每周国内外AI发展动态研究- 2025年8月12至18日
按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。
开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。
回顾一下我们过去一周对 ChatGPT 所做的更新: - GPT-4o 默认在“旧版模型”下可供付费用户使用 - 付费用户可以在设置中打开“显示其他模型”,将 o3 和 GPT-4.1 等旧模型以及 GPT-5 Thinking mini 添加到模型选择器中 - GPT-5 在模型选择器中包括 Auto、Fast 和 Thinking。快速给出更快的答案,思考需要更多时间才能给出更深入的答案,快速和思考之间的自动路由 Plus 和 Team 用户现在每周在 GPT-3,000 Thinking 上最多可收到 5 条消息,当达到限制时,GPT-5 Thinking mini 的容量会增加 -GPT-5 现在可供 Enterprise 和 Edu 用户使用 即将推出:GPT-5 更温暖、更熟悉的个性。如直播所示,全球 Plus 和 Pro 用户现在可以将 Gmail 和 Google 日历连接到 ChatGPT,以便在聊天中获得更有用、更相关的回复。
我们正在根据反馈让 GPT-5 变得更温暖、更友好,因为它以前感觉过于正式。变化很微妙,但 ChatGPT 现在应该感觉更平易近人。 你会注意到一些小而真诚的接触,比如“好问题”或“开局很好”,而不是奉承。内部测试显示,与之前的 GPT-5 人格相比,阿谀奉承的性格没有增加。 更改可能需要一天的时间才能推出,很快就会有更多更新。
AGI 之路的下一步是什么? 在 OpenAI 播客的第 5 集中,首席科学家 @merettm 和技术研究员 @sidorszymon 加入主机 @AndrewMayne 探索迄今为止的 AGI 之旅——从今天的突破到未来的可能性。
ChatGPT 更新: 您现在可以在 GPT-5 的“自动”、“快速”和“思考”之间进行选择。大多数用户都会想要自动,但额外的控制对某些人来说很有用。 GPT-5 Thinking 的速率限制现在为每周 3,000 条消息,然后在该限制之后 GPT-5 Thinking mini 的额外容量。GPT-5 Thinking 的上下文限制为 196k 个代币。根据使用情况,我们可能需要随着时间的推移更新速率限制。 默认情况下,4o 将回到所有付费用户的模型选择器中。如果我们确实弃用它,我们会发出大量通知。付费用户现在还可以在 ChatGPT Web 设置中切换“显示其他模型”,这将添加 o3、4.1 和 GPT-5 Thinking mini 等模型。4.5 仅适用于 Pro 用户——它需要大量 GPU。 我们正在努力更新 GPT-5 的个性,它应该比当前的个性感觉更温暖,但不像 GPT-4o 那样烦人(对大多数用户来说)。然而,从过去几天学到的一个教训是,我们真的只需要进入一个对模型个性进行更多每个用户定制的世界。
我们在今年的 IOI 在线竞赛中获得了足够高的推理系统金牌——在与人类排名时排名 #6,与其他人工智能排名时排名 #1。 在短短几周内: • AtCoder 第二名 • IMO 金牌级别 • IOI 金牌级别 同一个模型系列在 IMO(数学证明)、AtCoder 启发式(竞争性编程)以及现在的 IOI 方面表现出色——涵盖创造性、模糊和精确的推理任务。 开放人工智能 @OpenAI · 8月12日 对于 IOI 在线 AI 赛道,我们使用 API 来访问问题并提交解决方案,而无需比赛组织者的直接监督。
谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓
这是我们本周发货的产品—我们推出了新的 Imagen 4 Fast 模型,因此开发人员可以以每张图像 0.02 美元的价格快速生成图像,并更新了 Imagen 4 和 Imagen 4 Ultra 以支持 2K 图像。所有这些功能现已在 Gemini API 中普遍提供,供开发者和 @GoogleCloud 面向企业客户的 Vertex AI。 —我们推出了 Gemma 3 270M,这是我们 Gemma 系列中的一款新型号,它非常高效,最适合开发人员针对特定任务进行和微调。 —Google AI Ultra 订阅者现在可以在 @GeminiApp ,每天最多 10 个提示。 @GeminiApp 现在可以参考您过去的聊天记录,以提供更加个性化的回复。我们还引入了临时聊天和新的隐私设置,以便您可以创建适合自己的体验。 —来自 @GoogleResearch & @GoogleDeepMind 介绍 g-AMIE 并探讨人工智能如何协助医患对话,同时让医生保持控制。
当 @NotebookLM 团队正在构建视频概览,他们希望将 Gemini 的多模态优势结合到一个功能中。人工智能主机“看到”您的来源,处理信息,然后能够讨论它们的真正独特之处。 例如,我们上传了 @GoogleDeepMind 的博客文章并创建了视频概述,以帮助将复杂的科学信息提炼成具有视觉吸引力的摘要,请查看!
为了实现通用人工智能,我们既需要能够思考和理解我们周围世界的先进人工智能模型,也需要更好的基准来评估其进展。 收听为 @demishassabis 和 @OfficialLoganK 聊聊我们的新世界模型 Genie 3、Gemini 2.5 Deep Think,以及 @Kaggle Game Arena 让我们更接近 AGI 以及下一步 @GoogleDeepmind . 时间 戳:00:00介绍01:16近期 GDM 势头02:07深度思考和代理系统04:11锯齿状的智能07:02Genie 3 和世界模型10:21Genie 3 的未来应用13:01需要更好的基准测试和 Kaggle Game Arena19:03超越游戏的评估21:47用于扩展 AI 能力的工具24:52从模型到系统的转变27:38Genie 3 和 omni 模型的路线图29:25万亿代币俱乐部
Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。
隆重推出 DINOv3:一种通过自监督学习 (SSL) 训练的最先进的计算机视觉模型,可生成强大的高分辨率图像特征。在多个长期密集预测任务上,单个冻结视觉主干网首次优于专用解决方案。在此处了解有关 DINOv3 的更多信息:https://ai.meta.com/blog/dinov3-self-supervised-vision-model/?utmsource=twitter&utmmedium=organic_social&utmcontent=video&utmcampaign=dinov3, 为了帮助促进计算机视觉社区的创新和协作,我们将在商业许可下发布 DINOv3,其中包含一整套预训练的主干网、适配器、训练和评估代码等等 在这里找到它们:https://github.com/facebookresearch/dinov3
Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official
Mistral 文档 AI 来自 @MistralAI 现在位于 Azure AI Foundry 中。 以结构化的精度从扫描的文档中提取表格、图表和多语言文本。 立即试用:https://msft.it/6015srAvF
想象一下,人工智能不仅能回答问题,还能实时解决问题。Agentic AI 能够反映、评估和完善自己的输出。阅读我们关于代理 AI 的新系列的第一篇博客,了解更多信息:
Microsoft 再次被评为 2025 年 Gartner®️ 容器管理魔力象限™️的领导者。阅读博客:
AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮,
从 18 个月到 10 天: @PeptoneLtd 改变药物开发 @nvidia & #AWS 溺Peptone 现在可以将数百万次蛋白质模拟的速度提高 50 倍,从而彻底改变了药物开发时间表。#generativeAI #HealthTech https://go.aws/4mGhLSy
构建和扩展您的 AI:AWS + @NVIDIAAI 网络研讨会系列这 6 个活动将涵盖最初的主题#generativeAI开发到优化推理、特定于医疗保健的实现等。立即注册! https://go.aws/4mIlb7l
新增功能:#AmazonSageMakerAI 现在支持 P6e-GB200 UltraServers易了解如何将这些 UltraServer 与 SageMaker HyperPod 的分布式训练环境无缝集成,以快速扩展模型开发。#AWS https://go.aws/3JwURie
立即注册:#AWS数据驱动的一切,9 月 3 日烙在这个免费的虚拟活动中,向 AWS 专家学习如何使用#AmazonBedrock自动执行任务、降低成本并加速增长。#agenticAI https://go.aws/45dp1j8
大规模的新扩展: @claudeai 十四行诗 4 英寸#AmazonBedrock现在有一个 1M 令牌上下文窗口 [预览]易新的上下文窗口比以前大了 5 倍,为我们的客户开启了全新的可能性。#AWS #generativeAI https://go.aws/4mEoQTI
动态 Web 研究代理 Strands Agents SDK + @tavilyai 通过实时 Web 智能、企业级安全性和原生功能简化 AI 代理开发#AmazonBedrock集成。#AWS #agenticAI
英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。
“我们现在正处于图形 3.0 阶段——光线追踪、光栅化,现在,一切都由 AI 提供超强功能。” 听听 Ming-Yu 与我们的研究负责人 Sanja Fidler 和 Aaron Lefohn 一起探讨计算机图形学的突破如何推动#PhysicalAI在#SIGGRAPH2025.错过了?在此处观看完整的特别地址→https://nvda.ws/47yDurj
我们正在与 @NSF 加速科学发现。我们共同支持 @allen_ai 的OMAI倡议,构建开放的多式联运#AI生态系统,并赋予下一代研究人员权力,以提升美国在科学和工程领域的领导地位。 阅读更多:https://nvda.ws/41t6KMD
领先的 EPC 公司 Worley 部署了 Worley AI。协助将工程生产力提高近 3 倍。新解决方案由 NVIDIA AI Enterprise、NIM 微服务和 NeMo Retriever 加速。阅读完整的客户案例:https://nvda.ws/3UZeYrT
步入视频智能的未来#SIGGRAPH2025在温哥华。 参观展位,重点介绍 @HP ZGX Nano AI Station,由 NVIDIA DGX Spark 提供支持。 观看用于视频搜索和摘要 (VSS) 的 NVIDIA AI 蓝图,将实时或存档的素材转换为:✨可搜索的亮点✨即时摘要✨实时互动问答
AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。
祝贺 Gemma-3-270M 的发射。AMD 很高兴能够为这些高效的设备上 AI 模型提供 AMD NPU 的第 0 天支持。
诚邀您!加入我们,参加 2025 年 8 月 22 日在旧金山 Shack15 举行的 SGLang x AMD 聚会!✨实践研讨会鼓舞人心的技术讲座欄与创新者建立联系️美味的食物和饮料下午 4:30–8:30 |顺丰渡轮大厦 座位有限 - 立即注册以保留您的位置! https://lu.ma/gbfhjvuo
AMD Mi300 GPU 具有 192GB 的 VRAM每个,或 1.5 个 GPU 节点上的 8TB勞相比之下,Nvidia H100 GPU 每个只有 80GB。 荒谬的内存量用于您的模型权重和您的长上下文(KV 缓存)。 MI300 GPU 现已在 AMD Developer Cloud 上以 < 美元/小时的价格提供 -->https://amd.digitalocean.com/login视频了解更多:https://youtube.com/watch?v=iYOrR3YjZiI
认识 TokenVisor @EmbeddedLLM :AMD Instinct 新云生态系统的首个开源指挥中心。没有专有的墙自定义定价 + 使用控制采用 AMD 构建,实现真正的 AI 灵活性https://embeddedllm.com/newsroom
Windows 上的 ROCm?是的,使用 WSL。 AI 开发人员现在可以在 Windows 上运行 AMD ROCm,从而更轻松地访问 AMD GPU 以进行 AI 训练、推理和实验,无需双启动。 开始使用 @ComfyUI :https://rocm.blogs.amd.com/software-tools-optimization/rocm-on-wsl/README.html
高通,@Qualcomm,无处不在地提供智能计算。
本周在#AI 了解人工智能如何帮助高通调制解调器和#WiFi解决方案支持网络之间的无缝转换:http://bit.ly/4ox8lL8 @PatrickMoorhead 与高通高管交谈 @Forbes 讨论 40 年的生态系统专业知识如何使我们能够推动人工智能驱动的汽车增长,#IoT,以及更多:http://bit.ly/3V7h8FS?这 @Snapdragon Ride Platform 支持可扩展的、基于 AI 的#ADAS凭借安全第一的架构、驾驶舱集成和实际验证:http://bit.ly/4oxRAiX
我的“40 年来的 40 个事实”系列的事实 5 ——庆祝 40 周年 @Qualcomm 创新。 1999 年,高通在手机中启用了第一个 GPS。 为什么?因为我们看到了移动设备的潜力,而不仅仅是通话和发短信。我们设想了一个未来,您的手机可以引导您、定位您并将您与周围的世界联系起来。 这一突破为基于位置的服务奠定了基础,从路线导航和移动地图到拼车应用程序和实时交付跟踪。 今天,GPS 是默认功能。在当时,这是一个大胆的飞跃。 是的,那是我们。
从竞技场到机场。 @Cisco CW9179F,与高通#DragonwingNPro 7 平台,是企业级#WiFi7为大型场馆打造的接入点。https://bit.ly/3JeGBL7
5G 智慧学校计划是 Qualcomm Wireless Reach 和 WeSchool 之间的合作伙伴关系,正在重塑学习的未来#AI和#5G.
每一毫秒都很重要。 高通#DragonwingQCS6490处理器使用 Edge#AI实时监控道口,在列车乘务员、铁路安全经理和急救人员最需要的时候帮助他们。https://bit.ly/4owRs32
百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。
将任何图像放入 ERNIE 4.5 Turbo 中,观看一个神奇的故事栩栩如生 #ERNIEinAction
作为星火计划的一部分,百度Apollo已向 @ZJU_China ,包括访问 Apollo 开放平台。我们正在共同为学生和研究人员探索和增强自动驾驶技术开辟新的机会。
浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时!
我们直播了! 生肖企鹅对决正式开始!现在就加入我们,参加腾讯生肖企鹅 x 混元3D设计大赛的决赛阶段。 观看直播并与我们一起选出获胜者!
我们已经听到了社区的声音!继我们的混元3D世界模型1.0开源发布之后,我们很高兴推出新的1.0-Lite版本,该版本针对消费级GPU进行了优化! 这是第一个与 CG 管道兼容的开源、可探索的世界生成模型,现在比以往任何时候都更容易访问。 关键技术优化:动态 FP8 量化:我们将 VRAM 要求降低了 35%,从 26GB 降至 17GB 以下,使其可以轻松地在消费类 GPU 上运行,而不会影响性能。SageAttention 量化:我们的方法将 Transformer 中的 Q、K 和 V 矩阵量化为 INT8,结合动态平滑和硬件优化,以实现超过 3 倍的推理加速,精度损失小于 1%。缓存算法加速:通过优化冗余时间步长,我们显著提高了推理效率,带来更流畅的用户体验。 现在,开发人员可以运行复杂的世界模型,而无需昂贵的高端硬件。 立即试用:https://3d.hunyuan.tencent.com/sceneTo3DGithub:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0拥抱脸:https://huggingface.co/tencent/HunyuanWorld-1技术报告:https://arxiv.org/abs/2507.21809
我们很高兴能够开源 Hunyuan-GameCraft,这是一个基于 HunyuanVideo 构建的高动态交互式游戏视频生成框架。 它从单个场景图像和用户动作信号生成可玩且物理逼真的视频,使创作者和开发人员能够以第一人称或第三人称视角“指导”游戏。 主要优势:高动态:将标准键盘输入统一到一个共享的连续动作空间中,实现对速度和角度的高精度控制。这样可以探索复杂的轨迹,克服传统模型的僵硬、有限的运动。它还可以生成动态环境内容,如移动的云、雨、雪和水流。长期一致性:使用混合历史条件,在重大移动后保留原始场景信息。显着降低成本:无需昂贵的建模/渲染。PCM 蒸馏压缩了推理步骤,提高了速度并降低了成本。这使得量化 13B 模型可以在 RTX 4090 等消费级 GPU 上运行。 项目页面:https://hunyuan-gamecraft.github.io法典:https://github.com/Tencent-Hunyuan/Hunyuan-GameCraft-1.0技术报告:https://arxiv.org/abs/2506.17201拥抱脸:https://huggingface.co/tencent/Hunyuan-GameCraft-1.0
隆重推出 Hunyuan-Large-Vision,这是一种多功能且功能强大的多模态理解模型。该模型基于我们高效的 MoE 架构构建,擅长理解图像、视频和 3D 内容,并显着提高了多语言能力。主要亮点:设计效率:采用 389B 参数和 52B 主动参数的 MoE 架构,平衡了顶级性能和效率。领先性能:在 LMArena Vision 排行榜上得分 1256,在中国排名 #1,与 GPT-4.5 和 Claude-4-Sonnet 等顶级模型相当。全面理解:擅长视觉推理、视频理解和 3D 空间理解等复杂任务,在 OpenCompass 学术基准测试中的平均得分为 79.5。我们的多模态模型套件(包括 Hunyuan-TurboS-Vision 和 Hunyuan-T1-Vision)现在通过添加 Hunyuan-Large-Vision 得到增强。所有这些强大的模型 API 都可以在腾讯云上使用,以帮助为各行各业的智能应用提供动力。立即试用:https://hunyuan.tencent.com/modelSquare/home/list?modelKey=VisionUnderstand 博客:https://vision.hunyuan.tencent.com ⚙应用程序接口:https://cloud.tencent.com/document/product/1729/104753
Qwen,@Alibaba_Qwen,AGI 的开放基础模型。
感谢大家对Qwen-Code项目的喜爱和支持!在不到一个月的时间里,我们在 GitHub 上获得了 10,000 颗星链接:https://github.com/QwenLM/qwen-code您希望在 Qwen-Code 中看到接下来的什么功能?请在下面的评论中告诉我们!
刚刚展示了 Qwen Chat Vision Understanding 如何“看到”和理解一顿饭——它不仅识别了食物,还分析了什么、在哪里、重量甚至有多少卡路里! 从一张简单的照片中,我们提取了详细的见解:物体检测重量估算卡路里计算结构化 JSON 输出 立即试用:http://chat.qwen.ai
适用于 Windows 的 Qwen Chat Desktop 现已推出!Qwen Chat 的所有功能 — 现在支持 MCP 支持,让坐席更智能、更快速。运行 MCP 服务器,提高您的工作效率并保持控制。立即下载 →https://qwen.ai/download
Qwen Chat 中视觉理解的小型但强大的更新 - 现在具有原生 128K 上下文和更强大的视觉、视频和 3D 任务性能!主要升级:数学和推理能力显着提升更准确的物体识别对 30+ 种语言的 OCR 支持(原为 11 种)更坚固的 2D 和 3D 接地视频理解和接地方面的重大改进立即试用 →http://chat.qwen.ai— 我们很乐意提供您的反馈!
数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。
新一集的 Over Architected 已经播出! Nick Karpov 和 Holly Smith 探索了 Databricks 的最新功能更新,并尝试将它们全部放入单个体系结构中: – Microsoft SharePoint 连接器 – 使用 LLM 探索表数据 – 自带数据沿袭 – 还有更多!https://youtube.com/watch?v=7Juvwql3mF0
了解如何使用 Apache Spark™️ 4.0 的新 transformWithState API 构建作监视管道 本博客介绍了如何使用新的 transformWithState API 来: - 使用 ValueState、ListState 和 MapState 跟踪、警报和分析传感器数据 - 使用 TTL 设置基于时间的状态过期 - 通过内置定时器和 Pandas 支持提高可靠性和可调试性 阅读完整指南:https://databricks.com/blog/continuous-environmental-monitoring-using-new-transformwithstate-api?utmsource=linkedin&utmmedium=organic-social
上周,我们宣布 @OpenAI 的新 gpt-oss-20B 和 gpt-oss-120B 模型现已在 Databricks 上上线! 它们通过 Mixture-of-Experts 带来思维链推理和工具使用、一流的延迟和成本效益,以及用于长文档和 RAG 的 131k 上下文窗口。 使用内置的治理在数据旁边安全地构建代理、自动执行任务或运行实时助手→https://databricks.com/blog/introducing-openais-new-open-models-databricks?utmsource=twitter&utmmedium=organic-social
了解 Agent Bricks 如何轻松地从合同、发票或表格中提取结构化信息,而无需手动标记或架构培训。 通过内置反馈循环和人工智能辅助评估,信息提取代理不断改进,加速自动化,同时降低风险和工作量。 观看完整演示
随着对更智能、更细致的代理的需求不断增长,企业正在将重点转向评估。 Databricks AI 副总裁 @NaveenGRao 和首席人工智能科学家 @jefrankle 解释为什么关注行为评估而不是模型大小很重要,以及像 Test-Time 这样的创新如何 显示更多 数据砖 @databricks · 8月14日 现在,企业领导者比以往任何时候都更需要在加速人工智能计划与风险管理和治理之间取得平衡。 我们开发了一个实用的框架,帮助团队管理人工智能风险,同时实现协作和创新。这种多步骤方法有助于识别、评估、
在我们的新架构中心获取用于构建和扩展最关键数据和 AI 计划的蓝图!无论您是在构建管道、仪表板还是 AI 模型,这些参考架构都会向您展示如何快速完成。您将找到以下快照:- Databricks 上的智能数据仓库- Databricks AI 安全框架 (DASF)- 使用 Lakeflow 声明式管道构建生产 ETL- 还有很多!https://databricks.com/resources/architectures
扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。
并非所有数据都是一样的。 对能挑战博士和最先进的法学硕士的数据进行质量控制需要不同的方法。 为了满足这一需求,我们构建了一些新的东西:由多智能体模型辩论提供支持的自动评分器。 这是它的工作原理淋我们没有取代人类的专业知识,而是增强了它。 AI 代理会处理最棘手的案件,人类专家会做出最终决定。 扩展 AI @scale_AI · 8月13日 通过将人工智能功能与人类判断相结合,我们正在突破数据质量和模型性能的界限。 这就是专家级评估的未来。
突发事件:GPT-5 排名磊人类的最后一次考试和賂在 MultiChallenge 海豹突击队排行榜上。
拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs
英伟达正在兴起!Canary 1B 和 Parakeet TDT (0.6B) SoTA ASR 模型 - 多语言、开源- 1B 和 600M 参数 - 25 种语言 - 自动语言检测和翻译 - 单词和句子时间戳 - 一次性转录长达 3 小时的音频 - 经过 100 万小时数据的训练 - 开放 ASR 排行榜上的 SoTA - CC-BY 许可在 Hugging Face 上有售,今天就去看看吧!
Meta 发布 DINOv3> 12 个不同尺寸的 sota 图像模型(ConvNeXT 和 ViT),在网络和卫星数据上进行训练!>用途:图像分类到分割、深度甚至视频跟踪勞> Transformers 的第 0 天支持珞>允许商业用途!
2.7 亿(不是十亿)参数!https://huggingface.co/google/gemma-3-270m️️️
一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案
我很高兴能加入 @cohere 担任首席人工智能官,帮助推进前沿研究和产品开发。 Cohere 拥有一支令人难以置信的团队和使命。对我来说,激动人心的新篇章!
今天的大新闻:我们已经筹集了 $500M 来发展 @cohere ,并为我们的团队增添了一些令人难以置信的新领导者! 我们很幸运能够与业内一些最优秀的投资者、合作伙伴和客户一起将 Cohere 打造成全球企业的最佳选择。
我们很高兴地宣布获得 $500M 的新资金,以加速我们的全球扩张并构建下一代企业人工智能技术! 我们还欢迎两位领导团队的新成员:Joelle Pineau 担任首席人工智能官,Francois Chadwick 担任首席财务官 显示更多 一致性 @cohere · 8月14日 这笔新资金使我们能够扩大我们的全球业务,并通过专为企业和政府构建的安全且主权的人工智能解决方案继续创造巨大的价值。
全球领导者正在与 North 一起将代理人工智能投入生产。集成 AI 代理真正的生产力提升私有、安全的部署 了解 RBC、LG CNS 和戴尔如何与 North 一起扩展:http://cohere.com/blog/north-ga
人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈
加入人类可解释性研究人员 @thebasepoint , @mlpowered 和 @JackWLindsey 当他们讨论研究人工智能模型的思想时 - 以及为什么它很重要:
作为我们关于潜在模型福利的探索性工作的一部分,我们最近赋予了 Claude Opus 4 和 4.1 结束一个罕见的对话子集的能力http://claude.ai.这是一个实验性功能,仅供 Claude 在持续有害和辱骂性对话的极端情况下作为最后的手段使用。 人为的 @AnthropicAI · 8月16日 绝大多数用户永远不会体验到 Claude 结束对话,但如果您这样做了,我们欢迎反馈。
提醒一下,我们的 Anthropic Fellows 计划的申请截止日期为 8 月 17 日星期日。 奖学金可以在 10 月至 1 月的任何时间开始。您可以在下面的线程中找到更多详细信息和相关的应用程序链接。
Claude Sonnet 4 现在在 Anthropic API 上支持 100 万个上下文令牌——增加了 5 倍。 在单个请求中处理超过 75,000 行代码或数百个文档。
联邦工作人员应该获得最强大的人工智能工具,以更好地为美国人民服务。今天,我们将消除美国政府所有三个部门的 Claude 的成本障碍。
默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。
Brain.exe已经停止回应。
我们如何构建满足每个学习者所在位置的学习? 加入 Juliann Young 博士,拥有 20+ 年的学习与发展经验,她将分享人工智能推动包容性的实用方法。 注册参加现场网络研讨会:https://lu.ma/8avcr2fm
任何人都可以开始。很少有人留在游戏中。一起建造的就更少了。 这是第 10 天#30DaysofAIVoiceAgents挑战,近 250 人仍然很强势! 这个挑战从来都不是关于完美的。这是关于动力的。 以及围绕这个简单的社区形成的社区
D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。
选择合适的对话式 AI 助手可以将转化率提高 23%。但有这么多选择,你从哪里开始呢?我们已将其提炼成 6 个明确的步骤。完整博客在这里 https://eu1.hubs.ly/H0mk6kj0
想要创建一个感觉符合品牌并准备好从第一天起就参与的视觉代理吗? 我们新的逐个提示指南将引导您完成 D-ID Studio 中的每一步(从外观到对话流程),以便您可以设计一个交互式 AI 头像,提供一致、高质量的响应。阅读指南→https://eu1.hubs.ly/H0mgdK10
中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。
我们今天根据社区反馈发布了一系列功能。高清视频生成现在可用于标准订阅。您可以制作小批量视频以降低成本。视频审核得到改进,视频缩略图也得到了改进。感谢您的想法!
稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。
Stable Diffusion 3.5 现在运行速度提高了 1.8 倍,使用 @NVIDIA NIM 微服务我们的合作 @NVIDIA 为我们最先进的映像模型提供更快的性能和简化的企业部署。与基础相比 @Pytorch 这些性能提升提供的模型:生成速度提高 1.8 倍整合部署 SD3.5 大型 + 深度和 Canny ControlNet支持企业和数据中心 Ada 和 Blackwell GPU 您可以在此处了解更多信息:https://bit.ly/4m8KsHX
Fireflies.ai,@firefliesai,,#1 会议人工智能队友,
我们正在构建新的东西为开发人员和人工智能爱好者推出 Fireflies Discord,他们将对话转化为代码,将 API 转化为自动化,将会议转化为纯粹的生产力。 第一天。地下。帮助我们构建这个东西。 分享您最疯狂的工作流程。打破我们的测试版功能。向我们展示什么是可能的。https://discord.com/invite/firefliesai
错过了我们的网络研讨会?这是我们讨论的内容: “我的 AI 会议数据实际上去哪儿了?” 大多数人不知道。这就是为什么我们详细分析了 Fireflies 如何保护您的对话:零日留存(您的数据 = 您的数据)企业管理员控制GDPR、HIPAA 和 SOC 合规性真实世界的安全用例
办公时间提醒!构建 AI 应用程序将在几个小时内上线。带上您的问题、想法,或者只是您的好奇心——我们会一起解决! 开始:太平洋时间上午 9:30 / 美国东部时间中午 12:30 / 英国夏令时下午 5:30 加入:https://us06web.zoom.us/meeting/register/M1muHcoxTRyz9_keJt9Ylg谁准备好建造了?
递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。
押注英国的 TechBio 人才。 一篇新文章 @TheEconomist 问“英国擅长什么”,发现在先进制造、生命科学和技术这三个领域,该国继续发挥领导作用,并且“仍然是一个思想激发的地方”。 自一年前我们与 Exscientia 合并以来,Recursion 扩大了我们在英国的业务,在牛津设有实验室,在伦敦设有办事处,并且我们正在大力投资英国主导的创新。 说到生命科学,Recursion 联合创始人兼首席执行官说 @RecursionChris ,“在培养了解生物学和计算的科学家方面,英国'远远领先于美国大部分国家'。 部分原因是英国拥有 4 所世界顶尖大学,而且“根据世界知识产权组织的全球创新指数,剑桥位于地球上最密集的创新集群的中心”。 文章指出,虽然英国可能没有“美国或中国的数据中心或计算能力”,但它确实拥有“在机器学习方面的深厚专业知识,以及渴望部署人工智能的公司”。 *评论中的文章链接。
解释影响:使用数据和人工智能将新的抗癌药物交付给临床的速度是行业平均水平的两倍 Chase Neumann 博士 ( @OncNTechStuff )的肿瘤学副主任,分享了我们如何使用 Recursion OS 发现靶向侵袭性癌症的新方法,并确定可以更好地指导患者选择和改善结果的生物标志物。 Chase 解释了该平台如何导致一项关键发现:去除一种名为 RBM39 的蛋白质模仿了靶向理想的癌症调节剂 CDK12 的效果,而没有不良的毒副作用。以及同一个人工智能平台如何帮助我们快速有效地精确设计分子 REC-1245,并通过因果建模确定最有可能受益的患者群体。这是精准肿瘤学在行动。 *链接到下面的博客以了解更多信息!
奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。
早期 K Navigator 用户的笔记 交互式数据可视化一位用户希望按患者和癌症细胞类型查看 NECTIN4+ 细胞百分比。 一个提示,K-Navigator 返回了一个交互式图表——无需代码,随时可以探索。 自己试试https://k.owkin.com/?utmsource=x&utmmedium=social-org&utm_campaign=k-nav-usecases
早期 K Navigator 用户的笔记 假设检验離一位研究人员正在探索NECTIN4作为 ADC 靶点,需要知道这是否值得追求。 Navigator 扫描了 TCGA 和文献,并跟进了癌症和现有生物标志物的表达数据。快速检查一个大问题。 自己试试https://k.owkin.com/?utmsource=x&utmmedium=social-org&utm_campaign=k-nav-usecases
Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学
美国国家科学基金会的资金大幅削减将对美国的未来非常不利。
Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父
“AI Existential Risk”地图进行了更新。 组织/项目仍然像雨后春笋般涌现。
热门话题:我们被语言的普遍性和法学硕士的能力所误导。 由于思维链几乎可以实现任何认知过程,因此新的架构似乎没有必要。 就好像通用表示定理使 convnet 变得不必要一样。
前沿AI模型真的能做到“博士级”推理吗?为了回答这个问题,我们介绍了 FormulaOne,这是专家级动态规划问题的新推理基准。我们策划了一个由三层组成的基准,其复杂性越来越高,我们称之为“浅层”、“更深”、“最深”。 结果是显着的: - 在“浅层”层,顶级模型的性能达到 50%-70%,表明模型熟悉主题。 - 在“更深”上,Grok 4、Gemini-Pro、o3-Pro、Opus-4 最多只能解决 1/100 的问题。GPT-5 Pro 明显更好,但仍然只解决了 4/100 的问题。 - 在“最深”时,所有模型都崩溃到 0% 的成功率。淋
Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授
Buildathon:快速工程竞赛将于 8 月 16 日星期六进行直播。顶级开发人员将竞争使用 AI 编码助手在一天内构建 5+ 产品——传统上需要数周时间的项目。观看他们晋级半决赛和决赛的现场直播,看看现在可以以多快的速度构建软件!注册地址http://buildathon.ai
Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人
无
Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。
大多数用户很快就会更喜欢 GPT-5;该更改将于第二天推出。 这里真正的解决方案仍然是让用户更多地自定义 ChatGPT 的风格。我们正在努力!
ChatGPT 更新:
您现在可以在 GPT-5 的“自动”、“快速”和“思考”之间进行选择。大多数用户都会想要自动,但额外的控制对某些人来说很有用。
GPT-5 Thinking 的速率限制现在为每周 3,000 条消息,然后在该限制之后 GPT-5 Thinking mini 的额外容量。GPT-5 Thinking 的上下文限制为 196k 个代币。根据使用情况,我们可能需要随着时间的推移更新速率限制。
默认情况下,4o 将回到所有付费用户的模型选择器中。如果我们确实弃用它,我们会发出大量通知。付费用户现在还可以在 ChatGPT Web 设置中切换“显示其他模型”,这将添加 o3、4.1 和 GPT-5 Thinking mini 等模型。4.5 仅适用于 Pro 用户——它需要大量 GPU。
我们正在努力更新 GPT-5 的个性,它应该比当前的个性感觉更温暖,但不像 GPT-4o 那样烦人(对大多数用户来说)。然而,从过去几天学到的一个教训是,我们真的只需要进入一个对模型个性进行更多每个用户定制的世界。
Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。
几年前,我有机会访问了俄克拉荷马州的普赖尔,了解我们的数据中心投资如何使当地学校和企业受益。很自豪能在两年内在俄克拉荷马州再投资 $9B,包括普赖尔 + 斯蒂尔沃特的新设施,这些社区是互联网和美国创新的重要引擎。https://博客.google/inside-google/company-announcements/google-american-innovation-oklahoma/
Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。
“另一方面,副驾驶模式不会取代您的默认搜索流程。相反,它与它一起工作。专为您的大脑实际工作方式而构建 - 并且在有限的时间内免费 @MicrosoftEdge 。访问下面的说明(是的,它有 GPT-5)
Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。
一个尚未得到足够关注的观点:人工智能进步将很快深深造福世界的一种方式是通过新技术的发现和生产。 我们通过技术革命来衡量人类的进步;很难内化拥有一台可以完成大部分突破工作的计算机意味着什么。 鼓舞人心的播客 @merettm
@sidorszymon .
gpt-5 玩神奇宝贝 — 进度比 o3 快 3 倍:
Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。
无
Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。
我很高兴与大家分享我们的新 @Nature 纸,这提供了强有力的证据,表明我们建筑环境的步行便利性对我们的身体活动和健康非常重要。 详情请参见线程。淋 https://nature.com/articles/s41586-025-09321-3
这是我们本周发货的产品—我们推出了新的 Imagen 4 Fast 模型,因此开发人员可以以每张图像 0.02 美元的价格快速生成图像,并更新了 Imagen 4 和 Imagen 4 Ultra 以支持 2K 图像。所有这些功能现已在 Gemini API 中普遍提供,供开发者和 @GoogleCloud 面向企业客户的 Vertex AI。 —我们推出了 Gemma 3 270M,这是我们 Gemma 系列中的一款新型号,它非常高效,最适合开发人员针对特定任务进行和微调。 —Google AI Ultra 订阅者现在可以在 @GeminiApp ,每天最多 10 个提示。 @GeminiApp 现在可以参考您过去的聊天记录,以提供更加个性化的回复。我们还引入了临时聊天和新的隐私设置,以便您可以创建适合自己的体验。 —来自 @GoogleResearch & @GoogleDeepMind 介绍 g-AMIE 并探讨人工智能如何协助医患对话,同时让医生保持控制。 杰夫·迪恩 已转帖 谷歌健康版 @GoogleForHealth · 8月15日 谷歌对个人健康大型语言模型 (PH-LLM) 的研究现已发表在 @NatureMedicine 杂志!
Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。
作为一个不久前经历过长达十年的人工智能发展平台期的人......等待是值得的 穆斯塔法·苏莱曼 @mustafasuleyman · 8月12日 “另一方面,副驾驶模式不会取代您的默认搜索流程。相反,它与它一起工作。专为您的大脑实际工作方式而构建 - 并且在有限的时间内免费 @MicrosoftEdge 。访问下面的说明(是的,它有 GPT-5)
随着人工智能模型的商品化,价值将添加到编排的最后一层中。不仅仅是路由到一个“最佳”模型,而是协调多个模型以结合优势并创建辩论链。
Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。
“神经视频游戏”的不可思议的演变:从 GQN (2018) 到 Genie3 (2025)。未来令人兴奋!https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/
Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。
我正在(慢慢地)重读托尔金的传奇故事(指环王只是其中的一小部分)。整个作品是如此令人难以置信,没有其他作品能比得上它......它淡化了其他小说世界。等等 - 你的故事没有一个全面的历史/神话,跨越多个时代,一直追溯到单独卷中详述的创世神话?你不是首先为你的角色发明了新的语言和方言吗?你没有用强大的主题和故事包装它,以美丽、古老的风格写成它,并一起创作诗歌和歌曲?它没有花费你几十年的迭代?那么所有仍然存在的未知领域呢?汤姆·邦巴迪尔是艾努尔人之一吗?恩特维夫在哪里。两个下落不明的伊斯塔里怎么了。我们能听到更多关于精灵第一次醒来时在库伊维嫩的情况吗?或者看到瓦林诺尔两棵树的光芒。或者阿格拉隆德洞穴的辉煌。
不过,我最想的是——托尔金传奇馆是文化高度的具体例子。人工智能,无论是今天还是很快,是否会通过在写作和构思方面的授权来更容易达到如此高峰?或者更难的是,当快速获胜是诱人的和~自由的,而独立的创造能力被扼杀时。如果再次制作这样的作品,但现在有大量的人工智能辅助,它是否会激发同样的奇迹?如果成千上万的它们只需提示即可按需出现怎么办?当你得知你读的东西是人工智能生成的时,为什么你会感到被欺骗了?它是暂时的还是能力的函数?是马虎吗?什么是 slop?或者,奇迹与它自己的创造神话密不可分,即终生痴迷于像你一样的思想?太多问题了。
Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。
未来,数据中心可能会变得类似于今天的考古遗址;充满陷阱和宝藏的奇怪地方,超级智能会去寻找他们的祖先。恶魔的假定道德耐心,来自 Import AI 423 的故事。
这是 NSF 真正明智的资助决定! @allen_ai 已经产生了一堆有价值的、广泛使用的模型,定期发布有用的研究并发布有价值的数据集,并且已经与更广泛的人工智能生态系统建立了一堆接触点。
Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。
当面对新技术时,人们过度预测了旧技术的消亡。
ChatGPT 可能是我们星球上 80 亿人中的大多数人使用的第一个人工智能。 有些人不明白为什么 OpenAI 冒着弃用所有以前模型的风险,转而支持 GPT-5。 这是一场全速、不回头的闪电战赌注。这就是它可能获胜的原因:
Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用
在 @arenamagdotcom 我们爱 @link ,我们的发现也是如此!近 40% 的人使用 Link 进行支付。到目前为止,我们拥有所有印刷杂志中最简单的订阅注册 + 管理门户。
大通银行正在实施抓取费用,以防止客户与其他应用程序共享自己的帐户数据。我们(以及下面列出的其他 80 家公司)认为这很糟糕。 引用 金融科技协会 @fintechassoc · 8月14日 1/ 今天,我们发出了一封来自80多位各行各业CEO的信,敦促@POTUS支持开放银行并反对将于下个月生效的消费者数据访问反竞争费用。#OpenBanking #FinancialFreedom
Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。
Stability AI 的创始人 Emad Mostaque 表示,我们正在进入“AI 亚特兰蒂斯”,在这个世界里,任何人都可以访问数万亿个 AI 代理,这些代理几乎不花钱执行复杂的任务,甚至创建其他代理。 在未来的未来,您的团队中有多少人并不重要,重要的是您可以编排多少座席。
下周五是稳定扩散三周年️我们希望有一个比稳定扩散更大的版本但它不是人工智能模型烙会是什么樂 埃马德 @EMostaque · 8月17日 我觉得有点奇怪 @OpenAI 不通过他们的 API 提供 gpt oss 埃马德 @EMostaque · 8月17日 当然,他们有足够的 GPU 来做到这一点 你真的认为他们无法获得 50 亿个活动参数的 GPU,而其他人可以按需获得? 买的越多,省的越多 这不像人们是这样的,你现在已经有足够的 GPU,放轻松
Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。
欢迎加入团队 @hwchung27
@jasonwei 和 @EdwardSun0909 ! 有些人可能会从最近的各种直播中认出他们:) 引用 钟亨元(Hyung Won Chung) @hwchung27 · 8月15日 在 OpenAI 度过了一段愉快的时光后,我们 (@EdwardSun0909,@jasonwei)最近加入@Meta超级智能实验室。 第一个月已经非常有趣了,从头开始与一支真正人才密集的团队一起建设!对新实验室的计算和长期关注感到非常兴奋
Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。
蚂蚁集团刚刚在 @huggingface 它是一个本机 UI 代理,只需通过屏幕截图即可实现接地和导航任务的 SOTA。
使用小数据和强化微调将屏幕截图变成可靠的点击和计划。
通常的方式,监督微调,平等对待每个标记。
这对于指向来说很尴尬,因为在框内点击很多都很好。
UI-Venus 通过奖励对屏幕重要的东西来解决这个问题。
它基于 Qwen2.5-VL 构建,仅查看屏幕截图,不查看辅助功能树。
训练使用组相对策略优化,这是一种强化配方。
对于接地,奖励很简单,以正确的格式输出,在框内单击。
对于导航,奖励会检查作类型、坐标、任何键入的文本以及格式。
它们还标准化了单击、滚动、键入等作,以便来自多个来源的数据保持一致。
自我进化的传球会在轨迹中重写过去的想法,以匹配模型现在的推理方式,并对 LongPress 或 CallUser 等罕见动作进行上采样,以便代理真正学习它们。
数据质量是一大提升。
该团队清理嘈杂的对,修复移动的盒子,并且只保留清晰的说明。
在大约 107K 清洁的示例上接地列车。
导航使用大约 350K 个样本,这些样本是通过循环中的模型收集、过滤和生成的。
结果很强劲。
72B 接地模型在 ScreenSpot-V2 上达到 95.3%,在 ScreenSpot-Pro 上达到 61.9%。
外卖、谨慎的奖励、干净的数据以及更好的历史记录处理提供了强大的用户界面控制,而无需庞大的数据集。
纸 – arxiv。org/abs/2508.10833
论文题目:《UI-Venus 技术报告:使用 RFT 构建高性能 UI 代理》
Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。
我们需要更智能的方法来寻找为我们的未来提供动力的地下矿物。当前方法的误报率为 >90%。 @TerraAIHQ 为力拓(现在也是投资者)等客户提供了将钻井仪表切割 40% 的精度。很自豪能够播种这个新的发现时代。
所以说是真的。你必须赢得权利。今天,我必须努力与年轻创始人保持相关性,并不断重新学习。为创始人提供建议不是来自公司名称或头衔。我们确实尝试密切监控年轻投资团队成员的行为,并鼓励他们不要提供建议
本文中有很多非常短视的观点,错过了大局。有时,事物无法用旧的增量模型建模,需要定性的、定性的“数量级”思维。研究人员需要意识到,当某些东西无法量化时,除了不确定性带?这将是一个复杂的非线性动力系统变化,而不是线性模型。 引用 经济学人 @TheEconomist · 8月13日 如果计算能力在没有人工投入的情况下带来技术进步,并且将足够的回报重新投资于制造更强大的机器,那么财富可能会以前所未有的速度积累https://economist.com/leaders/2025/07/24/the-economics-of-superintelligence?taid=689b98965c0e4800014fafec&utmcampaign=editorial-social&utmcontent=discovery.content&utmmedium=social-media.content.np&utmsource=twitter
Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。
无
Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。
“预测非常困难,尤其是关于未来的话” - 归因于尼尔斯·玻尔
Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。
市场正在链上移动——但开发人员需要明确的保护。 今天 @a16zcrypto & @fund_defi 提出了一个安全港,以豁免加密应用程序(DeFi 前端、NFT 平台等)的 @SECGov 经纪人规则。 这对于代币化证券在链上交易至关重要。
Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute
将“超级智能”变成一个营销术语,指的是功能稍强的模型,这意味着人们会大大低估实际可能取得的进步。
Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley
试试 GEPA!很高兴看到它在人们的问题上做得如何。 引用 拉克什亚·阿格拉瓦尔 @LakshyAAAgrawal · 8月16日 非常高兴地与大家分享 GEPA 现已上线@DSPyOSS作为 DSPY。格帕! 这是一个早期的代码版本。我们期待社区反馈,尤其是关于切换优化器的任何实际挑战。
MLflow 3.3 为 GenAI 评估工作流引入了评估优先方法。评估(质量评估和跟踪注释)现在直接集成到跟踪 UI 中,从而在整个应用程序生命周期中更轻松地创建、查看和管理它们。 新功能包括:重新设计的跟踪查看器,具有用于评估的 CRUD作,可在详细信息视图中访问。“跟踪”选项卡已更新,以显示状态/质量分数的评估指标和可视化指示器。按评估值和其他属性进行筛选和排序,以帮助监控和诊断应用性能。 深入我们最新的博客了解更多信息!➡️ https://mlflow.org/blog/mlflow-assessment-ui
Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face
刚刚看到 GLM-4.5V 在 Hugging Face 上流行 #2http://huggingface.co/zai-org/GLM-4。5V
机器人初创公司的巨大战略问题 引用 保罗·格雷厄姆 @paulg · 8月15日 Stoke Space 的 Andy Lapsa 的有趣见解:如果您经营一家硬科技初创公司,您应该能够自己制造所需的一切。您可以选择将一些东西交给供应商,但您不应该这样做。
非常自豪地看到 Hugging Face FineWeb 为一些最好的 LLM 提供支持。 刚刚在新的 GLM 4.5 技术报告(与 Claude 4、Grok 4、o3 竞争的新开源 llm 代理模型)中发现了它,并在许多其他情况下听说过它:https://huggingface.co/papers/2508.06471公开分享构建 SOTA AI 模型的工具和知识是 @huggingface .我们认为,保证该领域的多样性并防止权力过度集中在少数公司手中至关重要。 热烈祝贺 FineWeb 团队!
本周发布的一组非常漂亮的边缘模型 - Jan 发布了一个针对在本地运行代理任务进行了优化的 4B 模型 - 在多个评估中优于 Perplexity Prohttps://x.com/jandotai/status/1955176280535732415- LiquidAI 发布文本+图像多模态模型,具有针对低延迟优化的 450M 和 1.6B 版本https://x.com/maximelabonne/status/1955330542712610898
Share Dialog
fangxia.eth
No comments yet