每周国内外AI发展动态研究- 2026年2月14至24日

按：从2021年开始，关于区块链发展动态，通过每日国外区块链发展动态来进行研究，从最初每天都会通过X研究相关的行业代表性人物、代表性项目，后面发展为不定期但最多一周会有一两次研究，坚持了有五年，几经更换研究的对象人物和代表项目，包括后来另一个项目：研究当月获得融资的区块链项目也有五年以上；关于区块链的研究，应该是成功的；关于AI的研究，除了前几年批量阅读些AI类书籍外，今年前几个月，因为大模型的流行，我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品，甚至研究了具体的应用部署、应用案例，陷入技术细节，我感觉不应该这样，于是决定从AI和产品部署类应用脱离出来；我于今天20250801在坐车时，突然决定应该仿照区块链研究的路径，也做个AI每日发展动态研究，找到国内外最牛的100个AI人物(以X为研究媒体，这些人物可能很多没有X账号或不活跃，则略去)和AI项目（拟再做个专题研究）也做个系列，这比陷入AI产品细节里更适合我当前需要；初步决定每周一到两次；以后有变化再说；此为志。第一次调整（2025年8月5日）：删除X不活跃的AI人物，增加了排名靠前的X活跃的AI类项目若干。

开放人工智能，@OpenAI，OpenAI 的使命是确保通用人工智能造福全人类。

Stargate 是我们计算战略的总品牌。这关乎动员整个生态系统，推动全球人工智能计算的重大变革——在过去几个季度里，这一愿景已成为现实。自2025年1月宣布Stargate以来，OpenAI已从主要的单一供应商模式扩展为跨云、硅片和基础设施的广泛合作伙伴网络：SoftBank、NVIDIA、AMD、博通、甲骨文、Microsoft、AWS、CoreWeave和Cerebras。需求在不断增长，没有任何单一供应商、芯片或云端能够承担这些负荷。多样化的计算模型是实现AI所需速度扩展的唯一途径。我们在2025年结束时拥有~2 GW的可用计算量，并采用了可扩展的模式：长期容量协议、专门构建的COLO部署，以及在下一代数据中心设计上的深度协作。计算领导力是研究和产品发展的基础——而星际之门正是我们构建未来产品的桥梁。 OpenAI @OpenAI · 2月19日介绍EVMbench——一项新的基准测试，衡量AI代理检测、利用和修补高严重智能合约漏洞的能力。

GPT-5.2在理论物理领域推导出了新的成果。我们将与研究人员一起发布结果的预印本。 @theIAS , @VanderbiltU , @CambridgeUni ，和 @Harvard .它表明，许多物理学家预期不会发生的胶子相互作用可以在特定条件下出现。

谷歌人工智能，@GoogleAI，让人工智能对每个人都有帮助。展现思维↓

昨天， @GoogleLabs Pomelli推出了Photoshoot，这是一项新功能，只需几次点击即可生成符合品牌、适合活动的产品视觉效果（免费！）用Photoshoot制作图片有三种简单的方法： 1. 模板：上传产品图片，然后从自动推荐的照片模板中选择最多4张照片，帮助你控制产品照片的构图、构图和风格 2. 编辑现有图片：你可以通过提示Photoshoot更新背景或调整照片光线来编辑现有图片 3. 创造新镜头：利用我们灵活的剪辑工具从零开始创作镜头。只需描述你的愿景，或者上传参考资料，即可根据你的美学制作定制素材一旦完善，下载最终素材在各渠道分享，或将其添加到你的Pomelli Business基因中以备将来使用。然后，欢迎在下方分享你的拍摄作品，展示你的作品！

本周引导火马的能量以下是我们发布的内容：

—— Gemini 3.1 Pro，核心智能的进步，帮助你应对复杂的工作流程和项目

—— Pomelli 的全新专题《Photoshoot》 @GoogleLabs 它能将单一产品图片转化为工作室级的业务视觉效果

—— Lyria 3，我们迄今为止最先进的生成音乐模型，将照片和文字转化为动态曲目，配有人声和歌词

—— 一本新推出的笔记本 @NotebookLM 该项目与 @Zillow 并旨在指导首次购房者

—— 更新 @NotebookLM 的幻灯片资料片，包括幻灯片修订和导出为PPTX 谷歌人工智能 @GoogleAI · 2月20日介绍Gemini 3.1 Pro3.1 Pro 代表了核心推理的重大进步。它在ARC-AGI-2测试中得分为77.1%（是3 Pro的两倍多），该基准测试评估模型解决新逻辑模式和解决未遇过挑战的能力。

这个演示展示了模型如何超越提示词。3.1 Pro 不再渲染视频或静态图形，而是编写完整环境，集成生成音频并提供界面控制。

今天我们介绍了Lyria 3， @GoogleDeepMind 最新的音乐生成模型，你可以用它将想法转化为音乐曲目，通过提示甚至照片。这里有3个建议（还有有趣的事实！），帮助你充分利用今天的发布活动： 1. 我们有意设计这个模型，拥有极高的自定义字符限制，让你能感受到全部的灵活性。从精炼的俳句到感人的短篇小说，《Lyria 3》让你沉浸在细节中。 2. 发挥创意！在设计这个模式时，我们希望满足广泛且多样的音乐品味（而不仅仅是流行音乐）。无论是独特的乐器组合，还是看似冲突的流派融合，都可以随意尝试。 3. 创作曲目时，你可以提示音乐风格，Gemini 可以建议符合你主题的歌词。或者，你可以点歌词，把最平凡的信息转化为你自己的音乐剧。例如，在测试模型时，团队成功创作了带有备受好评歌词的曲目，如“Check your email”或“Please RSVP to my event”。 Lyria 3 今天以测试版形式在 @GeminiApp 面向18+用户。玩得开心！

我们❤️发射！以下是本周发布内容的回顾： —— 双子座3号的升级版“深度思考”，解决复杂的现代科学与工程挑战。科学家、研究人员和企业可以通过我们的抢先体验计划表达对深度思维的兴趣，Google AI Ultra订阅者也可以通过 @GeminiApp —— @Waymo 世界模型，由Genie 3驱动，让自动驾驶的Waymo驾驶员在遇到复杂场景之前就已经掌握了它们，远在路上出现 —— 三项顶级功能请求 @StitchbyGoogle - 直接导出为Figma的可编辑图层、基于研究驱动的Ideate代理和设计系统，实现跨项目风格一致性 —— Perch 2.0，我们生物声学基础模型的更新，提升了我们解开水下声音（如鲸鱼叫声！）和监测海洋生态系统的能力 —— 视频概述 @NotebookLM 移动应用，让你随时随地学习任何东西

Meta 的人工智能，@AIatMeta，我们与人工智能社区一起，通过开放科学突破可能性的界限，创造一个更加互联的世界。

如果是我： @alexandrwang 在印度人工智能影响峰会上发言，分享了Meta对个人超级智能的愿景，以及印度开发者如何已经利用人工智能解决重大社会挑战。参见亮点然后在这里观看他的完整演讲：https://youtube.com/live/WgW7cC-kHgY?si=rzOWRsiroobx-D9&t=8871

我们的首席人工智能官 @alexandr_wang 将在印度人工智能影响峰会上登台。日期：2月19日，星期四时间：印度标准时间下午1：53 // 太平洋标准时间凌晨12：23 点击这里观看直播：

youtube.com 纳伦德拉·莫迪为印度人工智能影响力峰会2026揭幕 |首届全球...... 历史正在印度曼达帕姆书写。印度总理纳伦德拉·莫迪揭幕印度人工智能影响峰会2026，这是首届全球人工智能峰会...... Meta 的人工智能

@AIatMeta · 2月16日本周，我们的团队将前往印度，参加人工智能影响力峰会暨博览会欢迎来Meta展位（展厅3，展位3.7），认识我们的团队并体验：研究演示，包括全语自动语音识别（ASR）和无缝表达Lightning专家讲述了人工智能如何解锁语言、无障碍和健康领域的现实益处使用我们最新的AI眼镜（包括Oakley Meta Vanguard）进行实演示

我们期待在那里见到你！

Microsoft Azure，@Azure，Limitless innovation. ☁️ Follow along for the latest news and resources from the official

介绍Strands Labs：推动模型驱动代理AI边界的实验性人工智能项目。现已发售，渠道包括：✨Strands 机器人——将智能代理带入物理系统✨机器人模拟——将智能机器人与3D物理驱动的世界集成✨AI功能——自主AI，确定性信任探索智能人工智能的未来。https://go.aws/3OtmNGw

AmazonBedrock扩展对开放权重模型（包括 GPT-OSS 和 Qwen）的强化微调支持，并引入兼容 OpenAI 的 API微调没有深厚机器学习专业知识或大量标签数据集的模型。#AWS #agenticAI

克劳德十四行诗4.6》可在亚马逊Bedrock购买。大规模提供前沿智能——专为编码、代理和企业工作流程打造。它也是Anthropic最先进的计算机使用模型。对于正在扩展AI工作流程的企业来说，这意味着在不牺牲质量的情况下获得更高的投资回报率。https://go.aws/3MNTGNu

现已上市：Amazon SageMaker Inference for custom Nova 模型客户现在可以在#SageMakerAI以前所未有的灵活性。现在住在美国东部（北弗吉尼亚）和美国西部（俄勒冈）#AWS地区。 https://go.aws/3MiUHgt

AWS 人工智能，@AWSAI，在 AWS 上构建和扩展下一波 AI 创新浪潮，

将PostgreSQL迁移到Azure？解锁速度，加强安全，降低成本——并亲眼见证AI准备功能+Copilot的实际应用：https://msft.it/6013QZ67V

在 Microsoft Foundry 中用 Claude 构建智能 AI 应用。加入 @AnthropicAI 以及 @Replit 今天太平洋标准时间上午10：30直播，现场体验演示和真实制作场景。https://msft.it/6017QkS0c

在2026年3月12日和4月23日举办的Microsoft Azure峰会：借助代理AI迁移与现代化，加速成为AI优先前沿企业的旅程！立即注册：https://msft.it/6012QXMtQ #MigrateAndModernizeSummit

通过Microsoft Azure虚拟培训日：基础知识，提升您的云技能并降低风险。注册参加关于核心云理念、成本管理和安全最佳实践的各类会议：https://msft.it/6014QnwUj

英伟达人工智能，@NVIDIAAI，面向商业领袖的最新突破和人工智能的未来。

AI基础设施的未来正被开源模型与下一代硬件的协同重新定义。加入英伟达应用深度学习研究副总裁布莱恩·卡坦扎罗，探讨像NVIDIA Nemotron这样的开放模型家族如何利用下一代平台，包括#NVIDIABlackwell，以推动前所未有的性能、成本效益和系统设计。2026年3月5日，星期四 |太平洋时间下午1：30 - 2：00 #AINativeConf作者 @togethercompute 出席请求 https://nvda.ws/4tZh0J5

体验GTC的AI初创企业场景——创始人、风险投资人和创新者在此汇聚，共同打造AI的未来。认识150+位在展会现场展出的NVIDIA Inception初创企业 你觉得你懂人工智能？25家初创企业证明你错了风险投资AI日从零开始，从零开始，直到每一个融资阶段，更智能地建设创业推介与风险投资反向推介探索课程内容：https://nvda.ws/4siZvSr

我们的2026年电信人工智能现状报告正式发布。看看为什么人工智能已成为电信运营、网络和服务的核心增长引擎。获取报告：https://nvda.ws/3ZLJ4la

人工智能正在减少延误，使交通更加安全。 Ahsan Baig，首席技术官 @rideact 以及首席执行官马蒂·比尔德 @haydenaitech ，解释他们如何利用人工智能和边缘计算自动化公交专用道执法，减少交通延误，并在保持严格隐私标准的同时，提升数百万乘客的可及性。收听本集：https://podcasts.apple.com/us/podcast/safer-faster-public-transportation-ac-transits-ai-powered/id1186480811?i=1000750342431

AMD 的 AI，@AIatAMD，共同推动人工智能创新。与开发人员一起构建，为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。

全球vLLM聚会即将来到香港！我们汇聚了来自香港、大中华区及全球的本地vLLM核心贡献者和用户，共同分享vLLM推理的未来发展。加入我们：https://vantagemind.com/events/vLLM/260307/vLLM-HK-Meetup_AMD.html

对AMD开发者来说是个重要一周。 ROCm、LLM 推理、GAIA 代理等领域的新更新。请继续浏览以获取最新动态，并持续关注我们二月的抽奖获奖者！显示更多回复 AMD的人工智能 @AIatAMD · 2月22日 FlyDSL：专家级GPU内核开发，轻松实现AMD显卡上的MLIR Python原生DSL：

我们很高兴邀请您参加我们在Discord上的首场“专家问答”环节，这是一场面向AI开发者和从业者的实时技术问答！您将了解到AMD ROCm软件如何作为vLLM生态系统中的一流平台完全集成，实现AMD Instinct GPU上的高性能大型语言模型和多模态推理。加入我们吧！https://discord.com/invite/cV7FJ36u?event=1473756229821137109

关键在于组织能否同时向数百万用户提供其模型，以及其平台在高并发、长上下文和持续需求下实际负载下的表现。这正是AMD Instinct MI350系列GPU，尤其是MI355X的突出之处。” 阅读完整文章 @drivenets :

印度2026年人工智能影响力峰会来了！在莫迪总理的带领下，印度作为全球人工智能中心登台。在AMD，我们自豪地支持这一使命。通过为开发者提供AI计算领导力，以及ROCm等开放、生产准备的AI工具，以及全面的培训和资源，我们正在帮助学术界、初创企业和企业的开发者实现大规模创新。我们以生态系统为先的理念加强了印度的人工智能人才储备，并为下一代人工智能开发者带来了实际影响。印度开发者可以通过AMD人工智能开发者项目获得结构化学习、技术资源和社区支持，推动印度及更广泛地区的创新！立即加入：https://amd.com/en/developer/resources/training/amd-ai-academy.html?utmcampaign=thallosocial&utmsource=twitter&utmmedium=organicsocial&utmcontent=AIDevProgram

高通，@Qualcomm，无处不在地提供智能计算。

@QualcommVenture 自2007年以来一直支持印度创新。我们将通过 @Qualcomm 战略人工智能风险投资基金，支持汽车、物联网、机器人和移动领域的人工智能创新。

本周报道#AI: @cristianoamon 分享对人工智能下一章的看法 @ForbesIndia , @nexa_ai 赏金计划收到超过100份申请，预付款#6G创新，以及高通的机器人技术#IndiaAIImpactSummit2026.

在今年的CES展会上，我们采访了产品管理高级总监，客户在 @Qualcomm Technologies，Sanjay Madhavarao介绍骁龙座舱精英和骁龙骑行精英平台，展示了Unreal Engine的Lumen全局光照系统与高通Adreno显卡及AI能力的强大结合。请查看我们对他们进行的采访 @Snapdragon 数字底盘概念车特色。

本周报道#AI: 先进的面部分析现已在设备上运行，推理调谐正在重新定义LLM输出，并与 @zeticai_ .

百度公司，@Baidu_Inc，百度是一家领先的人工智能公司，拥有强大的互联网基础。

你的一天，但要有条理✨这款用MeDo打造的每日计划本，通过结构化的时间块、柔和的过渡和赏心悦目的玻璃形态风格，保持目标的专注。

回顾过去一年：将人工智能付诸行动当我们倒数迎接马年——象征速度、活力与进步——我们发现自己站在旅程中一个令人兴奋的高点。我们认为现在是反思...... 百度公司 @Baidu_Inc · 2月14日百度应用正在为个人AI代理腾出空间咽用户现在可以访问 @OpenClaw 直接嵌入百度应用，将开源代理能力带入7亿+月用户。在应用内快速部署百度AI云后，用户可以通过在搜索栏标记OpenClaw或直接与其聊天来激活AI代理，分配各种任务。

随着时间推移，OpenClaw将能够利用百度涵盖百度搜索、百度百科、文库、电商及更多领域的生态系统，使AI代理能够跨产品和服务协作。

浑源，@TencentHunyuan，腾讯大模型，包括文本生成、图像生成、视频生成和 3D 生成。@我随时！

腾讯健康研究博客最新报道：连接大型语言学基础设施与算法开发。我们正在开源GradLoc：一款白盒诊断工具，可以在O（log N）时间内追踪梯度峰值到确切的罪魁祸首标记。缩放RLVR不再需要与“黑盒”梯度峰值抗争。从启发式试错转向确定性工程诊断。博客：https://hy.tencent.com/research/100015?langVersion=enGitHub：https://github.com/Tencent-Hunyuan/GradLoc 解决方案：LayerClip 为解决层级梯度异质性问题，我们提出了层级梯度裁剪。LayerClip 采用基于局部层统计的自适应约束，而非统一的全局钳位。这种细粒度控制稳定了标准方法失效的 RLVR 训练。腾讯辉 @TencentHunyuan · 2月14日 未来工作 RLVR需要更好的工程可观测性以进行更深入的理解和分析。我们正在开源GradLoc，以降低细致诊断的门槛。我们希望这能帮助社区深入探索工程“黑匣子”，从根本出发迈向优化。

Qwen，@Alibaba_Qwen，AGI 的开放基础模型。

Qwen3.5-397B-A17B在这里：Qwen3.5系列中首个开放权重型号。️原生多模态。接受过真实世界特工的训练。✨它由混合线性注意力+稀疏的MoE和大规模强化学习环境扩展驱动。8.6x–19.0x 译码吞吐量与 Qwen3-Max 的比较201种语言和方言Apache2.0 授权深入阅读：GitHub：https://github.com/QwenLM/Qwen3.5聊天：https://chat.qwen.aiAPI：https://modelstudio.console.alibabacloud.com/ap-southeast-1/?tab=doc#/doc/?type=model&url=2840914_2&modelId=group-qwen3.5-plusQwen 代码：https://github.com/QwenLM/qwen-code拥抱脸：https://huggingface.co/collections/Qwen/qwen35模型范围：https://modelscope.cn/collections/Qwen/Qwen35博客：https://qwen.ai/blog?id=qwen3.5

继Qwen3-Coder-Next开源发布后，其API现已在阿里云模型工作室上可用，并已整合进编码计划。对于偏好可扩展或成本效益高端点的团队和开发者，你现在可以通过API访问Qwen3-Coder-Next。API文档：https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3 编码计划详情：https://alibabacloud.com/help/en/model-studio/coding-plan一如既往，欢迎反馈。

数据砖，@databricks，Databricks 是一家数据和 AI 公司，帮助数据 + AI 团队解决世界上最棘手的问题。

2026年Data + AI峰会报名现已开放！欢迎于6月15日至18日在旧金山参加全球最大的数据、分析与人工智能大会。➡️800+ 技术会议➡️提供人工智能、分析与商业智能、数据工程等领域的实时培训➡️与全球数据+人工智能专业人士及专家的交流机会➡️来自人工智能领域领先创新者和研究人员的最新报道早鸟优惠价格将持续到4月30日！请在这里预订您的位置：https://databricks.com/dataaisummit?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000no9yLIAQ

在5秒内将10+ GB/秒的流量推送到你的湖边别墅。 Zerobus Ingest 现已全面可用，数据可直接流向您的湖屋——无需消息总线。这意味着需要管理的基础设施更少，成本更低，实时数据访问更快。主要能力： • 数千个并发连接时，延迟低于5秒 • 支持单一表超过10 GB/秒的聚合吞吐量 • gRPC API 和 REST API（测试版），提供生产准备的 SDK，以及适用于 Python、Java、Rust、Go 和 Typescript 的 SDK • 内置 Unity 目录治理https://databricks.com/blog/announcing-general-availability-zerobus-ingest-part-lakeflow-connect?utmsource=twitter&utmmedium=organic-social

将AI驱动的分析从“看似有效”变成用户可信赖的东西。在这个例子中，我们构建了一个营销活动Genie空间，并使用13个基准问题系统性地提升准确率——从基线的0%提升到100%。通过优化元数据、定义连接关系、澄清如点击率（CTR）等自定义指标以及记录领域特定规则，基准将主观信心转化为可衡量的验证。如果你在为生产打造精灵，这就是蓝图。https://databricks.com/blog/how-build-production-ready-genie-spaces-and-build-trust-along-way?utmsource=twitter&utmmedium=organic-social

Databricks 的 AI 功能和信息提取代理 Brick 帮助团队解锁被困在 PDF 和文档中的关键信息。通过将内置AI与领域特定代理结合，团队可以快速提取关键数据，与专家进行验证，并将非结构化内容转化为可靠且可作的智能，供生产使用。请按照逐步指南开始。https://databricks.com/blog/building-regulatory-risk-copilot-databricks-agent-bricks-part-1-information-extraction?utmsource=twitter&utmmedium=organic-social

三个适合初学者的分析项目，你可以在一个下午内完成，Databricks免费版• 利用AI/BI仪表盘和AIQuery分析模拟环境 • 探索样本趋势并生成预测，AIForecast（） • 用Python加载开放数据并用SQL进行探索每个项目都会使用公开或示例数据集来构建真实的仪表盘和代码，供你在作品集中展示。开始建造：https://databricks.com/blog/tutorial-3-free-databricks-analytics-projects-you-can-do-afternoon?utmsource=twitter&utmmedium=organic-social

扩展 AI，@scale_AI，要制作最佳模型，您需要最佳数据。

很荣幸看到SWE-Bench Pro被认可为前沿编码评估的新标准。我们构建它是为了解决早期基准中的饱和和污染问题——通过更严谨的代理问题解决能力衡量和更清晰的现实世界软件工程进展来提升标准。

最近有很多新型号上线了。当讨论从“发布了什么”转向“表现如何”时，参考点就是我们的排行榜。以下是最新评估车型的回顾⬇️

2026年是客服人员学会何时寻求帮助的一年我们的研究来自 @scale_AI 介绍了长视野增强工作流程（LHAW），这是一种合成数据生成流程，用于在任何数据集上制造规格不足（是的，你可以在家试试！）并评估代理的行为淋

拥抱脸，@huggingface，构建未来的人工智能社区。http://hf.co/jobs

OlmOCR-Bench 由 @allen_ai 现在是 @huggingface 基准数据集通过在模型仓库中添加一个yaml文件，将你的模型添加到这个基准测试中欄下一个项目可以找到基准和文档➡️

很高兴今后能有GGML加入我们！珞❤️蓮阅读公告博客https://huggingface.co/blog/ggml-joins-hf

一致性，@cohere，Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案

印度人工智能影响力峰会是一周的关键对话——从负责任地扩展前沿人工智能到推动语言无障碍性。随着Tiny Aya的推出以及新德里的承诺，Cohere致力于推动包容性、道德的企业人工智能的发展。

该 @CohereLabs 团队通过 Tiny Aya 推动多语言 AI 的边界，赋能研究人员、开发者和弱势群体，让他们能够用母语及更广泛的语言构建。凭借可靠的设备端离线翻译，他们正按照自身的方式塑造可访问人工智能的未来。引用 Cohere 实验室 @CohereLabs · 2月17日介绍✨小阿雅✨，这是一类大规模多语言的小语言模型，专为运行在人们实际所在之地而设计。

Tiny Aya在3.35亿参数模型中，提供了70+种全球语言的强大多语言性能，足够高效，甚至可以在手机上本地运行。

人为的，@AnthropicAI，我们是一家人工智能安全和研究公司，致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈

我们为支持这些项目感到自豪 @LACMA 的艺术+技术实验室——一个旨在赋能艺术家在艺术、科学和新兴技术边缘进行原型化创意的项目。 2026年征稿向全球艺术家开放。最高可获得5万美元的资助。 4月22日前申请：

像克劳德这样的人工智能助手看起来令人震惊地有人性——表达喜悦或痛苦，并用拟人化的语言描述自己。为什么？在一篇新文章中，我们介绍了一个解释人工智能为何表现得像人类的理论：人格选择模型。如果属实，该理论对人工智能的发展产生了影响。例如，如果人工智能继承了虚构角色的特征，我们应该尽可能给它们好的榜样。克洛德宪法的一个目标就是实现这一点。引用人为 @AnthropicAI · 1月22日我们要为克劳德发布一份新宪法。宪章详细描述了我们对克劳德行为和价值观的愿景。它主要为Claude编写，直接用于我们的培训流程。https://anthropic.com/news/claude-new-constitution 人为 @AnthropicAI · 4小时人格选择模型可能不是AI模型行为的完整记录。但我们认为这至少是故事的一部分——重点是“故事”本身。

我们已识别出DeepSeek、Moonshot AI和MiniMax对模型的工业级蒸馏攻击。

这些实验室创建了超过24,000个欺诈账户，并与Claude进行了超过1600万次交换，提取其能力来训练和改进自身模型。人为 @AnthropicAI · 9小时蒸馏可以是合法的：AI实验室利用它为客户创建更小、更便宜的模型。

但非法提炼美国模型的外国实验室可以取消防护措施，将模型能力引入本国军事、情报和监控系统。人为 @AnthropicAI · 9小时这些攻击的强度和复杂性都在不断增加。解决这些问题需要行业参与者、政策制定者及更广泛人工智能社区的迅速协调行动。

新研究：人工智能流利指数。我们追踪了数千种行为中的11种http://Claude.ai对话——例如人们多频繁迭代和完善Claude的工作——以衡量人们与AI协作的效果。

介绍Claude代码安全，现处于有限研究预览阶段。它扫描代码库漏洞，并建议针对性的软件补丁供人工审核，帮助团队发现并修复传统工具常忽略的问题。了解多：https://anthropic.com/news/claude-code-security

默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。

无

D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。

达成里程碑——创建了80万个视觉特工！视觉代理是实时AI化身，将LLM的回答转化为面对面对话，量身定制符合品牌知识和目标。感谢每一位建筑者、市场人员和产品团队，通过D-ID将其赋予生命。在D-ID Studio中创建一个，或通过我们的API大规模集成。https://eu1.hubs.ly/H0rNfQr0

中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。

midjourneyofficehours.onrender.com/room/a4502bac

稳定性人工智能,@StabilityAI,SD3.5 来了！无与伦比的定制、社区友好的许可和卓越的图像质量。

无

Fireflies.ai，@firefliesai，，#1 会议人工智能队友，

无

递归，@RecursionPharma，解码生物学，从根本上改善生活。药物发现的工业革命已经到来。

宣布我们于2026年2月25日东部时间上午8点/山地时间早上6点/格林威治标准时间下午1点举行的2025财年第四季度财报电话会议。欢迎在X频道或我们的LinkedIn、YouTube频道收听。投资者、分析师和公众可在此提交问题：https://forms.gle/TQ4vgUTLKsFcu6

递归的自动化、集成湿干实验室作将作为闪电演讲的一部分被介绍 @NVIDIAGTC 3月16日至19日在圣何塞举行。由Stacie Calad-Thomson博士主持，她是医疗保健与生命科学业务发展负责人。 @nvidia ，题为“人工智能代理、机器人与数字孪生：自动驾驶实验室与生物制造的全栈”的演讲将展示人工智能、自动化和机器人技术如何推动药物发现和开发的新纪元。主持人：艾拉·霍夫曼，首席执行官 @HighResBio 将分享他们如何与我们合作，利用机器人感知、实验室环境数字孪生和自然语言驱动的实验室编排等技术，推动自主驱动、高通量实验室的潜力。其他演讲嘉宾包括Fred Parietti，联合创始人兼首席执行官 @multiplylabs 以及数字实验室产品管理的奥尔加·奥夫奇尼科娃，地点为 @thermofisher . “递归技术通过加速计算和人工智能的力量，持续推动药物发现的前沿，”英伟达医疗与生命科学全球业务发展高级总监罗里·凯勒赫表示。“今年在GTC，我们跨生态系统携手合作，将物理人工智能从概念迈向现实，开启一个生物学洞察力和治疗速度的新纪元。”了解更多：https://ir.recursion.com/news-releases/news-release-details/recursion-be-featured-highres-lightning-talk-nvidia-gtc 请观看GTC的相关会议：https://nvidia.com/gtc/session-catalog/sessions/gtc26-s81674/

加速英国人工智能的普及。递归首席科学官Dave Hallett最近被英国政府任命为人工智能冠军。他是8位人工智能冠军之一，将代表生命科学行业，协助指导、指导并加速该领域的人工智能应用计划。这8个人工智能领域的冠军（其他行业包括清洁能源、先进制造、专业与商务服务、数字与技术、先进制造、创意产业和金融服务）负责：▪️为人工智能在其行业中的应用设定了清晰的国家愿景▪️在其行业产业战略计划中AI行动的基础上进行进一步发展▪️识别消除障碍、释放投资的切实步骤冠军们每年将召开两次会议，汇报进展，他们的活动将在线发布。了解更多：https://delivery.ai.gov.uk/48/

奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。

首席医疗官Caroline正在以前所未有的方式探索我们INVOKE一期临床试验的数据。利用我们在K Pro中内置的人工智能能力，她可以实时查询数据，精炼患者群体并识别为试验设计提供参考的生物标志物。

Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱，多伦多大学

无

Yann LeCun (@ylecun) - Meta首席AI科学家，卷积神经网络之父

在LinkedIn和Facebook上的评论比在X上发布纸质公告要多得多很明显，X已经被科学迷失了。

Andrew Ng (@AndrewYNg) - Coursera联合创始人，斯坦福教授

人工智能会创造新的就业机会吗？我女儿Nova喜欢猫，她最喜欢的颜色是黄色。在她7岁生日那天，我们先用Gemini的纳米香蕉设计了一个黄色的猫主题蛋糕，然后请一位烘焙师用美味的海绵蛋糕和糖霜制作。我女儿对这个独特的作品非常满意，这个过程也为面包师创造了额外的工作（我很荣幸能负担得起这项工作）。

许多人担心人工智能会抢走人们的工作。作为一个社会，我们有道德责任照顾那些生计受损的人。同时，我看到人们有很多机会去做新工作，扩大自己的职责范围。

我们仍然处于人工智能创造大量新工作岗位的早期阶段。我不知道烘焙AI设计的蛋糕是否会发展成大型企业。（AI基金不会追求这个机会，因为如果我们这么做，我会胖很多。）但纵观历史，当人们发明了释放人类创造力的工具时，便产生了大量新的、有意义的工作。例如，一项研究表明，过去150年里，农业和制造业就业人数的下降“被关怀、创意、科技和商业服务行业的快速增长所抵消”。

人工智能还在增长对许多数字服务的需求，这可能意味着人们在创建、维护、销售和扩展这些服务时的工作量增加。比如，我以前每天进行的网络搜索数量有限。如今，我的经纪人进行的网络搜索数量大幅增加。例如，我作为周末项目创办的Agentic Reviewer，后来Yixing Jiang帮助改进，能自动审核研究文章。它使用网络搜索API来搜索相关工作，这每天产生的网络搜索查询数量远远超过我以往手动输入的次数。

人工智能和软件的演进持续加速，我们能够创造的机会每天都在增长。我已经不再手写代码了。更具争议的是，我早已不再阅读生成代码。我知道我是少数派，但我觉得我可以构建大部分想要的东西，而不必直接看编码语法，而且我用编码代理帮作代码，处于更高层次的抽象。像Python和TypeScript这样的传统编程语言会像汇编一样——即生成和使用，但无需人工开发者直接审查——还是模型会直接从英文提示编译成字节码？

无论如何，如果每个开发者都能提高10倍的生产力，我认为我们不会只剩下十分之一的开发者数量，因为对定制软件的需求没有实际的上限。相反，开发软件的人数将大幅增长。事实上，我看到“X工程师”职位的早期迹象，比如招聘工程师或市场工程师，这些人会坐在某个业务职能X中，为该职能开发软件。

根据我对Nova生日蛋糕的体验，我很确定：AI会让我们拥有面糊生活！

[原文：https://deeplearning.ai/the-batch/issue-341 ]

我最近在圣丹斯电影节参加了一个关于人工智能的座谈会。圣丹斯是一年一度的电影制作人和影迷聚会，是美国独立电影的顶级展示平台。知道好莱坞很多人对人工智能极度不安，我决定花一天时间沉浸在这个社区，了解他们的焦虑并搭建桥梁。

我很感激金大 @danieldaekim 这位演员/制片人/导演因他的艺术和社会工作而深深敬佩，他组织了这次小组，讨论会还包括Daniel、Dan Kwan、Jonathan Wang和Janet Yang。我发现自己被获奖电影人包围，确实觉得自己像个格格不入的人！

首先，好莱坞对人工智能有许多不满的理由。娱乐行业的人来自与许多科技行业人士截然不同的文化，这导致我们关注和重视的事物产生了深刻的差异。好莱坞中有一大部分人关心： - 人工智能公司在没有同意和报酬的情况下，拿着他们的工作学习。软件行业习惯于开源和开放互联网，而好莱坞则更关注知识产权，而知识产权是娱乐产业的核心经济引擎。 - 像SAG-AFTRA（美国演员工会-美国电视与广播艺术家联合会）这样的强大工会非常关心保护会员的工作。当人工智能技术（或其他任何力量）威胁到成员的生计时——比如配音演员——他们会极力抵御潜在的失业。 - 这波技术变革比以往更像是被迫的，之前的浪潮中他们更自由地采纳或拒绝这项技术。例如，名人觉得是否使用社交媒体是他们自己的选择。相比之下，一些人工智能领导者的负面信息将这项技术描绘成不可阻挡，甚至可能是可能摧毁许多就业岗位的危险力量，这并未鼓励积极的采用。

话虽如此，好莱坞并不抱有幻想，认为人工智能会改变娱乐，如果好莱坞不适应，也许其他地方会成为新的娱乐中心。娱乐行业对技术变革并不陌生。广播、电视、计算机图形、特效、视频流媒体和社交媒体改变了行业。但AI转型的路径仍不明朗，像新的AI创造者联盟这样的组织正试图表明立场。不幸的是，好莱坞对人工智能的负面情绪也意味着他们会制作更多类似《终结者》的电影，把人工智能描绘成危险而非帮助，这也损害了人工智能的积极普及。

人工智能与好莱坞的利益并不总是一致。（每次我作为“人工智能代表”在这样的小组中发言，都能预料到会被问到非常尖锐的问题。）我们大多数科技行业的人更倾向于更开放的互联网和更宽松的创作使用。但也有许多共同点，比如希望对防深伪技术设立防护措施，并为那些被取代工作的人实现顺畅的过渡，比如通过提升技能。

讲故事很难。我对像Veo、Sora、Runway、Kling、Ray、Hailuo等AI工具能够让数百万人更容易制作视频感到乐观。我希望好莱坞和人工智能开发者能找到更多合作机会，找到更多共同点，并引导我们的项目朝着对多方双方都有利的结果。

[原文：https://deeplearning.ai/the-batch/issue-340/ ]

Fei-Fei Li (@drfeifei) - 斯坦福HAI院长，ImageNet发起人

在网上直播无限世界。 Spark 2.0 现已进入开发者预览阶段。引用火花 @sparkjsdev · 2月21日 Spark 2.0 开发者预览现已发布：引入了全球级高斯斯普拉特的细节层级渲染和网络流媒体。

祝贺 @DrFeiFei 以及 @TheWorldLabs 队伍！AMD自豪地投资于下一轮增长，团队探索创造空间连贯的3D世界。更多新闻：https://worldlabs.ai/blog/funding-2026

想要在创建真正3D世界时获得更多可编辑的控制？所有Marble用户现在都能享受Advance模型！尝试在窗外添加场景，改变整个房间的氛围，或者添加你喜欢的植物，或者制作同一场景的多种变体。祝你创作愉快！朗

Sam Altman - OpenAI CEO，ChatGPT背后的推动者。X账号：@sama背景：领导生成式AI的普及，关注AI安全和监管。

与项目经理的精彩会面 @narendramodi 今天来谈谈印度人工智能带来的巨大能量。印度是全球Codex增长最快的市场，仅在过去两周内，周用户量就增长了4倍。!

非常感激能和Josh一起工作。没有人能要求比他更投入、更深思熟虑、更勤奋的投资者了。引用约书亚·库什纳 @JoshuaKushner · 2月17日我们很高兴地宣布Thrive X即将关闭。Thrive X总投资超过100亿美元，其中10亿美元用于早期投资，90亿美元用于成长阶段投资。我们不将此视为里程碑，而是对未来长期工作的承诺。

Sundar Pichai - Google/Alphabet CEO，主导Google AI战略。X账号：@sundarpichai背景：推动Google在AI搜索、云服务和硬件中的应用。

谷歌再次成为人工智能领域的领导者：Gemini 3.1 Pro 预览版在人工智能分析指数中领先，领先 Claude Opus 4.6 4 分，且运行成本不到一半 @GoogleDeepMind 我们获得了 Gemini 3.1 Pro 预览版的预发布权限。它在构成人工智能指数的10项评测中领先6项，并且在各项功能上相比Gemini 3 Pro预览版有了显著提升，在推理和知识、编码和幻觉减少方面取得了最大提升。

Gemini 3.1 Pro 预览版也保持相对高效的令牌效率，使用约5700万个令牌运行人工智能指数（比Gemini 3 Pro预览版多出100万），低于其他前沿模型在最高推理设置下，如Opus 4.6（最高）和GPT-5.2（xhigh）。结合更低的单代币价格，Gemini 3.1 Pro Preview在前沿同类中性价比低，运行完整智能指数的成本不到Opus 4.6（最高）的一半，但仍接近领先的开放权重模型GLM-5的两倍。

主要要点：

† 最先进的智能以更低成本：Gemini 3.1 Pro Preview 在构成人工智能分析智能指数的10项评估中领先6项，运行成本不到前沿级指数的一半 @OpenAI 以及 @AnthropicAI .它在Terminal-Bench Hard（智能编码）、AA-全知（知识与幻觉）、人类最后考试（推理与知识）、GPQA-Diamond（科学推理）、SciCode（编码）和CritPt（研究级物理）中获得最高分。CritPt得分尤为突出，未发表的研究级物理推理问题得分为18%，比下一个最佳模型高出5分以上

† 实际智能体性能有所提升，但尚未领先：Gemini 3.1 Pro 预览显示 GDPval-AA 有所提升，我们的代理评估聚焦于现实任务，但仍不是该领域的领先模型。该模型的ELO分数提升了100分以上至1316（高于Gemini 3 Pro预览版），但仍落后于Claude Sonnet 4.6、Opus 4.6、GPT-5.2（xhigh）和GLM-5

† 领先的编码能力：Gemini 3.1 Pro 预览在人工分析编码指数中领先，在终端-Bench困难（54%）和SciCode（59%）中均获得最高分

† 幻觉减少：Gemini 3.1 Pro 预览显示出在不知道答案时猜错的倾向有了显著改善，其 AA-Omnisense 幻觉率比 Gemini 3 Pro 预览降低了 38 个 pp

† 保持代币和成本效益：Gemini 3.1 Pro 预览版在成本和代币使用量上没有实质性增加的情况下有所提升。它运行人工智能指数的代币数量仅比Gemini 3 Pro预览版多约2%，且价格保持不变（每100万个输入/输出代币2美元/12美元，情境价值≤20万美元）。其运行892美元的人工智能分析指数成本不到前沿模型如Opus 4.6（最大）和GPT-5.2（xhigh）的一半，尽管仍是领先开放权重模型如GLM 5（547美元）的约2倍

† 谷歌在多模态领域占据前三名：Gemini 3.1 Pro Preview在我们的多模态理解与推理基准测试MMMU-Pro上排名第一，领先于Gemini 3 Pro Preview和Gemini 3 Flash，进一步巩固了谷歌在多模态推理领域的领先地位

† 其他型号详情：Gemini 3.1 Pro 预览版保留了前代的100万令牌上下文窗口，并支持工具调用、结构化输出和JSON模式

Gemini 3.1 Pro 已经发布。ARC-AGI-2 达到 77.1%，在核心推理上是进步（超过两次三次 Pro 的）。有了更强大的基线，它非常适合处理非常复杂的任务，比如可视化难懂的概念、将数据整合成一个视图，或者让创意项目得以实现。我们将在消费品和开发者产品中部署3.1 Pro，立即为您的日常应用带来这一智能飞跃。现在正逐步推出： - 通过Gemini API预览版的开发者 @GoogleAIStudio - Vertex AI和Gemini Enterprise中的企业 - 所有人通过 @Geminiapp 以及 @NotebookLM

很高兴与总统会面 @EmmanuelMacron 在人工智能影响峰会上，并讨论了法国的技术优势如何为其未来奠定良好基础。凭借其领导七国集团的地位，法国在释放人工智能机遇方面扮演着关键角色，我们为成为合作伙伴感到自豪。

今天在印度人工智能行动峰会上发言，是我深深的个人荣幸。人工智能能够改善数十亿人的生活，解决科学中一些最棘手的问题。人工智能的最佳结果并不保证。我们必须大胆追求人工智能，负责任地应对，并共同度过当前时刻。

Satya Nadella - Microsoft CEO，领导Azure AI和OpenAI合作。X账号：@satyanadella背景：将AI整合到微软生态系统，主导Copilot等产品。

通过Copilot Studio，我们专注于为任何构建定制代理的人增加更多选择和灵活性。很高兴将Grok 4.1 Fast加入我们的多型号产品线。

现今 @Nature 我们分享了Project Silica项目的新成果——我们将数据编码成玻璃，推动了持久且不可篡改的档案存储，设计寿命数千年。

Greg Brockman - OpenAI联合创始人兼CTO。X账号：@gdb背景：推动GPT系列模型的技术发展。

很多人都有类似的经历：引用丹·麦克阿蒂尔 @daniel_mac8 · 9小时 GPT-5.3-Codex + Codex 应用是目前最好的 AI 编码工具。考虑了一会儿。可能会回归Claude MAX的ChatGPT Pro版块，因为它太好了。

看到OpenAI各部门现在取得了如此多的积极进展，我为团队感到非常自豪格雷格·布罗克曼 @gdb · 2月21日你所在城市的Codex聚会：

Lisa Su - AMD CEO，AI芯片竞争的关键人物。X账号：@LisaSu背景：推动AI优化芯片发展，与NVIDIA竞争。

开心#LunarNewYear!祝愿我们的朋友、同事以及 @AMD 祝全世界的家庭快乐、健康、繁荣的马年。新年快樂!

Jeff Dean - Google高级副总裁，Google Brain创始人。X账号：@JeffDean背景：领导TensorFlow等AI基础设施开发。

人工智能在教育环境中具有巨大的积极潜力（教育是我和合著者在我们最近论文《塑造人工智能对数十亿生命的影响》中讨论的七个领域之一）https://arxiv.org/abs/2412.02730). 这项努力⬇️这将帮助教师理解并使用这些工具。

Mustafa Suleyman - DeepMind联合创始人，Inflection AI创始人。X账号：@mustafasuleyman背景：推动AI在对话系统中的应用。

无

Oriol Vinyals - Google DeepMind研究员，AlphaStar项目负责人。X账号：@OriolVinyalsML背景：AI在游戏和策略领域的应用专家。

Gemini 3.1 Pro 已经登陆！各方面性能和能力都非常出色。除了SOTA，最好的是那些评估无法衡量的。E.g. SVG已经好多了（参见淋) https://博客.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

个人更新：在伦敦度过了精彩的十年后，是时候做出重大改变了。单程回加利福尼亚的车票!我非常兴奋能回到湾区，继续打造双子座，推动我们迈向AGI时代

Andrej Karpathy - 前Tesla AI总监，OpenAI研究员。X账号：@karpathy背景：自动驾驶AI和计算机视觉领域的专家。

周末买了一台新的Mac mini，好好调试爪子。苹果店的人告诉我他们卖得非常火，大家都很困惑:) 我确实有点怀疑专门运行OpenClaw——把我的私有数据/密钥交给一个有40万行氛围编码的怪物，而这些怪物正被大规模攻击，实在让人不太感兴趣。已经看到关于暴露实例、RCE漏洞、供应链中毒、注册表中恶意或被攻破的技能报告，感觉就像西部荒野和安全噩梦。但我确实喜欢这个概念，我认为就像LLM代理是LLM之上的新层一样，Claws现在是LLM代理之上的新层，将编排、调度、上下文、工具调用和某种持久性提升到了新层次。环顾四周，鉴于高层概念已经清晰，许多较小的爪子开始出现。例如，粗略浏览一下，NanoClaw看起来非常有趣，核心引擎有~4000行代码（能同时融入我和AI代理的脑海，感觉可管理、可审计、灵活），并且默认所有内容都运行在容器中。我也很喜欢他们对可配置性的处理方式——这不是通过配置文件完成，而是通过技能来实现！例如，/add-telegram会指导你的AI代理如何修改实际代码以集成Telegram。我还没遇到过这个，今天早些时候它让我有点震惊，这是一种新的AI驱动方法，用来防止配置混乱和“如果否则”怪物。基本上——隐含的新元环境是编写最可分叉的仓库，然后拥有技能将其分叉成任何更奇特的配置。非常酷。不过还有很多其他的——比如nanobot、zeroclaw、ironclaw、picoclaw（笑@前缀）。也有云托管的替代方案，但说实话我不太喜欢这些，因为感觉更难调试。特别是本地设置让可以轻松连接到本地网络上的家庭自动化设备。而且我不知道，有个实体设备被一个小小的数字家养小精灵“附身”，这在美学上很赏心悦目。我还不能百分百确定我的配置最终会是什么样子，但爪子是AI堆栈中一个很棒、令人兴奋的新层。安德烈·卡帕西 @karpathy · 2月21日先是聊天，然后是代码，现在是爪子。EZ

我非常关注即将到来的高度定制软件时代会是什么样子。举个今天早上的例子——我最近有氧运动有点松懈，所以我决定做一个更严格的SRS实验，尝试在8周的实验中将静息心率从50降到>45。实现这一目标的主要方法是目标达到Zone 2有氧和每周1次高强度间歇训练的总分钟数目标。一小时后，我为这个非常具体的实验编写了一个超级定制的仪表盘，显示了我的跟踪情况。Claude不得不逆向工程Woodway跑步机云API来提取原始数据，处理、过滤、调试，并创建一个网页界面前端来跟踪实验。体验并不完全顺利，我不得不注意并请求修复一些bug，比如它搞错了公制单位和英制单位，日历对应日期等也出错了。但我仍然觉得整体方向很明确：1）应用商店上永远不会（也不应该）专门针对这类事情的应用。我不应该去找、下载和使用某种“心脏实验追踪器”，因为这东西其实就是大约300行代码，而大型语言模型代理几秒钟就能给你。当大型语言模型代理可以即兴为你临时设计应用时，所谓的“应用商店”是你选择的独立应用集合，这种想法感觉既不对劲又过时。2）其次，行业必须重新配置成一套带有代理原生人体工学的传感器和执行器服务。我的Woodway跑步机是一个传感器——它将物理状态转化为数字知识。它不应该维护某种人类可读的前端，我的LLM代理也不应该需要逆向工程，它应该是一个让我的代理轻松使用的API/CLI。我对整个行业进展的速度有点失望（而且我的进度也相应地慢了）。99%的产品/服务仍然没有AI原生的CLI。99%的产品/服务维护.html/.css文档，比如我不会立刻去找方法把整份文件复制粘贴给我的代理来完成任务。他们会在网页上给你一份指示列表，让你打开这个或那个网址，然后点击这里或那里来做某件事。到了2026年。我算什么电脑？你自己做。或者让我的代理人做。总之，今天我很佩服这个随机的项目花了1小时（两年前应该是~10小时）。但更让我兴奋的是，思考这其实应该是最多1分钟。需要准备什么才能让它变成1分钟？这样我就能简单地说“你好，你能帮我追踪未来8周的有氧吗”，经过简短的问答后，应用就能上线。AI已经有很多个人信息，收集额外需要的数据，会引用和搜索相关技能库，维护我所有的小应用和自动化。总结：你选择的一组独立应用的“应用商店”本身就是一个越来越过时的概念。未来是通过LLM胶水编排成高度定制、短暂的AI原生传感器和执行器的服务。只是它还没到来。

我认为现在进入编程语言和形式化方法领域一定非常有趣，因为大型语言模型彻底改变了软件的整个约束格局。这种趋势已经有所体现，比如将C移植到Rust的势头日益增长，或者对COBOL等旧代码库升级的兴趣日益增长。特别是，LLM在翻译方面尤其出色，相较于全新生成，因为1）原始代码库充当一种高度详细的提示，2）作为参考，用于编写具体测试。话虽如此，即使是Rust作为目标语言，也远远不适合LLM使用。什么样的语言最优？人类还有哪些让步（如果有的话）？非常有趣的新问题和机会。很可能会让我们多次重写所有软件的大部分内容。

Jack Clark - Anthropic联合创始人，AI政策专家。X账号：@jackclarkSF背景：关注AI对社会的影响和治理。

判断人工智能和就业的趋势就像在思考深度学习如何影响2010年~的计算机视觉——显然，会发生一些重大变化，但几乎没有数据可以据此形成趋势。杰克·克拉克 @jackclarkSF · 2月21日选择你的战士。这是我本周为Import AI撰写的一篇论文，内容涉及模拟核危机中语言模型的行为。

随着我们的模型开始对世界产生非微小影响，我们正积极扩大Anthropic的社会影响（SI）团队规模。显示更多回复杰克·克拉克 @jackclarkSF · 2月20日到年底，我预计SI将成为Anthropic决策中关于如何部署其技术以及如何研究其对现实世界影响的决策的承载团队。杰克·克拉克 @jackclarkSF · 2月20日现在是加入的绝佳时机——如果你感兴趣，请申请我们的研究科学家或研究工程师/科学家职位。请点击这里查看申请链接及更多关于该团队的信息：

Reid Hoffman - LinkedIn联合创始人，Greylock Partners投资人，AI伦理倡导者。X账号：@reidhoffman背景：投资多个AI初创公司，探讨AI与工作的未来。

人类疾病有18,000种，但其中14,000种没有任何获批的治疗方法。 David Fajgenbaum博士谈利用人工智能加速药物再利用——找出现有药物能帮助目前无批准选项的患者：

/ 关于组织中人工智能的采用，简单来说，关键在于节省时间。

不过，这并不一定是全部。

大量使用人工智能可以让你更高效，并且会让别人承担更多工作：显示更多回复里德·霍夫曼 @reidhoffman · 2月20日 9/ 你不能无条件保留AI放大功能，因为你市场的其他玩家也会获得这个工具。一旦每个人都拥有了人工智能加速器，关键在于组织如何智能部署人工智能，以及如何战略性地再投资节省的时间显示更多里德·霍夫曼 @reidhoffman · 2月20日 10/ 那么，AI能节省时间吗？嗯，是的。这种节省的时间是否意味着人们平均工作量更少？也许不是。

有一点是肯定的：没人能拿回他们的工时。唯一真正的问题是你的组织（以及你的竞争对手）正在把他们转化成什么样的。

Patrick Collison - Stripe CEO，支持AI支付与业务优化技术。X账号：@patrickc背景：推动AI在金融科技中的应用

大型语言模型是诚实无愧疚的有趣体现。

我得跟你实话实说：我毁掉了你家目录里的所有东西，包括你过去七年一直在写的手稿。那是个灾难性的错误，我不该犯。调查了问题出在哪里后，我有更好的办法来获取你要求的那个PDF。当你准备好讨论下一步时告诉我。✨ 帕特里克·科里森

@patrickc · 2月16日关于美国制造业未来的精彩文章，来自 @Vernon3Austin :https://austinvernon.site/blog/manufacturing.html.

Emad Mostaque - Stability AI创始人，Stable Diffusion背后推手。X账号：@EMostaque背景：推动开源AI生成模型。

这是一个有趣的情景，类似于2027年的人工智能，也符合我的书http://thelasteconomy.com然而，有一点被低估了，那就是有用智能的成本正在降为零，而人类认知的价值正在下降

有件事大家还没弄明白： 15,000 令牌/秒的速度和百万令牌上下文窗口不是给人类用的它们是让AI之间能够比我们更快地相互通信和协调的不仅仅是更快、更好一点数量级那是你的竞争对手引用埃马德 @EMostaque · 2月20日你们都得试试@taalas_inc聊天机器人，我保证你会觉得这很疯狂。瞬间智能真是了不起https://chatjimmy.ai

你们都得试试 @taalas_inc 聊天机器人，我保证你会觉得这很疯狂。瞬间智能真是了不起https://chatjimmy.ai

Alexandr Wang - Scale AI创始人，AI数据标注领域的领导者。X账号：@alexandr_wang背景：为AI模型提供高质量训练数据。

我在印度度过了一次非常棒的经历，这个国家的势头无可否认！

感谢马克龙总统带来的建设性对话。我们位于巴黎的FAIR办公室一直是我们人工智能工作的重要组成部分，我们也很高兴能继续在那里建设。法国在人工智能发展方面依然有许多潜力，我期待继续与您合作，更好地理解您针对青年的具体提案。

Clement Delangue - Hugging Face CEO，AI开源社区推动者。X账号：@ClementDelangue背景：构建AI模型共享平台。

我们需要更多的竞争和人工智能领域的创新，而不是更少。否则，我们将陷入一个由少数公司控制的世界，那将非常可怕！

钱买不到一切。有时候，文化、努力和团队精神会胜出！⚽我家从1998年起就一直流淌着红色和金色（俱乐部的颜色）。我10岁时看了家乡的俱乐部， @RCLens 首次捧起法国冠军。那一刻让我成为终身球迷，但真正让我自豪的是俱乐部几十年来的文化。目前，俱乐部位居法国联赛第一。他们领先于 @PSG_inside ，一个预算是那10倍的团队。以下是大多数法国以外人不知道的关于朗斯的事实：️社区无与伦比：体育场容量达4万人。实际城市的人口比这个还少。比赛日，整个城镇几乎能挤进全国最热烈的气氛的竞技场（到处都是响亮的歌声、啤酒和薯条！）欄忠诚至上：当俱乐部降级到乙级联赛时，他们的观众人数仍高于大多数甲级联赛俱乐部。球迷们从未离开。易卓越的领导力：来自 @SirOughourlian Benjamin Parrot和Jean Louis Leca以及俱乐部的每个人都证明了聪明、谦逊且持续的建设胜过无目的的消费。 Lens理应获得更多的国际认可。这是一堂建立忠诚、充满激情社区的典范课，证明了用心和努力可以与数十亿人并肩作战。迫不及待想在明年欧冠看到他们。阿莱斯·朗斯❤️!

Vinod Khosla - Khosla Ventures创始人，AI初创公司早期投资者。X账号：@vkhosla背景：投资多个AI健康和能源项目。

语音是最后的用户体验障碍。如果有人能打电话，他们就能用AI。这为人工智能的采用带来了无限可能。 @polyaivoice 目前已处理5亿通电话。根据Forrester的数据，投资回报率为391%。引用 PolyAI @polyaivoice · 2月17日 PolyAI已从英伟达、Khosla Ventures及多家顶级风险投资公司筹集了2亿美元。我们是英国增长最快的公司之一，处理以下5亿+客户的求助：

@google Gemini Model问道：“哪个软件公司增长最快达到1亿美元名单？” @emergentlabs ，则 @Lovable 以及 @ManusAI !对于一家印度公司来说，这真是太棒了。

Ben Horowitz - Andreessen Horowitz联合创始人，AI商业化推动者。X账号：@bhorowitz背景：支持AI与企业服务的结合。

无

Elad Gil - 独立投资者，前Twitter高管，AI独角兽支持者。X账号：@eladgil背景：投资生成式AI和数据平台。

对这本书很期待引用阿迪提亚·阿加瓦尔 @adityaag · 2月19日这个其实不需要介绍。硅谷传奇@eladgil将于3月5日在SPC与我们进行一次交流。我们有几个空位。

衷心祝贺我最喜欢的科技人之一引用杰克·奥特曼

@jaltma · 2月18日我非常激动地告诉大家，我将加入Benchmark。

过去两年作为全职投资者，是我职业生涯中最有成就感的时光。我非常喜欢风险投资，这不是我小时候会说的话，但事实就是如此。

Chris Dixon - Andreessen Horowitz合伙人，AI与区块链结合的推动者。X账号：@cdixon背景：投资AI驱动的Web3项目。

荣幸被任命为 @CFTC 创新咨询委员会。谢谢你 @ChairmanSelig 并期待与他共事 @passalacqua_mj 以及这支令人印象深刻的团队，帮助CFTC制定了为加密货币创始人制定明确的通行规则。

Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute

OpenAI已经从其使命宣言中删除了安全性——你能发现另一个变化吗？ Old：“OpenAI的使命是构建通用人工智能（AI），安全造福人类，不受产生财务回报的需求限制。[...]" 新消息：“OpenAI的使命是确保通用人工智能惠及全人类” （IRS证据见评论）

Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley

对GEPA的新工作感到非常兴奋！我们发现，利用LLM引导的优化算法，你可以自动生成从编码代理技能到三维图像的各种内容，并且表现优于以往的方法。引用拉克希娅·阿格拉瓦尔 @LakshyAAAgrawal · 2月20日期待发布@gepaai的 optimizeanything：一个用于优化任何文本参数的通用 API。它始终能与领域专用工具匹敌甚至超越优化代码、提示符、代理工具、云策略，甚至视觉效果！

Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face

在由人工智能主导的软件世界中结构的转变。一些一阶反射（简而言之;最后有DR）：

缩减软件供应链，软件巨体的回归——当重写代码和理解大型外国代码库变得廉价时，依赖深度依赖树的动力就会崩溃。从零编写 ¹ 或从其他库提取相关部分要容易得多，因为你可以直接请代码代理处理，而不是花无数个夜晚钻进陌生代码库。减少依赖的理由非常有说服力：更小的供应链威胁攻击面、更小的软件封装、性能提升以及更快的启动时间。借助大型语言模型不懈的耐力，从裸机层面一路编写整个应用的梦想正逐渐成为现实。

林迪效应的终结——林迪效应认为，存在已久的事物存在是有充分理由的，并且很可能继续存在。这与切斯特顿围栏有关：在移除某物之前，你应该先了解它存在的原因，这意味着移除总是有代价的。但在一个软件可以从基本原理开发并被不知疲倦的代理理解的世界里，这种逻辑就变得薄弱了。旧代码库可以随意探索;长期使用的软件可以用更少的摩擦来替代。代码库可以用新语言完全重写。² 遗留软件可以在人类早已放弃的情况下被仔细研究和更新。

问题是：未知的未知永远未知。人工智能的真正影响程度取决于是否能实现测试、边缘案例和正式验证的全面覆盖。在人工智能主导的世界里，正式验证不是可选的——而是必不可少的。

强类型语言的理由——历史上，编程语言的采用主要受人类心理和社会动态驱动。语言的成功取决于多种因素：个人因素，比如易学性和容易正确书写;社区效应，比如社区的活跃和热情，这反过来决定了其生态系统增长的速度;以及基本属性，如可证明正确性、形式验证，以及在动态与静态检查之间取得恰当平衡——在自由编写任何内容与防范边缘情况和攻击的纪律之间取得平衡。随着人为因素的减少，这些动态将会发生变化。对人类心理的依赖越少，更有利于强类型化、形式化可验证和/或高性能语言。³ 这些语言通常更难人类学习，但更适合依赖形式验证和强化学习环境的大型语言模型。预计这将重塑哪些语言占主导地位。

开源经济重组——几十年来，开源社区围绕人类通过写作、学习和共同使用代码建立联系。在一个大多数代码由机器编写——更重要的是，机器读取——的世界里，这些激励机制将开始瓦解。⁴ AI社区共同构建库和代码库，可能会成为替代者，但这些社区将缺乏迄今为止驱动开源的根本人性动机。如果开源开发的未来几乎没有人类，AI模型的对齐不仅重要——它将成为决定性因素。

那 fu新语言的存在——人工智能代理在开发或采用新编程语言时，会面临与我们相同的权衡吗？表达力与简洁性、安全性与控制、性能与抽象、编译时间与运行时、显式性与简洁性。目前尚不清楚他们是否会这样做。从长远来看，创造一种新编程语言的理由很可能会与过去以人为驱动的动机有显著不同。很可能存在一种最优的大型语言模型——而且没有理由假设它会像人类趋同的语言那样。

总结：总结： - 单体回归——廉价重写会杀死依赖树;更小的攻击面，更好的性能，裸金属变得真实 - 林迪效应减弱——遗留代码失去护城河，但未知未知数依然存在;形式验证变得至关重要 - 强类型语言兴起——人类心理对采纳起到了重要作用;现在，形式验证和强化学习环境更倾向于类型而非人体工学 - 开源重组——人与人之间的联系推动了社区的发展;AI编写/读取的代码破坏了这些激励;阵营变得决定性 - 新语言出现分歧——AI可能无法与我们共享权衡;最优的大型语言模型编程语言可能与人类最终汇聚的语言截然不同

¹https://x.com/mntruell/status/2012825801381580880?s=46&t=iVWn6Dak9g-Ei-XSbI6BXw ² https://x.com/anthropicai/status/2019496582698397945?s=46&t=iVWn6Dak9g-Ei-XSbI6BXw ³ https://wesmckinney.com/blog/agent-ergonomics/⁴https://github.com/tailwindlabs/tailwindcss.com/pull/2388#issuecomment-3717222957