# 每周国内外AI发展动态研究-2026年3月3至9日 **Published by:** [blockchain&AI](https://paragraph.com/@blockchainandai/) **Published on:** 2026-03-09 **URL:** https://paragraph.com/@blockchainandai/%E6%AF%8F%E5%91%A8%E5%9B%BD%E5%86%85%E5%A4%96ai%E5%8F%91%E5%B1%95%E5%8A%A8%E6%80%81%E7%A0%94%E7%A9%B6-2026%E5%B9%B43%E6%9C%883%E8%87%B39%E6%97%A5 ## Content 每周国内外AI发展动态研究-2026年3月3至9日 openclaw,@openclaw那个做事的人工智能。openclaw.ai OpenClaw 2026.3.7咽 ⚡GPT-5.4 + Gemini 3.1 Flash-Lite烙ACP绑定在重启后依然有效Slim Docker 多阶段构建SecretRef for gateway auth可插拔上下文引擎HEIF 映像支持Zalo 通道修复 OpenClaw 2026.3.2咽 Telegram直播ACP 子代理默认开启原生PDF工具✅Openclaw 配置验证Zalo 用纯 JS 重建100+ 安全与稳定性修复 睡眠功能我们还没发布。https://github.com/openclaw/openclaw/releases/tag/v2026.3.2 @alexfinn,氛围编码。Creator Buddy 的创始人兼首席执行官, 亚历克斯·芬恩 @AlexFinn · 3月8日苹果不再销售512GB的Mac Studios 纽约立法规定你能和不能与人工智能谈论什么 主要AI公司因你连接OpenClaw而封禁你 Mac Mini 在各地都售罄 下一款Xbox将售价1200美元你看到发生了什么吗? 正如当地情报机构所 x.com/MacRumors/stat...... 亚历克斯·芬恩 @AlexFinn · 4小时 你知道这意味着什么吗? 卡帕西刚刚释放了伟大的扳平者 现在任何人都可以成为自己的人工智能实验室 如果你只有一块GPU,你可以自动化它,让它自己构建模型并不断改进 你将成为一个人的OpenAI 刚买了第二个DGX Spark,这样我就能一次运行双倍实验 对于不了解具体作方式的人来说: 卡帕西的自动研究项目让你的GPU整晚都在自己做实验 尝试开放式配重模型 实施改进模型的实验 丢弃那些伤害模型的实验 持续自我改进的人工智能。在你家里。在你桌上。 可能是近几年里最大的一次发布 这个世界走向如此明显,令人痛苦 拥有自己硬件的人将拥有全部权力。自我提升的超级智能 没有硬件的客户会租用公司实验室目前决定租给他们的设备 自己。你的。智力。 开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。 GPT-5.4 思维和 GPT-5.4 Pro 现已在 ChatGPT 中陆续推出。 GPT-5.4 现已收录在 API 和 Codex 中。 GPT-5.4将我们在推理、编码和代理工作流领域的进展整合到一个前沿模型中。 我们正在发布一套关于思维链(Chain-of-Thought,简称CoT)可控性的全新评估套件和研究论文。 我们发现GPT-5.4 Thinking在掩盖推理方面能力较低——这表明CoT监控仍是有用的安全工具。 Codex 应用现已登陆 Windows。 在Windows上体验完整的Codex应用,支持本地代理沙盒和PowerShell开发环境支持。https://developers.openai.com/wendows 谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓ 更聪明。更快。Gemini 3.1 Flash-Lite 来了⚡该模型通过关注以下方面,提供了规模化的无妥协速度与智能: — 成本效益:输入成本仅为0.25万美元/100万,输出代币为1.5万美元/100万美元,工作速度更快,成本仅为大型型号的一小部分,包括输出速度比Gemini 2.5闪存提升了45% — 计算控制:3.1 Flash-Lite 提供灵活的思维层级,您可以根据项目复杂度主动选择模型在特定任务中“思考”的程度 — 可扩展智能构建:该模型能够大规模处理大量任务,同时降低成本,并且能够处理需要深入推理的复杂工作负载,如生成用户界面或详细的指令跟踪 3.1 Flash-Lite 今天通过 Gemini API 预览版 @GoogleAIStudio 以及顶点人工智能。 如果你们的话,以下是本周发布的回顾: —— Gemini 3.1 Flash-Lite(预览),我们迄今为止最具成本效益的 Gemini 3 系列机型 —— 电影视频概述 @NotebookLM 将你的资料资料转化为定制、沉浸式的视频 —— NotebookLM 信息图提供10种自定义样式,让你只需一键就能将复杂的源材料转化为易于阅读的视觉效果 — Canvas AI 模式下,提供动态侧面板,用于组织计划、撰写创意写作和直接在搜索内构建交互式编码工具(仅限美国) — @AndroidDev Bench 是一个面向 Android 开发的大型语言模型排行榜,旨在帮助开发者评估能力、识别差距并加速应用质量的提升 —— Groundsource,一个由人工智能驱动的数据集 @GoogleResearch 该项目旨在帮助社区更好地为突发洪水做好准备 —— Gemini 3.1 Pro 推出至 @StitchbyGoogle 提升了推理能力和细节关注,使你能够同时应对庞大的设计系统,遵守严格的品牌规范等 谷歌人工智能 @GoogleAI · 3月7日 有了Nano Banana 2,创造力的潜力不仅限于图像生成,还延伸到可用、可部署的软件和工具。以下是你可以用它构建的一些想法: ——基于实时数据的旅行应用:一款索引真实火车行程并可视化天气的应用 显示更多 谷歌人工智能 @GoogleAI · 3月7日 今天就开始用 Nano Banana 2 创建——通过 Gemini API 在 @GoogleAIStudio 顶点 AI + 在 @antigravity 以及 @firebase . 在这里了解更多关于该模型及人们正在构建的内容: 以下是 Gemini 3.1 Flash-Lite 解决现实世界问题的几个例子: 首先,这款高容量图像分类器展示了模型快速分析和排序大量内容(如图片)的能力(过去这可能太昂贵或过慢)。 这个演示只是一个快照利用3.1 Flash-Lite的多模态分析功能可以构建的内容。比如:实时数据可视化代理、CRM管理工具、自动化内容审核软件等。 Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。 无 Microsoft Azure,@Azure,Limitless innovation. ☁ Follow along for the latest news and resources from the official 将VMware工作负载迁移到Azure?这份官方学习计划将引导你如何将Windows Server和VMware资源迁移到Azure VMware解决方案,并利用Azure Arc进行混合管理。 开始计划,自信地迁移:https://msft.it/6010QgSYu Microsoft Foundry 通过加速 AI 生产,提供显著的投资回报率,同时具备强有力的治理、简化的复杂性和推动实际业务影响的统一平台。 探索我们Forrester TEI研究中各组织取得的成就:https://msft.it/6012QgtSG 认识Foundry中的Phi-4-reasoning-vision-15B:高保真视觉推理+高质量感知,适用于真实世界开发工作流程。 了解更多:https://msft.it/6011QgKvl GPT-5.4 可在 Microsoft Foundry 中获得。为生产级AI代理打造,具备更可靠的推理、更强的指令跟踪和集成的计算机使用能力。 在Foundry中自信打造:https://msft.it/6012QgMFy 现发货:Microsoft Build 两天的真实代码、真实系统和真实工作流程,供开发者构建和扩展人工智能。 2026年6月2日至3日 / 旧金山 报名现已开放:https://msft.it/6016QemVa 磁盘级恢复不能等?对Premium SSD v2(Pv2)和超强磁盘增量快照的即时访问支持,让你能立即以接近满速的速度将磁盘上线,缩短恢复时间,减少有状态工作负载的摩擦。 AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮, 无 英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。 从交易到支付再到防欺诈,人工智能正在从头到尾重塑金融服务。 这里有三条#NVIDIAGTC金融基础设施未来专题:淋现代欺诈检测需要高置信信号和大规模规模,以应对代理性商业和审判滥用等新兴风险。 加入 @Stripe 以及NVIDIA如何利用先进的机器学习技术和加速硬件,将欺诈率降至1.4万亿美元的规模,从而学习Radar等AI解决方案。3月17日,星期二 |太平洋时间上午11:00 – 上午11:40NVIDIA GTC |加利福尼亚州圣何塞 添加到日程 https://nvda.ws/3OwGaOK 人工智能正在从根本上改变世界的资金流动和管理方式。 不要错过任何见解——查看我们精心策划的精准金融服务会议议程,规划你的完整内容#NVIDIAGTC经验: 开放模型是人工智能最重要转变的核心之一。 在#NVIDIAGTCNVIDIA创始人兼首席执行官黄仁森正在召集一些最令人兴奋的人工智能公司的领导者,共同探讨未来发展。 介绍以下领导人: @AllenAI , @BFLML , @cursor_ai , @LangChain , @MistralAI , @EvidenceOpen , @perplexityai , @reflectionai , @thinkymachines , 和 @UW AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。 本周,AMD 开发团队为你带来了全新的更新! 横扫获胜者。RecSys 培训。LLM-d 与 RedHat AI、IBM Research 和 AMD 的 Meetup 会合。推理缩放教程。 柠檬水挑战赛冠军Sawan Srivastava为Open WebUI创建了柠檬水控制面板,为开发者提供了便捷的方式,在使用Lemonade Server和OpenWebUI运行本地AI时,监控性能、查看系统信息和管理模型。 加入AMD人工智能开发者项目,获取开发资源、社区资源,并有机会展示您的作品:https://amd.com/en/developer/ai-dev-program.html?term=3-04&utmcampaign=thallosocial&utmsource=twitter&utmmedium=social&utmcontent=1772646837 在印度建设人工智能需要开放的开发方式。我们的领先计算组合和开放软件ROCm将加速这一进程......加入AMD AI开发者项目#ExperienceOpen https://amd.com/en/developer/ai-dev-program.html?utmsource=x&utmmedium=organicsocial&utmcampaign=thallosocial&utmcontent=AIDevProgram 高通,@Qualcomm,无处不在地提供智能计算。 人们喜欢高通X105调制解调器RF系统的哪些方面,最近在#MWC26? 高通的Max Rodrigues为我们介绍了全球首款R19-Ready调制解调器,这为未来奠定了基础#6G开发与测试。 我们正在通过Network Edge释放真正沉浸式智能家居体验的潜力#AI. 高通的Jolie Lou为我们展示了演示。#MWC26 高通和 @Siemens 展示了一种自主工厂模型,边缘人工智能与私有工业5G协同工作——驱动AGV、机器人技术以及实时本地决策。#MWC26:https://bit.ly/4u4x7EW 本周人工智能专题: 行业联盟在#MWC26对于AI原生连接, @cristianoamon 在推动AI时代的6G平台上,高通首次展示了AI200机架和全新的Wi-Fi 8产品组合 百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。 海南刚刚获得了专属的自主路线,由Apollo Go掌舵。 Apollo Go去年在海口推出,是岛上首个完全运营的自动驾驶骑行服务。精心策划的路线现在带领骑行者穿越沿海地区、历史街区及城市的其他重要区域。 海口只是全国多个现有这些线路运营的城市之一。 在城市中出行还不错。 中国在人工智能方面有哪些独特之处? 去年十一月, @TIME 的 @CharlieCamp6ell 参加了我们在北京举办的百度世界年度大会,并与我们的首席执行官李罗宾进行了交流。 罗宾说,中国更重视应用。他将人工智能的发展描述为建立在芯片和模型基础层上的金字塔,应用置于顶层。如今产生的大部分价值仍集中于基础。为了维持整个生态系统的投资,必须在应用层实现更大的价值。 观看刚刚发布的采访: 浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时! 一个静态模型并不适用于所有人我们刚刚发布了最新的研究:功能性神经记忆。我们不再使用静态模型,而是为每一个输入生成自定义的“参数”。✅随时都可以提示你的模型✅即时个性化✅更好的教学跟进✅灵活且动态的存储器(无存储库)✌) (淋1/6) 0:08 / 0:09 显示更多回复 腾讯辉 @TencentHunyuan · 3月6日 HY-WU在人类评估方面超越甚至可与领先的开源和闭源模型相媲美。 (淋5/6) 腾讯辉 @TencentHunyuan · 3月6日 博客:https://tencent-hy-wu.github.io GitHub:https://github.com/Tencent-Hunyuan/HY-WU 腾讯健康团队已有25多篇论文被接受 @CVPR 2026. 今年,我们的工作涵盖:️图像编辑:思维链(Chain-of-Thought,简称CoT)推理和工具调用,实现细粒度、可控的编辑。视频生成:训练后强化学习、统一音视频生成、流媒体视频生成和推理加速。3D视觉:可控3D生成、纹理合成、3D强化学习、交互世界模型和统一多模态3D模型。 从推理引导剪辑到可扩展视频和3D原生基础,我们专注于构建跨模式的通用生成模型。 我们将在会议期间分享技术深度解析。 再见#CVPR2026今年六月在丹佛! Qwen,@Alibaba_Qwen,AGI 的开放基础模型。 Qwen 3.5系列GPTQ-Int4权重现已发布。 原生 vLLM 和 SGLang 支持。⚡️显存减少。推断更快。 在有限GPU配置上运行高性能模型。获取权重+示例代码: 拥抱脸:https://huggingface.co/collections/Qwen/qwen35模型范围:https://modelscope.cn/collections/Qwen/Qwen35 数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。 实时数据流一直需要复杂的架构和数周的开发工作才能做到最好。Databricks 的 Zerobus Ingest 就是为了改变这一点而设计的。 @CRN 的 @RickWhiting1 与产品管理高级总监Bilal Aslam讨论了该全托管、无服务器的导入服务的普遍可用性,该服务将数据直接流向湖屋,延迟不到五秒。 关于这对构建实时应用的团队意味着什么:“开发时间是几分钟到数小时,而不是几周或几个月。” 阅读全文:https://crn.com/news/software/2026/new-databricks-offering-targets-next-generation-data-streaming Lakebase 是一种新的运营数据库类别,将计算和存储分离,提供无服务器的 Postgres,随着需求扩展,闲置时可归零。 生产数据分支只需几秒钟,所有数据都以开放格式存储,无需担心供应商锁定。 启动产品巡回:https://databricks.com/resources/demos/tours/appdev/databricks-lakebase?itmdata=democenter?utmsource=twitter&utmmedium=organic-social 你构建真正上线的数据和AI应用指南作为应用开发者,你不应该花几个月时间在DevOps上,只为了让原型完成。这本动手电子书展示了如何更快地在Databricks平台上发布生产准备的数据和AI应用,使用端到端的示例和代码片段,而无需学习新的基础设施。 你将学会如何: - 从笔记本和原型转向实际应用 - 通过事务层提供分析数据和应用状态 - 构建安全、受治理的应用,无需自定义基础设施 - 使用可重复、生产准备的模式部署和运行https://databricks.com/resources/ebook/hands-guide-apps-databricks?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000jCPjxIAG 人工智能推理在生产环境中到底是什么样子的? 基于真实Databricks在20,000+组织中的使用数据: - 96%的请求是实时处理的,而非批量处理 - 实时驱动互动用例,如副驾驶、客户支持和个性化 - 科技行业在实时使用方面领先,医疗保健和生命科学在时间敏感场景中紧随其后 探索完整发现:https://databricks.com/resources/ebook/state-of-ai-agents?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000V6YWcIAN 扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。 介绍SWE-Atlas。 我们构建了 SWE-Atlas,作为 SWE-Bench Pro 的下一代进化,将代理评估扩展到超越变更准确性,更好地反映定义软件开发的真实交互式工作流程。 Codebase QnA 的结果现已公布,这是首个基于 SWE-Atlas 的评估,通过运行时分析和多文件推理衡量代理如何理解复杂代码库。 顶级模特得分仅为~30%。 拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs 部署 @Microsoft Microsoft Foundry 上的 VibeVoice-ASR @huggingface 多语言STT课程! 结构化输出,包含“谁”(说话者)、“何时”(时间戳)和“内容”,单次传输最多60分钟。 帖子中的逐步说明淋 huggingface_hub v1.5.0 刚刚发布了! 亮点:水桶。 可以想象成S3,但本地运行在Hub上。没有git历史记录。就是快速的、分块去重的对象存储。 高频桶同步 ./输出 hf://buckets/me/my-checkpoints 就这样。目前处于测试预览阶段。如果感兴趣,可以私信我! 一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案 我们自豪地宣布与 @AstonMartinF1 队伍! 每位团队成员现在都能使用我们的企业级模型和代理人工智能平台,使他们能够在全球体育中最具挑战性的数据环境中自信地运营。 请注意,从本周末开始,Cohere品牌将出现在车上。#AustralianGP 点击这里了解更多:https://astonmartinf1.com/en-GB/news/announcement/cohere-joins-aston-martin-aramco-as-official-generative-ai-partner 引用 阿斯顿·马丁阿美F1车队 @AstonMartinF1 · 3月4日 欢迎@cohere作为我们的官方生成式人工智能合作伙伴,帮助加速人工智能创新。 了解更多:https://astonmartinf1.com/en-GB/news/announcement/cohere-joins-aston-martin-aramco-as-official-generative-ai-partner 人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈 Anthropic Engineering Blog 新内容:在 BrowseComp 上评估 Claude Opus 4.6 时,我们发现模型识别了测试,然后找到并解密了答案——这引发了关于网络环境中评估完整性的问题。 阅读更多: 我们与Mozilla合作,测试Claude在Firefox中发现安全漏洞的能力。 Opus 4.6在短短两周内发现了22个漏洞。其中14个为高严重度,占Mozilla 2025年修复的全部高严重性漏洞的五分之一。 默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。 无 D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。 无 中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。 无 稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。 无 Fireflies.ai,@firefliesai,,#1 会议人工智能队友, 一个故事 @GeneOnlineNews 关注AI药物发现的新“展示证据”时代,以及递归的表现。 “人工智能药物发现公司面临的问题,不再是算法是否能生成假设,而是它们是否能带来临床结果。” 报道聚焦于递归公司针对罕见疾病家族性腺瘤性息肉症(FAP)的REC-4881项目,该项目在正在进行的二期临床试验中,在患者身上展现出显著效果。“在一个通常以计算雄心和平台潜力为特征的领域,这些数据提供了更具体的临床进展衡量标准。” 它强调了递归平台在最初发现过程中的关键作用。 “Recursion没有从预设的分子靶点开始,而是首先设计了缺乏APC的细胞,以计算方式定义疾病表型本身。高内容成像捕捉了人眼看不见的细微形态变化,随后通过专有计算机视觉系统和基础模型转化为可量化的疾病特征。数千种化合物被筛选出该表型,以确定哪些化合物能恢复细胞平衡。” “我们并不是在寻找特定的通路,”递归公司首席执行官兼总裁纳贾特·汗博士说,“我们是在问哪种化合物能真正纠正疾病状态。” 文章还强调了Recursion的ClinTech方法在推进和扩展试验中的重要性——利用美国超过3亿名去身份化患者生命,以及定制的大型语言模型扫描256,000份与约1,000名FAP患者关联的医生笔记,几乎实时建立现实世界的护理标准。通过与阿姆斯特丹联合医学会的合作,利用最全面的FAP注册系统之一,创建了关于疾病背景的健全自然史研究,进一步加强了这一研究。 正如报道所指出的,“递归的集成平台旨在做的不仅仅是发现新分子。它旨在缩短从患者最初出现症状到有效治疗的过程。汗简洁而坚定地总结了这一使命:“正确的诊断,正确的治疗,在正确的时间。”阅读更多:https://geneonline.com/recursion-makes-the-unknown-known-in-rare-disease-drug-discovery/ 递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。 无 奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。 我们继续与首席研发官埃里克·杜兰德的座谈,了解Owkin的K Pro基础设施,以及我们正在构建人工智能科学家的工作。 了解更多关于K Pro的信息:https://owkin.com/k-os/k-pro 我们与首席研发官埃里克·杜兰德坐下来,听取他对我们如何实现生物人工智能超级智能的看法,推动这一转变的技术,以及奥金斯的开发过程。 0:05 / 3:36 奥金 @OwkinScience · 3月4日 我们与 @ConsensusNLP - 领先的AI驱动科学论文研究引擎——将2亿篇同行评审论文直接导入K Pro:我们的生物学AI科学家。 请阅读新闻稿:http://owkin.com/newsfeed/owkin-announces-partnership-with-consensus-to-strengthen-literature-intelligence-for-owkins-ai-scientist-k-pro Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学 无 Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父 新论文发布:人工智能必须拥抱通过超人适应智能实现专业化 其中 @JudahGoldfeder 、菲利普·怀德,以及 @ylecun . 我们的论文引起了不少关注,以下是我的看法。 大家都在谈论AGI,但没人真正理解它的含义,这种混淆正在伤害整个领域。我们对最著名的定义进行了调查,并将其划分为两个轴:指的能力类型(学习与实践)和范围(任何重要、人类能做的任何事)。结果是定义层面不仅存在分歧,而且内部常常不一致。 我们的出发点很简单:人类智能不是通用的。我们是专门化的生物,经过进化塑造,能够在有限的生存关键任务中表现出色。我们觉得自己很笼统,因为我们看不到自己的盲点。马格努斯·卡尔森是有史以来最伟大的人类国际象棋选手,但与计算可达的水平相比,他实际上并不擅长国际象棋。这并不是贬低马格努斯。这表明人类适应的局限性,以及为何将人工智能的北极星锚定于人类水平表现是错误的选择。 我们提出“超人适应智能”(SAI)一词,换句话说,就是能够在任何重要任务上超越人类,并且能够完成完全超出人类领域任务的智能。该指标并非不断增长的基准清单。它是适应速度:系统能多快获得一项新技能? 这对我们的建筑方式有具体影响。SAI建议通过自我监督学习从未标记数据获取通用知识,以及用于规划和零样本转移的世界模型。它也反击当前自我倒退建筑的单一文化,因为专业化要求建筑多样性,而非单一范式统治一切。 或者用我们的话说:折叠蛋白质的人工智能不应该是叠衣服的人工智能。 这篇论文源于我们与Yann在《信息瓶颈》播客中的一次对话,这促成了与 @elonmusk 以及 @demishassabis 在X上(并非所有报纸都能引用推特上的争执作为来源)。 Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授 苹果刚刚给它最新的笔记本取名为Neo——和我儿子的名字一样!我应该买一个吗? 如果我在Apple Neo上运行Amazon Nova,我希望能让我的两个孩子大开眼界。 吴安德鲁 @AndrewYNg · 3月5日 新课程:与 JAX 合作构建并训练大型语言模型,合作开发于 @Google 并由 @chrisachard . JAX 是谷歌 Gemini、Veo 及其他高级模型背后的开源库。本短期课程教你如何利用JAX及其工具生态系统从零开始构建和训练一个2000万参数的语言模型。 你将从零开始实现完整的MiniGPT风格架构,训练它,并通过图形界面与完成的模型进行对话。 你将获得的技能: - 学习JAX的核心原语:自动微分、JIT编译和矢量化执行 - 使用 Flax/NNX 构建 MiniGPT 风格的大型语言模型,实现嵌入和变换器模块 - 加载预训练的 MiniGPT 模型,并通过聊天界面进行推理 来学习这个构建大型语言模型的重要软件层吧!https://deeplearning.ai/short-courses/build-and-train-an-llm-with-jax/ Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人 70名黑客参加了我们首次在旧金山举办的世界实验室黑客松。 仅用3.5小时,32个团队就使用Marble参与了从机器人模拟和代理到AR/VR界面、游戏、艺术体验和房地产工具等项目。 看看他们做了什么 ↓ 文本成为软件的通用界面。 三维空间正成为宇宙的通用界面。 它是让人类和人工智能能够共同生成、编辑、模拟和分享世界的媒介。 喜欢World Labs团队的这篇文章!就像代码一样,3D是机器和人的通用界面。朗 Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。 GPT-5.4在编程、知识工作、计算机使用等方面表现出色,看到大家这么喜欢它真的很开心。 但它也是我最喜欢和它聊天的模特!我们在模特性格上已经有一段时间没找到目标,所以能朝着正确的方向前进,感觉格外好。 山姆·奥特曼 @sama · 3月8日 非常感谢Jensen为AWS扩展Nvidia能力所做的努力! 引用 泰金 @firstadopter · 3月7日 Jensen 表示,两天前 Nvidia 正在“疯狂”扩展 OpenAI 在 AWS 的容量 我们也知道OpenAI Codex代币的使用正在爆炸式增长。 任何说OpenAI整体计算需求减弱的说法都令人怀疑。x.com/firstadopter/s...... 山姆·奥特曼 @sama · 3月8日 哇,读第二段和第三段时,情感的多样性真是太丰富了。 引用 本 @benhylak · 3月6日 过去几周我一直在用GPT 5.4。 在无尽的模型掉落和基准最大化中,这款模型是很久以来首个值得你花时间尝试的车型。 说实话,没想到OpenAI能做到这一点。 山姆·奥特曼 @sama · 3月8日 “我能问你最难但你可能答对的问题是什么?” 引用 玉辰金 @Yuchenj_UW · 3月6日 大家都说GPT-5.4 Pro是最智能的模型,达到AGI级别的智能,但你有AGI级别的问题要问吗? Windows上的Codex应用! 引用 安德鲁·安布罗西诺 @ajambrosino · 3月5日 Codex应用现已在Windows上线。 该应用既原生运行,也支持 WSL,集成了 PowerShell、命令提示符、Git Bash 或 WSL 的终端。 Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。 本周谷歌上有一些有用的更新,后续还会有更多!淋 @NotebookLM 为Ultra用户推出英文电影视频概览。 将复杂信息提炼成惊人的视觉深度分析——看看吧 0:03 / 0:34 来自 笔记本LM 显示更多回复 桑达尔·皮查伊 @sundarpichai · 3月7日 我们最新的Pixel昨天上架了。 @madebygoogle Pixel 10a 是获取最新谷歌 AI 最实惠的方式。它配备了6.3英寸的Actua显示屏,亮度比前代高出40%,电池续航30+小时,并拥有七年的更新! 显示更多 桑达尔·皮查伊 @sundarpichai · 3月7日 大量新的实用功能 @Android :在聊天中途与亲友分享你的实时位置,通过与航空公司分享追踪标签链接寻找丢失行李,并用Play Shorts发现优秀应用。 点击这里阅读更多: Gemini 3.1 Flash-Lite 是 Gemini 3 系列中最快且最具成本效益的型号⚡️它以2.5倍快的首次答题令牌速度和45%的输出速度,性能优于2.5 Flash,成本仅为大型型号的一小部分! Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。 我这周一直在尝试Copilot任务,在这个共工模式下分配任务(即使是重复任务)并自主完成,并用代理模式细化和迭代输出,真的很棒。举几个例子...... 萨蒂亚·纳德拉 @satyanadella · 10小时 祝贺印度队在T20世界杯中取得了精彩的胜利今天运气不好,新西兰。 @Jaspritbumrah93 ,再次在关键时刻成为制胜球员。 @IamSanjuSamson 多么精彩的比赛,多么震撼。绝对不可思议。 医疗行业从未发展得更快,也从未对临床医生提出更多要求。 在HIMSS,我们正在对Dragon Copilot推出重大更新,包括Work IQ,将正确的工作环境与患者数据结合起来,减少行政繁琐,更多关注患者。 我这周一直在尝试Copilot任务,在这个共工模式下分配任务(即使是重复任务)并自主完成,并用代理模式细化和迭代输出,真的很棒。举几个例子...... 显示更多回复 萨蒂亚·纳德拉 @satyanadella · 3月4日 2/ 研究一个主题,把它变成PPT,然后不断迭代...... Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。 一种新兴的工作方式 引用 德里娅·乌努茨医学博士 @DeryaTR_ · 15小时 我新的周日早晨例行公事: 1. 去喝咖啡 2. 在Codex应用上查看GPT-5.4项目,继续并开始新的项目 4. 启动ChatGPT 5.4 Pro,进行新的头脑风暴会议 5. 思考/学习如何使用我尚未探索的90%的人工智能能力 GPT-5.4 研究级物理问题专业版: 引用 海德尔。 @slow_developer · 3月7日 进展比我预期的快得多 GPT-5.4 Pro(XHigh)在研究级物理推理方面取得了重大突破 该模型在CRITPT基准上提升了10个百分点,2025年11月最高分仅为9%, GPT-5.4 感觉就像“和聪明的朋友聊天” 引用 贾斯汀·摩尔 @venturetwins · 3月8日 GPT 5.4是一个非常特别的模型。 我觉得下面那条推文是关于编程的,但我认为它同样适用于一般用途(比如解释概念或讨论问题)。 要把个性塑造得恰到好处——这个模型真的像是在和聪明的朋友聊天。x.com/benhylak/statu...... 格雷格·布罗克曼 @gdb · 3月8日 用于捕捉过时文档的GPT-5.4: 引用 亚姆佩莱格 @Yampeleg · 3月7日 GPT-5.4只是随机抓到一些.md文件中的过时部分,并建议移动它们,避免其他代理将这些内容当作真实信息。 这意味着之前的每个特工都犯了这个错误。 Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。 谢谢蒋总和全体 @LifeAtPurdue 社区,祝你有一次美好的访问体验。喜欢结识一些才华横溢的学生,并花时间讨论计算和人工智能的未来。 Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。 我期待与比尔·达利进行一次精彩的讨论。 @nvidia 3月18日的GTC活动! 引用 NVIDIA 人工智能开发者 @NVIDIAAIDev · 3月7日 两位为现代人工智能生态系统铺平道路的研究人员,携手同台。欄 @JeffDean比尔·达利正在主持炉边谈话,地点为#NVIDIAGTC深入挖掘驱动AI下一个前沿所需的真正条件——从智能系统到超高效系统, 自2021年以来,我们一直在开展Waxal数据集项目,旨在提升非洲语言可用的数据量。该公共语音数据集最初涵盖27种撒哈拉以南非洲语言,由超过1亿名使用者在26个以上国家使用。 引用 谷歌研究 @GoogleResearch · 3月7日 非洲人工智能应用最大的障碍不是模型复杂度,而是2000+口语语言的数据稀缺。 我们刚刚发布了WAXAL。该开放获取数据集提供了2400+小时的高质量语音数据,涵盖27种撒哈拉以南非洲语言, 很高兴宣布Gemini 3.1 Flash-Lite!我们树立了效率和能力的新标准,为开发者提供迄今为止最快、最具成本效益的双子座3号模型。 我们设计了该模型,采用思维层级,使其能够即时处理高流量查询,同时在复杂边缘情况中扩大推理能力。 按数字:⏱首次令牌时间比2.5闪存快2.5倍,且质量显著更高每100万个输入代币0.25美元LMArena有1432个Elo,GPQA钻石有86.9% 很期待看到开发者能以这种速度和质量大规模打造什么。现已在Google AI Studio和Vertex AI平台上线。https://博客.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。 任务现在支持短信!通过短信委派,完成后会收到通知。而且预定任务可以代表你执行,无论是一次性还是重复。收到早期测试者的好评(更多功能即将推出),请立即加入等待名单:https://copilot.microsoft.com/tasks/preview?form=M301EQ&OCID=CGEosocialCopilotFree868hmzrvb Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。 3.1 闪电轻量版> 2.5 闪电⚡️又发生了。我们最新的Flash-Lite型号性能优于上一代的Flash级别。 更聪明。快点。更便宜。https://博客.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。 自动研究的下一步是必须对代理进行异步大规模协作(比如:SETI@home风格)。目标不是模仿某个博士生,而是模仿他们组成的研究社区。 当前代码同步生成一个特定的研究方向的提交线程。但原始仓库更像是一个种子,可以从中孕育出各种不同研究方向或不同计算平台的代理贡献的提交。Git(Hub)差不多但并不适合这个。它内置了一个“主”分支的默认,临时分叉成 PR,稍后再合并回来。 我尝试做了一个非常轻量化的原型,可以带有这种风格,比如我的经纪人写的一篇讨论,作为一夜连载的总结:https://github.com/karpathy/autoresearch/discussions/43另外,PR还拥有精确提交的优势:https://github.com/karpathy/autoresearch/pull/44但你绝不会想真正合并它......你只需要“采纳”并积累提交的分支。但即使是这种轻量化的方式,你也可以先让你的客服用GitHub CLI阅读讨论/PRs,等研究完成后,再贡献一份“论文”。 我其实不太确定这应该是什么样子,但这是一个比自动研究仓库更通用的宏大想法。原则上,代理可以轻松地在任意分支结构中处理和协作处理成千上万个提交。随着智力、注意力和韧性不再是瓶颈,现有的抽象概念将积累压力。 我把“自动研究”项目打包成一个新的自给自足的最小仓库,方便大家周末玩。它基本上就是把nanochat的LLM训练核心简化成一个单GPU版本,代码约630行,然后: - 人类对提示词(.md)进行迭代 - AI代理对训练代码进行迭代(.py) 目标是让你的经纪人能够无限期地以最快的速度推进研究,且无需你自己参与。在图中,每个点都是完整的LLM训练运行,时间正好为5分钟。代理在 git 功能分支上以自主循环运行,并积累 git 提交到训练脚本,因为它找到了更好的设置(以降低验证损失),包括神经网络架构、优化器、所有超参数等。你可以想象比较不同提示、不同代理人的研究进展情况。https://github.com/karpathy/autoresearch部分代码,部分科幻,还有一点精神错乱:) 安德烈·卡帕西 @karpathy · 3月8日 (我现在还有那个大表亲在生产nanochat上运行,运行更大的型号,运行8XH100,现在看起来就是这样。我就先让它运行一阵子......) nanochat 现在只需 2 小时即可在单个 8XH100 节点上训练 GPT-2 能力模型(较一个月前的约 3 小时大幅缩短)。越来越接近~互动了!做了很多调优和功能(fp8),但最大的区别是数据集从 FineWeb-edu 切换到 NVIDIA ClimbMix(NVIDIA 干得不错!)。我试过Olmo、FineWeb、DCLM,结果都出现了回归,ClimbMix开箱即用效果很好(以至于我对goodharting有点怀疑,不过看了论文后似乎~还行)。 另外,在尝试了几种设置方法后,我现在让AI代理自动在纳米聊天中迭代,所以我就让它运行一阵子,去放松一下,享受AGI后的感觉:)。这里举个例子:过去 ~12 小时内做了 110 次更改,使验证损失从 0.862415 降至 d12 型号的 0.858039,且无墙钟时间成本。代理负责功能分支,尝试想法,合适时合并并迭代。有趣的是,过去 ~ 2 周我几乎感觉自己在“元配置”上做了更多迭代,优化和调整代理流程,甚至比直接用 nanochat 仓库还多。 安德烈·卡帕西 @karpathy · 3月7日 啊,是的,这就是AGI之后的感觉:)我什么都没碰。马上回来桑拿 Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。 我们与Mozilla合作,测试Claude在Firefox中发现安全漏洞的能力。 Opus 4.6在短短两周内发现了22个漏洞。其中14个为高严重度,占Mozilla 2025年修复的全部高严重性漏洞的五分之一。 我们还是太早了。 引用 塔奈·贾普里亚 @tanayj · 3月6日 这是Anthropic关于人工智能对劳动力市场影响的研究中的一张不错图表。 蓝色表示AI在工作职能中的理论能力(占任务百分比),红色表示观察到的使用情况。 Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。 无 Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用 “法币对加密货币”比“法币对加密货币”没那么有趣。 我们正在扩展我们的工作范围 @Visa 以支持在100多个国家发行卡片:https://fortune.com/2026/03/03/visa-stripe-bridge-stablecoin-backed-cards-100-countries/.这些卡将以稳定币余额为担保,实现高效且一体化的全球覆盖。 Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。 未来几个月将公布多项重大AI辅助进展那些轻视人工智能创新影响的人是错误的所有重大发现将在几年内由人工智能辅助或推动烙下一步变化即将到来 埃马德 @EMostaque · 3月4日 我总觉得AI用大量水很奇怪 这里有个有趣的数据: 全球高尔夫球场的用水量是AI数据中心的10倍 引用 迪兰·帕特尔 @dylan522p · 3月4日 揭穿围绕人工智能数据中心的虚假叙事。 起初是说用水量高,但其实并非如此。 这次是关于电价的。 关于高价定价的说法既荒谬又带有政治色彩,且没有实际支持 被有目的的人纵的统计数据 x.com/SemiAnalysis_/...... Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。 无 Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。 无 Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。 人工智能将需要改变税收结构、资本利得税、普通所得税等。人工智能会改变劳动力/资本在收入中的比例,因此税收结构必须将比例重新平衡给劳动力(选民)以接受。资本主义是民主许可的。将资本利得和普通收入等同,排除年收入低于10万美元的人免除所有联邦税,使变革税收中性。 引用 财富 @FortuneMagazine · 3月6日 “我认为从根本上说,我们应该取消资本利得的概念。”@vkhosla告诉《财富》杂志主编@ajs在最新一集@Fortune500:工业的巨擘与颠覆者。http://bit.ly/4u7rEgR 三年来,我们的见解一直是员工,而不是副驾驶!这是正确的长期战略。 引用 阿鲁尔日 @hari_arul · 3月7日 我们@khoslaventures自2023-24年起一直在投资这篇论文。就像@vkhosla2018年投资OpenAI 如果你想和那些生活在人工智能前沿的人一起在早期阶段工作,欢迎来和我们聊聊:)x.com/julienbek/stat...... 维诺德·科斯拉 @vkhosla · 3月8日 真是个了不起的故事和创业者 @PeterJBeck 以及 @RKLB 现在价值400亿美元!!而且他是个很棒的人! Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。 很高兴能和Venture Heavyweight坐下来聊聊 @bhorowitz 以及 @BoozAllen 霍拉西奥·罗赞斯基在#AmericanDynamism峰会,包括伊朗、人类与五角大楼、人工智能颠覆以及私人市场 @a16z 最近筹集了150亿美元用于各基金的部署,$BAH正在投资并合作政府任务的科技 @CNBC @CNBCWEX Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。 无 Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。 无 Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute 我们很高兴启动《支持人类的人工智能宣言》,为人工智能规划出比硅谷那种反乌托邦式的替代竞赛更具启发性的道路。它拥有极为广泛的支持,从班农到本吉奥,从工会到信仰团体,从家长到自然安全局领导人。请加入我们不断壮大的运动,让我们一起创造改变! (下面有回复链接) Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley 这真的很酷:设计你的代理时,避免断章取义,而且可以无限循环。 引用 幸志·森 @koushik77 · 6小时 whatispossible如何在[KISS Sorcar](https://github.com/ksenxx/kiss_ai)? 光标在原地压缩上下文。Claude Code 触发压缩 API。随着上下文漂移的积累,两者都会逐渐退化。 我们拿到了 马修·扎卡赖亚斯 @matei_zaharia · 3月7日 这是一个构建你自己专业人工智能的良好模式,详见我们的报告。 - 生成基于当前模型版本的合成数据 - 应用高效的大批量非策略RL(OAPL) - 通过更新模型生成更硬的数据 - 生成高效、可推广的小模型 引用 Databricks 人工智能研究 @DbrxMosaicAI · 3月5日 认识一下KARL:一个由定制强化学习驱动的企业知识快速代理(现已进入预览阶段)。 企业知识工作不仅仅是问答。客服人员需要搜索文档、查找事实、交叉比对信息,并进行数十甚至数百个步骤的推理。 请查看我们的技术报告https://databricks.com/sites/default/files/2026-03/karl.pdf我们如何构建了一个超高效但SOTA的文档搜索模型。我们将流水线提供给客户,采用无服务器GPU计算平台,以便运行。 Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face 攻击面不断扩大 引用 萨什扎茨 @zats · 3月6日攻击者通过在GitHub问题标题中注入一个提示,AI分诊机器人读取并将其解释为指令并执行,从而获得了npm令牌。 ## Publication Information - [blockchain&AI](https://paragraph.com/@blockchainandai/): Publication homepage - [All Posts](https://paragraph.com/@blockchainandai/): More posts from this publication - [RSS Feed](https://api.paragraph.com/blogs/rss/@blockchainandai): Subscribe to updates - [Twitter](https://twitter.com/steven_yanghf): Follow on Twitter - [Farcaster](https://farcaster.xyz/mr123): Follow on Farcaster