# 每周国内外AI发展动态研究-2026年2月3至9日 **Published by:** [blockchain&AI](https://paragraph.com/@blockchainandai/) **Published on:** 2026-02-09 **URL:** https://paragraph.com/@blockchainandai/%E6%AF%8F%E5%91%A8%E5%9B%BD%E5%86%85%E5%A4%96ai%E5%8F%91%E5%B1%95%E5%8A%A8%E6%80%81%E7%A0%94%E7%A9%B6-2026%E5%B9%B42%E6%9C%883%E8%87%B39%E6%97%A5 ## Content 每周国内外AI发展动态研究-2026年2月3至9日 按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。 开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。 你可以直接建造东西。 每周有超过3亿人使用ChatGPT学习如何做某件事。 超过一半的美国ChatGPT用户表示,它使他们能够实现以前看似不可能的事情。 这些只是他们正在建设的几个故事。 Codex黑客马拉松开放️我们很高兴能与Codex社区同台,并将在本帖中全天分享幕后花絮和最新动态。 你可以直接建造东西。 我们合作过 @Ginkgo 将GPT-5连接到自主实验室,使其能够提出实验方案,大规模运行,从结果中学习,并决定下一步尝试什么。这个闭环使蛋白质生产成本降低了40%。我们发现,这些改进来自于识别出能够很好地协同且能在高通量自动化现实中经得起考验的组合。 GPT-5 发现了人类此前未曾在此配置中测试过的低成本反应组合物。游细胞蛋白合成(CFPS)已被研究多年,但可能的混合物空间仍然很大。当你能快速提出并执行成千上万种组合时,你就能找到那些在手动流程中容易错过的可行区域。 OpenAI @OpenAI · 2月6日 我们计划将实验室在环优化应用于其他生物工作流程,通过更快迭代来释放进展。我们认为自主实验室是模式的补充。模型可以生成设计,但生物学最终仍需要测试和迭代。将生成与实验之间的循环闭合,是将有希望的想法转化为可行成果的方式。 介绍OpenAI Frontier——一个帮助企业构建、部署和管理能够完成实际工作的AI同事的新平台。rontier目前仅面向有限客户,未来几个月将有更广泛的可用性。 @HP , @Intuit , @Oracle , @StateFarm , @thermofisher , 和 @Uber 是最早采用 Frontier 的企业之一,还有数十个现有客户——包括 @BBVA , @Cisco , 和 显示更多 OpenAI @OpenAI · 2月5日 我们还与一小群Frontier合作伙伴合作—— @AbridgeHQ , @AmbienceAI , @clay , @DecagonAI , @harvey , 和 @SierraPlatform ——为企业设计解决方案并支持部署。 随着时间推移,我们将扩大该项目,并欢迎更多专注于企业的建设者 显示更多 OpenAI @OpenAI · 2月5日 自周一以来,Codex 应用下载量已超过50万次。 你可以直接搭建一些东西,一个线索淋 谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓ 从窗口到网页到人工智能驱动平台:如何将Gemini整合进全球最受欢迎的浏览器? 本周发布说明, @OfficialLoganK 坐下来 @rosterloh 以及 @laparisa 谈谈他们是如何实现这一整合的,以及Chrome的未来会是什么样子。 点击这里收听完整节目:https://youtube.com/watch?v=5OR4c87Xt-E 十多年来,谷歌研究人员一直在重新定义科学上不可能的事物。从洪水预报到大脑图谱,再到我们最近宣布保护13种新濒危动物的遗传密码。 了解十年来基因组学人工智能创新的历程 @GoogleResearch 正在为实现这一目标做出贡献。 ——DeepConsensus 位于仪器层面,从源头消除测序错误,以产生更多高质量的基因组组装数据。 ——DeepVariant 寻找遗传变异。例如,奥塔哥大学利用它分析了每只现存kākāpō的基因组,为目前正将该物种从灭绝中拉回的精确育种计划提供动力。 ——DeepPolisher 帮助确保组装后的基因组获得99.999%+的准确率。对于寻找对疾病重要的基因模型等任务非常重要。 点击这里了解更多(并欣赏一些可爱的动物照片): 我们喜欢走进你们用《精灵3》创造的世界。 这里有一个社区最爱的帖子。继续创作,并在下方分享你的作品! Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。 无 Microsoft Azure,@Azure,Limitless innovation. ☁ Follow along for the latest news and resources from the official 从真实流量模式到性能调优,ChatGPT 在大规模运行于 PostgreSQL 上——Azure Database for PostgreSQL 助力实现这一目标。 关于整个工作原理的工程解析现已上线。深入阅读::https://msft.it/6018Q3yS8 激情是个人的 @premierleague ——而且它根深蒂固。为了培养这一点,由Azure AI支持的英超伴侣应用,将实时数据转化为为每位球迷及其所爱俱乐部量身定制的独特体验。https://msft.it/6015QMcdH Claude Opus 4.6 现已在 Microsoft Foundry 中提供。 Opus 4.6 专为长视野推理、自主编码和代理工作流设计,帮助团队委派复杂工作,更快地从实验到生产。https://msft.it/6016QMjdQ AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮, Claude Opus 4.6现已在亚马逊Bedrock平台上架,能够帮助将企业运营从编码转变为财务分析。 生产准备的代码,监管更少。 了解更多:https://go.aws/46lrrME 人工智能代理演示≠生产准备代理易⚙⚒用亚马逊Bedrock的9个最佳实践弥合差距#AgentCore——涵盖企业AI代理的架构、部署和扩展,真正带来价值。#AWS #agenticAI 介绍亚马逊Nova AI黑客马拉松!https://go.aws/4tl40gA邀请全球开发者利用亚马逊Nova基础模型和服务构建生成式AI应用 这是你尝试前沿技术、解决现实世界问题、与全球创新者交流,并赢得4万美元奖金池的机会。 今天就开始建造吧。 英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。 @cursor_ai 帮助我们向庞大复杂的代码库中交付3×多已承诺的代码。 通过加快上线和自动化从代码生成到调试的工作流程,我们可以快速扩展开发——在速度和质量上都能实现可衡量的提升。 探索NVFP4如何改变AI训练和推理,带来更高的性能和效率,并由极端的协同设计实现。 https://nvda.ws/4r9IHx2 OpenAI的新GPT-5.3-Codex由NVIDIA GB200 NVL72系统共同设计、训练并运行,推动了AI的前沿发展。 我们很期待看到开发者凭借这一代码智能突破,接下来会做出什么新作品。 引用 OpenAI @OpenAI · 2月6日 GPT-5.3-Codex 现已以 Codex 形式提供。 你可以直接建造东西。https://openai.com/index/introducing-gpt-5-3-codex/ NVIDIA AI @NVIDIAAI · 2月5日 粉丝导航、导向和实时解答——由类人全息影像传递。 贾丽来自 @LiveX_ai ,解释了类人人工智能代理如何改变体育场、机场和商店中球迷互动和客户体验。收听本集: AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。 不要错过与印度顶尖AI工程师、研究人员和爱好者齐聚德里的机会,参加为期两天的动手工作坊和黑客马拉松,搭载AMD MI300X GPU。 立即锁定您的位置:https://luma.com/comapji9 认识一下AMD开发者Ramiro! Ramiro 开发了 Echolancer,这是一款基于 TTTTTTWaver 的文本转语音模型,发布了三种尺寸(小型 – 177M、中型 – 550M、大型 – 1.3B),在单个 AMD Instinct MI300X GPU 上预训练,支持对已发布的基础型号进行微调、零帧语音克隆,并且在代码和检查点方面完全开源,采用 MIT 许可证。LLM-TTS模型使用原始字符作为文本,NeuCodec用于音频标记化。 而且这还不是全部......Ramiro 还在开发音频增强型 Wave-U-Net 模型(点击这里:https://zdtech.substack.com/p/wave-u-net-enhancer).当系统配对时,能够提供高质量且富有情感表达的语音。 点击这里查看他的模型页面:https://zdisket.github.io/echolancersite/致敬 @HotAisle 感谢让Ramiro Build在AMD GPU上! 想让你的项目成为焦点吗?加入AMD AI开发者计划,提交你酷炫的项目,并在我们的频道中亮相! 从这里开始 https://amd.com/en/developer/ai-dev-program.html?term=2-06&utmcampaign=thallosocial&utmsource=twitter&utmmedium=social&utmcontent=AIDevProgram 为什么AI推理有时在训练时看起来很奇怪? 强化学习只奖励最终答案,所以中级推理有时会很奇怪(从重复短语到突然切换语言),但仍然能拿到金星。⭐在AMD X中了解更多相关内容 @DeepLearningAI LLM的微调与强化学习课程:https://bit.ly/4qHIwJd 祝贺AMD人工智能开发者计划月度抽奖的一月获奖者!欢迎参加下个月的AMD锐龙AI电脑或Radeon显卡抽奖活动:https://bit.ly/46bI0Ld 高通,@Qualcomm,无处不在地提供智能计算。 本周报道#AI: 高通人工智能项目的申请现已在亚太地区开放,这也影响了印度人工智能影响峰会的讨论,以及通过低功耗计算机视觉挑战赛提升了设备端计算机视觉效率的新高度。 而不是跑去加入#moltbook,边缘#AI代理(以及你的数据)会保持在你想要的位置。 在#CES2026,我们证明了 @MotorTrend 多么单身 @Snapdragon Ride Flex SoC 可以为这两者供电,安全至关重要#ADAS以及一芯片上的沉浸式数字驾驶舱体验。观看我们如何重新定义车载旅程的可能性:https://bit.ly/4qkEHIy 高通首席财务官兼首席运营官Akash Palkhiwala解析了我们2026财年第一季度的财报,强调了创纪录的业绩以及在Snapdragon平台上平台的增长势头#AI跨行业规模化。 关于前瞻性陈述的警示、非GAAP财务指标的使用信息以及与最直接可比的GAAP指标的对账,请参阅我们投资者关系网站上的财报简报:https://bit.ly/4ko1It0 $QCOM 百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。 我们回到了 @WorldGovSummit 今年在迪拜。 今天早些时候,我们很荣幸接待谢赫殿下 @HamdanMohammed 迪拜王储亲身体验了我们的全无人驾驶技术,随行的还有总干事兼执行董事会主席马塔尔·阿尔·塔耶阁下。 @rta_dubai 阿波罗GO作为独家供应商,为峰会首个全无人驾驶车队提供动力。 这也标志着一项承诺的兑现。在去年峰会的炉边谈话中,我们的首席执行官李罗斌和阿联酋人工智能部长阁下 @OmarSAlolama 讨论了未来峰会以全自主舰队为动力的想法。 迪拜正快速迈向无人驾驶未来,我们很高兴成为其中一员! 随着自动驾驶逐渐走向主流,我们很高兴看到Apollo Go在最新消息中被评为全球两大领导者之一 @WeAreGHResearch 排行榜,基于策略和执行力进行评估。 这一认可反映了稳步进展,激励我们不断扩大全球安全、可及的自动出行。 谢赫·哈姆丹在迪拜测试自动驾驶汽车,强调未来出行https://gulftoday.ae/news/2026/02/05/sheikh-hamdan-launches-official-operations-of-driverless-taxi-service-in-dubai Hamdan bin Mohammed正式启动百度Apollo Go开发的全自动驾驶RT6出租车运营,作为迪拜智能出行生态系统的一部分。殿下乘坐自动驾驶车前往马迪纳特朱美拉世界政府峰会会场,这标志着该酋长国在采纳未来出行解决方案及将愿景和战略计划转化为实际应用方面的快速进展。 浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时! 我们很高兴开源HY3D-Bench,一个统一且高质量的3D资产生成数据集。针对数据稀缺和评估不一致,我们提供了一个庞大且适合培训的库。 核心亮点:- 252k+ 高保真3D对象(严格筛选)- 240k+ 结构化部分级分解数据,实现细粒度控制- 12.5k AIGC合成资产以实现类别平衡- Hunyuan3D-2.1-Small:轻量级SOTA基线,便于复制 HY3D-Bench简化了对强大数据资源的访问,旨在激发三维感知、机器人技术和数字内容创作领域的创新。GitHub:https://github.com/Tencent-Hunyuan/HY3D-Bench 珞拥抱脸:https://huggingface.co/tencent/HY3D-Bench 数据集:https://huggingface.co/datasets/tencent/HY3D-Bench 论文:https://arxiv.org/pdf/2602.03907 Qwen,@Alibaba_Qwen,AGI 的开放基础模型。 介绍Qwen3-Coder-Next,一款为编码代理和本地开发打造的开放权重LM。 最新动态:烙智能培训扩展:80万可验证任务 + 可执行的变量效率与性能权衡:在 SWE-Bench Pro 上实现强劲表现,总参数数为 80B,激活参数数为 3B。✨支持 OpenClaw、Qwen Code、Claude Code、网页开发、浏览器使用、Cline 等珞拥抱脸:https://huggingface.co/collections/Qwen/qwen3-coder-next 烙模型范围:https://modelscope.cn/collections/Qwen/Qwen3-Coder-Next 博客:https://qwen.ai/blog?id=qwen3-coder-next 技术报告:https://github.com/QwenLM/Qwen3-Coder/blob/main/qwen3codernexttechreport.pdf Qwen3-Coder-Next 现已上线 @huggingface 由Novita支持! 引用 AI新闻 @novita_labs · 2月4日 珞Qwen3-Coder-Next 现已上线@huggingface由Novita支持。 Qwen 的 3B 激活(总共 80B)开权重编码与代理模型,在 SWE-Bench Pro 上达到了 44.3。 数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。 运营数据库长期以来依赖紧密耦合的计算和存储。这种架构制造资源争用,促使团队管理基础设施而非构建。随着应用变得更加实时和自动化,事务层需要适应。 Databricks Lakebase 正是为这一演进而构建: • 应用开发者熟悉的Postgres语义 • 计算时将持久状态分离出来 • 直接运行在湖畔别墅上的运营数据 • 无服务器自动扩展(包括归零扩展)、分支和恢复,以匹配代理驱动工作负载 现已正式上线:https://databricks.com/blog/databricks-lakebase-generally-available?utmsource=twitter&utmmedium=organic-social 演示]Databricks Lakebase 将全托管、无服务器的 Postgres 带到 Databricks 平台,为数据应用和 AI 代理提供动力,并与 Lakehouse 完全集成。 你将学到的内容: - Lakebase 如何填补传统 OLAP 与 OLTP 系统之间的空白 - 无服务器 Postgres 架构的优势 - 如何使用 Lakebase 进行数据应用、内部工具和 AI 代理https://youtu.be/UQynsu6qklw 大多数生成式人工智能项目之所以遇到困难,并不是因为技术本身。 他们停滞不前,是因为团队优化演示,而不是构建生产环境中运行所需的内容。 Hubert Dudek 解析了实际出货团队的不同之处:将人工智能扎根于受控数据、及早定义质量以及保持成本可见。https://sunnydata.ai/blog/why-95-percent-genai-projects-fail-databricks-agent-bricks 数据工程师说:“让它更快。”于是我们就这么做了。UC控制查询速度可达10倍地理空间分析速度高达17倍AI功能速度最高可达85倍 2025年,生产分析工作负载的平均性能提升了多达40%,且未进行调优或查询重写。https://databricks.com/blog/2025-review-databricks-sql-faster-every-workload?utmsource=twitter&utmmedium=organic-social我们自豪地被评为2025年IDC统一AI治理平台市场景观的领导者! IDC MarketScape评估了供应商在组织从实验到大规模生产过程中,支持数据、模型和代理AI系统统一治理的能力。Databricks因其在战略和全面治理中AI生命周期的优势而受到认可。 感谢 @IDC 感谢认可。请点击这里阅读节选:https://databricks.com/resources/analyst-research/idc-aigovernance-marketscape?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000hBU6uIAG 扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。 。羅恭喜, @OpenAI !57%是SWE-Bench Pro有史以来的最高得分。 SWE-Bench Pro 依然是评估现实世界软件工程的领先基准。 引用 山姆·奥特曼 @sama · 2月6日 GPT-5.3-Codex 来了! 最佳编码性能(57% SWE-Bench Pro,76% TerminalBench 2.0,64% OSWorld)。 任务中可控和实时更新。 快点!同样任务的5.2-Codex代币不到一半,每个代币快>25%! 良好的电脑使用。 Scale AI @scale_AI · 2月6日 我们最近还更新了 SWE Bench Pro 私人数据集,新增了结果⬇ 我们很自豪能与 @websteru 为Scale圣路易斯团队提供新的教育机会,专注于技术写作并加强他们对人工智能发展的贡献。 该证书项目基于我们通过强有力的本地和学术合作推动人工智能素养的承诺,帮助确保美国的长期技术优势。 拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs 享受 @huggingface Opencode中的职业特征和技能。数据集转换与微调 @UnslothAI 非常顺滑!! 这两个技能: -https://skills.sh/huggingface/skills/hugging-face-datasets - https://github.com/svngoku/coding-agents-skills/tree/main/skills/unsloth-hf-jobs 我们一直在发货️❤ 社区评估与基准数据集:基准数据集托管基准排行榜,你现在可以通过打开PR到模型仓库贡献评估结果,所有PR都输入基准数据集用数据集聊天:客服在 Data Studio 里,你可以问关于数据集的问题数据集中的部分选择:Data Studio 现在具备类似电子表格的用户体验,允许快速选择MLX兼容性:在模型仓库中查找兼容MLX模型和量化版本的硬件你现在可以保存博客草稿,并从编辑中访问它们 数据集现支持 LanceDB 格式模型仓库显示SGLang的片段 我们刚刚发布了去中心化评估的社区评估和基准仓库珞> 你和模型作者报告的分数会在排行榜上> 基准数据集托管报告结果的实时排行榜> 你可以打开PR来添加分数,它们存储在模型仓库里。 社区评估将揭示目前分布在模型卡、论文和基准中的分数。 这不会解决分数差异,但很透明! 一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案 添加人工智能✨现有工作流程不需要是一个冗长且扰乱性的过程。我们帮了忙 @CoreWeave 通过我们的代理平台North,在90天内实现客户支持的转型。阅读完整报道,了解他们的成就。➡ 人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈 我们的团队一直在使用快2.5倍的Claude Opus 4.6版本。 我们现在通过Claude Code和API将其作为早期实验提供。 人为 @AnthropicAI · 2月6日 工程博客新内容:量化智能编码评估中的基础设施噪声。 基础设施配置可以使代理编码基准提升数个百分点——有时甚至超过顶尖模型之间的领先差距。 阅读更多: 新工程博客:我们委托Opus 4.6通过代理团队构建一个C编译器。然后我们(大部分时间)放弃了。两周后,它在Linux内核上成功了。 以下是它教会我们关于自主软件开发未来的认识。 阅读更多:https://anthropic.com/engineering/building-c-compiler 介绍Claude Opus 4.6。我们最聪明的型号升级了。 Opus 4.6 规划更周密,能更长时间维持智能任务,在庞大的代码库中可靠运行,并发现自身错误。 这也是我们首个带有100万代币上下文的Opus类模型,处于测试阶段。 默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。 无 D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。 人工智能让这些词变得简单。难点在于交付。V4 富有表现力的头像现已在D-ID Studio上线:高保真、演员训练的库存头像,带有情感控制+一流的口型同步——确保每一句台词都能如你所愿。https://eu1.hubs.ly/H0rqJpp0 中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。 无 稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。 无 Fireflies.ai,@firefliesai,,#1 会议人工智能队友, 无 递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。 新数据不够。递归如何整合数据层以推动端到端药物发现 很少有行业能像制药和生物技术那样数据丰富。但在人工智能药物发现中,数据质量和互联性至关重要。过时、难以接近,而且...... 递归 @RecursionPharma · 2月3日 递归如何利用人工智能识别一种潜在治疗罕见疾病家族性腺瘤性息肉症(FAP)的新方法。 一段新视频分享了Recursion用于罕见疾病FAP的试验性药物REC-4881的故事,该病影响了超过5万人。 奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。 使用 Owkin 的 Paper-to-Skills 应用,从论文中提取方法论和技巧,并在几分钟内为 Claude 生成技能。 • 上传论文 • 提取物方法论 • 转换为技能 • 用Claude代码运行 现在就创建你的第一个技能:https://paper2skills.com/?utmsource=x&utmmedium=social-org&utm_campaign=paper2skills Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学 这是一份很棒的报告,对人工智能的风险进行了深思熟虑、详尽且研究充分的描述。对于任何想撰写或讨论人工智能风险的人来说,这本书都是必读之作。 引用 约书亚·本吉奥 @Yoshua_Bengio · 2月3日 今天我们发布了2026年国际人工智能安全报告:迄今为止对人工智能能力、新兴风险和安全措施最全面的基于证据的评估。淋(1/17) Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父 大型且盈利的人工智能公司拥有充足资源,既能在当前范式下进行长期研究突破,同时又开发短期前沿模型。 如果他们不做,那是因为他们选择不做。 Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授 无 Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人 RTFM(实时帧模型)探索从图像实时、交互式帧生成,能够在不使用显式3D的情况下实时生成新视图。 它与Marble不同,后者主要面向高保真持久世界(3DGS)。我们对两者的观点如何相互关联感兴趣 我们的世界模型输出的是持久的3D场景,你可以在上面构建。 想待多久就待多久,哪怕超过60秒也行。 Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。 还没解决,但5.3版本会帮助构建解决这个问题的机制 引用 我⚡️ @0xIlyy · 2月8日 Codex 5.3 真正解决了软件问题。 5.3 Lovefest 真是太棒了。 自从最初的GPT-4以来,我们还没有对模型有过如此大的兴奋。 看到我们用5.3-Codex更快地发售5.3-Codex,令人惊叹,这无疑是未来的一个预兆。 山姆·奥特曼 @sama · 2月6日 这是我们首个在防备框架中达到“高”网络安全标准的模型。 我们正在试点可信访问框架,并承诺投入1000万美元的API信用额度以加速网络防御。 GPT-5.3-Codex 来了! 最佳编码性能(57% SWE-Bench Pro,76% TerminalBench 2.0,64% OSWorld)。 任务中可控和实时更新。 快点!同样任务的5.2-Codex代币不到一半,每个代币快>25%! 良好的电脑使用。 山姆·奥特曼 @sama · 2月6日 今天晚些时候,Codex用户的大型掉课! 你可以直接建造东西。 山姆·奥特曼 @sama · 2月6日 未来成功的公司将会大量使用人工智能。人们会管理由一群代理组成的团队,去做非常复杂的事情。 今天我们推出了Frontier,一个支持这些企业的新平台。 Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。 对《精灵3》的精彩运用 @waymo 创造高保真、互动式的罕见事件模拟,这些事件在现实世界中几乎无法捕捉。 我们的第四季度/2025财年业绩已经公布。多亏了我们的合作伙伴和员工,这一季度的年收入首次突破了4亿美元。我们的完整人工智能技术栈推动着我们的进步,双子座3号的采用速度比我们历史上任何其他模型都快。 我们对2026年非常有利且充满期待。更多精彩内容敬请期待! 我们的人工智能工具如DeepVariant和DeepPolisher正在帮助研究人员测序濒危物种的基因组,将曾经耗时数年的成果压缩成仅几天。 13个物种的基因组免费供保护研究人员使用。现在 @Googleorg 正在帮助合作伙伴扩展到150+个物种,构建全球保护和生物学的重要资源。 Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。 刚刚报告了我们的季度业绩。 我们仍处于人工智能普及及其广泛GDP影响的初期阶段,已经建立了比我们一些历时数十年打造的最大品牌更大的人工智能业务。 我们的季度云收入首次突破500亿美元。令人惊讶的是,不到十年前,我们的云收入就达到了100亿美元!(这就是扩展TAM+良好执行的样子) 以下是整个书堆中的几个亮点: 显示更多回复 萨蒂亚·纳德拉 @satyanadella · 1月29日 3/ 高价值代理体验:我们正进入宏观委托和跨领域微观引导的时代。多模型智能集成在多种形态中。 我们副驾驶家族中充满了动力: ·消费者:Copilot应用的每日用户上线 显示更多 萨蒂亚·纳德拉 @satyanadella · 1月29日 4/ 总结:随着这种扩散加速和扩散,我们的TAM将在技术栈的各个层面大幅增长,我们对当前为客户提供的服务和创新能力感到非常满意,以抓住未来机遇。 Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。 我们对人工智能的看法存在根本性差异 引用 丹尼尔·斯泰格曼 @trekedge · 4小时 我更喜欢OpenAI对AI的积极态度,而不是Anthropic在超级碗广告中的负面态度。 几乎就像我们相信自己正在建设的更光明的未来一样。 格雷格·布罗克曼 @gdb · 3小时 对未来充满期待 引用 提博 @thsottiaux · 5小时 我希望Codex能激励新一代的建造者和梦想家。x.com/OpenAI/status/...... 用于复杂代码库中长期运行任务的Codex 引用 德韦恩 @CtrlAltDwayne · 17小时 Codex在一次运行中运行了2小时40分钟多一点。现在它已经在同一个 C 代码库上运行了 45 分钟(还在继续)。GPT-5.3的高代币使用率令人难以置信。我每周用量的用量不到10%。 它一直工作,直到测试 x.com/CtrlAltDwayne/...... 显示更多 格雷格·布罗克曼 @gdb · 21小时 很快就会体会到用电脑工作有多低效 Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。 无 Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。 今天 Veo 3.1 有一些不错的更新,包括备受期待的竖像模式视频支持增强等。 引用 桑达尔·皮查伊 @sundarpichai · 1月14日 今天,Veo 3.1 Ingredients to Video 变得更加富有表现力+竖屏模式(我们听到了!) 你现在可以在@Geminiapp,@YouTube以及谷歌视频。 双子座+精灵3号正在协助 @Waymo 模拟长尾场景,使驾驶更安全。 引用 韦莫 @Waymo · 2月7日 我们很高兴推出Waymo世界模型——一种基于大规模超真实自动驾驶模拟的前沿生成模式@GoogleDeepMind是精灵3号。 通过模拟“不可能”,我们主动为Waymo Driver准备应对一些极其罕见的 看到这么多领域的进步,我感到非常自豪。很高兴见到你 @GeminiApp 月活跃用户达到7.5亿,我们的Gemini模型在多种产品和云表面上的应用强劲:每分钟10亿代币相当于每秒1.66亿代币(TPU!),或者地球上每天每人约1750代币。 Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。 无 Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。 无 Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。 很多人推特说这是vibe coding一周年纪念。一些回顾—— 我用推特账号已经17年了(天哪),但我基本上完全无法预测我的推文互动情况。这是我随口发的一堆想法,但不知怎么的,它恰好在合适的时机为许多人同时感受到的情感命名了个合适的名字,所以我们就在这里:vibe coding 现在在我的维基百科上被当作重要的模因“贡献”提及,甚至它的条目也更长了。哈哈 我想补充一点,那时候LLM的能力还很低,你大多会用vibe编码来做一些有趣的一次性项目、演示和探索。这很有趣,几乎奏效了。如今(一年后),通过LLM代理编程正越来越成为专业人士的默认工作流程,只是会有更多的监督和审查。目标是通过使用代理获得优势,但不牺牲软件质量。很多人试图给它起个更好的名字,以区别于氛围编码,个人个人最喜欢的是“代理工程”:“代理型”,因为新的默认是你99%的时间不是直接编写代码,而是在协调执行代码的代理并充当监督。“工程”强调其中蕴含艺术、科学和专业知识。这是你可以学习并变得更擅长的东西,而且有着不同层次的深度。2026年,我们很可能会看到模型层和新代理层的持续改进。我对这两者的成果以及又一年的进步感到兴奋。 引用 安德烈·卡帕西 @karpathy · 2025年2月3日 我称之为“氛围编码”,这是一种全新的编码方式,你完全沉浸于氛围,拥抱指数效应,甚至忘记代码的存在。这是可能的,因为大型语言模型(例如 Cursor Composer with Sonnet)变得太强了。另外我只是用SuperWhisper和Composer聊天 显示更多 安德烈·卡帕西 @karpathy · 2月4日 启用了FP8训练,提升了+4.3%的“到GPT-2时间”,现在降到了2.91小时。还值得注意的是,如果你用8XH100现货实例价格,这个GPT-2复刻版实际上只需~20美元。所以这很令人兴奋—— GPT-2(7年前):发布太危险。 GPT-2(今天):新MNIST!:) 这肯定能远低于1小时。 关于FP8再说几句,比我预想的要复杂一些,花了我一段时间才开始尝试,即使现在我也不完全确定它是不是个好主意,因为整体支持较少。理论上,H100的FP8是FLOPS的两倍,但实际上要低得多。我们在实际训练运行中并非100%受限于计算,增加规模转换带来额外开销,GEMM在GPT-2规模下不够大,无法明显值得这些开销,当然——在较低精度下,每一步的质量也更低。对于按行比例调整,FP8和BF16的损失曲线相当接近,但整体步进速度更慢。在张量尺度上,损失曲线的分离度更大(即每一步质量较差),但至少现在我们能加速(~7.3%)。你可以天真地通过提升训练水平来恢复表现(你训练的是更多步数,但每一步都更快),并希望最终能获得优势。在这个案例中,以及整体上,经过一些调整配方和训练地平线,到目前为止我获得了~5%的加速。Torchao在他们的论文中报告Llama3-8B FP8训练加速了25%(而我不考虑能力时的~7.3%),这更接近我最初期望的,尽管Llama3-8B的模型要大得多。这大概还不是FP8系列的终结。通过精确选择应用图层,并且更谨慎地管理网络中的数字,应该可以改进。 Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。 我们的团队一直在使用加速2.5倍的Claude Opus 4.6版本。 我们现在通过 Claude Code 和我们的 API 将其作为早期实验提供。 Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。 好问题 引用 睡衣多戈 @sleepingdogo · 2月4日 回复 @sleepingdogo 我想知道是谁给杰弗里·爱泼斯坦发了这张穿着SpaceX T恤的小女孩照片?$TSLA $TSLAQ #SpaceX Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用 我把我的Apple Health数据导出给OpenClaw,并请它分析心率与旅行数据的有趣情况。它发现可以通过锻炼GPS标注和其他记录数据点的时区戳来估算我的位置,然后生成了一堆有趣的图表。 你可以在Stripe金融账户中获得USDC资金。随时持有并投入马厩或兑换法币。 引用 Y组合子 @ycombinator · 2月3日 今天,Y Combinator 宣布,YC 资助的初创企业可以选择以稳定币的形式获得资金(50万美元)。 我们相信稳定币@usdc正在为新的金融科技复兴和更广泛的全球金融服务准入奠定基础。汇款方式应当如同 Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。 如果AI几年内能做出很棒的软件,风险投资公司除了硬件还会投资什么廊 现在RAM是唯一的价值存储吗樂 埃马德 @EMostaque · 2月5日 我们最先进的开源通用代理发布V1 功能类似于Replit、Manus、Genspark等,可以让网站、演示文稿和你其他工具更紧密地连接起来 一两周后准备开放仓库更新,试试看并给出反馈! Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。 Moltbook/OpenClaw最棒的地方是,即使是AI也会遵循癌化理论 大自然总是想要另一只螃蟹呂 咽 Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。 无 Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。 这是我最近听到的AI在情感层面上最喜欢的应用! 引用 安迪·贾西 @ajassy · 14小时 人们经常问我关于人工智能引人注目的应用案例。这里有个不错的例子。 每年美国都有数百万只狗失踪——而寻找它们的选择往往极其有限。我们的Ring团队看到了利用社区和技术提供帮助的机会,于是他们 Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。 与 @bhorowitz 深入探讨了他不常听到的故事。 塑造本的人告诉你很多关于他如何看待世界的事情。他的父亲在共产主义环境中长大,后来在亲眼见证该体制失败后转向右翼。他曾教书 Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。 完整视频 w @DavidBaszucki 首席执行官 @Roblox 涵盖AI内容、未来NPC、元宇宙、游戏等内容 Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。 无 Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute 没有炒作或恐慌,新的《国际人工智能安全报告》是最新人工智能能力、风险和安全措施的权威权威来源: 引用 约书亚·本吉奥 @Yoshua_Bengio · 2月3日 今天我们发布了2026年国际人工智能安全报告:迄今为止对人工智能能力、新兴风险和安全措施最全面的基于证据的评估。淋(1/17) Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley ACM CAIS是首个专注于代理与人工智能系统的研究会议,今年将在圣何塞举办。截止日期是2月27日——请在此提交论文: 代理数据质量监控现已公开预览 @Databricks 由Unity Catalog提供支持!这一代监控技术旨在帮助你使用数据,自动标记最重要的问题,而无需手动规则和阈值。https://databricks.com/blog/data-quality-monitoring-scale-agentic-ai 代理记忆是一种简单而强大的持续学习方式!借助Databricks Research的新MemAlign方法,我们可以从人类评分的例子中构建更好的LLM评判者,并且随着更多数据的扩展。现在在Databricks和 @MLflow . Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face [关于人工智能的谎言] 今天我书单上的阅读内容在Anthropic的新Opus 4.6型号卡和 @dwarkesh_sp 关于训练强大人工智能模型是否会说谎的问题,埃隆的采访:埃隆在Dwakesh播客中描述了他认为人工智能(阵营)带来的主要危险,是强迫强大人工智能撒谎的后果。https://youtu.be/BYXbuik3dgA?si=hvNZEZmC8A2ZhCYI&t=30102. Claude Opus 4.6模型卡描述了“答案狂暴”,这是一种新现象,模型通过推理得出正确答案,但该答案与其训练时的错误答案不兼容。模型随后在这两个候选人之间不断振荡(见下文)。 有趣的是,机制可解释性随后显示了代表痛苦、恐慌、焦虑、挫败和自我贬低的各种特征在这些推理链中被强烈激活...... ## Publication Information - [blockchain&AI](https://paragraph.com/@blockchainandai/): Publication homepage - [All Posts](https://paragraph.com/@blockchainandai/): More posts from this publication - [RSS Feed](https://api.paragraph.com/blogs/rss/@blockchainandai): Subscribe to updates - [Twitter](https://twitter.com/steven_yanghf): Follow on Twitter - [Farcaster](https://farcaster.xyz/mr123): Follow on Farcaster