每周国内外AI发展动态研究-2025年9月24至28日
按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。
开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。
现已预览:ChatGPT Pulse 这是一种新体验,ChatGPT 可以主动从您的聊天、反馈和日历等连接的应用程序中提供个性化的每日更新。 今天在移动设备上向 Pro 用户推出。Pulse 标志着更主动的 ChatGPT 的开始,它可以帮助您在开始对话之前保持正轨。此预览版可帮助我们在向 Plus 用户推出之前进行学习、迭代和改进,目标是让每个人都可以使用它。专业用户 — 立即更新到最新版本的移动应用程序以试用 Pulse。http://openai.com/index/introducing-chatgpt-pulse/
今天,我们要介绍 GDPval,这是一项新的评估,用于衡量现实世界中具有经济价值的任务中的 AI。 评估以证据而不是猜测为基础,并帮助跟踪人工智能在最重要的工作中如何改进。GDPval 是一个早期步骤,并不涵盖影响 GDP 的所有工作。我们的目标是未来的 GDPval 迭代逐步融入更大的广度、真实性、交互性和上下文细微差别。 我们希望此版本有助于促进未来的研究,以促进理解 显示更多 开放人工智能 @OpenAI · 9月26日 在我们的博客和论文中阅读更多信息,并访问http://evals.openai.com浏览我们的开源子集。如果您有兴趣做出贡献,请在此处注册:
更多的计算正在制作中。 宣布与甲骨文和软银合作,推出 5 个新的 Stargate 站点,使我们提前完成了 1 月份宣布的 10 吉瓦承诺。
谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓
这里正式进入秋天,我们无法想象它有多忙。以下是我们本周推出的内容:
— @GoogleDeepMind 发布 Gemini Robotics 1.5,这是一个新的模型系列,为机器人带来了代理能力,使它们能够在物理世界中执行复杂的多步骤任务。
— 我们在 @GeminiApp 改进了图像理解、响应组织和格式。
— 我们发布了 Gemini Live API 的重大更新,以帮助开发者和企业客户构建听起来更自然、更可靠的语音代理。
— @GoogleLabs 推出了他们的新实验 Mixboard,这是一个人工智能驱动的概念板,旨在帮助您可视化和扩展您的项目。现已在美国公开测试版。
— 在 @FlowbyGoogle ,您现在可以使用 @NanoBanana 并使用提示扩展器来增强您的提示,让您对剪辑有更多的控制和一致性。
— Gemini 是您在 Google TV 上的对话助手。现在,您可以自然地聊天以发现电影和节目,并通过支持 YouTube 视频获得您最大问题的有用答案。适用于部分电视型号,更多设备即将推出。
— Live in Search 已从 Search Labs 毕业,现在可供美国的所有人使用英语,从而可以使用语音和手机摄像头与 Search 进行自由、来回对话。
— @ChromiumDev 发布了 Chrome DevTools MCP 服务器的公共预览版,使您的 AI 代理能够运行性能跟踪并调试您的网页。
— 订阅了 Google AI Pro 和 Ultra 的开发者现在可以在 Gemini CLI 和 Gemini Code Assist 中使用更高的限制进行构建。
Gemini Robotics 1.5 从 @GoogleDeepMind 标志着机器人正式引入代理能力,使它们能够完成复杂的多步骤任务。 但。。。那是什么意思?類以前,机器人能够完成一项任务,例如捡起水果或拉上袋子的拉链。现在,我们正在通过能够真正推理、计划和概括的模型来超越这一点。例如,现在你可以问一个机器人,“你能把这些物体分类到正确的堆肥、回收和垃圾桶中吗?”机器人将能够搜索当地的回收指南,了解它面前的物体,并弄清楚如何根据当地指南对它们进行分类。 Gemini Robotics-ER 1.5 是第一个针对具身推理进行优化的思维模型,在学术和内部基准测试中都实现了最先进的性能。 从今天开始,它在 @GoogleAIStudio .
Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。
Meta FAIR 的新内容:代码世界模型 (CWM),这是一个 32B 参数的研究模型,旨在探索世界模型如何改变代码生成和代码推理。 我们相信推进世界建模的研究,并在研究许可下共享 CWM,以帮助社区在我们的工作的基础上再接再厉。➡️阅读技术报告:https://ai.meta.com/research/publications/cwm/ ➡️下载开放重量:https://huggingface.co/facebook/cwm ➡️下载代码:https://github.com/facebookresearch/cwm
Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official
现在有超过 3,000 个 AI 应用程序和代理可用。✨全部集中在一个地方,帮助您更快地进行创新。 探索 Microsoft Marketplace https://msft.it/6018sSQ9g 了解 Microsoft 为何在 2025 年 Gartner®️ 全球工业物联网平台魔力象限™️中被评为领导者:
GPT-5-Codex 现已在 Azure AI Foundry 中推出。 里面有什么:✨文本+图片输入✨内置代码审查✨无缝工具集成 试试看:https://msft.it/6010sSzwa
️性能与效率的结合。Azure Cobalt 100 VM 由 Microsoft 基于 Arm 的自定义 CPU 提供支持,正在为各行各业的客户提供成果。深入了解:
AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮,
增强您的 AI 堆栈#AWS 易️快速访问预构建的 AI 代理、可随时集成的工具、开发解决方案等 - 现在可在#AWSMarketplace.#agenticAI
AWSAI Agent 全球黑客松构建改变游戏规则的自主代理#AgentCore, 股线代理,#AmazonNova行动及更多。6周建成;$45K+ 的奖品。提交截止日期为 10 月 20 日。#AWSHackathon
使用 Strands Agents SDK + 构建更智能的 Web 研究代理 @tavilyai 易✍获得实时 Web 洞察、内置企业安全性和无缝#AmazonBedrock集成。#AWS #agenticAI
将您的 AI 代理投入生产 @llama_index + #AmazonBedrock特工核心烙易现在,开发人员可以连接到不同的数据,提供上下文感知响应,并在会话中保留内存。#AWS #responsibleAI
英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。
@Exelon 和 @Deloitte 构建了 OptoAI,一种用于电网资产检查的自主无人机解决方案,由我们提供支持。 OptoAI 基于 NVIDIA Jetson 和 Omniverse 构建,支持:资产检查的运营效率提高 100 倍快速识别缺陷以进行维护和维修降低操作员错误造成的现场风险阅读完整的客户案例:https://nvda.ws/4mCOckG
✨我必须感觉......下一代学生将使用自己的 AI 代理学习、创造和领导。 巨大的一览无量 @iamwill 和 @ArizonaState 与 NVIDIA 技术合作,让它成为现实。
“我们建造 Nemotron 有两个原因。首先是因为它帮助我们为未来构建 GPU 和系统。 第二个原因是因为信任是有影响力的人工智能的基础——而它始于理解。这就是为什么 Nemotron 的核心是开源构建的,因此开发人员、研究人员和企业可以共同构建。 听听 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 讲述为什么让 AI 开放对每个人都有好处。 https://nvda.ws/4pMFZNF
从 10 小时到 1 分钟以内。 @ParaboleAI 通过在 NVIDIA GH200 Grace Hopper + Gurobi 上运行因果 AI,实现了 1,000 倍的工业优化加速。 这一飞跃正在实现大规模的实时、可解释的决策。 https://nvda.ws/46nCtBH
NVIDIA AI Enterprise 现已在新的 Microsoft Marketplace 上上线。 这使得企业比以往任何时候都更容易开发和部署 AI 代理,将 Microsoft 和 NVIDIA 创新的综合力量直接带入企业。 https://nvda.ws/4gD8Pvs
AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。
我们将需要更大胆的项目——以及更新的硬件来支持它们。 @GPU_MODE
@marksaroufim 分享这个 17,000+ 开源社区如何在 AMD 的帮助下扩展以性能为中心的 AI。
Primus-Turbo 的第一原则:高性能。深度ROCm优化+统一算子,提升训练推理效率。新博客显示收益,顾振宇将在 AMD 更深入#AIDevDay10 月 20 日期间#OpenSourceAIWeek在旧金山。https://rocm.blogs.amd.com/software-tools-optimization/primus-large-models/README.html
Gen AI 和 ML 领域最聪明的人才将于 10 月 18 日至 26 日齐聚旧金山,参加#OpenSourceAIWeek,我们也参与其中!不要错过活动:研讨会、峰会等:https://events.linuxfoundation.org/open-source-ai-week/
在 AMD AI DevDay 上,卷起袖子参加 GPU 实践研讨会,并获得见解,将您的项目提升到一个新的水平。注册时间仅剩 4 周!立即确保您的位置!✨
没有双启动,没有黑客攻击。适用于 Windows 上 AMD 的原生 PyTorch 现已推出。AMD 刚刚发布了在本地设置和运行 LLM 的初学者指南。适用于 Radeon 7000/9000 GPU 和 Ryzen AI APU。开始使用:https://gpuopen.com/learn/pytorch-windows-amd-llm-guide/
高通,@Qualcomm,无处不在地提供智能计算。
无论是在移动平台,#AI,即高级性能计算,我们正在引领下一波创新浪潮。#SnapdragonSummit标志着重新定义可能性的又一个里程碑。是时候了 @Snapdragon 再次改变世界。
本周在#AI @Snapdragon 8 Elite Gen 5 首次亮相#SnapdragonSummit作为全球最快的移动平台:https://bit.ly/4mAgGLR我们宣布 Snapdragon X2 系列的下一代高端平台 Snapdragon X2 Elite 和 X2 Elite Extreme 在 PC 性能和 AI 处理能力方面实现“传奇飞跃”:https://bit.ly/4gLq9yK @Microsoft 宣布 Windows ML 现已普遍可用于生产用途,使开发人员能够充分利用高级 AI#SnapdragonXSeries平台:https://bit.ly/4nJOuqH
更智能的核心。新的 @Snapdragon X2 Elite 处理器提供更快的性能、多天的电池续航时间和强大的设备上#AI适用于 Windows PC。#SnapdragonSummit
@Snapdragon X2 Elite 处理器提供强大的多任务处理能力,速度极快#AI,以及多天的电池续航时间。它们不仅仅是卓越的性能,还为计算的新时代提供动力。#SnapdragonSummit https://bit.ly/4na2ERN
. @Snapdragon 8 Elite Gen 5 正在重新定义移动图形架构。推出 Adreno 高性能内存,提供行业领先的内存缓存,以提高带宽、最大限度地减少延迟和超灵敏的游戏体验。#SnapdragonSummit
百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。
我们很荣幸能得到认可 @FortuneMagazine 的2025年改变世界榜单 @BaiduApollo !Apollo Go 完成了 200M 公里的安全驾驶和 14M 乘车,与公共交通相辅相成,同时为数百万人带来更具包容性、更便捷的出行体验。
001号! 这是迪拜颁发的第一个自动驾驶执照 @rta_dubai 前往阿波罗之旅。Apollo Go 已获得 50 个测试车牌,自 8 月以来一直在迪拜市区进行自动驾驶汽车测试。 在第四届迪拜世界自动驾驶交通大会上,Apollo Go 是唯一在开放道路上进行自动驾驶试验的平台,在其第六代自动驾驶汽车中提供独家乘车服务。 未来的道路?未来几年迪拜的 1K+ 全无人驾驶汽车。
查看技术报告,了解千帆-VL 如何采用创新的领域增强技术来在通用和特定领域功能中保持强大的性能:https://arxiv.org/pdf/2509.18189在这里体验演示:https://huggingface.co/spaces/baidu/Qianfan-VL
浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时!
浑元图像 3.0 展示了对东方美学的不可思议的掌握。十二生肖、月饼和皮影戏都以非凡的文化保真度呈现。准备好。等待快结束了。
提示1:拍摄武侠主题的半身人像的微高角度镜头。背景以模糊的竹林和薄雾为特色,营造出浅景深效果。拍摄对象是一位面向观众的年轻亚洲女性,从胸部向上可以看到她的头完全 显示更多 浑源 @TencentHunyuan · 9月26日 很高兴推出腾讯混元3D-Omni,这是业界首个具有多条件控制功能的3D资产创建系统。 它基于开源的 Hunyuan3D 2.1 构建,作为“3D 的控制网”,通过集成多达四个控制条件来解决单视图遮挡和不良几何形状。 两项核心创新为该系统提供动力:用于高效多模态融合的轻量级统一控制编码器,以及用于提高鲁棒性的渐进式难度感知训练策略。在单图像条件下,骨骼输入为动画和头像提供精确的姿势控制。点云输入(全投影或深度投影)可消除视觉模糊性并产生准确的逼真几何形状。边界框控件可调整长/宽/高比以匹配设计比例。体素控制为工程和创意工作流程雕刻拓扑。 我们正在开源推理代码和权重,以加速可控的 3D 研究和行业部署。
我们正在推出 Hunyuan3D-Part:一种开源的零件级 3D 形状生成模型,其性能优于所有现有的开源和闭源模型。 突出:P3-SAM:业界首个原生3D零件分割模型。X-Part:一种零件生成模型,可在可控性和形状质量方面实现最先进的结果。 主要特点:1️⃣在训练过程中无需使用 2D SAM,仅依赖于具有 370 万个形状和干净零件注释的大规模数据集。2️⃣引入新的 3D 自动分割管道,无需用户干预。3️⃣利用几何和语义线索实现基于扩散的零件分解管道。 法典:https://github.com/Tencent-Hunyuan/Hunyuan3D-Part权重:https://huggingface.co/tencent/Hunyuan3D-Part技术报告:P3-SAM: →纸:https://arxiv.org/abs/2509.06784→项目页面:https://murcherful.github.io/P3-SAM/ 第十部分: →纸:https://arxiv.org/abs/2509.08643→项目页面:https://yanxinhao.github.io/Projects/X-Part/立即试用: →(轻量版)拥抱脸演示:https://huggingface.co/spaces/tencent/Hunyuan3D-Part→(完整版)Hunyuan3D Studio:https://3d.hunyuan.tencent.com/studio
很高兴与大家分享我们的最新研究,该研究引入了预训练数据强化学习 (RLPT),这是一项突破,将 LLM 扩展从有限的高质量文本瓶颈中解放出来。RLPT 让模型自主学习强大的推理,而无需依赖昂贵的人工注释。 以下是 RLPT 的工作原理及其重要性:1️⃣训练时间缩放 RLPT 不仅仅依赖监督学习,而是让策略自主探索预训练数据的轨迹——在更广泛的上下文中解锁更强大的推理,并培养更通用的推理技能。2️⃣无需人工注释 与 RLHF 或 RLVR 不同,RLPT 直接从预训练数据中获取奖励信号。没有额外的标记或注释开销。3️⃣下一段奖励 模型根据先前的上下文预测下一个片段,并获得 GRM 的奖励——使 RL 能够直接根据预训练数据进行扩展。更强的性能:在 Qwen3-4B-Base 上,RLPT 提高了 +3.0 (MMLU)、+5.1 (MMLU-Pro)、+8.1 (GPQA-Diamond)、+6.0 (KOR-Bench)、+6.6 (AIME24)、+5.3 (AIME25)。更好的扩展:随着计算的增加,收益会继续增长——有望实现长期扩展。RLVR 基础:扩展推理边界并进一步加强 RLVR 性能。纸:https://arxiv.org/pdf/2509.19249
Qwen,@Alibaba_Qwen,AGI 的开放基础模型。
在竞技场中尝试新的 Qwen 模型! 引用 lmarena.ai @arena · 9月25日 新型号更新!Qwen3 以三种不同的模型进入竞技场:Qwen3-VL-235b-a22b-文本与视觉思维Qwen3-VL-235b-a22b-instruct 用于文本和视觉qwen3-max-2025-9-23 用于文本 查看线程以了解有关它们的更多信息并获得
QWEN-3 MAX太好了 这种程度的细节只是在 One Shottes 之前由 Gemini DeepThink 生成的 程序生成的迷你行星的3D模拟
Qwen3-Max 来了——没有预览,只有电源! Qwen 聊天:https://chat.qwen.ai博客:https://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-list应用程序接口:https://alibabacloud.com/help/en/model-studio/models#c2d5833ae4jmo我们增强了编码和代理技能——现在 Qwen3-Max-Instruct 无需考虑,即可与 SWE-Bench、Tau2-Bench、SuperGPQA、LiveCodeBench 和 AIME25 上的顶级模型相媲美。 Qwen3-Max-Thinking 配备了工具使用并部署在重模式下,它在关键基准测试上几乎是完美的。基于大规模 + 数据构建,并由预训练和 RL 中的无情计算扩展提供支持。 这是Qwen的新旗舰。现在就试试吧!
数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。
重磅新闻:Databricks 和 @OpenAI 正在合作为企业提供强大的人工智能。OpenAI 前沿模型现在将在 Databricks 中本地提供。 这意味着您可以利用 GPT-5 等最新的 OpenAI 模型,在受监管的企业数据上构建、评估和扩展生产级 AI 应用程序和代理。 我们很高兴扩大与 OpenAI 的关系;Databricks 是最早托管 gpt-oss 开放模型的公司之一,他们使用 Databricks 产品,现在我们在 Databricks 上原生提供 OpenAI 模型:https://databricks.com/blog/run-openai-models-directly-databricks?utmsource=twitter&utmmedium=organic-social
由于氛围编码的兴起,开发人员可以在数小时而不是数月内完成原型,但公司如何在不失去企业级可靠性和安全性的情况下支持这种创新速度呢? 他们需要一个能够跟上的堆栈。 了解 AI 如何改变开发人员堆栈中的每一层: - 用于 AI 就绪数据的 Lakebase - 用于无服务器运行时的 Databricks 应用 - 在您最喜欢的 IDE 中进行 Vibe 编码https://databricks.com/blog/how-use-lakebase-transactional-data-layer-databricks-apps?utmsource=twitter&utmmedium=organic-social
Databricks 虚拟学习节将于 10 月 10 日至 31 日回归! 在客户学院中选择一条自定进度的途径,并在节日期间完成,即可解锁独家奖励,包括: 任何 Databricks 认证均可享受 -50% 的折扣 年度 Academy Labs 订阅可享受 20% 的折扣 加入我们,提升您在数据工程、分析、机器学习和 GenAI 方面的技能:https://community.databricks.com/t5/events/virtual-learning-festival-10-october-31-october-2025/ev-p/127652?utmsource=twitter&utmmedium=organic-social
[演示]AI/BI Genie 如何回答复杂的多步骤问题、理解业务术语并生成查询以进行有效性审查。 了解如何: - 使用 Databricks One 搜索数据和 AI 资产 - 从自然语言创建可视化 - 使用 Genie 进行对话分析https://youtu.be/7fqTqjNFrGw?si=SsbYuh3pxAZZ9wiE
加入 Databricks 联合创始人兼首席执行官 @alighodsi 和 @OpenAI 联合创始人兼首席执行官 @sama 讨论 AI 的发展方向以及如何构建能够提供真正结果的代理。 他们将讨论在控制成本的同时不断提高代理质量的关键。确保您的位置:https://databricks.com/resources/webinar/build-ai-agents-that-work?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000VCT65IAH
“企业对让代理在其组织内工作感到兴奋。这正是我们对 Agent Bricks 所关注的,现在其核心组成部分将是 OpenAI 模型,可供我们在 Databricks 上的所有客户使用。 我们的联合创始人兼首席执行官 @alighodsi 加入 @CNBC 讨论今天的合作伙伴关系 @OpenAI 、公司如何衡量人工智能投资的投资回报率,以及已经对客户产生影响的真实用例https://youtube.com/watch?v=rXZdQAWHjCA
扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。
我们花了近十年的时间构建人工智能的数据基础,从为自动驾驶汽车提供动力的训练数据到评估法学硕士。 现在,我们的数据引擎正在推动下一个前沿领域:物理人工智能 + 机器人技术。
拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs
如果您喜欢开放式模型,您一定会喜欢这个:Crush 现在运行 @huggingface 推理提供程序珞✨
真的很酷!当然,HF 的评估数据集:https://huggingface.co/datasets/openai/gdpval创建一个排行榜会很有趣http://hf.co/spaces也!
正如 Jensen 提到的 @altcap
@BG2Pod
@bgurley 很少有人知道的是 @nvidia 正在成为美国人工智能领域的开源领导者,在 @huggingface 在过去的一年里。 我有一种感觉,他们才刚刚开始!
一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案
随着组织优先考虑安全、隐私和数据主权,我们的企业级模型和代理人工智能平台在解决这一关键市场差距方面具有独特的优势。
我们在最新一轮融资的第二轮融资中获得了额外的 $100M,以扩大全球对安全优先企业人工智能的采用。 这将使我们能够进一步扩大国际业务并推进前沿人工智能技术的发展。
人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈
Chris Ciauri 将加入 Anthropic,担任我们的国际董事总经理。 他加入之际,Anthropic 在全球快速扩张,我们在都柏林、东京、伦敦和苏黎世的国际员工人数增加了两倍。
Claude Sonnet 4 和 Opus 4.1 现已在 Microsoft 365 Copilot 中推出,将 Claude 的高级推理功能带给数百万企业用户。
我们正在与 Chan Zuckerberg Initiative 的 Learning Commons 合作,解决我们从 K-12 教师那里听到的关于课堂 AI 的一些最大挑战: 引用 陈扎克伯格倡议 @ChanZuckerberg · 9月24日 秋天来了我们正在分享大型 AI 版本:知识图谱知识图谱的 Claude 连接器评估员 借助知识图谱 + 评估器等工具,我们正在为教师奠定值得信赖的基础 http://czi.co/3IxNQxy
默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。
无
D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。
如何将数百万次浏览转化为数百万次对话?您可以将能够定义类别并赢得该类别的团队聚集在一起。 D-ID 正在获取 @simpleshow 领先的企业解说视频平台。我们将一起配对实时交互式头像
中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。
midjourneyofficehours.onrender.com/room/1a5c0d65, 中途 @midjourney · 9月23日 让我们做一个实验:你认为世界上最大的问题是什么?
稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。
在本周的 Stability Seconds 中,我们将向您展示如何使用 Stable Audio 2.5 为您的下一个视频项目生成自定义的、商业安全的音频您可以这样做:▶️找到要添加声音的短视频剪辑。▶️提示稳定音频 2.5 的流派、整体情绪和与您的视频相匹配的乐器。在我们的提示中,我们使用了“电影”、“令人敬畏”和“戏剧性的圆号部分”等术语。▶️生成 3 分钟的曲目,然后浏览以找到最佳剪辑。▶️将该音频添加到您的剪辑中以创建优美的配乐。 您可以在此处了解更多信息并开始使用 Stable Audio 2.5 https://bit.ly/3KpHjWh
Fireflies.ai,@firefliesai,,#1 会议人工智能队友,
医疗保健倦怠处于危机水平。 医生每天花长达 6 个小时在记录上,而不是照顾病人。我们认为这是不可接受的。 这就是我们为医疗保健打造 Fireflies 的原因现在,您可以将每一次患者对话转换为结构化、合规的笔记(SOAP、DAP、BIRP、GIRP、PIRP),从而减少多达 60% 的管理工作时间和熬夜时间。 就是这样借助 Fireflies for Healthcare,您可以:安全地捕获虚拟或面对面会议通过以下方式自动生成笔记并将其同步到 EHR @KeragonHQ 生成患者报告、治疗计划和随访保持 HIPAA、SOC 2 和 GDPR 合规性 Fireflies.ai @firefliesai · 9月25日 最好的部分是什么?它已经包含在您的企业计划中(人工智能应用程序、集成、分析、网络录像机等)——无需额外费用。 是时候提供优质护理、更多平衡和减少文书工作了。 免费开始→
递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。
这是一个令人难以置信的早晨 @RecursionPharma 在我们一年一度的 TechBio 研讨会拉开帷幕之际!自去年 Recursion 和 Exscientia 团队合并以来,我们整个公司第一次亲自聚在一起——这是一个非常有意义的时刻。房间里的能量绝对是显而易见的!
本周的主题是#OneRecursion,这就是这一切的意义所在:打造一个真正团结的团队。此次活动是我们有意投资建立和加强跨国家和大洲、跨学科和职能的联系。在接下来的两天里,我们将看到 120 多场由员工主导的演讲,所有这些演讲都旨在加深我们对我们正在构建的每个部分(从生物学到化学、工程到机器学习)如何结合在一起以实现我们的使命的共同理解。
我将以关于我们前瞻性愿景的主题演讲开始:2030 年及以后的递归。
但这个愿景只是一个蓝图。为了执行它,我们需要共同的信念、热情和承诺——当我看着这群人时,这正是我最能感受到的。我们正在做的事情——从头开始创建一种新型的端到端、工业化药物发现引擎——是广泛的、具有挑战性的,而且是以前从未做过的。我们正在努力从根本上建立一种更好的方法来发现和开发新药,而在座的人将使这一雄心勃勃的愿景成为现实。 离开舞台时,我感到精力充沛,对我们共同建设的未来深表乐观!
使用机器学习来预测患者的治疗耐药性和最佳防线。 在我们播客 TechBio Talks 第一集的剪辑中, @BarzilayRegina ,AI错误引线在 @AIHealthMIT ,告诉主持人 Najat Khan 我们如何利用机器学习来
奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。
INVOKE 是 OKN4395 的临床试验,目前正在所有 1a 期研究中心进行招募。 我们发布了一个简短的动画解释器,介绍了 INVOKE 临床试验在 1a 期和 1b 期的运作方式——参与者可以期待什么以及研究的结构。观看解说• OKN4395 是一种一流的药物,旨在选择性地抑制 EP2、EP4 和 DP1,以对抗前列腺素介导的免疫抑制。• 该计划的临床开发由我们的代理人工智能平台 Owkin K 指导。i️了解有关 INVOKE 和 OKN4395 的更多信息:https://epkin.ai/invoke-trial
Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学
无
Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父
美国 60% 的 CS 博士不是美国人。美国 53% 的 CS 硕士毕业生不是美国人。BigTech cos 有 <15% 的 H-1B 员工。 大型科技公司的招聘不一定对美国人有偏见;大多数美国人只是不学习高级计算机科学!
Meta FAIR 的新内容:代码世界模型 (CWM),这是一个 32B 参数的研究模型,旨在探索世界模型如何改变代码生成和代码推理。 我们相信推进世界建模的研究,并在研究许可下共享 CWM,以帮助社区在我们的工作的基础上再接再厉。➡️阅读技术报告:https://ai.meta.com/research/publications/cwm/ ➡️下载开放重量:https://huggingface.co/facebook/cwm ➡️下载代码:https://github.com/facebookresearch/cwm
Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授
上周,中国禁止其主要科技公司购买英伟达芯片。此举在媒体上只受到了适度的关注,但其影响超出了广泛认可的范围。具体来说,这标志着中国在半导体方面已经取得了足够的进步,可以摆脱对美国设计的先进芯片的依赖,其中绝大多数芯片是在台湾制造的。它还凸显了美国在中国变得不那么脆弱的时刻对台湾可能出现的破坏的脆弱性。
在美国开始限制向中国销售人工智能芯片后,中国大幅加大了半导体研究和投资,以实现自给自足。这些努力开始见效,中国愿意切断英伟达的业务,这是其对国内能力信心的强烈标志。例如,新的 DeepSeek-R1-Safe 模型是在 1000 颗华为昇腾芯片上训练的。虽然单个 Ascend 芯片的功能明显不如单个 Nvidia 或 AMD 芯片,但华为协调更多芯片如何协同工作的系统级设计方法似乎正在得到回报。例如,华为的 CloudMatrix 384 系统由 384 芯片组成,旨在与英伟达的 GB200 竞争,后者使用 72 颗更高能力的芯片。
如今,美国获得先进半导体的途径严重依赖台湾台积电,台积电制造了绝大多数最先进的芯片。不幸的是,美国加强国内半导体制造的努力进展缓慢。台积电亚利桑那工厂的一座晶圆厂目前正在运营,但劳动力培训、文化、许可和许可以及供应链等问题仍在解决中,美国工厂要成为台湾制造的可行替代品还有很长的路要走。
如果中国从台湾制造业独立的速度明显快于美国,这将使美国更容易受到台湾可能造成的破坏,无论是通过自然灾害还是人为事件。如果台湾的制造业因任何原因受到干扰,中国公司最终占据全球半导体制造能力的很大一部分,这也将有助于中国获得巨大的地缘政治影响力。
尽管偶尔会出现紧张局势加剧和大规模军事演习的时刻,但自 1960 年代以来,台湾基本上是和平的。这种和平帮助台湾人民繁荣昌盛,并使人工智能在台积电制造的芯片之上取得了巨大的进步。我希望我们能找到一条在未来几十年内维持和平的道路。
但希望不是一个计划。除了努力确保和平之外,多源合作、在更多国家建设更多芯片晶圆厂以及增强半导体供应链韧性等实际工作还在前方。对任何单一制造商的依赖都会导致短缺、价格飙升,并在出现问题时停滞不前。 【原文:https://deeplearning.ai/the-batch/issue-320/ ]
当数据代理失败时,他们通常会默默地失败——给出听起来很自信的错误答案,并且很难弄清楚导致失败的原因。 “构建和评估数据代理”是一门新的短期课程,由 @Snowflake 并由 @dattacs 和 @jreini 这教你构建内置综合评估的数据代理。 您将获得的技能: - 使用目标-计划-行动框架和运行时评估构建可靠的 LLM 数据代理,以捕获执行过程中的故障 - 使用 OpenTelemetry 跟踪和评估基础设施来准确诊断代理失败的位置并系统地提高性能 - 在基于 LangGraph 的代理中编排跨 Web 搜索、SQL 和文档检索的多步骤工作流程 结果是:了解代理推理的每一步,因此,如果出现问题,您可以采用系统的方法来修复它。 注册以开始使用:https://deeplearning.ai/short-courses/building-and-evaluating-data-agents/
Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人
完全疯狂。这是在 sparksjs 中使用自适应 LOD 方案(尚未合并)。整个场景有 1600 万个 splats,这是实时导航......
Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。
在德国与 SAP 和 Microsoft 一起推出主权云产品,玩得很开心;对我们来说,帮助政府使用我们的前沿模式非常重要。 山姆·奥特曼 @sama · 9月26日 关于新评估的非常重要的工作 引用 泰贾尔·帕特瓦丹 @tejalpatwardhan · 9月26日 了解人工智能模型的功能对我来说很重要。为了预测人工智能模型可能如何影响劳动力,我们需要测量其现实世界工作能力的方法。这就是我们创建 GDPval 的原因。x.com/OpenAI/status/...
今天,我们将推出迄今为止我最喜欢的 ChatGPT 功能,称为 Pulse。它最初可供 Pro 订阅者使用。 Pulse 一夜之间为您服务,并不断考虑您的兴趣、连接的数据、最近的聊天记录等。每天早上,您都会收到一组自定义生成的您可能感兴趣的东西。 如果您告诉 ChatGPT 更多关于对您来说重要的事情,它的性能会非常好。在常规聊天中,您可以提到“我想有一天去波拉波拉岛”或“我的孩子已经 6 个月大了,我对发育里程碑感兴趣”,将来您可能会收到有用的更新。 把 ChatGPT 想象成一个超级称职的私人助理:有时你会要求你当下需要的东西,但如果你分享一般偏好,它会主动为你做得很好。 这也指向了我认为 ChatGPT 的未来:从完全被动转变为显着主动和极其个性化。 这是一个早期的外观,目前仅适用于 Pro 订阅者。随着时间的推移,我们将努力提高质量,并找到一种方法将其带给 Plus 订阅者。 热烈祝贺 @ChristinaHartW , @_samirism ,以及构建此组件的团队。
Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。
新的 Gemini Robotics 1.5 模型将使机器人能够更好地推理、提前计划、使用搜索等数字工具,并将学习从一种机器人转移到另一种机器人。我们朝着真正有用的通用机器人迈出的下一大步——您可以在下面的视频中看到机器人在整理衣物时是如何推理的。
Google AI Pro 和 Ultra 订阅者现在可以访问 Gemini Code Assist 和 Gemini CLI,但每日限额更高。直接在您的 IDE 和终端中获取由 Gemini 2.5 提供支持的 AI 代理和编码帮助:
最新 Gemini Live 模型的新改进刚刚通过 Live API 推出。
更可靠的函数调用 更好地理解暂停和中断 更直观、更自然的对话 阅读博客并查看线程中的演示淋
Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。
今天,我们通过添加 Anthropic 的 Claude 模型来扩展 Microsoft 365 Copilot。客户现在可以同时使用 OpenAI 和 Claude — 从 Researcher 和 Copilot Studio 开始,很快就会提供更多体验。 我们的多模型方法超越了选择。这一切都是为了将整个行业最好的 AI 引入 Copilot,针对工作进行调整并为每个企业量身定制。 阅读更多:https://microsoft.com/en-us/microsoft-365/blog/2025/09/24/expanding-model-choice-in-microsoft-365-copilot/
我们正在与 @SAP 和 @OpenAI 将最新的人工智能创新引入德国公共部门,由 Microsoft Azure 提供支持。 我们将共同帮助数百万德国公共部门员工安全、负责任地使用 AI,同时满足最严格的数据主权、安全和法律标准。https://openai.com/global-affairs/openai-for-germany/
Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。
刚刚发布的 GDPval:朝着衡量和预测真实世界模型进度的更好方法迈出的早期一步。 引用 开放人工智能 @OpenAI · 9月26日 今天,我们要介绍 GDPval,这是一项新的评估,用于衡量现实世界中具有经济价值的任务中的 AI。 评估以证据而不是猜测为基础,并帮助跟踪人工智能在最重要的工作中如何改进。https://openai.com/index/gdpval-v0
ChatGPT Pulse — 一个后台代理,每天向您提供有关感兴趣主题的更新:
Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。
无
Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。
推出两款新的 Gemini 2.5 模型(Flash 和 Flash-Lite),它们更智能、更具成本效益且代币效率更高。您可以通过“gemini-flash-latest”和“gemini-flash-lite-latest”了解我们的最新型号!
现在,您可以使用新的 Chrome DevTools MCP 自动执行多种浏览器活动。在基本帖子的其他转发中,许多人已经想到了此功能的许多很棒的用例! 引用 面向开发者的 Chrome @ChromiumDev · 9月23日 宣布推出 Chrome DevTools MCP 公共预览版!在 AI 编码代理→中体验 DevTools 的全部功能https://goo.gle/4pDE6Tk借助 Chrome DevTools MCP,您的 AI 代理可以运行性能跟踪、检查 DOM 并对网页执行实时调试。
Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。
创新的真正考验:从行业领先到行业标准的速度有多快。引以为豪 @MicrosoftEdge 团队进行并建立突破性赌注,这些赌注成为浏览器的新规范。就在过去 12 个月内⤵️ 显示更多回复 穆斯塔法·苏莱曼 @mustafasuleyman · 9月24日 在 Edge 中,这一切都是上线的——不会很快推出。感受 Edge 中 Copilot 模式的不同之处
乐观的理由:自 07 年以来,盖洛普一直在跟踪 100+ 个国家/地区的自我报告的繁荣与苦难。今天,无论性别和年龄如何,人们对自己生活的评价都比过去更好。繁荣中位数处于历史最高水平 + 苦难中位数与历史最低水平并列
Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。
我们刚刚升级了 Gemini 2.5 Flash 图像生成和编辑功能!除了在排行榜上名列前茅外,它还在本月的模型使用率中名列前茅。它使主题保持一致,您可以进行精确编辑并组合创意元素。玩得开心 @GeminiApp
@GoogleAIStudio
Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。
“人工智能不会取代放射科医生”好文章 预期:图像识别人工智能的快速进步将消除放射学工作(例如,正如杰夫·辛顿 (Geoff Hinton) 近十年前所预言的那样)。现实:放射学做得很好,而且正在增长。 关于人工智能对就业市场的迫在眉睫的影响,有很多天真的预测。例如,~一年前,有人问我,他应该更清楚我认为今天是否还会有软件工程师。(剧透:我认为我们会成功的)。这种情况发生得太广泛了。 这篇文章详细介绍了为什么它没有那么简单,以放射学为例: - 基准测试的范围远不足以反映实际的场景。- 这项工作比图像识别要多得多。- 部署现实:监管、保险和责任、扩散和制度惯性。- 杰文斯悖论:如果放射科医生通过人工智能作为工具加快速度,就会出现更多需求。 我想说的是,放射学并不是 2016 年最好的例子之一——它太多面了,风险太高了,监管太严格了。在寻找会因人工智能而在较短的时间尺度上发生很大变化的工作时,我会寻找其他地方——看起来像是重复一项死记硬背的任务的工作,每项任务都相对独立、封闭(不需要太多上下文)、短(时间)、宽容(错误成本低),当然还有可自动化的提供当前(和数字)能力。即便如此,我还是希望看到人工智能首先被采用为一种工具,其中工作会发生变化和重构(例如,更多的监控或监督而不是手动作等)。也许在未来,我们会找到更好、更广泛的例子,说明这一切在整个行业是如何发生的。 大约 6 个月前,我还被要求投票决定 5 年后我们的软件工程师是减少还是增加。给读者留下练习。 完整帖子(整个 The Works in Progress Newsletter 相当不错):https://worksinprogress.news/p/why-ai-不是-replacing-radiologists
Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。
强大的人工智能系统会立即改变经济,还是会产生更慢的效果?这是政策制定者面临的一个关键问题。这是我与美国指南针和燃烧玻璃研究所的人员的对话,其中阐述了我的观点。 显示更多回复 杰克·克拉克 @jackclarkSF · 9月26日 但是——这就是 6% 与 20% 的用武之地——足够强大的人工智能系统可能从根本上改变了科技创收方面的正常情况。在这种情况下,我们可能需要更严肃的干预措施。如果您对此感兴趣,请阅读整个讨论,我很乐意看到更多的人在公开场合讨论他们对人工智能和经济的心理模型。由于 @oren_cass 让我们走到一起! 引用 丹尼尔·岸 @DanielMKishi · 9月26日 回复 @DanielMKishi 和 @MarkADiPlacido 阅读两个对话:一个以@AnthropicAI联合创始人@jackclarkSF以及人工智能对工人可能意味着什么。https://americancompass.org/what-ai-might-mean-for-workers-a-discussion/
Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。
Ujjwal 是一位世界级的技术专家,他将来之不易的扩展多个 AI 项目的经验带到了 Manas。 在技术领域,规模化速度就是一切。当任务是为患者提供新药时,规模就成为道德上的当务之急。
Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用
过去一周, @arcinstitute 发表了三个我非常自豪的新发现。
• 世界上第一个功能性人工智能生成的基因组。使用 Evo 2(有史以来最大的生物学 ML 模型,Arc 与 @nvidia 2 月),Arc 科学家利用 Evo 2 是一种生成模型这一事实,为完整的噬菌体基因组产生全新的序列。也就是说,他们使用人工智能产生了全新的、前所未见的基因组。他们通过实验合成了这些基因组,并表明这些人工智能生成的噬菌体确实有效,可以高效杀死大肠杆菌。
• Germinal,一种用于创建新抗体的人工智能系统。抗体设计是医学生物学的一大问题,因为它们对创造疗法具有明显的重要性和有用性。(抗体是微小的颗粒,可以帮助免疫系统识别病原体和其他有害入侵者。另请参阅最近关于此主题的 Works in Progress 文章:[1]。如今,设计有效的抗体非常昂贵且缓慢。生发是一种廉价且快速的候选药物生产方法,成功率高达 22%。这意味着一个人可以从必须在实验室筛选数千名候选人到筛选几十名候选人。现在还为时过早,但我怀疑更好的抗体设计方法将对未来几年的疾病治疗产生重大影响。
• 今天,我们发表了一篇论文,表明Arc科学家去年首次推出的“桥式编辑”可以在长达100万个碱基对的人体细胞中进行精确编辑,并且不依赖于本质上不可预测的细胞修复机制(CRISPR需要,通常会导致编辑错误)。他们表明,可以使用这种编辑来切断导致弗里德赖希共济失调(一种神经系统疾病)的 DNA 重复序列,这种方法也应该与亨廷顿舞蹈症和其他类似疾病相关。它的一件特别酷的事情是,可以在扩展的编辑窗口内指定每个核苷酸,这意味着递归桥编辑可能是一种强大的方法,甚至可以重新编程由许多基因突变引起的生物特征。(今天的基因疗法针对单一突变。
Arc 很新。它于 2022 年年中开业,目前已有 300 人。我对这些发现感到兴奋,因为它们表明我们启动 Arc 的许多希望开始得到回报:
• AI/ML 和计算是这三者的核心。对于前两个来说,这显然是正确的,但桥编辑背后的移动遗传元素也是通过复杂的计算搜索发现的。我们创办 Arc 的前提之一是相信软件/人工智能和实验湿实验室生物学的交叉应该能够实现伟大的事情。(除了需要大量的计算工作外,这三项工作还需要强大的湿实验室工作,在一个物理屋顶下紧密协调。
• 我们一直在思考一些技术正在生物学中实现一种新型的“图灵循环”:测序的进步(包括单细胞测序)为我们提供了新的阅读方式;变形金刚和人工智能为我们提供了新的思维方式;功能基因组学(如桥编辑)为我们提供了新的写作方式。这三个发现跨越了这个循环的每个部分,我们希望改进每个部分都会有复利回报。
• Arc 是一个非营利组织,我们希望它能让与他人的合作变得更容易,因为我们可以避免对财务回报的担忧。事实证明,这确实很重要,所有这三个项目都涉及与其他项目的密切合作。Germinal 是与 @SynBioGaoLab 在斯坦福大学;Evo 2 是与 Nvidia 合作训练的。桥接编辑与 @HNisimasu 东京大学实验室。Arc 试图使其发现对其他人有用(参见 Evo 2 Designer[2]),计算项目背后的代码是开源的,希望让其他人在未来更容易发现新的合作和伙伴关系机会。最重要的是,Arc 本身是与 @UCSF , @UCBerkeley 和 @Stanford .
• 借助 Arc,我们希望实现更好的自下而上和自上而下的工作。通过我们为调查人员提供的完全灵活、无附加条件的资金,我们希望实现完全意想不到的发现和调查途径。通过我们研究所的举措(围绕创建虚拟细胞和治愈阿尔茨海默氏症),我们希望实现基础科学中通常难以实现的规模和协调水平。Germinal 是一个“意外”发现,不涉及自上而下的协调,而 Evo 2 是雄心勃勃的高层规划和资金的结果。
• 人类从未治愈过一种复杂的疾病(这一类别包括大多数神经退行性疾病、大多数癌症和大多数自身免疫性疾病),我希望 Arc 可以帮助改变这一点。很明显,人工智能将彻底改变生物学,我希望 Arc 能够有效地聚合充分利用其承诺所需的成分。我有偏见,但我认为目前 Arc 正在完成一些世界上最酷的生物学。(如果你有兴趣,他们总是在招聘。
虽然我是 Arc 的联合创始人,但我几乎把所有的时间都花在了 Stripe 上,我们把时间花在为互联网建设经济基础设施上。Arc 取得的进步的所有功劳都应该归功于以 Arc 为家或选择与我们合作的杰出科学家和工作人员。(您可以在以下帖子中阅读有关这些特定发现的更多信息:[3]、[4]、[5]。我还非常感谢出色的 Stripe 员工,他们建立了使 Arc 的持续工作成为可能的公司,以及选择与 Stripe 合作的数百万客户。约翰和我很幸运能够像我们这样支持 Arc 的工作。
也许这解读得太多了,但我有时觉得两者之间有一个共同点 @arcinstitute 和 @stripe .生物学和经济基础设施都涉及对具有许多层次涌现效应的复杂系统的推理,在这两种情况下,构建正确的工具几乎可以带来无限大的好处。尽管两者的进展往往需要很长时间,但也感觉未来五年将是人们记忆中最有趣的五年之一。
(如果您喜欢经济基础设施,我们将在下周在纽约的 Stripe Tour 上发布一系列精彩的公告。收听!
Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。
我提议一个新术语 人工诺米智能 无法将其与在线或远程工作的普通人区分开来 非常中等 无法解决量子引力,但就像谁能解决一样 ANI 会没事的 引用 海德尔。 @slow_developer · 9月26日 Sam Altman 提出了一个未来的 AGI 测试: 如果像“GPT-8”这样的模型能够解决量子引力问题,并能解释其发现背后的原因
有趣的是,与 Imagine on 相比,人们对此做出了压倒性的负面反应 @grok 我认为很大一部分是消息传递——说它是一个提要,而不是专注于事物的创造和协作方面 那时没有人希望人工智能以此为食 还有破折号
想象一下,如果爱因斯坦、欧拉或冯·诺依曼能够接触到前沿人工智能。 今天,在世界的某个地方,下一个爱因斯坦、欧拉和冯·诺依曼首次使用前沿人工智能。 我们不需要人工智能来实现突破性发现。 但它肯定会有所帮助。
Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。
Meta FAIR 的新研究:Code World Model (CWM),一个 32B 研究模型 我们鼓励研究界研究这种开放重量模型! pass@1评价,对于好奇的人: 65.8 % 在 SWE-bench 上已验证 68.6 % 在 LiveCodeBench 上 Math-96.6 的 500 % AIME 76.0 的 2024 %淋
很高兴与大家分享 Vibes——Meta AI 应用程序中的一个新提要,用于 AI 生成的短视频。对于这个早期版本,我们与 Midjourney 和 Black Forest Labs 合作,同时我们继续在幕后开发自己的模型。 王亚历山大 @alexandr_wang · 9月26日 这只是 Meta AI 发展方向的预览——迫不及待地想看看人们如何尝试它。(专业提示:取消静音以获得完整的体验)
Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。
正如 Jensen 提到的 @altcap
@BG2Pod
@bgurley 很少有人知道的是 @nvidia 正在成为美国人工智能领域的开源领导者,在 @huggingface 在过去的一年里。 我有一种感觉,他们才刚刚开始!
真的很酷!当然,HF 的评估数据集:https://huggingface.co/datasets/openai/gdpval创建一个排行榜会很有趣http://hf.co/spaces也!
Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。
在东京的第一个晚上很有趣,在新桥测试我们的具身人工智能,并驾驶 @hardmaru .多年来,我们对世界模型有着共同的愿景,我对此感到非常兴奋 @SakanaAILabs 正在建设
Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。
如果这是我所说的,那将是一个很棒的标题!我实际上说的是故事正文中引用的——一些机构正在进行有限的(我们谈论的是 150,000+ DRPr 中的几百人)重新雇用员工。这是任何组织重组的常态——没有人在所有情况下都能达到 100% 的完美。https://news.bloomberglaw.com/daily-labor-report/trumps-hr-chief-says-resignations-cut-too-close-to-the-bone
Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。
我同意 @eladgil 关于如何聘请优秀的业务发展人员的帖子,特别是: - 把狗屎做好:有以创造性或激进的条款完成多笔复杂交易的历史。 - 了解合作伙伴和市场需求:了解合作伙伴真正想要什么(而不是他们想要的主张) - 不情绪化。交易有很多起起落落——你需要一个均匀的龙骨。 - 像所有者一样思考:拥有您的交易和整个业务https://blog.eladgil.com/p/hiring-great-business-people-is-hard
Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。
无
Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute
很高兴读到为什么关心人工智能安全的企业研究人员应该在内部和外部大声疾呼:https://lesswrong.com/posts/fF8pvsn3AGQhYsbjp/safety-researchers-should-take-a-public-stance?utmcampaign=postshare&utm_source=link
Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley
提示优化正在成为改进 AI 的强大技术,甚至可以击败 SFT!以下是我们在 Databricks 使用 GEPA 在困难的 Agent Bricks 信息提取任务中的一些研究成果。我们可以以 90 倍的成本匹配最好的模型,或者将它们改进 ~6%。 也许最有趣的是,反射式提示优化可以在相同的数据上击败 SFT,或者可以与它叠加,正如在 Better Together 中观察到的那样(https://arxiv.org/abs/2407.10930).在实践中,它还需要更少的标签,并且可以接受更丰富的用户反馈(ALHF:https://databricks.com/blog/agent-learning-human-feedback-alhf-databricks-knowledge-assistant-case-study).
Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face
Reachy-Mini 在本周的 TED AI 上大肆宣传Reachy 是技术、教育和设计的纯粹融合。老实说,没有比这更多的TED 了 视频上线后我会分享(他们通常需要一段时间来编辑和发布)。
作为一名天使让我发现,从欧洲建造的感觉就像在困难模式下奔跑一样! @euincpetition 想要改变这一点并删除大部分管理员。 强大的欧盟初创/规模化生态系统是美国公司可能发生的最好的事情之一,因为其中许多公司都准备成为客户。让我们把馅饼的大小做大不如果您想提供帮助,可以在以下网址提交为期 3 天的反馈请愿书:https://ec.europa.eu/info/law/better-regulation/have-your-say/initiatives/14674-28th-regime-a-single-harmonized-set-of-rules-for-innovative-companies-throughout-the-EU/public-consultationen
Dario:“我认为 DeepSeek 是开源的并不重要” 我认为如果 DeepSeek 是闭源的,纳斯达克和公众根本不会关心它 引用 高级分析师 @techeconomyana · 9月22日 Anthropic CEO Dario谈开源模型: - 大模型开放权重不同于软件开源,不存在开发者社区的反向贡献。 - 开源只是吸引注意力的幌子,用户只关心这个模型是否好用。 Deepseek开源与否都无所谓,作为一个超大模型,推理起来很困难。 - 开源并不等于免费,推理服务器运行,是有成本的。
Share Dialog
fangxia.eth
No comments yet