每周国内外AI发展动态研究- 2025年10月14日至20日
按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。
开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。
2 Sora 2 更新: - 故事板现在可以在网络上向 Pro 用户使用 - 所有用户现在都可以在应用程序和网络上生成长达 15 秒的视频,专业用户在网络上生成长达 25 秒的视频,Pro 用户可以通过在 composer 中选择“storyboard”来访问故事板http://sora.com.
ChatGPT 现在可以自动管理您保存的记忆——不再“内存满”。 您还可以按新近度搜索和排序回忆,并在设置中选择要重新确定优先级的回忆。 从今天开始,在全球网络上向 Plus 和 Pro 用户推出。
我们对 ChatGPT 进行了相当严格的限制,以确保我们小心处理心理健康问题。我们意识到这对许多没有心理健康问题的用户来说不太有用/有趣,但考虑到问题的严重性,我们希望解决这个问题。 现在我们已经能够缓解严重的心理健康问题并拥有新工具,我们将能够在大多数情况下安全地放宽限制。 几周后,我们计划推出一个新版本的 ChatGPT,让人们拥有一种更像人们喜欢 4o 的个性(我们希望它会更好!如果你想让你的 ChatGPT 以一种非常像人类的方式做出响应,或者使用大量的表情符号,或者表现得像朋友一样,ChatGPT 应该这样做(但前提是你想要它,而不是因为我们正在最大化使用量)。 12 月,随着我们更全面地推出年龄限制,作为“像对待成年人一样对待成人用户”原则的一部分,我们将允许更多内容,例如针对经过验证的成年人的色情内容。
谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓
这是令人难以置信的发布周!这是发生的一切: — 我们推出了 Veo 3.1,其中包含一系列新功能,让您对视频生成有更多的创造性控制。 — 我们将 Nano Banana 引入新的表面,例如 @Google 搜索 @NotebookLM 、滑入 @GoogleWorkspace ,并且即将推出 @GooglePhotos . — @GoogleResearch 发布了 DeepSomatic,这是一种新的人工智能工具,可以更准确地识别癌细胞中的遗传变异。 — 我们推出了 Grounding @GoogleMaps 在 Gemini API 中,因此开发人员现在可以构建地理空间感知应用程序。 — 这 @NotebookLM 移动应用程序收到了两项重大更新,即工作室面板重新设计和源发现。
认识 Veo 3.1使用 Veo 3.1,您可以生成音频更丰富、叙事控制更好、真实感更强的视频。此新更新还附带了一套专为创意控制而构建的附加功能。 包括以下能力: — 扩展您的视频以使其更长(带音频) — 设置视频的第一帧和最后一帧以控制输出(带音频) — 上传多个成分图像来制作您的场景(带音频) — 直接在视频中添加或删除对象 这些功能在 @FlowbyGoogle 、Gemini API 和 @GoogleCloud 顶点 AI。Veo 3.1 也可在 @GeminiApp .我们很高兴看到你的创作!
人工智能正在迅速加速科学发现,并为更好地了解癌症做出贡献。我们很自豪地宣布 @GoogleResearch 和 @GoogleDeepMind 展示了人工智能在该领域的巨大潜力: 首先,DeepSomatic 可以通过准确识别癌细胞内的关键遗传变异来显着改善癌症诊断,其性能优于当前最先进的方法。这为研究人员和临床医生提供了更精确、更可靠的工具来绘制癌症蓝图,这对于靶向治疗的开发至关重要。 其次,我们新的 Gemma C2S-Scale 27B 模型(使用我们的开放 Gemma 系列构建)实现了一个激动人心的里程碑:它提出了一个新假设,将“冷”肿瘤(众所周知,对当前免疫疗法具有耐药性)转化为可以成功治疗的“热”肿瘤。这一发现可能为癌症药物开发提供一条新途径。
2018 年,视频生成是 Google Brain 团队的一个大胆创新计划项目。如今,Veo已经生成了数亿个视频。勞在本期发行说明中, @doomie 和 @OfficialLoganK 回顾 Veo 从研究到现实的旅程,并讨论下一步。 在这里听:https://youtube.com/watch?v=VldX34mM95o
我们本周发布的几项产品绝对是…以下是您可以找到 Nano Banana 的新地方: — 直接在幻灯片中使用自定义提示编辑图像 @googleworkspace @NotebookLM 的视频概览得到了巨大的升级,有 6 种新的视觉风格 您也可以继续在 @GeminiApp 、面向开发者的 Gemini API,或 @FlowbyGoogle 对于创意人士! 纳米香蕉下一步该何去何从?
Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。
今天,我们宣布在德克萨斯州埃尔帕索建立下一个最先进的数据中心,该数据中心将能够扩展到 1GW。这个新数据中心将帮助我们在迈向超级智能的过程中提供顶级的人工智能模型和产品体验。 了解更多信息:https://about.fb.com/news/2025/10/metas-new-ai-optimized-data-center-el-paso/
Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official
Oracle Database@Azure:无与伦比的价值、久经考验的成熟度和微秒级的延迟。强大功能 + 敏捷性 = 更智能的应用、企业安全性和无缝迁移。开始使用:
更快地构建更智能的生成式 AI 应用。启动学习模块,亲身体验 azure_ai 扩展并探索强大的大型语言模型:https://msft.it/6011sFjNF
我们很高兴地宣布 Azure 存储发现正式发布 使用 Azure 中的 Copilot 获取跨 Blob 和 Data Lake Storage 的数据的完整视图、优化成本、确保安全性并解锁见解,所有这些都使用自然语言。 了解更多信息:https://msft.it/6011sf3UW
在 OCP 全球峰会上,Microsoft 正在推进电源、冷却和安全的全球标准,以实现前沿规模的 AI。了解下一步:
探索精选的生成式媒体模型目录,包括 Sora、GPT-image-1、Flux 1.1、Kontext Pro 等,这些模型旨在加速创造力、简化制作并安全可靠地将创意变为现实。了解更多信息:
AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮,
最后的加入机会#AWSAI Agent 全球黑客马拉松:提交截止日期为 10 月 20 日 构建方式#AgentCore, 股线代理,#AmazonNova行动及更多。6周。$45K+ 的奖品。不要错过! https://go.aws/4nWEF9y
是什么让基于机器的推理如此难以正确?易亚马逊副总裁兼杰出科学家 Byron Cook 分享 3 大挑战及其方式#AWS正在通过自动推理检查来解决这些问题#AmazonBedrock护栏。#ResponsibleAI
现在注册的最后更改#AWS10月23日创新☁️加入我们的免费虚拟活动,AWS 客户将分享他们如何使用云进行现代化和迁移。学习经验教训、最佳实践并获得灵感。#CloudMigration
英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。
打开。共同。可 伸缩。 NVIDIA Nemotron 为开发人员提供数据 + 工具,以共同构建更智能、更快的 AI 模型。 去看看开源 AI 的可能性,请访问#OpenSourceAIWeek https://nvda.ws/4hn46Pe
应用研究的两位领导者。欄一个播客。️剧集将于 10 月 21 日播出。 https://nvda.ws/3KWlUV1
早期的设计决策决定了一切。 但性能模拟通常是一个瓶颈:速度慢、成本高昂且脱节。 @FosterPartners 正在改变这一点。借助 NVIDIA RTX PRO™️ GPU,模拟和设计现在可以同时进行,更快、更智能。阅读全文:https://nvda.ws/498SEo3
没有工作室?没关系。了解作方法 @omi_3D 一#NVIDIAInceptionstartup,帮助品牌在几分钟内创建令人惊叹的品牌视觉效果,由 NVIDIA 技术提供支持。观看首席执行官 Hugo Borensztein 解释虚拟产品工作室如何扩展创造力→https://nvda.ws/472pDrr
这不是典型的推介会。 来自领先风险投资公司的投资者在以下地点分享他们对行业未来的愿景#NVIDIAGTC直流。️10 月 29 日,星期三 |美国东部时间上午 10:00 @FusionFundVC | @SignalFire | @SAICinc |斯特拉资本 |行动
NVIDIA AI 播客的新功能:Raja Shankar 和 Avinob Roy 来自 @IQVIA_global 深入了解代理 AI 如何改变医疗保健——从加快临床试验到更快地为正确的患者提供正确的治疗。现在听:https://nvda.ws/4n6OXCH
AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。
AMD AI 开发者社区一直很忙。从新的 Ryzen AI 版本到 PyTorch 和 Llama3.3-70B 的性能突破。这是您本周需要了解的所有内容。
开发人员们,我们正在共同构建和塑造人工智能的未来。 介绍 AMDevs,这是一项开放生态系统运动。 AMDevs 不仅仅是 AMD,→是我们所有人。 这是一个分享您的故事、您的构建、您的胜利和挑战的社区。我们将通过炉边谈话、问答和教程来学习,并在此过程中获得一些乐趣。 加入运动。分享你的故事。 合作。 这仅仅是开始。还有更多。
高通,@Qualcomm,无处不在地提供智能计算。
本周在#AI: 高通#Dragonwing利用人工智能改造宽带网络, @Observer 名字 @cristianoamon 到 AI Power Index,以及来自 @awscloud + 高通教你如何部署 @PyTorch 端到端建模。
获得完全控制、安全性和效率,无需云。了解高通公司如何#Dragonwing #AIOn-Prem Appliance 正在通过跨行业的可扩展、经济高效的性能改变企业运营。
更大的型号。更快的性能。真正的隐私。 设备上#AI正在加速,我们正在与以下合作伙伴合作,例如 @nexa_ai 推动其背后的创新。
这 @Dell Latitude 7455,由#SnapdragonXSeries,为您提供更智能工作的自由度。通过性能和电池寿命提高业务生产力,为最长的工作日提供动力。https://bit.ly/47qb4PP
当你设计未来时,它就会被注意到。谢谢 @Interbrand 以表彰我们的全球影响力。
百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。
准备好!百度世界2025,我们的旗舰科技大会,将于11月13日在北京举行从为应用程序提供支持的全栈 AI 功能到扩展应用程序的生态系统以及我们的全球增长蓝图,今年的会议都是关于 AI 在行动的。
我们很荣幸在第 25 届动物行动奖中凭借我们的 AI 濒危物种守护者 2.0 获得“年度创新者”奖,因其对保护和动物福利的影响而受到认可。 开发者 @ifawglobal 和我们的 @paddlepaddle 团队,它是第一个打击在线非法野生动物贸易的人工智能图像识别工具——截至 2025 年 6 月,帮助删除 13K+ 广告并保护全球生物多样性。
PaddleOCR-VL 刚刚在 Hugging Face Trending 上获得 #1 - 恭喜 PaddlePaddle 团队!
MuseSteamer 刚刚升级!我们的视频生成模型现在支持实时交互式长视频生成。它打破了传统的 10 秒限制,以更快的速度和控制力创建任意长度的视频,使用户能够在此过程中随时暂停、重写故事情节或延长过渡。
浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时!
混元最新作品:用单个GPU在5秒内生成高质量的3D世界。法典:https://github.com/imlixinyang/FlashWorld页:https://imlixinyang.github.io/FlashWorld-Project-Page/
Qwen,@Alibaba_Qwen,AGI 的开放基础模型。
很高兴地宣布 Qwen3-VL-Flash 在阿里云模型工作室上推出!强大的全新视觉语言模型,结合推理和非推理模式,响应更快、能力更强、成本更低,性能优于开源Qwen3-VL-30B-A3B和Qwen2.5-72B!支持超长上下文(最多 256K 令牌)——非常适合长视频和文档易通过 2D/3D 定位和空间感知增强图像/视频理解高级 OCR、多语言识别、代理控制和实际应用显著提升安全感知和真实环境视觉智能 应用程序接口:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-vl-flash
我们正在开源 Qwen3Guard 技术报告中的几个核心组件,现在可供研究和社区使用:Qwen3-4B-SafeRL:使用来自 Qwen3Guard-Gen-4B 的反馈通过强化学习进行微调的安全对齐模型。→ 在不影响一般任务性能的情况下,在 WildJailbreak(64.7 → 98.1)上实现了显着的安全性改进。Qwen3GuardTest:评估 Guard 模型的基准,涵盖:(1)中间推理/思维内容的安全分类(2)流式/逐个token输出的审核拥抱脸:https://huggingface.co/Qwen/Qwen3-4B-SafeRL 烙型号范围:https://modelscope.cn/models/Qwen/Qwen3-4B-SafeRL 数据:https://huggingface.co/datasets/Qwen/Qwen3GuardTest 代码和详细信息:https://github.com/QwenLM/Qwen3Guard Qwen @Alibaba_Qwen · 10月15日 易认识你的 AI 记忆 解锁更丰富、更个性化的体验 - Qwen Chat Memory 使用您的上下文和历史记录来定制每次交互,因此一切都感觉专为您量身定制。存储关于您的有意义和重要的回忆回忆与当前上下文相关的过去互动✨将您的历史记录转化为深度个性化的体验 你的过去,记住了。您的未来,量身定制。立即试用:https://chat.qwen.ai
数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。
Claude Sonnet 4.5 在 Databricks 上发布! 跑 @AnthropicAI 的最新模型直接基于您的治理数据 — 自动化 GenAI 工作流程、大规模推理并使用 Agent Bricks 构建特定于领域的代理。https://databricks.com/blog/claude-sonnet-45-here?utmsource=twitter&utmmedium=organic-social
我们最近从 Lakeflow Connect 发布了 SQL Server 连接器! 此完全托管的连接器旨在通过内置更改数据捕获和更改跟踪进行可靠的生产级摄取。 了解更多信息:https://databricks.com/blog/announcing-sql-server-connector-lakeflow-connect-now-generally-available?utmsource=twitter&utmmedium=organic-social
大规模分析位置数据变得更加容易。 Databricks Spatial SQL 允许使用本机 GEOMETRY 和 GEOGRAPHY 类型,运行 80 多个内置 SQL 函数,并在不手动编制索引的情况下执行空间联接。 现已推出公共预览版:https://databricks.com/blog/introducing-spatial-sql-databricks-80-functions-high-performance-geospatial-analytics?utmsource=twitter&utmmedium=organic-social
“我们询问组织,'Agent Bricks 的价值是什么?'他们说它提供了'更高的准确性和质量'。 Databricks 联合创始人兼现场工程高级副总裁 Arsalan Tavakoli-Shiraji 加入 @business 讨论人工智能和人工智能代理的下一个时代如何推动真正的业务成果和价值。
“我们始终专注于为客户提供他们想要的东西,他们想要的时间,他们想要的地方。”磻 @7eleven 正在通过使用数据和人工智能在营销活动中提供个性化优惠、更快的洞察力和无缝分析来改变其与客户的联系方式
扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。
发布了我们最新的基准测试 VisualToolBench (VTB),这是第一个旨在评估多模态大型语言模型 (MLLM) 与视觉信息动态交互和推理的能力的基准测试。 VTB 不仅仅是思考图像,而是与图像一起思考。该基准测试包含 16 个不同 MLLM 的排行榜结果,包括推理模型、非推理模型、开源模型和闭源模型。
拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs
我喜欢这些天流行的开放数据集的多样性。再也没有理由不训练自己的模型了! - Fineweb 和它的洗牌 @karpathy - Webscale-RL,一个大规模强化学习数据集,来自 @salesforce - SVQ,来自 @Google - 很棒的 chatgpt 提示,有近 10,000 个赞 @fkadev - 数学数据集的子集 @DanHendrycks - Nemotron 人 by @nvidia - 阿拉伯语数据集 @rightnowai_co - 1.5M+ 的精选数据集 @github 存储 库 - Toucan-1.5M,最大的全合成工具代理数据集 - 来自 @arxiv - 来自 @NIST 由 @ethanolivertroy 这些只是超过 50 万个公共数据集中的当前趋势 @huggingface !http://hf.co/datasets
一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案
. @cohere 、AMD 和 @OracleCloud 基础设施正在为大规模企业提供安全、高效的 AI。当我们共同行动时,创新会更快地发展。https://amd.com/en/blogs/2025/amd-and-oracle-cloud-infrastructure-are-powering-the-ne.html
人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈
Anthropic Engineering 博客上的新功能:我们为开发人员提供的关于使用代理技能的提示,这是一种通过指令文件夹、脚本和资源扩展 Claude 功能的新方法:
Claude 现在连接到 Microsoft 365。 Claude 可以在 SharePoint、OneDrive、Outlook 和 Teams 中搜索信息,无缝提供量身定制的响应。我们还引入了企业搜索。 企业搜索将您公司的知识集中到一个地方,使用一个专门的项目,该项目借鉴了您与 Claude 连接的工具。
隆重推出 Claude Haiku 4.5:我们最新的小型模型。 五个月前,克劳德十四行诗 4 是最先进的。如今,Haiku 4.5 以三分之一的成本和两倍多的速度与其编码性能相匹配。
我们请经济学家和研究人员探索对强大人工智能潜在经济影响的政策应对措施。 现在,我们分享我们收到的一些初步想法和反馈。
默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。
无
D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。
人工智能演员成为头条新闻,但真实的故事并不在好莱坞。 数字人(或者我们称之为可视化代理)的真正价值在于为企业提供可衡量的影响。从扩大客户参与度到确保一致性,这是企业可以做到的地方
中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。
在接下来的三个周末,我们将租一艘大型双体帆船,带领 Midjourney 成员进行日落巡游,欣赏音乐表演,并有机会与朋友和工程团队成员会面。感兴趣?在这里注册!https://midjourney.typeform.com/to/oo6kvC4Q
稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。
本周的 Stability Seconds 展示了如何使用 Stable Audio 2.5 快速迭代多个音乐方向⏩从一个短视频剪辑开始,我们应用了三种不同的提示,在几秒钟内改变视频曲目的类型和情绪:1️⃣Shoegaze 合成器:
Fireflies.ai,@firefliesai,,#1 会议人工智能队友,
我们为您的对话腾出了更多空间。️音频上传刚刚得到了重大升级——现在所有计划都高达 500 MB。 付费计划的视频上传→高达 2 GB 因为伟大的想法不应该被缩短。
我们上周为风险投资公司推出了 Fireflies——现在看看它实际上能做什么。从创始人电话会议到 IC 会议,Fireflies 将对话转化为投资情报 — 观看演示自动捕获会议用于推介、董事会和投资组合电话会议的自定义风险投资模板烙生成备忘录和创始人记分卡将所有内容同步到您的交易工具 每次风险投资对话的新 AI 队友
递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。
TechBio 将走向何方? 首席研发官兼首席商务官 Najat Khan 将在 @HLTHEVENT 10 月 21 日在拉斯维加斯分享她对 TechBio 快速加速的见解 @mikenally ,首席执行官 @generatebiomed 进行题为“哦,TechBio 将要去的地方”的讨论。对话将由 @Grgyap ,合作伙伴 @MenloVentures . 正如描述中所指出的:“TechBio 类别正在迅速扩张,以至于定义它本身就成为一项挑战,涵盖从计算药物发现和合成生物学到数字疗法和人工智能驱动的诊断的方方面面”了解 TechBio 将在多大程度上突破制药创新的界限。在这里注册:https://hlth.com/events/usa/
是什么让你兴奋? 传播与文化研究员 Katherine Matsumoto 要求 Recursionauts 分享他们的工作中最让他们兴奋的“一件事”。
这不仅仅是技术的转变。 如今,联合创始人兼首席执行官 @RecursionChris 在主舞台上发表讲话 @GITEX_GLOBAL 讨论人工智能、数据和 DNA 的融合如何从根本上改变我们发现药物的方式。 正如他在一篇相关文章中所写:“这不仅仅是技术的转变——它是科学过程本身的重新架构。当我们将海量生物数据集与下一代人工智能模型相结合时,我们不仅加速了发现,而且我们开始以曾经难以想象的规模了解生物学。现在,是时候加速了。关注我们以了解更多信息。
扩大围绕人工智能的对话。 上周,首席研发官兼首席商务官 Najat Khan 参加了由 @StrongReporter ,屡获殊荣的科技记者和主持人 @shiftpodcast 和 @jeffwilser ,AI-Curious 播客的主持人,在
奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。
Owkin 在 ESMO 2025 上推出 K Pro! 我们推出了 K Pro——首款由先进生物推理模型提供支持的生物制药代理 AI 副驾驶。 K Pro 建立在 Owkin 10 年的 AI 创新之上。它使制药、生物技术和投资者能够在整个研发管道中做出更明智、更快速的决策。K Pro 结合了: • 用于查询复杂生物学问题的自然语言交互 • 高质量、多模态生物医学数据——精心策划、集成且支持 AI • 代理人工智能,可在瞬间(而不是几个月)提供分析、可视化和可作的临床见解 K Pro 的核心集成了 OwkinZero(我们开创性的生物大语言模型,用于执行高级生物推理),并为科学家和高管统一了分散的工作流程。 在这里找到新闻稿:https://owkin.com/newsfeed/owkin-launches-k-pro-the-first-agentic-ai-co-pilot-for-biopharma-powered-by-biological-reasoning-models 欢迎莅临我们的 ESMO 展位 #4021,详细了解 K Pro 如何改变生物制药决策的游戏规则,或在此处预订与我们的团队会面:https://calendly.com/esmo-2025
制药公司可以信任新一波代理人工智能吗? 我们的首席执行官兼联合创始人, @TClozel ,在 @FastCompany 今天讨论我们的国情报告中的见解(与 @statnews )以及制药行业需要采取什么措施来集成代理人工智能。 阅读 Fast Company 的文章:https://fastcompany.com/91417750/can-pharma-trust-the-new-wave-of-agentic-ai在此处阅读国情报告:https://owkin.com/connect/state-of-the-nation-biopharmas-agentic-ai-moment?utmsource=linkedin&utmmedium=social-org&utm_campaign=k-pro-launch
在制药行业实施代理人工智能的最大障碍是什么? 作为我们新的《国情咨文》报告的一部分,我们向 202 名制药行业高管和科学专家询问了这个问题 - 生物制药的代理人工智能时刻 - 结合 @statnews . 数据保护成为突出的障碍。但深入研究数据,我们发现它对最小的公司 (68.4%) 比最大的公司 (53.8%) 更重要。这可能是由于较小的公司更容易受到数据泄露的影响,或者监控数字运营和防止数据丢失的数据安全人员较少。 在完整报告中找到这些深刻的见解:https://owkin.com/connect/state-of-the-nation-biopharmas-agentic-ai-moment?utmsource=linkedin&utmmedium=social-org&utmcampaign=k-pro-launch我们进行了这项研究,作为 Owkin 发布 K Pro(我们的企业级代理软件)准备工作的一部分。您可以在此处预订 K Pro 演示:https://owkin.com/connect/book-a-demo?utmsource=linkedin&utmmedium=social-org&utmcampaign=k-pro-launch
Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学
我和乔恩·斯图尔特一起做了一个播客,他一直是我的英雄。这很有趣。他真的很想了解人工智能是如何工作的。
Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父
扩散模型通过使用经过训练去噪的神经网络估计分数来学习概率密度。这些网络中出现了什么样的表征,这与学习密度有何关系? @EeroSimoncelli
@StephaneMallat 我探讨了这个问题。
CDS 创始董事兼教授 Yann LeCun ( @ylecun )在最近在 CDS 举办的一次演讲中介绍了“JEPA、世界模型、规划和人工智能的未来”。 LeCun 探索了联合嵌入预测架构及其实现人工智能系统可以对世界进行建模和规划的潜力。
Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授
上周,当我写道,团队在构建 AI 代理方面取得进展速度的最大预测因素在于他们推动评估(衡量系统性能)和错误分析(识别错误原因)的严格流程的能力时,读者的反应既惊讶又赞同。人们很容易缩短这些流程并快速尝试修复错误,而不是放慢速度来确定根本原因。但评估和错误分析可以带来更快的进展。在这封由两部分组成的信中的第一部分,我将分享一些发现和解决代理系统中问题的最佳实践。 尽管错误分析长期以来一直是构建监督学习系统的重要组成部分,但与使用最新和最流行的工具相比,它仍然被低估。确定特定类型错误的根本原因可能看起来“无聊”,但它是有回报的!如果您还没有相信错误分析很重要,请允许我指出:- 要掌握乐器的乐曲,您不仅要从头到尾演奏同一首曲子。相反,您确定自己在哪里绊倒并更多地练习这些部分。- 为了保持健康,您不仅要围绕最新的营养时尚来制定饮食。您还会询问您的医生您的血液检查,看看是否有任何问题。(我上个月这样做了,很高兴地报告我身体健康!) - 为了提高运动队的表现,您不仅要练习技巧击球。相反,您会审查游戏影片以发现差距,然后解决它们。
要改进您的代理 AI 系统,不要只是堆叠刚刚在社交媒体上疯传的最新热门技术(尽管我发现尝试热门 AI 技术和下一个人一样有趣!相反,使用错误分析来找出不足之处,并专注于此。
在分析错误之前,我们首先必须确定什么是错误。所以第一步是放入评估。我将在这封信的其余部分重点讨论这一点,并在下周讨论错误分析。
如果您使用监督学习来训练二进制分类器,则算法可能出错的方式是有限的。它可以输出 0 而不是 1,反之亦然。还有一些标准指标,如准确度、精确度、召回率、F1、ROC 等,适用于许多问题。因此,只要您知道测试分布,评估就相对简单,并且错误分析的大部分工作在于确定算法在哪些类型的输入上失败,这也导致了以数据为中心的人工智能技术,用于获取更多数据以增强算法在薄弱领域。
借助生成式 AI,监督学习的评估和错误分析中的大量直觉会延续下来——历史不会重演,但它会押韵——已经熟悉机器学习和深度学习的开发人员通常比从头开始的人更快地适应生成式 AI。但一个新的挑战是输出的空间要丰富得多,因此算法的输出可能出错的方式还有很多。
以自动处理财务发票为例,我们使用代理工作流使用收到的发票中的信息填充财务数据库。算法是否会错误地提取发票到期日期?还是最终金额?或者将付款人地址误认为是账单地址?还是弄错了金融货币?或者进行错误的 API 调用,导致验证过程失败?因为输出空间大得多,所以故障模式的数量也大得多。
因此,与其提前定义错误指标,不如先快速构建原型,然后手动检查一些代理输出,看看它在哪些方面表现良好,在哪些方面出现障碍,通常更有效。这使您可以专注于构建数据集和错误指标(有时是在代码中实现的客观指标,有时是使用 LLM-as-judge 的主观指标),以检查系统在您最关心的维度上的性能。在监督学习中,我们有时会调整误差指标以更好地反映人类关心的内容。使用代理工作流程,我发现调整评估更加迭代,更频繁地调整评估以捕获可能出错的更广泛范围的事情。
我在 Agentic AI 课程的模块 4 中详细讨论了这一点和其他最佳实践,内容如下:http://deeplearning.ai我们上周宣布的。构建评估后,您现在可以测量系统的性能,这为尝试对代理进行不同的修改奠定了基础,因为您现在可以衡量产生影响的因素。下一步是执行错误分析,以查明要将开发工作重点放在哪些更改上。我将在下周进一步讨论这个问题。
【原文:https://deeplearning.ai/the-batch/issue-323/ ]
学习构建您自己的声控 AI 助手,该助手可以执行任务,例如从网络收集最新的 AI 新闻、编写播客脚本以及使用工具将所有这些内容放入多扬声器播客中。请参阅我们新的短期课程:“使用 Google 的 ADK(代理开发工具包)构建实时语音代理”,由 Google 的 @lavinigam 和 @sitalakshmi_s . ADK 提供模块化组件,可以轻松构建和调试代理。它还包括一个用于跟踪代理推理的内置 Web 界面。本课程通过构建实时语音代理来说明这些概念,该代理可以链接作来完成创建播客等复杂任务。这需要维护上下文、实施护栏、推理和处理音频流,同时保持低延迟。 您将学习: - 构建能够倾听、推理和响应的语音代理 - 指导您的座席遵循特定的工作流程来完成任务 - 协调专业代理构建代理播客工作流程,研究主题并生成多扬声器音频 - 了解如何将代理部署到生产环境中 即使您尚未构建语音系统,您也会发现了解实时代理如何流式传输数据并保持可靠性对于设计现代代理应用程序很有用。 请在这里加入:https://deeplearning.ai/short-courses/building-live-voice-agents-with-googles-adk/
Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人
从人工智能赋能的教育改革,到就业的未来,从空间智能到机器人技术,周六与来自世界各地的校友和我的朋友一起度过校友聚会很有趣 @lilysarafan ,主席 @Stanford 董事会。红衣主教加油! @StanfordHAI
非常兴奋地分享 @theworldlabs 的最新研究工作RTFM!!这是一个实时、持久且 3D 一致的生成世界模型,运行在单个 H100 GPU 上!下面提供了博客和现场演示!朗
Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。
自 1 年前交付 DGX-9 以来,事情已经取得了长足的进步;太棒了...... 引用 格雷格·布罗克曼 @gdb · 10月15日 感谢 Jensen 亲自交付 DGX Spark。有史以来最好的送货服务。 在如此小的外形尺寸中看到如此多的计算(1 petaflop!
我们对 ChatGPT 进行了相当严格的限制,以确保我们小心处理心理健康问题。我们意识到这对许多没有心理健康问题的用户来说不太有用/有趣,但考虑到问题的严重性,我们希望解决这个问题。 现在我们已经能够缓解严重的心理健康问题并拥有新工具,我们将能够在大多数情况下安全地放宽限制。 几周后,我们计划推出一个新版本的 ChatGPT,让人们拥有一种更像人们喜欢 4o 的个性(我们希望它会更好!如果你想让你的 ChatGPT 以一种非常像人类的方式做出响应,或者使用大量的表情符号,或者表现得像朋友一样,ChatGPT 应该这样做(但前提是你想要它,而不是因为我们正在最大化使用量)。 12 月,随着我们更全面地推出年龄限制,作为“像对待成年人一样对待成人用户”原则的一部分,我们将允许更多内容,例如针对经过验证的成年人的色情内容。
Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。
在 Gemini API 中引入 Google 地图基础功能,将大约 2.5 亿个地点的数据和 Gemini 整合在一起,创造全新的体验️! 如此强大,可以在单一体验中将地图 + 搜索等内容连接在一起:)
/ 又一周将有用的人工智能交到更多人手中淋对于创作者来说,升级后的 Veo 3.1 型号提供了增强的真实感、更丰富的音频 + 更多。现已在 @Flowbygoogle , @geminiapp , @GoogleCloud Vertex AI + Gemini API。 我们将为另外 18 个国家/地区的 52+ 学生提供一年的免费 Google AI Pro 计划,包括 Gemini 2.5 Pro、Deep Research、Veo 3、2TB 存储空间 + 更多。 12 月 9 日之前注册:http://bit.ly/geministudentsemea,5/ 最后 - 在癌症研究中应用人工智能的一些令人兴奋的进展。 我们的 C2S-Scale 27B 基础模型,构建为 @Yale 和 Gemma,提出了一个关于癌细胞行为的新假设,该假设在活细胞中得到了验证,我们已经在 GitHub 和 HuggingFace 上发布了该模型。 我们还推出了 DeepSomatic,这是一种开源人工智能模型,可加快癌症研究的基因分析速度。 迫不及待地想看看下周会发生什么!
人工智能在科学领域的一个激动人心的里程碑:我们的 C2S-Scale 27B 基础模型,构建为 @Yale 并基于 Gemma,提出了一个关于癌细胞行为的新假设,科学家们在活细胞中进行了实验验证。 随着更多的临床前和临床测试,这一发现可能会为开发抗癌疗法揭示一条有前途的新途径。 桑达尔·皮查伊 @sundarpichai · 十月16 模型 + 资源现已在 HuggingFace 和 GitHub 上,因此研究人员可以继续构建和实验。更多详情在这里:
Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。
嘿副驾驶!向所有人展示我们如何改变你与 Windows 电脑的交互方式 - 这样你就可以自然地交谈,它可以看到你所看到的内容,并代表你采取行动。
毫无疑问,护士是医疗保健的心脏。今天,我们推出了第一个为护理工作流程构建的商用环境体验,这样他们就可以专注于最重要的事情:照顾患者。
Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。
Codex IDE 扩展正在以惊人的速度增长。如何充分利用它: 引用 OpenAI 开发人员 @OpenAIDevs · 10月18日 该系列的下一个 – Codex IDE 扩展。 在云中探索代码、实现新功能、集思广益前端设计并启动任务 - 所有这些都可以通过您的代码编辑器完成。x.com/OpenAIDevs/sta...
Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。
美好的一天#AustinGP配套 @MercedesAMGF1 与朋友和合作伙伴。
一件美丽的事情☺️- 请在以下位置与赫利俄斯会面#OCPSummit25我们新的开放式机架级 AI 平台基于 Open Rack Wide 标准构建 @Meta - MI450 系列 Instinct GPU、EPYC CPU 和 Pensando 网络 - 非常高兴将 Helios 推向市场。
Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。
另一个很好的例子,说明如何使用 ML 来改进计算机系统,通过了解系统的实际使用方式(在本例中,通过预测 VM 生命周期以优化其放置)。 干得好,Pratik Worah 和 @martin_maas 和合著者!
我们的一种新的 Gemma 开放模型 Cell2Sentence-Scale 已经确定了一种新的癌症治疗途径,该途径已在活细胞中进行了实验验证。开发 w/ @GoogleDeepMind & @Yale 大学,它深入研究了如何为人工智能表示细胞和生物信息↓
Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。
今天,我们离人工智能作为作系统又近了一步。一台可以与之交谈的计算机,可以看到您所看到的内容并采取行动 - 所有这些都在您的许可下进行,并且比以往任何时候都更加直观。愿景现已在全球范围内正式发布 + 更多关于今天的信息 @Windows 博客:https://blogs.windows.com/windowsexperience/?p=179966
我很高兴与大家分享我们的新视觉形象 @MicrosoftAI . 以温暖、信任+人性为基础,我们设想一个技术让生活变得有意义的更美好的世界。感谢 MAI 设计团队将其变为现实。您现在可以在以下位置探索它:http://Microsoft.AI
认识我们的第三个 @MicrosoftAI 型号:MAI-Image-1 LMArena 上的 #9,在生成速度和质量之间取得了令人印象深刻的平衡 很高兴能从这里继续精炼 + 攀登排行榜! 我们才刚刚开始。https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/
Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。
无
Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。
我很高兴上周来到 Dwarkesh,我认为问题和对话真的很好。
我刚才也重新观看了豆荚。首先,是的,我知道,我很抱歉我说得这么快:)。这对我不利,因为有时我的演讲线索超过了我的思考线索,所以我认为我因此搞砸了一些解释,有时我也很紧张,因为我走得太远了,或者太深入一些相对虚假的东西。无论如何,一些注意事项/提示:
AGI 时间表。我对 AGI 时间表的评论似乎是早期响应中最热门的部分。这是“特工十年”是指早些时候的这条推文https://x.com/karpathy/status/1882544526033924438基本上,我的人工智能时间线大约是 5-10 倍的悲观,你会在附近的 SF AI 家庭聚会或推特时间线上找到,但对于人工智能否认者和怀疑论者的不断上升,仍然相当乐观。明显的冲突不是:我同时 1) 近年来在法学硕士方面取得了巨大进展,而 2) 还有很多工作要做(繁重的工作、集成工作、物理世界的传感器和执行器、社会工作、安全和安保工作(越狱、中毒等))以及在我们拥有一个您更愿意雇用而不是一个人从事任意工作的实体之前要完成的研究世界。我认为总的来说,否则 10 年对于 AGI 来说应该是一个非常看涨的时间表,只是与目前的炒作形成鲜明对比,它并没有这种感觉。
在 RL 上。我已经批评过 RL 几次了,例如https://x.com/karpathy/status/1944435412489171119.首先,你“通过吸管吸吮监督”,所以我认为信号/翻牌非常糟糕。RL 也非常嘈杂,因为完成可能有很多错误,可能会受到鼓励(如果你碰巧偶然找到了正确的答案),而相反,可能会被气馁的出色洞察令牌(如果你后来碰巧搞砸了)。流程监督和法学硕士评委也存在问题。我认为我们会看到替代的学习范式。我长“代理交互”,短“强化学习”https://x.com/karpathy/status/1960803117689397543.我最近看到许多论文出现,它们按照我所说的“系统提示学习”的思路在正确的树上吠叫https://x.com/karpathy/status/1921368644069765486,但我认为 arxiv 的想法与在一般方式运作的 LLM 前沿实验室的实际大规模实施之间也存在差距。总的来说,我非常乐观地认为,我们很快就会在剩余工作的这一维度上看到良好的进展,例如,我什至会说 ChatGPT 内存等是新学习范式的原始部署示例。
认知核心。我之前关于“认知核心”的帖子:https://x.com/karpathy/status/1938626382248149433,剥离法学硕士的想法,让他们更难记忆,或者主动剥离他们的记忆,让他们更好地泛化。否则,他们会过于依赖他们所记住的内容。人类不能那么容易记住,相比之下,这现在看起来更像是一个特征,而不是一个错误。也许无法记忆是一种正则化。还有我不久前的帖子,关于模型尺寸的趋势是如何“倒退”的,以及为什么“模型必须先变大才能变小”https://x.com/karpathy/status/18140380962180834971989 年穿越到 Yann LeCun。这是我在 pod 上描述的非常仓促/糟糕的帖子:https://x.com/karpathy/status/1503394811188973569.基本上 - 凭借 33 年的算法进步知识,您能在多大程度上改进 Yann LeCun 的结果?算法、数据和计算对结果的约束程度如何?那里的案例研究。
纳米聊天。我的 ChatGPT 训练/推理管道的端到端实现(基本要素)https://x.com/karpathy/status/1977755427569111362关于 LLM 代理。我对这个行业的批评更多的是夸大了工具与当前的能力。我生活在一个我认为是中间的世界,我想与 LLM 合作,我们的利弊是匹配的。这个行业生活在一个完全自主的实体并行协作编写所有代码而人类毫无用处的未来。例如,我不希望一个 Agent 关闭 20 分钟,然后带着 1,000 行代码回来。我当然觉得还没有准备好监督一个由 10 人组成的团队。我想分成一些我可以留在脑海中的块,其中 LLM 解释它正在编写的代码。我希望它向我证明它所做的是正确的,我希望它拉取 API 文档并向我展示它正确地使用了东西。我希望它能减少假设,并在不确定某件事时询问/与我合作。我想一路学习并成为一名更好的程序员,而不仅仅是获得大量我被告知有效的代码。我只是认为这些工具应该更现实,因为它们的能力以及它们如何适应当今的行业,我担心如果这做得不好,我们最终可能会在软件中积累大量草率,并增加漏洞、安全漏洞等。https://x.com/karpathy/status/1915581920022585597作业自动化。放射科医生的表现如何出色https://x.com/karpathy/status/1971220449515516391以及哪些工作更容易受到自动化的影响以及原因。
物理。孩子们应该在早期教育中学习物理,不是因为他们继续学习物理,而是因为它是最能激发大脑的学科。物理学家是智力胚胎干细胞https://x.com/karpathy/status/1929699637063307286我有一篇较长的帖子,在我的草稿中写了一半~年,我希望尽快完成。
再次感谢 Dwarkesh 邀请我过来!
Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。
分布式 AI 训练/自制 AI 社区的美学和语言令人着迷且激励人心,从 Prime Intellect 到 Nous 再到 Exo 等多个组织都是如此。这很酷! 杰克·克拉克 @jackclarkSF · 10月19日 炸药之屋是一部有趣、节奏、紧张的电影,与《传染病》和《24》等滴答滴答娱乐的风格相同。很有趣,特别是如果你读过雅各布森的书。 杰克·克拉克 @jackclarkSF · 十月16 更快、更便宜、更好。 引用 克劳德
@claudeai · 十月16 隆重推出 Claude Haiku 4.5:我们最新的小型模型。
五个月前,克劳德十四行诗 4 是最先进的。如今,Haiku 4.5 以三分之一的成本和两倍多的速度与其编码性能相匹配。 隆重推出 Claude Haiku 4.5:我们最新的小型模型。 五个月前,克劳德十四行诗 4 是最先进的。如今,Haiku 4.5 以三分之一的成本和两倍多的速度与其编码性能相匹配。
Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。
信任是创业的复合利益
强烈建议阅读此内容。 这首作品捕捉到了乔什对自己手艺的奉献精神以及他对旅途中遇到的人的深切关怀。蓝图!
Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用
印象非常深刻 @supabase 的成长。对于新的初创公司来说,它们似乎在很短的时间内就从“有前途”变成了“标准”。
Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。
老实说,这比这更简单 过去在网络中大量发送短信和通话的电话运营商被锁定了 现在两者都不再重要了 Layer 1 区块空间费用和链锁效应即将崩溃
当您承担足够的债务和义务时,您的企业价值就会归零 猜猜谁在承担义务 出于多种原因,OpenAI 做 PPU 而不是股票期权,但他们的 409a 可能已经是 0,这是其中之一,这使得期权变得棘手
当我在完成所有模式的 sota 模型并下载 300m 后离开 Stability 时,我因为没有盈利而受到了很多批评(! 实际上,制造最先进的模型和系统来与前沿实验室竞争是很有可能的 做到这一点并盈利真的很困难, 这非常好,因为硬币销售透明地流向癌症、教育、文化等集群,你可以看到他们做了什么/质押来直接网络超级计算 今年数字资产的总净流入量为 $50b(5 OpenAI),只会上升 民间还是会抱怨的 埃马德 @EMostaque · 10月17日 最后说明:这也是为什么进入 SV 对于前沿 AI 实验室来说是一个很大的优势 你可以用资本击败竞争对手(尽管有时会扼杀创新! 另一种选择是像 Mistral 或 Cohere 那样采取战略性措施,但它仍然要少一个数量级
Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。
Meta FAIR 的新研究:Code World Model (CWM),一个 32B 研究模型 我们鼓励研究界研究这种开放重量模型! pass@1评价,对于好奇的人: 65.8 % 在 SWE-bench 上已验证 68.6 % 在 LiveCodeBench 上 Math-96.6 的 500 % AIME 76.0 的 2024 %淋
Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。
我喜欢这些天流行的开放数据集的多样性。再也没有理由不训练自己的模型了! - Fineweb 和它的洗牌 @karpathy - Webscale-RL,一个大规模强化学习数据集,来自 @salesforce - SVQ,来自 @Google - 很棒的 chatgpt 提示,有近 10,000 个赞 @fkadev - 数学数据集的子集 @DanHendrycks - Nemotron 人 by @nvidia - 阿拉伯语数据集 @rightnowai_co - 1.5M+ 的精选数据集 @github 存储 库 - Toucan-1.5M,最大的全合成工具代理数据集 - 来自 @arxiv - 来自 @NIST 由 @ethanolivertroy 这些只是超过 50 万个公共数据集中的当前趋势 @huggingface !http://hf.co/datasets
顺便说一句,模型路由器是令人惊叹的开放模型 Arch-Router-1.5B @katanemo_
@salman_paracha :https://huggingface.co/katanemo/Arch-Router-1.5B
GPT-5 的主要突破是在几个不同的模型之间路由您的消息,以便为您提供最好、最便宜和最快的答案。 这很酷,但想象一下,如果你不仅可以对几个模型,还可以对数百个模型(大大小小、快慢、任何语言或专门用于任何任务)做到这一点——所有这些都在推理时完成。这就是我们在 HuggingChat Omni 中引入的内容,它由 100 多个开源模型提供支持,包括 gpt-oss、deepseek、qwen、kimi、smolLM、gemma、aya 等等! 而这仅仅是个开始,因为有超过 200 万个开放模型,不仅用于文本,还用于图像、音频、视频、生物学、化学、时间序列等 @huggingface !
Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。
对资金感到非常兴奋 @PimDeWitte 踏上人工智能理解物理世界的激动人心的旅程!
未来事物的形状: @Google 作为造福人类的科学家,并对癌症的新想法具有创造力
Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。
我们正在加倍努力 @deel 并以 $17.3B 的估值共同领投他们的 E 轮融资。 Deel 正在为全球工作提供动力。从第一天起,他们就拥有 250+ 法人实体、55+ 原生薪资引擎和全球金融许可证。他们在运营所在的每个国家/地区都有法律、人力资源和合规人员。 Deel 的平台正在超越传统系统:他们拥有多样化的产品套件,默认情况下是分拆的,并拥有自己的薪资和银行基础设施。 Deel 表现出了非凡的增长,我们很高兴能继续与 @Bouazizalex , @shuoshuooshuooo ,以及团队。
Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。
埃拉德·吉尔是谁? 埃拉德·吉尔 ( @eladgil )解释道。
天使支票→领先的 $500M+ 轮次
200+ 投资,40+ 每项超过 $1B
互联网IPO泡沫的教训
通过技术周期进行投资(金融科技、人工智能)
永远的私营公司(Stripe、SpaceX)
何时出售 200+ 投资组合包括:Abridge、Airbnb、Airtable、Anduril、Applied Intuition、Braintrust、Brain Co、 @brexHQ 、字符、跳棋、Coinbase、dbt Labs、Deel、Decagon、Figma、Flexport、Gitlab、Gusto、Harvey、Instacart、Mistral、Navan、概念、$OPEN、PagerDuty、Perplexity、Pika、Pinterest、Retool、Rippling、Samsara、Saronic、Square、Stripe 等。
(00:00) 埃拉德·吉尔 (02:00) Elad 的职业生涯:谷歌、Twitter、彩色、天使投资、书籍、个人 GP 基金、播客、纪念碑 (02:30) 技术是一股向善的力量 (03:20) 埃拉德为何要建造纪念碑 (09:09) 天使投资数十亿美元基金 (??) (11:03) Gil Capital 小而专注的团队内部 (11:45) 论文驱动投资与机会主义投资 (12:43) 跨浪支持 200+ 公司 (15:15) Stripe、Airbnb、Figma、Instacart 和跨竞争投资 (17:08) 为什么现在每家软件公司都是人工智能 (18:47)人工智能最大的瓶颈:能源与地缘政治 (22:10) 政策、加密货币监管和人工智能的风险 (26:14) 1999 年 IPO 热潮的教训及其对人工智能的意义 (34:29) 建立一家万亿美元的公司需要什么
Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。
无
Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute
我厌倦了听到科技游说者说他们不会担心 AGI,因为他们无法定义它:我们可以! 引用 丹·亨德里克斯 @DanHendrycks · 十月16 “AGI”一词目前是一个模糊的、移动的球门柱。 为了为讨论奠定基础,我们提出了一个全面、可测试的 AGI 定义。 使用它,我们可以量化进度: GPT-4 (2023) 是 AGI 的 27%。GPT-5 (2025) 为 58%。
Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley
我的团队正在 Databricks 招聘 2026 年夏季的 AI 研究实习生!加入我们,了解数千家公司的 AI 用例,并为任何人更轻松地为困难的任务构建专门的 AI 代理和模型做出贡献。具体重点领域包括可扩展的 RL 训练、多模态模型、信息检索、评估以及编码和数据科学代理。在这里申请:
Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face
你的象限是什么,人工智能训练药丸的匿名者?
人工智能 x 科学令人兴奋的一周,谷歌和 OAI 关于癌症和融合研究的新闻 现在,如果您渴望加入该运动但不愿加入 DM/OAI 怎么办? 我们花了几个小时让您开始使用 @cgeorgiaw 因此,这里有 10+ 个活跃的开放项目,人工智能可以帮助科学: 显示更多回复 托马斯·沃尔夫 @Thom_Wolf · 10月17日 10/X 了解动物 构建模型以理解动物的语言。带有注释的庞大数据集,以便我们可以实际与海底和丛林生物交流,了解它们的世界。一探究竟: 自然-LM-音频
我有偏见,但我想看到更多这样的内容 人工智能+癌症研究+开源 长远思考:当科学研究涉及社区交流和培养思想时,它是最有益和最成功的。我们必须在权力动态日益不平衡的世界中保持活力(来自人工智能资本支出集中)。我们需要开源和开放科学。 惊人的工作 @Yale
@GoogleAI
@GoogleDeepMind
@davidvandijk !
Share Dialog
fangxia.eth
No comments yet