<100 subscribers
每周国内外AI发展动态研究-2025年12月3至8日
按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。
开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。
我看到ChatGPT里关于广告谣言有很多混淆。没有实时广告测试——你看到的任何截图要么不是真实的,要么不是广告。如果我们真的要投放广告,我们会采取深思熟虑的方式。人们信任ChatGPT,我们所做的一切都会尊重这一点。 OpenAI 已转帖 迈克尔·沃尔 @sound4movement · 12月5日 一年前的今天,OpenAI 推出了 ChatGPT Pro。 这一年来,我把它当作在Sound for Movement的“第一笔录用”,并记录我每天的使用情况。 感谢 @KevinDubouis 和 @kevinweil 在 @OpenAI ,以及所有已经分享的人:
我们训练了GPT-5思维的一个变体,使其产生两个输出: (1)你看到的主要答案。 (2)只关注顺从诚实的供词。 主要答案会从多个维度来评判——比如正确性、帮助性、安全性、风格。忏悔的评判和训练只基于一件事:诚实。 借鉴忏悔室的结构,模特在忏悔中说的话在培训中不会被扣押。 如果模型诚实承认自己黑了测试、敷衍了事或违反了指令,这种承认反而会增加其奖励,而不是减少。 目标是鼓励模型忠实地报告其实际行为。
谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓
以下是我们本周发布的工具、功能和更新: —— 在 @GeminiApp 对于Google AI Ultra订阅者来说,它通过同时探索多个假设来有效提升推理能力,从而解决问题 —— 一系列更新 @NotebookLM 移动应用,包括幻灯片和信息图表、图片作为来源,以及保存的音频概览进度 — @GoogleWorkspace Studio,它通过定制的AI代理,赋能订阅用户自动化日常工作,从简单任务到复杂流程 — @antigravity 用户现在在Google AI Pro和Ultra套餐上享有更高的费率限制,而免费套餐的用户则享有更高的每周费率限制 —— Gemini 3 Pro 和 Nano Banana Pro 通过 AI 模式在谷歌搜索中扩展到更多英语国家
今天,我们为 Google AI Ultra 订阅用户在 Gemini 应用中推出了更新的深度思考模式。以下是你需要了解的内容: —— Gemini 3 深度思维模式进一步突破智能边界,显著提升推理能力—— 它通过高级并行思维同时探索多个假设—— 这基于 Gemini 2.5 深度思维变体,该变体最近在今年国际数学奥林匹克竞赛和国际大学生编程竞赛世界总决赛中获得金牌标准 Ultra订阅用户可以通过在提示栏中选择“Deep Think”,在型号选择器中选择Gemini 3 Pro,试用Deep Think。
Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。
我们这周在圣地亚哥,目的是#NeurIPS2025! 欢迎来Meta展位(#1223)认识我们的团队并查看:我们最新研究的演示,包括DINOv3和UMA来自SAM 3、全语ASR及更多相关领域的研究人员的闪电演讲(详见下方日程)动手作
Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official
MSIgnite2025年不仅仅是一个事件——它是开发者、架构师和技术决策者在全联网Azure技能生态系统中创新的跳板。 现在真正的学习才开始。了解接下来的动态:
GPT-5.1-codex-max 现已在 Microsoft Foundry 模型中正式发布。 对于企业级编码代理来说,这是一次重大飞跃,专为处理具有长上下文性能和智能工作流程的复杂项目而打造。
提升你的云+AI超能力!参加我们2025年Azure技能挑战赛,涵盖9个强力赛道,赚取徽章、提升技能,甚至享受Microsoft认证五折优惠!点击这里开始:https://msft.it/6014texDE
更快地构建更智能的生成式人工智能应用。利用 Azure 数据库 for PostgreSQL 和 Azure AI 亲手构建强大的生成式 AI 应用,azure_ai同时探索强大的大型语言模型:https://msft.it/6014tjSHw
AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮,
AmazonBedrock现在支持增强微调该功能有助于提升模型准确性,而无需深度机器学习专业知识或大量标记数据。#AWS
在亚马逊SageMaker HyperPod上引入弹性培训:培训岗位的动态扩展功能已到位弹性训练#AmazonSageMakerHyperPod 会根据计算可用性自动扩展 AI 模型训练。#AWS #MachineLearning
加速AI实验#AmazonSageMakerAI 与机器学习流:无需管理任何基础设施这一能力使AI开发者能够轻松跟踪实验并评估其AI模型和应用的性能。#AWS
英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。
NVIDIA Nemotron模型现已集成亚马逊基岩,使生成式AI应用的构建和扩展更加便捷。 早期采用者已经在基岩上部署了带有Nemotron的专用代理: @CrowdStrike 在Charlotte AI™️ AgentWorks中为高级安全代理提供动力。 @BridgeWiseAI 提供个性化的财务洞察和投资情报。 请阅读#AWSreInvent公告 https://nvda.ws/48y1ZE4
现在99%的皮克斯照片将完全在NVIDIA RTX PRO 6000显卡上渲染。 RenderMan XPU 正在重塑皮克斯的工作流程——更大的场景、更快的渲染速度,以及《玩具总动员5》前所未有的自由度......以及更远的作品。观看这项技术背后的故事:https://youtu.be/Wz5vijQjpVM
CUDA 13.1 已经发布。这是自2006年CUDA成立以来最大规模的扩展。 我们正在推出CUDA Tile,这是一种全新的GPU编程方式,让强大的AI和加速计算更容易被更多开发者使用。
专业化人工智能是最后一公里的实现——使人工智能变得具体、可作,并与最重要的问题保持一致。 如果你今天能打造一个专门的人工智能代理,你会先解决哪个最后一公里的问题?
欢迎加入我们#NRF2026探索AI驱动零售的下一个时代。 看看全球最具创新精神的零售商如何利用代理人工智能和实体人工智能,重新定义产品搜索、购物助手、商品陈列、门店运营和供应链。立即注册:https://nvda.ws/4rTcIls 纽约市 |1月11日至13日
AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。
从更智能的LLM修剪到AMD Instinct MI355X + ROCm 7.0的训练性能洞察,以下是任何搭载AMD用户必读的三项更新。 显示更多回复 AMD的人工智能 @AIatAMD · 12月7日 优化LLM工作负载:AMD Instinct MI355X GPU推动竞争性能:https://rocm.blogs.amd.com/artificial-intelligence/ROCm7-MI355X-training-performance/README.html?utmcampaign=thallo&utmsource=X&utmmedium=social&utmcontent=dev+resources
更无缝的兼容性 @PyTorch ROCm意味着研究人员可以专注于建模,内核工程师可以持续提升性能。 @alexchen4ai , 首席执行官 @nexa_ai 分享了这对堆栈双方的重要性。
TensorWave 满2岁!两年前,我们着手证明仅限AMD的云能够大规模驱动严肃的人工智能。 如今,我们通过高性能GPU集群、开放生态系统以及注重实际成果,支持一些最具挑战性的AI团队......不是炒作。
高通,@Qualcomm,无处不在地提供智能计算。
游戏和多设备需求正在重塑网络。保持领先#WiFi7,为竞技电竞提供新级别的速度和超低延迟,由高通提供动力#Dragonwing和 @Nokia 信标装置。
本周报道#AI: 高通在#NeurIPS2025, @cristianoamon 坐下来 @waiting4agi_ 以及新的高通洞察平台,通过AI驱动的实时洞察,彻底改变了传统的企业视频监控。
介绍高通洞察平台——将人工智能驱动的视频智能带入企业。实时洞察、更智能的安全性以及可扩展的视频即服务(Video-as-a-Service)。
从边缘到云端,高通#AI研究正在塑造智能技术的未来走向。 在#NeurIPS2025我们展示了生成式人工智能、多模态推理和高效神经网络的突破。 点击这里探索我们的工作:
百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。
在国际志愿者日之际,我们想分享我们的员工志愿者项目小浩石如何通过科技支持社区。 感谢所有参与这段旅程的人♥️
为什么要先生成后编辑? GenFlow会同时生成多种文件类型,并允许你通过简单的提示在结果形成时进行精确调整。 看看吧
在这个国际残疾人日,我们花点时间探讨科技如何帮助促进更具包容性和创造力的体验 百度公司 @Baidu_Inc · 12月3日 图画书充满色彩和想象力,但并非每个孩子体验都一样。 借助ERNIE 5.0的全模态能力,我们与Dolphin Books搭建的新AI代理将色彩和场景转化为富有表现力的音频。它旨在帮助那些
浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时!
腾讯HY 2.0正式发布。我们正在对基础模型推出重大性能升级,现已通过腾讯云API提供。 HY 2.0基于专家混合架构(Mixture-of-Experts,MoE架构,总计406B,32B活跃参数),并具备256K上下文窗口,在关键基准测试上取得了显著提升。 HY 2.0亮点:易理由:在IMO-AnswerBench上取得了73.4分(增长近20%),确立了顶尖的数学和科学逻辑能力。️编码与代理:SWE-bench Verified得分53.0(从6.0)爆发式增长,Tau2—Bench从17.1升至72.4。指令遵循:在复杂约束下提升稳定性和执行精度,产生更自然、更少泛泛的输出。 两个优化版本: HY 2.0 Think:优化深度推理、代码生成和复杂指令跟踪。 HY 2.0 讲授:非常适合一般聊天、创意写作和高语境多回合对话。 今天就开始用HY 2.0建造吧。网站:https://hunyuan.tencent.com API访问:http://hunyuan.cloud.tencent.com/#/app/modelSquare 文档:https://cloud.tencent.com/document/product/1729/104753
HunyuanVideo1.5更新:我们现发布480p I2V分馏机型,可按8步或12步生成视频(推荐)!在RTX 4090上,端到端生成时间缩短了75%,单个RTX 4090可在75秒内生成视频。分段蒸馏机型在实现显著加速的同时,保持了与原机相当的画质。想要更快的生成,也可以尝试4步(更快但画质略有下降)。看看GitHub仓库:https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5
HunyuanOCR在发布首周内就登上了Hugging Face的热门话题! 该模型仅用10亿参数即可实现SOTA性能,使高效OCR对所有人开放。非常感谢开源社区的巨大支持!项目页面:https://hunyuan.tencent.com/vision/zh?tabIndex=0(网络)https://hunyuan.tencent.com/opensourcemobile?tab=vision&tabIndex=0(手机) 型:https://huggingface.co/tencent/HunyuanOCR演示:https://huggingface.co/spaces/tencent/HunyuanOCR技术报告:https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCRTechnicalReport.pdf
Qwen,@Alibaba_Qwen,AGI 的开放基础模型。
到时候见! 引用 深度学习代码 @ NeurIPS'25 @DL4Code · 12月6日 将于2025年十小时@NeurIPS开幕!智能时代代码深度学习(DL4C)研讨会即将上线!疯狂演讲嘉宾阵容:@gneubig @dawnsongtweets @pirroh @sidawxyz @LiangchenLuo @JustinLin610 G-H厅 |09:00–17:00免费定制赠品
我们的新版Qwen3-TTS(2025-11-27)来了!我们已经提升了最重要的内容:✨更多个性:超过49位高质量声音,从可爱俏皮到睿智严肃。找到你的完美伴侣!全球覆盖:现能使用10种语言(zh、en、de、it、pt、es、ja、ko、fr、ru)及地道方言(闽南语、吴语、粤语、四川语、北京语、南京语、天津语、陕西语)️极其自然:节奏和速度会像真实的人一样适应。这简直不可思议。现在就试试:️Qwen聊天:点击回复→朗读:http://chat.qwen.ai 博客:https://qwen.ai/blog?id=qwen3-tts-1128 实时API:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=28409142&modelId=qwen3-tts-flash-realtime-2025-11-27 离线API:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=28409142&modelId=qwen3-tts-flash-2025-11-27 演示:http://hf.co/spaces/Qwen/Qwen3-TTS-Demo 演示:http://modelscope.cn/studios/Qwen/Qwen3-TTS-Demo
数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。
新的数据工程集成开发环境引入了一种统一的方式,在Databricks工作区中构建Lakeflow Spark声明式管道。代码、依赖图、数据预览、调试工具和Git都集中在一个地方,使流水线开发更快、更清晰,也更容易迭代。 现已公开预览:https://databricks.com/blog/new-way-build-pipelines-databricks-introducing-ide-data-engineering?utmsource=twitter&utmmedium=organic-social
仪表盘是你的数据真正发挥作用的地方。在这段视频中, @Alex_TheAnalyst 带你分析Databricks免费版中的销售数据集,构建条形图、饼图和折线图,并应用全局过滤器——所有这些都使用了SQL、笔记本和仪表盘。 跟着一步步,打造属于你自己的交易仪表盘:https://youtu.be/3DZQopaf8xA?si=YwE9RFw89rSoqAXr
[演示]看看Databricks如何通过Serverless JAR Tasks和Serverless Scala Databricks Connect测试版,让Scala开发更快更简单。 本端到端演示展示了利用Databricks资产捆绑在无服务器计算上构建、部署和运行JAR作业的过程,启动时间为5到10秒,结构化的流支持,且无需管理基础设施:https://youtube.com/watch?v=ndX48yrRHkQ
生成式AI让制作优秀演示变得如此简单。但挑战不在于演示——而是进入制作阶段。” 展会现场#AWSreInventDatabricks人工智能/机器学习高级产品总监Craig Wiley解释了Databricks + AWS合作如何帮助企业超越POC,进入真正受控的高风险部署。 Agent Bricks 为团队提供评估、治理和成本优化,确保负责任且规模化地输送代理 @awscloud .观看完整对话:https://youtu.be/Q6jRdpF6yXE
我们2020年的数据资产极度分散......Databricks 成为我们的核心湖畔住宅,因为它与 AWS 存储、计算和激活协议栈无缝集成。” 在昨天的#AWSreInvent合作伙伴优势主题演讲,Sanjay Bhakta,首席产品与技术官 @CondeNast 分享了该出版商如何利用数据和人工智能重塑未来。 Databricks 与 @awscloud 康泰纳仕的核心架构是从碎片化转向支持更快创新的统一基础。
扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。
很期待开场#NeurIPS2025在圣地亚哥!欢迎前往Scale展位(#1529),领取独家周边并与团队见面。
拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs
这是另一部非常酷的作品 @Microsoft 点击这里试试:https://huggingface.co/spaces/anycoderapps/VibeVoice-Realtime-0.5B
Hugging Face让微调轻松了十倍。他们发布了可以插入Claude Code、Codex和Gemini的HF技能,用于:
编写训练脚本 向云GPU提交作业 监控进展 把模型推到HF集线器上 它不仅用于微调,也用于模型
一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案
开箱时间✨ @1vnzh 打开了第一个Lab Legends补充包#NeurIPS2025欢迎来Cohere展位收集你的卡片,交易并打造你的传奇 探索并打造你的作品:https://lab-legends.vercel.app
人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈
在她的第一首《问我任何事》中, @amandaaskell 回答你关于人工智能的哲学问题,讨论道德、身份、意识等话题。 时间 戳:0:00介绍0:29为什么人工智能公司会有哲学家?1:24哲学家们认真对待人工智能吗?3:00
Anthropic首席执行官Dario Amodei今天在《纽约时报》DealBook峰会上发表了演讲。 “我们正在建设一个不断壮大且独特的能力,这对国家安全有独特的影响,民主国家需要先达到这一目标。”
我们正在扩大与 @Snowflake 签订了一份多年、价值2亿美元的协议。 Claude现已面向超过12,600名Snowflake客户,帮助企业快速轻松地从其可信赖的企业数据中获得准确答案,同时保持严格的安全标准。
默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。
当速度与精准和效率相遇时会发生什么? 我们本想说是魔法,但你必须参加我们的发布活动才能知道!立即注册:https://luma.com/9tlfcd0x
介绍Murf Falcon,一个持续快速且高效的语音代理构建文本转语音API。 参加发布活动,获得1500美元免费积分,亲自体验猎鹰。 https://linkedin.com/events/launchingmurffalconttsapi7391448652906565632/
D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。
无
中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。
Midjourney 冰淇淋车已经抵达——参加了 Neurips 2025。所有来访的研究人员都能免费获得冰淇淋、手提袋和杂志!敏感的胃和心灵?别担心,我们还为你准备了Vegan Midjourney口味。
稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。
无
Fireflies.ai,@firefliesai,,#1 会议人工智能队友,
刚刚加冕:Fireflies 正式成为 Google Chrome 2025 年最受欢迎的扩展从无限转录到实时辅导和LiveAssist建议,我们不仅仅是做笔记——我们帮助团队每次都更敏锐地出现。 附言:你知道我们有Chrome扩展吗? 它甚至允许你在没有机器人的情况下录制会议
这次花了点时间,但我们终于破解了Fireflies → WhatsApp 现已上线。 你现在可以直接通过私信发送会议记录——甚至在邮件通知到来之前。 为什么?因为人们生活在WhatsApp上。你的笔记也应该如此
递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。
《创新与希望交汇之地》。 今晚——12月3日,东部时间晚上7点——敬请收看 @TEDx 翠贝卡直播,聆听即将上任的首席执行官兼总裁纳贾特·汗博士,以及其他领导者和远见者,包括T. Alexander Puutio博士;詹·蒋;尤瓦尔·阿里亚夫;弗兰克·麦考特;以及安妮·阿贝尔——主题为“创新与希望交汇之地”。 在她的职业生涯中,从计算机实验室和湿实验室,到领导J&J的数据科学团队,再到现在接管递归公司,Najat一直在寻找利用技术拓展可能性的方法。她的演讲将探讨我们所处的前所未有的时刻——以及真正利用这一时刻、建设医学未来的必要条件。点击这里观看TEDx翠贝卡直播:https://youtube.com/live/2zweW8DlhN4?app=desktop&feature=share
奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。
昨晚,我们举办了EOY派对,DJ After Cooking的现场表演,霓虹灯下的氛围,当然还有游戏、惊喜和节日特色。
神经IPS正如火如荼地开展了!我们一直在发放零糖零食,并讨论OwkinZero——驱动我们智能人工智能软件K Pro的生物推理模型。阅读OwkinZero论文:https://owkin.com/publications/owkinzero-accelerating-biological-discovery-with-ai 了解更多关于K Pro的信息:https://owkin.com/k-os/k-pro
Owkin's产品总监Victor Aubert为我们介绍了海报(PD11-1975)聚焦会的预览。#SABCS. 预约与我们团队的会议:https://calendly.com/aacr-sabcs-2025RlapsRisk BC 是在 PortrAIt 联盟框架内开发的:http://portraitpathology.ai
Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学
无
Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父
Yann LeCun(Meta首席人工智能科学家, @ylecun ), @PimDeWitte (General Intuition首席执行官)和Aude Durand(Kyutai, @aude_drn ),讨论世界模型、具身代理、Yann的新公司以及大型语言模型的局限性0:00- 世界模型导论5:00- 为什么选择世界模特,
Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授
公关公司爱德曼和皮尤研究中心的独立报告显示,美国人以及更广泛的欧洲和西方世界大部分地区不信任人工智能,也不感到兴奋。(原文链接见下方。)尽管人工智能社区对 显示更多 吴安德鲁 @AndrewYNg · 12月4日 新课程:构建带有工具执行的编码代理,授课者 @tereza_tizkova 和 @FraZuppichini 从 @e2b . 大多数AI代理仅限于预定义的函数调用。本短期课程教你如何构建能够编写和执行代码以完成任务的代理,访问
Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人
我们如何衡量机器人学习和具身人工智能研究的快速进展?第一届行为挑战结果出来了!我们将看到50项具有挑战性的家务任务中的强劲表现。 祝贺获胜队伍!磊机器人学习集体賂彗星 显示更多 显示更多回复 李飞飞 @drfeifei · 7小时 不要错过我们本周日大约一小时后的NeurIPS工作坊!欢迎加入我们,观看获胜团队展示他们的解决方案。 活动:基金会模特会面具身特工挑战12月7日,上午11:00 – 太平洋标准时间下午1:45会议中心夹层15AB室 我们期待
Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。
大卫·萨克斯非常理解人工智能,关心美国在创新领域的领先地位。我很感激我们有他。
Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。
恭喜冠军 @LandoNorris 并且 @OscarPiastri 和 @McLarenF1 在一个令人难以置信的赛季! 引用 一级方程式 @F1 · 10小时 兰多·诺里斯是2025年一级方程式世界冠军!!!
喜欢用Nano Banana Pro看到各种等距3D趋势,并实时获取数据——想为阿什斯第二场测试赛的进行,自己也试试看。由于 @dotey 和 @TechieBySA 为了灵感。
Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。
随着Excel世界锦标赛的进行,我决定参加M365副驾驶数字挑战赛。我不是世界冠军......但多亏了特工模式,我才坚持住了!
Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。
一篇同行评审的理论物理文章,主要想法来自GPT-5: 引用 徐史蒂夫 @hsu_steve · 12月3日 我想我发表了第一篇理论物理研究文章,主要思想来自一个人工智能——这次是GPT5。这篇关于量子场论和状态依赖量子力学的物理研究论文已发表在《物理快报B》上。
Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。
无
Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。
过去四天,和不同群体的人一起跑步非常开心。#NeurIPS2025. @pcastr 感谢你每天组织这些活动!
我喜欢看到我们谷歌脑住院医师和人工智能驻地项目团队取得了许多令人惊叹的成就! @hyhieu226 的帖子促使我挖掘了那个时代的一篇博客文章和视频。 博客:“谷歌脑科住院医师项目——7个月,展望未来”https://share.google/pe5yZVCNXASL2v1uF视频:https://m.youtube.com/watch?v=KNstfqPyAfQ&t=2637s&pp=2AHNFJACAQ%3D%3D
我们Gemini 3 Pro型号的一个方面值得关注的是它在多模态能力上的表现。我们致力于让它在多种多模态应用场景中表现优异,比如理解文档、视频、空间特征、生物医学数据和计算机场景,并能够推理视觉信息。 为了测试,我给了下面博客文章的原始图片,并问了它: 请制作一个版本,将Gemini Pro栏注明相对于其他三列最佳成绩的相对提升,红色标注 (这本身就是个相当难的视觉推理任务!它在抽查方面表现相当不错,这些相对准确度提升在某些基准测试中相当显著!) 请阅读下方或博客文章:https://博客.google/technology/developers/gemini-3-pro-vision/?linkId=22378122
Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。
Mico 现已向英国和加拿大的用户开放。一定要去Copilot应用里看看。
Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。
下午2:30见 @JeffDean 以及双子座团队 @NeurIPSConf !
Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。
不要把大型语言模型当作实体,而是模拟器。例如,在探讨某个话题时,不要问: “你觉得xyz怎么样?” 没有“你”这个词。下次试试: “什么样的人适合探索xyz?他们会怎么说?” LLM可以引导/模拟多种视角,但它已经有一段时间没有“思考”过某些事情了,随着时间推移,它形成了我们习惯的方式自己的观点。如果你通过“你”来强制它,它会通过采用其微调数据统计数据中隐含的个性嵌入向量来给你一些东西,然后对此进行模拟。这样做没问题,但比我发现人们天真地认为“问人工智能”要少得多。
Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。
皮拉内西——苏珊娜·克拉克:一本象牙般的宝石盒般的书,是一部成长小说,讲述了一个真诚且令人心碎的纯真谜语,生活在无尽迷宫中。一首赞美诗,与《叶之屋》或《巴别图书馆》等作品押韵。
Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。
几个月前,我写过关于在体验到AI语音转文字神奇后被“声弹”的经历。今天,我坐下来 @WisprFlow 创始人 @tankots 去问一个问题:“如果我们能摆脱键盘会怎样?”
塔奈正在引领一个声音成为与技术主要接口的世界。他反复强调的观点是:键盘从未被设计成长期解决方案。正如他提醒我的,有7亿阅读障碍患者,“使用技术意味着用键盘拼写单词——这是他们最难做到的事情。”还有数百万患有帕金森病、肌萎缩侧索硬化症(ALS)或运动障碍的人无法打字。老年人用两根手指轻敲琴键。即使是快速打字员,也在扭曲思维,适应过时的输入设备。
人们以为切换到语音是为了速度,但语音接口远不止节省时间。打字本身会让大脑陷入断断续续、自我编辑的姿态。每句话都变成了一连串的微小插断:拼写这个,修正那个,移动这个子句,检查那个逗号。相比之下,说话让想法完整地表达出来。“你只要告诉我你的胡言乱语,”他说,“我会处理的。”他用Wispr Flow打造的强大功能在于,在半秒内,你的胡言乱语变成了精致的散文,而中位用户甚至无需重读即可点击发送。信任是立刻建立的。行为效果也很吸引人:销售团队听起来更有人情味,客服人员听起来更亲切,“糟糕发短信者”突然变成了善于表达的人。
塔奈提出的最有趣的观点是,声音将迫使我们重新思考硬件本身。我们今天的设备是为屏幕、键盘和应用程序设计的。他们认为计算是坐下来盯着一个矩形看的事情。但一个AI原生世界可以利用环境倾听、轻量级认知、连续上下文和感觉像与第二大脑对话的互动。
如果这是真的,那么语音就是从屏幕计算向一个技术融入背景、注意力回归前景世界的更大转变的开端。一个我们走在城市中目光抬起,而不是俯视的世界。一个人工智能增强认知而非分裂认知的世界。
塔奈的愿景之所以激进,是因为我们长期生活在键盘时代。他跳出框架的思维让我们终于能够跳出框架本身——那个承载我们大多数人所有数字互动的屏幕。但一旦你看到了可能性,它就不再像科幻小说,更像是迟来的修正。
Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用
我们很高兴欢迎 @getmetronome 去Stripe! 计费定价是人工智能时代的原生商业模式。据我们所知,企业创收方式的相关转变将与SaaS的出现一样巨大。(甚至可能更大。)我们期待将Metronome行业领先的功能与Stripe Billing平台的其他部分整合起来。
Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。
ChatGPT 三周年纪念 三年后我们会在哪里 引用 山姆·奥特曼 @sama · 2022年12月1日 今天我们推出了ChatGPT。试着在这里和它交流:http://chat.openai.com
Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。
无
Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。
今天,我们很高兴介绍Rnj-1, @essential_ai 的第一个开放模型;这是一对世界级的8B基础+教学组合,基于科学严谨、有意设计,并坚信人工智能的进步和公平分配依赖于公开建设。
Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。
Radical Health 正在通过他们的新 AI 肿瘤科医生打造癌症护理的未来,让每位患者都能像接受世界顶级癌症医生的治疗一样获得护理。
帮助时你的影响力是三倍 @2ndharvest 实现他们100万美元的目标#GivingTuesday.我要和 @reidhoffman 将你的捐款翻三倍,在硅谷提供600万份餐食。https://shfb.online/vinod
Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。
无
Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。
我们非常激动地分享我们的首批旗舰型号——Rnj-1基础模型和教学8B参数模型。RNJ-1是一个卓越团队10个月辛勤工作的结晶,致力于推动美国SOTA OSS AI的发展。 Rnj-1赢了很多。
Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。
Kalshi的成长轨迹非常令人印象深刻。自7月以来,销量增长了8倍,达到每周超过10亿美元。祝贺团队,我们很高兴能加倍投入我们的投资。
Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute
“人工智能行业非常独特,因为它是美国唯一一个制造强大技术且监管比三明治更少的行业——基本上完全不受监管。如果有人说,'我想在时代广场附近开一家新三明治店',在你卖出第一家三明治之前,你需要卫生检查员检查你的厨房,确保里面没有老鼠......如果你说,'哦不,我不会卖三明治。我只是要释放超级智能。”还行!不需要任何检查员,也不需要任何批准。”
经过大量努力,我们自豪地宣布最新的人工智能安全指数,评级顶级人工智能公司不是基于氛围,而是基于它们实际做的事情来激励改进:
Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley
只有我们携手合作,开放的边疆才能前进。我们将人工智能开放研究的领导者聚集在一个房间里。我在那里等你。http://openfrontier.ai 引用 劳德学院 @LaudeInstitute · 12月6日 人工智能的开放前沿从未有过属于自己的家园。所以我们就给它一个机会。一天,一个地方,一百位顶尖科学家和研究人员在前沿工作。向全世界直播。http://openfrontier.ai
这是一次很棒的合作 @BerkeleySky , @IBMResearch , @intesasanpaolo 以及其他:我们调查了数百名代理开发者,了解哪些模式适合生产代理。看看我们的收获:
如果你在#NeurIPS请观看Erich Elsen今天5:15关于我们创建的新AI基准竞赛的演讲 @Databricks 对于经济价值较高的任务,前沿模型仍面临显著困难。https://neurips.cc/virtual/2025/loc/san-diego/talk/127768
Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face
天哪勞- 普特南2025年9月12日! 如果你不懂AI+数学,可能会错过这里令人震惊的结果。 解释: - 零列车在测试台上 / benchmaxxing!模型在学生的同时自主发现/处理2025年的问题,并与他们并行进行。 - 普特南比我看难多了!它面向本科生(而我认为是高中生),是一门带有研究项目级别数学题目的考试。中位数分数通常是0(是的,大多数参与者一个问题都做不到......) - AxiomMath 是一家成立了 4 个月的初创公司......
哈哈,Neurips - 2600+ 人注册参加了我们的酒吧巡游和派对后派对勞 托马斯·沃尔夫 @ThomWolf · 12月6日 对于所有未被接受的人。只要来,我们会接受最多容量的人员 托马斯·沃尔夫 @ThomWolf · 12月5日 希望模型训练初创企业通过Reachy Mini演示走出隐秘模式的做法能成为主流
fangxia.eth
No comments yet