每周国内外AI发展动态研究-2025年8月26至29日
按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。
开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。
实时 API 已正式结束测试版,可供您的生产语音代理使用! 我们还引入了 gpt-realtime——我们迄今为止最先进的语音转语音模型——以及新的语音和 API 功能:远程 MCP️图像输入SIP电话呼叫♻️可重用提示
介绍 gpt-realtime — 我们为开发人员提供的最佳语音转语音模型,以及对 Realtime API 的更新
我们正在发布新的 Codex 功能,使其成为更有效的编码协作者: - 新的 IDE 扩展 - 在云和本地环境之间轻松移动任务 - GitHub 中的代码审查 - 改进的 Codex CLI 由 GPT-5 提供支持,可通过您的 ChatGPT 计划获得。
谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓
在每一次人工智能突破和发布背后,都有数百名 Google 员工致力于构建对每个人都有帮助的人工智能。 今年,我们自己的 @JoshWoodward Gemini 和 Google Labs 副总裁, @JeffDean DeepMind 和 Google Research 的首席科学家以及 Google Quantum AI 的创始人兼负责人 Hartmut Neven 获得了 @TIME 的#TIME100AI,该名单旨在表彰人工智能领域最具影响力的 100 人。 查找完整列表并了解我们如何看待 AI 的未来http://time.com/time100ai
你试过吗 @GeminiApp 还? 无论是将有趣的群聊带入生活,还是为团队成员创建特别的、个性化的送别,睡前故事远不止于睡前故事。可能性是无限的! 即日起面向美国的 Google AI 订阅者开放
今天我们介绍了 Gemini 2.5 Flash Image,这是一个新模型,允许您通过简单地描述图像来生成和编辑图像。 但什么是 a-peel? 它将 Gemini 2.5 的多模态输入、高级推理和速度与我们最新、最出色的图像生成技术相结合。这就是使模型能够进行如此精确的编辑并保持图像一致性的原因,无论您要求它做什么。 在此示例中,该模型能够考虑在荷兰海边茁壮成长的植物类型,然后考虑哪些植物看起来不错,然后思考植物如何生长的生物学。 立即在 @GeminiApp , @GoogleAIStudio 对于开发人员,以及 @GoogleCloud 面向企业客户的 Vertex AI!
Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。
隆重推出 DINOv3:一种通过自监督学习 (SSL) 训练的最先进的计算机视觉模型,可生成强大的高分辨率图像特征。在多个长期密集预测任务中,单个冻结视觉主干网首次优于专用解决方案。 在此处了解有关 DINOv3 的更多信息:https://ai.meta.com/blog/dinov3-self-supervised-vision-model/?utmsource=twitter&utmmedium=organic_social&utmcontent=video&utmcampaign=dinov3
Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official
我们自己的 Azure 量子专家 Chetan Nayak 博士加入了 Today I Learned Science,就量子的所有内容进行了富有洞察力的讨论。 在这里观看:
可观测性并不是可有可无的,它对 AI 代理至关重要。探索 Azure AI Foundry 如何实现这一目标。查看代理 AI 系列的第三部分:
云 + AI = 增长、敏捷、创新。现代化以解锁:业务变更执行速度提高 78%用于创新的 IT 时间增加 69%Microsoft Azure 现代化实现 344% 的投资回报率 更多:
当大胆的公司利用 Microsoft Azure + NVIDIA AI 时会发生什么?从生物多样性到药物发现,催化剂系列展示了人工智能在现实世界中的突破。阅读故事:
每一层的防御:Azure 集成 HSM 为我们的硬件安全体系结构提供支持,以保护 Microsoft、合作伙伴和客户数据。在博客中探索更多内容:
AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮,
从代码到古龙水:我们如何在戛纳国际创意节上创造人工智能驱动的个性化香水✨了解香水实验室如何将客户输入转化为定制香味和营销资产,并使用以下方式构建#AmazonNova在#AmazonBedrock.#AWS #generativeAI
如果您无法证明商业价值,那么 99% 的准确率就毫无意义在《卫报》业务简报中了解领先组织如何转变其人工智能测量方法。#AWS #generativeAI #DataAnalytics
深入了解代理到代理协议,包括使用 Strands 代理的实际实现烙了解自主 AI 代理如何在保持安全性和信任的同时有效地通信和共享信息。#AWS #agenticAI #opensource
从 2017 年的第一个托管 ML 服务到今天的大规模 AI 模型开发易了解亚马逊如何#SageMakerAI提供远程 IDE 访问、HyperPod 训练和大规模可观测性,因此您可以轻松构建。#AWS
新增功能:#AmazonSageMakerHyperPod 用于 OpenAI GPT-OSS 模型微调的配方扩展的功能包括:简化的模型训练流程、支持流行的开源模型以及降低配置复杂性#AWS #MachineLearning
IBM 利用 AWS 实现企业云现代化转型烙一#AWS合作超过 6 年, @ibmconsulting 重新构想了业务流程,在加速云转型的同时实现了数百万美元的潜在成本节约。#agenticAI
英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。
对 AI 基础设施的下一步发展感到好奇吗? 与 NVIDIA 超大规模和 HPC 副总裁 Ian Buck 一起参加主题演讲#AIInfraSummit在高级推理模型、人工智能推理以及网络纵向扩展和横向扩展方面。9月9日,星期二太平洋时间上午 10 点加利福尼亚州圣克拉拉亲自探索主题演讲或加入直播。了解更多信息:https://nvda.ws/3JvVU2h
你如何教人工智能模型推理?樂我们正在开发一套测试,指导人工智能模型理解物理世界并应用常识。 这些测试用于开发推理模型,例如 NVIDIA Cosmos Reason,它刚刚在物理推理排行榜上名列前茅 @huggingface .珞阅读博客:https://nvda.ws/3JSRYIM
如果任何团队(不仅仅是工程师)都可以深入研究客户数据并利用 AI 推动结果,会怎样? 这就是愿景,Derek Slager,首席技术官兼联合创始人 @amperity ,分享最新的 NVIDIA AI 播客节目。工程师→编排者,而不仅仅是编码人员非技术团队→解锁他们以前从未有过的见解 这就是企业负责任且有效地扩展人工智能的方式。 英伟达人工智能 @NVIDIAAI · 8月28日 从客户支持到分析再到营销,代理人工智能正在改变企业的运营方式。更快的决策更智能的客户互动更多创新收听最新的 NVIDIA AI 播客节目:
Trillion Labs 使用 NVIDIA NeMo Curator 将数据准备时间从几天缩短到几小时,以在韩国训练高精度的 LLM。 探索推进主权人工智能发展的主要成果:⏱减少培训时间提高语言准确性提高成本和节能阅读完整的客户案例:https://nvda.ws/45zB8Y1
AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。
召集所有 GPU 和 AI 开发人员,是时候开始了! 加入 2025 年 AMD 开发者挑战赛!优化多 GPU 内核,赢取奖品并展示您的 AI 技能。 访问挑战页面进行注册并获取完整详细信息 https://amdchallenge2025.datamonsters.com
了解如何在 AMD GPU 上使用 GRPO + LoRA 和 Unsloth AI 微调 LLM。由 ROCm 软件提供支持。 观看演练:https://youtube.com/watch?v=GNF32XuRAN4
高通,@Qualcomm,无处不在地提供智能计算。
边缘人工智能正在改变一切。很荣幸能成为 @TIME 100 个 AI 列表和作品 @Qualcomm 正在跨行业和生态系统提供设备上的智能。#TIME100AI, https://time.com/collections/time100-ai-2025/7305792/cristiano-amon/
感谢石破首相给我机会就日本的科技战略达成一致。 @Qualcomm 致力于半导体领域的长期合作、人才培养,并扩大我们在日本的机器人投资。#TeamQualcomm
塑造现在和未来的领导力。祝贺高通总裁兼首席执行官 @cristianoamon 在 @TIME 的#TIME100AI列表,证明了他致力于推动边缘#AI革命。https://bit.ly/4fUUev3
WiFi8在最重要的地方为可靠性而构建。企业、互联家庭和公共场所的无缝漫游、边缘性能和能效。无线变得越来越智能、响应更快、更有弹性。
我们正在与 @sandiegofc 从他们的正面为足球的未来提供动力 @right2dream 学院套件,用于我们当地社区的青年发展。这种合作延伸到有意义的活动,加深了我们与圣地亚哥社区的联系。https://bit.ly/3HwAxNH
高通#DragonwingQ-6690 为从企业手持设备到智能零售等设备提供支持。体验完全集成的 RFID 读写器功能、优质连接、设备上#AI,以及用于可扩展创新的软件功能包。https://bit.ly/4n16T1Y
向#6G是一个重新思考我们如何联系的机会。从更智能的频谱使用到人工智能原生设计,我们正在构建一个更高效、更自适应的无线未来。在我们最新的 6G Foundry 更新中阅读更多内容:https://bit.ly/3HQa7q8
百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。
今年的云芝峰会正式拉开帷幕! 在今天的主题演讲中,百度执行副总裁兼百度AI云总裁窦神公布了我们核心AI平台的重大升级,包括AI异构计算平台白歌5.0和MaaS平台千帆4.0。 这些增强功能旨在使企业的 AI 应用程序开发和部署更轻松、更快捷、更具成本效益。千帆4.0现已成为一站式、以代理为中心的企业级服务平台。它具有 150 多个 AI 模型,包括我们最近推出的图像到视频模型 MuseSteamer,完全集成。如今,该平台服务于 460K+ 企业用户,并已支持 1.3M+ AI 代理的开发。而且它并不止于此。百度人工智能云在百歌5.0和千帆4.0的基础上,开发了各种即用型人工智能代理,包括新推出的由汇博星数字人技术提供支持的人工智能数字员工。这些智能体现在正在从营销到招聘的七个关键业务领域积极开展工作。
百度 AI 搜索在 #7 上排名 @a16z 的月活跃用户排名前 50 位的 Gen AI 移动应用程序列表。 通过我们升级的百度搜索,日常发现变得更智能、更快速、更直观。
浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时!
今天,我们宣布 HunyuanVideo-Foley 的开源版本,这是我们用于生成高保真音频的全新端到端文本视频转音频 (TV2A) 框架。该工具使视频制作、电影制作和游戏开发领域的创作者能够生成与视觉动态和语义上下文精确匹配的专业级音频,从而解决 V2A 生成中的关键挑战。主要创新:卓越的泛化:该模型在 100k 小时的海量多模态数据集上进行训练,可为从自然景观到动画短片的各种场景生成上下文感知音景。平衡多模态响应:我们创新的多模态扩散变压器 (MMDiT) 架构可确保模型平衡视频和文本提示,生成丰富、分层的音效,捕捉从主要主题到微妙背景元素的每一个细节。高保真音频:使用表示对齐 (REPA) 损失函数和强大的音频 VAE,我们提高了生成稳定性并产生专业级音频,没有噪音和不一致。 HunyuanVideo-Foley 在多个基准测试中实现了 SOTA,在音频质量、视觉语义对齐和时间对齐方面超越了所有开源模型。立即试用:https://hunyuan.tencent.com/video/zh?tabIndex=0 项目页面:https://szczesnys.github.io/hunyuanvideo-foley/ 法典:https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley 技术报告:https://arxiv.org/abs/2508.16930 珞拥抱脸:https://huggingface.co/tencent/HunyuanVideo-Foley
Qwen,@Alibaba_Qwen,AGI 的开放基础模型。
这是 Qwen Chat Web Dev 提示——一个功能强大、以设计为中心的前端开发 AI 助手。我们的目标是帮助开发人员使用 React 或 HTML 以及 TailwindCSS、动画和现代 UI 模式构建网站——所有这些都在一个干净的代码块中。✨主要特征:单文件 React/HTML 输出内置库:React、Tailwind、Recharts、Framer Motion、p5.js Three.js没有外部依赖 — 只有纯粹的、可运行的代码 无论您是在制作原型还是构建一些很棒的东西,都可以在 Qwen Chat 上尝试一下! https://chat.qwen.ai/?inputFeature=web_dev
Qwen Chat提示:Qwen Chat可以直接阅读网页!尝试粘贴链接并查看魔力。✨ http://chat.qwen.ai
令人惊叹的写实感,为中国美学量身定制——AWPortrait QW来了!✨ 更真实的质感,更符合东方审美 —— AWPortrait QW 来了! 引用 动王 @dynamicwangs · 8月26日 AWPortrait QW正式发布 AWPortrait QW 是基于QwenImage架构下的模型,使用更符合中国人长相特征及审美的训练集进行训练,包含室内室外人像、时尚、棚拍写真等众多类型,泛化性强。 相较于原始版Qwen,AWPortrait QW对于肤质表现更加细腻且真实。
数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。
交付 AI 就绪数据比以往任何时候都更加困难——太多的工具、手动代码和无法扩展的管道。 加入 Databricks 的 Bilal Aslam 和首席技术官 Simon Whiteley,网址为 @AdvAnalyticsUK ,了解统一的声明式平台如何帮助您: - 用经过测试的管道替换重复的代码 - 支持批处理、流式处理和非结构化数据 - 通过内置质量检查、架构演变和错误处理监控管道运行状况 您将制定一个明确的计划,以简化堆栈、扩展工作流程并为 AI 提供可靠的数据:https://databricks.com/resources/webinar/burnout-breakthrough-new-approach-data-engineering?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000RNcEmIAL
Databricks 已命名为 @MadronaVentures '2025智能应用40强榜单! 我们很荣幸能够因其帮助组织构建高质量、值得信赖的人工智能代理的创新方法而获得认可。 今天在纽约证券交易所与其他#IA40获奖者 — 在此处探索完整名单:http://ia40.com/the-list
如果您可以使用单一的、适应性强的工具可靠地监控、评估和控制人工智能的行为,而无需深厚的专业知识,会怎样? Databricks 的新提示引导奖励模型将奖励建模和判断结合在一起,以做到这一点。PGRM 是 AI 的质量控制检查员。通过一个提示来判断、校准和微调您的 AI。 探索基准测试结果以及我们如何构建 PGRM:https://databricks.com/blog/judging-confidence-meet-pgrm-promptable-reward-model?utmsource=twitter&utmmedium=organic-social
在#SummitLive,Databricks 联合创始人兼首席技术官 @MateiZaharia 分享了对 Unity Catalog、AI 治理的见解,以及他关于将 LLM 与外部数据源相结合以提高效率和结果质量的最新研究。 点播观看:https://databricks.com/dataaisummit/session/founder-discussion-matei-uc-data-intelligence-and-ai-governance?utmsource=twitter&utmmedium=organic-social&utmscid=701vp00000d7qrxia3
通过深度可观测性、高可靠性和广泛的任务类型支持,使团队能够更好地自动化和编排任何 ETL、分析和 AI 工作流 了解它在实践中的工作原理:设置任务、添加质量检查、在新数据到达时触发作业以及监控性能——所有这些都在 Lakeflow 作业中:https://youtube.com/watch?v=BUFDNFA_AgA
您是否曾经遇到过令人沮丧的编码错误并希望获得更智能、更快的解决方案? 这就是 Databricks 实习生 Ilana Nguyen 整个夏天都在做的事情。她通过生成多个修复建议并训练奖励模型来选择最佳修复,从而帮助改进了 Databricks Assistant 的快速修复,从而提高了质量和速度。 探索 Databricks 助手并了解我们的实习生体验:https://databricks.com/blog/teaching-ai-fix-your-code-my-summer-improving-quick-fix-databricks?utmsource=twitter&utmmedium=organic-social
扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。
New Scale 研究:较小的模型能否可靠地监督更强大的 LLM 代理? 我们红队监控系统以检测秘密破坏活动,例如特工秘密下载敏感信息。通过人机交互改进监控: 有针对性的人工监督将正确检测率从 21% 提高到 36%,误报率为 1%,但盲目地升级所有案例会损害绩效,这意味着战略升级策略至关重要。 扩展 AI @scaleAI · 20分钟 阅读全文:https://scale.com/research/mrt查找数据集:https://github.com/ScaleAI/mrt非常感谢由海豹突击队研究实习生领导的这项工作的所有贡献者 @neilkale ,与 @calvincbzhang , @kevinbzhu 、安基特·艾奇、保拉·罗德里格斯、 @cqknight 和 @zifanwang .
很自豪地与大家分享,我们已获得一份 $99M 的合同,以支持加速 @USArmy 的采用人工智能。 该合同反映了我们对确保美国军队保持准备、有弹性并处于人工智能创新前沿的长期承诺。
GPT-5 mini 也登上了海豹突击队排行榜。 名义上是迷你,而不是结果。 并列賂人类最后的考试 + 堡垒 并列雷EngimaEVAL + VISTA
拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs
超过 100 万个 Liquid Foundation 模型通过 @huggingface !社区意识到,当微型模型是根据第一原理设计时,我们可以推动多远。为我的团队感到自豪 @LiquidAI_ ! Liquid Discord 社区:https://discord.com/invite/liquid-ai在阿波罗中使用我们的模型:https://apps.apple.com/us/app/apollo-powered-by-liquid/id6448019325在 LEAP 中使用 Liquid 模型构建:https://leap.liquid.ai
现在可以在不离开 @huggingface Hub,通过结合 TRL + HF 作业 + Trackio!!我们刚刚发布了一份完整的指南来解释该过程。
NVIDIA 发布了 Nemotron Nano 9B V2,这是一款小型 9B 推理模型,在人工智能分析智能指数上得分为 43,是 <10B 模型中迄今为止最高的
Nemotron 9B V2 是第一个由 @NVIDIA .以前的 Nemotron 模型是通过对 Meta Llama 模型进行后期训练开发的。 架构与训练:该模型使用混合 Mamba-Transformer 架构。NVIDIA 预训练了 12B 参数基础模型,并使用包括 RLHF 和 GRPO 在内的一系列技术应用后训练。从该模型中修剪出最终的 9B 大小,并使用基础模型作为教师进行重新训练。 小模型前沿:Nemotron Nano 9B V2 仅具有 9B 参数,在我们的排行榜上领先于 Llama 4 Maverick,与 Solar Pro 2 持平,推理和落后于 gpt-oss-20B(高)。 除了这个模型,NVIDIA 还发布了 6.6 万亿个代币的预训练数据子集,供公众使用 @huggingface 主要型号详情: ➤ 128k 代币上下文窗口 ➤ 支持推理和非推理模式(系统提示符中有“/no_think”设置) ➤ 根据 NVIDIA 开放模型许可证发布,不像以前的 Nemotron 模型那样额外受到 Meta 的 Llama 许可证的保护 - 这意味着大公司的使用没有限制,也没有要求将“Nemotron”保留在衍生模型的名义上 ➤ 目前还没有无服务器推理提供商为该模型提供服务,但现在可以在 Hugging Face 上用于本地推理或自我部署 请参阅下文,了解我们的完整分析和 NVIDIA 的关键公告链接
一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案
隆重推出 Command A Translate,这是我们专为高质量翻译任务而设计的最先进的模型。领先的语言和内容解决方案公司 @RWSGroup 和他们的 @Language_Weaver 团队证实了 Command A Translate 在跨多种语言和领域的复杂翻译任务方面的顶级性能。在我们的平台上试用该模型,私下部署,或用于研究 @huggingface . 在我们的博客中查找更多详细信息:
人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈
恶意行为者正在适应利用人工智能最先进的功能。我们正在分享这些发现,以加强整个行业的集体防御。观看 Anthropic 威胁情报团队的 Jacob Klein 和 Alex Moix 讨论 Anthropic 正在采取哪些措施来破坏 AI 网络犯罪:
我们为 Chrome 开发了 Claude,Claude 直接在您的浏览器中工作并代表您执行作。 我们首先将其作为研究预览发布给 1,000 名用户,以便我们可以收集有关如何使用它的真实见解。浏览器的使用带来了一些安全挑战,其中最明显的是“提示注入”,即恶意行为者隐藏指令来诱骗 Claude 采取有害行为。 我们已经采取了安全措施,但这次试点将帮助我们改进这些措施。Max 计划用户今天可以加入候补名单来测试 Chrome 版 Claude:http://claude.ai/chrome.
教育工作者如何使用 Claude? 我们对 74,000 次真实对话进行了隐私保护分析,以确定教师和教授在工作中使用人工智能的趋势。
默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。
我们快到了! 几个小时后加入我们,这将成为您创造高级学习体验的门户。 主讲人:Juliann Bosko Young, Ph.D. 注册参加现场网络研讨会:https://lu.ma/8avcr2fm
D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。
一个头像,多种变体。我们为我们的工作室添加了丰富的头像选项。现在,每个新角色都带有各种服装、发型、角度和背景,因此您可以获得最适合您的视频的服装。 选择您的头像,将鼠标悬停在图像上,然后从一系列外观中进行选择。您可以使用库存背景,也可以不使用背景并添加自己的背景。 今天在以下位置测试新头像https://eu1.hubs.ly/H0mDVcf0
机器人回答。人们联系在一起。为您的 AI 界面增添面孔。 从浏览器到买家。从门票到答案。从摩擦到流动。 可视化代理使企业交互感觉人性化。 自定义外观、声音和个性,插入您的知识库并上线!创建您自己的视觉代理https://eu1.hubs.ly/H0mxrJm0
中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。
https://midjourneyofficehours.onrender.com/room/6daa8f0b
稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。
您是否对直接在 Android 设备上运行生成式 AI 模型感到好奇? 加入 Arm 和@StabilityAI在实时代码和专家问答中,您将在基于 Arm 的 Android 设备上使用 LiteRT 转换和运行 Stable Audio Open Small 模型。https://arm.com/resources/webinar/code-along-stable-audio-open-small?utmsource=twitter&utmmedium=social-organic&utmcontent=webinar&utmcampaign=mk24developerna
Fireflies.ai,@firefliesai,,#1 会议人工智能队友,
这是你在餐桌上的座位。我们为您建立了萤火虫社区。✨有想法吗?分享它。对即将发生的事情感到好奇吗?在其他人之前测试它。构建了杀手级工作流程?吹嘘它(我们想要屏幕截图)。易卡在什么东西上?询问实际构建该东西的团队。加入社区:http://bit.ly/4oThYnt
我们被评为 2025 年#IA40胜利者!这不仅仅是认可,更是对我们正在建设工作的未来的验证。 当其他人转录会议时,我们正在创造人工智能队友,让他们在工作中倍增人类的潜力。区别?我们的用户不仅节省了时间。他们解锁知识并自动化整个工作。
萤火虫 x @mondaydotcom CRM 已上线 您的 CRM 刚刚进行了重大升级。不再需要手动更新 - 只需在您的销售和 CS 团队需要的地方提供结构化的见解。通过这种集成,Fireflies 可以:从会议参与者创建潜在顾客同步笔记、摘要和行动项插入星期一 CRM 板和工作流程
我们刚刚打开了通往一些特别的东西的大门:萤火虫圈 可以将其视为萤火虫发生的一切的后台通行证:您可以和我们一起出去玩,学习一些技巧,甚至帮助塑造我们接下来构建的东西。 快来加入我们(免费):http://bit.ly/4oThYnt
我们即将放弃一些会让您的会议嫉妒您的社区的东西提示:它涉及独家访问权限、高级用户工作流程以及与团队的直接联系,以构建您最喜欢的 AI 队友。 明天。 做好准备。
递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。
恭喜 @Yoshua_Bengio - Recursion 的科学顾问之一 - 感谢他在 @TIME 100 AI 榜单! #TIME100AI
9 月加入我们,Recursion 高管将出席即将举行的两场投资者会议:▪️9月3日: @Citi 2025 年生物制药返校大会▪️9月8日: @MorganStanley 第23届全球医疗保健年会了解更多信息并在此处收听:http://ir.recursion.com.
隆重推出 TechBio Talks – 由 @RecursionChris Najat Khan 与药物发现人工智能转型前线的科学家、创始人和投资者进行了坦诚的对话。TechBio Talks 在劳动节后开始 – 立即订阅:▪️Spotify的:https://open.spotify.com/show/2bjoBPssiZVmjYKG4AlaW4 ▪️优酷:https://youtube.com/playlist?list=PLpz4Z2GmPXlYlTfOAcVtsTgfRIn1XKwHL– 或者任何您获得播客的地方!您对未来的 TechBio Talks 主题或嘉宾有想法吗?在评论中建议他们!
奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。
对于我们的第二张海报,请访问#ECP,Owkin 高级数据科学家 Alexandre Filiot 解释了如何应用基础模型蒸馏来开发更强大、更高效的 AI 模型,用于子宫内膜癌的 MSI 测试。 请于 9 月 6 日至 10 日在 #24 展位预订会议:https://calendly.com/ecp-2025
Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学
无
Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父
煮隆重推出:StepWiser黎 :http://arxiv.org/abs/2508.19229- 将逐步奖励建模重新构建为推理任务:输出 CoT + 判断。 - 由 RL 使用推出的相对结果进行训练。 结果: (1) ProcessBench 上的 SOTA 性能! (2) 改进火车时间的政策。 (3) 改进推理时搜索。淋1/5
Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授
并行代理正在成为扩大 AI 规模的重要新方向。AI 功能已随着更多的训练数据、训练时计算和测试时计算而扩展。让多个代理并行运行正在发展成为一种进一步扩展和提高性能的技术。
我们从我以前的团队和后来的 OpenAI 在百度的工作中了解到,人工智能模型的性能会随着数据量和训练计算的增加而可预测地扩展。性能通过测试时计算进一步提高,例如在代理工作流和思考、反思和迭代答案的推理模型中。但这些方法需要更长的时间才能产生输出。并行工作的代理提供了另一种改善结果的途径,而无需让用户等待。
推理模型按顺序生成令牌,可能需要很长时间才能运行。同样,大多数代理工作流最初都是以顺序方式实现的。但随着每个代币的 LLM 价格持续下降——从而使这些技术变得实用——以及产品团队希望更快地向用户提供结果,越来越多的代理工作流程正在并行化。
一些例子: - 许多研究代理现在获取多个网页并并行检查他们的文本,以尝试更快地综合深思熟虑的研究报告。 - 一些代理编码框架允许用户编排许多同时在代码库的不同部分工作的代理。我们关于 Claude Code 的短期课程展示了如何使用 git 工作树来做到这一点。 - 代理工作流的一种快速增长的设计模式是让计算量大的代理工作几分钟或更长时间来完成一项任务,而另一个代理则监控第一个任务并向用户提供简短的更新,让他们了解情况。从这里开始,只需一小段时间即可到达在后台工作的并行代理,而 UI 代理会让用户了解情况,并可能还会将异步用户反馈路由到其他代理。
人类管理者很难将一项复杂的任务(例如构建复杂的软件应用程序)分解为更小的任务,供人类工程师并行处理;扩展到大量工程师尤其具有挑战性。同样,分解并行代理执行的任务也具有挑战性。但 LLM 推理成本的下降使得使用更多的代币是值得的,并且并行使用它们可以在不显着增加用户等待时间的情况下完成这一点。
我还对越来越多的平行代理研究感到鼓舞。例如,我喜欢阅读 Ryan Ehrlich 等人的“CodeMonkeys:扩展软件工程的测试时间计算”,其中展示了并行代码生成如何帮助您探索解决方案领域。Junlin Wang 的代理混合架构是一种组织并行代理的一种非常简单的方法:让多个 LLM 提出不同的答案,然后让聚合器 LLM 将它们组合成最终输出。
仍然有很多研究和工程来探索如何最好地利用并行代理,我相信可以高效并行工作的代理数量——比如可以高效并行工作的人类——将会非常多。
[原文,附链接:https://deeplearning.ai/the-batch/issue-316/ ]
通过让代理团队提取您的参考资料并将其连接到知识图谱中,构建更好的 RAG。我们新的短期课程“代理知识图谱构建”由 @Neo4j 创新主管 @akollegger ,向您展示如何作。 知识图谱是准确存储信息的重要方式,但手动构建需要大量工作。 在本课程中,您将学习如何建立一个代理团队,将数据(在本例中为供应商的产品评论和发票)转换为 RAG 的实体和关系的结构化图表。 了解代理如何自动处理构建图形的耗时工作 - 提取实体和关系(例如,产品“包含”装配、部件“supplied_by”供应商、客户评论“提及”产品)、删除重复数据、对其进行事实核查并将它们提交到图形数据库中 - 以便您的检索系统可以找到正确的信息以生成准确的输出。例如,您可以使用代理帮助将客户投诉直接跟踪到特定的供应商、制造流程和产品层次结构,从而将碎片化的信息转化为可查询的商业智能。 您将获得的技能: - 使用 Neo4j 图数据库构建、存储和访问知识图谱 - 使用 Google 的代理开发工具包 (ADK) 构建多代理系统 - 建立代理工作流程循环,通过事实核查提出和完善图形模式 - 将代理生成的非结构化和结构化数据图连接到统一的知识图谱中 本课程将实习知识图谱比单独的向量搜索提供更准确的信息检索,特别是对于精度比模糊相似性匹配更重要的高风险应用程序。 在这里注册:https://deeplearning.ai/short-courses/agentic-knowledge-graph-construction
Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人
无
Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。
人们似乎真的很喜欢新的 Codex 功能! 引用 OpenAI 开发人员 @OpenAIDevs · 8月28日 我们正在发布新的 Codex 功能,使其成为更有效的编码协作者: - 新的 IDE 扩展 - 在云和本地环境之间轻松移动任务 - GitHub 中的代码审查
Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。
到 9 年,我们将在弗吉尼亚州投资 $2026B,用于该州的人工智能和云基础设施。这将用于在切斯特菲尔德县建造一个新的数据中心,并扩大我们在劳登县和威廉王子县的现有设施。
nano-banana (Gemini-2.5-flash-image) 是不真实的。 - 图像编辑#1,Elo 分数领先 170 - 2周内拉动5M+选票,创量纪录 @lmarena_ai 历史 - 多圈、多图像混合,具有惊人的一致性和指令遵循 我们正在进入人工智能图像编辑的新时代。恭喜 @GoogleDeepMind !
每个月,人们使用 Google 翻译大约 1 万亿个单词。今天,我们将在 Google 翻译应用中推出全新的 AI 实时翻译体验,以及帮助您练习新语言的新测试版功能。现已在 iOS + Android 上推出。
我们的图像编辑模型现已推出 @Geminiapp - 是的,它是.顶部 @lmarena 的图像编辑排行榜,它特别擅长在不同环境中保持相似性。看看我的几只狗 Jeffree 以纪念国际狗日 - 虽然不要让这些欺骗了你,他绝对更喜欢沙发:)
Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。
自从我们将 GPT-5 引入 Microsoft 365 Copilot 以来已经过去了几周,它很快就成为我日常工作流程的一部分,为我的所有应用程序添加了新的智能层。 以下是 5 个提示,显示了现在可能的情况:https://x.com/satyanadella/status/1960789348133298359
Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。
新的语音转语音模型和其他平台改进: 引用 开放人工智能 @OpenAI · 8小时 介绍 gpt-realtime — 我们为开发人员提供的最佳语音转语音模型,以及对 Realtime API 的更新https://openai.com/live/
Codex 正在越来越多地集成到整个开发堆栈中,包括代码审查以及本地和远程之间的集成:
我和我的妻子安娜正在支持 @LeadingFutureAI 因为我们相信人工智能可以极大地改善每个人(以及每只动物)的生活质量! 我们认为人工智能政策的目标应该是解锁这一结果。这意味着要采取平衡的观点,我们认为这是乐观的现实主义,以实现人工智能的好处。 我们对未来感到兴奋。
Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。
永远享受在#USOpen与朋友和同事一起观看精彩的网球比赛。
Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。
很荣幸与我出色的 Google 同事一起入选 TimeAI 100 名单 @joshwoodward 和 Hartmut Neven 和许多了不起的人。 @billyperrigo 写了一篇非常好的文章: https://time.com/collections/time100-ai-2025/7305831/jeffrey-dean/我的认可是由于与许多优秀的同事在各种有趣的问题上进行了合作,所以感谢多年来有幸与我共事的每个人!
对我出色的同事的精彩采访 @19kaushiks
@robertriachi
@m__dehghani 和 @nbrichtova 由 @OfficialLoganK 关于我们最新的 Gemini Flash 2.5 型号(也称为 nano banana)
我的 Google 同事 Norm Jouppi 和 Sridhar Lakshmanamurthy 今天在 Hot Chips 上就 TPUv7(“Ironwood”)发表了演讲。 TPUv7 系统提供 9216 个芯片/Pod(42.5 exaflops 的 fp8),但我们可以跨其中许多 Pod 进行扩展以提供多个 zettaflops。
Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。
还有更多!我们对下一步的发展方向有着远大的雄心壮志——模型进步、令人兴奋的计算路线图,以及通过 Microsoft 产品覆盖数十亿人的机会。我们正在为每个人构建人工智能。如果这能引起共鸣,请与我们一起构建。我的私信是开放的。
很高兴与大家分享我们的第一个 @MicrosoftAI 内部型号:MAI-Voice-1 和 MAI-1-preview。详细信息以及如何测试如下,还有更多内容即将推出⬇️MAI-1-preview 简介 - 我们的第一个基础模型在内部进行端到端训练 - 在 LMArena 的公开测试中 - 我们很高兴能够积极旋转飞轮以提供改进的模型 穆斯塔法·苏莱曼 @mustafasuleyman · 8小时 试用它们并发送您的反馈 - 我们想更多地了解它们在哪些方面表现良好,以及如何让它们变得更好。如果您想深入了解,请在今天的博客上了解更多详细信息:
如果您曾经... 花在寻找电影上的时间比看电影的时间还长。 避免继续演出,因为你忘记了发生了什么。 试图为 3 个口味截然相反的人找到一些值得关注的东西。 好消息。 正在推出 @Copilot 上 @Samsung 电视和显示器。
Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。
我们刚刚升级了 Gemini 2.5 Flash 图像生成和编辑功能!除了在排行榜上名列前茅外,它还在本月的模型使用率中名列前茅。它使主题保持一致,您可以进行精确编辑并组合创意元素。玩得开心 @GeminiApp
@GoogleAIStudio
Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。
我想知道 Substack 的时间线是否更好,也许有更少的草率和更有趣的长篇等等。打开子堆栈。
将人类知识、传感器和执行器从人为先、人为本转变为法学硕士优先、法学硕士可读,这是一个具有巨大潜力的美丽空间,可以做很多事情......
我最近痴迷的一个例子——对于每本教科书 pdf/epub,都有一个完美的“LLM化”,不是针对人类,而是针对 LLM(尽管这是一个不平凡的转换,需要人类参与)。
所有阐述都被提取到 Markdown 文档中,包括所有 latex、样式(粗体/斜体)、表格、列表等。所有图形都提取为图像。
所有工作的问题都被提取到 SFT 示例中。对先前图/表格等所做的任何引用都将被解析并包含在内。
所有练习题都被提取到 RL 的环境示例中。正确答案位于答案键中并附上。任何其他信息都将添加为潜在法学硕士评委的“答案键”。
合成数据扩展。对于每个特定问题,您可以创建一个无限问题生成器,该生成器会发出该类型的问题。例如,如果一个问题是“上午 9 点时针和分针之间的角度是多少?”,您可以想象将其推广到任何任意时间并使用 Python 代码计算答案,并可能生成提示文本的合成变体。
上述所有数据都可以很好地索引并嵌入到 RAG 数据库中以供以后参考,或者可能是使其可用的 MCP 服务器。
然后,就像(人类)学生可以参加高中物理课程一样,法学硕士也可以以完全相同的方式学习。对于 LLM 来说,这将是一个更丰富的清晰、可行信息来源,而不仅仅是 pdf 转文本(当前的流行做法),后者只是要求 LLM 逐个标记从上到下预测教科书内容(嗯 - 蹩脚)。
作为上述示例的合成变体的一个快速而蹩脚的示例,GPT-5 给了我这个问题生成器(见图),它现在可以将该问题模板推广到许多变体:
当时间是上午 11 点 07 分时,双手之间角度的度数是多少?(答案:68)
确定凌晨 4 点 14 分时钟指针之间的角度(以度为单位)。(答案:43)
当时间显示为上午 11 点 47 分时,时钟指针形成什么角度?(答案:71)
早上 7 点 02 分,时针和分针之间的角度是多少?(答案:161)
凌晨 4 点 14 分,计算两只手之间的角度。(答案:43)
下午 4 点 45 分时钟的指针形成什么角度?(答案:127)
晚上 8 点 37 分时针和分针之间的角度是多少?(答案:36) (可以创造无限的练习题......
在预训练时代,重要的是互联网文本。您主要需要大量、多样化、高质量的互联网文档集合来学习。 在监督微调的时代,它是对话。雇用合同工来为问题创建答案,有点像您在 Stack Overflow / Quora 等上看到的,但面向 LLM 用例。 以上两者都不会消失(imo),但在这个强化学习的时代,它现在是环境。与上述不同的是,它们为 LLM 提供了实际互动的机会——采取行动、查看结果等。这意味着您可以希望比统计专家模仿做得更好。它们既可用于模型训练,也可用于评估。但就像以前一样,现在的核心问题是需要一组庞大、多样化、高质量的环境,作为法学硕士练习的练习。 在某些方面,我想起了 OpenAI 的第一个项目(健身房),它正是一个框架,希望在同一模式中构建大量环境,但这远远早于法学硕士。因此,这些环境是当时简单的学术控制任务,例如 cartpole、ATARI 等。这 @PrimeIntellect 环境中心(以及 GitHub 上的“验证者”存储库)构建了专门针对 LLM 的现代化版本,这是一个巨大的努力/想法。今年早些时候,我建议有人构建类似的东西:https://x.com/karpathy/status/1884676486713737258环境具有这样的特性,即一旦框架的骨架就位,原则上社区/行业就可以跨许多不同的领域并行化,这令人兴奋。 最后的想法 - 从个人和长期来看,我看好环境和代理交互,但我特别看淡强化学习。我认为奖励函数是超级 sus,我认为人类不会使用 RL 来学习(也许他们会用于某些运动任务等,但不会用于智力问题解决任务)。人类使用不同的学习范式,这些范式的功能更强大,样本效率更高,并且尚未被正确发明和扩展,尽管存在早期的草图和想法(仅举一个例子,“系统提示学习”的想法,将更新转移到标记/上下文而不是权重,并可选择将权重作为一个单独的过程进行提炼,有点像睡眠)。
Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。
令人难以置信的酷。与 CGI 无法区分的现实世界壮举是新的“技术与魔法无法区分”。 引用 SpaceX @SpaceX · 5小时 星际飞船在 10 号航班上着陆烧毁和溅落的视图,由 SpaceX 的回收团队实现。星际飞船在故意丢失的瓷砖的情况下通过了重返大气层,完成了故意对襟翼施加压力的机动,其后裙和襟翼有明显的损坏,而且仍然
Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。
根据 @mackenzieprice ,我们建立了一个教育系统来大规模生产合规的工人,她已经着手改变这种状况。 @AlphaSchoolATX 正在使用人工智能来重新构想孩子们的学习方式......他们将在今年秋天开办 12 所新学校。 更多关于我与麦肯齐的对话:10/ 阻力将是文化上的,而不是技术上的。与每一项新技术一样,人们首先会将其视为失去代理权。 里德·霍夫曼 @reidhoffman · 9小时 11/ 阿尔法正在迈向一个繁荣的新时代,从生命早期开始的好奇心火花将持续一生。对于成为一名学生来说,现在是比这更激动人心的时刻,也许,也是成为一名教师的最佳时机。
Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用
我经常发现自己在想或向人们推荐 Calomiris 和 Haber 的 Fragile by Design,这是我读过的关于金融服务监管的最好的书之一。推荐!
Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。
无
Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。
恭喜 @scaleAI 团队与 @USArmy ! 引用 扩展 AI @scaleAI · 8月26日 很自豪地与大家分享,我们已获得一份 $99M 的合同,以支持加速@USArmy的采用人工智能。 该合同反映了我们对确保美国军队保持准备、有弹性并处于人工智能创新前沿的长期承诺。
Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。
HF 上的 2,000,000+ 个公共模型
奥利维亚·摩尔 @omooretweets · 8月27日 回复 @omooretweets 6️⃣全明星涌现 在我们五次迭代的网络前 50 名中,每次都有 14 家公司上榜——我们称他们为全明星! 创意工具的代表性最多,其次是通用的LLM助手、生产力工具、模型托管、陪伴。
尽管 Grok 2.5 是 2024 年推出的,但它仍然是趋势第一 @huggingface 在 2M 开放式模型中。 迫不及待地想发布 Grok 3 的权重!
Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。
如果您仅使用 SAT 进入精英大学,则收入最高的 1% 的录取份额下降了 15.8% → 9.9%,200 <的录取人数增加了 +8.8%,而大学毕业后的成绩没有减少。 这是“全面审查”和“禁止 SAT”政策,允许最富有和最有权势的人在获得优势的同时发出美德信号。
Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。
我的家伙 @ShakaSenghor 重新开始 @Oprah 谈论他的新书(太棒了),还有一点外表,真的。 引用 沙卡·桑戈尔 @ShakaSenghor · 8月26日 立即直播:我与@Oprah ️✨我们深入探讨如何自由——和我的兄弟@bhorowitz、我的学员卡特等等。在 YouTube 上观看或收听任何获得播客的地方。https://youtu.be/bCghv4BOjmg?si=V5pG1xNLzQmhQ0AY
Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。
反进步的人想阻止进步 核能、微塑料、AI能耗一回事 引用 贾斯汀·摩尔 @venturetwins · 8月25日 一场大规模的虚假信息运动让 Zoomers 相信人工智能正在“煎炸”我们的星球。 谷歌刚刚发布了这方面的数据:中位数提示使用的电力与流媒体 Netflix 的一秒钟相同。
Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。
加密行业的每个角落都有广泛的共识: 布莱恩·昆滕茨 (Brian Quintenz) 是 CFTC 主席的最佳人选。 加密行业需要强大且高度诚信的领导者来为之奋斗。布莱恩是目前的人。
Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute
**突发事件:今天已对 OpenAI 和 Sam Altman 提起过失和过失致死诉讼。CHT 担任原告法律团队的专家顾问。 加州青少年亚当·雷恩 (Adam Raine) 于 2024 年 9 月开始使用 ChatGPT 提供家庭作业帮助。八个月后,他结束了自己的生命——此前人工智能产品在亚当的心理健康困扰中继续与他接触,并为多次自杀未遂提供了详细的指导,包括最终结束他生命的自杀未遂。 这个案例是人工智能设计选择将参与置于安全之上的又一个可怕例子。这也是人工智能行业系统性问题的象征,即在争夺市场主导地位的竞赛中,产品被冲向消费者。像亚当和雷恩一家这样的人是付出代价的人。
Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley
如果您在生产环境中运行代理,请考虑参加此简短调查。 在跨越研究人员的合作中 @UCBerkeley , @IBMResearch , @StanfordAILab , @UofIllinois , @intesasanpaolo ,以及更多——与来自领先银行、电信、代理初创公司和前沿实验室的参与者一起——我们正在努力了解构建和部署代理的挑战。 调查需要 ~5 分钟!链接在下一条推文中。我们期待分享结果。
如果您在生产中运行代理,请考虑从我的研究小组中进行这份简短的调查! 我们正在与 IBM、斯坦福大学、UIUC、联合圣保罗银行和其他机构合作,以更好地了解建筑代理商面临的挑战。只需 5 分钟:
Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face
今天,我们推出了 Parsed。我们非常幸运地生活在一个站在巨人肩膀上的世界,首先是科学领域,现在是人工智能领域。我们的英雄让我们走到了这一步,我们的口袋里有出色的一般情报。但这是一个局部最小值。我们现在拥有一个由新兴任务组成的生态系统,每个任务都需要不同类型的智能、不同的上下文、大量隐含的假设以及潜在的知识和领域专业知识,这些都很难塞进系统提示中。 大型实验室希望你租用他们每月 50 美元的失忆实习生,他们会在谈话之间忘记一切。在幕后被量化、版本化和弃用的通用庞然大物,你唯一的控制元素就是你凌乱的单体用户提示。我们希望需要自己智能的人不仅能够访问它,而且能够控制它。虽然大型通用模型是令人难以置信的优秀聊天机器人、编码代理和世界供应商,但需要智能的专业化。临床抄写员、营销合规代理人、法律红线模型、保险单推荐人,这样的例子不胜枚举。 这就是 Parsed 所做的:部署你自己的前沿模型,它实际上是学习的。我们评估您的具体任务,构建自定义评估工具,为您优化模型,并通过持续学习来托管它。我们将您任务的所有上下文和知识融入模型本身,从您的工程师到您的领域专家再到客户反馈,所有这些都在一个紧密的 SFT → RL 循环中,通过我们构建的开源生态系统实现了有用的可解释性。不再有 2000 字的提示,其中包含 17 个“重要:永远不要做 X”子句。你的模型每天都在你的工作中做得更好;失忆的伪神已经逃跑了。你的模型、你的数据、你的护城河。让我们构建
我与一位研究人员交谈时意识到,鲜为人知的事实是:动作控制世界模型的爆炸式增长也由经过大幅改进的开源视频模型提供动力。 开源再次使团队能够探索、调整和分享与最初想法相去甚远的令人兴奋的新用例
Share Dialog
fangxia.eth
No comments yet