# 最新！OpenAI发布o3及o3 mini推理模型

By [bewildcard](https://paragraph.com/@bewildcard) · 2025-03-03

---

前情回顾
----

OpenAI在圣诞前连续12天发布了一系列重磅更新，以下是每日发布的简要回顾：

*   **Day1**：发布o1满血版、ChatGPT Pro最贵订阅版本200美元/月
    
*   **Day2**：发布强化微调新功能，用少量训练数据即可在特定领域构建专家模型
    
*   **Day3**：发布视频生成模型Sora
    
*   **Day4**：Canvas全面开放，升级代码功能
    
*   **Day5**：展示OpenAI与苹果智能合作功能
    
*   **Day6**：发布高级实时视频理解功能
    
*   **Day7**：发布Projects In ChatGPT功能
    
*   **Day8**：搜索功能全面开放，支持语音搜索
    
*   **Day9**：o1 API开放，实时API更新
    
*   **Day10**：拨打1-800-ChatGPT热线电话，可访问ChatGPT
    
*   **Day11**：展示Mac桌面版App与各类App的互操作性
    

本期我们将详细介绍**Day12**：OpenAI发布o3及o3 mini推理模型。

o3系列模型：性能卓越，接近通用人工智能（AGI）
-------------------------

在OpenAI为期12天的圣诞系列发布活动的高潮时刻，终于揭晓了备受期待的重磅新品——o3，这是其迄今为止最先进的前沿推理模型的升级版。OpenAI宣称，在特定条件下，o3的性能已经接近于通用人工智能（AGI）的水平。

在直播环节中，OpenAI的首席执行官Sam Altman表示：“我们视o3为人工智能发展的新篇章。这些模型能够处理日益复杂且需要深度推理的任务。”他还特别强调了o3在编程领域的卓越表现，称其为“不可思议”。

### o3系列模型介绍

OpenAI推出了o3系列，包括两款模型：

1.  **OpenAI o3**：旗舰版，性能强大。
    
2.  **OpenAI o3 mini**：轻量级，速度快，成本低，性价比高。
    

### o3系列模型的开放计划

o3系列目前不向普通用户开放，OpenAI计划先进行外部安全测试，预计明年1月正式发布。感兴趣的人可以提交申请：[OpenAI安全测试申请](https://openai.com/index/early-access-for-safety-testing/)

### o3模型的性能提升

o3模型在多个基准测试中表现出色：

*   在SweepBench Verified基准测试中，准确率达到71.7%，比o1高出20%。
    
*   在Codeforces编程竞赛平台上，得分2727，远超o1的1891分。
    
*   在美国数学竞赛AIME 2024测试中，准确率为90.67%，高于o1的83.3%。
    
*   在GPQA Diamond测试中，得分87.7%，比o1的78%高。
    
*   在EpochAI Frontier Math测试中，得分超过2457分，远超其他模型。
    

### o3在AGI领域的进展

o3在ARC-AGI基准测试中表现出色，得分75.7分，在提高算力和思考时间后，得分达到87.5%，超过大多数真人。

### o3 mini模型的特点

o3 mini继承了o1 mini的数学和编程能力，成本极低，并向安全研究人员开放测试申请。它支持低、中、高三种推理时间模式，可根据任务复杂度调整思考时间。在Codeforces Elo评分中，随着推理时间增加，得分持续攀升。o3 mini还能自我测试，在GPQA数据集测试中，准确率达到61.62%。

### o3 mini模型的数学和编程能力

在AIME数学基准测试中，o3 mini低推理模式性能与o1 mini相当，中等推理模式超越o1 mini。o3 mini还支持函数调用、结构化输出和开发者指令等API功能。

### o3模型的市场影响

OpenAI在AI领域领先竞争对手约两年，但随着市场份额被蚕食，ChatGPT的光环正在褪去。竞争对手如Anthropic和Google开发出性能接近的新模型，OpenAI的竞争优势正在减弱。尽管如此，作为用户，我们将成为这场变局中的最大赢家。

👉 [野卡 WildCard | 一分钟注册，轻松订阅海外线上服务](https://bit.ly/yekapay)

---

*Originally published on [bewildcard](https://paragraph.com/@bewildcard/openai-o3-o3-mini)*