当前位置：

OpenAI发布下一代模型,O1后直接发布o3!

时间:2026-01-04 18:07:57 出处:娱乐阅读（143）

OpenAI发布下一代模型，发布发布O1后直接发布o3！

“双12”直播活动的模型最后一天，终于来了一个大的直接，奥特曼本人也再次出现在直播间。发布发布

与o1相比，o3最突出的模型成绩是顶级程序员竞赛CodeForces目前人类超过这个分数的分数超过2700分，不到200分。直接

二是发布发布为AGI准备的测试ARC-AGI上分从32%跃升到75.7%、87.5%。下代

为什么会有两个成绩？模型

因为o3支持低思考程度和高思考程度两种设置，计算能力(横轴)的直接高思维度也直接拉满。

ARC-AGI是发布发布Keras之父François 由Chollet发起的测试基准，典型的下代题目是图形逻辑推理。

另一项测试被称为最难的模型数学测试EpochAI Frontier Math，包括最新未公开的前沿话题。

陶哲轩之前对这次测试的第一印象是“可能会困住AI好几年”。

与SOTA相比，o3在测试中从2分提高到25分。

人类专业数学家需要几个小时到几天才能解决其中一个问题。现在o3只需要思考几分钟。

直播也公布了o3-mini，支持低、中、高三种思维水平的设置。

主要显示代码能力，低设置下的o3-mini与o1-mini相似，中高设置已超过o1的官方版本。

参与研究的北京大学校友任宏宇，现场展示了o3-mini编程能力。

他使用了ChatGPT的特殊版本，称为ChatGPT。 α。

任务如下：

写一个Python脚本，在当地为HTML文件启动服务器提供一个大文本框。当我在框中输入文本并按下提交时，它应该将代码请求发送到Openal o3-mini API ，使用medium reasoning_effort ，获取生成的代码，将其保存在桌面上的临时文件中，然后在新的Python终端中执行文件。还有一些细节：

可以在~/api在_key中找到我的API密钥

请在API的请求中添加一些额外的提示，指定它只应返回原始代码，没有任何格式或Markdown

您将在Mac笔记本电脑环境中运行

o3-mini的思维过程花费了38秒，然后代码秒出，一次成功运行。