OpenAI发布o1模型：错误率减少34%，速度提升50%，月付200美元Pro会员无限制调用

菲龙网编辑部7 发表于 2024-12-7 12:23

OpenAI发布o1模型：错误率减少34%，速度提升50%，月付200美元Pro会员无限制调用 | 最前线

文 | 田哲
编辑 | 苏建勋
12月6日凌晨2点，OpenAI开启了12天工作日的首场直播。此次直播，OpenAI推出了o1模型，以及新的订阅服务ChatGPT Pro。自今天起，o1模型将取代o1-preview模型，ChatGPT Plus和Pro订阅用户均可使用。
今年9月，OpenAI正式推出o1大模型，可针对科学、代码和数学等领域的复杂问题解答，不过，彼时仅推出o1-preview、o1 mini两个版本，未解锁o1模型的全部能力。而此次发布会推出的o1模型，在智能化、多模态输入、思考速度等方面均有所提高。
OpenAI联合创始人、首席执行官Sam Altman表示，相对o1-preview，o1模型的重大错误率相比o1-preview减少了约 34%，而思考速度提升了约 50%。
他介绍，o1之所以与众不同，是其每次在回答之前都会思考，这使得它能够提供比其他模型更详细、更正确的答案。
o1的智能化体现在数学等复杂问题具备更高的准确率。据悉，o1模型在解答AIME 2024数学竞赛、博士级科学问题的准确率分别达到78.3%、75.6%，比o1-Preview的准确率分别高出28.3%，1.5%。
回答速度方面，o1也有所提升。在离线测试情况下，o1的平均响应速度比 O1 预览版快了约 60%。OpenAI员工在直播中提出一个问题，分别要求o1、o1-Preview列举公元2世纪的罗马皇帝，并简述他们的生平。结果显示，o1只花了约14秒解答，而o1-Preview耗费33秒。
OpenAI还注意到模型之前对所有问题都有较长的相应时间，他们已经修复这一问题。现在，如果你提出一个简单的问题，o1会快速作答；如果提出了一个复杂的问题，它会花更长的时间思考。
此外，o1新增多模态输入能力，能同时处理图片和文本内容，并进行推理。
OpenAI展示了一张手绘草图的A4纸，画有太阳、冷却系统等物体，以及不同数值，拍照上传给o1。o1在没有任何提示的情况下，生成用户可能想问的问题，并自动解答。接着在不到10秒的时间，o1不仅成功理解了草图的问题要求，还意识到没有提供的参数，自我推理给出了正确答案。
考虑到用户希望不受调用限制使用模型的需求，OpenAI此次推出了新的订阅机制ChatGPT Pro，用户每月付费200美元即可无限制使用更强的o1模型——o1 Pro。
OpenAI展示了o1-Preview、o1、o1 Pro在数学竞赛、代码竞赛、博士级科学问题的回答差异，在每个问题询问四次后，o1 Pro的可靠准确率最高，分别为80.0%、74.9%、74.2%。

来源：OpenAI
在直播中，OpenAI提出了一个o1-Preview回答错误的化学问题，要求o1 Pro找到符合特定标准的蛋白质。结果显示，o1 Pro仅耗费53秒完成答题，并允许用户查看思考过程。
OpenAI表示，他们计划让o1 Pro支持更多高计算密集型任务，允许处理更长和更复杂的任务。此外，o1 Pro还将新增网络浏览、文件上传和增强的API支持（例如结构化输出、函数调用和图像理解）功能。

页: [1]

菲龙网's Archiver

OpenAI发布o1模型：错误率减少34%，速度提升50%，月付200美元Pro会员无限制调用 | 最前线