出品 | 搜狐科技
作者 | 梁昌均
12月6日凌晨,OpenAI为期12天的活动开幕。在首日直播上,OpenAI创始人&CEO山姆·奥特曼带着三名研究员露面,宣布正式推出“满血版”推理模型o1和ChatGPT Pro。
“我们听取了很多反馈,希望它更智能、更快,能够多模态,并且更擅长遵循指令等。我们在这方面投入了很多工作,对科学家、工程师、程序员来说,我们认为他们会非常喜欢o1。”奥特曼开场表示。
奥特曼介绍,o1是目前世界上“最智能”的模型,相比预览版o1-preview是更智能、更快速的推理模型,其思维更简洁,响应时间比o1-preview更快。
“o1现在会思考得更智能。如果问它一个简单的问题,它会非常快速地回应;如果问它一个非常困难的问题,它会思考较长时间。我们发现它犯错的次数比之前的模型少了大约三分之一,同时思考速度提高约50%。”OpenAI研究员Max Schwarzer表示。
在演示中,o1-preview和o1都被问到了同样的问题:列出第二世纪的罗马皇帝,包括他们的日期和成就。预览版用了33秒给出答案,而o1花了14秒,快了近58%。
同时,它在编码、数学和科学写作等方面表现更好。评测显示,o1在数学、编程上的性能显著优于o1-preview和GPT-4o,在博士级别的科学问题上远超GPT-4o,和o1-preview不相上下,但同样超越了人类专家。
同时,o1具备更多功能,可支持图像输入等多模态功能,从而对视觉和文本内容进行联合推理。OpenAI还表示,还在努力将网页浏览和文件上传等功能添加o1当中。
OpenAI研究科学家Hyung Won Chung在演示中上传了一张太空数据中心的简意图,o1用了10秒钟完成解读:不仅识别出这跟太空数据中心有关,还提到了需要做的任务以及所要回答的问题,并对其进行了分步骤解答,且进行了复杂的数据计算。
随着o1推出,今年9月推出的预览版o1-preview将退出舞台。目前,ChatGPT的Plus和Team用户可以通过模型选择器访问o1,Enterprise和Edu用户将在一周内获得访问权限。o1还将通过API对外开放,其将支持函数调用、结构化输出和视觉理解等功能。
“现在ChatGPT的重度用户,他们使用得很多,想要的计算能力超过了每月20美元的购买能力。”奥特曼表示,为此OpenAI推出ChatGPT Pro,满足用户更难更大的任务需求。
ChatGPT Pro可以访问OpenAI更佳的模型和工具,包括无限制访问最新发布的模型o1,以及o1-mini、GPT-4o和高级语音服务,并包括o1 pro版本,其使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案。
OpenAI表示,ChatGPT Pro为研究人员、工程师和其他日常使用研究级智能的用户提供了一种加速生产力并保持在AI进步前沿的方式,未来还将添加更多强大的计算密集型生产力功能。
OpenAI重点介绍了ChatGPT Pro所能访问的“最智能”模型——o1 pro。在测试评估中,该模型产生更可靠、更准确和更全面的回应,特别是在数据科学、编程和案例分析等领域。
与o1和o1-preview相比,o1 pro在数学、科学和编码等领域的挑战性机器学习基准测试中表现更好。在单次测试中,o1 pro在数学、编程和博士级别的科学问题中的得分都要优于o1和o1-preview模型。
同时在更为严格的评估测试中,即只有模型在四次尝试中都给出正确答案(4/4可靠性)时,才认为解决了一个问题,o1 pro则在前述三个领域中具有更加突出的可靠性优势。
思维链(CoT)提出者、 OpenAI 研究员Jason Wei演示了基于o1 pro的ChatGPT Pro的能力,向其提出了一个非常具有挑战性的化学问题(找出符合六个标准的蛋白质),o1-preview难以回答正确,而o1 pro则借助CoT小部件,显示进度条,最终用时53秒给出正确答案(Retinoschisin)。
当然,更强功能也需要花更多的钱,ChatGPT Pro每月订阅费200美元,是此前订阅版本价格的10倍。OpenAI表示,随着时间的推移,将添加功能,以解锁更多计算密集型任务,并继续将这些新功能带给用户。
OpenAI还宣布,为帮助在造福人类的领域取得有意义的进步,将向美国领先机构的医学研究人员提供10项 ChatGPT Pro资助,并计划在未来将资助扩展到其他地区和研究领域。
OpenAI此前预告将连续12日进行发布或演示,这在整个科技界都可谓罕见,而首日就放出了市场备受期待的o1模型,无疑让接下来的发布更加让人期待,Sora、Agent,以及更多更强大的功能,可能都在路上。
发表评论