奥特曼没有其他选择

出品 | 虎嗅科技组

作者 | 王欣

编辑 | 苗正卿

头图 | 《教父》

果然是o1(正式版)和ChatGPT Pro。

12月5日,OpenAI仅花了15分钟就结束了圣诞季发布会的首秀。前一天他们发推表示要连续12天的集中新品发布,看似“大的来了”。

但在15分钟首秀过后,有人调侃奥特曼将短剧模式玩明白了,把两小时发布会切成了12段。

这次发布的o1正式版但并没有超出行业预期——此前接近OpenAI人员就向The Verge透露,发布会新品包括文生视频期货Sora和新的推理模型。

然而,o1对行业的意义也已经逐渐凸显——成为在传统Scaling Law遇到瓶颈后一种新的scale技术路径,国内玩家也在这条路径上积极投入。

而从售价翻倍、高达200 美元一月的ChatGPT Pro,不难看出OpenAI的商业化野心——OpenAI首席商务官Lionetti表示,OpenAI今年的目标是实现近 40 亿美元的收入,其中绝大部分销售额来自为 ChatGPT 的高级功能付费的个人消费者。

或许可以说,奥特曼也没有太多其他选择。据此前未披露的内部财务数据估算和相关人士的分析,OpenAI今年可能亏损高达50亿美元。

新的里程碑?

Lionetti表示,OpenAI 将o1视为一个“里程碑”,它已经打开了新的市场。

o1使用强化学习技术训练模型自行解决问题,该技术通过奖励和惩罚来教导系统。然后,它使用“思路链”来处理查询,类似于人类通过逐步思考来处理问题的方式。

相较于之前的o1-preview(预览版),新模型在速度、性能和准确性上均有显著提升。据奥特曼介绍,o1模型在编码、数学和科学写作等方面表现更为出色,特别是在处理复杂问题时,其响应速度提高了约50%,错误率减少了34%。

值得一提的是,o1模型还支持图片形式的多模态推理。除此之外,OpenAI还计划在未来几个月内增加网页浏览和文件上传等功能的支持,进一步拓展ChatGPT的应用场景。

OpenAI 推出 o1-preview 后,谷歌也加大了推理力度。谷歌已将其推理模型团队规模从 o1-preview 发布前的几十人扩大到 200 人左右。据一位知情人士透露,谷歌还为该团队提供了更多计算资源。

在国内,Kimi、昆仑万维、deepseek也上线了o1路线的推理模型。

11 月 16 日,月之暗面发布了数学模型K0-math,根据其公布的基准测试:K0-math可对标OpenAI o1中可公开使用的两个模型:o1-mini和o1-preview。

11 月 20 日,Deepseek的DeepSeek-R1-Lite正式上线。与OpenAI的o1模型相比,R1-Lite模型将完全公开其复杂的思考路径。根据Deepseek官方的说法,R1-Lite能够处理的思维链长度可达到数万字之多。

11月27日,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版(Skywork o1)。

“o1路线所代表的深度推理模型,其实之前国内各家AI公司都有尝试,但并没有做得很深,”某互联网大厂产品经理表示:“而OpenAI的o1发布后,大家才坚信这个事情是值得做的,投入会比前期要更坚决一些。”

大家押注o1另一重要原因也在于,此前Scaling Law的路线已经走到了瓶颈,GPT5也迟迟未发。

智谱CEO张鹏认为,虽然“Scaling Law确实不再涨了”,但仍在Agent、多模态、强化学习、扩散模型等不同方向上存在新场景、算法的scale可能。

o1所代表的强化学习路线,就是这些可能性中的一条重要路线。

如何落地?

但o1落地场景仍然还需要更多探索尝试,并且局限依然存在。比如,模型也会因为过度思考,而在简单问题上花费多余的步骤。

然而,在数学、生物、物理等科研领域,o1的潜力正在逐步显现。相较于陪聊、普通问答等场景,让AI去攻克哥德巴赫猜想等人类难题,或许才是不断提升AI上限的正确打开方式。

据The Information报道,劳伦斯利弗莫尔国家实验室的研究人员,已经使用o1模型来解决博士级的问题。

该实验室位于加利福尼亚州利弗莫尔,其研究重点是使用高功率激光照射小型燃料胶囊,以在核聚变反应中产生能量。据参与实验的一位人士称,在一个案例中,研究人员使用 OpenAI 的o1-preview,来计算在一定强度的激光作用下胶囊的温度和压力,并询问需要多强的激光才能达到一定的温度和压力。

OpenAI 推理模型通常需要 10 到 60 秒来回答这些问题。该人士表示,这可以为研究人员节省 30 分钟到几个小时或几天的时间。

而在这次的发布会上,Jason Wei也演示了o1在生物科学领域的应用,让o1找出符合标准的蛋白质。对于这个o1-preview无法回答的问题,o1正式版在53秒后便给出了正确答案。

OpenAI首席商务官Lionetti也强调了o1模型在法律、编程、医疗保健和制造业的应用场景。例如,在法律领域,它有助于对条款清单、文档分析、多步骤审批流程进行法律或数学计算。他表示,该公司还向医疗保健公司出售 o1,这些公司使用它来为医疗索赔定价、分析临床指南和分析复杂数据集。它关注的另一个市场是制造业,OpenAI 表示,o1 可以分析和加速工业流程。

这些场景也让OpenAI看到了商业化的更多可能性。

因此,OpenAI推出了价格更高的ChatGPT Pro订阅服务,这是一个每月收费200美元的新套餐,用户可以无限制地使用OpenAI的o1、GPT-4o以及高级语音模式。此外,Pro订阅还特别提供了一个仅供Pro用户使用的o1版本,这个版本被称为o1 Pro模式,它通过增加计算资源来优化对复杂问题的处理,以提供更优质的答案。

虽然相较此前每月 20 美元的 Plus 套餐,Pro定价更为高昂,但这对于刚刚宣布周活用户高达3亿的OpenAI,仍然存在很大的付费转化空间。

更为重要的是,ChatGPT目前付费版本的可能增长速度,不足以弥补运营该服务的高昂成本——据此前未披露的内部财务数据和参与该业务的人士的分析,OpenAI今年可能亏损高达50亿美元。

这种情况下,要达到40亿美元年收入的小目标,OpenAI似乎没有太多选择。

(Tips:我是虎嗅科技医疗组的王欣,关注AI及创投领域,行业人士交流可加微信:13206438539,请注明身份。)