开源且能力比肩o1！阿里、幻方相继发布重磅新品，推理大模型直逼OpenAI

⋅ 2024-11-29 12:09:41 ⋅ 阅读 ⋅ 手机

在OpenAI发布具有突破性推理能力的模型后，人工智能的推理能力竞赛已然打响，阿里、幻方相继发布重磅新品，不仅性能比肩o1模型而且是开源！

周四，阿里通义千问推出QwQ-32B-Preview开源模型，包含325亿个参数，能够处理最长32000 个 tokens的提示词。在 AIME和MATH基准测试中，表现优于OpenAI推理模型o1-preview 和 o1-mini。

QwQ是少数能与o1匹敌的模型之一，其在数学和编程领域，尤其在需要深度推理的复杂问题上表现出色，而且它可以用于商业应用。

上周，量化巨头幻方DeepSeek-R1-Lite模型，Preview版在难度较高数学和代码任务上超越o1-preview，大幅领先GPT-4o等。在AIME测试基准中，随着计算时间增加，其得分稳步提升。

值得一提的是，官方还表示，目前模型仍在开发阶段，经持续迭代，正式版DeepSeek-R1模型将完全开源。

阿里、幻方模型崭露头角，预示着业内推理AI正在兴起，这可能为小型AI开发商提供赶超机会，打破目前由少数几家科技巨头主导的局面。

于今年第二季度开始研究推理模型的初创公司Fireworks，其联合创始人兼首席执行官Lin Qiao表示：

整个开源社区……将会以超快的速度推出推理模型。

此外，科技巨头们也加大了推理模型研发力度，谷歌已将其推理模型团队规模从 o1-preview 发布前的几十人扩大到 200 人左右，谷歌还为该团队提供了更多算力资源。

后进者更具成本优势，思维链成大模型关键

后进者在构建大模型方面更具成本优势。

后进者在开发OpenAI替代品时，似乎受益于斯坦福大学、谷歌、Meta Platforms和OpenAI自身研究人员近年来发布的关于推理的论文。推理模型的开发成本低于传统的LLMs，如GPT-4o，传统模型需要花费数亿美元在计算资源和训练数据上，并需要合法获取这些数据。

新模型可以帮助 OpenAI 及其竞争对手开发能够完成困难项目的编码助手。例如，微软和 Salesforce 等企业软件公司可以利用它们来改进代表客户采取行动的代理，例如安排预约。

值得一提的是，研究人员可以通过让其他模型生成解决问题的思维过程，然后将这些过程用于训练LLM，从而将推理能力融入现有的LLMs中。

一些研究人员还免费向其他开发人员开放了以推理为重点的数据集。例如，阿里巴巴表示，它使用了Open o1其中一个研究小组的数据来构建推理模型。

人工智能初创公司Anyscale和Databricks的联合创始人 Ion Stoica 表示：

在开发推理模型方面，OpenAI的竞争对手并没有明显的劣势。

- THE END -

本文由 @知闻楼 - 汇聚世界，洞见未来修订发布于 2024-11-29 12:09:41

本文来自投稿，不代表本站立场，如若转载，请注明出处：/tech/shouji/38365.html

评论（共条评论，人围观）