李彦宏把AI的门槛打没了

⋅ 2024-11-12 20:02:11 ⋅ 阅读 ⋅ 股票

李彦宏把AI的门槛打没了

随着大模型技术和能力的指数级跃迁，自然语言成为了这个时代最重要的编程语言。它对产业、对应用场景能产生的增益价值，远超过去的移动互联网时代。

“过去24个月，AI行业最大的变化是大模型基本消除了幻觉，回答问题的准确性大幅提升。让AI变得真正可用、可信赖。”在百度创始人李彦宏看来，AI应用的大规模落地正在成为现实。

日调用量超15亿的文心大模型，相较一年前首次披露的5000万次，增长约30倍，成为过去两年中国大模型应用爆发的缩影。但和外界期待的不同，百度并非要借助AI大模型重构移动互联网时代的10亿DAU“超级应用”，而是要打造数以百万“超级有用”的应用矩阵。

在百度世界2024大会上，李彦宏以“应用来了”为主题进行了演讲，并发布了iRAG和无代码工具“秒哒”两大创新技术。他认为，AI之所以被称为产业革命级的机会，就是因为它对于社会经济，带来了生产力的无限扩张。而“智能体将作为AI应用的主流形态，即将迎来它的爆发点。”

小学生都能创造的AI应用

2023年，ChatGPT火爆，AI狂飙。当国内还在聚焦百模大战时，李彦宏就提出了“不要卷模型，要卷应用”他认为，大模型不应该只向内卷算力、卷参数，更应该向外卷场景、卷问题，才能充分释放大模型潜力和价值。

他坚信，中国AI的发展道路，是由应用来驱动的。而在AI泡沫期到来之前，百度就盯准了AI应用。当时，无论是微软Copliot，还是2022年底发布的Perplexity，AI助手都是全球科技巨头的应用方向。

在 2022 年年底 ChatGPT 大火之后，李彦宏判断，大模型正在从Copilot阶段迈向Agent阶段。而智能体，是他最看好的AI原生应用发展方向。

这一判断也得到了全球企业家和AI专家的认可。去年 11 月，比尔·盖茨在其个人网站上撰文表示：“智能体不仅会改变我们与计算机的互动方式，还将颠覆软件行业，带来自图形用户界面诞生以来最大的计算革命。”他称智能体将会像过去的Android、iOS和Windows一样，成为下一个平台。

扎克伯格也预测，未来智能体的数量可能会达到数十亿，甚至超过全球人口总数。

今年 3 月，斯坦福大学教授吴恩达指出，他们在研究中基于 GPT-3.5 构建的智能体工作流在应用中表现可以比 GPT-4 要好，基于 GPT-4 构建的智能体工作流效果当然还可以更好。他认为，AI 智能体将在2024 年推动 AI 的大规模进步，甚至可能超过下一代基础模型所带来的影响。

这表明，将目光局限于大模型不一定可取，智能体（Agent）或许会比其所用的基础模型更加优秀。

所谓“智能体”，是能够自主感知环境、做出规划、执行任务的智能实体。如果用一个比较直观的公式来表示，智能体=大模型（LLM）+规划（Planning）+反馈（Feedback）+工具使用（Tool use）。

和传统的单体大语言模型这个“黑箱模型”相比，智能体的优势在于能更容易理解和分析不同组件如何对系统的整体行为做出贡献。在实际应用中，它具有更高的鲁棒性和容错能力。

李彦宏的判断是，智能体是AI应用的最主流形态，并将作为敲门砖逐步渗透进各个行业领域。

而这种自动化程度再发展，就会变成AI Worker，能独立完成各方面的工作。就像科幻爱情电影《Her》，具有自我意识和情感的AI或许不久就会出现。眼下，它已经初具雏形。

李彦宏认为，智能体最明显的特点是使用门槛足够低，谁都能上手。比如在百度的文心智能体平台上，有11岁的小学生创造的智能体，通过搜索和其他渠道分发出去。在大模型幻觉消失之后，越来越多的人靠自然语言提示词就可以做出很有用的智能体。

这意味着，将来会有数以百万量级的智能体涌现，形成庞大的智能体生态。而技术进步带来的生产力提升，最终让全社会的每一个体都能从中获益。

为此，百度在今年5月就提出了“让智能体人人可用”的口号，以帮助更多人、更多企业打造出数百万“超级有用”的应用。为了兑现承诺，李彦宏在百度世界大会2024上带来了两大最新技术，并为接下来构建AI应用生态做准备。

人人都具备程序员能力

眼下，虽然依靠检索增强（RAG）技术，大模型在文本上的幻觉已经基本被解决，但以图像为代表的等多模态内容和RAG的结合还不够，导致图像幻觉问题依然存在。

李彦宏把AI的门槛打没了

而市面上完全基于大语言模型的文生图系统，生成的图片经常“一眼假”，甚至不合逻辑。比如某开源模型生成的北京天坛的照片，真正的天坛是3层建筑，却生成了4层。“这是文生图领域存在的典型幻觉现象，这种现象非常普遍，在很大程度上限制了多模态大模型的规模化应用。”李彦宏如是说。

基于大模型开发应用，消除幻觉是必须的。为了针对性地解决了图像幻觉问题，百度本次发布的iRAG（检索增强文生图）技术，是团队自研的一种结合检索和生成的技术方法，用以提升生成内容的可靠性和准确性。

有了百度搜索的亿级图片资源和基础模型能力，二者结合就可以生成各种超真实的图片。从实际体验来看，整体效果远远超过文生图原生系统，去掉了“机器味儿”。

比如我们让大模型生成一张爱因斯坦打麻将的图片：

李彦宏把AI的门槛打没了

再画一张马斯克和一只迅猛龙在后备箱里剥豆角的图片：

李彦宏把AI的门槛打没了

除了具备无幻觉、超真实的特点，iRAG给用户带来的低成本、立等可取的体验，使自身的商业价值得到了充分释放，使其能够满足影视作品、漫画作品、连续画本、海报制作等诸多领域的应用需求。

比如在品牌宣传场景，以前拍一组汽车在某场景的大片宣传海报动辄需要一二十万，甚至大几十万，现在有了iRAG，创作的成本接近于0。

在李彦宏看来，AI之所以被称为产业革命级的机会，就是因为它对于社会经济，带来了生产力的无限扩张。

黄仁勋在2024年世界政府峰会上被问及人们应该学习什么时，他回答，“因为我们的工作是创造计算技术，使得没有人需要传统意义上的‘编程’，让世界上的每个人都成为程序员。”

而在年初，李彦宏也预言“人人都是程序员”的时代将会到来。在百度世界2024上，他兑现了承诺，带来了重磅产品——秒哒。这款无代码工具被李彦宏自信地称为“迄今为止人类历史上最复杂的多智能体协作工具”。

秒哒由大模型和智能体组成，其具有无代码编程、多智能体协作和多工具调用三大特性，可以让用户在任意场景下创建各种应用，指挥多个智能体来协同完成任务。

李彦宏把AI的门槛打没了

有了这款无代码工具，用户通过自然语言交互，就可以完成一整套系统的搭建，从而具备了程序员的能力。未来，人们不需要去招募项目经理、设计人员、开发人员、测试人员等等，自己就可以。李彦宏表示：“只要有想法，你就可以心想事成，我们将迎来一个前所未有的只靠想法就能赚钱的时代。”

AI群星闪耀时

智能体，是贯穿整场大会的关键元素。作为内容、信息和服务的新载体，李彦宏判断：“智能体是AI应用的最主流形态，即将迎来爆发点。”

不过，智能体虽然已经受到越来越多的大模型公司及客户的关注，但尚未形成行业共识。像百度这样提前把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。

而李彦宏的底气显然来自于百度在大模型产业的落地规模。截至11月初，百度文心大模型的日均调用量已经超过15亿，相较一年前首次披露的5000万次，增长近30倍。

李彦宏把AI的门槛打没了

另据沙利文《2024年全球AI生态全景概览》报告，在全球AI生态全景中，百度与谷歌、OpenAI位于AI-Native Giant 同一象限。

李彦宏把AI的门槛打没了

Meta首席人工智能科学家、有“AI教父”之称的杨立昆（Yann LeCun）也曾在著作《科学之路》中赞扬“百度是最早部署商业化深度学习系统的大型公司之一，领先于谷歌和微软”。

尽管智能体降低了用户的操作门槛，但它的天花板又足够高，可以做出功能非常强大的应用。多个智能体的协作，还可以解决更加复杂的问题。

为了给行业做出更多智能体应用打样，在本次大会上，李彦宏展示了公司类智能体、角色智能体、工具类和行业智能体的实践案例。

其中，公司类智能体实际上是对企业传统官网进行的迭代升级。以比亚迪的智能体为例，不仅涵盖了公司介绍、产品图片和参数展示、线下门店位置等官网基本功能，还注入了主动推荐、及时响应、一对一服务等AI能力。比亚迪的官方智能体上线后，销售转化率提升119%。

比如，智能体可以准确理解并推荐“性能均衡”的车型，并展示产品图片：

李彦宏把AI的门槛打没了

还可以用表格形式对比多种车型的参数：

李彦宏把AI的门槛打没了

在工作生活中，或多或少都会遇到各类法律相关的问题，但不是每个人都能第一时间找到专业的律师来帮自己支招。这时，法律行业智能体“法行宝”派上了用场。

假设在发生了交通事故纠纷，法行宝给出了四个步骤的指导，先是保留相关证据，请求交管部门去调解，如果调解失败，可以再提起民事诉讼、申请法院的强制执行。

如果需要计算事故损失和赔偿金额，可以输入详细信息，法行宝的“赔偿计算器”就能帮你计算：

李彦宏把AI的门槛打没了

不仅如此，法行宝可以帮你写一封起诉状：

李彦宏把AI的门槛打没了

上线半年多以来，法行宝已累计回答用户1660万个法律问题，成为普通人的AI免费律师。

此外，百度文库与百度网盘联合发布了工具类智能体“自由画布”，让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材，迅速生成多模态内容。李彦宏称其为是“立即可用的现货”。它打通了公域与私域资料的限制，比如行业分析师可以使用它来撰写研究报告，文档、视频、音频等不限格式的文件都可以一键摘录到自由画布：

李彦宏把AI的门槛打没了