AI时代，最原生的创作工具长什么样？--知闻楼

AI时代，最原生的创作工具长什么样？

题图｜视觉中国

人人都是内容创作者。无论是你打工要汇报PPT，还是上学要撰写文章，都需要经历“内容生产”环节。

随着人工智能技术的发展，内容创作领域正经历一场革命，AI工具可以很大程度上帮我们设计PPT、生成专业长文。

但仔细一想，现有的AI工具似乎陷入“帮了，但没完全帮”的困境。

专业工具功能强大，但往往因为较为复杂，生成过程对指令技巧要求较高，对用户来讲学习成本和门槛也比较高；而集合类AI工具操作简单，但其功能不够精细，产出的内容大都是无效、泛泛而谈的，缺乏个性化、定制化的内容。举个例子，如果现在让手机里的AI助手生产出一篇结构完整、资料详实的专业报告。试过的都知道，可谓是异想天开了。

这也造成了在AI时代，不少内容创作者，看似工具多多，但似乎挑不到一件趁手的。

百度文库尝试给出了解法。在刚刚过去的2024虎嗅F&M创新节上，百度文库AI产品负责人钟昊介绍了百度文库重构为“一站式AI内容获取和创作平台”后的全新进展。

AI时代，最原生的创作工具长什么样？

在钟昊看来，理想的内容生产创作有三大特征：端到端交付、纯自然交互和全模态支持。具体到操作层面，就是能在一个平台上生产完整的内容、用户用最自然的交互即可实现编辑意图（无需学习复杂的操作）、支持对不同模态素材的加工创作。

而理想的内容生产创作，应该如何落地实现？AI时代，百度又是如何打造爆款内容生产力工具的？钟昊也给出了一一解答。

“进击”的百度文库

在大模型最初火热之时，百度创始人李彦宏就说要用大模型把所有应用重做一遍。而重构的技术基础就是文心大模型。

而在内容生产创作领域，大模型的AI能力主要体现在两部分，一是跨模态AI生成能力，它让不同格式的处理和转换畅通无阻；二是全场景智能交互能力，它让AI能够理解用户的指令，并实现自然的交互。

早在2023年3月份，百度文库团队就开始投入重构。作为一个15年历史的产品，百度文库拥有14亿的文档资源，是内容创作的宝贵原料，而光有内容还不够，百度文库希望让用户可以实现一站式的内容获取、生产、编辑全流程贯通。

所以，从2023年5月份开始，百度文库开始进行融合编辑器的建设。而融合编辑器要给用户带来自由的感受，意味着其必须是跨模态（在计算机与人工智能领域，“模态”可以大致理解为“数据类型”）的。

“专业的编辑器功能很多，但其中可能有80%-90%日常都用不到。用户一旦要用到，还要现学，学习成本太高了。我们希望能让大模型直接能听懂我们想要什么。”钟昊说。

比如，如何让产品更好地理解用户的指令？如果用户对生成结果不满意，能不能局部修改？怎么让用户体验更丝滑？文库团队希望能给用户创造更大的自由度。

所以，文库团队在模态融合、前端交互和自然语言处理上下了大量功夫。比如在自然语言处理上，团队不断进行用户调研，聆听用户对市面上Chatbot（聊天机器人）使用难点的反馈，并基于此不断优化，让用户无需学习复杂的操作，无需操作层层叠叠的按钮和界面，就能自然实现自己的编辑意图。

经过持续打磨、拓展和细化，百度文库的全模态AI能力矩阵进行了全面的进化升级，实现了更多、更全面场景的覆盖。尤其是在智能PPT、智能文档、行业研究报告、AI全网搜索、智能有声画本、智能小说、智能漫画、拍图生文等核心能力上持续优化，涵盖学习办公、家庭教育、兼职赚钱多场景。

AI时代，最原生的创作工具长什么样？

百度文库全模态AI能力矩阵

比如，在学习办公场景下，百度文库的专业搜索功能在提供优质信息外，还能将搜索的信息以结构化的、图表的形式呈现出来。例如针对“小球藻CGF活性因子提取方法”的专业内容搜索，文库能够提供详细的实验方法、流程描述以及相应的注意事项，并且还会将提取方法中的每个步骤详细拆解，生成直观的流程图。

并且，与其他搜索工具相比，百度文库的AI搜索引用源更加丰富，一方面参考了全网的海量信息，另一方面还充分引用了文库中多达14亿的专业内容文档，同时也涵盖了百度学术的相关内容。

“扎实且全面的知识库，对攻克大模型“幻觉”问题很有帮助。”钟昊介绍道。大模型存在一个普遍问题——会产生 “幻觉”，也就是生成的内容可能存在不符合事实的情况。而百度文库在近一年的AI重构过程里，始终聚焦该问题。

百度文库的另外一个明星AI功能就是智能PPT，一经推出就很受欢迎，迅速占领了智能PPT领域的市场，目前，其市场占有率已经达到80%，稳居第一。在其他公司只能生成PPT大纲或草稿时，百度文库就已经可以通过一句话主题、上传文档、上传草稿等多种形式，生成图文内容丰富、结构完整、版式布局专业精美、直接可用的PPT，还能让用户上传自己的模版，模型理解后生成PPT，大大节省了用户在PPT排版和美化上花费的时间。

在家庭教育场景，百度文库推出了“智能画本”功能，让家长可以制作画本给小朋友阅读。孩子不认真写作业怎么办？智能画本就会生成一个寓教于乐的画本大纲，再根据大纲生成配有多种声音可选择的画本视频，还将支持用户自定义自己的声音。同时，家长甚至可以通过上传照片，定制以孩子形象为主角的画本，孩子看到自己成了画本故事里的主角，代入感也会更强。这个功能在推出之后，非常受家长们的欢迎。

在兼职赚钱场景，百度文库通过智能漫画、智能小说等跨模态AI创作功能，帮助人们更容易地将创作内容商业变现。AI拍图生文功能则能够满足用户在小红书、闲鱼等平台的推广文案创作需求，为兼职创作者提供一站式创作支持。

同时，在专业创作领域，百度文库推出了全新的AI Native产品“橙篇”，是行业内首个集专业知识检索与问答、超长图文理解与生成、深度编辑和整理的一站式AI自由创作平台。

橙篇最大的亮点就是长文写作功能。背靠百度文库、百度学术以及全网数十亿的专业信息和资料，橙篇在生成长文时能提供专业、权威、准确的知识依据，而且在专业长文生成和自由编辑方面，橙篇也都走在行业前列。

目前，百度文库的AI MAU（月活跃用户）已突破7000万，达到国内第一梯队。在大模型重构以来，百度文库已然从一个文档共享平台成功进化为 “一站式AI内容获取和创作平台”。截至2024年10月，百度文库AI用户数累计超过2.3亿，AI功能累计使用次数超过28亿。

“自由”的创作工具

在重构一年多以来，百度文库团队也一直在思考，如何打造一款高自由度、集成化的工具，能够破除跨平台、跨格式的限制，让用户实现更加低门槛、随心所欲的创作。

大会上，钟昊向观众介绍了“自由画布”，这是百度文库和百度网盘联手推出的AI创作新物种，并即将全面开启公测。

在自由画布诞生之初，文库团队就定下了这款产品的底色：自由。百度文库一站式的产品定位，以及融合编辑器的持续迭代，成为“自由画布”诞生的土壤。

对于自由画布的核心竞争力，文库团队给出的答案就是：“多格式、全模态”，并且贯穿在内容生产到消费的每一个环节。

比如以前，用户日常接触到的格式多达100多种，让产品能识别、理解、并展示市面上全格式的内容，并不是件容易的事。比如，用户写文章要用Word，编辑图片要用Photoshop，做PPT要用PowerPoint，处理不同格式的文件时，还要在不同平台不停地切换、跳转，繁琐且耗时。

但自由画布做到了。“我们需要一款工具，能像我们的大脑一样，可以处理全模态的信息。画布里面的格式、模态和编辑器都是充分自由的，无论是Word、PPT还是音频、视频都能拖入画布，这样边界就不存在了，自由画布都能识别、处理。”钟昊说。

在自由画布上，融合编辑器的能力也得到了飞跃，易用性大大提升：用户通过“一拖一圈”，就能实现对内容的整体或局部调用；使用最简单的交互，就能“指哪改哪”，让自由画布去做局部内容的修改，无需亲自修改编辑和排版。

以前段时间火热的山西旅游为例，在创作山西大同相关内容时候，用户可以将有关大同的音频、图片、视频等素材导入自由画布，进行后续的AI创作。用户可以标记这些素材里的重点部分并决定使用方式，通过直接圈选、输入指令等，即可生成大同攻略海报、小红书文案等不同格式的内容。在此基础上，用户可以进一步实现格式的流转，还能进行一键链接分享，或者直接存储到百度网盘。

AI时代，最原生的创作工具长什么样？

操作极简、高度自由、功能强大，自由画布做到了“工具是为人服务的”，也真正满足了端到端交付、纯自然交互和全模态支持的特征。

下一步去哪？

自由画布，凸显出百度文库强大的AI能力，也透露出百度文库和百度网盘借助AI能力进一步打通、重构的可能性。

作为“AI创作新物种”，自由画布可以说是百度文库和百度网盘融合的“第一步”。作为两个国民级的应用，一个有着大量的公域资料（百度文库的14亿在线文档），一个有着大量的私域素材（用户个人授权的网盘存储内容），打破了私域与公域资料的界限，创作将更自由、更个性化，让两个十余年的老牌产品，蜕变成智能生产力的代表。

在未来，大模型还能给这两个产品的融合带来哪些可能性？

比如，是否能够整合更多的媒介形式，例如3D模型和虚拟现实（VR）？能否进一步发掘和利用个人授权的可分享内容，进而生成更加个性化的学习方案？大模型技术是否能够提供更高级的自然语言处理功能，比如自动校对、文风一致性检查，以及在用户写作时提供词汇和句式建议？

百度文库和百度网盘的融合将走向何处？答案或许逐渐清晰。

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com