作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com
自ChatGPT横空出世以来,大模型技术如同一股旋风席卷全球科技界。我们亲眼见证了这场革命性变革的演进,从2023年上半年开始,企业和开发者们争相囤积算力、训练模型,掀起了一股“大模型军备竞赛”。而随着时间推移,市场逐渐冷静,进入了更为理性的探索阶段。2023年下半年开始,从“千模大战”到大模型价格战,一定程度上也促进了大模型的落地,更多的企业开始将目光投向实际应用,试图将大模型技术与自身业务相结合。
反映到云市场上,百度智能云事业群总裁沈抖在近期提供了一个观察:“今天跟大家聊的时候是大家出钱要把它用起来,而不只是看热闹、凑热闹。”一个体现是今年大模型招标的规模比去年大了很多。沈抖的判断是但凡人能参与的地方,大模型都会在将来深入地去应用。
“企业真正把大模型用起来的决心和可能比以前是变大了。”
从这种由FOMO引发的跟风热炒,到关注真实价值、深耕应用之间的转变,预示着AI大模型正在进入一个新的发展阶段,产业落地成为新的关键词。
大模型落地,首先要思考的一个问题是什么样的场景才能创造价值。智能手机作为个人计算设备,具备广泛的用户基数,是AI和大模型技术理想的落地平台之一。同时,智能手机也是消费者日常生活中最常用的设备,使得AI技术能够无缝融入用户体验中,推动其快速普及。
终端设备厂商已经意识到,AI在提升用户体验上蕴藏着巨大的潜力。然而,开发和维护一个高质量的大模型,就像是从地基开始修建一座复杂的智能大厦,既需要巨大的资源投入,又需要高度专业化的技术储备。
对于大多数终端企业来说,从零开始构建自己的AI系统无异于“重新发明轮子”,因此,选择那些在AI领域已经积累深厚的技术伙伴进行合作,无疑是更明智的策略。这不仅能够节省时间和成本,还能让终端企业专注于自己的硬件优势和用户需求,正如拼图中的两块互补的部分,协同合作才能共同打造出更完美的全景图。
1
把大模型装进手机
在百度云智大会上,三星电子大中华区总裁崔胜植分享了三星如何与百度智能云共同探索大模型在智能终端上的深度应用。
他表示,2024年初,三星在全球市场推出Galaxy AI,并与百度智能云达成战略合作,基于千帆平台、百度识图为中国用户带来创新的Galaxy AI本地化功能,包括即圈即搜、笔记助手、转录助手、聊天助手、浏览助手等移动AI体验。
这次合作也反映了百度智能云在AI生态构建方面的战略布局。百度智能云通过与三星等全球领先的智能终端企业合作,让AI技术触达消费者日常生活的最前沿,这种合作模式就像是行业的“英特尔inside”战略,让AI能力成为智能终端的“大脑”。
蔚来汽车数字座舱人工智能研发负责人,高级总监 高杰
1
不只是语音助手,更是AI伙伴
作为智能电动汽车领域的领军企业,蔚来汽车座舱人工智能研发负责人高杰在百度云智大会上分享了在智能座舱领域的最新进展,特别是在大模型应用方面的创新。
智能座舱不仅是一个技术平台,更是“移动的生活空间”,关于智能座舱与大模型技术的结合,他指出其核心价值在于“交互效率、使用价值和情感价值”。
蔚来携手千帆平台,接入千帆API,调用文心大模型共同研发NOMI GPT的问答功能,打造了端云多模态大模型,让NOMI能够更加自然地与用户互动,成为一个更懂用户、更聪明的座舱AI伙伴。
关于蔚来的人工智能助手NOMI,高杰解释道:
我们没有把它当语音助手,而是人工智能的伙伴。
高杰分享了NOMI的发展历程,从最初的上车打招呼、自定义唤醒词,到后来的灵动音色、儿童专属体验等。随着大模型技术的出现,NOMI的能力得到了进一步提升。
他给出了NOMI新一代的人工智能技术框架,包括原生多模态感知、以大模型为主体的决策引擎,以及执行部分。高杰介绍:
我们认为在汽车里,一个无处不在、24小时可用、不需要被唤醒的原生多模态大模型,能够服务于所有人的有情感的人机交互框架,一定是下一步。
在具体的大模型应用方面,蔚来推出了多个创新功能:
一句话多指令:利用大模型提升指令理解能力。
生成式交互框架:支持文本、声音、图片和视频的动态生成。
多智能体框架:支持多个智能体之间的相互通信和协作。
知识类智能体:与百度合作搭建问答系统,支持车辆相关和开放域问题。
生成类智能体:可以生成表情、氛围灯效果等。
任务型智能体:如“守卫Agent”,可以监控车辆周围环境。
高杰还特别强调了情感部分的重要性:
最重要的就是NOMI懂你。情境的感知,对你的人、车、环境,你的世界知识,拿到这些知识以后再进行一些总结和计算,生成一个具体的场景。
通过这些创新,NOMI的用户满意度显著提升:
NOMI成功的成为公司购车最重要的因素。如果进行调研的话,今天大家会觉得最重要的就是车的造型,舒适度,彩电、冰箱和大沙发等等,智驾是核心的因素。有了大模型加持,它已经飞速挤到购车因素最重要的点。
这些进展表明,随着大模型技术的应用,智能座舱正在成为汽车行业的新焦点,为用户带来更加个性化、智能化的驾驶体验。
在相关方案中,与百度智能云与蔚来的合作也成为关键:
借助百度文心大模型提升开放域问答交互体验;
通过端云多模态大模型实现座舱场景创新;
持续进行联合技术研讨,扩大合作范围,共创更多场景和应用。
1
智驾背后的大算力支撑
作为国内汽车行业的领军企业之一,长安汽车在智能化转型道路上取得了显著进展,特别是在自动驾驶研发方面。长安的智能驾驶系统基于视觉、激光和融合感知算法,辅以AI预测和控制算法,希望为用户带来更安全、更人性化的驾驶体验。
而智驾的研发,自然离不开算力基础设施建设。具体来看,百舸平台为长安提供了AI容器、并行文件存储、AI训练加速套件等整套自动驾驶训练最佳实践方案,实现GPU资源的精细化管理与调度。双方还在数据加载、计算效率、通信方式等维度进行优化,使得算力总体平均使用率提升到了90%以上,综合资源利用率提升了50%,相同资源条件下,单个模型的训练效率最多提效达到了30%。
云智大会上重庆长安汽车股份有限公司执行副总裁张晓宇表示:
“我们将与以百度为代表的行业领军AI企业通力合作,积极拥抱大模型对汽车产品智能体验和企业生产力效率提升的历史机遇,用大数据+大模型+大算力的AI技术促进公司向智能低碳出行科技公司转型,最终实现引领汽车文明,造福人类生活的使命愿景。”
1
电力央企如何把大模型用起来?
随着今年年初国家首次将“开展‘人工智能+’行动”写入政府工作报告,加快布局人工智能等战略成为国资央企的重点工作。
作为电力领域的创新者,南方电网数字电网研究院股份有限公司党委委员、副总经理胡荣在云智大会上介绍了行业面临的机遇和挑战,以及南方电网的一系列战略举措。
胡荣表示,去年九月,南方电网发布了行业垂直领域首个自主可控的大模型“大瓦特”。
“大瓦特”模型体系由大模型、小模型及智能体三大核心组件构成,划分为基础级(L0)、业务领域级(L1)和场景级(L2)三个层次,覆盖了语言、视觉、预测、多模态和科学计算等五大基础能力,广泛应用于输配电、调度、安监、供应链、营销等专业领域,实现对电网运行、客户服务、企业经营管理和产业创新发展的全息感知、态势判断、趋势预测和智能优化。
“大瓦特”既是大模型、小模型及智能体构成的模型体系,也是开放共享的平台与生态体系。平台上,南方电网基于百度智能云千帆平台构建了电力调度值班助手。在应对突发事件时,电力调度值班助手可以秒级生成处置方案,极大地增强了调度员的应急响应能力。
1
视频大模型也要摆上“货架”
作为AI视频生成领域的创新者,生数科技联合创始人兼CEO唐家渝在百度智能云大会上阐述了视频大模型的最新进展。
如何高效、大规模地生产高质量视频内容一直是个难题,生数科技的Vidu是全球首个突破长时长、高一致性、高动态性的视频大模型,采用自主研发的U-VIT架构。
据他介绍,实际情况中,训练如此复杂的视频大模型需要投入巨大的算力资源和技术支持。与此同时,高度个性化、自动化的视频内容创作能力已成为企业和创造者越来越渴求的能力。
生数科技面临着这样一个问题:
传统方法难以满足需求,亟需创新的技术支持,如何构建稳定的超大算力集群,确保模型训练和推理的高效进行?
突破口是:生数选择了与百度百舸AI异构计算平台深度合作。
据唐家渝介绍,生数科技选择与百度智能云展开战略合作,取得了显著成效:
百舸强大的平台调度和机器管理的能力,包括高性能算力集群的任务分发、队列调度和训练加速的功能,显著提升了Vidu的训练效率,并且在少数的异常事件发生的时候,能够做迅速的响应和恢复,大大缩短了整个模型的研发的周期。
此外,Vidu还成为百度智能云千帆大模型平台接入的首个视频大模型。企业用户可直接在千帆平台通过Vidu API体验全球领先的视频生成能力,在多个行业场景中开始落地应用。不仅获得了算力和技术支持,还能借助百度智能云的平台优势进一步探索商业化。
Vidu上线以来已经收到了海内外数万家企业用户的接入申请,因此,开放API也是Vidu进一步商业化布局的重要一环。
唐家渝也表示,未来生数科技将与百度智能云紧密合作,在泛娱乐、广告、影视、动漫、游戏等多个行业场景中加速落地,共同探索视频大模型的边界。
1
“卷”出新的可能性,我们需要更多的“梯子”
吴晓波在百度云智大会上的分享中提到他多年来走访了上千家工厂,观察到中国在智能制造领域的领先地位。他特别指出中国拥有全球最多的制造产能和灯塔工厂,这印证了中国强大的制造业基础和在产业智能化方面的实践。
中国是全球最激进的产业智能化实验场,这一点没有错。
通过对比了五六年前和现在企业对产业智能化的态度变化,企业对人工智能的接受度和应用速度也远超预期,这种变化反映了企业主动性的增强。
人工智能在传统制造业和传统服务业的渗透速度,会远远大于过去十年产业智能化在制造业和服务业的渗透的速度。
这背后离不开云计算平台提供的基础设施,充当弥合AI技术与真实价值之间距离的“梯子”。
向下渗透层面,这样的“梯子”让AI不再是科技巨头的专利。从科技行业到传统行业,从中小企业到央国企,云计算平台促进了AI技术的普惠,这种普及化趋势,正在为整个经济生态注入新的活力;
向上升级层面,这样的“梯子”让AI应用正从单点突破走向系统性应用。领先企业不再满足于在个别环节应用AI,而是追求全流程的智能化升级,涵盖从产品设计到客户服务的各个方面。通过提供全方位的AI赋能,最终提升企业核心竞争力,推动商业模式创新:
让我们很多非常卷的行业,已经不是红海,可能是血海的行业,能够卷出一个新的可能性。
在这次大会上,百度智能云也进一步对包括底层基础设施到上层应用的全栈式解决方案进行了升级。百舸4.0用一云多芯解决算力卡脖子的问题,已经具备了成熟的十万卡集群部署和管理能力。
千帆3.0则升级了三大服务,覆盖企业客户模型调用、模型开发和应用开发全流程:
模型调用上,企业和个人开发者可通过API直接调用文心大模型,还支持近百个国内外大模型、语音、视觉等各种传统小模型。
模型开发上,千帆大模型平台,提供最完善的大模型工具链,支持CV、NLP、语音等传统模型的开发,支持将应用中产生的数据反馈给模型,持续优化模型效果,实现企业的数据飞轮。
应用开发上,全新推出了企业级RAG方案,从检索效果、性能、扩展性、灵活性四方面全面升级;企业级Agent开发支持,提供业务自主编排、人工编排、知识注入、记忆能力等80多个官方组件;AI速搭平台。通过自然语言对话就能进行企业级应用开发,一句话即可生成应用;
根据官方的数据,百度智能云千帆平台上文心大模型日均调用量已超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。在百度云智大会的主论坛以及分论坛的企业分享中,我们也看到其中很多企业在AI转型升级都借助了千帆平台这把“梯子”。
其实无论是终端厂商还是央国企,这些企业对大模型每一次尝试和验证背后都是一个故事,但整个故事还远没有讲到结尾的时候,AI大模型正在润物细无声的向更多行业进行更加深入的渗透。
正如约瑟夫·克鲁奇所说,技术让庞大人口诞生成为可能,而庞大的人口则让技术变得不可或缺。我们有理由相信,当企业和个体都能驾驭新技术的力量时,人类社会将迎来一次前所未有的蜕变。
从这个意义上讲,我们需要更多千帆这样的“梯子”,不仅仅是为企业和开发者,也是为每一个人。