本报记者 李昆昆 李正豪 北京报道
10月22日,高通在骁龙峰会期间宣布与腾讯混元合作,基于骁龙8至尊版移动平台推动腾讯混元大模型7B和3B版本的终端侧部署。高通方面表示,通过使用INT4量化技术,端侧推理实现首个token(文本中最小的语义单元)生成时延达到150ms,解码速率达到超过30tokens/秒。
过去一段时间,国内各领域公司推出了一系列大模型产品,“百模大战”打响,如今,一年多时间过去,国内大模型发展得究竟如何了?面临哪些现实的问题和挑战?未来又会朝着怎样方向发展?这些成为业内热议的话题。
艾媒咨询CEO张毅接受《中国经营报》记者采访时表示:“目前国内大模型方面遇到一些瓶颈或者问题,首先,也是最大的问题,还是创新性不足,也就是大家经常讲的原创性算法模型不足,尤其在产品模型、产品模式,以及相关的算法会参考国外的比较多一些。”
国内大模型发展瓶颈
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。
据介绍,腾讯已经构建起了全链路的大模型产品矩阵,包括底层基础设施、帮助企业训练专属模型的TI平台和行业大模型解决方案,自研的混元大模型,构建应用的平台工具,以及基于大模型的各类智能应用。
而2024年至今,字节跳动在国内外推出包括“豆包”在内的20余款APP,从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到教育、办公助手、开发平台、代码生成等行业,而且这些应用的表现亮眼,一个个在AI应用大乱斗里杀出重围。
据了解,今年3月“豆包”的下载量和月活跃用户开始双双登顶。而硅谷风头机构a16z发布的全球Top 100AI应用榜单显示,字节跳动系的Cici、Coze、Gauth、Hypic、CapCut五款产品名列前茅。与此同时,字节跳动依然不断在海外推出新的产品进行试点。
速途研究院院长丁道师告诉本报记者:“我觉得国内的大模型发展一点都不慢,以百度、阿里巴巴、腾讯、华为、科大讯飞为代表的企业所推出的大模型,和美国的GPT最新版本的性能,我认为距离越来越近了,尤其是在中文的语境环境下,已经实现了全面超越。当然现在还有所差距,但也在努力追赶。并且中国有超大的市场规模和超大的应用场景,这是其他国家无法媲美的。所以在这一块,虽然有些人很悲观,认为差距会越来越大,但我认为差距只会缩小,甚至中国企业有望实现赶超。”
“我作为一个创作者已经大量地使用国内的各大模型,已经在多个环节下,可以做到越来越媲美或者辅助真人的能力。比如我昨天做了一个视频号,他是由我的一个数字人形式呈现的,背后的技术我不懂,但这个技术所呈现出来的产品效果,已经能够让人傻傻分不清(真人和数字人)了。这是我朋友的一家公司做的产品。我周围都没有人认为这是一个数字人,那不就说明国内在这个领域取得了积极的进展嘛。”丁道师说。
张毅认为,目前国内大模型的发展瓶颈还是,训练不足和缺乏高质量的训练,这也会限制大模型的训练效果。另外,从全国范围来看,特别优秀的爆款大模型应用相对会少一些,尤其缺乏好的应用场景,对于大模型的商业模式落地会有一定的短板和影响。还有一个,算力瓶颈可能会有一定的限制,尤其是面对指数级的用户增长,训练所需要的高性能AI芯片还存在一定的限制。
未来如何发展?
今年视频生成模型很火。根据公开资料,目前主流视频模型称能力散落在了各个模型里,比如视频编辑、运动笔刷、端到端视频生成等,也有在Github上评分较高的开源模型,显示测试效果比已在国内发布的PixelsDance要更好。
比如MagicVideo的V2版本是目前开发者评价字节跳动旗下最可用的一款文生视频模型,V2版本采用了模块化式生产流程,第一模块从文本到图像、第二模块从图像到视频生产关键帧、第三模块从视频到视频扩展、第四模块视频帧插值,能实现平滑过渡。目前整体的生成效果、色彩和审美高于Pika1.0和Gen2.0。
有算法工程师就分析道:“如果几个模型的能力加起来,其实会比现在公开发布的版本更好,至少能达到可灵的效果,但是现在发布版本比较一般,可能也是内部赛马资源没有谈妥的结果。”
谈及对大模型未来的看法,丁道师认为,未来不要都卷大模型,可以卷场景、卷应用,让大模型具体服务到360个行业,这才是真正应该发力的方向。
“举个很简单的例子,比如我们要搞科研研发,实验几十、几百种材料,这些材料都很昂贵。如果你在现实的环境中去实验的话,第一成本很高,第二很浪费时间,如果在虚拟的人工智能空间里进行实验的话,是不是效率就会高很多呢?比如今年我国的高阶辅助驾驶发展越来越快,尤其是以华为、理想为代表的企业正在大规模落地这种端到端的智能驾驶能力,最终怎么来实现?其实就是通过大模型的人工智能训练,缩短时间,使得这项技术可以加速落地。”丁道师说。
张毅则认为,未来趋势可以分为技术和商业两个方面,在技术方面,通用和垂直可能会是两个发力的方向,同时也能区分不同的大模型品牌。其次是云端,云侧和端侧二者相结合,会形成满足不同用户需求的技术路线。从产品技术方面来说,未来的大模型在多模态能力和处理理解多种类型的数据需求方面,应该是一个产品的路径方向。
张毅说:“从商业角度来看,第一,开源模型有望爆发,有点像今天我们看到的谷歌、百度搜索一样,全球AI大模型开源趋势目前非常明显。第二,小模型解决专业化问题和覆盖更多的终端设备,这可能也会形成新的独特的商业逻辑和商业模式。第三,单位型产品和大模型企业,会更像一个平台型企业,提供大家对知识需求的解决能力,从而在其他地方,形成众多的用户聚集,通过其他的变现形式,来实现商业模式和资本价值的变现。”
(编辑:吴清 审核:李正豪 校对:颜京宁)