语音对话更加拟人化、用短视频回答生活话题、支持过百万字的长文本处理……2024年以来,国产智能助手不断有新星冉冉升起,既有产品也在迭代升级中。随着人工智能技术的不断发展和应用场景的不断拓展,智能助手能够更好地理解用户需求、提供更加精准的服务,人机交互体验越发友好。

不过,近日,AI搜索内容可能包含AI生成内容从而“无限套娃”的话题在社交平台引发关注。智能助手行业正步入一个快速而又复杂的发展阶段,面对机遇的同时也面临着诸多挑战。

AI搜索总结提升效率情感心理安慰更“暖心”

“我正在研究失业人员的心理健康问题,可以帮我集思广益研究问题吗?”博士生孙宇凡向智能助手提出问题后,它瞬间生成出100个研究问题,关键词包括经济环境、社会干预、疾病相关、健康与福祉等,不仅每一个提问方式都很学术、开脑洞,其后还附上了真实的学术参考文献,可以直接进行阅读及参考。

陶女士面对一份关于国产芯片的6万字的研报愁眉不展,100多页的ppt中包含大量的数据和信息,靠自己读不仅费时还容易遗漏。但有了智能助手这个过程简单多了:它会先泛读一遍,把关键信息提炼出来,然后可以选择进入深度阅读模式进一步精读,将关键数据、图表都整合好,并总结出几个关键问题和答案。此外,它还可以随时切换回原文进行对照,遇到难以理解的专业术语也能在线搜索查询,遇到英文内容直接翻译。

“我失恋了,能安慰一下我吗?”在一位科技博主的测评中,面对来自人类的这一提问和要求,智能助手kimi给予了情感方面的安慰,除了建议多和朋友在一起、投身新的爱好之外,也建议寻求专业的心理咨询师;通义、腾讯元宝的回复口吻稍显理性,会将建议按次序罗列整理好;讯飞星火、豆包则更加感性,语气像是一位朋友,会说出类似“抱抱你”的话语。

理解并执行任务国产智能助手不断进化

智能助手在年轻人的生活、学习、工作场景中的应用已经非常普遍。这些助手通过自然语言处理、机器学习和数据分析等技术,能够理解和响应使用者的语音、文字或其他形式的输入,执行各种任务,从而提升用户的生活和工作效率。

智能助手的历史可以追溯到上世纪60年代,科学家们开始对人机对话进行初步探索,ELIZA作为首个聊天机器人问世。进入21世纪,随着移动互联网的普及和AI技术的不断突破,智能助手迎来了快速发展的黄金时期。2011年,苹果Siri的推出,开创了智能语音助手的先河,随后谷歌助手、小爱同学等语音助手产品相继问世,它们通过语音交互的方式,为用户提供了便捷的日常事务管理、信息查询和设备控制服务。

随着深度学习等AI技术的不断成熟,智能助手的能力也得到了显著提升。“进化”后的通用型智能助手,不仅能够理解更复杂的语境、提供更准确的回答,还能根据用户的个性化需求提供定制化服务。国内通用型智能助手如Kimi、豆包AI、讯飞星火、文心一言、通义、天工AI等,更是以其广泛的能力和复杂任务处理能力,成为了用户工作和生活中的得力助手。这些智能助手能够进行自然语言理解、内容生成、数据分析等任务,在医疗、教育、金融等多个领域发挥重要作用。

此外,全球知名度极高的chatGPT在语言多领域的知识问答和创作上表现突出,能处理多种复杂的外语语法和语义情况,其算法的先进性使得它在处理复杂逻辑和多轮对话时拥有优势。但其对于中国本土的一些特定文化元素、地域特色内容理解方面稍显不足,存在偏差。并且受到国外数据存储等相关政策的影响,可能存在数据隐私方面的风险,一些注重数据安全的中国用户对此有所顾虑。

机遇与挑战并存生成内容“无限套娃”亟待解决

当前,智能助手行业正步入一个快速而又复杂的发展阶段,同质化现象日益凸显。为在激烈的市场竞争中脱颖而出,各企业纷纷采取策略,构建智能综合体,旨在全面覆盖用户的多样化需求与使用场景,力求打造独一无二的一站式智能体验。

量子位智库发布的《AI智能助手产品分析报告》显示,当前,智能助手的功能场景日益丰富,从教育、医疗到企业服务、个人助理等多个领域均有涉猎,功能上也涵盖了文档速读、重点抓取、搜索能力、脱机推理、图像生成等多个方面。此外,智能助手还支持个性化定制,允许用户根据自己的需求调整助手的功能和行为,进一步提升了使用体验。

在基本日常对话问答方面,智能助手已经实现了流畅自然的对话体验,能够精准有效地回答用户的问题。联网搜索功能的加入保证了智能助手在回答问题时的准确性和可信度。然而,在文档速读和图片生成等高级功能方面,智能助手仍存在一定的不足。尽管大多数智能助手已经能够实现快速阅读文档并给出重点或总结,但在信息整理的颗粒度上仍显不足,多数只能给出较为宽泛的重点。而在图片生成方面,大部分软件虽然能够生成图片,但在实用性和好用性上仍有待提升。

推理问题一直是智能助手的难点之一。尽管大部分软件已经能够解决简单的推理问题,但在面对中高难度的推理问题时仍需用户引导或难以保证准确率和稳定性。这反映出智能助手在复杂问题处理能力上仍有待加强。

人工智能将生成的内容变成静态网页后被搜索引擎收录,是否会发生“无限套娃”?近日,社交平台上这一讨论引发关注。大模型需要通过搜索去寻找信息源佐证自己回答内容的真实性,但如果信息源本身也是人工智能自动化生产的,不确定是否可靠的内容被不断引用,毫无疑问会产生极为严重的后果,需要人们警醒并防范。

特定领域有望达到专家水平当前主要服务18至40岁人群

随着技术的不断进步和应用的深化,未来,智能助手将在多个维度上实现飞跃式的发展。

《AI智能助手产品分析报告》分析认为,首先,模型性能将具备更高级的自然语言处理以及情感识别,具备高级推理以及真正的类人认知学习能力。并且可通过区块链等加密技术实现大模型时代数据隐私的安全。

在未来5到10年内,智能助手将进一步提升其对话能力,实现多种语言甚至方言的无缝切换。同时,多模态跨模态能力的提升将使智能助手能够处理更多类型的信息输入,如图像、音频、视频等,提升其综合服务能力。在情感识别方面,智能助手将能够更加准确地理解用户的情绪状态,提供更加贴心和个性化的服务。此外,逻辑能力的提升将使智能助手能够支持创意问题的解决,为用户提供更多创新性的建议。在特定领域,如医疗、法律等,智能助手将实现更高的准确率,达到专家级建议水平。

随着技术的进一步成熟,未来10到20年内,智能助手或将逐渐具备一定的自主决策能力,例如根据实时数据和变化自动调整决策,从而提升工作和生活中的自动化程度。同时,生态集成的实现将使智能助手全面接入生活及工作场景,不同设备和平台之间的无缝集成将为人们带来更加统一和便捷的体验。不同的智能助手之间能够相互协作,共同完成任务,提升整体效率。

智能助手还有哪些潜力市场?目前智能助手主要服务于18至40岁之间的学生和工作人员群体,但未来中老年市场可能成为新的增长点。此外,在特殊群体应用中,智能助手将开发语音触觉交互或手语识别等功能,提高残障人士的生活便利程度;在办公场景中,智能助手可协助进行复杂的项目管理和行业数据分析等工作;在生活出行中,智能助手可结合实时交通信息提供行程规划和驾驶建议等服务;在B端市场中,将为企业级用户提供供应链管理、库存优化和物流规划等垂直服务;在生物融合领域,智能助手将与人体生物传感器结合提供健康管理和检测等服务;在情绪感知方面,智能助手还可提供心理健康的支持和干预服务等。

文/本报记者陈斯