本报(chinatimes.net.cn)记者周南 北京报道
11月27日下午,《华夏时报》记者通过微信联系到王玮时,她刚从合肥落地深圳不久,正忙于出差。临近年底,活动繁多,王玮是科大讯飞副总裁、安徽听见科技有限公司总经理,难逃忙碌。
28日下午,工作结束后的王玮将朋友圈定位在深圳宝安机场,准备飞离。人在深圳,朋友圈的内容却与当天远在北京举行的“WISE2024 商业大会”相关:图片中,参会嘉宾正就大会主题“Hard But Right Thing(正确的事)”发表讲话,后方的LED大屏底部是一排中英双语字幕——那是讯飞同传正在助力大会无障碍交流的印证。“#正确的事 让有价值的思想,无障碍地传播!”王玮如此配文。
几个小时后,晚间23:40,落地合肥后的王玮又给记者发来大段信息,回复采访事宜。
“我认为科技发展的意义是为不能作战的人而战”“技术的发展,始终需要落脚到我们每个人身上”“科大讯飞的核心技术是语音识别和语音合成”……夜色并未消磨王玮的激情和理性。
在人工智能领域工作23年,从技术走向产品,再从市场的第一次尝试到涉足公益,如何找到技术创新、社会效益与商业可持续发展的平衡点,如何看待AI在无障碍技术领域的未解难题……在这场“隔空对话”中,她向《华夏时报》记者讲述了科大讯飞的公益战略和自己的公益体悟——做正确的事,为不能作战的人而战,这是科技应有的温度。
科技发展的落脚点是“人”
“科技发展的意义是为不能作战的人而战”——这是科大讯飞在公益领域整体战略的起点,也是王玮在公益中的体悟和坚持。
2015年讯飞听见录音转文字网站正式上线之前,王玮一直专注于技术工作。同年,科大讯飞正式发布了一款语音转写的产品叫作“讯飞听见智能会议系统”,这是王玮从技术走向产品再到市场的第一次尝试。在与用户长期打交道的过程中,她注意到了其中的听障群体。
“听障群体对语音识别和转写技术的需求度很高。在中国注册的听障人士有2000多万,还有1亿—2亿的弱听人群,这是一个非常大的数字。”王玮和团队开始思考,怎样能为听障群体做更多事。
2019年5月19日第29个全国助残日,科大讯飞联合中国聋协、中国残疾人艺术团,发起“听见AI的声音”公益项目。由讯飞听见作为承办方,通过科大讯飞核心的人工智能语音识别技术把语音转化成文字,变听为看、看听结合,让听障人士通过文字感受世界、与人交流、顺利完成工作,建立起与听障人士沟通的桥梁。
王玮(前排左一)作为公益活动联合发起人之一,与中国残疾人艺术团团长邰丽华(前排中)等人用实际行动助力公益
王玮作为公益活动联合发起人之一,经由项目与更多听障人士有了交流。她向记者回忆称,2022年,团队组织拍摄过一部用户故事短片《除了听,我们什么都可以!》,自己对其中的聋人律师谭婷印象尤为深刻。
谭婷来自四川大凉山,前后参加过三次法律资格考试:2018年首次踏入律考;2019年接触讯飞听见APP后,自己上网课,学习效率大幅提升;2020年正式考取律师资格证,成为中国首位聋人律师。“别人可能会质疑她是聋人还要做律师吗,但她一直没有放弃,她心里想的是如何为残障人群提供法律咨询服务,所以在不断精进、不断热爱、不断学习中,她达成了梦想,她每天都在做有意义的事,她很快乐。而我们的技术在这过程中帮助到了她。”
王玮为谭婷的生命力量感动,也为科大讯飞的技术能对一个生命有所助力而倍感触动。这也更加坚定了她的信念——科技发展的落脚点是“人”。
“技术的发展,始终需要落脚到我们每个人身上。科技应该更有温度,不仅要追求技术进步和效率提升,还要关注对社会、对人的影响,体现人文关怀。科技应该最大限度地帮助人们解决问题,提升生活质量,收获实实在在的体验认可。”王玮说道。
科大讯飞深入场景的公益实践
为了这份“实实在在的体验认可”,科大讯飞秉承着将核心技术和业务价值深入场景中来做公益,回馈社会。
2020全国两会期间,《人民政协报》两会特别报道“委员会客厅”采访现场,使用了讯飞听见会议与多位全国政协委员进行连线互动,采访解读委员们各项提案;同年10月,推动深圳卫视知识春晚节目与科大讯飞合作,用人工智能技术将现场演讲实时转化为文字,并且直接呈现在电视直播画面中,这是AI直播字幕技术首次应用于省级卫视频道,助力听障人士收看节目;基于教学、会议、办公、窗口等场景,听障领域采用语音识别、多媒体和电子白板等采用无障碍软件+智能硬件技术、文本——声音转换技术,可以为听障学生营造多功能智慧学习空间。目前系列软硬件产品已在北京联合大学特教学院、南京特殊教育学院进行常态化应用,并在西安市第二聋哑学校、长春大学特殊教育学院、襄阳市特殊教育学校进行试点应用……
“这些技术应用平均每天为听障人群提供超过5000万次的AI服务,累计服务障碍人群超过1087万。”能参与其中,王玮只觉与有荣焉。
至于“听见AI的声音”项目,因与讯飞语音识别技术高度契合,该项目成为科大讯飞公益版图中的重要一块。截至2023年末,项目累计为听障群体定向捐赠时长超1亿分钟。
此外,科大讯飞还启动了“三声有幸”项目,通过语音识别和合成技术,开发盲人游戏《荣耀战场》,让视障人群能够参与电子竞技;今年5月,科大讯飞与中国残疾人联合会签署合作协议,双方将共建通用人工智能助残联合实验室,积极研发用于残疾人服务的人机交互组件、智能康复辅具,开展多类别的智慧助残研究,并搭建面向残疾人需求的应用场景,协同推进人工智能等技术创新成果在助残领域的示范应用等。
“在方言保护、促进教育资源平等方面,我们也有投入,如智慧教育产品捐赠:向新疆喀什疏附县托克扎克镇中心小学捐赠智慧课堂教学系统、智慧窗一体机等设备,帮助学校构建智能化教学环境,提升数字化教学能力,共享人工智能发展成果。”王玮说道。
AI技术赋能公益、无障碍的未来
在科大讯飞的系列公益实践中,王玮愈发看见了AI技术的普惠性。
“这种普惠性是指确保每个人都能享受到人工智能技术带来的便利与益处,这不仅是技术层面的普及,更是社会层面的公平与包容。这是一个非常宏大的命题,涉及到技术普及、社会公平、教育就业多方很多面的讨论。”
而作为一名科技企业工作者,这种普惠性时刻提醒王玮先做好自己和一些行业引领。“比如作为一名AI工具的生产者,我们要在设计和开发过程中就考虑到多样性和包容性。2022年我们招聘过一名听障员工加入产品研发队伍,她为我们提供了很好的交互改进思路,非常细小的修改却能为特殊群体提供质的体验提升——以听障群体实际需求者和用户的视角出发,去考虑普惠性问题,这一点非常重要——还是以人为本。”
那么,作为一家人工智能企业,在推动公益项目时,如何找到技术创新、社会效益与商业可持续发展的平衡点?
王玮回答记者:“只要足够深入用户需求、能够解决大众痛点,这三者本质上并不冲突。”
她举例称,2022年,自己带领讯飞听见与B站携手在英雄联盟直播时使用无障碍实时字幕。在中国电竞战队EDG夺冠的英雄联盟s11赛事中,B站无障碍直播间使用讯飞听见AI字幕的人数突破600万,总决赛单场比赛峰值人气为400万。“我们当时开设无障碍直播间本意是为听障群体提供便利,但过程中发现很多普通观众也有字幕需求:在声音不方便公放的场合,他们也需要实时字幕。类似这种延展出来的需求其实很多,所以我们很感谢聋人朋友,正因为他们对声音的需求和使用更加敏感,帮助我们拓展了更多技术使用场景。”
面对推动AI技术服务公益和无障碍事业的未来,王玮表示,伴随着大模型的不断发展成熟,AI技术将进一步提升无障碍设备的智能化和自主性。例如,智能语音助手可以更好地理解用户的指令,提供个性化的服务;系统可以在没有人类干预的情况下自主学习、决策和适应环境,这将极大地提升无障碍设备的实用性和用户体验。
但是,伴随而来的伦理和法规问题也不可忽视。“确保AI技术的健康发展,需要制定符合伦理标准和法规要求的准则和规范,我想这对大众来说都是很大的难点和挑战,对特殊群体未来的应用更是。”王玮说道。
众人拾柴火焰高,她希望国家能将信息无障碍列入规划和重要工程,努力构筑和完善信息基础设施,不断提升信息基础设施提供信息无障碍服务的能力和水平,也给予无障碍行业工作者更多的政策和资源支持,同时,结合人文关怀,确保技术进步服务于每一个人的福祉,尤其是边缘群体的需求。
责任编辑:方凤娇 主编:文梅