头图 | AI生成
作者 | 黄思语
在高温熔炉旁,具身智能机器人用传感器精准地感知着周围的温度变化,井然有序地工作着,灵巧的手臂将通红的金属材料从熔炉中小心取出,每一个动作都精确无比。
在家里,人形机器人正熟练地操作着咖啡机,精准地测量着咖啡粉的用量,缓缓注入热水,蒸汽升腾间,为你做好了一杯浓郁的咖啡。
养老院里,当老人需要进食时,机器人温柔地端起饭碗,用勺子舀起适量的食物,小心地送到老人嘴边;散步时,机器人稳稳地扶住老人手臂,以合适的速度陪伴在他的左右。
以上种种,三至十年将陆续成为现实。眼下,要迈出具身智能从想象进入现实的第一步,实现具身智能在具体场景的落地,还有大量的技术和商业难题亟待解决。比如人形机器人是具身智能落地的最佳形态?在技术层面,数据的难题如何破解?如何更好地实现商业化?
对此, 9 月 20 虎嗅智库大鲸AI闭门会 · 具身智能专场汇聚来自不同领域的专家和企业代表,给出了一些深入思考和建议。
应用场景:具身智能虽会率先落地工业,但服务业潜力更大
具身智能作为科技领域的新兴力量,未来在工业、服务和养老等领域均具有多样的应用场景和适应性。
在工业领域,人形机器人与机械臂等传统设备并非相互替代,而是共存发展。阿里研究院AI产业研究中心主任周搏指出人形机器人进厂并非统治制造业,而是为了获取数据以打破发展困境。
因为人形机器人没有上一代证明其有用性,市场未大规模接受,形成了死循环,工业制造等领域可为人形机器人提供获取初始数据的环境。
阿里研究院AI产业研究中心主任 周搏
穹彻智能副总裁王竞凡在圆桌讨论中提到,人形机器人虽然目前在工业领域存在精度、刚性、频率响应和数据融合算法等方面的局限性,但在挑战人类生理极限的高温、高压、有毒等特殊环境下,具身智能产品却能发挥重要作用。
在服务人类的交互场景中,人形机器人未来将被应用最多。网易灵动技术负责人陈赢峰博士认为人形机器人最终适合服务人类,因为社会环境依据人类形态设置,其人形结构能复用已有设备并给人带来更好的情感感受,可在餐饮、摁电梯、家用等场景为人类提供便利。
千寻智能联合创始人郑灵茵也指出具身智能在商用和服务领域能拓展很多新场景,如小米汽车打磨、餐饮制作及康养等,过去因机器人环境要求固定和缺乏通用能力无法批量落地,如今可借助人形机器人的交互性得以改变。
千寻智能 联合创始人 郑灵茵
养老场景是具身智能的重要应用方向。欧美和中国老龄化问题日益严峻,劳动力短缺促使养老机器人市场需求巨大。扶老人、喂饭等需求为人形机器人在养老场景的应用开辟了广阔空间。
郑灵茵在演讲中提到,关于成本,价格永远不是影响人形机器人批量落地的核心卡点,主要还是看新的技术解决了哪些核心痛点,到底为人类的进步带来了哪些改变?而且随着技术发展和产业链成熟,价格会逐渐达到预期。未来机器人行业发展道路曲折但前途光明,千寻智能未来将以更低价格、更快速度打造具身轮式机器人,未来,机器人走进千家万户,成为人类的伙伴,一定会变成现实。
人形机器人是具身智能落地的最佳载体,但不是唯一载体
在本次圆桌讨论中,三位嘉宾从技术、应用场景和成本商业化三个维度深入探讨了人形机器人是否是具身智能落地的最佳形态载体。
(左-右)虎嗅智库分析师 梁子博、穹彻智能 副总裁 王竞凡、网易灵动 技术负责人 陈赢峰、保时捷管理咨询合伙人 董钧天
在技术层面,王竞凡强调具身智能的产品形态可以按需组装软硬件。陈赢峰博士认为人形机器人是具身智能验证的最佳载体之一但非唯一。具身智能可根据不同场景选择不同载体验证技术,人形机器人在特定场景有优势但非最佳选择。
在应用场景层面,王竞凡指出人形机器人在工业领域有局限性但在挑战人类生理极限方面有意义,在商业和民用领域有应用可能。陈赢峰博士认为人形机器人适合服务人类场景,在工业场景有局限性但部分仍需人形结构。
保时捷管理咨询合伙人董钧天女士从企业需求端出发,强调没有最好形态,只有最适合的形态。具身智能可突破人类生理局限与社会局限,在高温、严寒等恶劣环境下完成高危作业,或通过替换可重复标准化作业,释放劳动力。具身智能的出现并非是取代人,更不是要淘汰人,而是通过人机协同,不断提高人的生活品质与工作效率。
在成本商业化层面,王竞凡提到人形机器人成本高,需降低成本以推动行业发展,成本问题是制约其大规模应用的重要因素。董钧天女士指出企业智能化落地要考虑成本、可靠性、灵活性与可持续性等多重因素。目前投资回报率低但长期看中国供需螺旋上升可降成本,企业应用具身智能需综合考虑,平衡技术先进性与成本效益。
技术挑战的突破关键在于:数据、控制、感知
具身智能发展中数据是关键问题,3D的AI进展缓慢且数据采集、标注和解耦难。同时,人形机器人运动控制、空间感知和任务理解推理也面临挑战。
跨维智能联合创始人解锐在主题演讲中提到,自然语言和图像大模型较为成熟,但3D 的AI进展缓慢。具身智能需要从3D感知到与物体互动的相关能力,而数据的采集、标注和组合解耦成为了难题。
跨维智能 联合创始人 解锐
3D数据采集标注复杂,难以通过互联网及其他采集渠道获取大量数据。与自动驾驶相比,机器人对3D感知精度要求更高,且需要高效的手眼协同。
为了解决这一问题,跨维智能提出了 Sim 2 Real 的解决方案,跨维智能基于自研3D物理引擎,通过生成式AI快速生产海量3D资产,并且高效完成数据自动标注与合成加工,即时导入自主设计的神经网络进行模型训练,保证数据生产和模型数据需求的配合,在域适应算法支持下,实现虚拟空间能力向真实场景有效迁移。
面向应用场景,在工业领域结构化场景已使用可以在一天内完成训练的小模型解决机器人引导控制需求,具身智能引擎 2.0 阶段将加入多模态概念,完善仿真体系,实现各形态通用机器人任务仿真和能力训练。
人形机器人的运动控制也是当前面临的一大挑战。周搏在演讲中提到,目前业界在人形机器人的运动控制方面仍需努力,例如弯腰系鞋带这样的动作还无人能做到。除了数据和运动控制问题,人形机器人在空间感知能力和任务理解推理方面也处于探索阶段。
智平方战略副总裁 莫磊
智平方战略副总裁莫磊指出,为了提升智能机器人的空间感知能力和任务理解推理能力,需要不断探索新的技术和方法。智平方聚焦解决这一难题,是全栈自研、体系化投入的聚焦空间感知基础模型的公司。
智平方以多源数据融合引擎AI2R Data为基础,原创模型结构与训练方法,在泛化多样的操作等最关键的问题上取得重大技术突破,且100%可由数据驱动实现系统升级。
同时,通过系统性的软硬垂直整合技术与智能硬件深度融合,进一步解决在真实场景中进行规模化交付的难题。智平方已经获得多家国际头部车企、互联网企业等行业头部客户的技术认证,成为最早进行商业化推广的智能机器人公司。
商业化落地的成本考量与发展前景
当前具身智能在成本商业化方面面临诸多挑战,人形机器人成本高且投资回报率可能较低,但其未来在中国供需螺旋上升及技术进步下商业化前景值得期待。
在圆桌讨论中,嘉宾们提到,人形机器人的成本结构严峻,例如手臂的价格最便宜也得 1 万多人民币,而人形机器人需要两个手臂,更别提其他部件。同时,硬件成本和软件能力都需要提升,才能降低人形机器人的成本。
企业智能化落地需考虑成本优势、可靠性、灵活性和可持续发展等因素,目前投资回报率可能较低。峰瑞资本执行董事刘鹏琦在主题演讲中提到,目前的现状是估值高的公司未必商业化程度高,真正商业化好的公司估值未必高。
以自动驾驶为例,L2 和 L4 面临成功率和通用性的权衡;具体到具身智能方向,早期的工业机器人往往牺牲通用性来实现商业化,人形机器人则在成功率和通用性上都有待提升。
峰瑞资本执行董事 刘鹏琦
在投资策略方面,峰瑞资本认为未来具身智能的落地会以为人类提供服务为核心,团队要有全栈能力,数据是核心,早期需自采数据并尽快进入场景数据算法的迭代闭环。因此,除了在本体、核心零部件、关键传感器、场景应用以及大小脑方向有布局之外,峰瑞也在积极寻找具身数据相关创业团队。中国市场适合发展具身智能,有供应链优势、产业需求拉动和政策鼓励。
整场活动中,现场观众参与了热烈的讨论,提出了一些问题,嘉宾也在现场给出了相应地回答。其中,来自中石油、理想汽车、蔚来汽车、机械工业信息研究院、上海电气等企业高层莅临现场,与会人员展开深度对话、交流实践经验,探讨业务合作,圆满结束了本次大鲸AI闭门会。
结语:
从工业领域到服务场景,再到养老领域,具身智能展现出了广阔的应用前景,但也暴露出技术、成本等方面的问题。人形机器人是否为具身智能落地的最佳形态载体尚无定论,数据难题、运动控制及感知任务推理的挑战、成本商业化的困境都亟待解决。未来,具身智能有望真正融入我们的生活,为人类带来更多的便利与福祉。
大鲸案例库已全面登陆智库官网,案例库将实时追踪AIGC、AI Agent、具身智能、工业大模型等前沿应用,诚邀行业朋友与大鲸助理(v:17710850103)联系申报,为我们提供更多有关生成式AI的丰富实践。
追踪更多数字化、AI创新实践活动,欢迎前往虎嗅智库完成注册即可接收我们的内容更新与活动通知。
关于虎嗅智库: 虎嗅智库是一家聚焦企业数字化、AI创新实践的新型研究服务机构,为产业智能化进程中的甲乙双方,提供有洞察性的研究报告、案例评选,以及线上会议、线下活动与参访服务,以支持企业高管在智能化、数字化方面的明智决策。 我们提供的核心价值: 及时与优质的洞察,了解技术、了解行业、了解同行与对手; 为决策者技术与产品战略决策、产业规划、解决方案选型提供重要参考; 帮助市场全面了解前沿科技及所影响产业的发展状况,还有未来趋势。