首页 > 新闻 > 科技 > 科技关注

具身智能:机器人打破“专用”枷锁 柔性制造迎来新范式

时间:2025-08-11 浏览:

【环球网科技报道 记者 李文瑶】“个性化消费时代,多品种、小批量、高柔性的制造需求,与传统工业机器人的结构化封闭环境、单一指令模式产生了根本性矛盾。”在2025世界机器人大会(WRC)现场,聆动通用CEO、科大讯飞机器人首席科学家季超如此点出当前制造业自动化的核心痛点。

这一矛盾正推动机器人控制技术经历一场静默革命——从过去基于精确模型(Model Base)的编程式控制,转向基于数据驱动学习(Learning Base)的具身智能。其背后,是以Transformer架构为代表的大模型技术向机器人领域的深度渗透。

效率与通用性的“悖论”

拥抱通用性并非没有代价。季超坦言,具身智能机器人在单一场景的效率目前可能仍低于专用机器人。他描绘了一个清晰的坐标轴:横轴是通用性,纵轴是效率,二者呈现显著的负相关。“通用性越强,初期效率往往不会特别高;专用性强的系统因建模相对成熟,效率反而更容易提升。”解决这一矛盾,正成为业界共同攻坚的方向。

具身智能的核心突破在于赋予机器“理解”与“规划”的能力。传统工业机器人依赖人类编程的精确指令,执行直接而单一的动作。随着多模态大模型和具身大模型的发展,机器人开始具备理解模糊任务指令、进行动作规划并执行的能力,形成“任务理解-动作规划-执行”的复杂全链路架构,为突破柔性制造的瓶颈提供了可能。

数据金字塔与大小脑协同

实现这一愿景的关键在于数据。聆动通用提出了“数据金字塔”理论:底层是海量互联网视频文本数据,中层是仿真合成数据与动作捕捉数据,塔尖则是高价值、高可用的真实场景数据。越往塔尖,数据规模越小、质量要求越高、获取难度与成本也越大。

“聆动通用的解法是分层构建。”季超介绍,依托科大讯飞的多模态预训练底座,底层利用任务数据和互联网数据构建基础空间理解能力;中高层则通过合成数据和真机数据,如其发布的具身智能采训推一体机进行补充和微调,最终形成闭环。这使得基座模型能利用少量高质量真机数据快速适配不同场景,大幅降低任务迁移成本。

在技术架构上,“一脑多小脑”模式成为务实选择。通用“大脑”由海量数据预训练形成的基座模型构成,赋予机器人任务层级的认知理解能力;专用“小脑”则通过真机数据微调,解决具体场景的动作优化问题。两者结合,既保证通用智能的基础,又满足特定场景的高效可靠。季超坦言:“我们认为现阶段能够落地的方式,可能是这种大脑和小脑结合的模式。”

生态共进:从实验室走向工厂

落地节奏上,季超预测具身智能将经历“单一结构化场景-半结构化场景-逐步通用”的渐进路径。而推动这一进程需要全行业协作——从数据、模型、硬件工具链到应用,非单一企业能覆盖。

科大讯飞的“平台+赛道”战略正着眼于此。平台层面,其2022年发布的“讯飞超脑2030计划”旨在以基座大模型能力赋能生态伙伴,目前科大讯飞推出“即插即用”的机器人智能语音背包,降低语音交互集成门槛;赛道层面,聆动通用聚焦工业制造、物流及零售领域,做垂直深耕。讯飞牵头起草的国内首个《机器人自适应能力技术要求》国家标准(GB/T 44589-2024)已于今年4月1日正式实施,为行业建立技术共识提供标尺。

“世界机器人大会这类平台的价值日益凸显。”季超以亲身经历为例,去年人形机器人还在蹒跚学步,今年已能稳定行走并完成操作任务,“它让产业链上下游看见彼此进展,促成合作,加速技术从实验室渗透至产线。”

当机器人从执行预设程序的“机械臂”,进化为能理解、规划并适应复杂环境的“智能体”,一场属于柔性制造的智能化跃迁已然启幕。其终点,是让机器真正融入人类生产与生活的动态洪流之中。

猜你喜欢: