2025年世界人工智能大会(WAIC 2025)于7月26日至28日在上海盛大举行,本届大会以"智能时代,同球共济"为主题,展览面积突破7万平方米,吸引了800多家国内外企业参展。大会上,一众科技企业携重磅成果登场,涵盖底层技术平台、全新机器人产品、创新互动形式等多个维度,为行业呈现了一场人工智能盛宴。其中,具身智能相关成果尤为亮眼。
7月26日,2025年世界人工智能大会(WAIC 2025)主论坛上,智元机器人联合创始人兼首席技术官彭志辉通过灵犀X2正式发布“智元灵渠OS”开源计划。作为业界首个具身智能操作系统参考框架,其实现从底层硬件驱动到上层智能服务的全链路打通,对具身智能行业迈入标准化、规模化、生态化发展具有重大意义,也将加速机器人“飞入寻常百姓家”。
图片来源于智元机器人
据悉,“智元灵渠OS”将以“分层开源、共建共享”模式推进:底层基于智元已开源的高性能中间件AimRT持续增强,提供稳定、高效的分布式群体实时通信、硬件抽象等基础服务框架;上层开放智能体服务框架,支持交互、作业、运动等智能基座模型的标准化对接,降低应用门槛;同时,提供丰富的工具链,涵盖开发调试、仿真验证、部署管理、数据录制等能力,助力开发者快速构建从虚拟仿真到实体部署的技术闭环。
彭志辉表示,该计划将于今年第四季度开始逐步开源,与产业界开源共建具身智能操作系统生态,聚力突破具身智能系统在智能化提升、群体协同、云边端融合等新技术上的挑战。
而7月27日,在“智启具身论坛”上,智元机器人合伙人、具身业务部总裁姚卯青发布了行业首个面向真实世界双臂机器人的世界模型开源平台“Genie Envisioner”,简称GE。
该平台集成了预测、控制、评测三大核心能力,为机器人从视觉感知到动作执行提供了端到端的解决方案。其核心技术——多视角视频扩散模型GE-Base,基于AgiBot-World-Beta数据集,利用百万条视频流数据,捕捉机器人操作任务中的关键信息。
姚卯青表示,未来“Genie Envisioner”平台将扩展更多传感器模态,支持全身移动与人机协作,进一步推动智能制造与服务机器人的落地应用。
在2025年7月27日的WAIC 2025大模型论坛上,商汤科技正式推出了其最新的“悟能”具身智能平台。这一平台以商汤“开悟”世界模型为核心引擎,依托商汤大装置提供的端侧和云侧算力支持,旨在为机器人、智能设备赋予感知、视觉导航及多模态交互能力。
“悟能”具身智能平台能为各类终端硬件赋予对万物的识别与理解能力,并支持嵌入到端侧芯片,实现端侧推理,还可让机器人在更多样的环境中实现路径规划与导航。
图片来源于商汤科技
其亮点在于其构建的面向人、物、场的4D真实世界模型。用户只需发出简单的指令,例如“在厨房找东西”或“进入娱乐室开门”,平台便能自动生成动作指令,实现“闻令而动”的智能化操作。
商汤科技董事长兼首席执行官徐立在现场演示中,展示了一款搭载“悟能”平台的人形机器人,该机器人不仅语言流畅、风趣幽默,还能自主翻页、回答问题,甚至进行内容总结,展现了其高度的智能化水平。
商汤科技表示,“悟能”具身智能平台可广泛适配包括汽车、机器人在内的各类终端,实现空间层面的现实世界互动。
徐立表示,商汤希望通过这一平台,助力具身智能企业实现与现实世界的无缝交互,推动智能设备的广泛应用。
宇树科技展台的G1机器人与真人拳击表演成为大会最具观赏性的互动项目之一。机器人展示了倒地快速爬起、灵活闪避等高动态能力,虽然目前仍由人工操控,但宇树表示格斗是高效的动作学习方式,可通过动作捕捉获取职业选手的"标准答案"。
这场表演的价值更多在于公众科普:一方面生动展示了人形机器人的运动控制水平;另一方面也揭示了真正从秀肌肉到上岗,机器人还得过很多关。比如处理混乱场景、应对突发变化、进行人机协作、提升自我规划能力等。
宇树科技的创始人兼首席执行官王兴兴指出,2025年上半年全国智能机器人行业的平均增速可能达到50%到100%。并提到,自去年以来,几乎每天都有新款机器人问世,显示出行业的快速发展和出货量的显著提升。
在大会前,7月25日,宇树科技正式发布了其第三款人形机器人Unitree R1,售价为3.99万元起。
图片来源于宇树科技
根据介绍,Unitree R1具有26个关节,整机重量约25kg,集成语音和图像多模态大模型。此外,用户还可以自行开发、改制。官方暂未披露该机器人的更多信息。
在官方发布的视频中,Unitree R1展示了下坡、翻跟头、倒立等一系列高难度动作,充分证明了其“为运动而生”的设计理念。
在前不久的第三届中国国际供应链促进博览会上,宇树科技工作人员介绍,或许在未来1到3年内,机器人产品可以从单一的工业化产品落地发展到复合化工业场景。在3到10年内,可以将机器人投放至生活场景,例如做家务、照顾老人等。
GR-3是傅利叶首款主打交互陪伴的医用康养机器人,在功能迭代的基础上进一步拓展机器人在陪伴与情绪交互上的功能。该产品是GRx系列第三代,将于8月6日在北京正式发布,定位为Care-bot(照护机器人),拓展了机器人在情感交互维度的边界。
图片来源于傅利叶
GR-3采用了柔肤软包覆材设计和全感交互系统,打破了传统机器人冰冷的金属形象,拉近了人与科技的距离。其外观设计采用了莫兰迪暖调配色、动物风格的头部设计以及柔和的面部曲线,使机器人更具亲和力。
除了GR-3的首秀,傅利叶还展示了全新升级的“具身智能康复港”。这一方案以GRx系列人形机器人为核心,融合多模态感知、大模型与精准运控,针对康养场景需求构建了五大训练交互模块。这些模块包括导诊咨询、认知康复训练、上肢康复训练、运动功能重建以及远程康复,实现了康复训练、辅助照护与情感陪伴的一体化服务。
据了解,傅利叶已为全球3000余家医疗机构提供服务,累计服务患者超百万人。同时,智能康复港在全国范围内已有300个案例科室,覆盖省市县社区医院及乡镇卫生院,不断以技术重塑康复服务体系。
大会期间,擎朗智能带来了其最新研发的双足人形具身服务机器人——XMAN-F1,并实现了全球首秀。这款机器人以其高度拟人化的动作和精准的服务流程,成为大会的焦点之一。擎朗展台化身"具身服务体验馆"、医疗站、酒馆餐吧和剧院三大场景群机智慧协同展示及互动体验。
图片来源于美通社
XMAN-F1不仅能够流畅地完成爆米花制作,还能根据顾客需求调制各类冰镇饮料,包括雪碧、可乐等,并提供是否加冰等多种选择,展现出卓越的环境适应能力和任务执行精度。此外,XMAN-F1还具备强大的多模态交互能力,能够自主完成PPT讲解和产品演示,配合动态平衡与自然肢体语言。
“全球范围内,擎朗智能以22.7%的出货量占比位居商用服务机器人市场第一,并在餐饮配送细分领域以40.4%的份额保持领先。擎朗的产品已畅销全球60余个国家和地区的600多个城市。”擎朗智能相关负责人表示。此次XMAN-F1的推出,或将进一步巩固擎朗智能在全球服务机器人市场的领先地位。
网易发布全球首个专为露天矿山挖掘机装车场景打造的具身智能模型——“灵掘”
在大会现场,网易旗下工程机械智能化品牌网易灵动召开露天矿山具身智能技术发布会,正式推出全球首个专为露天矿山挖掘机装车场景打造的具身智能模型——“灵掘”。
图片来源于网易灵动
据悉,此次发布深度响应国家能源局“2025年大型露天煤矿实现智能连续作业和无人化运输”的战略目标,为《智能化煤矿建设指南》提供了可规模化落地的技术范本。
该模型三大创新点:一是摒弃传统分模块开发与场景定制模式,首创端到端一体化架构;二是采用真实矿山作业场景数据进行训练,攻克仿真数据无法解决的场景难题;三是基于国产框架研发,实现核心算法与硬件芯片全自主可控,保障技术安全与供应链稳定。
据了解,在内蒙古霍林河北露天煤矿的严苛环境中,“灵掘”单机装车效率已达人工80%,近70%作业时间无需人为干预,成功适配极寒、高粉尘等严苛环境与多型号矿卡。
为加速技术普惠,网易宣布开源"灵掘"数据集,并向全行业发起"2027产业协同计划",目标在2027年实现30座以上矿山无人化运营,以生态合力加速技术普惠。
除了以上提及的看点,具身智能领域还有其他很多亮眼成果,如由上海理工大学李清都教授团队研发的卓益得“行者二号”优化版机器人“学霸 01”,成功被上海戏剧学院录取,成为全国首位以“博士”身份入学的具身智能机器人;还有灵宝推出新款机器人CASBOT 02与W1;京东推出JoyInside“附身智能加速计划”,为机器人、AI玩具和智能硬件等企业提供限时免费接入服务等。
从底层技术到终端产品,从行业应用到公众互动,全方位展现了人工智能领域的最新发展态势,尤其是具身智能的快速崛起,正引领着智能时代的新变革。