登录
首页 >  科技周边 >  人工智能

生数科技MotuBrain登顶双榜,定义具身智能新标准

时间:2026-05-01 09:46:09 321浏览 收藏

生数科技重磅发布具身智能核心引擎MotuBrain,一举登顶WorldArena与RoboTwin2.0两大国际权威评测榜首,以超95分的强干扰鲁棒性、首创“边感知-边推演-边执行”的世界动作模型架构,真正实现“所见即所动”;它不仅能跨硬件平台灵活适配、无缝完成10+步长程复杂任务,更在火锅捞食、插花调酒等真实场景中展现出类人级情境理解与自主决策能力——这不仅是技术突破,更是具身智能从指令驱动迈向认知驱动的关键拐点,标志着可商用、可迁移、可扩展的通用“具身大脑”已照进现实。

在具身智能领域蛰伏三周的“神秘模型”终于揭开面纱。此前,一款代号为MotuBrain的模型悄然登顶两大国际权威评测基准——WorldArena(聚焦物理世界理解能力)与RoboTwin2.0(聚焦动作执行精度),引发业界高度关注与诸多猜想。近日,凭借视频生成大模型Vidu广受瞩目的生数科技正式官宣:该模型正是其面向具身智能场景打造的首个可商用落地的核心引擎。

此次突破绝非概念性尝试。MotuBrain在上述两项评测中均刷新历史最高分纪录。尤为突出的是,在引入高频随机扰动的强干扰测试环境中,它是目前唯一实现平均得分突破95分的模型,充分验证了其在复杂动态场景下的卓越鲁棒性与泛化性能。

跨界黑马登顶双榜!生数科技发布MotuBrain,定义具身智能“大脑”新标准

“所见即所动”:重构感知与行动的耦合逻辑

区别于传统“先规划、再执行”的串行范式,MotuBrain开创性地采用“世界动作模型”(World Action Model)架构。这一“边感知、边推演、边执行”的实时闭环机制,使决策与动作同步演化,有效抑制误差累积,显著缩短端到端响应延迟。

在真实场景演示中,搭载该模型的机器人展现出类人级的任务理解力。例如在火锅用餐模拟任务中,机器人能依据实时视觉反馈判断勺中是否有食材,并据此动态调整后续动作——若为空则主动补捞,而非机械复刻固定流程。这种基于情境自主判断的行为逻辑,标志着具身系统正从指令驱动迈向认知驱动。

跨界黑马登顶双榜!生数科技发布MotuBrain,定义具身智能“大脑”新标准

一脑适配多形态,长程任务无缝贯通

MotuBrain的核心竞争力在于其高度统一的通用表征能力。它不仅支持“一脑多型”,可灵活适配不同构型、自由度及传感配置的机器人硬件平台;更具备“一脑贯全程”的长时序任务统筹能力。在插花、调酒、家居整理等多类复杂任务中,系统可连续稳定完成逾10个细粒度原子动作,全流程自然连贯,全程无需人工介入或重置。

实测数据显示,随着任务类型多样性提升,MotuBrain的学习成功率呈现正向增长趋势。这表明模型习得的是物理交互中的普适性规律,而非针对特定动作的过拟合模板——任务越丰富,其底层建模能力越扎实,表现也越稳健。

扎根物理世界,构建数字与实体协同演进新范式

生数科技此次成果的背后,是其长期深耕多模态基础架构的技术沉淀。依托全球首创的U-ViT统一架构,公司首次实现了虚拟生成模型(VGM)与具身动作模型(WAM)的同源协同。左手以Vidu高效构建高保真数字世界,右手借MotuBrain精准操控真实物理实体,双轨并进大幅降低真实数据采集成本,加速模型迭代闭环。

现阶段,生数科技已与无界动力、星尘智能等多家具身智能头部企业签署战略合作协议。随着行业竞争焦点由单点能力转向通用智能体构建,掌握真正可迁移、可扩展、可部署“具身大脑”的技术方,正逐步成为定义下一代智能终端生态的关键主导者。

以上就是《生数科技MotuBrain登顶双榜,定义具身智能新标准》的详细内容,更多关于的资料请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>