登录
首页 >  科技周边 >  人工智能

GR00TN1—英伟达开源人形机器人模型发布

时间:2025-04-05 16:27:26 470浏览 收藏

英伟达重磅发布全球首个开源通用人形机器人基础模型GR00T N1,这是一个里程碑式的成果。GR00T N1能够理解多模态输入(例如语言和图像),并执行抓取、搬运等复杂操作任务,兼容多种机器人平台。该模型采用双系统架构,结合互联网数据、合成数据和真实机器人数据进行训练,具有高效的数据利用率和强大的泛化能力。GR00T N1已开源,可在NVIDIA官网、GitHub和HuggingFace平台获取,其在物流、制造等领域的应用前景广阔,有望推动人形机器人技术发展。

NVIDIA发布全球首个开源通用人形机器人基础模型:GR00T N1

NVIDIA重磅推出GR00T N1,这是全球首个面向通用人形机器人的开源基础模型。它能够基于多模态输入(例如语言和图像)在各种环境中执行多种操作任务。

GR00T N1— 英伟达开源的人形机器人基础模型

GR00T N1核心功能:

  • 多功能操作: 执行抓取、搬运、双臂协调等多种操作任务,适应复杂环境。
  • 多模态理解: 理解自然语言指令并结合视觉图像信息执行任务。
  • 跨平台兼容: 兼容多种机器人平台,例如Fourier GR-1和1X Neo。
  • 复杂任务规划: 能够处理需要多步骤和多种技能整合的复杂任务。
  • 高效数据利用: 结合互联网数据、合成数据和真实机器人数据进行训练,提高性能和泛化能力,降低对标注数据的依赖。

GR00T N1技术架构与原理:

GR00T N1采用双系统架构:

  • 视觉-语言模型 (System 2): 基于NVIDIA-Eagle和SmolLM-1.7B构建,负责环境理解、推理和规划,生成动作计划。
  • 扩散变换器 (System 1): 将视觉-语言模型的计划转化为精确的连续动作,控制机器人运动。

其数据策略涵盖互联网视频数据、合成数据(NVIDIA Omniverse生成)和真实机器人数据,并利用无监督学习提升效率。模型通过大规模数据预训练和针对特定平台、任务和环境的微调来优化性能。

获取GR00T N1:

GR00T N1应用前景:

GR00T N1在物流、制造、零售、医疗和工业检查维护等领域具有广泛的应用前景,有望显著提升效率和自动化水平。

好了,本文到此结束,带大家了解了《GR00TN1—英伟达开源人形机器人模型发布》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>