朱玉可团队新作:看一眼就能模仿,大模型让机器人轻松学会撒盐
来源:机器之心
时间:2024-11-26 11:03:34 275浏览 收藏
学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《朱玉可团队新作:看一眼就能模仿,大模型让机器人轻松学会撒盐》,以下内容主要包含等知识点,如果你正在学习或准备学习科技周边,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!

论文地址:OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation 论文链接:https://arxiv.org/pdf/2410.11792 项目地址:https://ut-austin-rpl.github.io/OKAMI/







首先使用 CoTracker 跟踪关键点,并检测关键点的速度变化以确定关键帧,这些关键帧对应于子目标状态。 对于每个子目标,都确定一个目标物体(会因为操作而运动)和一个参考物体(通过接触或非接触关系作为目标物体运动的空间参考)。目标物体是根据每个物体的平均关键点速度确定的,而参考物体则通过 GPT-4V 预测的几何启发式或语义关系来识别。 确定子目标和相关物体后,生成一个参考规划 l_0, l_1, . . . , l_N,其中每一步 l_i 都对应于一个关键帧,并且包含目标物体 o_target、参考问题 o_reference 和 SMPL-H 轨迹段 的点云。
OKAMI 能否有效地让人形机器人基于单个人类演示视频来模仿各种操作任务? 在 OKAMI 中,将演示者的身体动作重新定位到人形机器人身上是否重要,以及为什么没有选择仅根据物体位置进行重新定位? OKAMI 能否在多样化人体统计学特征的人类演示视频中始终保持自身性能? OKAMI 生成的展示(rollout)是否可以用来训练闭环视觉运动策略?

将毛绒玩具放入篮子里(Plush-toy-in-basket) 将少许盐撒入碗中(Sprinkle-salt) 关上抽屉(Close-the-drawer) 合上笔记本电脑的盖子(Close-the-laptop) 将一袋零食放在盘子上(Place-snacks-on-plate) 将薯片袋放入购物袋中(Bagging)



今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
声明:本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
382 收藏
-
332 收藏
-
391 收藏
-
345 收藏
-
250 收藏
-
475 收藏
-
440 收藏
-
142 收藏
-
165 收藏
-
285 收藏
-
369 收藏
-
240 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习