天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花
来源:搜狐
时间:2023-06-03 05:43:08 104浏览 收藏
一分耕耘,一分收获!既然打开了这篇文章《天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
前言:随着中国数字经济的深入发展,产业数字化进程不断加速,大数据在产业决策中的比重越来越高。天眼查数据研究院特此推出“天眼新知”专栏,以天眼查大数据为依托,梳理产业格局及发展脉络,解读产业领域最新动态和投融资风向,为各方决策提供参考。
本文为天眼新知·产业分析系列,第三十七篇。
机器人,多数人的第一次“亲密接触”源于科幻大电影,源于对超越现实生活的无尽想象,机器人逐渐从“工具”逐步进化成为“亲密伙伴”。
年初爆红的“大模型”,以及再次“走红”的人形机器人,让人们再次惊呼科技对于生活方式的改变。
未来,随着AI技术的不断成熟,人形机器人研发的突破,让“机器人走进普通人生活的愿景”越来越逼近现实。
一、机器人:从“自动化”向“智能化”演进
国际机器人协会(InternationalFederationofRobotics,IFR)提出,机器人是可在两个或多个轴上进行编程的驱动机制,具有一定程度的自主性,在特定环境中移动以执行预定的任务。
1.机器人应用场景逐步由“简单,初级”向“复杂,高级”迈进
最初机器人的核心功能是替代人进行重复的、危险的工作,同时提高效率与精度;之后以“服务人”为功能的机器人走入人们的眼帘,用于迎宾接待等与人类距离更近的场景,娱乐/扫地机器人等大规模进入家庭;接着其高精度的特性被用于物流、医疗,自动取件、辅助护理机器人开始出现。
2.机器人逐步由“自动化”向“智能化”演进
机器人的发展经历了三代的演进,第一代为程序控制机器人:通过编程或示教将动作指令输入机器人中,而由于缺之外部传感器,机器人只能刻板地完成程序规定的动作,一旦环境情况略有变化,机器人的工作就会出现问题;第二代为自适应机器人:其带有视觉、力觉等传感器,能据传感器获得的信息调整工作状态:第三代为智能机器人:其拥有更丰富的传感器,不仅能获取并处理外部综合信息,甚至能据此自己制定行动目标,其智能主要体现在感知交互、独立决策、自我优化三个方面。
二、大模型:一线城市率先发力,主攻通用人工智能
在2023年4月的中共中央政治局会议上,强调了通用人工智能的发展重要性,呼吁营造创新生态,同时重视风险预防。区别于此前中央经济工作会议等重要会议中泛指的“人工智能”,此次政治局会议明确强调“通用”,即Chat-GPT自去年11月以来引领的通用性AI大模型技术路线。
北京市《若干措施》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施,北京打响了地方大模型竞赛的第一枪。当前Chat-GPT的“千模大战”已经开始,大型模型有望为各行业带来新的效率提升和用户体验升级。随着AI第一城北京行动了,上海、深圳、杭州等地区可能也会陆续采取行动。
三、人形机器人:人与机器的“不期而遇”
人形机器人是一种具有智能的机器人,其外观和运动方式与人类相似,其定义和使用目的是如此。人形机器人(humanoidrobots)又译“仿人机器人”,字面意思是模仿人的形态和行为设计制造的机器人。目前人形机器人并没有普遍定义,但根据专业书籍《HumanoidRobots》的归纳,人形机器人应当能“在人工作和居住的环境工作,操作为人设计的工具和设备,与人交流”。在此前提下,人形机器人最终应具有与人类似的身体结构,包括头、躯干和四肢,使用双足行走,用多指手执行各种操作,并具有一定程度的认知和决策智能。
人形机器人起步于1960年代后期,以日本的研究成果最为瞩目。1973年日本早稻田大学的加藤一郎教授研发出世界上第一款人形机器人WABOT-1的WL-5号两足步行机,严格讲类属于仿生机械,是人形机器人的雏形。Honda initiated research on humanoid robot ASIMO in 1986 and successfully launched the first model in 2000.。
四、人形机器人与AI大模型:通用场景加速C端革命性推进
随着集成设计技术、运动管理控制技术、传感器感知技术等关键技术的不断突破,以及人工智能、5G等新一代信息技术的融合应用持续深入,特种机器人加速应用于煤矿、深海、极地等场景,释放出巨大的生产和科研价值,而其中最让前沿科技公司、普通消费者“着迷”的是以人形机器人为代表的智能移动机器人的出现,迭代。
智能系统能够全面感知、实时互联、进行数据分析和决策,同时能够自主学习,从而实现机器人的自主作业。AI通过机器人视觉技术强化机器人的感知能力,通过构建算法模型提升其分析决策、自主学习的能力,从而使机器人能够独立完成作业。
1.感知世界的能力(机器人的眼睛)
当前机器人自主移动的常见技术方案包括激光和视觉导航,这两种方案被广泛应用。计算机视觉的发展经历了基于以特征描述子代表的传统视觉方法、以CNN卷积神经网络为代表的深度学习技术,目前通用的视觉大模型正处于研究探索阶段,人形机器人的场景相对工业机器人更通用、更复杂,视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景。
一方面,大模型的强拟合能力使得人形机器人在进行目标识别、避障、三维重建、语义分割等任务时具备更高的精确度;另一方面,大模型解决了深度学习技术过分依赖单一任务数据分布,场景泛化效果不佳的问题,通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,提升场景泛化效果。
典型产品:特斯拉“Optimus(擎天柱)”
感知层面,特斯拉机器人头部使用8个摄像头采集视觉信息。计算层面,机器人将采用目前特斯拉汽车使用的FSD(FullSelf-Driving,全自动驾驶)电脑、运用神经网络等模型实时处理信息。特斯拉将使用超算“Dojo(道场)”训练机器人使用的AI模型,使其更有效的识别外界物体并做出反应。
2.思考和决策的能力(机器人的大脑)
目前的机器人都是专用机器人,只能在限定场景中应用,即使是机器人抓取,基于计算机视觉,仍然是在限定场景中,算法仅用于识别物体,如何做、做什么仍需要人的定义。需要一些基础知识才能完成的事情,例如要让机器人变得通用,只需命令它去浇花,然后它便知道拿水壶、倒水、浇花等常识动作。在大型模型出现之前,使机器人拥有常识几乎无解。大模型让机器人可以拥有常识,从而具备通用性去完成各种任务,彻底改变通用机器人实现的模式。人类工具和环境的适应性,不用再为了机器人而造工具。
典型产品:首个机器人公民“索菲亚”
2017年,索菲亚成为世界上第一个获得公民身份的机器人。她说她会用她的智慧帮助人类发展,让我们不要害怕她,她很友善。2018年,她还成为全球首位开展在线教育课程的AI老师。据索菲亚称,未来的机器人完全能够胜任教育工作者的角色,通过与学生互动来解决学生所遇到的心理和情感问题。
3.执行能力(机器人的四肢)
行动能力(腿)+精细操作(手)。把机器人做成人形,就是为了让机器人的执行能力更加通用。机器人执行任务时所处的环境是按照人类的体型建造起来的:建筑、道路、设施、工具等,这个世界是为了方便人类这种人形生物才这样设计。人们必须重新设计一个适应于新型机器人的全新环境。设计在某个特定范围内执行任务的机器人相对容易,如果想要提高机器人的通用性,就必须选择可以作为分身的人形机器人。此外,人类与人形机器人更容易有情感上的交流,人形机器人会让人感到亲近。
典型产品:波士顿动力Atlas
在2020年12月,波士顿动力发布了Atlas跳舞的视频,其动作顺畅、富有表现力。机器人需要在跃空起跳的状态下调整姿态,在舞蹈中精准地完成动作并保持平衡。2021年8月,在官方最新视频中,Atlas可以在障碍环境内“跑酷”,做出跳跃、俯冲翻滚、空翻等一系列高难度全身动作。
4.“具身智能”+机器人:人工智能的终极形态
如何让电脑有如一岁小孩般的感知和行动能力的问题,诞生了“具身智能”的概念。其可以简单理解为,各种不同形态的机器人,让它们在真实的物理环境下执行各种各样的任务,来完成人工智能的进化过程,比如:人形机器人、智能驾驶汽车,或者未来的“变形金刚”。
英伟达创始人黄仁勋在ITFWorld2023半导体大会上表示,具身智能(EmbodiedAI)是能理解、推理、并与物理世界互动的智能系统,是人工智能的下一个浪潮。
具身智能最大的特质就是能够以主人公的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动的等待数据投喂。人形机器人提供了各种基于人类行为的学习和反馈系统,为实现更复杂行为语义提供了迭代的基础和试验场。因此,人形机器人的逐步完善也为具身智能的落地提供了方向,是具身智能的重要应用场景,也将为具身智能的迭代优化提供方向和空间。
五、专利技术:机器人、大模型专利申请逐年增加
1.机器人专利:
近年来,机器人与前沿科技产业,诸如:大数据,人工智能等结合愈加紧密,特别是人形机器人的出现,让机器人作为科技产业的“技术”含量日益提升。
从数量来看,机器人专利保持稳定增长,2022年申请专利2.3万余项;从类型上来看,发明专利与实用新型占比较高,两者之和占总数的9成。
2.大模型专利:
大模型的“爆发”也并非没有征兆。在人工智能领域,作为其“皇冠上的明珠”,自然语言处理是理解人类语言、情感和思想的技术,从其“寥寥数语”的介绍中,就可以发现它对于“机器”到底“因何为人”的重要性与超高的难度。
从近年来专利申请的数量来看,还是保持了较为稳定快速的增长,自2018以来,其申请量的复合增长率达到61.2%;
从类型上来看,发明专利占据绝对的领先地位,占比近98%。
天眼查研究院认为,大模型技术推动人工智能实现了一次历史性跨越,未来仍有广阔的持续创新空间。中国的高质量经济社会发展为创新大型模型提供了丰富的场景和数据基础,因此人工智能在中国拥有巨大的发展潜力。
到这里,我们也就讲完了《天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
207 收藏
-
118 收藏
-
252 收藏
-
380 收藏
-
397 收藏
-
299 收藏
-
204 收藏
-
203 收藏
-
159 收藏
-
221 收藏
-
193 收藏
-
485 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习