AI小镇中的NPC居民以真人角色扮演,仿佛进入《我的世界》
来源:51CTO.COM
时间:2024-01-02 15:12:47 388浏览 收藏
本篇文章向大家介绍《AI小镇中的NPC居民以真人角色扮演,仿佛进入《我的世界》》,主要包括,具有一定的参考价值,需要的朋友可以参考一下。
请留意,这个方块人正在紧锁眉头,思考着面前几位“不速之客”的身份。
原来她陷入了危险境地,意识到这一点后,她迅速展开脑力搜索,寻找解决问题的策略。
最终,她决定先逃离现场,然后尽快寻求帮助,并立即采取行动。
与此同时,对面的人也在进行着与她相同的思考……
在《我的世界》中出现了这样一个场景,所有的角色都由人工智能控制。
他们每个人都有着独特的身份设定,比如之前提到的女孩就是一个年仅17岁但聪明勇敢的快递员。
他们拥有记忆和思考能力,在这个以《我的世界》为背景的小镇中像人类一样生活。
驱动他们的,是一款全新的、针对开放世界设计的、基于语言的AI角色扮演框架LARP。
这里的LA指的是Language Agent,同时LARP又是实时(Live Action)角色扮演的缩写,可谓是一语双关。
除了拥有更高的认知复杂度,相比于传统的智能体框架,LARP还缩小了智能体与开放世界游戏之间的差距——
这类游戏往往没有特定的“通关标准”,而是由玩家在其中自由探索,而传统的游戏智能体常被用来完成特定目标。
此外,LARP的重点是突出模拟,使得智能体的行为更接近人类,为此研究者甚至特意引入了遗忘机制。
那么,LARP具体如何实现?马上就来一探究竟。
多模块协同控制智能体
LARP的结构是模块化的,具体包括了认知、人格、记忆、决策等组成部分。
其中,记忆模块又由长期记忆、工作(短期)记忆和记忆处理系统三个部分组成。
流程上,角色观察到的环境等信息会以自然语言形式输入记忆处理模块,经过编码转换并结合提取到的长期记忆,形成工作记忆;
然后工作记忆会输入到决策模块,最终产生决策或对话内容。
决策模块的一个特点是会将一项大的目标拆解成子任务,同时利用其中的语言模型确定子任务的执行顺序。
模型所做出的决策,会通过环境交互模块调用API来执行,必要时还会调用回溯模块进行代码重建;
执行成功后,角色的新技能会被储存,成为新的长期记忆。
在长期记忆的提取的过程中,人物会根据观察到的内容进行自我提问,并通过逻辑语句、向量相似度和句子相似度三个维度进行查询,从而提取答案。
其中逻辑语句用于语义(semantic)记忆的查询,后两者则用来查询情景(episodic)记忆。
语义记忆是关于世界的一般性概念和事实知识,包含了游戏规则和相关世界观;情景记忆则是游戏中的具体事件,与特定场景和经历相关。
前者内容相对固定,而后者则会根据Agent的经历不断积累。
为了让LARP控制的智能体更像真人,研究团队还特意引入了随时间变化的遗忘机制。
当衰减参数σ超过一定阈值时,记忆提取会失败,从而模拟遗忘过程,σ的计算方式则是依据心理学定律设定的:
σ = αλN (1 + βt) - ψ
λ代表记忆的重要性程度,N表示提取次数,t代表最后一次提取后经过的时间,ψ是角色自身的遗忘速率,α和β为缩放参数
这一公式由心理学家Wayne Wickelgren提出,是对艾宾浩斯遗忘曲线的一个补充。
而在人物性格的塑造上,研究人员在体现不同性格的数据集上预训练出了基础模型,并用专门构建的指令数据集进行监督微调。
同时,团队还为角色的不同能力设计了多个数据集并训练出了低秩适配模型,并于基础模型动态整合,指导决策模块生成符合人设的内容。
同时,LARP中还设置了行动验证和冲突识别模块,确保模型为agent生成的内容受游戏环境数据和先验知识规范约束。
目前,LARP的GitHub页面已经建立,不过还处于空仓状态,代码暂未发布。
随着大模型研究的深入,智能体和群体智能实验如今已成AI研究最热门方向之一。
比如去年爆火的斯坦福AI小镇、清华推出的“AI游戏公司”和“AI狼人杀”,都让人们看到了多智能体协同的效益。
关于智能体的更多内容,量子位智库推出的《2023十大前沿科技报告中》也有详细介绍。
论文地址:https://arxiv.org/abs/2312.17653
到这里,我们也就讲完了《AI小镇中的NPC居民以真人角色扮演,仿佛进入《我的世界》》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于AI,技术的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
319 收藏
-
117 收藏
-
396 收藏
-
350 收藏
-
263 收藏
-
448 收藏
-
229 收藏
-
182 收藏
-
479 收藏
-
485 收藏
-
344 收藏
-
231 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习