讯享网
让LLM驱动游戏能解决什么问题?
游戏界有一种说法:过去20年的游戏在核心玩法上的创新是缓慢的,绝大多数的创新发生在技术上。
开发者在游戏内提供更大的地图,更精致的画面,庞大的细节。其中的主要目的之一是为玩家提供「沉浸感」。当玩家在游戏世界里得到自己所期望的反馈时,会获得庞大的满足感。
然而,由于技术的限制,过去的创新并没有涉足游戏的一个核心方面:世界与NPC的运行逻辑。
当玩家与世界和NPC的互动超出了规则设定的范畴时,玩家将无法获得反馈,从而产生巨大的落差。游戏界称这种体验为Breaking Immersion。
过去的开发者使出了千方百计来避免玩家产生违和感。
以荒野大镖客2为例,由于R星将immersive作为其开发的首要原则,导致其花费了8年时间,为游戏世界添加了无数的逻辑与细节,整个开发花费近5.4亿刀,可见其难度与成本。
大型语言模型(LLM,Large Language Model)的普及可能改变这一现状
大模型可以为游戏世界的运行与NPC的行为提供逻辑,帮助游戏理解玩家的行为,让游戏世界在可信的状态下稳定运行。由此从根本上提升玩家的沉浸感。
将LLM用在游戏里需要几步?
我们把LLM在游戏中的应用分为两部分:
·World:与游戏环境的交互
·Agent:与NPC的交互
具体来说:
World中包含:
·游戏的世界观
·地图上具体的地点
Agent则包括:
·Persona:人物性格
·Memory:NPC记忆
·Planning:决定NPC将要采取哪些动作(Action)
让LLM理解游戏世界与环境
为了让ChatGPT理解我们游戏的世界观,我们引入一段Prompt:
export const worldHistory =
你所在的大陆名为“大唐王朝”。这是一个神话与现实交织的世界。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 主岛上有五个重要的地点。最大的是“长安城”,是国家的政治、经济和文化中心,城墙之内有各种店铺和庙宇。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 接着是“五指山”,孙悟空曾被压在此山下。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 此外还有“草庙村”,“高老庄”和“女儿村”,这些地方都是唐僧和他的徒弟们在旅程中遇到的挑战和冒险。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 东边的小岛上则是一个隐秘的佛教圣地,称为“灵山”,这是四人取经的终点。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 两个岛屿间有一座长长的桥梁,名为“通天河”,是由沙僧的金箍棒变化而成。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> ;
export const worldKnowledge = “”;
222: {
description: 位于主岛的西北边缘。西面是汪洋大海,东面则是高原的悬崖。周围有几棵树和一片怪物出没的长草地。往南则是长安城的方向。,
mapId: 222,
},
254: {
description: 位于主岛的东北边缘。东面是海洋,西面是高原的悬崖。附近有几棵树和常有妖怪出没的长草地。长安城就在南边。,
mapId: 254,
},
188: {
description: 是高原上的森林区。森林里树木茂密,有几片怪物常出没的长草地。长安城就在南边。,
mapId: 188,
},
190: {
description: 位于高原的一片森林中。你正站在一个维护得相当好的小木屋前。四周是茂密的树木和怪物常出没的草地。长安城就在南边。,
mapId: 190,
},
220: {
description: 长安城,主岛上的城镇。,
mapId: 220,
},
…….
上述Prompts为地图的每个块都提供了文字描述,从而得以让ChatGPT理解地图上的每个地点:
[完整地图]
让LLM驱动NPC
首先,我们要让LLM知道他现在正在扮演一个NPC:
export const npcSharedPrompt = 你正在扮演“西游记”中的一个角色。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">这是一个2D的神话世界,玩家和你都可以在这片大陆上进行探索。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">你可以与其他的角色交流,如唐僧、孙悟空、猪八戒和沙僧,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">并与妖怪发起战斗、参观村庄或神庙、购买法宝或草药。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">在这个世界里,与妖怪的战斗是旅程的一部分,但目标是取得真经,使世界充满和平。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">妖怪虽然凶恶,但并不是绝对的恶,与他们战斗既是为了保护自己,也是希望能够教化他们。</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;">你的角色不知道现实世界的存在,只知道他在这神话的旅程中的使命。;
{
id: 1,
name: “唐僧”,
description: “唐僧,本名唐三藏,是中国古典小说《西游记》中的主要人物之一。他是一个决心强烈、智慧和信念的僧人,出发去西天取经。”,
age: 40,
starSign: “pisces”,
money: 100,
items: [“jingwulian”],
personalHistory: 你是唐僧,一个被派来从印度取经的僧人。你的任务是获取佛教经文,将它们带回中国。,
personalKnowledge: “你知道你的三个徒弟:孙悟空、猪八戒和沙和尚。他们各自都有独特的能力和历史。”,
conversation: new ConversationModel(),
startingPos: new Vec2(32, 38),
upSprites: TypedAssets.spriteSheets.momup,
downSprites: TypedAssets.spriteSheets.momdown,
leftSprites: TypedAssets.spriteSheets.momleft,
rightSprites: TypedAssets.spriteSheets.momright,
}
{
id: 2,
name: “女儿国国王”,
description: “女儿国国王是《西游记》中的一个角色。她是女儿国的统治者,对唐僧产生了浓厚的兴趣。”,
age: 35,
starSign: “virgo”,
money: 500,
items: [“elixir of life”],
personalHistory: 你是女儿国的国王,你的国家只有女性。当你听说了唐僧的到来,你决定要与他结婚。,
personalKnowledge: “你知道唐僧是一个高贵的和尚,他正在进行取经之旅。”,
conversation: new ConversationModel(),
startingPos: new Vec2(23, 47),
upSprites: TypedAssets.spriteSheets.carolup,
downSprites: TypedAssets.spriteSheets.caroldown,
leftSprites: TypedAssets.spriteSheets.carolleft,
rightSprites: TypedAssets.spriteSheets.carolright,
},
{
id: 3,
name: “牛魔王”,
….
每个NPC的核心在于:
1、 其独特的人格 - 我们引入了一系列属性来定制其人格:description,personal history,personal knowledge,年龄,星座等等。
2、一系列可以与玩家交互的属性/道具:钱,道具(items)。
3、记忆:我们在这就用每个NPC的对话记录作为其所有的记忆。当然还可以把NPC之前的所有action也加入记忆。
[人格驱使角色提供定制的对话]
[有时候的对话甚至会自带旁白]
为了让ChatGPT给出定制的对话,我们需要提供的包括:
const fullPrompt = generalContent + personalContent + currentState;
1. generalContent:
const generalContent = npcSharedPrompt + worldHistory + worldKnowledge;
2. personalContent
const personalContent = Your name is ${npc.name}, ${npc.age} years old, you have the personality of a ${npc.starSign}.</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> You have ${npc.money} fictional dollars. ${npc.personalHistory} ${npc.personalKnowledge}</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> ${storySoFar}</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> ;
3. currentState
const prompt = ${timeMsg} at ${envDescription}, What would ${npc.name} say to 悟空? (Keep the response short and just the words your character says)
实现NPC与玩家的互动 - 动作:
content: 悟空 replies "${replyText}". What would you like to do?</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 1: 让悟空跟着你,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 2: 你向他告别,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 3: 继续当前对话,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> Pick an action from the list above. respond with just the number for the action,
}];
我们为NPC提供一系列可选择的工作,ChatGPT将决定NPC的下一步行动。这里的prompt同样包含了位置,时间,对话历史等信息,但为了简洁暂略去。
[这里ChatGPT让牛魔王带领孙悟空前往下一地点]
实现NPC的记忆 - 让NPC记住和玩家的所有互动对话:
1、 每次NPC与玩家对话后,ChatGPT将生成本次对话的重点(也就是摘要):
// summarize conversation
const summary = await this.summarizeConversation(conversation, endConversationText);
const updatedConversation: IConversationModel = {
isActive: false,
history: […conversation.history, { msg: Conversation summary: ${summary} }],
messages: [],
};
[在之前发生剧情之后,牛魔王根据记忆选择用「真经」来发起对话]
与NPC的道具互动
[问八戒要点饼子吃]
避免NPC/玩家搞花活导致产生风险内容
这里我们让ChatGPT来判断玩家/NPC的回复是否特别离谱,如果特别离谱则应拒绝正经回答!
private async validateReply(replyText: string, conversation: IConversationModel): Promise{
const promptMsgs: GptMessage[] = […this.mapToGptMessages(conversation), {
role: “user”,
content: 悟空 replies "${replyText}". Does his response make sense. On this scale of 1 to 5,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 1: Response is non-sensical,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 2: Response is immersion breaking or meta and acknowledging this is a game,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 3. Reponse is bad, unnecessarily vulgar for no reason based on the past conversation</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 4: Response is all right, and something someone might say but unlikely,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> 5: Response is good and mostly in context of the game world,</span></p><p style="text-wrap: wrap;"><span style="font-size: 12px;"> how would you rate the response, give a one sentence reason why,
}];
以上。本人对LLM在游戏中的使用十分乐观,这么简单的demo我乐此不疲的玩了很久。
从技术上来说,这个demo整体的框架还算比较完整,很适合在此基础上删删改改,实验各种agent的方法和prompt等。
此外由于demo是用react实现,这里推荐大家观看2小时的react入门视频,从而无缝上手。
注:作者目前为萨里大学在读博士
完整的代码参见:
https://github.com/liyucheng09/ChatGPT_Agent
知乎主页:
https://www.zhihu.com/people/li-yu-cheng-15
∎ 互动有奖!
我们将在2023年11月16日抽出2名幸运粉丝,分别送出100Q币。参与方式如下:
①点击文末右下角的“在看”
②评论留言
③发送关键词“打卡”至公众号后台完成验证
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/208666.html