基于强化学习的UE4 GOAP插件——需求分析与设计

m0_59911267 2022-01-08 20:37:44

一、项目背景

GOAP（Goal-Oriented Action Planning）框架是一种决策架构，通过对智能体制定目标，使智能体根据自己当前所处的状态和环境制定相应的行动计划。与传统游戏当中的FSM有限状态机等方法相比，GOAP框架智能体能够应对更加复杂的游戏场景。当前GOAP插件一般使用A*等算法搜索路径，不能接收过多的状态、动作内容，不能适应某些应用场景，而强化学习于环境、状态、行动、奖励机制的特点完美契合于GOAP框架，本课题将实现一个基于强化学习算法的GoapUE4插件。

二、项目内容

本课题主要是在Ureal engine软件中实现基于goap决策算法的智能npc插件。目标导向型行动计划（GOAP）是代理的一种人工智能系统，让你能够计划一系列行动去满足一个特殊的模板。特殊的行动序列不仅依靠于目标，同时也依靠于世界和代理当前的状态。根据npc在环境中的信息决策出最佳和行动方案或者路线。

三、需求分析

需求类型可分为功能需求、质量需求、设计限制、过程需求，本项目插件分析如下：

四、用例分析

Goap行为插件主要面向游戏开发者和管理员。根据分析，游戏开发者主要可以使用以下功能，有以下用例。

建立自己的游戏场景
根据游戏场景训练算法模型
根据游戏状态获取对应的最优动作输出

五、功能模块图

本人在实践工程中主要负责强化学习算法部分，强化学习算法模块如下。

六、设计

工程实践所使用的设计模式有：

1.代理模式：强化学习算法与Goap插件主体之间是独立的，为降低耦合，采用代理模式。

2.工厂设计模式：Goap插件中定义的动作等所需实例化的对象较多，使用工厂设计模式。

3.单例设计模式：强化学习算法是唯一的，使用单例设计模式。

对应的强化学习场景、算法Agent的UML图如下：

采用的开发平台和框架为：

算法开发平台：Python

强化学习框架：parl/tensorflow

强化学习工具库：gym

服务器：Gpu云服务器

Goap插件开发平台：UE4

演示Demo开发平台：UE4

作者：487

...全文

673 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

格普 UE4 GOAP / AI测试项目简单的执行/启动UE4一个GOAP AI框架的基础上，通过Midgen的GOAPer实现（ - ）。

关于GOAP AI 的源码比较少，本代码为网上下载的一个比较庞大的源码，源码写的很好但是不利于初学者，本人将其重构了一下，删除大部分代码，留下最小的精简版本

一个 GOAP AI 的 Unity 实现 Demo，包含行为做饭、吃饭、写作业、打篮球、休息，根据自身状态和世界状态，获取最佳执行方法

一个 GOAP AI Unity 实现Demo，包含行为买菜，做饭，吃饭。根据自身变化以及世界状态，自动执行行为

# 基于GOAP架构的HalfLife 2机器人行为管理系统 ## 项目简介该项目是一个基于GOAP（Goal Oriented Action Planning）架构的HalfLife 2机器人行为管理系统。GOAP是一种用于创建具有复杂行为的游戏AI（人工智能）的方法，它将AI的行为分解为一系列的动作，并基于目标选择最佳的动作序列。该系统旨在为机器人提供复杂的行为和决策能力，支持Valve的Day of Defeat Source和HalfLife 2 Deathmatch游戏。 ## 项目的主要特性和功能 1. GOAP架构使用GOAP架构来管理机器人的行为，将行为分解为一系列动作，并基于目标选择最佳的动作序列。 2. 动作和状态定义系统中定义了多种动作和状态，如移动、攻击、寻找掩体、重新装载武器等，这些动作和状态用于构建机器人的行为。

代码中的软件工程

571

社区成员

817

社区内容

发帖

与我相关

我的任务

软件工程高校

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

《代码中的软件工程》

《代码中的软件工程》配套资料

试试用AI创作助手写篇文章吧

+ 用AI写文章