亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Hierarchical Reinforcement Learning for UAV-PE Game With Alternative Delay Update Method

强化学习 运动学 趋同(经济学) 计算机科学 纳什均衡 数学优化 过程(计算) 人工神经网络 控制理论(社会学) 人工智能 控制(管理) 数学 经济增长 经典力学 操作系统 物理 经济
作者
Xiao Ma,Yuan Yuan,Lei Guo
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:36 (3): 4639-4651 被引量:11
标识
DOI:10.1109/tnnls.2024.3362969
摘要

This article proposes a novel hierarchical reinforcement learning (HRL) algorithm for unmanned aerial vehicle pursuit-evasion (UAV-PE) game systems with an alternative delay update (ADU) method. In the proposed algorithm, the approximate solutions of the UAV-PE game problem are derived from a hierarchical learning process, which relies on a zero-sum game process of kinematics and a corresponding optimal process of dynamics. In this case, deep neural networks (NNs) are used to approximate the policy and value functions of UAV-PE game systems in kinematics and dynamics level. Furthermore, the ADU method is adopted to improve the training efficiency of deep NN by fixing one player of the UAV-PE game systems to form a stable environment. The goal of this article is to develop an HRL algorithm with an ADU method for obtaining approximate Nash equilibrium (NE) solutions of the considered UAV-PE game systems which are subjected to the coupling of kinematics and dynamics. Subsequently, sufficient conditions are provided for analyzing the convergence and optimality of the proposed HRL algorithm. Moreover, the inequalities of overload are obtained to guarantee that the state of dynamics tracks with the control input of kinematics in UAV-PE game systems. Finally, simulation examples are provided to demonstrate the feasibility and usefulness of the proposed HRL algorithm and ADU method.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
吃了吃了完成签到,获得积分10
1秒前
3秒前
酷波er应助林芟采纳,获得10
3秒前
zachary009完成签到 ,获得积分10
3秒前
何同学完成签到,获得积分10
4秒前
Sunvo完成签到,获得积分10
7秒前
香蕉君达发布了新的文献求助10
8秒前
合一海盗完成签到,获得积分0
11秒前
嗷大喵应助科研通管家采纳,获得150
12秒前
NexusExplorer应助科研通管家采纳,获得100
12秒前
小猫多鱼完成签到,获得积分10
25秒前
万能图书馆应助volcano采纳,获得10
29秒前
sucan发布了新的文献求助30
33秒前
57秒前
angew完成签到,获得积分10
1分钟前
1分钟前
1分钟前
知来者发布了新的文献求助10
1分钟前
shuilongyin2024完成签到,获得积分10
1分钟前
lele完成签到,获得积分10
1分钟前
姜1完成签到 ,获得积分10
1分钟前
花陵完成签到 ,获得积分10
1分钟前
小蘑菇应助jh2000采纳,获得10
1分钟前
1分钟前
知来者完成签到,获得积分10
1分钟前
科研通AI6.4应助天马采纳,获得10
1分钟前
六六完成签到,获得积分20
1分钟前
挺帅一男的完成签到,获得积分10
1分钟前
天天天晴完成签到 ,获得积分10
1分钟前
真的OK发布了新的文献求助10
1分钟前
光催完成签到 ,获得积分10
1分钟前
1分钟前
孙建飞发布了新的文献求助20
1分钟前
英姑应助Raunio采纳,获得10
2分钟前
prof.zhang发布了新的文献求助30
2分钟前
2分钟前
jh2000发布了新的文献求助10
2分钟前
孙建飞完成签到,获得积分10
2分钟前
Metrol_Wang完成签到,获得积分10
2分钟前
英俊的铭应助科研通管家采纳,获得10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6436348
求助须知:如何正确求助?哪些是违规求助? 8250814
关于积分的说明 17550949
捐赠科研通 5494621
什么是DOI,文献DOI怎么找? 2898053
邀请新用户注册赠送积分活动 1874763
关于科研通互助平台的介绍 1715972