Pursuit-evasion game strategy of USV based on deep reinforcement learning in complex multi-obstacle environment

强化学习 障碍物 模仿 计算机科学 人工智能 逃避(道德) 趋同(经济学) 过程(计算) 集合(抽象数据类型) 理论(学习稳定性) 点(几何) 避障 机器学习 机器人 移动机器人 数学 心理学 经济 法学 免疫学 生物 程序设计语言 经济增长 免疫系统 政治学 社会心理学 几何学 操作系统
作者
Xiuqing Qu,Wenhao Gan,Dalei Song,Liqin Zhou
出处
期刊:Ocean Engineering [Elsevier BV]
卷期号:273: 114016-114016 被引量:15
标识
DOI:10.1016/j.oceaneng.2023.114016
摘要

Aiming at the confrontation game problems between pursuit-evasion unmanned surface vehicles under complex multi-obstacle environment, a pursuit-evasion game strategy is proposed. Firstly, the multi-obstacle environment is set up, and the gaming situation can be judged by the perception between pursuit-evasion USVs. For the pursuers, the model training is performed based on multi-agent deep reinforcement learning, so that they can quickly plan a reasonable obstacle avoidance and pursuit route, and form an effective encirclement posture before the evader approaches the target point. Meanwhile, the credit assignment problem among the members of the pursuing group is considered. For the evader, deep reinforcement learning is combined with imitation learning to train the escape model, so that it can reach the preset point in as short a time as possible and avoid the obstacles on the way. Finally, an adversarial-evolutionary game training method under multiple random scenarios is designed and combined with curriculum learning to iteratively update the pursuit and escape models. Through the detailed comparative analysis of the model training process and simulation experiments, it is proved that the proposed two types of models have higher convergence efficiency and stability, and they can have higher intelligence to pursue, escape and avoid obstacles respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
飘逸的天佑完成签到 ,获得积分10
1秒前
科研通AI5应助Dora.Y采纳,获得10
1秒前
3秒前
3秒前
那地方发布了新的文献求助100
3秒前
4秒前
陈念发布了新的文献求助10
4秒前
孤烟完成签到,获得积分20
4秒前
Hello应助Yancy采纳,获得10
6秒前
大气的紫萍给大气的紫萍的求助进行了留言
6秒前
6秒前
还没想好完成签到,获得积分10
6秒前
英姑应助郝剑身采纳,获得10
7秒前
8秒前
8秒前
禹平露发布了新的文献求助10
8秒前
王一一发布了新的文献求助10
8秒前
薄荷油发布了新的文献求助10
9秒前
科研通AI2S应助贺英采纳,获得10
9秒前
9秒前
SnaiLinsist发布了新的文献求助10
9秒前
9秒前
9秒前
无限的FF发布了新的文献求助30
10秒前
科研通AI5应助Ree采纳,获得30
10秒前
dx3906发布了新的文献求助10
11秒前
完美世界应助qq.com采纳,获得10
11秒前
12秒前
今后应助Lin采纳,获得10
12秒前
万能图书馆应助77采纳,获得10
12秒前
朴实剑通发布了新的文献求助10
13秒前
13秒前
完美世界应助青木蓝采纳,获得10
13秒前
lizhiqian2024发布了新的文献求助10
13秒前
六月发布了新的文献求助10
14秒前
科研通AI5应助zane采纳,获得10
14秒前
木鸽子发布了新的文献求助10
15秒前
DMC北风过境完成签到,获得积分10
15秒前
香蕉觅云应助体贴的采蓝采纳,获得10
16秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 (PDF!) 1000
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3787003
求助须知:如何正确求助?哪些是违规求助? 3332619
关于积分的说明 10256691
捐赠科研通 3047851
什么是DOI,文献DOI怎么找? 1672796
邀请新用户注册赠送积分活动 801549
科研通“疑难数据库(出版商)”最低求助积分说明 760271