Deep reinforcement learning-based controller for dynamic positioning of an unmanned surface vehicle

强化学习 稳健性(进化) 无人机 马尔可夫决策过程 运动学 计算机科学 控制理论(社会学) 趋同(经济学) 动态定位 控制工程 人工智能 工程类 马尔可夫过程 控制(管理) 数学 生物化学 化学 统计 物理 经典力学 海洋工程 经济 基因 经济增长
作者
Yuan Wei,X. Rui
出处
期刊:Computers & Electrical Engineering [Elsevier BV]
卷期号:110: 108858-108858 被引量:1
标识
DOI:10.1016/j.compeleceng.2023.108858
摘要

Dynamic positioning (DP) system is of great significance for the unmanned surface vehicle (USV) to achieve fully autonomous navigation. Traditional control schemes have problems such as model accuracy, parameter tuning, and complex design. In addition, although the deep reinforcement learning (DRL) is widely used in the field of vessel motion control, the learning efficiency is not high, and insufficient robustness in the face of changing environmental. In order to improve the anti-disturbance ability, robustness and convergence speed of the controller during training, a deep reinforcement learning control method based on priority experience replay (PER) is proposed for dynamic positioning of the USV. The mathematical models are established based on the kinematic and dynamic of the USV. Markov decision process (MDP) models are constructed according to the DP tasks. The simulation results show that compared with other DRL algorithms, the proposed method has higher reward value, faster convergence speed, higher control precision and smoother control output.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
bob完成签到,获得积分10
1秒前
辛勤谷雪完成签到,获得积分10
5秒前
00完成签到 ,获得积分10
8秒前
嬗变的天秤完成签到,获得积分10
9秒前
lm番茄完成签到,获得积分10
10秒前
Miianlli完成签到 ,获得积分10
10秒前
11秒前
TUTU完成签到,获得积分10
13秒前
swy完成签到,获得积分10
13秒前
夜雨诗意完成签到,获得积分10
13秒前
活力的妙芙完成签到,获得积分10
15秒前
Zlj完成签到 ,获得积分10
15秒前
lm番茄发布了新的文献求助10
16秒前
懒大王完成签到 ,获得积分10
16秒前
自信的高山完成签到,获得积分10
16秒前
吴旭东完成签到,获得积分10
16秒前
hujun完成签到 ,获得积分10
17秒前
糊涂的皮卡丘完成签到 ,获得积分10
18秒前
CometF完成签到 ,获得积分10
18秒前
Mu丶tou完成签到,获得积分10
20秒前
火山暴涨球技完成签到,获得积分10
20秒前
无私诗云完成签到,获得积分10
21秒前
程程完成签到,获得积分10
22秒前
怕孤独的如凡完成签到 ,获得积分10
26秒前
孤独的涵柳完成签到 ,获得积分10
27秒前
28秒前
嘻嘻哈哈啊完成签到 ,获得积分10
28秒前
好好完成签到,获得积分10
28秒前
SOL完成签到,获得积分10
30秒前
cbq完成签到 ,获得积分10
32秒前
千瓦时醒醒完成签到,获得积分10
32秒前
风趣霆完成签到,获得积分10
33秒前
Zhuzhu完成签到 ,获得积分10
33秒前
落叶捎来讯息完成签到 ,获得积分10
34秒前
36秒前
大模型应助高不二采纳,获得10
36秒前
无限的千凝完成签到 ,获得积分10
37秒前
机灵火车完成签到,获得积分10
37秒前
花花完成签到,获得积分10
39秒前
cdercder应助芃123采纳,获得10
39秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3784858
求助须知:如何正确求助?哪些是违规求助? 3330123
关于积分的说明 10244413
捐赠科研通 3045505
什么是DOI,文献DOI怎么找? 1671716
邀请新用户注册赠送积分活动 800627
科研通“疑难数据库(出版商)”最低求助积分说明 759557