清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

A Novel Reinforcement Learning-Based Robust Control Strategy for a Quadrotor

强化学习 稳健性(进化) 计算机科学 水准点(测量) 新颖性 控制理论(社会学) 趋同(经济学) 鲁棒控制 人工智能 财产(哲学) 控制工程 控制(管理) 控制系统 工程类 电气工程 哲学 认识论 经济 化学 基因 生物化学 地理 经济增长 神学 大地测量学
作者
Hean Hua,Yongchun Fang
出处
期刊:IEEE Transactions on Industrial Electronics [Institute of Electrical and Electronics Engineers]
卷期号:70 (3): 2812-2821 被引量:16
标识
DOI:10.1109/tie.2022.3165288
摘要

In this article, a novel reinforcement learning (RL)-based robust control approach is proposed for quadrotors, which guarantees efficient learning and satisfactory tracking performance by simultaneously evaluating the RL and the baseline method in training. Different from existing works, the key novelty is to design a practice-reliable RL control framework for quadrotors in a two-part cooperative manner. In the first part, based on the hierarchical property, a new robust integral of the signum of the error (RISE) design is proposed to ensure asymptotic convergence, which includes the nonlinear and the disturbance rejection terms. In the second part, a one-actor-dual-critic (OADC) learning framework is proposed, where the designed switching logic in the first part works as a benchmark to guide the learning. Specifically, the two critics independently evaluate the RL policy and the switching logic simultaneously, which are utilized for policy update, only when both are positive, corresponding to the remarkable actor-better exploration actions. The asymptotic RISE controller, together with the two critics in OADC learning framework, guarantees accurate judgment on every exploration. On this basis, the satisfactory performance of the RL policy is guaranteed by the actor-better exploration based learning while the chattering problem arisen from the switching logic is addressed completely. Plenty of comparative experimental tests are presented to illustrate the superior performance of the proposed RL controller in terms of tracking accuracy and robustness.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CherylZhao完成签到,获得积分10
4秒前
FloppyWow完成签到 ,获得积分10
22秒前
千帆破浪完成签到 ,获得积分10
29秒前
38秒前
ljlbest1984发布了新的文献求助10
45秒前
zhdjj完成签到 ,获得积分10
47秒前
健忘雁易发布了新的文献求助10
50秒前
59秒前
俊逸的盛男完成签到 ,获得积分10
1分钟前
袁雪蓓完成签到 ,获得积分10
2分钟前
健忘雁易完成签到,获得积分20
2分钟前
2分钟前
房天川完成签到 ,获得积分0
2分钟前
coolplex完成签到 ,获得积分10
2分钟前
沉沉完成签到 ,获得积分0
3分钟前
和谐的夏岚完成签到 ,获得积分10
3分钟前
3分钟前
wjw123发布了新的文献求助10
3分钟前
搜集达人应助wjw123采纳,获得10
3分钟前
wen完成签到,获得积分10
3分钟前
lod完成签到,获得积分10
3分钟前
沙与沫完成签到 ,获得积分10
3分钟前
mzhang2完成签到 ,获得积分10
3分钟前
3分钟前
淡然藏花完成签到 ,获得积分10
3分钟前
4分钟前
无辜的行云完成签到 ,获得积分0
4分钟前
xun完成签到,获得积分20
4分钟前
wjw123发布了新的文献求助10
4分钟前
4分钟前
Raul完成签到 ,获得积分10
5分钟前
愉快竺完成签到 ,获得积分10
5分钟前
5分钟前
5分钟前
庄怀逸完成签到 ,获得积分10
5分钟前
LonelyCMA完成签到 ,获得积分0
5分钟前
6分钟前
黑子完成签到 ,获得积分10
6分钟前
刘刘完成签到 ,获得积分10
6分钟前
cgs完成签到 ,获得积分10
6分钟前
高分求助中
Thinking Small and Large 500
Algorithmic Mathematics in Machine Learning 500
Getting Published in SSCI Journals: 200+ Questions and Answers for Absolute Beginners 300
The Monocyte-to-HDL ratio (MHR) as a prognostic and diagnostic biomarker in Acute Ischemic Stroke: A systematic review with meta-analysis (P9-14.010) 240
Interpretability and Explainability in AI Using Python 200
SPECIAL FEATURES OF THE EXCHANGE INTERACTIONS IN ORTHOFERRITE-ORTHOCHROMITES 200
Null Objects from a Cross-Linguistic and Developmental Perspective 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3833864
求助须知:如何正确求助?哪些是违规求助? 3376300
关于积分的说明 10492595
捐赠科研通 3095843
什么是DOI,文献DOI怎么找? 1704723
邀请新用户注册赠送积分活动 820104
科研通“疑难数据库(出版商)”最低求助积分说明 771859