亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

NROWAN-DQN: A stable noisy network with noise reduction and online weight adjustment for exploration

强化学习 计算机科学 理论(学习稳定性) 噪音(视频) 正规化(语言学) 降噪 还原(数学) 人工智能 数学优化 机器学习 数学 几何学 图像(数学)
作者
Shuai Han,Wenbo Zhou,Jing Liu,Shuai Lü
出处
期刊:Expert Systems With Applications [Elsevier]
卷期号:203: 117343-117343 被引量:5
标识
DOI:10.1016/j.eswa.2022.117343
摘要

Deep reinforcement learning has been applied more and more widely nowadays, especially in various complex control tasks. Noise is vital to reinforcement learning exploration. The appropriate noise not only avoids local optimum solutions due to the lack of exploration, but also prevents unstable learning caused by excessive perturbations. Noisy networks can bring more efficient exploration to reinforcement learning. They enable agents to take actions more randomly at the start of training and tend to make the agents produce stable outputs in the subsequent learning. However, this tendency is not always enough to find a stable policy for an agent, which decreases the efficiency and stability. To address this issue, this paper proposes NROWAN-DQN, i.e., Noise Reduction and Online Weight Adjustment NoisyNet-DQN. Firstly, we develop a novel noise regularization method for NoisyNet-DQN to reduce the noise of output layers. Secondly, we design an online weight adjustment strategy for noise reduction. Finally, we evaluate this algorithm in four standard domains and analyze properties of hyper-parameters. Our results show that NROWAN-DQN outperforms prior algorithms in all these domains. In addition, NROWAN-DQN also shows better stability. The variance of the NROWAN-DQN score is significantly reduced, especially in some action-sensitive environments. This means that in some environments where high stability is required, NROWAN-DQN will be more appropriate than NoisyNet-DQN.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
28秒前
32秒前
36秒前
八轩发布了新的文献求助10
42秒前
苏苏发布了新的文献求助30
45秒前
SOLOMON举报忆年慧逝求助涉嫌违规
47秒前
苏苏完成签到,获得积分10
53秒前
畅快代柔完成签到 ,获得积分10
1分钟前
syyzm给syyzm的求助进行了留言
1分钟前
1分钟前
汉堡包应助Vincy采纳,获得10
1分钟前
HS完成签到,获得积分10
1分钟前
2分钟前
2分钟前
2分钟前
牛牛发布了新的文献求助10
2分钟前
3分钟前
wenbo完成签到,获得积分10
3分钟前
大模型应助牛牛采纳,获得10
4分钟前
4分钟前
SOLOMON举报tttt求助涉嫌违规
4分钟前
学术Bond发布了新的文献求助10
4分钟前
4分钟前
招水若离完成签到,获得积分10
4分钟前
4分钟前
隐形曼青应助学术Bond采纳,获得10
4分钟前
syyzm完成签到,获得积分10
4分钟前
牛牛发布了新的文献求助10
4分钟前
syyzm发布了新的文献求助10
4分钟前
风说喜欢你关注了科研通微信公众号
5分钟前
姚老表完成签到,获得积分10
5分钟前
5分钟前
SOLOMON应助小胡采纳,获得10
5分钟前
5分钟前
6分钟前
6分钟前
寒冷的绾绾完成签到 ,获得积分10
6分钟前
学术Bond发布了新的文献求助10
6分钟前
SOLOMON应助joseneo采纳,获得10
6分钟前
6分钟前
高分求助中
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 800
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
毛泽东著作版本导论 500
Ellis Washington, The Nuremberg Trials: Last Tragedy of the Holocaust 500
Active principle of croton oil. VII. Phorbol 500
The three stars each: the Astrolabes and related texts 500
Emily Hahn, China to Me: A Partial Autobiography 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2445197
求助须知:如何正确求助?哪些是违规求助? 2121138
关于积分的说明 5392664
捐赠科研通 1849511
什么是DOI,文献DOI怎么找? 920181
版权声明 562089
科研通“疑难数据库(出版商)”最低求助积分说明 492176