The Application of Deep Reinforcement Learning to Distributed Spectrum Access in Dynamic Heterogeneous Environments With Partial Observations

计算机科学 稳健性(进化) 强化学习 人工智能 循环神经网络 频道(广播) 人工神经网络 机器学习 计算机网络 生物化学 基因 化学
作者
Yue Xu,Jianyuan Yu,R. Michael Buehrer
出处
期刊:IEEE Transactions on Wireless Communications [Institute of Electrical and Electronics Engineers]
卷期号:19 (7): 4494-4506 被引量:44
标识
DOI:10.1109/twc.2020.2984227
摘要

This papera 1 investigates deep reinforcement learning (DRL) based on a Recurrent Neural Network (RNN) for Dynamic Spectrum Access (DSA) under partial observations, referred to as a Deep Recurrent Q-Network (DRQN). Specifically, we consider a scenario with multiple independent channels and multiple heterogeneous Primary Users (PUs). Two key challenges in our problem formulation are that we assume our DRQN node does not have any prior knowledge of the other nodes' behavior patterns and attempts to predict the future channel state based on previous observations. The goal of the DRQN is to learn a channel access strategy with a low collision rate but a high channel utilization rate. With proper definitions of the state, action and rewards, our extensive simulation results show that a DRQN-based approach can handle a variety of communication environments including dynamic environments. Further, our results show that the DRQN node is also able to cope with multi-rate and multi-agent scenarios. Importantly, we show the following benefits of using recurrent neural networks in DSA: (i) the ability to learn the optimal strategy in different environments under partial observations; (ii) robustness to imperfect observations and (iii) the ability to utilize multiple channels, and (iv) robustness in the presence of multiple agents. 1 A parton of this work was presented at MILCOM 2018 in [1].
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Chen发布了新的文献求助10
4秒前
zx完成签到 ,获得积分10
12秒前
Chen完成签到,获得积分10
12秒前
酷波er应助科研通管家采纳,获得10
12秒前
cdercder应助科研通管家采纳,获得10
13秒前
lucygaga完成签到 ,获得积分10
18秒前
无为完成签到 ,获得积分10
22秒前
liguanyu1078完成签到,获得积分10
30秒前
辻诺完成签到 ,获得积分10
35秒前
现实的大白完成签到 ,获得积分10
36秒前
50秒前
可玩性完成签到 ,获得积分10
51秒前
51秒前
gabee完成签到 ,获得积分10
52秒前
螃蟹医生发布了新的文献求助10
54秒前
刘建章完成签到 ,获得积分10
54秒前
春天的粥完成签到 ,获得积分10
57秒前
cdercder应助Blessing采纳,获得20
59秒前
xu完成签到 ,获得积分10
59秒前
居里姐姐完成签到 ,获得积分10
1分钟前
1分钟前
腰果虾仁完成签到 ,获得积分10
1分钟前
黑大侠完成签到 ,获得积分10
1分钟前
Veronica Mew完成签到 ,获得积分10
1分钟前
haihuhu完成签到 ,获得积分10
1分钟前
听话的醉冬完成签到 ,获得积分10
1分钟前
blueblue完成签到,获得积分10
1分钟前
r41r32完成签到 ,获得积分10
1分钟前
顾矜应助归零者碳索者采纳,获得10
1分钟前
熬大夜完成签到 ,获得积分10
1分钟前
缘分完成签到,获得积分10
1分钟前
tingalan完成签到,获得积分10
1分钟前
qianchimo完成签到 ,获得积分10
1分钟前
dd完成签到 ,获得积分10
1分钟前
SciGPT应助shin采纳,获得10
1分钟前
JasVe完成签到 ,获得积分10
1分钟前
minuxSCI完成签到,获得积分10
1分钟前
光亮若翠发布了新的文献求助10
1分钟前
wjswift完成签到,获得积分10
1分钟前
齐朕完成签到,获得积分10
2分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3792550
求助须知:如何正确求助?哪些是违规求助? 3336787
关于积分的说明 10282126
捐赠科研通 3053566
什么是DOI,文献DOI怎么找? 1675652
邀请新用户注册赠送积分活动 803629
科研通“疑难数据库(出版商)”最低求助积分说明 761468