Multi-Agent Reinforcement Learning in NOMA-Aided UAV Networks for Cellular Offloading

计算机科学 弹道 强化学习 无线网络 漫游 蜂窝网络 吞吐量 无线 诺玛 聚类分析 趋同(经济学) 数学优化 算法 实时计算 计算机网络 人工智能 电信线路 物理 电信 经济增长 经济 数学 天文
作者
Ruikang Zhong,Xiao Liu,Yuanwei Liu,Yue Chen
出处
期刊:IEEE Transactions on Wireless Communications [Institute of Electrical and Electronics Engineers]
卷期号:21 (3): 1498-1512 被引量:36
标识
DOI:10.1109/twc.2021.3104633
摘要

A novel framework is proposed for cellular offloading with the aid of multiple unmanned aerial vehicles (UAVs), while non-orthogonal multiple access (NOMA) technique is employed at each UAV to further improve the spectrum efficiency of the wireless network. The optimization problem of joint three-dimensional (3D) trajectory design and power allocation is formulated for maximizing the throughput. Since ground mobile users are considered as roaming continuously, the UAVs need to be re-deployed timely based on the movement of users. In an effort to solve this pertinent dynamic problem, a K-means based clustering algorithm is first adopted for periodically partitioning users. Afterward, a mutual deep Q-network (MDQN) algorithm is proposed to jointly determine the optimal 3D trajectory and power allocation of UAVs. In contrast to the conventional deep Q-network (DQN) algorithm, the MDQN algorithm enables the experience of multi-agent to be input into a shared neural network to shorten the training time with the assistance of state abstraction. Numerical results demonstrate that: 1) the proposed MDQN algorithm is capable of converging under minor constraints and has a faster convergence rate than the conventional DQN algorithm in the multi-agent case; 2) The achievable sum rate of the NOMA enhanced UAV network is 23% superior to the case of orthogonal multiple access (OMA); 3) By designing the optimal 3D trajectory of UAVs with the MDON algorithm, the sum rate of the network enjoys 142% and 56% gains than invoking the circular trajectory and the 2D trajectory, respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
通通通完成签到,获得积分10
1秒前
2秒前
甜蜜寄文完成签到 ,获得积分10
2秒前
猴子完成签到,获得积分10
5秒前
9秒前
12秒前
洲洲完成签到 ,获得积分10
12秒前
阔达的水壶完成签到 ,获得积分10
13秒前
米奇发布了新的文献求助10
13秒前
李爱国应助llg采纳,获得10
14秒前
平淡的天宇完成签到,获得积分10
14秒前
moon发布了新的文献求助10
17秒前
17秒前
19秒前
pluto应助星辰采纳,获得20
22秒前
谢富杰发布了新的文献求助10
23秒前
cgs完成签到 ,获得积分10
25秒前
Lojong完成签到,获得积分10
25秒前
26秒前
韩hqf发布了新的文献求助10
27秒前
28秒前
Lucas应助研友_89Nm7L采纳,获得50
30秒前
搜集达人应助潇洒的平松采纳,获得10
30秒前
超爱茶多酚完成签到,获得积分10
30秒前
ChiMing发布了新的文献求助20
33秒前
科研通AI5应助tdtk采纳,获得10
37秒前
烟花应助baolongzhan采纳,获得30
38秒前
自信安荷完成签到,获得积分10
40秒前
ChiMing完成签到,获得积分20
43秒前
乐乐应助科研通管家采纳,获得10
44秒前
科研通AI5应助科研通管家采纳,获得10
44秒前
上官若男应助科研通管家采纳,获得10
44秒前
orixero应助科研通管家采纳,获得10
44秒前
彭于晏应助科研通管家采纳,获得10
45秒前
科研通AI2S应助科研通管家采纳,获得10
45秒前
机灵柚子应助科研通管家采纳,获得10
45秒前
英俊的铭应助科研通管家采纳,获得10
45秒前
大个应助科研通管家采纳,获得10
45秒前
搜集达人应助科研通管家采纳,获得10
45秒前
研友_VZG7GZ应助科研通管家采纳,获得10
45秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Fashion Brand Visual Design Strategy Based on Value Co-creation 350
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3777834
求助须知:如何正确求助?哪些是违规求助? 3323321
关于积分的说明 10213925
捐赠科研通 3038575
什么是DOI,文献DOI怎么找? 1667549
邀请新用户注册赠送积分活动 798161
科研通“疑难数据库(出版商)”最低求助积分说明 758290