Deep Reinforcement Learning-Based Resource Allocation for Multi-UAV-Assisted Full-Duplex Wireless-Powered IoT Networks

强化学习 计算机科学 无线 资源配置 概率逻辑 数学优化 无线网络 计算机网络 分布式计算 人工智能 电信 数学
作者
Rui Tang,Ruizhi Zhang,Yongjun Xu,Chau Yuen
出处
期刊:IEEE Transactions on Cognitive Communications and Networking [Institute of Electrical and Electronics Engineers]
卷期号:10 (6): 2236-2251 被引量:6
标识
DOI:10.1109/tccn.2024.3407096
摘要

In this paper, we investigate a resource allocation problem for a multi-unmanned aerial vehicle (UAV)-assisted full-duplex wireless-powered Internet-of-things (IoT) network, where the slot partition, power allocation, user association, and three dimensional (3D) UAV placement are jointly considered to maximize the sum bit rate of all IoT devices under the imperfect self-interference cancellation and generalized probabilistic air-ground channel model. To deal with the formulated mixed-integer non-convex problem, we propose a novel resource allocation strategy with three nested parts by integrating the model-based optimization theory with the data-based learning theory. Particularly, the data-based deep deterministic policy gradient algorithm is only explicitly used to train the 3D UAV placement policy, while the model-based Lagrange dual theory and matching theory are implicitly used to explore the hidden tractability of the rest two parts and design efficient algorithms, where the optimization results are passed onto the data-based part through reward values. Simulation results show that the proposed strategy greatly cuts down the execution time of the exhausting search-based genetic algorithm by 4 orders of magnitude at the cost of less than 5.1 percent performance loss.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
haojiaolv完成签到,获得积分10
刚刚
陈博士发布了新的文献求助10
1秒前
大轩发布了新的文献求助10
1秒前
皮老师发布了新的文献求助10
3秒前
汉堡包应助元素分希怡采纳,获得10
3秒前
酷波er应助杰么酷采纳,获得10
5秒前
烟花应助学术小垃圾采纳,获得10
5秒前
7秒前
April完成签到 ,获得积分10
8秒前
8秒前
orixero应助陈博士采纳,获得10
8秒前
8秒前
renshiq完成签到,获得积分10
8秒前
万默完成签到 ,获得积分10
12秒前
寒冷寻桃发布了新的文献求助10
12秒前
12秒前
13秒前
自然芷文发布了新的文献求助10
13秒前
14秒前
慕青应助Rn采纳,获得10
14秒前
杰么酷完成签到,获得积分20
14秒前
善学以致用应助杨舒舒采纳,获得10
15秒前
云草发布了新的文献求助10
17秒前
愉快的真发布了新的文献求助30
17秒前
NexusExplorer应助科研通管家采纳,获得10
18秒前
科研通AI5应助科研通管家采纳,获得10
18秒前
18秒前
许甜甜鸭应助科研通管家采纳,获得20
18秒前
852应助科研通管家采纳,获得10
18秒前
酷波er应助科研通管家采纳,获得10
18秒前
打打应助科研通管家采纳,获得10
18秒前
传奇3应助科研通管家采纳,获得10
18秒前
18秒前
19秒前
诺贝尔发布了新的文献求助10
20秒前
Biubiu完成签到 ,获得积分10
20秒前
U2发布了新的文献求助20
20秒前
21秒前
21秒前
自然谷波发布了新的文献求助30
22秒前
高分求助中
Mass producing individuality 600
非光滑分析与控制理论 500
Разработка метода ускоренного контроля качества электрохромных устройств 500
A Combined Chronic Toxicity and Carcinogenicity Study of ε-Polylysine in the Rat 400
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
Effect of clapping movement with groove rhythm on executive function: focusing on audiomotor entrainment 200
The Oxford Handbook of Video Game Music and Sound 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3826255
求助须知:如何正确求助?哪些是违规求助? 3368692
关于积分的说明 10451867
捐赠科研通 3088099
什么是DOI,文献DOI怎么找? 1698959
邀请新用户注册赠送积分活动 817222
科研通“疑难数据库(出版商)”最低求助积分说明 770100