Deep Transfer Reinforcement Learning for Beamforming and Resource Allocation in Multi-Cell MISO-OFDMA Systems

正交频分多址 计算机科学 副载波 资源配置 波束赋形 正交频分复用 人工神经网络 强化学习 信道分配方案 电信线路 无线网络 光谱效率 分布式计算 无线 计算机网络 频道(广播) 人工智能 电信
作者
Xiaoming Wang,Gaoxiang Sun,Yuanxue Xin,Ting Liu,Youyun Xu
出处
期刊:IEEE Transactions on Signal and Information Processing over Networks 卷期号:8: 815-829 被引量:2
标识
DOI:10.1109/tsipn.2022.3208432
摘要

Orthogonal frequency division multiple access (OFDMA) is one of the promising technologies to satisfy the huge access demand and high data-rate requirement of the fifth generation (5G) networks. In this paper, we study the joint beamforming coordination and resource allocation in the downlink multi-cell multiple-input single-output OFDMA (MISO-OFDMA) systems. First, we divide the allocation framework into beamforming coordination and power allocation (BCPA) module and subcarrier allocation (SA) module. Then, we design a multi-agent deep Q-network (MADQN) algorithm for the allocation framework. Furthermore, we propose a MADQN-based transfer learning framework using knowledge distillation, which is called transfer learning-MADQN (TL-MADQN), to improve the adaptability of neural networks for different wireless schemes. TL-MADQN exploits neural networks and their parameters distilled from pre-trained agents and the experience collected from new agents so that the new agents complete their training process effectively and quickly in the new network environment. Finally, we adjust the allocation policy to maximize the sum data-rate for all users by updating the weights of each neural network. Simulation results show that the proposed MADQN algorithm achieves better performance than the baseline algorithms. Moreover, our TL-MADQN framework further improves the convergence speed and data-rate, which validates its effectiveness and superiority.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
栗子完成签到 ,获得积分10
2秒前
大个应助小冰采纳,获得30
2秒前
orixero应助乌拉拉采纳,获得10
2秒前
3秒前
acadedog发布了新的文献求助10
4秒前
4秒前
5秒前
5秒前
Jasper应助李艳霞采纳,获得10
5秒前
Hawnyoung完成签到,获得积分10
6秒前
arniu2008发布了新的文献求助10
6秒前
6秒前
mountainbike完成签到,获得积分10
6秒前
鑫鑫发布了新的文献求助10
8秒前
8秒前
tiantian完成签到,获得积分10
8秒前
欢乐谷发布了新的文献求助10
8秒前
xiaolizi发布了新的文献求助10
9秒前
鹊起惊梦发布了新的文献求助10
9秒前
橙子发布了新的文献求助10
9秒前
9秒前
10秒前
panda发布了新的文献求助10
10秒前
11秒前
最後まで完成签到,获得积分10
12秒前
13秒前
13秒前
13秒前
15秒前
16秒前
16秒前
Davidjin完成签到,获得积分10
17秒前
ogotho完成签到,获得积分20
18秒前
李艳霞发布了新的文献求助10
18秒前
水沐林泽发布了新的文献求助20
18秒前
20秒前
SciGPT应助橘子和柚子采纳,获得10
20秒前
luan完成签到,获得积分10
21秒前
鹊起惊梦完成签到,获得积分10
23秒前
高分求助中
Psychopathic Traits and Quality of Prison Life 1000
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6452988
求助须知:如何正确求助?哪些是违规求助? 8264588
关于积分的说明 17612294
捐赠科研通 5518381
什么是DOI,文献DOI怎么找? 2904263
邀请新用户注册赠送积分活动 1881074
关于科研通互助平台的介绍 1723455