Learning-Based Policy Optimization for Adversarial Missile-Target Assignment

强化学习 计算机科学 样品(材料) 数学优化 比例(比率) 控制(管理) 最优化问题 人工智能 对抗制 功能(生物学) 导弹 工程类 算法 数学 化学 物理 色谱法 量子力学 进化生物学 生物 航空航天工程
作者
Weilin Luo,Jinhu Lü,Kexin Liu,Lei Chen
出处
期刊:IEEE transactions on systems, man, and cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:52 (7): 4426-4437 被引量:29
标识
DOI:10.1109/tsmc.2021.3096997
摘要

The missile-target assignment (MTA) is a typical weapon-target assignment problem in Command and Control of modern warfare. Despite the significance of the problem, traditional algorithms still lack efficiency, solution quality, and practicability in the adversarial environment. In this article, we propose a data-driven policy optimization with deep reinforcement learning (PODRL) for the adversarial MTA. We design a comprehensive reward function to motivate the optimization of assignment policy. As such, the learned policy can implicitly model the penetration of missiles under an adversarial environment in a data-driven way. We also present a fair sample strategy to improve the sample efficiency and accelerate the policy optimization. Experimental results show that PODRL can adaptively generate satisfactory solutions in both small-scale and large-scale instances. Furthermore, we evaluate the effectiveness of PODRL in a multiobjective scenario. The result demonstrates that a well-optimized policy can achieve high-quality allocation and demand forecast of the missile resources simultaneously.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
自信的九娘完成签到,获得积分10
1秒前
3秒前
X519664508完成签到,获得积分0
3秒前
雪花发布了新的文献求助80
5秒前
可爱的函函应助调皮从云采纳,获得10
5秒前
LL666完成签到 ,获得积分10
5秒前
蛋堡完成签到 ,获得积分10
6秒前
zimo完成签到,获得积分10
8秒前
靖哥哥发布了新的文献求助10
8秒前
8秒前
11秒前
车宇完成签到 ,获得积分10
11秒前
星辰大海应助lvshiwen采纳,获得10
11秒前
若冰完成签到,获得积分10
13秒前
小屁孩完成签到,获得积分10
13秒前
14秒前
流口水完成签到,获得积分10
14秒前
圆圆完成签到 ,获得积分10
15秒前
幽默的友灵完成签到,获得积分10
15秒前
小屁孩发布了新的文献求助10
16秒前
小南完成签到 ,获得积分10
16秒前
19秒前
123321完成签到 ,获得积分10
19秒前
qqqqqqy完成签到,获得积分10
20秒前
_ban发布了新的文献求助10
20秒前
虎妞完成签到 ,获得积分10
25秒前
微笑的井完成签到 ,获得积分10
25秒前
xiaojingbao发布了新的文献求助10
25秒前
79完成签到 ,获得积分10
26秒前
动听煎饼完成签到 ,获得积分10
26秒前
飞雪完成签到,获得积分10
27秒前
圈圈应助落后书竹采纳,获得10
27秒前
xr完成签到 ,获得积分10
29秒前
嘟嘟豆806完成签到 ,获得积分10
31秒前
霍师傅发布了新的文献求助10
31秒前
简单的元珊完成签到,获得积分10
31秒前
脑洞疼应助xiaojingbao采纳,获得10
32秒前
诚心寄凡发布了新的文献求助100
32秒前
科研通AI2S应助Bob2采纳,获得10
33秒前
Lazarus_x完成签到,获得积分10
39秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779389
求助须知:如何正确求助?哪些是违规求助? 3324920
关于积分的说明 10220490
捐赠科研通 3040099
什么是DOI,文献DOI怎么找? 1668560
邀请新用户注册赠送积分活动 798721
科研通“疑难数据库(出版商)”最低求助积分说明 758522