清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

AD-VAT+: An Asymmetric Dueling Mechanism for Learning and Understanding Visual Active Tracking

计算机科学 人工智能 强化学习 机制(生物学) 跟踪(教育) 眼动 计算机视觉 对象(语法) 主动视觉 心理学 教育学 认识论 哲学
作者
Fangwei Zhong,Peng Sun,Wenhan Luo,Tingyun Yan,Yizhou Wang
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:43 (5): 1467-1482 被引量:54
标识
DOI:10.1109/tpami.2019.2952590
摘要

Visual Active Tracking (VAT) aims at following a target object by autonomously controlling the motion system of a tracker given visual observations. To learn a robust tracker for VAT, in this article, we propose a novel adversarial reinforcement learning (RL) method which adopts an Asymmetric Dueling mechanism, referred to as AD-VAT. In the mechanism, the tracker and target, viewed as two learnable agents, are opponents and can mutually enhance each other during the dueling/competition: i.e., the tracker intends to lockup the target, while the target tries to escape from the tracker. The dueling is asymmetric in that the target is additionally fed with the tracker's observation and action, and learns to predict the tracker's reward as an auxiliary task. Such an asymmetric dueling mechanism produces a stronger target, which in turn induces a more robust tracker. To improve the performance of the tracker in the case of challenging scenarios such as obstacles, we employ more advanced environment augmentation technique and two-stage training strategies, termed as AD-VAT+. For a better understanding of the asymmetric dueling mechanism, we also analyze the target's behaviors as the training proceeds and visualize the latent space of the tracker. The experimental results, in both 2D and 3D environments, demonstrate that the proposed method leads to a faster convergence in training and yields more robust tracking behaviors in different testing scenarios. The potential of the active tracker is also shown in real-world videos.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
充电宝应助受伤雨南采纳,获得10
刚刚
爆米花应助欣欣采纳,获得10
26秒前
细心白竹完成签到 ,获得积分10
29秒前
naczx完成签到,获得积分0
36秒前
43秒前
B_完成签到,获得积分10
45秒前
受伤雨南发布了新的文献求助10
49秒前
蓝意完成签到,获得积分0
1分钟前
Jasper应助科研通管家采纳,获得10
1分钟前
wanci应助受伤雨南采纳,获得10
2分钟前
冰糖完成签到 ,获得积分10
2分钟前
Tristan完成签到 ,获得积分10
2分钟前
车访枫发布了新的文献求助10
2分钟前
2分钟前
受伤雨南发布了新的文献求助10
2分钟前
2分钟前
优秀怜晴发布了新的文献求助10
2分钟前
FashionBoy应助优秀怜晴采纳,获得10
2分钟前
车访枫完成签到,获得积分10
2分钟前
修辛完成签到 ,获得积分10
3分钟前
玛卡巴卡爱吃饭完成签到 ,获得积分10
3分钟前
心随以动完成签到 ,获得积分10
3分钟前
香蕉觅云应助受伤雨南采纳,获得10
3分钟前
Arctic完成签到 ,获得积分10
3分钟前
吴静完成签到 ,获得积分10
4分钟前
4分钟前
受伤雨南发布了新的文献求助10
4分钟前
受伤雨南完成签到,获得积分10
4分钟前
情怀应助威威采纳,获得10
4分钟前
5分钟前
momo发布了新的文献求助10
5分钟前
5分钟前
威威发布了新的文献求助10
5分钟前
优秀怜晴发布了新的文献求助10
5分钟前
汉堡包应助优秀怜晴采纳,获得10
5分钟前
5分钟前
momo完成签到,获得积分10
5分钟前
风中星月完成签到 ,获得积分10
5分钟前
Droplet完成签到,获得积分10
6分钟前
一人独钓一江秋完成签到,获得积分10
6分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6399350
求助须知:如何正确求助?哪些是违规求助? 8215450
关于积分的说明 17407723
捐赠科研通 5452686
什么是DOI,文献DOI怎么找? 2881881
邀请新用户注册赠送积分活动 1858293
关于科研通互助平台的介绍 1700326