Hierarchical alignment network for domain adaptive object detection in aerial images

计算机科学 人工智能 领域(数学分析) 目标检测 对象(语法) 域适应 计算机视觉 模式识别(心理学) 比例(比率) 图像(数学) 航空影像 特征(语言学) 编码(集合论) 数学 地理 数学分析 语言学 哲学 地图学 集合(抽象数据类型) 分类器(UML) 程序设计语言
作者
You Ma,Lin Chai,Lei Jin,Jun Yan
出处
期刊:Isprs Journal of Photogrammetry and Remote Sensing 卷期号:208: 39-52
标识
DOI:10.1016/j.isprsjprs.2024.01.005
摘要

Domain Adaptive Object Detection (DAOD) alleviates the reliance on labeled data by transferring knowledge learned from labeled source domain to unlabeled target domain. Recent DAOD methods is modeled mainly based on ground-level images. Compared to ground-level images, aerial images suffer from scale variation and viewpoint diversity. This means that domain adaptive object detection in aerial images is a more challenging task. In this work, we address the domain shift in aerial images from two levels: 1) image-level shifts, such as weather, lighting, viewpoint, etc., 2) instance-level shifts, such as object appearance, scale, etc. Specifically, multiple domain-confusion classifiers are designed to learn image-level common knowledge of the source and target domains. Different levels of domain classifiers are further assigned adaptive weights to coordinate the transferability and discriminability of the adaptive detectors. Meanwhile, instance-level alignment is realized by forcing the intrinsic relationship between classes in both domains to be consistent. In addition, we perform instance-level alignment in different semantic-level feature layers to improve the scale awareness of the adaptation model. Extensive experimental results on VisDrone, UAVDT, DIOR and DOTA datasets demonstrate that our method achieves optimal detection performance in four domain adaption scenarios compared to other state-of-the-art methods, e.g., in Daytime → Night (VisDrone), the mAP50 is 23.5 %; in VisDrone → UAVDT, DIOR → UAVDT and DOTA → VisDrone, the AP50 of the car is 63.1 %, 46.6 % and 44.8 % respectively. Code will be available online (https://github.com/MaYou1997/HANet).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
不安青牛应助zzz采纳,获得10
6秒前
廿二完成签到,获得积分10
7秒前
科研通AI2S应助八戒采纳,获得10
8秒前
11秒前
12秒前
yjj发布了新的文献求助10
13秒前
15秒前
16秒前
xq完成签到,获得积分10
17秒前
八戒发布了新的文献求助10
17秒前
canvasss发布了新的文献求助10
17秒前
Yanan发布了新的文献求助10
20秒前
qu完成签到,获得积分10
20秒前
甘冽太白发布了新的文献求助10
21秒前
烟花应助kl采纳,获得10
22秒前
艾欧驳回了苏卿应助
24秒前
26秒前
26秒前
wks666666完成签到,获得积分10
26秒前
27秒前
30秒前
八戒发布了新的文献求助10
33秒前
雪山飞龙发布了新的文献求助10
33秒前
35秒前
Yanan完成签到,获得积分10
36秒前
Lh6610完成签到,获得积分10
38秒前
逆风飞扬发布了新的文献求助10
39秒前
科研通AI2S应助科研通管家采纳,获得10
41秒前
星辰大海应助科研通管家采纳,获得10
42秒前
42秒前
42秒前
42秒前
42秒前
科研通AI2S应助科研通管家采纳,获得10
42秒前
甜菜完成签到 ,获得积分10
43秒前
44秒前
Orange应助Lisby采纳,获得10
46秒前
Qshou发布了新的文献求助10
48秒前
wonderbgt完成签到,获得积分10
48秒前
高分求助中
Aspects of Babylonian Celestial Divination : The Lunar Eclipse Tablets of Enuma Anu Enlil 1010
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
《Disrupting White Mindfulness:Race and Racism in the Wellbeing Industry》 800
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
The Illustrated History of Gymnastics 800
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
[Echocardiography and tissue Doppler imaging in assessment of haemodynamics in patients with idiopathic, premature ventricular complexes] 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2515658
求助须知:如何正确求助?哪些是违规求助? 2162149
关于积分的说明 5538651
捐赠科研通 1882129
什么是DOI,文献DOI怎么找? 936803
版权声明 564341
科研通“疑难数据库(出版商)”最低求助积分说明 500157