已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Multimodal Fusion Transformer for Remote Sensing Image Classification

计算机科学 变压器 人工智能 卷积神经网络 CLs上限 编码器 上下文图像分类 模式识别(心理学) 安全性令牌 源代码 机器学习 图像(数学) 量子力学 医学 操作系统 验光服务 物理 电压 计算机安全
作者
Swalpa Kumar Roy,Ankur Deria,Danfeng Hong,Behnood Rasti,Antonio Plaza,Jocelyn Chanussot
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:61: 1-20 被引量:212
标识
DOI:10.1109/tgrs.2023.3286826
摘要

Vision transformers (ViTs) have been trending in image classification tasks due to their promising performance when compared to convolutional neural networks (CNNs). As a result, many researchers have tried to incorporate ViTs in hyperspectral image (HSI) classification tasks. To achieve satisfactory performance, close to that of CNNs, transformers need fewer parameters. ViTs and other similar transformers use an external classification (CLS) token which is randomly initialized and often fails to generalize well, whereas other sources of multimodal datasets, such as light detection and ranging (LiDAR) offer the potential to improve these models by means of a CLS. In this paper, we introduce a new multimodal fusion transformer (MFT) network which comprises a multihead cross patch attention (mCrossPA) for HSI land-cover classification. Our mCrossPA utilizes other sources of complementary information in addition to the HSI in the transformer encoder to achieve better generalization. The concept of tokenization is used to generate CLS and HSI patch tokens, helping to learn a {distinctive representation} in a reduced and hierarchical feature space. Extensive experiments are carried out on {widely used benchmark} datasets {i.e.,} the University of Houston, Trento, University of Southern Mississippi Gulfpark (MUUFL), and Augsburg. We compare the results of the proposed MFT model with other state-of-the-art transformers, classical CNNs, and conventional classifiers models. The superior performance achieved by the proposed model is due to the use of multihead cross patch attention. The source code will be made available publicly at \url{https://github.com/AnkurDeria/MFT}.}
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
糊涂小医仙完成签到,获得积分10
1秒前
Berthe完成签到 ,获得积分10
4秒前
6秒前
所所应助fl采纳,获得10
6秒前
六六完成签到 ,获得积分10
11秒前
YOUNG发布了新的文献求助10
11秒前
12秒前
整齐凝竹完成签到 ,获得积分10
12秒前
Hello应助TT2022采纳,获得10
12秒前
16秒前
烟花应助joe548采纳,获得10
17秒前
fl发布了新的文献求助10
17秒前
Youlu发布了新的文献求助20
20秒前
23秒前
小星星发布了新的文献求助30
27秒前
Akim应助Youlu采纳,获得10
28秒前
28秒前
30秒前
卡皮巴拉yuan完成签到,获得积分10
32秒前
金平卢仙发布了新的文献求助10
33秒前
Wu发布了新的文献求助10
36秒前
37秒前
圈圈发布了新的文献求助10
38秒前
39秒前
Imogen发布了新的文献求助10
41秒前
42秒前
lena发布了新的文献求助10
42秒前
mou小白完成签到,获得积分10
43秒前
一只呆呆完成签到 ,获得积分10
45秒前
47秒前
周小鱼完成签到,获得积分10
48秒前
Wu完成签到,获得积分10
48秒前
隐形曼青应助lena采纳,获得30
49秒前
49秒前
在水一方应助xu采纳,获得10
51秒前
划水完成签到,获得积分10
52秒前
善学以致用应助一木张采纳,获得10
54秒前
金平卢仙发布了新的文献求助10
54秒前
洪流完成签到,获得积分10
56秒前
可耐的冰萍完成签到,获得积分10
58秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Technologies supporting mass customization of apparel: A pilot project 300
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
Political Ideologies Their Origins and Impact 13th Edition 260
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3780712
求助须知:如何正确求助?哪些是违规求助? 3326219
关于积分的说明 10226204
捐赠科研通 3041293
什么是DOI,文献DOI怎么找? 1669330
邀请新用户注册赠送积分活动 799040
科研通“疑难数据库(出版商)”最低求助积分说明 758723