Transformer-Based Decoder Designs for Semantic Segmentation on Remotely Sensed Images

计算机科学 变压器 分割 人工智能 编码器 棱锥(几何) 深度学习 解析 模式识别(心理学) 计算机视觉 电压 量子力学 操作系统 光学 物理
作者
Teerapong Panboonyuen,Kulsawasd Jitkajornwanich,Siam Lawawirojwong,Panu Srestasathiern,Peerapon Vateekul
出处
期刊:Remote Sensing [MDPI AG]
卷期号:13 (24): 5100-5100 被引量:26
标识
DOI:10.3390/rs13245100
摘要

Transformers have demonstrated remarkable accomplishments in several natural language processing (NLP) tasks as well as image processing tasks. Herein, we present a deep-learning (DL) model that is capable of improving the semantic segmentation network in two ways. First, utilizing the pre-training Swin Transformer (SwinTF) under Vision Transformer (ViT) as a backbone, the model weights downstream tasks by joining task layers upon the pretrained encoder. Secondly, decoder designs are applied to our DL network with three decoder designs, U-Net, pyramid scene parsing (PSP) network, and feature pyramid network (FPN), to perform pixel-level segmentation. The results are compared with other image labeling state of the art (SOTA) methods, such as global convolutional network (GCN) and ViT. Extensive experiments show that our Swin Transformer (SwinTF) with decoder designs reached a new state of the art on the Thailand Isan Landsat-8 corpus (89.8% F1 score), Thailand North Landsat-8 corpus (63.12% F1 score), and competitive results on ISPRS Vaihingen. Moreover, both our best-proposed methods (SwinTF-PSP and SwinTF-FPN) even outperformed SwinTF with supervised pre-training ViT on the ImageNet-1K in the Thailand, Landsat-8, and ISPRS Vaihingen corpora.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
slr发布了新的文献求助20
1秒前
鱼鱼喜喜完成签到 ,获得积分10
2秒前
杨九斤Jenney完成签到 ,获得积分10
3秒前
5秒前
ldy完成签到 ,获得积分10
6秒前
7秒前
卡拉几黑完成签到 ,获得积分10
7秒前
Akim应助Jack采纳,获得10
8秒前
guagua发布了新的文献求助10
10秒前
10秒前
小花同学完成签到 ,获得积分20
10秒前
FashionBoy应助Dorr采纳,获得10
11秒前
华仔应助小土采纳,获得10
11秒前
13秒前
13秒前
秋雪瑶应助风趣的从安采纳,获得10
13秒前
崩溃发布了新的文献求助10
14秒前
17秒前
皮卡龙猫发布了新的文献求助10
17秒前
memory完成签到,获得积分10
20秒前
21秒前
23秒前
SciGPT应助崩溃采纳,获得10
24秒前
why发布了新的文献求助10
25秒前
26秒前
君生完成签到,获得积分10
26秒前
26秒前
dd关注了科研通微信公众号
27秒前
彭于晏应助皮卡龙猫采纳,获得10
28秒前
28秒前
风趣的从安完成签到,获得积分20
29秒前
1900发布了新的文献求助10
30秒前
31秒前
Dorr发布了新的文献求助10
33秒前
Arthur发布了新的文献求助10
36秒前
汉堡包应助彩色的老五采纳,获得10
37秒前
37秒前
37秒前
37秒前
领导范儿应助水月采纳,获得10
38秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Teaching Social and Emotional Learning in Physical Education 900
The three stars each : the Astrolabes and related texts 550
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
Chinese-English Translation Lexicon Version 3.0 500
Recherches Ethnographiques sue les Yao dans la Chine du Sud 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2398631
求助须知:如何正确求助?哪些是违规求助? 2099870
关于积分的说明 5293429
捐赠科研通 1827544
什么是DOI,文献DOI怎么找? 910968
版权声明 560061
科研通“疑难数据库(出版商)”最低求助积分说明 486921