LViT: Language Meets Vision Transformer in Medical Image Segmentation

计算机科学 人工智能 分割 图像分割 注释 计算机视觉 医学影像学 变压器 编码(集合论) 监督学习 模式识别(心理学) 物理 量子力学 人工神经网络 电压 集合(抽象数据类型) 程序设计语言
作者
Zihan Li,Yunxiang Li,Qingde Li,Puyang Wang,Dazhou Guo,Le Lü,Dakai Jin,You Zhang,Qingqi Hong
出处
期刊:IEEE Transactions on Medical Imaging [Institute of Electrical and Electronics Engineers]
卷期号:43 (1): 96-107 被引量:15
标识
DOI:10.1109/tmi.2023.3291719
摘要

Deep learning has been widely used in medical image segmentation and other aspects. However, the performance of existing medical image segmentation models has been limited by the challenge of obtaining sufficient high-quality labeled data due to the prohibitive data annotation cost. To alleviate this limitation, we propose a new text-augmented medical image segmentation model LViT (Language meets Vision Transformer). In our LViT model, medical text annotation is incorporated to compensate for the quality deficiency in image data. In addition, the text information can guide to generate pseudo labels of improved quality in the semi-supervised learning. We also propose an Exponential Pseudo label Iteration mechanism (EPI) to help the Pixel-Level Attention Module (PLAM) preserve local image features in semi-supervised LViT setting. In our model, LV (Language-Vision) loss is designed to supervise the training of unlabeled images using text information directly. For evaluation, we construct three multimodal medical segmentation datasets (image + text) containing X-rays and CT images. Experimental results show that our proposed LViT has superior segmentation performance in both fully-supervised and semi-supervised setting. The code and datasets are available at https://github.com/HUANGLIZI/LViT .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
hong完成签到 ,获得积分20
3秒前
Ava应助赤墨采纳,获得10
3秒前
3秒前
5秒前
yanling发布了新的文献求助10
5秒前
liucheng发布了新的文献求助10
6秒前
8秒前
Jane发布了新的文献求助20
11秒前
xf完成签到,获得积分10
11秒前
CodeCraft应助liucheng采纳,获得10
12秒前
13秒前
13秒前
浮一白发布了新的文献求助10
13秒前
13秒前
猪猪hero应助肥肥酱采纳,获得10
14秒前
赤墨发布了新的文献求助10
17秒前
17秒前
18秒前
111发布了新的文献求助30
18秒前
liucheng完成签到,获得积分10
18秒前
DoctorXu发布了新的文献求助10
20秒前
小祥哥发布了新的文献求助10
24秒前
慕青应助PigGyue采纳,获得10
25秒前
26秒前
项目发布了新的文献求助10
26秒前
27秒前
30秒前
科里斯皮尔应助111采纳,获得10
31秒前
neo完成签到,获得积分20
32秒前
NetSenior发布了新的文献求助10
32秒前
lxr发布了新的文献求助10
33秒前
33秒前
35秒前
36秒前
Msong发布了新的文献求助10
37秒前
暖暖发布了新的文献求助10
37秒前
生动盼秋发布了新的文献求助10
38秒前
39秒前
39秒前
高分求助中
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
The Illustrated History of Gymnastics 500
Division and square root. Digit-recurrence algorithms and implementations 500
Hemerologies of Assyrian and Babylonian Scholars 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2494041
求助须知:如何正确求助?哪些是违规求助? 2151912
关于积分的说明 5497801
捐赠科研通 1872736
什么是DOI,文献DOI怎么找? 931198
版权声明 563495
科研通“疑难数据库(出版商)”最低求助积分说明 497863