TFormer: A throughout fusion transformer for multi-modal skin lesion diagnosis

计算机科学 模式 变压器 人工智能 情态动词 特征提取 模式识别(心理学) 数据挖掘 计算机视觉 电压 工程类 社会科学 电气工程 社会学 化学 高分子化学
作者
Yilan Zhang,Fengying Xie,Jianqi Chen,Jie Liu
出处
期刊:Computers in Biology and Medicine [Elsevier]
卷期号:157: 106712-106712 被引量:3
标识
DOI:10.1016/j.compbiomed.2023.106712
摘要

Multi-modal skin lesion diagnosis (MSLD) has achieved remarkable success by modern computer-aided diagnosis (CAD) technology based on deep convolutions. However, the information aggregation across modalities in MSLD remains challenging due to severity unaligned spatial resolution (e.g., dermoscopic image and clinical image) and heterogeneous data (e.g., dermoscopic image and patients’ meta-data). Limited by the intrinsic local attention, most recent MSLD pipelines using pure convolutions struggle to capture representative features in shallow layers, thus the fusion across different modalities is usually done at the end of the pipelines, even at the last layer, leading to an insufficient information aggregation. To tackle the issue, we introduce a pure transformer-based method, which we refer to as “Throughout Fusion Transformer (TFormer)”, for sufficient information integration in MSLD. Different from the existing approaches with convolutions, the proposed network leverages transformer as feature extraction backbone, bringing more representative shallow features. We then carefully design a stack of dual-branch hierarchical multi-modal transformer (HMT) blocks to fuse information across different image modalities in a stage-by-stage way. With the aggregated information of image modalities, a multi-modal transformer post-fusion (MTP) block is designed to integrate features across image and non-image data. Such a strategy that information of the image modalities is firstly fused then the heterogeneous ones enables us to better divide and conquer the two major challenges while ensuring inter-modality dynamics are effectively modeled. Experiments conducted on the public Derm7pt dataset validate the superiority of the proposed method. Our TFormer achieves an average accuracy of 77.99% and diagnostic accuracy of 80.03% , which outperforms other state-of-the-art methods. Ablation experiments also suggest the effectiveness of our designs. The codes can be publicly available from https://github.com/zylbuaa/TFormer.git.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
无弋完成签到 ,获得积分0
5秒前
aupgs完成签到 ,获得积分10
7秒前
喜马拉雅完成签到 ,获得积分10
8秒前
brick2024完成签到,获得积分10
27秒前
刘茂甫应助科研通管家采纳,获得10
29秒前
深情安青应助科研通管家采纳,获得10
29秒前
田様应助科研通管家采纳,获得10
29秒前
有魅力翠柏完成签到 ,获得积分10
32秒前
nicolaslcq完成签到,获得积分10
33秒前
修士完成签到 ,获得积分10
35秒前
39秒前
rayzhanghl完成签到,获得积分10
40秒前
嘻嘻完成签到 ,获得积分10
41秒前
juice完成签到 ,获得积分10
42秒前
46秒前
若无完成签到 ,获得积分10
49秒前
kire完成签到 ,获得积分10
49秒前
阿喵发布了新的文献求助10
52秒前
鞘皮完成签到,获得积分10
52秒前
Clover完成签到 ,获得积分10
54秒前
林夏果完成签到,获得积分10
1分钟前
1分钟前
英俊的铭应助wxnice采纳,获得10
1分钟前
虞无声发布了新的文献求助10
1分钟前
小白发布了新的文献求助20
1分钟前
1分钟前
小波同学。完成签到,获得积分10
1分钟前
虞无声完成签到,获得积分10
1分钟前
wxnice完成签到,获得积分10
1分钟前
夏目由美完成签到 ,获得积分10
1分钟前
asjm完成签到 ,获得积分10
1分钟前
zao完成签到 ,获得积分10
1分钟前
文艺水风完成签到 ,获得积分10
1分钟前
starleo完成签到,获得积分10
1分钟前
1分钟前
杰行天下完成签到,获得积分10
1分钟前
JUGG完成签到,获得积分10
1分钟前
司纤户羽完成签到 ,获得积分10
1分钟前
医生小白完成签到 ,获得积分10
1分钟前
传奇3应助阿喵采纳,获得10
1分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2478697
求助须知:如何正确求助?哪些是违规求助? 2141507
关于积分的说明 5459029
捐赠科研通 1864682
什么是DOI,文献DOI怎么找? 926979
版权声明 562912
科研通“疑难数据库(出版商)”最低求助积分说明 496023