亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Text-Assisted Vision Model for Medical Image Segmentation

计算机视觉 计算机科学 图像分割 人工智能 分割 医学影像学 图像(数学) 计算机图形学(图像)
作者
Md. Motiur Rahman,Saeka Rahman,Smriti Bhatt,Miad Faezipour
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:: 1-14 被引量:1
标识
DOI:10.1109/jbhi.2025.3569491
摘要

Precise medical image segmentation is important for automating diagnosis and treatment planning in healthcare. While images present the most significant information for segmenting organs using deep learning models, text reports also provide complementary details that can be leveraged to improve segmentation precision. Performance improvement depends on the proper utilization of text reports and the corresponding images. Most attention modules focus on single-modality computation of spatial, channel, or pixel-level attention. They are ineffective in cross-modal alignment, raising issues in multi-modal scenarios. This study addresses these gaps by presenting a text-assisted vision (TAV) model for medical image segmentation with a novel attention computation module named triguided attention module (TGAM). TGAM computes visual-visual, language-language, and language-visual attention, enabling the model to understand the important features and correlation between images and medical notes. This module helps the model identify the relevant features within images, text annotations, and text annotations to visual interactions. We incorporate an attention gate (AG) that modulates the influence of TGAM, ensuring it does not overflow the encoded features with irrelevant or redundant information, while maintaining their uniqueness. We evaluated the performance of TAV on two popular datasets containing images and corresponding text annotations. We find TAV to be a new state-of-the-art model, as it improves the performance by 2-7% compared to other models. Extensive experiments were performed to demonstrate the effectiveness of each component of the proposed model. The code and datasets are available on Github1.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
洒脱完成签到,获得积分10
8秒前
zwb完成签到 ,获得积分10
42秒前
53秒前
1分钟前
矮小的向雪完成签到 ,获得积分10
1分钟前
zyx完成签到 ,获得积分10
1分钟前
1分钟前
FashionBoy应助Ji采纳,获得30
2分钟前
阳光的灵竹完成签到,获得积分10
2分钟前
永远完成签到,获得积分10
2分钟前
2分钟前
Ji发布了新的文献求助30
2分钟前
研友_LmVygn完成签到 ,获得积分10
2分钟前
2分钟前
ataybabdallah完成签到,获得积分10
3分钟前
4分钟前
白白发布了新的文献求助10
4分钟前
4分钟前
Jasper应助白白采纳,获得10
4分钟前
5分钟前
5分钟前
三个气的大门完成签到 ,获得积分10
5分钟前
guojin发布了新的文献求助10
5分钟前
5分钟前
gkhsdvkb发布了新的文献求助10
6分钟前
Youx完成签到 ,获得积分10
6分钟前
6分钟前
陶杨杨发布了新的文献求助10
6分钟前
CodeCraft应助陶杨杨采纳,获得10
6分钟前
coolru完成签到 ,获得积分10
7分钟前
fhzy完成签到,获得积分10
7分钟前
天天开心完成签到,获得积分10
7分钟前
7分钟前
辛勤的夏云完成签到 ,获得积分10
7分钟前
我是老大应助Ji采纳,获得10
7分钟前
Akim应助科研通管家采纳,获得30
7分钟前
小张完成签到 ,获得积分10
8分钟前
Jack祺完成签到 ,获得积分10
8分钟前
8分钟前
庄严完成签到,获得积分10
8分钟前
高分求助中
Yangtze Reminiscences. Some Notes And Recollections Of Service With The China Navigation Company Ltd., 1925-1939 800
The recovery-stress questionnaires : user manual 600
Common Foundations of American and East Asian Modernisation: From Alexander Hamilton to Junichero Koizumi 600
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
T/SNFSOC 0002—2025 独居石精矿碱法冶炼工艺技术标准 300
The Impact of Lease Accounting Standards on Lending and Investment Decisions 250
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5855422
求助须知:如何正确求助?哪些是违规求助? 6307887
关于积分的说明 15633258
捐赠科研通 4970354
什么是DOI,文献DOI怎么找? 2680571
邀请新用户注册赠送积分活动 1624533
关于科研通互助平台的介绍 1581419