Integrating Prior Knowledge into Bi-Branch Pyramid Network for Medical Image Segmentation

棱锥(几何) 分割 计算机科学 图像(数学) 人工智能 医学知识 图像分割 计算机视觉 业务 医学 数学 医学教育 几何学
作者
Xianjun Han,Tiantian Li,Hongyu Yang
标识
DOI:10.2139/ssrn.4564024
摘要

Medical image segmentation is crucial for accurate diagnoses, and while convolutional neural network (CNN)-based methods have made strides in recent years, they struggle with modeling long-range dependencies. Transformer-based methods improve this aspect but require more computational resources. The Segment Anything Model (SAM) can generate pixel-level segmentation in natural images using sparse manual prompts, but it performs poorly on low-contrast, noisy ultrasound images. To address this issue, we propose a new medical image segmentation network architecture that integrates the transformer components, CNN modules, and SAM encoder into a unified framework. This allows us to capture both long-range dependencies and local features simultaneously. Additionally, we incorporate the extracted image features from the SAM model as prior knowledge to further improve segmentation accuracy with limited training data. To reduce computational stress, we employ the axial attention mechanism to approximate the transformer's effects by expanding the receptive field. Instead of replacing transformer components with lightweight attention modules, our model is divided into a global branch and a local branch. The global branch extracts context features with the transformer components, while the local branch processes patch tokens with the axial attention mechanism. We also construct an image pyramid to excavate internal statistics and multiscale representations to obtain more accurate segmentation regions. This bi-branch pyramid transformer (Bi-BPT) architecture is effective and robust for medical image segmentation, surpassing other related segmentation network architectures. The experimental results on various medical image datasets demonstrate its effectiveness.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
落叶完成签到,获得积分10
2秒前
2秒前
宁夕发布了新的文献求助10
3秒前
4秒前
852应助年轻的怀蕊采纳,获得10
5秒前
5秒前
8秒前
瑶瑶瑶发布了新的文献求助10
8秒前
9秒前
自由灵波完成签到,获得积分10
9秒前
爱lx发布了新的文献求助10
13秒前
15秒前
15秒前
16秒前
聪慧恶天发布了新的文献求助10
16秒前
善学以致用应助luanzhaohui采纳,获得10
22秒前
25秒前
传奇3应助Sci采纳,获得10
26秒前
Hello应助自然浩阑采纳,获得30
26秒前
26秒前
26秒前
30秒前
30秒前
洁洁3323完成签到,获得积分10
34秒前
zhaopeipei发布了新的文献求助10
34秒前
34秒前
弦弦弦完成签到,获得积分10
35秒前
37秒前
Orange应助聪慧恶天采纳,获得10
37秒前
洁洁3323发布了新的文献求助10
37秒前
瑶瑶瑶完成签到,获得积分10
38秒前
38秒前
海燕完成签到,获得积分10
39秒前
斯文败类应助冯昊采纳,获得10
43秒前
自然浩阑发布了新的文献求助30
43秒前
46秒前
爱lx完成签到,获得积分10
47秒前
科研通AI5应助无语的大门采纳,获得10
48秒前
petiteblanche完成签到,获得积分10
48秒前
游悠悠完成签到,获得积分10
48秒前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Semantics for Latin: An Introduction 1099
Robot-supported joining of reinforcement textiles with one-sided sewing heads 780
水稻光合CO2浓缩机制的创建及其作用研究 500
Logical form: From GB to Minimalism 500
2025-2030年中国消毒剂行业市场分析及发展前景预测报告 500
镇江南郊八公洞林区鸟类生态位研究 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4166307
求助须知:如何正确求助?哪些是违规求助? 3701961
关于积分的说明 11686975
捐赠科研通 3390406
什么是DOI,文献DOI怎么找? 1859307
邀请新用户注册赠送积分活动 919641
科研通“疑难数据库(出版商)”最低求助积分说明 832328