已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Multi-Modal Mutual Attention and Iterative Interaction for Referring Image Segmentation

计算机科学 人工智能 保险丝(电气) 相互信息 分割 变压器 特征(语言学) 自然语言 情态动词 模式识别(心理学) 图像分割 计算机视觉 电压 工程类 化学 高分子化学 语言学 哲学 电气工程
作者
Chang Liu,Henghui Ding,Yulun Zhang,Xudong Jiang
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:32: 3054-3065 被引量:31
标识
DOI:10.1109/tip.2023.3277791
摘要

We address the problem of referring image segmentation that aims to generate a mask for the object specified by a natural language expression. Many recent works utilize Transformer to extract features for the target object by aggregating the attended visual regions. However, the generic attention mechanism in Transformer only uses the language input for attention weight calculation, which does not explicitly fuse language features in its output. Thus, its output feature is dominated by vision information, which limits the model to comprehensively understand the multi-modal information, and brings uncertainty for the subsequent mask decoder to extract the output mask. To address this issue, we propose Multi-Modal Mutual Attention (M3Att) and Multi-Modal Mutual Decoder ( M3Dec ) that better fuse information from the two input modalities. Based on M3Dec , we further propose Iterative Multi-modal Interaction (IMI) to allow continuous and in-depth interactions between language and vision features. Furthermore, we introduce Language Feature Reconstruction (LFR) to prevent the language information from being lost or distorted in the extracted feature. Extensive experiments show that our proposed approach significantly improves the baseline and outperforms state-of-the-art referring image segmentation methods on RefCOCO series datasets consistently.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2224270676完成签到,获得积分10
1秒前
kento完成签到,获得积分0
1秒前
韩寒完成签到 ,获得积分10
2秒前
2秒前
端庄从凝发布了新的文献求助10
3秒前
4秒前
FY完成签到 ,获得积分10
4秒前
幸福柏柳发布了新的文献求助10
4秒前
4秒前
朴素凡阳发布了新的文献求助10
4秒前
尊敬书本完成签到,获得积分10
5秒前
俭朴千万发布了新的文献求助10
5秒前
机灵的凌旋完成签到,获得积分10
5秒前
wwwjy完成签到 ,获得积分10
6秒前
6秒前
lok完成签到,获得积分10
6秒前
原大宝完成签到 ,获得积分10
6秒前
7秒前
star完成签到,获得积分10
8秒前
尊敬书本发布了新的文献求助10
9秒前
瑞瑞发布了新的文献求助10
9秒前
星野Nana_完成签到,获得积分10
10秒前
11秒前
俭朴千万完成签到,获得积分10
11秒前
muluoyinhua完成签到,获得积分10
11秒前
13秒前
Vintoe完成签到 ,获得积分10
14秒前
jerry完成签到,获得积分20
14秒前
Ferry完成签到,获得积分10
15秒前
流星雨完成签到 ,获得积分10
16秒前
颜绯完成签到 ,获得积分10
17秒前
wvv发布了新的文献求助10
17秒前
逍遥子0211完成签到,获得积分10
18秒前
18秒前
19秒前
可爱的函函应助yuan0320采纳,获得10
19秒前
21秒前
Repher发布了新的文献求助10
23秒前
SQL完成签到 ,获得积分10
24秒前
24秒前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Petrology and Plate Tectonics,2025 400
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
Impact of Storage Orientation and Duration on Prefilled Syringe Performance: Break-Loose and Glide Forces, and Injection Time Across Multiple Time Points 360
Programming for Chemical Engineers Using C, C++, and MATLAB 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6680696
求助须知:如何正确求助?哪些是违规求助? 8426716
关于积分的说明 18011010
捐赠科研通 5898392
什么是DOI,文献DOI怎么找? 2981045
邀请新用户注册赠送积分活动 1956977
关于科研通互助平台的介绍 1890212