清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Multimodal dynamic fusion framework: Multilevel feature fusion guided by prompts

计算机科学 融合 特征(语言学) 人工智能 机器学习 模式识别(心理学) 数据挖掘 哲学 语言学
作者
Lei Pan,H. Wu
出处
期刊:Expert Systems [Wiley]
卷期号:41 (11)
标识
DOI:10.1111/exsy.13668
摘要

Abstract With the progressive augmentation of parameters in multimodal models, to optimize computational efficiency, some studies have adopted the approach of fine‐tuning the unimodal pre‐training model to achieve multimodal fusion tasks. However, these methods tend to rely solely on simplistic or singular fusion strategies, thereby neglecting more flexible fusion approaches. Moreover, existing methods prioritize the integration of modality features containing highly semantic information, often overlooking the influence of fusing low‐level features on the outcomes. Therefore, this study introduces an innovative approach named multilevel feature fusion guided by prompts (MFF‐GP), a multimodal dynamic fusion framework. It guides the dynamic neural network by prompt vectors to dynamically select the suitable fusion network for each hierarchical feature of the unimodal pre‐training model. This method improves the interactions between multiple modalities and promotes a more efficient fusion of features across them. Extensive experiments on the UPMC Food 101, SNLI‐VE and MM‐IMDB datasets demonstrate that with only a few trainable parameters, MFF‐GP achieves significant accuracy improvements compared to a newly designed PMF based on fine‐tuning—specifically, an accuracy improvement of 2.15% on the UPMC Food 101 dataset and 0.82% on the SNLI‐VE dataset. Further study of the results reveals that increasing the diversity of interactions between distinct modalities is critical and delivers significant performance improvements. Furthermore, for certain multimodal tasks, focusing on the low‐level features is beneficial for modality integration. Our implementation is available at: https://github.com/whq2024/MFF-GP .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
青山完成签到 ,获得积分10
5秒前
Jasper应助zzy采纳,获得10
16秒前
mzhang2完成签到 ,获得积分10
19秒前
25秒前
zzy发布了新的文献求助10
31秒前
heher完成签到 ,获得积分10
50秒前
yshj完成签到 ,获得积分10
1分钟前
顾矜应助科研通管家采纳,获得10
1分钟前
雪花完成签到 ,获得积分10
1分钟前
研友_8y2G0L完成签到,获得积分10
1分钟前
sssss完成签到,获得积分10
1分钟前
Leon完成签到 ,获得积分0
2分钟前
伊叶之丘完成签到 ,获得积分10
2分钟前
2分钟前
qyang完成签到 ,获得积分10
2分钟前
clock完成签到 ,获得积分10
2分钟前
充电宝应助nick采纳,获得10
2分钟前
3分钟前
3分钟前
nick发布了新的文献求助10
3分钟前
今后应助标致惋庭采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
Singularity应助科研通管家采纳,获得10
3分钟前
浚稚完成签到 ,获得积分10
3分钟前
3分钟前
3分钟前
DrCuiTianjin完成签到 ,获得积分10
3分钟前
凤里完成签到 ,获得积分10
3分钟前
Alex-Song完成签到 ,获得积分0
4分钟前
taoxz521完成签到 ,获得积分10
4分钟前
CUN完成签到,获得积分10
4分钟前
ys1008完成签到,获得积分10
4分钟前
文献蚂蚁完成签到,获得积分10
4分钟前
Drizzle完成签到,获得积分10
4分钟前
洋芋饭饭完成签到,获得积分10
4分钟前
Skywings完成签到,获得积分10
4分钟前
杉杉完成签到 ,获得积分10
4分钟前
曾经不言完成签到 ,获得积分10
4分钟前
tkbxa完成签到 ,获得积分10
4分钟前
高分求助中
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
Optical and electric properties of monocrystalline synthetic diamond irradiated by neutrons 320
共融服務學習指南 300
Essentials of Pharmacoeconomics: Health Economics and Outcomes Research 3rd Edition. by Karen Rascati 300
Peking Blues // Liao San 300
Political Ideologies Their Origins and Impact 13 edition 240
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3800957
求助须知:如何正确求助?哪些是违规求助? 3346489
关于积分的说明 10329490
捐赠科研通 3063031
什么是DOI,文献DOI怎么找? 1681330
邀请新用户注册赠送积分活动 807474
科研通“疑难数据库(出版商)”最低求助积分说明 763714