When Multimodal Interactions Impair Prediction: A Novel Regularized Deep Learning Strategy

人工智能 深度学习 计算机科学 机器学习 多模式学习 特征(语言学) 利用 自然(考古学) 深度整合 软件 交叉口(航空) 实证研究 多模态 模式 基础(证据) 代表(政治) 模式治疗法 玻尔兹曼机 支持向量机 多式联运 数据科学 深信不疑网络 水准点(测量)
作者
Gang Chen,Shuaiyong Xiao,Chenghong Zhang,Huimin Zhao
出处
期刊:Informs Journal on Computing
标识
DOI:10.1287/ijoc.2024.0794
摘要

Multimodal data are proliferating and hence flourishing data-driven business decision making, exemplified by short video attractiveness prediction (SVAP), multimodal review sentiment classification (MRSC), and multimodal data-based default risk prediction (DRP). However, when data of various modalities (e.g., text, graph, image, and video) are used jointly, they may mutually interact, adversely affecting prediction performance. To unravel and resolve the opaque conflicts in multimodal data, we formally conceptualize multimodal interactions and provide analytical insights for mitigating negative interactions at the feature, modality, and modality-wise instance levels. To better realize the predictive power of multimodal data, we propose a novel deep learning strategy named NIRMD (for negative interaction-regularized multimodal deep learning), which allows positive (negative) multimodal interactions to be effectively encouraged (mitigated) in a learnable nonlinear representation space. Empirical evaluation in three case studies involving SVAP, MRSC, and DRP, respectively, shows that the prediction performance of state-of-the-art multimodal deep learning methods can be enhanced by incorporating NIRMD. Exploratory (i.e., ablation, feature contribution, and case) analyses render evidence of NIRMD’s effectiveness in mitigating negative multimodal interactions. History: Accepted by Ram Ramesh, Area Editor for Data Science & Machine Learning. Funding: G. Chen was supported by the National Natural Science Foundation of China [Grants 72522010, 72301239, and 72394371]. S. Xiao was supported by the National Natural Science Foundation of China [Grants 72301194, 72495133, and 72472058]. C. Zhang was supported by the National Natural Science Foundation of China [Grants 72271059 and 72571071]. Supplemental Material: The software that supports the findings of this study is available within the paper and its Supplemental Information ( https://pubsonline.informs.org/doi/suppl/10.1287/ijoc.2024.0794 ) as well as from the IJOC GitHub software repository ( https://github.com/INFORMSJoC/2024.0794 ). The complete IJOC Software and Data Repository is available at https://informsjoc.github.io/ .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
欧班长完成签到,获得积分10
刚刚
Alexgui发布了新的文献求助10
刚刚
可爱的函函应助amengptsd采纳,获得10
1秒前
霁故完成签到 ,获得积分10
1秒前
天天发布了新的文献求助10
1秒前
wdddr发布了新的文献求助10
2秒前
爆米花应助花露水采纳,获得10
2秒前
陶醉难胜发布了新的文献求助10
2秒前
活力曼梅发布了新的文献求助10
2秒前
852应助鲤鱼晓瑶采纳,获得10
3秒前
ll61完成签到,获得积分10
3秒前
土豪的听筠完成签到,获得积分10
3秒前
melody发布了新的文献求助10
3秒前
3秒前
3秒前
倘冷应助QW采纳,获得100
3秒前
英俊的铭应助无聊的黎采纳,获得10
4秒前
文艺友绿发布了新的文献求助20
4秒前
寂寞的马里奥完成签到,获得积分10
4秒前
哆啦A梦发布了新的文献求助10
4秒前
甜美孤云发布了新的文献求助10
4秒前
斯文败类应助路过的准采纳,获得10
5秒前
5秒前
5秒前
呼噜小熊完成签到,获得积分10
6秒前
guan完成签到,获得积分10
6秒前
逆鳞完成签到,获得积分10
6秒前
7秒前
研友_VZG7GZ应助wsf2023采纳,获得10
7秒前
Timo干物类发布了新的文献求助10
7秒前
Friday完成签到,获得积分10
7秒前
屹舟发布了新的文献求助10
7秒前
8秒前
Jase发布了新的文献求助10
8秒前
8秒前
吵吵robot发布了新的文献求助10
10秒前
姜玲发布了新的文献求助10
10秒前
文静的枫叶完成签到,获得积分10
10秒前
10秒前
坚强的赛凤完成签到,获得积分10
10秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6442847
求助须知:如何正确求助?哪些是违规求助? 8256805
关于积分的说明 17583779
捐赠科研通 5501441
什么是DOI,文献DOI怎么找? 2900701
邀请新用户注册赠送积分活动 1877655
关于科研通互助平台的介绍 1717371