已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Multi-modal Mutual Topic Reinforce Modeling for Cross-media Retrieval

计算机科学 判别式 情态动词 概率潜在语义分析 人工智能 模式 相互信息 水准点(测量) 一致性(知识库) 概率逻辑 主题模型 机器学习 图形模型 自然语言处理 班级(哲学) 过程(计算) 情报检索 化学 高分子化学 社会科学 地理 大地测量学 社会学 操作系统
作者
Yanfei Wang,Fei Wu,Jun Song,Xi Li,Yueting Zhuang
标识
DOI:10.1145/2647868.2654901
摘要

As an important and challenging problem in the multimedia area, multi-modal data understanding aims to explore the intrinsic semantic information across different modalities in a collaborative manner. To address this problem, a possible solution is to effectively and adaptively capture the common cross-modal semantic information by modeling the inherent correlations between the latent topics from different modalities. Motivated by this task, we propose a supervised multi-modal mutual topic reinforce modeling (M$^3$R) approach, which seeks to build a joint cross-modal probabilistic graphical model for discovering the mutually consistent semantic topics via appropriate interactions between model factors (e.g., categories, latent topics and observed multi-modal data). In principle, M$^3$R is capable of simultaneously accomplishing the following two learning tasks: 1) modality-specific (e.g., image-specific or text-specific ) latent topic learning; and 2) cross-modal mutual topic consistency learning. By investigating the cross-modal topic-related distribution information, M$^3$R encourages to disentangle the semantically consistent cross-modal topics (containing some common semantic information across different modalities). In other words, the semantically co-occurring cross-modal topics are reinforced by M$^3$R through adaptively passing the mutually reinforced messages to each other in the model-learning process. To further enhance the discriminative power of the learned latent topic representations, M$^3$R incorporates the auxiliary information (i.e., categories or labels) into the process of Bayesian modeling, which boosts the modeling capability of capturing the inter-class discriminative information. Experimental results over two benchmark datasets demonstrate the effectiveness of the proposed M$^3$R in cross-modal retrieval.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ThreeAct6完成签到,获得积分10
1秒前
king发布了新的文献求助10
3秒前
jacob258发布了新的文献求助10
6秒前
wang完成签到 ,获得积分10
9秒前
Wang_JN完成签到 ,获得积分10
9秒前
所所应助禹卓采纳,获得10
9秒前
vippp完成签到 ,获得积分10
10秒前
人文完成签到 ,获得积分10
10秒前
11秒前
yillin完成签到 ,获得积分10
13秒前
struggling2026完成签到 ,获得积分10
13秒前
Leif完成签到 ,获得积分0
14秒前
烟喜发布了新的文献求助10
14秒前
孔嘉康完成签到,获得积分10
16秒前
lx完成签到,获得积分20
16秒前
肚子幽伤完成签到 ,获得积分10
17秒前
天天快乐应助辰的小猫采纳,获得10
21秒前
烟喜完成签到,获得积分10
22秒前
学霸完成签到 ,获得积分10
24秒前
Cu完成签到 ,获得积分10
25秒前
zjzjzjzjzj完成签到 ,获得积分10
26秒前
MAVS完成签到,获得积分10
27秒前
王不会科研完成签到,获得积分10
29秒前
韩麒嘉完成签到 ,获得积分10
31秒前
简单小土豆完成签到 ,获得积分10
34秒前
内向的飞松完成签到,获得积分10
35秒前
光能使者完成签到,获得积分10
35秒前
35秒前
21完成签到 ,获得积分10
35秒前
史小菜给史小菜的求助进行了留言
37秒前
bean完成签到 ,获得积分10
37秒前
生椰拿铁完成签到 ,获得积分10
37秒前
yillin发布了新的文献求助10
39秒前
王一完成签到 ,获得积分10
39秒前
GCMTG发布了新的文献求助10
40秒前
40秒前
41秒前
oleskarabach发布了新的文献求助10
41秒前
44秒前
jieliu完成签到,获得积分10
44秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Multichannel rotary joints-How they work 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3795454
求助须知:如何正确求助?哪些是违规求助? 3340458
关于积分的说明 10300316
捐赠科研通 3057032
什么是DOI,文献DOI怎么找? 1677356
邀请新用户注册赠送积分活动 805385
科研通“疑难数据库(出版商)”最低求助积分说明 762491