Adapting Generative Pretrained Language Model for Open-domain Multimodal Sentence Summarization

计算机科学 自动汇总 可解释性 判决 人工智能 自然语言处理 钥匙(锁) 安全性令牌 领域(数学分析) 生成语法 特征(语言学) 嵌入 语言模型 机器学习 哲学 数学分析 语言学 计算机安全 数学
作者
Dengtian Lin,Liqiang Jing,Xuemeng Song,Meng Liu,Teng Sun,Liqiang Nie
标识
DOI:10.1145/3539618.3591633
摘要

Multimodal sentence summarization, aiming to generate a brief summary of the source sentence and image, is a new yet challenging task. Although existing methods have achieved compelling success, they still suffer from two key limitations: 1) lacking the adaptation of generative pre-trained language models for open-domain MMSS, and 2) lacking the explicit critical information modeling. To address these limitations, we propose a BART-MMSS framework, where BART is adopted as the backbone. To be specific, we propose a prompt-guided image encoding module to extract the source image feature. It leverages several soft to-be-learned prompts for image patch embedding, which facilitates the visual content injection to BART for open-domain MMSS tasks. Thereafter, we devise an explicit source critical token learning module to directly capture the critical tokens of the source sentence with the reference of the source image, where we incorporate explicit supervision to improve performance. Extensive experiments on a public dataset fully validate the superiority of our proposed method. In addition, the predicted tokens by the vision-guided key-token highlighting module can be easily understood by humans and hence improve the interpretability of our model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
武勇发布了新的文献求助50
2秒前
芯止谭轩完成签到,获得积分10
2秒前
atopos发布了新的文献求助10
2秒前
trap发布了新的文献求助10
3秒前
飞翔的小舟完成签到 ,获得积分10
3秒前
哈哈王子完成签到,获得积分10
4秒前
青栞完成签到,获得积分10
8秒前
量子星尘发布了新的文献求助10
9秒前
英姑应助墨墨采纳,获得30
9秒前
10秒前
盼盼完成签到,获得积分10
10秒前
trap完成签到,获得积分10
10秒前
爆米花应助糊涂的绿茶采纳,获得10
13秒前
隐形曼青应助dryan1110采纳,获得10
14秒前
15秒前
slow发布了新的文献求助10
17秒前
英俊的铭应助优秀的媚颜采纳,获得10
19秒前
顺其自然完成签到 ,获得积分10
20秒前
Rewi_Zhang完成签到,获得积分10
21秒前
roumaoliang完成签到,获得积分10
23秒前
文茵发布了新的文献求助10
28秒前
33秒前
35秒前
量子星尘发布了新的文献求助10
37秒前
37秒前
研友_VZG7GZ应助暮晓见采纳,获得30
38秒前
wfjj发布了新的文献求助10
39秒前
杨桃完成签到,获得积分10
40秒前
QQ发布了新的文献求助10
42秒前
优秀的媚颜给优秀的媚颜的求助进行了留言
43秒前
44秒前
shiqiang mu应助糊涂的绿茶采纳,获得10
44秒前
45秒前
沉默白桃完成签到,获得积分10
46秒前
共享精神应助游一采纳,获得10
49秒前
AIGT发布了新的文献求助10
49秒前
从别后忆相逢完成签到 ,获得积分10
50秒前
YAO完成签到 ,获得积分10
51秒前
公茂源完成签到 ,获得积分10
51秒前
高分求助中
【提示信息,请勿应助】请使用合适的网盘上传文件 10000
The Oxford Encyclopedia of the History of Modern Psychology 1500
Green Star Japan: Esperanto and the International Language Question, 1880–1945 800
Sentimental Republic: Chinese Intellectuals and the Maoist Past 800
The Martian climate revisited: atmosphere and environment of a desert planet 800
Parametric Random Vibration 800
Building Quantum Computers 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3863300
求助须知:如何正确求助?哪些是违规求助? 3405686
关于积分的说明 10646084
捐赠科研通 3129330
什么是DOI,文献DOI怎么找? 1725868
邀请新用户注册赠送积分活动 831261
科研通“疑难数据库(出版商)”最低求助积分说明 779718