Fine-Grained Multimodal Named Entity Recognition and Grounding with a Generative Framework

计算机科学 构造(python库) 任务(项目管理) 人工智能 注释 序列(生物学) 自然语言处理 对象(语法) 命名实体识别 情报检索 源代码 光学(聚焦) 编码(集合论) 实体链接 模式识别(心理学) 集合(抽象数据类型) 程序设计语言 知识库 经济 管理 物理 光学 生物 遗传学
作者
Jieming Wang,Ziyan Li,Jianfei Yu,Li Yang,Rui Xia
标识
DOI:10.1145/3581783.3612322
摘要

Multimodal Named Entity Recognition (MNER) aims to locate and classify named entities mentioned in a pair of text and image. However, most previous MNER works focus on extracting entities in the form of text but failing to ground text symbols to their corresponding visual objects. Moreover, existing MNER studies primarily classify entities into four coarse-grained entity types, which are often insufficient to map them to their real-world referents. To solve these limitations, we introduce a task named Fine-grained Multimodal Named Entity Recognition and Grounding (FMNERG) in this paper, which aims to simultaneously extract named entities in text, their fine-grained entity types, and their grounded visual objects in image. Moreover, we construct a Twitter dataset for the FMNERG task, and further propose a T5-based multImodal GEneration fRamework (TIGER), which formulates FMNERG as a generation problem by converting all the entity-type-object triples into a target sequence and adapts a pre-trained sequence-to-sequence model T5 to directly generate the target sequence from an image-text input pair. Experimental results demonstrate that TIGER performs significantly better than a number of baseline systems on the annotated Twitter dataset. Our dataset annotation and source code are publicly released at https://github.com/NUSTM/FMNERG.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
longer完成签到 ,获得积分10
4秒前
小涛涛完成签到 ,获得积分10
10秒前
Lyn完成签到 ,获得积分10
10秒前
Iris完成签到 ,获得积分10
12秒前
整齐白秋完成签到 ,获得积分10
16秒前
明理的乘云完成签到,获得积分20
18秒前
NIHAO完成签到 ,获得积分10
23秒前
天马完成签到,获得积分10
24秒前
明理的乘云关注了科研通微信公众号
31秒前
火星上誉完成签到 ,获得积分10
32秒前
xiaoju完成签到,获得积分20
34秒前
丸子完成签到 ,获得积分10
35秒前
38秒前
量子星尘发布了新的文献求助10
39秒前
耸耸完成签到 ,获得积分10
40秒前
43秒前
pp‘s发布了新的文献求助10
44秒前
wxh完成签到 ,获得积分10
47秒前
张图门完成签到 ,获得积分10
52秒前
liao_duoduo完成签到 ,获得积分10
53秒前
1分钟前
龙龙完成签到 ,获得积分10
1分钟前
小高同学完成签到,获得积分10
1分钟前
呆萌芙蓉完成签到 ,获得积分10
1分钟前
Jasper应助科研通管家采纳,获得10
1分钟前
LLin应助科研通管家采纳,获得10
1分钟前
猪猪hero应助科研通管家采纳,获得10
1分钟前
LLin应助科研通管家采纳,获得10
1分钟前
1分钟前
1分钟前
BAI_1完成签到,获得积分10
1分钟前
Una发布了新的文献求助50
1分钟前
猜不猜不完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
老实的黑米完成签到 ,获得积分10
1分钟前
川Q邓紫棋完成签到 ,获得积分10
1分钟前
Tiny完成签到 ,获得积分10
1分钟前
1分钟前
Hua完成签到 ,获得积分10
1分钟前
ZHR完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Polymorphism and polytypism in crystals 1000
Relation between chemical structure and local anesthetic action: tertiary alkylamine derivatives of diphenylhydantoin 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Checklist of Yunnan Pieridae (Lepidoptera: Papilionoidea) with nomenclature and distributional notes 500
Der Gleislage auf der Spur 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6074313
求助须知:如何正确求助?哪些是违规求助? 7905569
关于积分的说明 16345736
捐赠科研通 5212928
什么是DOI,文献DOI怎么找? 2788048
邀请新用户注册赠送积分活动 1770811
关于科研通互助平台的介绍 1648293