Fine-Grained Multimodal Named Entity Recognition and Grounding with a Generative Framework

计算机科学 构造(python库) 任务(项目管理) 人工智能 注释 序列(生物学) 自然语言处理 对象(语法) 命名实体识别 情报检索 源代码 光学(聚焦) 编码(集合论) 模式识别(心理学) 集合(抽象数据类型) 程序设计语言 物理 管理 生物 光学 经济 遗传学
作者
Jieming Wang,Ziyan Li,Jianfei Yu,Yang Li,Rui Xia
标识
DOI:10.1145/3581783.3612322
摘要

Multimodal Named Entity Recognition (MNER) aims to locate and classify named entities mentioned in a pair of text and image. However, most previous MNER works focus on extracting entities in the form of text but failing to ground text symbols to their corresponding visual objects. Moreover, existing MNER studies primarily classify entities into four coarse-grained entity types, which are often insufficient to map them to their real-world referents. To solve these limitations, we introduce a task named Fine-grained Multimodal Named Entity Recognition and Grounding (FMNERG) in this paper, which aims to simultaneously extract named entities in text, their fine-grained entity types, and their grounded visual objects in image. Moreover, we construct a Twitter dataset for the FMNERG task, and further propose a T5-based multImodal GEneration fRamework (TIGER), which formulates FMNERG as a generation problem by converting all the entity-type-object triples into a target sequence and adapts a pre-trained sequence-to-sequence model T5 to directly generate the target sequence from an image-text input pair. Experimental results demonstrate that TIGER performs significantly better than a number of baseline systems on the annotated Twitter dataset. Our dataset annotation and source code are publicly released at https://github.com/NUSTM/FMNERG.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
jinbozhang发布了新的文献求助10
刚刚
boshazhiwu完成签到 ,获得积分10
1秒前
姿姿发布了新的文献求助40
1秒前
7秒前
热忱未减应助梨子采纳,获得50
8秒前
MY完成签到,获得积分10
9秒前
狂野吐司发布了新的文献求助10
10秒前
炙热的凤灵完成签到 ,获得积分10
11秒前
红红火火h完成签到 ,获得积分10
11秒前
Owen应助科研通管家采纳,获得10
18秒前
英姑应助科研通管家采纳,获得10
18秒前
18秒前
19秒前
狂野吐司完成签到,获得积分10
20秒前
21秒前
22秒前
健忘道天发布了新的文献求助10
22秒前
陶醉的君浩完成签到,获得积分10
23秒前
王SQ完成签到 ,获得积分10
26秒前
学习快乐应助甜美的若采纳,获得10
28秒前
魏头头完成签到 ,获得积分10
29秒前
30秒前
洁净依云完成签到,获得积分10
30秒前
郑嘉祺完成签到,获得积分10
35秒前
wanci应助Rochester采纳,获得30
36秒前
风中天思发布了新的文献求助30
36秒前
淡漠完成签到 ,获得积分10
37秒前
树先生发布了新的文献求助150
41秒前
43秒前
xueying6767完成签到,获得积分10
43秒前
44秒前
完美世界应助科研难采纳,获得10
45秒前
mikiyoo发布了新的文献求助10
45秒前
哈哈完成签到,获得积分10
47秒前
kakafan发布了新的文献求助10
49秒前
Lczhou完成签到,获得积分10
52秒前
kakafan完成签到,获得积分10
56秒前
Phoenix9630完成签到,获得积分10
57秒前
tudouni完成签到,获得积分10
59秒前
阿莫西林胶囊完成签到,获得积分10
1分钟前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Gymnastik für die Jugend 600
Chinese-English Translation Lexicon Version 3.0 500
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 440
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2385325
求助须知:如何正确求助?哪些是违规求助? 2091954
关于积分的说明 5261925
捐赠科研通 1819020
什么是DOI,文献DOI怎么找? 907184
版权声明 559114
科研通“疑难数据库(出版商)”最低求助积分说明 484619