MMpedia: A Large-Scale Multi-modal Knowledge Graph

计算机科学 情态动词 知识图 可扩展性 图形 管道(软件) 构造(python库) 人工智能 情报检索 数据挖掘 自然语言处理 理论计算机科学 数据库 程序设计语言 化学 高分子化学
作者
Yinan Wu,Xiaowei Wu,Jùnwén Lǐ,Yue Zhang,Haofen Wang,Wan Du,Zhidong He,Jingping Liu,Tong Ruan
出处
期刊:Lecture Notes in Computer Science 卷期号:: 18-37
标识
DOI:10.1007/978-3-031-47243-5_2
摘要

Knowledge graphs serve as crucial resources for various applications. However, most existing knowledge graphs present symbolic knowledge in the form of natural language, lacking other modal information, e.g., images. Previous multi-modal knowledge graphs have encountered challenges with scaling and image quality. Therefore, this paper proposes a highly-scalable and high-quality multi-modal knowledge graph using a novel pipeline method. Summarily, we first retrieve images from a search engine and build a new Recurrent Gate Multi-modal model to filter out the non-visual entities. Then, we utilize entities’ textual and type information to remove noisy images of the remaining entities. Through this method, we construct a large-scale multi-modal knowledge graph named MMpedia, containing 2,661,941 entity nodes and 19,489,074 images. As we know, MMpedia has the largest collection of images among existing multi-modal knowledge graphs. Furthermore, we employ human evaluation and downstream tasks to verify the usefulness of images in MMpedia. The experimental result shows that both the state-of-the-art method and multi-modal large language model (e.g., VisualChatGPT) achieve about a 4% improvement on Hit@1 in the entity prediction task by incorporating our collected images. We also find that the multi-modal large language model is hard to ground entities to images. The dataset ( https://zenodo.org/record/7816711 ) and source code of this paper are available at https://github.com/Delicate2000/MMpedia .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
sgssm完成签到,获得积分10
1秒前
微之徒发布了新的文献求助10
2秒前
蒹葭苍苍发布了新的文献求助10
3秒前
时林完成签到,获得积分10
6秒前
yin完成签到,获得积分10
10秒前
骑着蜗牛追导弹完成签到 ,获得积分10
12秒前
wanci应助微之徒采纳,获得10
12秒前
自然水风完成签到 ,获得积分10
15秒前
hcjxj完成签到,获得积分10
15秒前
HCLonely完成签到,获得积分0
15秒前
18秒前
时光倒流的鱼完成签到,获得积分10
18秒前
XM完成签到 ,获得积分10
18秒前
Jasper应助想吃榴莲采纳,获得10
20秒前
mrwang完成签到 ,获得积分10
22秒前
GB完成签到 ,获得积分10
22秒前
唐新惠完成签到 ,获得积分10
23秒前
坚强采柳发布了新的文献求助10
25秒前
有魅力的念烟完成签到 ,获得积分10
26秒前
二世小卒完成签到 ,获得积分10
30秒前
小二郎应助阳光向秋采纳,获得20
33秒前
丰富的绮波完成签到 ,获得积分10
35秒前
坚强采柳完成签到,获得积分10
36秒前
daniel完成签到,获得积分10
37秒前
alick完成签到,获得积分10
37秒前
wuuToiiin完成签到,获得积分10
37秒前
小包子完成签到,获得积分10
38秒前
gao完成签到 ,获得积分10
38秒前
Ava应助雪轩采纳,获得10
38秒前
橙子完成签到 ,获得积分10
39秒前
40秒前
czz014完成签到,获得积分10
44秒前
阳光向秋发布了新的文献求助20
44秒前
善良断缘完成签到 ,获得积分10
48秒前
青衣完成签到,获得积分10
49秒前
wangdong完成签到,获得积分0
50秒前
糖糖爱干饭完成签到 ,获得积分10
52秒前
杨杨杨完成签到,获得积分10
57秒前
59秒前
叶洛洛完成签到 ,获得积分10
1分钟前
高分求助中
Mass producing individuality 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
Epigenetic Drug Discovery 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3822977
求助须知:如何正确求助?哪些是违规求助? 3365541
关于积分的说明 10435586
捐赠科研通 3084468
什么是DOI,文献DOI怎么找? 1696849
邀请新用户注册赠送积分活动 816061
科研通“疑难数据库(出版商)”最低求助积分说明 769389