r/Fakeddit: A New Multimodal Benchmark Dataset for Fine-grained Fake News Detection

元数据 计算机科学 构造(python库) 水准点(测量) 分类 假新闻 多模态 情报检索 社会化媒体 在线和离线 人工智能 数据科学 机器学习 万维网 地理 互联网隐私 大地测量学 程序设计语言 操作系统
作者
Kai Nakamura,Shařon Levy,William Yang Wang
出处
期刊:Cornell University - arXiv 被引量:51
标识
DOI:10.48550/arxiv.1911.03854
摘要

Fake news has altered society in negative ways in politics and culture. It has adversely affected both online social network systems as well as offline communities and conversations. Using automatic machine learning classification models is an efficient way to combat the widespread dissemination of fake news. However, a lack of effective, comprehensive datasets has been a problem for fake news research and detection model development. Prior fake news datasets do not provide multimodal text and image data, metadata, comment data, and fine-grained fake news categorization at the scale and breadth of our dataset. We present Fakeddit, a novel multimodal dataset consisting of over 1 million samples from multiple categories of fake news. After being processed through several stages of review, the samples are labeled according to 2-way, 3-way, and 6-way classification categories through distant supervision. We construct hybrid text+image models and perform extensive experiments for multiple variations of classification, demonstrating the importance of the novel aspect of multimodality and fine-grained classification unique to Fakeddit.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
善良梦竹完成签到 ,获得积分10
1秒前
不想看文献完成签到,获得积分10
1秒前
林冰完成签到 ,获得积分10
1秒前
杨涵完成签到 ,获得积分10
1秒前
源孤律醒完成签到 ,获得积分10
2秒前
Gicrosoft完成签到,获得积分10
2秒前
冷静的访天完成签到 ,获得积分0
2秒前
WY发布了新的文献求助10
3秒前
不重名完成签到,获得积分10
3秒前
yunqingbai完成签到 ,获得积分10
3秒前
冷傲鸡翅完成签到,获得积分10
4秒前
5秒前
5秒前
倪倪发布了新的文献求助10
8秒前
周周发布了新的文献求助10
8秒前
樟木头完成签到,获得积分10
8秒前
奋斗小公主完成签到 ,获得积分10
9秒前
arniu2008发布了新的文献求助10
10秒前
11秒前
123完成签到,获得积分10
12秒前
Yanz发布了新的文献求助10
12秒前
zhaoxiaonuan完成签到,获得积分10
12秒前
kxz完成签到 ,获得积分10
13秒前
乐盟主完成签到,获得积分10
13秒前
13秒前
情怀应助科研通管家采纳,获得10
13秒前
13秒前
13秒前
哟呵完成签到,获得积分10
14秒前
MQL完成签到,获得积分10
15秒前
友好小松鼠完成签到 ,获得积分10
16秒前
爱吃冻梨完成签到 ,获得积分10
17秒前
哟呵发布了新的文献求助10
17秒前
misa完成签到 ,获得积分10
19秒前
大大彬完成签到 ,获得积分10
20秒前
WN完成签到,获得积分10
21秒前
Whenhow完成签到,获得积分10
21秒前
科研通AI6.3应助倪倪采纳,获得10
21秒前
陨落的繁星完成签到,获得积分10
21秒前
高分求助中
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6459307
求助须知:如何正确求助?哪些是违规求助? 8268426
关于积分的说明 17621881
捐赠科研通 5528528
什么是DOI,文献DOI怎么找? 2905911
邀请新用户注册赠送积分活动 1882638
关于科研通互助平台的介绍 1727808