FeedRef2022: A Named Entity Recognition Dataset for Extracting Indicators of Compromise

计算机科学 妥协 注释 构造(python库) 棱锥(几何) 计算机安全 互联网 命名实体识别 人工智能 数据挖掘 机器学习 数据科学 万维网 任务(项目管理) 工程类 社会科学 社会学 物理 系统工程 光学 程序设计语言
作者
Hsin-Ju Chan,Chin-Yuan Hsu,Ching-Chang Chien,Ji-Jie Wu,He-Lin Ku
标识
DOI:10.1109/bigdata55660.2022.10020985
摘要

With the increasing use of the internet, cyber threats and malicious activities are becoming ubiquitous. To avoid unsuspecting attacks, gathering enough information about different threats is crucial. According to the Pyramid of Pain, Indicators of Compromise (IOCs) are the simplest artifacts to observe, which help cyber security professionals to design the corresponding precautions. Cyber Threat Intelligence (CTI) is data that presents current threat events, threat actors’ targets, and attack behaviors; hence, collecting and analyzing CTI in advance can be beneficial to defend against cyberattacks. In this paper, we construct a named entity recognition dataset using our annotation method by collecting 1,854 threat intelligence reports. Additionally, we fine-tuned four pre-trained language models and compared the efficiency of each model. Among the four models, we realized that the fine-tuned ELECTRA model could extract new IOCs correctly, and the FeedRef2022 dataset could train NER models for detecting IOCs.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小婷完成签到,获得积分10
刚刚
acid完成签到,获得积分10
刚刚
科研通AI6.3应助歪歪采纳,获得10
刚刚
WXY发布了新的文献求助10
刚刚
1秒前
老实黑猫发布了新的文献求助10
1秒前
星空发布了新的文献求助10
1秒前
岳普发布了新的文献求助10
2秒前
小蘑菇应助諾娑采纳,获得10
2秒前
梅TiAmo发布了新的文献求助10
2秒前
勤恳的灵薇完成签到,获得积分10
3秒前
Donutz完成签到,获得积分10
4秒前
4秒前
Seng发布了新的文献求助10
4秒前
火星上的傲旋完成签到,获得积分10
4秒前
Hello应助冷艳的竺采纳,获得10
4秒前
华仔应助王师傅采纳,获得10
5秒前
5秒前
李健应助青葱鱼块采纳,获得10
6秒前
梁凉凉完成签到 ,获得积分10
6秒前
6秒前
6秒前
eternal完成签到 ,获得积分10
7秒前
nanwang完成签到 ,获得积分10
8秒前
迷路煜祺完成签到,获得积分10
8秒前
Ava应助怡然安梦采纳,获得10
8秒前
8秒前
8秒前
一只小绵羊完成签到,获得积分10
8秒前
8秒前
8秒前
星空发布了新的文献求助10
8秒前
CodeCraft应助hc采纳,获得10
9秒前
10秒前
科研鬼才完成签到,获得积分10
10秒前
10秒前
hua完成签到,获得积分10
10秒前
xh发布了新的文献求助10
11秒前
11秒前
maduit发布了新的文献求助10
11秒前
高分求助中
Overcoming Stigma and Bias in Obesity Management 800
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Materials selection in mechanical design 500
Bounds for Statistical Estimation in Semiparametric Models 500
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6478406
求助须知:如何正确求助?哪些是违规求助? 8279986
关于积分的说明 17659237
捐赠科研通 5560730
什么是DOI,文献DOI怎么找? 2911088
邀请新用户注册赠送积分活动 1888058
关于科研通互助平台的介绍 1741844