FeedRef2022: A Named Entity Recognition Dataset for Extracting Indicators of Compromise

计算机科学 妥协 注释 构造(python库) 棱锥(几何) 计算机安全 互联网 命名实体识别 人工智能 数据挖掘 机器学习 数据科学 万维网 任务(项目管理) 工程类 社会科学 社会学 物理 系统工程 光学 程序设计语言
作者
Hsin-Ju Chan,Chin-Yuan Hsu,Ching-Chang Chien,Ji-Jie Wu,He-Lin Ku
标识
DOI:10.1109/bigdata55660.2022.10020985
摘要

With the increasing use of the internet, cyber threats and malicious activities are becoming ubiquitous. To avoid unsuspecting attacks, gathering enough information about different threats is crucial. According to the Pyramid of Pain, Indicators of Compromise (IOCs) are the simplest artifacts to observe, which help cyber security professionals to design the corresponding precautions. Cyber Threat Intelligence (CTI) is data that presents current threat events, threat actors’ targets, and attack behaviors; hence, collecting and analyzing CTI in advance can be beneficial to defend against cyberattacks. In this paper, we construct a named entity recognition dataset using our annotation method by collecting 1,854 threat intelligence reports. Additionally, we fine-tuned four pre-trained language models and compared the efficiency of each model. Among the four models, we realized that the fine-tuned ELECTRA model could extract new IOCs correctly, and the FeedRef2022 dataset could train NER models for detecting IOCs.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
5秒前
糖伯虎完成签到 ,获得积分10
7秒前
8秒前
正霖发布了新的文献求助10
8秒前
rocky15应助科研通管家采纳,获得10
8秒前
田様应助科研通管家采纳,获得10
8秒前
8秒前
9秒前
10秒前
坚定水壶完成签到 ,获得积分10
11秒前
12秒前
jtc发布了新的文献求助10
12秒前
充电宝应助陈梓采纳,获得10
13秒前
rocky15应助Guowei采纳,获得10
13秒前
好鬼谷完成签到,获得积分20
13秒前
在水一方应助painting采纳,获得10
15秒前
15秒前
Dusk大寺柯完成签到,获得积分10
16秒前
彭于晏应助勇毅前行采纳,获得10
16秒前
18秒前
20秒前
21秒前
22秒前
深情安青应助Heng采纳,获得10
22秒前
22秒前
23秒前
23秒前
roomvinli发布了新的文献求助10
23秒前
钱念波完成签到 ,获得积分10
24秒前
bkagyin应助胡younger米采纳,获得10
24秒前
25秒前
Elions完成签到 ,获得积分10
25秒前
25秒前
26秒前
hhh发布了新的文献求助10
26秒前
爆米花应助ma采纳,获得10
26秒前
painting发布了新的文献求助10
26秒前
owlhealth发布了新的文献求助10
26秒前
陈小二完成签到,获得积分10
26秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
The role of families in providing long term care to the frail and chronically ill elderly living in the community 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2555557
求助须知:如何正确求助?哪些是违规求助? 2179748
关于积分的说明 5621007
捐赠科研通 1901058
什么是DOI,文献DOI怎么找? 949551
版权声明 565592
科研通“疑难数据库(出版商)”最低求助积分说明 504748