FineCTI: A Framework for Mining Fine-grained Cyber Threat Information from Twitter Using NER Model

计算机科学 聚类分析 特征(语言学) 相似性(几何) 信息过载 信息敏感性 主题模型 数据挖掘 信息抽取 命名实体识别 情报检索 数据科学 计算机安全 万维网 机器学习 人工智能 任务(项目管理) 图像(数学) 管理 经济 语言学 哲学
作者
Chunyan Ma,Jun Jiang,Kai Zhang,Zhengwei Jiang,Peian Yang,Xuren Wang,Huamin Feng
标识
DOI:10.1109/trustcom60117.2023.00085
摘要

To timely respond to cyber threats related to a specific IT infrastructure called fine-grained (e.g., Windows or Linux), security analysts need to require timely and comprehensive threat information. Twitter, as a vital source of real-time threat information, provides abundant but overwhelming information due to the increased data sources. Automatically mining and summarizing fine-grained threat information from Twitter can help security analysts maintain the infrastructure's security. Most existing studies focus on classification, which carries less threat information. Some works use clustering based on text similarity relying on the embedding of text obtained from pre-trained models, which cannot be applied to short text, resulting in noisy clusters. Several works build topic models. However, the incoherent topic keywords are difficult to understand and analyze. To overcome these challenges, we design a FineCTI framework to mine the threat information related to the specific infrastructure on Twitter and generate a detailed threat information summary that is machine-readable and human-readable, efficiently reducing information overload. FineCTI optimizes the feature extraction part based on the named entity recognition model and performs clustering based on features extracted, thus effectively reducing the influence of sparsity of tweets on the clustering result and with the V-measure score improved by 7%. The cluster analysis results show that we can mine the fine-grained threats up to 15 days before the official disclosure date.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星辰大海应助阳光的灵竹采纳,获得30
1秒前
1秒前
chipmunk完成签到,获得积分10
1秒前
科研通AI2S应助淡淡映阳采纳,获得10
3秒前
3秒前
威武爆米花完成签到,获得积分10
3秒前
4秒前
爆米花应助太阳当下采纳,获得10
5秒前
5秒前
vkk完成签到 ,获得积分10
5秒前
6秒前
6秒前
鼠片发布了新的文献求助10
7秒前
彭于晏应助小兰花采纳,获得10
8秒前
9秒前
20010发布了新的文献求助10
10秒前
LL发布了新的文献求助10
10秒前
YIDAN发布了新的文献求助30
11秒前
12秒前
13秒前
打打应助NE采纳,获得10
13秒前
13秒前
14秒前
15秒前
思源应助20010采纳,获得10
16秒前
桐桐应助1157588380采纳,获得10
17秒前
罗大大完成签到 ,获得积分0
18秒前
wudilaoren发布了新的文献求助10
18秒前
安静的高山完成签到,获得积分10
18秒前
18秒前
顾矜应助淡淡映阳采纳,获得10
18秒前
标致凝莲发布了新的文献求助10
19秒前
简单如容发布了新的文献求助10
19秒前
zkc发布了新的文献求助10
19秒前
12123浪发布了新的文献求助10
19秒前
李爱国应助陈伟杰采纳,获得10
20秒前
20秒前
huh发布了新的文献求助10
20秒前
小鱼儿发布了新的文献求助10
21秒前
英俊的铭应助包宇采纳,获得10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Petrucci's General Chemistry: Principles and Modern Applications, 12th edition 600
FUNDAMENTAL STUDY OF ADAPTIVE CONTROL SYSTEMS 500
微纳米加工技术及其应用 500
Constitutional and Administrative Law 500
PARLOC2001: The update of loss containment data for offshore pipelines 500
Vertebrate Palaeontology, 5th Edition 420
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5298177
求助须知:如何正确求助?哪些是违规求助? 4446830
关于积分的说明 13840537
捐赠科研通 4332075
什么是DOI,文献DOI怎么找? 2378018
邀请新用户注册赠送积分活动 1373297
关于科研通互助平台的介绍 1338861