Textual data transformations using natural language processing for risk assessment

计算机科学 稳健性(进化) 数据挖掘 自然语言 风险评估 自然语言处理 人工智能 数据科学 风险分析(工程) 机器学习 计算机安全 生物化学 医学 基因 化学
作者
Mohammad Zaid Kamil,Mohammed Taleb‐Berrouane,Faisal Khan,Paul Amyotte,Salim Ahmed
出处
期刊:Risk Analysis [Wiley]
卷期号:43 (10): 2033-2052 被引量:4
标识
DOI:10.1111/risa.14100
摘要

Abstract Underlying information about failure, including observations made in free text, can be a good source for understanding, analyzing, and extracting meaningful information for determining causation. The unstructured nature of natural language expression demands advanced methodology to identify its underlying features. There is no available solution to utilize unstructured data for risk assessment purposes. Due to the scarcity of relevant data, textual data can be a vital learning source for developing a risk assessment methodology. This work addresses the knowledge gap in extracting relevant features from textual data to develop cause–effect scenarios with minimal manual interpretation. This study applies natural language processing and text‐mining techniques to extract features from past accident reports. The extracted features are transformed into parametric form with the help of fuzzy set theory and utilized in Bayesian networks as prior probabilities for risk assessment. An application of the proposed methodology is shown in microbiologically influenced corrosion‐related incident reports available from the Pipeline and Hazardous Material Safety Administration database. In addition, the trained named entity recognition (NER) model is verified on eight incidents, showing a promising preliminary result for identifying all relevant features from textual data and demonstrating the robustness and applicability of the NER method. The proposed methodology can be used in domain‐specific risk assessment to analyze, predict, and prevent future mishaps, ameliorating overall process safety.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
daheeeee完成签到,获得积分10
刚刚
刚刚
朵拉完成签到,获得积分10
1秒前
霍山柳发布了新的文献求助30
5秒前
boluohu完成签到 ,获得积分10
6秒前
辛勤的青雪完成签到,获得积分10
8秒前
11秒前
忧伤的含之完成签到,获得积分20
12秒前
memem1发布了新的文献求助10
15秒前
吴雨峰完成签到,获得积分10
16秒前
zzy发布了新的文献求助30
17秒前
讨厌组会完成签到,获得积分20
17秒前
弗一昂发布了新的文献求助20
21秒前
Hustle完成签到 ,获得积分20
21秒前
贰鸟应助巫马尔槐采纳,获得10
21秒前
21秒前
jy完成签到,获得积分10
21秒前
syq完成签到,获得积分10
22秒前
22秒前
23秒前
25秒前
syq发布了新的文献求助10
26秒前
AAAAA完成签到 ,获得积分10
27秒前
刻苦的匪完成签到,获得积分10
28秒前
于跃完成签到,获得积分10
29秒前
感性的夜玉完成签到,获得积分10
30秒前
852应助01采纳,获得10
31秒前
CodeCraft应助科研通管家采纳,获得10
33秒前
英俊的铭应助科研通管家采纳,获得10
33秒前
汉堡包应助科研通管家采纳,获得10
33秒前
桐桐应助科研通管家采纳,获得10
33秒前
33秒前
sars518应助科研通管家采纳,获得20
33秒前
zzz4743应助科研通管家采纳,获得30
33秒前
完美世界应助科研通管家采纳,获得10
33秒前
sars518应助科研通管家采纳,获得20
33秒前
zzz4743应助科研通管家采纳,获得30
33秒前
搜集达人应助科研通管家采纳,获得20
33秒前
zzz4743应助科研通管家采纳,获得30
33秒前
33秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
Pressing the Fight: Print, Propaganda, and the Cold War 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
The Three Stars Each: The Astrolabes and Related Texts 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2470623
求助须知:如何正确求助?哪些是违规求助? 2137423
关于积分的说明 5446309
捐赠科研通 1861574
什么是DOI,文献DOI怎么找? 925783
版权声明 562721
科研通“疑难数据库(出版商)”最低求助积分说明 495235