亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

ChemDataExtractor 2.0: Autopopulated Ontologies for Materials Science

计算机科学 等级制度 情报检索 数据挖掘 信息抽取 数据科学 集合(抽象数据类型) 人口 知识抽取 解析 利用 光学(聚焦) 人工智能 物理 社会学 人口学 经济 光学 程序设计语言 计算机安全 市场经济
作者
Juraj Mavračić,Callum J. Court,Taketomo Isazawa,Stephen R. Elliott,Jacqueline M. Cole
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:61 (9): 4280-4289 被引量:75
标识
DOI:10.1021/acs.jcim.1c00446
摘要

The ever-growing abundance of data found in heterogeneous sources, such as scientific publications, has forced the development of automated techniques for data extraction. While in the past, in the physical sciences domain, the focus has been on the precise extraction of individual properties, attention has recently been devoted to the extraction of higher-level relationships. Here, we present a framework for an automated population of ontologies. That is, the direct extraction of a larger group of properties linked by a semantic network. We exploit data-rich sources, such as tables within documents, and present a new model concept that enables data extraction for chemical and physical properties with the ability to organize hierarchical data as nested information. Combining these capabilities with automatically generated parsers for data extraction and forward-looking interdependency resolution, we illustrate the power of our approach via the automatic extraction of a crystallographic hierarchy of information. This includes 18 interrelated submodels of nested data, extracted from an evaluation set of scientific articles, yielding an overall precision of 92.2%, across 26 different journals. Our method and associated toolkit, ChemDataExtractor 2.0, offers a key step toward the seamless integration of primary literature sources into a data-driven scientific framework.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
邹醉蓝完成签到,获得积分10
11秒前
15秒前
asdf1234q1发布了新的文献求助10
16秒前
17秒前
整齐千柳发布了新的文献求助10
19秒前
22秒前
酷波er应助wwwl采纳,获得10
32秒前
38秒前
39秒前
40秒前
wwwl完成签到,获得积分10
42秒前
44秒前
wwwl发布了新的文献求助10
46秒前
王冠军发布了新的文献求助10
52秒前
王冠军完成签到,获得积分10
1分钟前
忧虑的羊完成签到 ,获得积分10
1分钟前
再见当套7完成签到,获得积分10
1分钟前
1分钟前
情怀应助科研通管家采纳,获得10
1分钟前
1分钟前
Rayyu_0905完成签到 ,获得积分10
1分钟前
猪猪hero应助asdf1234q1采纳,获得10
1分钟前
2分钟前
2分钟前
三木足球发布了新的文献求助10
2分钟前
天天天才完成签到,获得积分10
2分钟前
xiaokang123完成签到,获得积分10
2分钟前
蓦然回首完成签到,获得积分10
2分钟前
asdf1234q1完成签到,获得积分20
2分钟前
碳酸芙兰完成签到,获得积分10
2分钟前
小冯完成签到 ,获得积分10
3分钟前
钱邦国完成签到 ,获得积分10
3分钟前
daisy应助rpe采纳,获得20
3分钟前
默默犀牛发布了新的文献求助10
3分钟前
Owen应助科研通管家采纳,获得10
3分钟前
dormraider完成签到,获得积分10
3分钟前
大个应助沐颜采纳,获得10
3分钟前
3分钟前
3分钟前
沐颜发布了新的文献求助10
3分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3792466
求助须知:如何正确求助?哪些是违规求助? 3336701
关于积分的说明 10281905
捐赠科研通 3053448
什么是DOI,文献DOI怎么找? 1675609
邀请新用户注册赠送积分活动 803592
科研通“疑难数据库(出版商)”最低求助积分说明 761468