已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Schema profiling of document-oriented databases

计算机科学 星型模式 信息架构 模式(遗传算法) 数据库架构 模式迁移 文件结构说明 情报检索 数据挖掘 半结构化模型 模式演化 数据库 数据库设计 万维网 XML
作者
Enrico Gallinucci,Matteo Golfarelli,Stefano Rizzi
出处
期刊:Information Systems [Elsevier]
卷期号:75: 13-25 被引量:51
标识
DOI:10.1016/j.is.2018.02.007
摘要

In document-oriented databases, schema is a soft concept and the documents in a collection can be stored using different local schemata. This gives designers and implementers augmented flexibility; however, it requires an extra effort to understand the rules that drove the use of alternative schemata when sets of documents with different —and possibly conflicting— schemata are to be analyzed or integrated. In this paper we propose a technique, called schema profiling, to explain the schema variants within a collection in document-oriented databases by capturing the hidden rules explaining the use of these variants. We express these rules in the form of a decision tree (schema profile). Consistently with the requirements we elicited from real users, we aim at creating explicative, precise, and concise schema profiles. The algorithm we adopt to this end is inspired by the well-known C4.5 classification algorithm and builds on two original features: the coupling of value-based and schema-based conditions within schema profiles, and the introduction of a novel measure of entropy to assess the quality of a schema profile. A set of experimental tests made on both synthetic and real datasets demonstrates the effectiveness and efficiency of our approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
chupic发布了新的文献求助10
刚刚
WqLiu发布了新的文献求助10
3秒前
echoMe完成签到 ,获得积分10
7秒前
AUK应助an慧儿采纳,获得10
8秒前
12秒前
wslll1987发布了新的文献求助10
12秒前
chupic完成签到,获得积分10
12秒前
kl完成签到,获得积分10
13秒前
546hgu发布了新的文献求助10
16秒前
18秒前
24秒前
ranhuanyu1998完成签到 ,获得积分10
27秒前
CodeCraft应助pp猪猪采纳,获得10
29秒前
Hu发布了新的文献求助10
31秒前
势临完成签到,获得积分10
36秒前
37秒前
AUK应助HHHH采纳,获得10
39秒前
传奇3应助546hgu采纳,获得10
41秒前
Jessica小玉完成签到 ,获得积分10
41秒前
41秒前
pp猪猪发布了新的文献求助10
41秒前
43秒前
abby发布了新的文献求助50
44秒前
ranhuanyu1998发布了新的文献求助10
48秒前
柚子皮蛋瘦肉粥完成签到 ,获得积分10
49秒前
pp猪猪完成签到,获得积分10
49秒前
踏实嚣完成签到 ,获得积分10
54秒前
老六完成签到 ,获得积分10
54秒前
nnnick完成签到,获得积分0
54秒前
花无双完成签到,获得积分10
55秒前
HHHH给HHHH的求助进行了留言
56秒前
56秒前
58秒前
bsumvp完成签到 ,获得积分10
1分钟前
abby完成签到,获得积分10
1分钟前
善良的安卉完成签到,获得积分10
1分钟前
HGalong完成签到,获得积分10
1分钟前
哇呀呀完成签到 ,获得积分10
1分钟前
Teresa完成签到 ,获得积分10
1分钟前
1分钟前
高分求助中
【本贴是提醒信息,请勿应助】请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Hemerologies of Assyrian and Babylonian Scholars 500
Challenges, Strategies, and Resiliency in Disaster and Risk Management 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2483146
求助须知:如何正确求助?哪些是违规求助? 2145304
关于积分的说明 5473083
捐赠科研通 1867511
什么是DOI,文献DOI怎么找? 928307
版权声明 563102
科研通“疑难数据库(出版商)”最低求助积分说明 496662