An Efficient and Accurate Rough Set for Feature Selection, Classification, and Knowledge Representation

计算机科学 粗集 特征选择 人工智能 模式识别(心理学) 知识表示与推理 代表(政治) 特征(语言学) 选择(遗传算法) 数据挖掘 语言学 哲学 政治 政治学 法学
作者
Shuyin Xia,Xinyu Bai,Guoyin Wang,Yunlong Cheng,Deyu Meng,Xinbo Gao,Yujia Zhai,Elisabeth Giem
出处
期刊:IEEE Transactions on Knowledge and Data Engineering [IEEE Computer Society]
卷期号:35 (8): 7724-7735 被引量:27
标识
DOI:10.1109/tkde.2022.3220200
摘要

This paper presents a strong data-mining method based on a rough set, which can simultaneously realize feature selection, classification, and knowledge representation. Although a rough set, a popular method for feature selection, has good interpretability, it is not sufficiently efficient and accurate to deal with large-scale datasets with high dimensions, which prevents it from being immediately applied to real-world scenarios. To address the efficiency issue of a rough set, we discover the stability of the local redundancy (SLR) of attributes and propose a theorem to prove it rigorously. Based on SLR, only the parts of objects in the boundary region are partitioned when calculating outer significance, which further improves the efficiency of the rough set. With regard to the accuracy issue, we show that overfitting may lead to ineffectiveness of the rough set, especially when processing noise attributes. We then propose relative importance, a robust measurement for an attribute, to alleviate such overfitting issues. In this paper, we propose a novel rough-set framework that significantly improves the efficiency and accuracy of existing rough-set methods. We further develop our rough set framework by proposing a "rough concept tree" for knowledge representation and classification. Experimental results on public benchmark datasets show that our proposed framework achieves higher accuracy than seven state-of-the-art feature-selection methods. All the codes are available at https://github.com/syxiaa/powerroughset .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
wang完成签到,获得积分10
14秒前
我爱康康文献完成签到 ,获得积分10
20秒前
Wang完成签到 ,获得积分10
20秒前
楚楚完成签到 ,获得积分10
29秒前
17835152738完成签到,获得积分10
29秒前
cata完成签到,获得积分10
34秒前
熊泰山完成签到 ,获得积分10
37秒前
38秒前
40秒前
gtgyh完成签到 ,获得积分10
45秒前
无奈的萍发布了新的文献求助10
45秒前
kangkang完成签到 ,获得积分10
49秒前
皮皮完成签到 ,获得积分10
51秒前
aowulan完成签到 ,获得积分10
52秒前
程翠丝完成签到,获得积分10
53秒前
但大图完成签到 ,获得积分10
54秒前
双青豆完成签到 ,获得积分10
56秒前
56秒前
真真完成签到 ,获得积分10
59秒前
大灰狼完成签到 ,获得积分10
1分钟前
lql完成签到 ,获得积分10
1分钟前
chenying完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
Owen应助大灰狼采纳,获得30
1分钟前
机智的乌完成签到 ,获得积分10
1分钟前
KK完成签到 ,获得积分10
1分钟前
MM完成签到 ,获得积分10
1分钟前
racill完成签到 ,获得积分10
1分钟前
如初完成签到,获得积分10
1分钟前
红茸茸羊完成签到 ,获得积分10
1分钟前
fxy完成签到 ,获得积分10
1分钟前
1分钟前
shlw发布了新的文献求助10
1分钟前
疯狂的绝山完成签到 ,获得积分10
1分钟前
余味应助科研通管家采纳,获得10
1分钟前
余味应助科研通管家采纳,获得10
1分钟前
1分钟前
jennie完成签到 ,获得积分10
1分钟前
韩钰小宝完成签到 ,获得积分10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Computational Atomic Physics for Kilonova Ejecta and Astrophysical Plasmas 500
Technologies supporting mass customization of apparel: A pilot project 450
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3782730
求助须知:如何正确求助?哪些是违规求助? 3328104
关于积分的说明 10234493
捐赠科研通 3043122
什么是DOI,文献DOI怎么找? 1670450
邀请新用户注册赠送积分活动 799702
科研通“疑难数据库(出版商)”最低求助积分说明 758994