An adaptive Laplacian weight random forest imputation for imbalance and mixed-type data

插补(统计学) 随机森林 缺少数据 计算机科学 过采样 数据挖掘 特征选择 数据类型 朴素贝叶斯分类器 人工智能 统计 机器学习 数学 支持向量机 计算机网络 程序设计语言 带宽(计算)
作者
Ren Lijuan,Aicha Sekhari Seklouli,Haiqing Zhang,Tao Wang,Abdelaziz Bouras
出处
期刊:Information Systems [Elsevier BV]
卷期号:111: 102122-102122 被引量:3
标识
DOI:10.1016/j.is.2022.102122
摘要

As the application of information technology in the medical field is resulting in a large amount of medical data. As early withdrawal and refusal of participants, there are a lot of missing values in medical data. Although various processing methods for missing values have been proposed, few methods for those medical data with characteristics of imbalance and mixed-type data. In this work, we proposed an adaptive Laplacian weight random forest, called ALWRF. In ALWRF, feature weights were adjusted dynamically when model constructing, which increases selection probabilities of features with low Laplacian score and high importance. Meanwhile, a random operator is introduced to increase the diversity of trees. Furthermore, we proposed an imputation method based on SMOTE-NC oversampling technology and the ALWRF method for imbalanced and mixed-type data, called SncALWRFI. Meanwhile, Bayesian optimization and cross-validation were employed to search optimal parameters. The experimental results showed that the ALWRF method outperforms random forest and Bayesian optimized random forest in terms of classification and regression accuracy. Further, in the experiment for missing values, the SncALWRFI showed the best imputation accuracy, and it performed high imputation effectiveness in public datasets with characteristics of imbalanced and mixed-type.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lycc完成签到,获得积分20
2秒前
和谐雨竹完成签到,获得积分10
2秒前
贾恒博发布了新的文献求助10
3秒前
5秒前
eee完成签到 ,获得积分10
6秒前
cdercder应助莫莫采纳,获得20
9秒前
lynn完成签到,获得积分10
9秒前
lycc发布了新的文献求助10
10秒前
sen完成签到,获得积分10
10秒前
11秒前
jkhjkhj完成签到,获得积分10
11秒前
星辰大海应助Ttttsyu采纳,获得30
11秒前
13秒前
15秒前
peterlaa3完成签到,获得积分10
16秒前
luluyu完成签到,获得积分10
18秒前
冷傲听白完成签到,获得积分10
18秒前
Rose完成签到,获得积分20
19秒前
乙酰胆碱发布了新的文献求助10
19秒前
20秒前
ZHENZHEN发布了新的文献求助10
24秒前
不渡江发布了新的文献求助10
25秒前
活力山蝶发布了新的文献求助10
26秒前
玖玖完成签到,获得积分20
26秒前
26秒前
啧啧完成签到 ,获得积分10
28秒前
科研通AI6.4应助楼一笑采纳,获得10
29秒前
Kevin完成签到,获得积分10
29秒前
菓小柒发布了新的文献求助10
31秒前
32秒前
33秒前
默默访冬完成签到 ,获得积分10
36秒前
Pony完成签到,获得积分10
37秒前
37秒前
molihuakai应助GM采纳,获得10
37秒前
WBH36323发布了新的文献求助10
38秒前
39秒前
哇owao完成签到,获得积分10
39秒前
珍珠奶茶完成签到,获得积分10
40秒前
领导范儿应助ZHENZHEN采纳,获得50
41秒前
高分求助中
论现代体育科学研究的方法学特征 1000
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6918396
求助须知:如何正确求助?哪些是违规求助? 8608967
关于积分的说明 18265030
捐赠科研通 6332464
什么是DOI,文献DOI怎么找? 3069206
关于科研通互助平台的介绍 2098382
邀请新用户注册赠送积分活动 2046409