An adaptive Laplacian weight random forest imputation for imbalance and mixed-type data

插补(统计学) 随机森林 缺少数据 计算机科学 过采样 数据挖掘 特征选择 数据类型 朴素贝叶斯分类器 人工智能 统计 机器学习 数学 支持向量机 计算机网络 程序设计语言 带宽(计算)
作者
Ren Lijuan,Aicha Sekhari Seklouli,Haiqing Zhang,Tao Wang,Abdelaziz Bouras
出处
期刊:Information Systems [Elsevier]
卷期号:111: 102122-102122 被引量:3
标识
DOI:10.1016/j.is.2022.102122
摘要

As the application of information technology in the medical field is resulting in a large amount of medical data. As early withdrawal and refusal of participants, there are a lot of missing values in medical data. Although various processing methods for missing values have been proposed, few methods for those medical data with characteristics of imbalance and mixed-type data. In this work, we proposed an adaptive Laplacian weight random forest, called ALWRF. In ALWRF, feature weights were adjusted dynamically when model constructing, which increases selection probabilities of features with low Laplacian score and high importance. Meanwhile, a random operator is introduced to increase the diversity of trees. Furthermore, we proposed an imputation method based on SMOTE-NC oversampling technology and the ALWRF method for imbalanced and mixed-type data, called SncALWRFI. Meanwhile, Bayesian optimization and cross-validation were employed to search optimal parameters. The experimental results showed that the ALWRF method outperforms random forest and Bayesian optimized random forest in terms of classification and regression accuracy. Further, in the experiment for missing values, the SncALWRFI showed the best imputation accuracy, and it performed high imputation effectiveness in public datasets with characteristics of imbalanced and mixed-type.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
白昼流星发布了新的文献求助10
2秒前
ccyrichard发布了新的文献求助10
3秒前
3秒前
bolin发布了新的文献求助10
3秒前
5秒前
Akim应助PL采纳,获得30
5秒前
Singularity发布了新的文献求助10
7秒前
15247完成签到,获得积分10
7秒前
eagleyao111发布了新的文献求助10
8秒前
8秒前
crush完成签到 ,获得积分10
9秒前
brucehekai发布了新的文献求助10
9秒前
小高发布了新的文献求助10
9秒前
情怀应助东北一枝花采纳,获得10
10秒前
152522完成签到,获得积分20
11秒前
11秒前
11秒前
yzq完成签到 ,获得积分10
13秒前
lth发布了新的文献求助10
13秒前
29完成签到,获得积分10
14秒前
葛老四发布了新的文献求助10
14秒前
个性的凡灵完成签到 ,获得积分10
14秒前
高兴的静曼完成签到 ,获得积分10
14秒前
隐形曼青应助鳗鱼落雁采纳,获得10
15秒前
16秒前
17秒前
专注语堂发布了新的文献求助10
18秒前
害羞向日葵完成签到,获得积分10
18秒前
虚拟的姒发布了新的文献求助10
18秒前
hanliulaixi完成签到 ,获得积分10
19秒前
研友_VZG7GZ应助kwan采纳,获得10
19秒前
科研小白完成签到 ,获得积分10
20秒前
21秒前
无花果应助待破晓采纳,获得10
22秒前
张光光发布了新的文献求助10
23秒前
Ava应助科研通管家采纳,获得10
23秒前
田様应助科研通管家采纳,获得10
23秒前
从容芮应助科研通管家采纳,获得30
23秒前
23秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Division and square root. Digit-recurrence algorithms and implementations 400
行動データの計算論モデリング 強化学習モデルを例として 400
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2552786
求助须知:如何正确求助?哪些是违规求助? 2178300
关于积分的说明 5613736
捐赠科研通 1899263
什么是DOI,文献DOI怎么找? 948319
版权声明 565554
科研通“疑难数据库(出版商)”最低求助积分说明 504327