Machine Learning Interpretability in Diabetes RiskAssessment: A SHAP Analysis

可解释性 人工智能 机器学习 体质指数 特征选择 召回 计算机科学 梯度升压 糖尿病 试验装置 医学 心理学 内科学 随机森林 认知心理学 内分泌学
作者
Mustafa Kutlu,Turker Berk Donmez,Christopher Freeman
标识
DOI:10.69882/adba.cem.2024075
摘要

Diabetes continues to be a complicated and prevalent metabolic illness, providing a serious burden to public health. While machine learning approaches like extreme gradient boosting (XGBoost) provide intriguing options for diabetes prediction, their 'black-box' nature typically limits clinical interpretability. To overcome this gap, our work applied SHapley Additive exPlanations (SHAP) to give insights into the XGBoost model's predictions. The dataset utilized in this research comprised of 253,680 patients and contained 21 parameters, such as General Health Status, High Blood Pressure Status, Age, and Body Mass Index. After feature selection using Recursive Feature Elimination (RFE), 15 important characteristics were discovered. In the test set, the XGBoost model obtained an accuracy of 86.6%, precision of 54.1%, recall of 17.0%, and an F1-score of 25.9% for the Original dataset. For the RFE dataset, the model displayed an accuracy of 86.6\%, precision of 54.9%, recall of 16.5%, and an F1-score of 25.3%. SHAP analysis found that General Health Status, High Blood Pressure Status, Age, and Body Mass Index were the most important characteristics in both the Original and RFE datasets. This work provides as a platform for transparent and clinically applicable predictive modeling, assisting in early diabetes identification and preventive healthcare.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
追光发布了新的文献求助10
刚刚
AWDSDA发布了新的文献求助10
3秒前
black_cavalry完成签到,获得积分10
3秒前
Hello应助称心网络采纳,获得10
5秒前
fanboyz完成签到 ,获得积分10
7秒前
乐乐应助文艺的冬卉采纳,获得10
7秒前
整齐乐荷发布了新的文献求助10
8秒前
烟花应助车骋昊采纳,获得10
9秒前
爆爆应助科研通管家采纳,获得10
9秒前
桐桐应助科研通管家采纳,获得10
9秒前
脑洞疼应助科研通管家采纳,获得10
9秒前
SciGPT应助科研通管家采纳,获得10
9秒前
ding应助科研通管家采纳,获得10
9秒前
顾矜应助科研通管家采纳,获得10
10秒前
orixero应助科研通管家采纳,获得10
10秒前
10秒前
传奇3应助科研通管家采纳,获得10
10秒前
追光完成签到,获得积分10
10秒前
16PRO应助科研通管家采纳,获得10
10秒前
10秒前
10秒前
11秒前
11秒前
kwen完成签到 ,获得积分10
12秒前
洛阳官人完成签到,获得积分10
13秒前
孙燕应助标致盛男采纳,获得10
14秒前
xiongyh10完成签到,获得积分10
15秒前
感谢有你发布了新的文献求助10
15秒前
16秒前
17秒前
Alex应助复杂硬币采纳,获得30
17秒前
咩咩羊完成签到,获得积分10
18秒前
大模型应助整齐乐荷采纳,获得10
19秒前
小奋青完成签到 ,获得积分10
21秒前
谷策发布了新的文献求助10
22秒前
22秒前
27秒前
27秒前
zs1234完成签到,获得积分10
27秒前
李凭中国弹箜篌完成签到,获得积分10
27秒前
高分求助中
Mass producing individuality 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
Epigenetic Drug Discovery 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3823540
求助须知:如何正确求助?哪些是违规求助? 3365885
关于积分的说明 10438226
捐赠科研通 3085083
什么是DOI,文献DOI怎么找? 1697149
邀请新用户注册赠送积分活动 816235
科研通“疑难数据库(出版商)”最低求助积分说明 769462