Shallow decision trees for explainable $k$-means clustering

启发式 聚类分析 决策树 功能(生物学) 树(集合论) 计算机科学 简单(哲学) 多项式的 数学 时间复杂性 算法 组合数学 数据挖掘 数学优化 人工智能 数学分析 哲学 认识论 进化生物学 生物
作者
Eduardo Sany Laber,Lucas Murtinho,Felipe Leite de Oliveira
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2112.14718
摘要

A number of recent works have employed decision trees for the construction of explainable partitions that aim to minimize the $k$-means cost function. These works, however, largely ignore metrics related to the depths of the leaves in the resulting tree, which is perhaps surprising considering how the explainability of a decision tree depends on these depths. To fill this gap in the literature, we propose an efficient algorithm that takes into account these metrics. In experiments on 16 datasets, our algorithm yields better results than decision-tree clustering algorithms such as the ones presented in \cite{dasgupta2020explainable}, \cite{frost2020exkmc}, \cite{laber2021price} and \cite{DBLP:conf/icml/MakarychevS21}, typically achieving lower or equivalent costs with considerably shallower trees. We also show, through a simple adaptation of existing techniques, that the problem of building explainable partitions induced by binary trees for the $k$-means cost function does not admit an $(1+\epsilon)$-approximation in polynomial time unless $P=NP$, which justifies the quest for approximation algorithms and/or heuristics.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
情怀应助无情孤菱采纳,获得10
1秒前
wanci应助^O^采纳,获得10
2秒前
凉月发布了新的文献求助10
2秒前
chem完成签到,获得积分10
3秒前
李珂完成签到,获得积分10
9秒前
CarolineOY完成签到,获得积分10
9秒前
12秒前
沫沫完成签到 ,获得积分10
13秒前
万能图书馆应助凉月采纳,获得10
13秒前
爆米花应助可靠的又夏采纳,获得10
14秒前
鸣蜩阿六完成签到,获得积分10
15秒前
爆米花应助椰子冻采纳,获得30
16秒前
18秒前
科目三应助科研通管家采纳,获得10
19秒前
脑洞疼应助科研通管家采纳,获得10
19秒前
iVANPENNY应助科研通管家采纳,获得10
19秒前
柯一一应助科研通管家采纳,获得10
19秒前
斯文败类应助科研通管家采纳,获得10
19秒前
完美世界应助科研通管家采纳,获得10
19秒前
科研通AI2S应助科研通管家采纳,获得10
19秒前
胖胖橘应助科研通管家采纳,获得10
19秒前
小马甲应助科研通管家采纳,获得10
19秒前
天天快乐应助科研通管家采纳,获得10
20秒前
小马甲应助科研通管家采纳,获得10
20秒前
vvvvvv完成签到,获得积分10
20秒前
21秒前
这个大头张呀完成签到,获得积分10
21秒前
刘_Young完成签到,获得积分10
22秒前
Hustle发布了新的文献求助10
22秒前
ZYH完成签到,获得积分20
24秒前
28秒前
Ava应助hc采纳,获得10
31秒前
Hustle完成签到 ,获得积分20
33秒前
34秒前
35秒前
123完成签到,获得积分10
35秒前
39秒前
^O^发布了新的文献求助10
40秒前
风中寄灵完成签到 ,获得积分10
42秒前
42秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Counseling With Immigrants, Refugees, and Their Families From Social Justice Perspectives pages 800
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
Electrochemistry 500
Broflanilide prolongs the development of fall armyworm Spodoptera frugiperda by regulating biosynthesis of juvenile hormone 400
Statistical Procedures for the Medical Device Industry 400
藍からはじまる蛍光性トリプタンスリン研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2372547
求助须知:如何正确求助?哪些是违规求助? 2080392
关于积分的说明 5210850
捐赠科研通 1807718
什么是DOI,文献DOI怎么找? 902410
版权声明 558275
科研通“疑难数据库(出版商)”最低求助积分说明 481789