Robust $k$-Means-Type Clustering for Noisy Data

聚类分析 计算机科学 类型(生物学) 数学 数据挖掘 人工智能 地质学 古生物学
作者
Xi Xiao,Hailong Ma,Guojun Gan,Qing Li,Bin Zhang,Shu‐Tao Xia
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:: 1-15
标识
DOI:10.1109/tnnls.2024.3392211
摘要

Data clustering is a fundamental machine learning task that seeks to categorize a dataset into homogeneous groups. However, real data usually contain noise, which poses significant challenges to clustering algorithms. In this article, motivated by how the k -means algorithm is derived from a Gaussian mixture model (GMM), we propose a robust k -means-type algorithm, named k -means-type clustering based on t -distribution (KMTD), by assuming that the data points are drawn from a special multivariate t -mixture model (TMM). Compared to the Gaussian distribution, the t -distribution has a fatter tail. The proposed algorithm is more robust to noise. Like the k -means algorithm, the proposed algorithm is simpler than those based on a full TMM. Both synthetic and actual data are used to illustrate the proposed algorithm's performance and efficiency. The experimental results demonstrated that the proposed algorithm operates more quickly than other sophisticated algorithms and, in most cases, achieves higher accuracy than the other algorithms.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
haha完成签到,获得积分10
刚刚
2799完成签到,获得积分10
2秒前
11发布了新的文献求助10
2秒前
chiweiyoung完成签到,获得积分10
3秒前
3秒前
dxtp01完成签到,获得积分10
4秒前
小黄瓜完成签到,获得积分20
6秒前
7秒前
烂漫的烙完成签到,获得积分10
9秒前
szbllc完成签到,获得积分10
9秒前
10秒前
欣喜柚子完成签到 ,获得积分10
12秒前
Jasper应助万里青山采纳,获得10
12秒前
自觉以冬发布了新的文献求助10
12秒前
123发布了新的文献求助10
13秒前
aslink完成签到,获得积分10
13秒前
TimeLeSs完成签到 ,获得积分10
13秒前
Bluetea完成签到,获得积分10
14秒前
szbllc发布了新的文献求助10
14秒前
小此君发布了新的文献求助10
14秒前
14秒前
123发布了新的文献求助10
14秒前
15秒前
dangdang完成签到 ,获得积分10
18秒前
znn完成签到,获得积分10
20秒前
芒果发布了新的文献求助10
21秒前
龙小天完成签到,获得积分10
22秒前
CC关注了科研通微信公众号
26秒前
阔达宛儿完成签到,获得积分20
28秒前
李爱国应助芒果采纳,获得10
29秒前
11完成签到,获得积分10
30秒前
30秒前
eth完成签到 ,获得积分10
30秒前
31秒前
淡淡青枫完成签到,获得积分10
33秒前
单薄冰安完成签到,获得积分10
33秒前
34秒前
34秒前
毛豆完成签到,获得积分10
34秒前
35秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Thermal effects on behaviour of clay–structure interface under partial drainage 500
Petrology and Plate Tectonics 500
Writing Systems 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6896180
求助须知:如何正确求助?哪些是违规求助? 8591886
关于积分的说明 18243560
捐赠科研通 6292377
什么是DOI,文献DOI怎么找? 3060591
关于科研通互助平台的介绍 2079252
邀请新用户注册赠送积分活动 2038399