Efficient Data Clustering Algorithms: Improvements over Kmeans

计算机科学 k均值聚类 聚类分析 初始化 离群值 数据挖掘 算法 人工智能 程序设计语言
作者
Mohamed B. Abubaker,Wesam M. Ashour
出处
期刊:International journal of intelligent systems and applications [MECS Publisher]
卷期号:5 (3): 37-49 被引量:27
标识
DOI:10.5815/ijisa.2013.03.04
摘要

This paper presents a new approach to overcome one of the most known disadvantages of the well-known Kmeans clustering algorith m.The problems of classical Kmeans are such as the problem of random init ialization of prototypes and the requirement of predefined number of clusters in the dataset.Randomly in itialized prototypes can often yield results to converge to local rather than global optimu m.A better result of Kmeans may be obtained by running it many times to get satisfactory results.The proposed algorith ms are based on a new novel definition of densities of data points which is based on the k-nearest neighbor method.By this definit ion we detect noise and outliers which affect Kmeans strongly, and obtained good initial prototypes from one run with automatic determination of K nu mber of clusters.This algorithm is referred to as Efficient In itializat ion of Kmeans (EI-Kmeans).Still Kmeans algorithm used to cluster data with convex shapes, similar sizes, and densities.Thus we develop a new clustering algorith m called Efficient Data Clustering Algorith m (EDCA) that uses our new definit ion of densities of data points.The results show that the proposed algorithms improve the data clustering by Kmeans.EDCA is able to detect clusters with different non-convex shapes, different sizes and densities.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
酷波er应助yangliming采纳,获得10
刚刚
lijg完成签到,获得积分10
刚刚
Amekaji完成签到,获得积分10
1秒前
bofu发布了新的文献求助10
2秒前
3秒前
4秒前
六六发布了新的文献求助30
6秒前
张泽崇应助巫马白桃采纳,获得10
6秒前
张泽崇应助巫马白桃采纳,获得10
6秒前
tsttst发布了新的文献求助10
7秒前
bofu发布了新的文献求助10
8秒前
Lucas应助裴白薇采纳,获得10
8秒前
9秒前
11秒前
11秒前
Jennie发布了新的文献求助10
11秒前
fang发布了新的文献求助10
11秒前
11秒前
东方傲儿发布了新的文献求助20
12秒前
12秒前
13秒前
bofu发布了新的文献求助10
14秒前
雪舞樱飘完成签到,获得积分10
15秒前
16秒前
会飞的猪发布了新的文献求助10
16秒前
16秒前
少少完成签到,获得积分20
17秒前
uu完成签到 ,获得积分10
19秒前
yangliming发布了新的文献求助10
19秒前
顺利山蝶发布了新的文献求助10
20秒前
20秒前
雪舞樱飘发布了新的文献求助10
21秒前
21秒前
21秒前
ssssept发布了新的文献求助10
22秒前
shinysparrow应助脆皮晶晶采纳,获得20
23秒前
希望天下0贩的0应助零蝉采纳,获得10
25秒前
少少发布了新的文献求助10
25秒前
运医瘦瘦花生完成签到,获得积分10
25秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
Aspect and Predication: The Semantics of Argument Structure 666
De arte gymnastica. The art of gymnastics 600
少脉山油柑叶的化学成分研究 530
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2411716
求助须知:如何正确求助?哪些是违规求助? 2106567
关于积分的说明 5323481
捐赠科研通 1833972
什么是DOI,文献DOI怎么找? 913832
版权声明 560895
科研通“疑难数据库(出版商)”最低求助积分说明 488667