Large dataset partitioning using ensemble partition-based clustering with majority voting technique

聚类分析 计算机科学 数据挖掘 CURE数据聚类算法 模糊聚类 数据库扫描 相关聚类 分拆(数论) 树冠聚类算法 数据流聚类 共识聚类 高维数据聚类 人工智能 机器学习 数学 组合数学
作者
Vunnava Dinesh Babu,K. Malathi
出处
期刊:Indonesian Journal of Electrical Engineering and Computer Science [Institute of Advanced Engineering and Science (IAES)]
卷期号:29 (2): 838-838 被引量:1
标识
DOI:10.11591/ijeecs.v29.i2.pp838-844
摘要

<span lang="EN-US">Large datasets have become useful in data mining for processing, storing, and handling vast amounts of data. However, handling and processing large datasets is time-consuming and memory intensive. As a result, the researchers adopted a partitioning strategy to improve controllability and performance and reduce the time and memory required to handle large datasets. Unfortunately, the numerous clustering techniques available in the literature could confuse experts in choosing the best techniques for a given dataset. Furthermore, no clustering technique can tackle all problems, such as cluster structure, noise, or density. To manage large datasets, existing clustering techniques need scalable solutions. Therefore, this paper proposes an ensemble partition-based clustering with a majority voting technique for large dataset partitioning using the aggregation of k-means, k-medoids, fuzzy c-means, expectation-maximization (EM) and density-based spatial clustering of applications with noise (DBSCAN) techniques. These techniques cluster the large dataset individually in the first stage. The final clusters are discovered in the next stage through a majority voting technique among the five clustering algorithms. These five clustering algorithms assigned data instances to the cluster with the most votes. The experimental findings demonstrate that the ensemble partition-based clustering method surpasses the other five clustering algorithms in terms of execution time and accuracy.</span>

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
周周周完成签到 ,获得积分10
4秒前
8秒前
依古比古完成签到 ,获得积分10
11秒前
13秒前
鳗鱼凌雪完成签到,获得积分20
14秒前
回锅肉完成签到 ,获得积分10
17秒前
17秒前
睁眼睡大觉完成签到 ,获得积分10
18秒前
舒适思松完成签到 ,获得积分10
18秒前
鳗鱼凌雪发布了新的文献求助10
21秒前
娇1994完成签到,获得积分10
24秒前
27秒前
merrylake完成签到 ,获得积分10
30秒前
36秒前
cdercder应助369ninja采纳,获得10
43秒前
CY完成签到,获得积分10
44秒前
xinjiasuki完成签到 ,获得积分10
45秒前
freebird完成签到,获得积分10
47秒前
宇文雨文完成签到 ,获得积分10
53秒前
认真觅荷完成签到 ,获得积分10
55秒前
林克完成签到,获得积分10
57秒前
木子李完成签到 ,获得积分10
57秒前
丽丽完成签到,获得积分10
59秒前
貔貅完成签到 ,获得积分10
1分钟前
王淳完成签到 ,获得积分10
1分钟前
璟6完成签到 ,获得积分10
1分钟前
1分钟前
陈M雯完成签到 ,获得积分10
1分钟前
莫三颜完成签到 ,获得积分10
1分钟前
LIJIngcan完成签到 ,获得积分10
1分钟前
不知道完成签到,获得积分10
1分钟前
isedu完成签到,获得积分0
1分钟前
wonwojo完成签到 ,获得积分10
1分钟前
1分钟前
bkagyin应助科研通管家采纳,获得10
1分钟前
CindyZhao完成签到 ,获得积分10
1分钟前
automan完成签到,获得积分10
1分钟前
如意书桃完成签到 ,获得积分10
1分钟前
zoey完成签到,获得积分10
1分钟前
1分钟前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
Matrix Methods in Data Mining and Pattern Recognition 510
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7204269
求助须知:如何正确求助?哪些是违规求助? 8838112
关于积分的说明 18651840
捐赠科研通 6850698
什么是DOI,文献DOI怎么找? 3180150
关于科研通互助平台的介绍 2338227
邀请新用户注册赠送积分活动 2154576