BIRCH

聚类分析 计算机科学 数据挖掘 CURE数据聚类算法 鉴定(生物学) 高维数据聚类 相关聚类 公制(单位) 人工智能 机器学习 模式识别(心理学) 运营管理 植物 生物 经济
作者
Tian Zhang,Raghu Ramakrishnan,Miron Livny
标识
DOI:10.1145/233269.233324
摘要

Finding useful patterns in large datasets has attracted considerable interest recently, and one of the most widely studied problems in this area is the identification of clusters, or densely populated regions, in a multi-dimensional dataset. Prior work does not adequately address the problem of large datasets and minimization of I/O costs.This paper presents a data clustering method named BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), and demonstrates that it is especially suitable for very large databases. BIRCH incrementally and dynamically clusters incoming multi-dimensional metric data points to try to produce the best quality clustering with the available resources (i.e., available memory and time constraints). BIRCH can typically find a good clustering with a single scan of the data, and improve the quality further with a few additional scans. BIRCH is also the first clustering algorithm proposed in the database area to handle "noise" (data points that are not part of the underlying pattern) effectively.We evaluate BIRCH's time/space efficiency, data input order sensitivity, and clustering quality through several experiments. We also present a performance comparisons of BIRCH versus CLARANS, a clustering method proposed recently for large datasets, and show that BIRCH is consistently superior.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
纯真冰露完成签到,获得积分10
刚刚
诸葛一笑发布了新的文献求助10
1秒前
好运连连发布了新的文献求助10
2秒前
今后应助刘浩然采纳,获得10
3秒前
科研通AI2S应助fhznuli采纳,获得10
4秒前
今后应助稳重的尔阳采纳,获得10
6秒前
香蕉觅云应助诸葛一笑采纳,获得10
6秒前
ymh发布了新的文献求助10
9秒前
123_完成签到,获得积分10
9秒前
汉堡包应助科研通管家采纳,获得200
12秒前
丘比特应助科研通管家采纳,获得10
13秒前
隐形曼青应助科研通管家采纳,获得10
13秒前
13秒前
fhznuli发布了新的文献求助10
18秒前
20秒前
20秒前
23秒前
24秒前
社科狗发布了新的文献求助80
29秒前
30秒前
31秒前
空明流毓发布了新的文献求助10
31秒前
巧巧巧乐兹完成签到,获得积分10
31秒前
31秒前
天天向上发布了新的文献求助10
32秒前
32秒前
36秒前
sam发布了新的文献求助10
36秒前
36秒前
BowieHuang应助Tsuki采纳,获得10
36秒前
自觉的凛发布了新的文献求助10
36秒前
无花果应助丰盛的煎饼采纳,获得10
37秒前
yourenpkma123发布了新的文献求助10
37秒前
39秒前
英姑应助材小料采纳,获得10
39秒前
陈陈发布了新的文献求助10
39秒前
向日葵完成签到,获得积分10
39秒前
39秒前
伟峰发布了新的文献求助10
40秒前
大眼的平松完成签到,获得积分10
40秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1621
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
Brittle fracture in welded ships 1000
King Tyrant 600
Essential Guides for Early Career Teachers: Mental Well-being and Self-care 500
A Guide to Genetic Counseling, 3rd Edition 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5563713
求助须知:如何正确求助?哪些是违规求助? 4648650
关于积分的说明 14685821
捐赠科研通 4590597
什么是DOI,文献DOI怎么找? 2518657
邀请新用户注册赠送积分活动 1491243
关于科研通互助平台的介绍 1462521