Improvement of DBSCAN Algorithm Based on K-Dist Graph for Adaptive Determining Parameters

数据库扫描 聚类分析 算法 计算机科学 图形 确定数据集中的群集数 模式识别(心理学) 航程(航空) 数学 人工智能 CURE数据聚类算法 相关聚类 理论计算机科学 复合材料 材料科学
作者
Lifeng Yin,Hongtao Hu,Kunpeng Li,Guanghai Zheng,Yingwei Qu,Huayue Chen
出处
期刊:Electronics [Multidisciplinary Digital Publishing Institute]
卷期号:12 (15): 3213-3213 被引量:4
标识
DOI:10.3390/electronics12153213
摘要

For the shortcomings of an unstable clustering effect and low accuracy caused by the manual setting of the two parameters Eps and MinPts of the DBSCAN (density-based spatial clustering of applications with noise) algorithm, this paper proposes an adaptive determination method for DBSCAN algorithm parameters based on the K-dist graph, noted as X-DBSCAN. The algorithm uses the least squares polynomial curve fitting method to fit the curve in the K-dist graph to generate a list of candidate Eps parameters and uses the mathematical expectation method and noise reduction threshold to generate the corresponding MinPts parameter list. According to the clustering results of each group of parameters in the Eps and MinPts parameter lists, a stable range of cluster number changes is found, and the MinPts and Eps corresponding to the maximum K value in the stable range are selected as the optimal algorithm parameters. The optimality of this parameter was verified using silhouette coefficients. A variety of experiments were designed from multiple angles on the artificial dataset and the UCI real dataset. The experimental results show that the clustering accuracy of X-DBSCAN was 21.83% and 15.52% higher than that of DBSCAN on the artificial and real datasets, respectively. The X-DBSCAN algorithm was also superior to other algorithms through comprehensive evaluation and analysis of various clustering indicators. In addition, experiments on four synthetic Gaussian datasets of different dimensions showed that the average clustering indices of the proposed algorithm were above 0.999. The X-DBSCAN algorithm can select parameters adaptively in combination with the characteristics of the dataset; the clustering effect is better, and clustering process automation is realized.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
Wacky发布了新的文献求助10
3秒前
美满的机器猫完成签到,获得积分10
4秒前
4秒前
AAAA完成签到,获得积分10
7秒前
深情安青应助思柔采纳,获得10
7秒前
moriaty应助rarfen采纳,获得10
7秒前
怕孤单的绝义完成签到,获得积分10
9秒前
二姑娘发布了新的文献求助10
10秒前
10秒前
12秒前
科研通AI5应助ZJU丶CMZ采纳,获得10
12秒前
科研通AI5应助帅气的沧海采纳,获得10
14秒前
14秒前
wddhy完成签到,获得积分10
15秒前
QDF发布了新的文献求助10
15秒前
丁仪完成签到,获得积分10
16秒前
SMG发布了新的文献求助10
16秒前
xin完成签到,获得积分10
16秒前
阿嘎普莱特完成签到,获得积分10
18秒前
18秒前
白茶完成签到,获得积分10
18秒前
wddhy发布了新的文献求助10
19秒前
19秒前
充电宝应助QDF采纳,获得10
21秒前
hbhbj发布了新的文献求助10
21秒前
pshhhz1994发布了新的文献求助10
22秒前
23秒前
25秒前
震动的戒指完成签到,获得积分10
25秒前
lulu完成签到 ,获得积分10
26秒前
27秒前
dm11完成签到 ,获得积分10
29秒前
29秒前
30秒前
ZJU丶CMZ发布了新的文献求助10
30秒前
西部森林完成签到,获得积分10
30秒前
30秒前
tutu完成签到,获得积分10
32秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 800
求中国石油大学(北京)图书馆的硕士论文,作者董晨,十年前搞太赫兹的 500
Vertebrate Palaeontology, 5th Edition 500
Narrative Method and Narrative form in Masaccio's Tribute Money 500
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4768748
求助须知:如何正确求助?哪些是违规求助? 4105258
关于积分的说明 12698872
捐赠科研通 3823356
什么是DOI,文献DOI怎么找? 2110064
邀请新用户注册赠送积分活动 1134444
关于科研通互助平台的介绍 1015793