杨旭华,朱钦鹏,童长飞.基于Laplacian中心性的密度聚类算法[J].计算机科学,2018,45(1):292-296, 306
基于Laplacian中心性的密度聚类算法
Density Clustering Algorithm Based on Laplacian Centrality
投稿时间:2016-12-01  修订日期:2017-03-23
DOI:10.11896/j.issn.1002-137X.2018.01.051
中文关键词:  加权完全图,Laplacian中心性,密度聚类
英文关键词:Weighted complete graph,Laplacian centrality,Density clustering
基金项目:本文受国家自然科学基金(61374152),浙江省自然科学基金(LY17F030016,LQ13G010007)资助
作者单位E-mail
杨旭华 浙江工业大学计算机科学与技术学院 杭州310023 xhyang@zjut.edu.cn 
朱钦鹏 浙江工业大学计算机科学与技术学院 杭州310023 sh2zqp@163.com 
童长飞 温州大学计算机科学与工程系 浙江 温州325035 changfei@wzu.edu.cn 
摘要点击次数: 537
全文下载次数: 376
中文摘要:
      聚类分析是一种重要的数据挖掘工具,可以衡量不同数据之间的相似性,并把它们分到不同的类别中,在模式识别、经济学和生物学等领域有着广泛的应用。 文中提出了一种新的聚类算法。首先,把待分类的数据集转换成一个加权的完全图,每个数据点为一个节点,两个数据点之间的距离为相应两个节点之间边的权值。然后,用Laplacian中心性来计算和评价该网络每个节点的局部重要性,聚类中心为局部的密度中心,它具有比周围的邻居节点更高的Laplacian中心性,并且与具有更高Laplacian中心性的节点之间的距离也较大。新算法是一种真正的无参数聚类方法,不需要任何先验参数便可以自动地对数据集进行分类。在6种数据集中将其与9种知名聚类算法做了对比,结果显示该算法具有良好的聚类效果。
英文摘要:
      As an important tool of data mining,clustering analysis can measure similarity between the different data and classify them into different categories.It is wisely applied in pattern recognition,economics,biology and so on.In this paper,a new clustering algorithm was proposed.Firstly,dataset to be classified is converted into a weighted complete graph.Data point is a node and the distance between two data points is used as weight of side between these two data points.Secondly,local importance of each node in the network is calculated and evaluated by Laplacian centrality.The cluster center has higher Laplacian centrality than surrounding neighbor nodes and the node with higher Laplacian centrality has larger distance.Finally,the algorithm is a real parameter-free clustering method,which can classify the dataset automatically without any priori parameters.In this article,the new algorithm was compared with 9 famous clustering algorithms in 6 datasets.Experimental results show that the proposed algorithm has good clustering performance.
查看全文  查看/发表评论  下载PDF阅读器