摘要:随着计算技术的迅猛发展,导致产生了大量的大数据集。因此,需要找到这些大数据集的元素之间的相似性并进行定义分组。找到这些相似之处的方法之一是数据聚类。目前,广泛使用的几种数据聚类算法,它们的应用领域和效率各有不同。计算能力的提高和算法的改进大幅减少了大数据集聚类所需的时间。为了克服在传统K-means聚类算法过程局部最优、簇内方差较大所带来的聚类结果不佳的缺陷,提出了一种基于利用切比雪夫距离的密度计算方法与传统K-means相结合的聚类算法。该算法根据切比雪夫距离的计算方法来计算数据源中数据点的密度,再利用K-means进行不断的迭代计算,最终得到聚类结果。实验结果表明,使用基于切比雪夫距离的密度计算方法与K-means结合的聚类方法有效降低了簇内方差,提升了聚类算法的性能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社