1.png
image
下面介绍Kmeans以及Kmeans++算法理论以及算法步骤:
2.png
3.png
根据样本特征选择不同的距离公式,程序实例中采用欧几里得距离。下面分别给出Kmeans以及Kmeans++算法的步骤。
4.png
Kmeans聚类算法的结果会因为初始的类别中心的不同差异很大,为了避免这个缺点,下面介绍对初始类别中心的选择进行了优化的Kmeans++聚类算法。
5.png
image
下面给出基于AnFany以及Sklearn库的结果:
AnFany结果:
af.png
Sklearn结果:
sk.png
作者:AiFan
链接:https://www.jianshu.com/p/9dace86f5246



