k-means聚类算法实现
1.首先,我们选择一些类/组来使用并随机地初始化它们各自的中心点。要想知道要使用的类的数量,最好快速地查看一下数据,并尝试识别任何不同的分组。中心点是与每个数据点向量相同长度的向量,在上面的图形中是“X”。 2.每个数据点通过计算点和每个组中心之间的距离进行分类,然后将这个点分类为最接近它的组。 3.基于这些分类点,我们通过取组中所有向量的均值来重新计算组中心。 4.对一组迭代重复这些步骤。你还可以选择随机初始化组中心几次,然后选择那些看起来对它提供了最好结果的来运行