python 聚类算法 kmeans
时间: 2023-09-11 16:09:19 浏览: 140
python实现kmeans聚类算法
5星 · 资源好评率100%
K-Means是一种简单的聚类算法,用于将数据集划分为固定数量的聚类,使得聚类内部具有较高的相似性,而聚类与聚类之间具有较低的相似性。在Python中,可以使用scikit-learn库中的KMeans类来实现K-Means算法。
以下是使用Python的KMeans类实现K-Means算法的示例代码:
```python
import numpy as np
from sklearn.cluster import KMeans
# 创建随机数据集
X = np.random.randn(10, 100)
# 创建KMeans对象并拟合数据
kmeans = KMeans(n_clusters=6)
kmeans.fit(X)
# 对数据进行分类
for data in X:
print(kmeans.predict([data]))
```
上述代码创建了一个大小为10×100的随机数据集X,然后使用KMeans类创建了一个具有6个聚类的K-Means对象,并将数据拟合到该对象中。最后,使用predict方法对数据进行分类并输出结果。
如果你想在Jupyter Notebook中可视化聚类结果,可以使用matplotlib和sklearn.datasets中的make_blobs函数生成一个具有6个聚类的数据集,并使用scatter函数进行绘制。下面是一个示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
# 生成具有6个聚类的数据集
X, y = make_blobs(centers=6, n_samples=1000)
# 绘制数据集
fig = plt.figure(figsize=(8, 6))
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.title("Dataset with 6 clusters")
plt.xlabel("First feature")
plt.ylabel("Second feature")
plt.show()
```
上述代码生成了一个具有6个聚类的数据集,并使用scatter函数将数据集绘制在散点图上。每个聚类在图中用不同的颜色表示。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [Python实现K-means聚类算法](https://blog.csdn.net/wudibaba21/article/details/119704339)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文