python聚类分析代码
时间: 2023-07-02 13:18:34 浏览: 89
好的,下面是一个简单的 Python 聚类分析代码示例,使用 k-means 算法:
```python
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv("dataset.csv")
# 特征选择
X = data.iloc[:, [2, 3]].values
# 使用 k-means 算法进行聚类分析
kmeans = KMeans(n_clusters=3, init='k-means++', random_state=0)
y_kmeans = kmeans.fit_predict(X)
# 可视化聚类结果
plt.scatter(X[y_kmeans == 0, 0], X[y_kmeans == 0, 1], s=100, c='red', label='Cluster 1')
plt.scatter(X[y_kmeans == 1, 0], X[y_kmeans == 1, 1], s=100, c='blue', label='Cluster 2')
plt.scatter(X[y_kmeans == 2, 0], X[y_kmeans == 2, 1], s=100, c='green', label='Cluster 3')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='yellow', label='Centroids')
plt.title('Cluster Analysis')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.show()
```
这段代码使用了 pandas 库读取数据集,选择了两个特征,然后使用 sklearn 库中的 KMeans 类进行聚类分析,最后使用 matplotlib 库将聚类结果可视化。请注意,这只是一个简单的示例,实际应用中可能需要根据具体情况进行修改和调整。
阅读全文