西瓜数据集的k-means聚类算法python代码实现
时间: 2023-10-01 20:03:40 浏览: 117
K-means 聚类算法 python 代码实现
可以参考以下代码实现:
```python
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
# 读取数据
data = pd.read_csv('watermelon.csv')
X = data.iloc[:, 1:3].values
# 特征缩放
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# KMeans聚类
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X_scaled)
# 输出聚类结果
labels = kmeans.labels_
print(labels)
```
其中,`watermelon.csv`是西瓜数据集的文件名,数据集中第一列是编号,第二列和第三列是特征。代码中使用`pandas`库读取数据,并使用`sklearn.preprocessing`库的`StandardScaler`进行特征缩放。然后使用`sklearn.cluster`库的`KMeans`进行聚类,其中`n_clusters`参数指定聚类簇数,`random_state`参数指定随机种子。最后输出聚类结果。
阅读全文