机器学习kmeans算法实例西瓜数据集
时间: 2023-08-18 10:21:31 浏览: 144
K-means算法之西瓜数据集
好的,我可以为您提供机器学习kmeans算法在西瓜数据集上的实例。首先,让我们了解一下西瓜数据集。
西瓜数据集是一个著名的二元分类数据集,其中包含17个属性和2个类别。属性包括色泽,根蒂,敲声,纹理等等。类别分别为好瓜和坏瓜。下面是西瓜数据集的前几行数据:
| 编号 | 色泽 | 根蒂 | 敲声 | 纹理 | 脐部 | 触感 | 密度 | 含糖率 | 好瓜 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 | 青绿 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.697 | 0.46 | 是 |
| 2 | 乌黑 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.774 | 0.376 | 是 |
| 3 | 乌黑 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.634 | 0.264 | 是 |
| 4 | 青绿 | 蜷缩 | 沉闷 | 清晰 | 凹陷 | 硬滑 | 0.608 | 0.318 | 是 |
| 5 | 浅白 | 蜷缩 | 浊响 | 清晰 | 凹陷 | 硬滑 | 0.556 | 0.215 | 是 |
现在,我们可以使用kmeans算法对这个数据集进行聚类。下面是Python代码的示例:
```python
import pandas as pd
from sklearn.cluster import KMeans
# 读取数据集
data = pd.read_csv('watermelon.csv', encoding='gbk')
# 取出数据集中的属性值
X = data.iloc[:, 1:-1]
# 设置聚类数量为2
kmeans = KMeans(n_clusters=2)
# 对数据进行聚类
kmeans.fit(X)
# 输出聚类结果
print(kmeans.labels_)
```
在这个示例中,我们使用`pandas`库读取了西瓜数据集,并使用`sklearn.cluster`库中的`KMeans`类对数据进行聚类。我们设置聚类数量为2,并使用`fit`方法对数据进行聚类。最后,我们输出了聚类结果。
希望这个示例对您有所帮助!
阅读全文