使用k近邻法判断密度为0.45,含糖量为0.1的瓜是否为好瓜,K=3,距离为曼哈顿距离
时间: 2024-03-04 13:53:26 浏览: 98
首先,需要准备训练数据集,该数据集应包含密度和含糖量属性以及对应的好瓜/坏瓜标签。然后,需要计算测试样本与每个训练样本之间的曼哈顿距离,并选择距离最近的K个训练样本。最后,根据K个最近邻样本的好瓜/坏瓜标签,通过投票的方式来预测测试样本的标签。
假设训练数据集如下表所示:
| 样本编号 | 密度 | 含糖量 | 标签 |
|---------|--------|--------|--------|
| 1 | 0.697 | 0.460 | 坏瓜 |
| 2 | 0.774 | 0.376 | 坏瓜 |
| 3 | 0.634 | 0.264 | 坏瓜 |
| 4 | 0.608 | 0.318 | 坏瓜 |
| 5 | 0.556 | 0.215 | 坏瓜 |
| 6 | 0.403 | 0.237 | 坏瓜 |
| 7 | 0.481 | 0.149 | 坏瓜 |
| 8 | 0.437 | 0.211 | 坏瓜 |
| 9 | 0.666 | 0.091 | 好瓜 |
| 10 | 0.243 | 0.267 | 好瓜 |
| 11 | 0.245 | 0.057 | 好瓜 |
| 12 | 0.343 | 0.099 | 好瓜 |
| 13 | 0.639 | 0.161 | 好瓜 |
| 14 | 0.657 | 0.198 | 好瓜 |
| 15 | 0.360 | 0.370 | 好瓜 |
| 16 | 0.593 | 0.042 | 好瓜 |
| 17 | 0.719 | 0.103 | 好瓜 |
计算测试样本(密度为0.45,含糖量为0.1)与每个训练样本之间的曼哈顿距离,得到距离列表如下:
| 样本编号 | 曼哈顿距离 |
|---------|-----------|
| 1 | 0.588 |
| 2 | 0.603 |
| 3 | 0.821 |
| 4 | 0.755 |
| 5 | 0.846 |
| 6 | 0.869 |
| 7 | 0.841 |
| 8 | 0.734 |
| 9 | 0.482 |
| 10 | 0.597 |
| 11 | 0.558 |
| 12 | 0.607 |
| 13 | 0.502 |
| 14 | 0.526 |
| 15 | 0.712 |
| 16 | 0.696 |
| 17 | 0.577 |
然后,选择距离最近的K个训练样本,当K=3时,距离最近的三个样本为第9个、第11个和第13个样本。这三个训练样本的标签分别为好瓜、好瓜和好瓜,因此通过投票的方式,可以预测测试样本的标签为好瓜。
因此,根据K近邻法,可以预测密度为0.45,含糖量为0.1的瓜为好瓜。
阅读全文