使用python实现knn算法_使用python实现KNN算法
时间: 2023-07-30 19:10:33 浏览: 163
KNN算法是一种常见的分类算法,可以通过计算待分类样本与训练集中各样本之间的距离,将待分类样本归为距离最近的K个训练集样本所属的类别。下面是使用Python实现KNN算法的步骤:
1. 导入必要的库
```python
import numpy as np
from collections import Counter
```
2. 定义KNN函数
```python
def knn(x_train, y_train, x_test, k):
"""
x_train: 训练集特征
y_train: 训练集标签
x_test: 待分类样本特征
k: 选取的K值
"""
# 计算待分类样本与训练集样本之间的距离
distances = []
for i in range(len(x_train)):
distance = np.sqrt(np.sum(np.square(x_test - x_train[i, :])))
distances.append(distance)
# 根据距离排序,选取距离最近的K个样本
nearest = np.argsort(distances)[:k]
# 统计K个样本所属的类别,选择出现次数最多的类别作为待分类样本的类别
counts = Counter(y_train[nearest])
return counts.most_common(1)[0][0]
```
3. 加载数据集
```python
def load_dataset():
"""
加载数据集
"""
# 生成随机数据
x_train = np.random.rand(10, 2)
y_train = np.random.randint(0, 2, 10)
x_test = np.random.rand(1, 2)
return x_train, y_train, x_test
```
4. 进行测试
```python
x_train, y_train, x_test = load_dataset()
k = 3
prediction = knn(x_train, y_train, x_test, k)
print("预测结果为:", prediction)
```
以上就是使用Python实现KNN算法的基本步骤,你可以根据自己的实际需求进行相应的修改和扩展。
阅读全文