k近邻算法分类python
时间: 2023-10-31 19:07:41 浏览: 116
knn.rar_in_knn python实现_k近邻_python 算法_近邻分类
K近邻算法是一种机器学习算法,用于对事物进行分类。它的原理是给定一组样本,对新的输入样本,在已有样本中找到与该实例最邻近的K个例子,当这K个例子的大多属于某个类别时,就把该输入样本分类到这个类之中。在Python中,可以使用scikit-learn库中的KNeighborsClassifier类来实现K近邻算法分类。具体步骤如下:
1. 导入KNeighborsClassifier类和数据集。
2. 将数据集分为训练集和测试集。
3. 创建KNeighborsClassifier对象,并将K值设置为所需的值。
4. 使用训练集训练KNeighborsClassifier对象。
5. 使用测试集测试KNeighborsClassifier对象的准确性。
6. 对新的输入样本进行分类。
下面是一个简单的K近邻算法分类Python代码示例:
```
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
# 生成数据集
X, y = make_blobs(n_samples=1000, centers=3, n_features=2, random_state=40)
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建KNeighborsClassifier对象,并将K值设置为3
knn = KNeighborsClassifier(n_neighbors=3)
# 使用训练集训练KNeighborsClassifier对象
knn.fit(X_train, y_train)
# 使用测试集测试KNeighborsClassifier对象的准确性
accuracy = knn.score(X_test, y_test)
print("Accuracy:", accuracy)
# 对新的输入样本进行分类
new_sample = [[-5, 0]]
predicted_class = knn.predict(new_sample)
print("Predicted class:", predicted_class)
```
阅读全文