knn标签分类模型,并预测结果用python代码实现
时间: 2024-09-24 14:09:04 浏览: 39
knn.zip_KNN 分类 python_knn_knn python实现_python knn
KNN(K-Nearest Neighbors,k近邻算法)是一种基于实例的学习方法,用于非监督和监督学习。在分类任务中,它的核心思想是根据训练数据集中样本的特征相似度来对新样本进行标签预测。简单来说,就是通过查找最近邻居(通常是k个最接近的新样本)的类别,然后选择这些邻居中最常见的类别作为预测结果。
以下是使用Python的sklearn库实现KNN标签分类的一个简单示例:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# 加载iris数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建KNN分类器,这里设k=5
knn = KNeighborsClassifier(n_neighbors=5)
# 训练模型
knn.fit(X_train, y_train)
# 预测测试集
y_pred = knn.predict(X_test)
# 计算预测准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
# 示例预测单个样本
sample_data = [6.4, 3.2, 4.5, 1.5] # 假设这是新的观测值
prediction = knn.predict([sample_data])
print("Predicted label for sample:", prediction)
```
在这个例子中,我们首先加载了Iris数据集,划分成了训练集和测试集,然后创建了一个KNN分类器并进行了训练。最后,我们使用训练好的模型对测试集进行预测,并计算了准确率。对于新的样本,我们也展示了如何用模型进行单独的预测。
阅读全文