用python,代码完成knn算法求解鸢尾花种类
时间: 2024-09-10 15:07:56 浏览: 46
K-最近邻(K-Nearest Neighbors, KNN)是一种基本分类与回归方法。在Python中,我们通常使用`scikit-learn`库来实现KNN算法。以下是一个简单的例子,展示了如何使用`scikit-learn`中的`KNeighborsClassifier`类来完成鸢尾花数据集的分类任务。
首先,你需要安装`scikit-learn`库(如果尚未安装):
```bash
pip install scikit-learn
```
然后,你可以使用以下Python代码来实现KNN算法:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report, accuracy_score
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 数据标准化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# 创建KNN分类器实例,这里假设我们使用3个邻居
knn = KNeighborsClassifier(n_neighbors=3)
# 训练模型
knn.fit(X_train, y_train)
# 预测测试集
y_pred = knn.predict(X_test)
# 评估模型
print("分类报告:")
print(classification_report(y_test, y_pred))
print("准确率:", accuracy_score(y_test, y_pred))
```
在这段代码中,我们首先导入了必要的模块,然后加载了鸢尾花数据集。接下来,我们把数据集分为训练集和测试集,并对数据进行了标准化处理。使用`KNeighborsClassifier`创建了KNN分类器,并用训练集数据训练模型。最后,我们用测试集数据对模型进行了预测,并打印了分类报告和准确率来评估模型性能。
阅读全文