编写一个程序,使用scikit-learn库中的K-近邻算法(KNN)对鸢尾花数据集进行分类。要求程序使用Sklearn自带工具计算并输出模型的准确率。
时间: 2024-11-09 21:31:24 浏览: 32
当然,我们可以使用Python和Scikit-learn库中的K-最近邻(KNN)算法来对鸢尾花数据集进行分类。以下是详细的步骤:
```python
# 导入所需库
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data # 特征数据
y = iris.target # 类别标签
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建KNN分类器,设置k值为3(可以根据需要调整)
knn = KNeighborsClassifier(n_neighbors=3)
# 使用训练数据拟合模型
knn.fit(X_train, y_train)
# 预测测试集
y_pred = knn.predict(X_test)
# 计算准确率
accuracy = metrics.accuracy_score(y_test, y_pred)
print("模型的准确率为:", accuracy)
```
在这个例子中,我们首先加载了鸢尾花数据集,然后将其拆分为训练集和测试集。接着,我们创建了一个KNN分类器,并使用训练数据对其进行训练。最后,我们预测了测试集的类别,并计算了预测的准确性。
阅读全文