首页knn算法实现鸢尾花分类

knn算法实现鸢尾花分类

时间: 2023-11-17 18:07:26 浏览: 96

KNN（K-Nearest Neighbors）算法是一种基于实例的学习（Instance-Based Learning）方法，也是一种非参数化的分类（Classification）和回归（Regression）算法。在KNN算法中，样本的类别与其邻居的类别有关，即将一个测试样本的类别归为其K个最近邻居中占比最大的类别。下面是使用KNN算法实现鸢尾花分类的Python代码，数据集采用sklearn中自带的鸢尾花数据集： ``` # 导入相关库 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42) # 创建KNN模型 knn = KNeighborsClassifier(n_neighbors=3) # 拟合模型 knn.fit(X_train, y_train) # 预测 y_pred = knn.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print('准确率：', accuracy) ``` 在上述代码中，首先导入所需的库和鸢尾花数据集，然后使用train_test_split函数将数据集划分为训练集和测试集，其中测试集占总样本数的30%。接着创建KNN模型，其中n_neighbors=3表示将测试样本的类别归为其3个最近邻居中占比最大的类别。然后使用fit函数拟合模型，并使用predict函数对测试集进行预测。最后计算准确率并输出结果。需要注意的是，KNN算法对数据集的特征值进行了标准化处理，以避免某些特征值对结果的影响过大。因此，在实际应用中，我们可能需要对数据集进行标准化处理。

阅读全文