首页鸢尾花数据集完整代码

鸢尾花数据集完整代码

时间: 2024-09-08 14:04:29 浏览: 73

鸢尾花数据集（Iris dataset）是一个经典的机器学习入门示例，通常用于分类任务。它是从维纳尔·辛普森收集的真实植物样本中选取的数据，包含了三种不同种类的鸢尾花的测量值：花萼长度、花萼宽度、花瓣长度和花瓣宽度。完整的Python代码，特别是使用scikit-learn库来处理鸢尾花数据集，通常会包含以下几个步骤： ```python # 导入必要的库 from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import classification_report # 加载鸢尾花数据集 iris = datasets.load_iris() X = iris.data y = iris.target # 数据预处理：归一化特征 scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42) # 使用KNN分类器 knn = KNeighborsClassifier(n_neighbors=3) # 设置邻居数量 knn.fit(X_train, y_train) # 预测并评估 y_pred = knn.predict(X_test) print("Classification Report:") print(classification_report(y_test, y_pred)) #

阅读全文