鸢尾花数据集完整代码
时间: 2024-09-08 14:04:29 浏览: 73
鸢尾花数据集(Iris dataset)是一个经典的机器学习入门示例,通常用于分类任务。它是从维纳尔·辛普森收集的真实植物样本中选取的数据,包含了三种不同种类的鸢尾花的测量值:花萼长度、花萼宽度、花瓣长度和花瓣宽度。
完整的Python代码,特别是使用scikit-learn库来处理鸢尾花数据集,通常会包含以下几个步骤:
```python
# 导入必要的库
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 数据预处理:归一化特征
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
# 使用KNN分类器
knn = KNeighborsClassifier(n_neighbors=3) # 设置邻居数量
knn.fit(X_train, y_train)
# 预测并评估
y_pred = knn.predict(X_test)
print("Classification Report:")
print(classification_report(y_test, y_pred))
#
阅读全文
相关推荐

















