鸢尾花机器学习实验
时间: 2023-06-22 08:21:32 浏览: 169
鸢尾花(Iris)数据集是机器学习中最著名的数据集之一,它包含了 150 个样本,分为 3 类,每类 50 个样本,每个样本包含 4 个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。在这里,我将介绍如何使用 Python 和 Scikit-learn 库对鸢尾花数据集进行机器学习实验。
首先,我们需要导入 Scikit-learn 库和鸢尾花数据集:
```python
from sklearn.datasets import load_iris
iris = load_iris()
```
接下来,我们可以查看数据集的一些基本信息:
```python
print("数据集大小:", iris.data.shape)
print("数据集的特征名称:", iris.feature_names)
print("数据集的类别名称:", iris.target_names)
```
数据集大小: (150, 4)
数据集的特征名称: ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
数据集的类别名称: ['setosa' 'versicolor' 'virginica']
接着,我们可以将数据集分为训练集和测试集:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
```
然后,我们可以选择一个机器学习算法,例如决策树:
```python
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier()
```
接下来,我们使用训练集对模型进行训练:
```python
clf.fit(X_train, y_train)
```
然后,我们可以使用测试集对模型进行评估:
```python
from sklearn.metrics import accuracy_score
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
```
最后,我们可以使用训练好的模型进行预测:
```python
y_pred = clf.predict([[5.1, 3.5, 1.4, 0.2]])
print("预测结果:", iris.target_names[y_pred])
```
以上就是使用 Python 和 Scikit-learn 进行鸢尾花机器学习实验的基本流程。
阅读全文