鸢尾花数据可视化及分类
时间: 2023-11-06 11:08:56 浏览: 87
鸢尾花数据集
鸢尾花数据集是一个经典的分类问题数据集,包含了三个不同品种的鸢尾花的花萼长度、花萼宽度、花瓣长度、花瓣宽度等四个特征,共150个样本。下面我将介绍如何对鸢尾花数据进行可视化和分类。
1. 数据可视化
使用Python中的matplotlib和seaborn库对鸢尾花数据进行可视化。代码如下:
```python
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
iris = sns.load_dataset('iris')
sns.pairplot(iris, hue='species', height=2.5)
plt.show()
```
运行结果如下图所示:
![iris visualization](https://i.imgur.com/UvIYbW1.png)
从图中可以看出,不同品种的鸢尾花在四个特征上有明显差异,可以用这些特征来对鸢尾花进行分类。
2. 数据分类
使用Python中的scikit-learn库对鸢尾花数据进行分类。代码如下:
```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
print('Accuracy:', accuracy_score(y_test, y_pred))
```
运行结果如下所示:
```
Accuracy: 1.0
```
使用KNN算法对鸢尾花数据进行分类,得到了100%的分类准确率。说明这四个特征对于鸢尾花分类是非常有效的。
以上就是对鸢尾花数据集进行可视化和分类的简单介绍,希望对你有所帮助。
阅读全文