鸢尾花数据集可视化Python+spyder
时间: 2023-12-04 12:03:28 浏览: 39
鸢尾花数据集是一个常用的分类实验数据集,其中包含了150个数据样本,分为3类,每类50个数据,每个数据包含4个属性(分别是:花萼长度,花萼宽度,花瓣长度,花瓣宽度)。在Python中,我们可以使用sklearn.datasets.load_iris()函数来加载这个数据集。接下来,我们可以使用pandas库将数据集转换为DataFrame格式,并进行数据可视化。
以下是鸢尾花数据集可视化的Python代码:
```
import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
# 加载数据
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['label'] = iris.target
df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'label']
# 数据可视化
plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='setosa')
plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='versicolor')
plt.scatter(df[100:]['sepal length'], df[100:]['sepal width'], label='virginica')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend()
plt.show()
```
上述代码中,我们使用scatter()函数绘制了鸢尾花数据集中前50个数据样本的花萼长度和花萼宽度的散点图,并使用不同的颜色区分了三个不同的鸢尾花种类。通过这个可视化图表,我们可以更加直观地了解鸢尾花数据集的特征和分类情况。