Python-鸢尾花数据集Iris 数据可视化
时间: 2024-09-11 07:03:07 浏览: 97
Python中的鸢尾花数据集(Iris dataset)是一个常用的分类实验数据集,由Fisher在1936年整理。该数据集包含150个样本,分为三个种类的鸢尾花,每个种类各有50个样本。每个样本都有四个特征:萼片长度、萼片宽度、花瓣长度和花瓣宽度,这些特征都是浮点数。
为了进行数据可视化,我们可以使用Python中的数据可视化库,如matplotlib和seaborn。下面是一个简单的示例,展示如何使用这些库来绘制鸢尾花数据集的散点图。
```python
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
# 加载鸢尾花数据集
iris = datasets.load_iris()
iris_df = iris.data[:, :2] # 只取前两个特征用于二维散点图
iris_target = iris.target
# 设置图表样式
sns.set_style("whitegrid")
# 创建散点图
plt.figure(figsize=(10, 6))
sns.scatterplot(x=iris_df[:, 0], y=iris_df[:, 1], hue=iris_target,
palette='Set1', style='o')
# 添加图表标题和标签
plt.title('Iris Data Set Visualization')
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
# 显示图例
plt.legend(title='Species')
# 显示图表
plt.show()
```
这段代码首先导入必要的库,然后加载鸢尾花数据集。之后,它使用seaborn库来绘制散点图,其中不同的颜色和标记代表不同的鸢尾花种类。
阅读全文