实验1: 绘制花瓣长度(petal length)和花瓣宽度(petal width)之间的散点图,并用不同的颜色区分不同的花卉种类(species)。
时间: 2024-10-13 07:14:40 浏览: 34
实验1的主要目标是通过可视化手段分析鸢尾花数据集中的花瓣长度和花瓣宽度之间的关系,以及各个花卉品种(如setosa、versicolor和virginica)之间的区别。在这个实验中,你会使用数据科学工具,比如Python的matplotlib库,创建二维散点图。
步骤如下:
1. 加载所需的数据集,如Iris dataset,通常可以从sklearn.datasets导入。
2. 准备数据,提取花瓣长度(petal_length)和花瓣宽度(petal_width)作为x和y轴的值,同时将花卉种类(species)作为颜色标签。
3. 使用`plt.scatter()`函数绘制散点图,其中第一个参数是花瓣长度,第二个参数是花瓣宽度,第三个参数是根据物种分类的颜色。
4. 添加标题和坐标轴标签,并可能添加图例来说明颜色代表的花卉种类。
5. 最后展示绘出的图形,观察各品种间的分布差异。
示例代码可能类似这样:
```python
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
# 加载鸢尾花数据
iris = load_iris()
X = iris.data[:, [2, 3]] # 提取花瓣长度和宽度
y = iris.target # 花卉种类
# 分别为每个物种创建不同颜色的散点图
colors = ['red', 'green', 'blue']
for i, species in enumerate(set(y)):
indices = y == species
plt.scatter(X[indices, 0], X[indices, 1], color=colors[i], label=iris.target_names[species])
# 设置图例和其它属性
plt.title('Petal Length vs Width by Species')
plt.xlabel('Petal Length (cm)')
plt.ylabel('Petal Width (cm)')
plt.legend()
# 显示图形
plt.show()
```
阅读全文