现有一个鸢尾花数据iris.csv文件,请完成以下数据分析任务。 (1)用read_csv()方法读取iris.csv文件到变量df中。 (2)显示前5行数据。 (3)用df.Species.value_counts()查看每个鸢尾花种类的数量。 (4)选取两列花瓣数据:Petal.Length、Petal.Width。 (5)选取品种为:setosa的数据。 (6)用plot()绘制两列花瓣数据的散点图。 (7)用plot()绘制Petal.Width的箱型图。 (8)用groupby()方法将鸢尾花按照种类划分,并求出各个数据中的最大修小值. (9)用info()查看数据类型以及数据是否有缺失值。 (10)用unique()方法查看Species中有几种类型
时间: 2023-11-28 09:50:29 浏览: 199
以下是对应的Python代码:
```python
# 导入所需库
import pandas as pd
import matplotlib.pyplot as plt
# 1. 读取数据
df = pd.read_csv('iris.csv')
# 2. 显示前5行数据
print(df.head())
# 3. 查看每个鸢尾花种类的数量
print(df.Species.value_counts())
# 4. 选取两列花瓣数据:Petal.Length、Petal.Width
petal_data = df[['Petal.Length', 'Petal.Width']]
# 5. 选取品种为:setosa的数据
setosa_data = df[df.Species == 'setosa']
# 6. 绘制两列花瓣数据的散点图
petal_data.plot(kind='scatter', x='Petal.Length', y='Petal.Width')
plt.show()
# 7. 绘制Petal.Width的箱型图
df.boxplot(column='Petal.Width')
plt.show()
# 8. 将鸢尾花按照种类划分,并求出各个数据中的最大修小值
grouped_data = df.groupby('Species')
print(grouped_data.max())
print(grouped_data.min())
# 9. 查看数据类型以及数据是否有缺失值
print(df.info())
# 10. 查看Species中有几种类型
print(df.Species.unique())
```
执行以上代码,即可完成对iris.csv数据的分析任务。