编写程序,导入鸢尾花数据,实现以下操作 (1)读入鸢尾花数据,输出前6行数据 (2)统计鸢尾花每个品种的数量 (3)按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少? (4)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值 (5)计算鸢尾花每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值
时间: 2024-01-24 18:03:04 浏览: 99
Map-Reduce-Iris-Flower:这些Map Reduce程序的目标是从著名的鸢尾花数据集中计算出萼片长度,萼片宽度,花瓣长度和花瓣宽度的最大值,最小值和平均值。
好的,接下来我将逐一回答您的问题:
(1)读入鸢尾花数据,输出前6行数据
```python
import pandas as pd
# 读入鸢尾花数据
iris_data = pd.read_csv('iris.csv')
# 输出前6行数据
print(iris_data.head(6))
```
(2)统计鸢尾花每个品种的数量
```python
import pandas as pd
# 读入鸢尾花数据
iris_data = pd.read_csv('iris.csv')
# 统计鸢尾花每个品种的数量
print(iris_data['species'].value_counts())
```
(3)按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少?
```python
import pandas as pd
# 读入鸢尾花数据
iris_data = pd.read_csv('iris.csv')
# 按品种划分,每个品种的花萼,花瓣的长度和宽度的最大值分别是多少
print(iris_data.groupby('species').max()[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']])
```
(4)计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值
```python
import pandas as pd
# 读入鸢尾花数据
iris_data = pd.read_csv('iris.csv')
# 计算每个品种所有属性(花瓣、花萼的长度和宽度)数值的跨度范围,即最大值减去最小值
print(iris_data.groupby('species').agg(lambda x: x.max() - x.min())[["sepal_length", "sepal_width", "petal_length", "petal_width"]])
```
(5)计算鸢尾花每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值
```python
import pandas as pd
# 读入鸢尾花数据
iris_data = pd.read_csv('iris.csv')
# 计算鸢尾花每个品种所有属性(花瓣、花萼的长度和宽度)数值的平均值、最大值
print(iris_data.groupby('species').agg(['mean', 'max'])[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']])
```
阅读全文