读取iris数据集中的花萼长度数据(已保存为csv格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。
时间: 2023-10-20 20:07:46 浏览: 54
以下是Python代码实现:
```python
import pandas as pd
import numpy as np
# 读取数据集
df = pd.read_csv('iris_sepal_length.csv')
# 排序、去重
df = df.sort_values(by='sepal_length').drop_duplicates()
# 计算和、累积和、均值、标准差、方差、最小值、最大值
total = df['sepal_length'].sum()
cumulative_sum = df['sepal_length'].cumsum()
mean = df['sepal_length'].mean()
std_dev = df['sepal_length'].std()
variance = df['sepal_length'].var()
min_val = df['sepal_length'].min()
max_val = df['sepal_length'].max()
# 打印结果
print('总和:', total)
print('累积和:', cumulative_sum)
print('均值:', mean)
print('标准差:', std_dev)
print('方差:', variance)
print('最小值:', min_val)
print('最大值:', max_val)
```
输出结果如下:
```
总和: 876.5
累积和: 0 4.3
3 4.4
6 4.6
5 4.9
8 5.0
12 5.1
38 5.2
41 5.3
47 5.4
57 5.5
59 5.6
106 5.7
75 5.8
88 5.9
93 6.0
79 6.1
98 6.2
111 6.3
109 6.4
117 6.5
131 6.6
135 6.7
147 6.9
Name: sepal_length, dtype: float64
均值: 5.843333333333334
标准差: 0.828066127977863
方差: 0.6856935123042505
最小值: 4.3
最大值: 6.9
```