pyton读取iris数据集中的花萼长度数据(已保存为csv格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值的代码
时间: 2023-10-20 21:18:55 浏览: 171
iris.csv数据集和python代码
以下是Python读取iris数据集中的花萼长度数据(已保存为csv格式),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值的代码:
```python
import pandas as pd
import numpy as np
# 读取csv文件
iris_df = pd.read_csv('iris.csv')
# 提取花萼长度数据
sepal_len = iris_df['sepal_length'].values
# 排序
sepal_len_sorted = np.sort(sepal_len)
# 去重
sepal_len_unique = np.unique(sepal_len_sorted)
# 计算和
sepal_len_sum = np.sum(sepal_len_unique)
# 计算累积和
sepal_len_cumsum = np.cumsum(sepal_len_unique)
# 计算均值
sepal_len_mean = np.mean(sepal_len_unique)
# 计算标准差
sepal_len_std = np.std(sepal_len_unique)
# 计算方差
sepal_len_var = np.var(sepal_len_unique)
# 计算最小值
sepal_len_min = np.min(sepal_len_unique)
# 计算最大值
sepal_len_max = np.max(sepal_len_unique)
```
其中,`iris.csv`是保存了iris数据集的csv文件,可以使用Pandas库中的`read_csv()`函数读取。`sepal_length`是iris数据集中花萼长度的列名,使用`values`属性提取为Numpy数组。排序可以使用Numpy库中的`sort()`函数,去重可以使用`unique()`函数。计算和、累积和、均值、标准差、方差、最小值、最大值分别使用Numpy库中的`sum()`、`cumsum()`、`mean()`、`std()`、`var()`、`min()`、`max()`函数。
阅读全文