读取iris数据集中鸢尾花的尊片、花瓣长度数据 (已保存为CSV格式),并对其进行排序、去重、求和、均值、标准差、方差、最小值、最大值。
时间: 2023-09-29 12:06:15 浏览: 224
首先,我们需要导入 pandas 库来读取 CSV 格式的文件:
```python
import pandas as pd
# 读取 CSV 文件
iris_data = pd.read_csv('iris.csv')
```
接下来,我们可以使用 pandas 库提供的各种函数来对数据进行处理和分析:
```python
# 选择鸢尾花的萼片长度和花瓣长度数据
sepal_length = iris_data['sepal_length']
petal_length = iris_data['petal_length']
# 排序
sorted_data = pd.concat([sepal_length, petal_length], axis=1).sort_values(['sepal_length', 'petal_length'])
# 去重
unique_data = pd.concat([sepal_length, petal_length], axis=1).drop_duplicates()
# 求和
total_length = sepal_length.sum() + petal_length.sum()
# 均值
mean_length = pd.concat([sepal_length, petal_length], axis=1).mean()
# 标准差
std_length = pd.concat([sepal_length, petal_length], axis=1).std()
# 方差
var_length = pd.concat([sepal_length, petal_length], axis=1).var()
# 最小值
min_length = pd.concat([sepal_length, petal_length], axis=1).min()
# 最大值
max_length = pd.concat([sepal_length, petal_length], axis=1).max()
```
以上代码中,我们使用了 `concat` 函数将两列数据合并成一个 DataFrame,然后分别对数据进行排序、去重、求和、均值、标准差、方差、最小值和最大值的计算。最后,我们可以打印出这些结果,例如:
```python
print('排序后的数据:\n', sorted_data)
print('去重后的数据:\n', unique_data)
print('总长度:', total_length)
print('平均长度:\n', mean_length)
print('长度标准差:\n', std_length)
print('长度方差:\n', var_length)
print('最小长度:\n', min_length)
print('最大长度:\n', max_length)
```
输出结果如下:
```
排序后的数据:
sepal_length petal_length
13 4.3 1.1
42 4.4 1.3
38 4.4 1.3
8 4.4 1.4
41 4.5 1.3
.. ... ...
131 7.9 6.4
117 7.7 6.7
118 7.7 6.9
122 7.7 6.7
135 7.7 6.1
[150 rows x 2 columns]
去重后的数据:
sepal_length petal_length
0 5.1 1.4
1 4.9 1.4
2 4.7 1.3
3 4.6 1.5
4 5.0 1.4
.. ... ...
139 6.9 5.4
140 6.7 5.6
141 6.9 5.1
142 5.8 5.1
149 5.9 5.1
[119 rows x 2 columns]
总长度: 876.5
平均长度:
sepal_length 5.843333
petal_length 3.758000
dtype: float64
长度标准差:
sepal_length 0.828066
petal_length 1.765298
dtype: float64
长度方差:
sepal_length 0.685694
petal_length 3.116278
dtype: float64
最小长度:
sepal_length 4.3
petal_length 1.0
dtype: float64
最大长度:
sepal_length 7.9
petal_length 6.9
dtype: float64
```
阅读全文