4、实现Pandas的去重、求最大最小值、均值等操作
时间: 2024-01-26 11:04:48 浏览: 54
假设我们有以下数据集:
```
import pandas as pd
data = pd.DataFrame({'A': [1, 2, 3, 2, 4],
'B': [5, 6, 7, 7, 9]})
```
### 去重
要对数据集进行去重,可以使用 `drop_duplicates()` 方法:
```
data.drop_duplicates()
```
这将返回一个新的数据集,其中重复的行已经被删除了。
### 求最大最小值
要计算数据集中每列的最大值和最小值,可以使用 `max()` 和 `min()` 方法。例如:
```
max_values = data.max()
min_values = data.min()
print(f'Max values:\n{max_values}\n')
print(f'Min values:\n{min_values}\n')
```
### 计算均值
要计算数据集中每列的均值,可以使用 `mean()` 方法。例如:
```
mean_values = data.mean()
print(f'Mean values:\n{mean_values}\n')
```
注意:这些方法默认情况下会忽略缺失值。如果你想要将缺失值包含在计算中,可以使用 `skipna=False` 参数:
```
mean_values = data.mean(skipna=False)
print(f'Mean values (including NaN):\n{mean_values}\n')
```
阅读全文