dataframe数据统计
时间: 2023-11-18 12:52:02 浏览: 94
要对DataFrame数据进行统计,可以使用pandas库中的一些统计函数。下面是一些常用的统计函数示例:
1. `describe()`: 返回关于DataFrame列的各种统计信息,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1,2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用describe函数进行统计
stats = df.describe()
print(stats)
```
2. `mean()`: 返回DataFrame中每列的平均值。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1,2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用mean函数计算平均值
means = df.mean()
print(means)
```
3. `sum()`: 返回DataFrame中每列的总和。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用sum函数计算总和
sums = df.sum()
print(sums)
```
还有其他一些常用的统计函数,如`min()`(最小值)、`max()`(最大值)、`std()`(标准差)、`median()`(中位数)等,你可以根据需求选择适合的函数进行统计。
阅读全文