使用DataFrame(df)的哪个方法可以一次性输出多个统计指标(如最大值、最小值、中位数、均值、上四分位数、下四分位数等)
时间: 2023-07-03 13:13:06 浏览: 574
使用 `df.describe()` 方法可以一次性输出多个统计指标,包括计数、平均值、标准差、最小值、25% 分位数、中位数、75% 分位数和最大值等。该方法默认只对数值型数据进行统计分析,可以通过参数指定包含的数据类型,如 `include='all'` 可以包含所有数据类型。同时,可以通过 `percentiles` 参数指定需要计算的百分位数,默认计算 25%、50% 和 75% 分位数。例如:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [2.0, 4.0, 6.0, 8.0, 10.0],
'C': ['a', 'b', 'c', 'd', 'e']})
df.describe() # 输出 A 和 B 列的统计指标
```
输出结果为:
```
A B
count 5.000000 5.000000
mean 3.000000 6.000000
std 1.581139 3.162278
min 1.000000 2.000000
25% 2.000000 4.000000
50% 3.000000 6.000000
75% 4.000000 8.000000
max 5.000000 10.000000
```
需要注意的是,该方法默认会忽略缺失值(NaN)。如果需要包含缺失值在内进行统计分析,可以通过 `include='all'` 参数进行指定。
阅读全文