pandas describe() 解析
时间: 2023-02-10 21:21:54 浏览: 149
`describe` 是 pandas 中的一个函数,用于计算数据的基本统计量。使用 `describe` 可以快速获得数据的描述性统计信息,包括计数、平均值、标准差、最小值、最大值、中位数、四分位数。
使用方法:
```
df.describe()
```
其中 `df` 是包含数据的数据帧(DataFrame)。
例如:
```python
import pandas as pd
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['a', 'b', 'c'])
print(df.describe())
```
输出:
```
a b c
count 3.000000 3.000000 3.000000
mean 4.000000 5.000000 6.000000
std 3.055050 3.055050 3.055050
min 1.000000 2.000000 3.000000
25% 2.500000 3.500000 4.500000
50% 4.000000 5.000000 6.000000
75% 5.500000 6.500000 7.500000
max 7.000000 8.000000 9.000000
```
你可以使用 `describe` 的参数 `include` 来指定要包含哪些数据类型的统计信息。例如:
```python
df.describe(include='all') # 包含所有数据类型的统计信息
df.describe(include=['object']) # 只包含 object 类型的统计信息
df.describe(include=['float64']) # 只包含 float64 类型的统计信息
df.describe(include=['int64']) # 只包含 int64 类型的统计信息
```
你还可以使用 `describe` 的参数 `percentiles` 来计算额外的分位数。例如:
```python
df.describe(
阅读全文