describe函数
时间: 2023-11-12 08:06:05 浏览: 211
`describe` 是 Pandas 库中的一个函数,用于计算 DataFrame 或 Series 中数值型列的统计信息。它会返回数据集的以下统计量:
- count:非空元素的数量
- mean:平均值
- std:标准差
- min:最小值
- 25%:第一四分位数
- 50%:中位数(第二四分位数)
- 75%:第三四分位数
- max:最大值
`describe` 函数的语法如下:
```python
df.describe()
```
其中 `df` 可以是 DataFrame 或 Series 对象。默认情况下,`describe` 函数只会计算数值型列的统计信息,但可以使用 `include` 和 `exclude` 参数来指定需要计算的列。
例如,下面的示例代码演示如何使用 `describe` 函数计算 DataFrame 中所有数值型列的统计信息:
```python
import pandas as pd
df = pd.read_csv('data.csv')
print(df.describe())
```
输出结果类似于下面的内容:
```
col1 col2 col3
count 1000.000000 1000.000000 1000.000000
mean 0.003214 0.002312 -0.001452
std 0.986543 0.981054 1.025607
min -3.034574 -2.939195 -3.182575
25% -0.671996 -0.669253 -0.675616
50% 0.015632 0.009772 0.002296
75% 0.672016 0.676234 0.661927
max 3.008684 2.982800 3.474791
```
阅读全文