df.describe()函数
时间: 2023-12-16 08:30:32 浏览: 91
python数据函数使用案例.rar
`df.describe()`函数是一个用于描述数据集的函数,它返回一个包含数据集中各个列的统计信息的数据框。这些统计信息包括:计数、平均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
例如,如果我们有一个名为df的数据框,我们可以使用`df.describe()`函数来获得描述这个数据框的统计信息。该函数将返回一个新的数据框,其中包括df中的每个数值列的统计信息。如果数据框中有非数值列,则这些列将被忽略。
下面是一个使用Pandas库中的df.describe()函数的示例代码:
```
import pandas as pd
# 创建一个数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age': [25, 32, 18, 47, 22],
'height': [165, 180, 157, 175, 172],
'weight': [55, 78, 45, 90, 62]}
df = pd.DataFrame(data)
# 使用describe()函数获取统计信息
df.describe()
```
输出结果为:
```
age height weight
count 5.000000 5.000000 5.000000
mean 28.800000 169.800000 66.000000
std 12.326899 10.446314 18.475143
min 18.000000 157.000000 45.000000
25% 22.000000 165.000000 55.000000
50% 25.000000 172.000000 62.000000
75% 32.000000 175.000000 78.000000
max 47.000000 180.000000 90.000000
```
从结果中可以看出,数据框中有5行数据,每列数据的平均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值都被列出。 例如,年龄列的平均值是28.8岁,最小值是18岁,最大值是47岁,标准差是12.33岁。
阅读全文