# 查看数据集各列的数据统计情况
时间: 2024-03-22 18:42:56 浏览: 58
你可以使用 pandas 中的 `describe()` 函数来查看数据集各列的数据统计情况。该函数会返回每个数值列的计数、平均值、标准差、最小值、25% 分位数、中位数、75% 分位数和最大值等统计信息。以下是一个示例:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv("data.csv")
# 查看数据集各列的数据统计情况
data.describe()
```
执行上述代码后,你会得到一个包含数据集各列数据统计情况的摘要,如下所示:
```
age height_cm weight_kg
count 1000.00000 1000.00000 1000.00000
mean 33.88200 170.04400 70.07900
std 12.83302 9.22654 14.82813
min 18.00000 147.50000 39.00000
25% 24.00000 163.50000 59.00000
50% 32.00000 170.10000 70.00000
75% 42.00000 176.60000 80.00000
max 65.00000 198.10000 116.00000
```
其中,`count` 表示非空值数量,`mean` 表示平均值,`std` 表示标准差,`min` 表示最小值,`25%` 表示第 25% 的分位数,`50%` 表示中位数,`75%` 表示第 75% 的分位数,`max` 表示最大值。
阅读全文