如何通过`pd.info()`看到所有列的统计数据?
时间: 2024-09-21 12:05:48 浏览: 30
pd.DataFrame统计各列数值多少的实例
`pd.info()`本身并不直接提供所有列的详细统计数据,它的主要作用是快速了解DataFrame的基本信息,包括每列的数据类型、非空值数量以及内存占用情况。如果你想要查看每一列的具体统计信息,比如均值、标准差、最大值、最小值等,应该使用`describe()`函数。
例如:
```python
df.describe() # 对所有数值型列(含整数和浮点数)提供统计摘要,包括count(非缺失值)、mean(平均值)、std(标准差)、min(最小值)和max(最大值)
```
如果你想获取某个特定列的更详细统计信息,可以单独对那个列应用`describe()`:
```python
column_name = 'your_column'
df[column_name].describe() # 只针对指定列名
```
如果你需要查看内存占用,可以直接调用`memory_usage()`方法,但通常不需要和`pd.info()`一起使用:
```python
df.memory_usage(deep=True).sum() # 计算DataFrame整体内存占用
```
阅读全文