pd.DataFrame常用统计函数
时间: 2023-11-03 11:57:16 浏览: 121
Pandas 的 DataFrame 类提供了许多常用的统计函数,用于计算和分析数据。以下是一些常用的统计函数示例:
- `df.mean()`: 计算每列的平均值。
- `df.median()`: 计算每列的中位数。
- `df.min()`: 计算每列的最小值。
- `df.max()`: 计算每列的最大值。
- `df.std()`: 计算每列的标准差。
- `df.var()`: 计算每列的方差。
- `df.sum()`: 计算每列的总和。
- `df.count()`: 计算每列的非空值数量。
- `df.describe()`: 提供有关每列的基本统计摘要,包括计数、均值、标准差、最小值、25%、50%、75% 分位数和最大值。
这些函数可以应用于整个 DataFrame,或者通过指定轴参数应用于特定的行或列。你还可以通过在这些函数后面添加 `axis` 参数来指定计算的轴方向,默认为按列计算。
除了上述示例之外,Pandas 还提供了许多其他统计函数,如协方差、相关性、百分位数等。你可以根据具体的需求选择适当的函数来分析和处理数据。
相关问题
pd.dataframe用法
Pandas中的DataFrame是一种二维数据结构,类似于Excel中的表格。可以使用pd.DataFrame()函数创建一个DataFrame。常用的参数有:
- data: 二维数组或其它可以转换成DataFrame的对象,如列表、字典、Series等。
- columns: 列名
- index: 行索引
例如,可以用下面的代码创建一个DataFrame:
```
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
```
可以使用下标访问DataFrame中的数据,如df[0]或df['name']。也可以使用布尔索引筛选数据,如df[df['age'] > 30]。DataFrame还提供了很多用于数据处理和统计分析的方法,如groupby、agg、sum等。
df: pd.DataFrame
DataFrame是pandas库中的一个数据结构,用于处理和分析数据。它类似于电子表格或数据库中的表格,可以存储和操作二维数据。
创建DataFrame对象的方法有多种,其中一种是使用pd.DataFrame()函数创建一个空的DataFrame对象[^1]:
```python
df = pd.DataFrame()
```
DataFrame对象有许多属性和方法可以用来操作和查看数据,以下是一些常用的属性和方法:
- df.values:返回一个ndarray类型的对象,包含DataFrame中的所有数据。
- df.index:获取行索引。
- df.columns:获取列索引。
- df.axes:获取行及列索引。
- df.T:行与列对调。
- df.info():打印DataFrame对象的信息,包括索引、列名、每列的非空值数量和数据类型等。
- df.head(i):显示前i行数据,默认为前5行。
- df.tail(i):显示后i行数据,默认为后5行。
- df.describe():查看数据按列的统计信息,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值等。
请注意,上述方法中的df指的是DataFrame对象的变量名,你可以根据实际情况进行更改。