pandas.crosstable函数用法
时间: 2024-06-07 11:03:26 浏览: 119
python pandas.DataFrame.loc函数使用详解
pandas.crosstab() 函数用于计算交叉表,它接受一些参数来定义表格,这些参数包括要交叉的数组、行和列的名称、要聚合的函数、是否规范化等。以下是一些示例参数和用法:
1. 参数:
- index:指定行索引。
- columns:指定列索引。
- values:要聚合的数值。
- aggfunc:指定聚合函数,默认为计数。
- margins:是否显示边际和。
- normalize:是否将值规范化为百分比。
2. 用法:
- 示例1:
```
df = pd.read_csv('data.csv')
pd.crosstab(df['gender'], df['class'])
```
这个例子中,我们读取了一个名为 data.csv 的 CSV 文件,然后使用 pd.crosstab() 函数计算了性别和班级之间的交叉表。
- 示例2:
```
df = pd.read_csv('data.csv')
pd.crosstab(df['gender'], df['class'], values=df['score'], aggfunc=np.mean)
```
在这个例子中,我们使用了 values 和 aggfunc 参数来聚合学生成绩,以获得性别和班级之间的平均分数。
阅读全文