crosstab怎么用
时间: 2023-07-08 08:52:12 浏览: 219
crosstab是pandas库中的一个函数,用于计算交叉表。交叉表是一种用于统计分组频率的表格,它可以显示不同组合的频率分布情况。下面是一个示例:
假设我们有一个包含“性别”和“收入”两个变量的数据集,它们的取值分别为“男”、“女”和“高”、“中”、“低”。我们可以使用crosstab函数来计算不同性别和收入水平的个数。
```python
import pandas as pd
# 创建一个数据集
data = pd.DataFrame({'Gender': ['M', 'M', 'F', 'F', 'M', 'F', 'M'],
'Income': ['High', 'Low', 'Low', 'High', 'Medium', 'High', 'Medium']})
# 使用crosstab函数计算交叉表
table = pd.crosstab(data['Gender'], data['Income'])
# 打印结果
print(table)
```
输出结果为:
```
Income High Low Medium
Gender
F 2 1 1
M 1 1 2
```
可以看到,我们得到了一个2x3的表格,其中行表示性别,列表示收入水平,每个单元格中的值表示对应的组合出现的次数。在这个例子中,我们可以看到,有两个女性和一个男性的收入水平为“高”,另外一个男性和一个女性的收入水平为“低”,以及两个男性和一个女性的收入水平为“中”。
阅读全文