crosstab pandas
时间: 2023-10-30 12:03:17 浏览: 90
Pandas面试题.pdf
pandas提供了一个crosstab函数用于计算交叉表。交叉表是一种用于统计分析的数据表格,可以显示两个或多个因素之间的频数分布。你可以使用pandas的crosstab函数来计算行和列因素之间的频数或其他统计量。
要使用crosstab函数,你需要传递两个或多个因素(可以是序列、数组或列名)作为参数,并且指定它们在行和列上的位置。以下是一个示例:
```python
import pandas as pd
# 创建一个示例数据集
data = {
'Gender': ['Male', 'Female', 'Male', 'Female', 'Male'],
'Education': ['High School', 'College', 'College', 'High School', 'High School'],
'Satisfaction': ['Satisfied', 'Dissatisfied', 'Satisfied', 'Satisfied', 'Dissatisfied']
}
df = pd.DataFrame(data)
# 计算交叉表
cross_tab = pd.crosstab(df['Gender'], [df['Education'], df['Satisfaction']])
print(cross_tab)
```
这将输出一个交叉表,显示了不同性别和教育水平下的满意度频数分布。
请注意,在上面的示例中,我们传递了两个因素('Gender'和'Education')作为行和列索引,并且还传递了第三个因素('Satisfaction')以计算频数。你可以根据需要传递更多的因素。
希望这可以帮助到你!如果你还有其他问题,请随时问我。
阅读全文