python卡方检验相关性,python代码
时间: 2024-06-18 10:01:40 浏览: 195
Python实现公司员工数据的统计分析源代码
卡方检验(Chi-squared test)是一种统计方法,用于评估观察数据和预期数据之间的差异是否具有统计学意义。在Python中,你可以使用`scipy.stats`库中的`chi2_contingency`函数来进行卡方检验,通常用于分类变量的独立性分析或列联表(contingency table)的数据。
以下是一个简单的例子,展示如何在Python中执行卡方检验:
```python
from scipy.stats import chi2_contingency
import numpy as np
# 假设我们有一个二维数组代表两个分类变量的交叉频数表
observed_values = np.array([[10, 20], [30, 40]]) # 期望值或实际观测值
# 使用chi2_contingency计算卡方统计量及其p值
chi2_stat, p_value, dof, expected_values = chi2_contingency(observed_values)
print("卡方统计量 (χ²):", chi2_stat)
print("p值:", p_value)
print("自由度 (dof):", dof)
print("预期频率:\n", expected_values)
# 如果p值小于预先设定的显著性水平(例如0.05),则拒绝原假设(即变量间无关联)
if p_value < 0.05:
print("拒绝原假设,存在显著相关性。")
else:
print("接受原假设,变量间无显著相关性。")
```
阅读全文