那之后怎么检验出它们是什么关联呢

在卡方检验中，如果P-value小于设定的显著性水平（通常是0.05），则拒绝原假设，即认为自变量和因变量之间存在关联性。但是，这只是判断是否存在关联性，并不能说明关联性的具体类型。为了进一步研究变量之间的关系类型，可以进行Cramer's V检验。Cramer's V是一个反映关联强度的指标，取值范围为0到1，值越大表示关联越强。如果Cramer's V的值为0，表示两个变量之间不存在关联；如果Cramer's V的值为1，表示两个变量之间存在完全的关联。一般来说，Cramer's V的值在0.1到0.3之间表示关联较弱，0.3到0.5之间表示关联中等，大于0.5表示关联强。下面是代码实现： ```python import pandas as pd from scipy.stats import chi2_contingency from scipy.stats import cramers_v # 读取数据集 df = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv') # 选择需要分析的变量 cols = ['Age', 'family', 'FAVC', 'FCVC', 'CH2O', 'CALC', 'NObeyesdad'] df_selected = df[cols] # 将连续变量转化为分类变量 df_selected['Age'] = pd.cut(df_selected['Age'], bins=[0, 18, 35, 60, 200], labels=['0-18', '18-35', '35-60', '60+']) df_selected['CH2O'] = pd.cut(df_selected['CH2O'], bins=[0, 2, 3, 4, 30], labels=['0-2', '2-3', '3-4', '4+']) df_selected['CALC'] = pd.cut(df_selected['CALC'], bins=[0, 1000, 2000, 3000, 10000], labels=['0-1000', '1000-2000', '2000-3000', '3000+']) # 执行卡方检验和Cramer's V检验 for col in cols[:-1]: crosstab = pd.crosstab(df_selected[col], df_selected['NObeyesdad']) chi2, p, dof, expected = chi2_contingency(crosstab) print(col) print('Chi-square test statistic: ', chi2) print('P-value: ', p) print('Degrees of freedom: ', dof) print('Expected values: \n', expected) print('Cramer\'s V: ', cramers_v(crosstab)) print('-------------------------') ``` 输出的结果中，Cramer's V表示关联强度。如果Cramer's V的值在0.1到0.3之间，表示关联较弱；如果Cramer's V的值在0.3到0.5之间，表示关联中等；如果Cramer's V的值大于0.5，表示关联强。

那之后怎么检验出它们是什么关联呢

相关推荐

数据整理分析方法.docx

多媒体数据库管理系统探讨(1).doc

“一致性相等”的陷阱

什么是虚拟内存，内存映射，缓存，它们有什么关联吗

什么是进程和线程？它们有哪些区别和联系？

构件图和配置图的用途是什么？它们之间有什么联系？

热力学温度和动力学温度有什么区别？它们是如何联系的？

假设检验中两类错误和显著性水平是什么

什么是标准组？什么是私有组？简述它们之间的关系

RGB gamma 和 Y gamma有什么不同？它们的概念是什么？对于图像来说它们的作用分别是什么？它们之间有什么关联性

什么是关联规则挖掘？

GPU是什么？与CPU有什么关联和区别？

什么是灰色关联度分析的灰色系统

什么是通过了a=0.0001的统计显著性检验

格兰杰因果检验的all什么意思

someip和binder的关联关系是什么？

关联查询是什么，以及它包含哪些？

fpga中寄存器是什么样的逻辑呢

接口测试的关联是什么意思

最新推荐

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

HSV转为RGB的计算公式

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

MATLAB柱状图在数据分析中的作用：从可视化到洞察

已知自动控制原理中通过更高的频率特征来评估切割频率和库存——相位稳定。确定封闭系统的稳定性。求Wcp 和ψ已知W（p)=30•(0.1p+1)•(12.5p+1)/p•(10p+1)•(0.2p+1)•(p+1)

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

关系数据表示学习