假设检验galon数据中父母身高和子女身高是否存在联系,请写出零假设,备择假设,确定检验统计量,并用python 计算检验统计量的观察值以及画出在零假设下检验统计量的分布,并确定是否拒绝原假设
时间: 2024-11-09 16:30:02 浏览: 22
kang-galon-lumen
在进行父母身高和子女身高之间的相关性假设检验时,通常我们会采用皮尔逊相关系数的t-test,因为它们之间可能存在线性关系。以下是步骤:
**零假设 (H0)**: 父母身高和子女身高之间不存在显著的线性关系,即它们之间的皮尔逊相关系数为0。
**备择假设 (Ha)**: 父母身高和子女身高之间存在显著的线性关系,即他们的相关系数不等于0。
**检验统计量**: 我们会计算皮尔逊相关系数的样本值(r),然后基于样本大小n和自由度n-2(因为我们排除了均值和比例这两个自由度)构造t值。
**Python 实现**:
```python
from scipy.stats import pearsonr, ttest_1samp
# 假设数据已准备好
r, _ = pearsonr(data['parent_height'], data['child_height'])
n = len(data) # 样本大小
df = n - 2
# 检验统计量(t值)是相关系数除以标准误,标准误计算依赖于样本大小和自由度
t_statistic = r / ((1 - r ** 2) * np.sqrt(1/n + 1/(n - 3))) # 使用numpy的sqrt和piersonr
# 为了模拟零假设下的分布,我们可以用t-distribution的理论分位数,但这需要查表或使用scipy提供的函数
# 或者对于大样本(n > 30),可以近似认为t分布为正态分布
# 由于这里没有给出具体的p值计算,这里仅展示如何获取t值的观察值
observed_t_statistic = t_statistic
print(f"观察到的t统计量: {observed_t_statistic:.2f}")
阅读全文