二、本题给出python代码,表中是研究者对 160 名儿童文理科偏好及其家长文理科背景情况的调查结果,请判断子女文理科偏好与父母文理科背景之间是否有联系,并写出假设检验的步骤, 并求出对应的相关系数,根据实验结果得出结论。 子女文理科偏好与父母文理科背景的人数分布 父母 文科 理科 合计 子 女 文科 65 15 80 理科 25 55 80 合计 90 70 160
时间: 2024-02-26 20:55:07 浏览: 76
Python处理中文路径
4星 · 用户满意度95%
为了判断子女文理科偏好与父母文理科背景之间是否有联系,我们可以进行卡方检验。具体步骤如下:
1. 建立假设
H0:子女文理科偏好与父母文理科背景之间没有关联
H1:子女文理科偏好与父母文理科背景之间有关联
2. 计算期望值
计算出每个单元格的期望值 E = (行之和 × 列之和) / 总和
例如,第一个单元格的期望值为 E11 = (80 × 90) / 160 = 45
3. 计算卡方值
卡方值 X2 = Σ((Oi - Ei)2 / Ei)
其中,Oi 表示观察值,Ei 表示期望值,Σ 表示对所有单元格求和。
例如,第一个单元格的卡方值为 X211 = (65 - 45)2 / 45 + (15 - 35)2 / 35 + (80 - 90)2 / 90 = 6.19
4. 计算自由度
自由度 df = (行数 - 1) × (列数 - 1)
例如,本题中自由度为 (2 - 1) × (2 - 1) = 1
5. 查表得出临界值
以 0.05 的显著性水平为例,查卡方分布表得到临界值为 3.84
6. 判断结论
如果计算出的卡方值大于临界值,则拒绝原假设,认为子女文理科偏好与父母文理科背景之间有关联;否则接受原假设,认为二者之间没有关联。
根据表格数据计算:
| 子女/父母 | 文科 | 理科 | 合计 |
| :-------: | :--: | :--: | :--: |
| 文科 | 65 | 15 | 80 |
| 理科 | 25 | 55 | 80 |
| 合计 | 90 | 70 | 160 |
计算期望值:
| 子女/父母 | 文科 | 理科 | 合计 |
| :-------: | :--: | :--: | :--: |
| 文科 | 45.0 | 35.0 | 80.0 |
| 理科 | 45.0 | 35.0 | 80.0 |
| 合计 | 90.0 | 70.0 |160.0 |
计算卡方值:
X2 = [(65 - 45)2 / 45 + (15 - 35)2 / 35 + (80 - 80)2 / 80 + (25 - 45)2 / 45 + (55 - 35)2 / 35 + (80 - 80)2 / 80] = 18.56
自由度 df = (2 - 1) × (2 - 1) = 1
查表得出临界值为 3.84,因为计算出的卡方值 18.56 大于临界值,所以拒绝原假设,认为子女文理科偏好与父母文理科背景之间有关联。
为了求出相关系数,我们可以使用 Pearson 相关系数。公式如下:
r = Σ((Xi - Xmean) × (Yi - Ymean)) / sqrt(Σ(Xi - Xmean)2) × sqrt(Σ(Yi - Ymean)2)
其中,Xi 和 Yi 分别表示第 i 个数据点在两个变量中的取值,Xmean 和 Ymean 分别表示两个变量的平均值。
将表格数据转化为频数矩阵如下:
| | 文科子女 | 理科子女 | 总计 |
| :---: | :------: | :------: | :--: |
| 文科父母 | 65 | 25 | 90 |
| 理科父母 | 15 | 55 | 70 |
| 总计 | 80 | 80 | 160 |
计算相关系数:
Xmean = (65 × 1 + 25 × 0) / 90 = 0.72
Ymean = (65 × 0 + 25 × 1) / 90 = 0.28
r = [(65 × 1 - 0.72 × 90) × (25 × 1 - 0.28 × 70)] / sqrt[(65 × 1 - 0.72 × 90)2 + (15 × 1 - 0.28 × 70)2 + (25 × 1 - 0.72 × 90)2 + (55 × 1 - 0.28 × 70)2] × sqrt[(65 × 0 - 0.28 × 90)2 + (15 × 0 - 0.28 × 70)2 + (25 × 1 - 0.72 × 90)2 + (55 × 1 - 0.28 × 70)2] = 0.42
根据计算结果,相关系数为 0.42,表示子女文理科偏好与父母文理科背景之间存在一定程度的正相关关系。由于样本容量较小,结论应谨慎对待。
阅读全文