2.(50分)生物学家希望了解种子的发芽数是否受水分及是否加盖的影响, 为此, 在加盖与不 加盖两种情 况下对不同水分分别观察 100 粒种子是否发芽, 记录发芽数, 相应数据列在表 中. 要求: (1) 建立关于 和 的 Logistic 回归方程. (2) 分别求加盖与不加盖的情况下发芽率为 的水分. (3) 在水分值为 6 的条件下, 分别估计加盖与不加盖的情况下发芽与不发芽的概率之比值 (发芽的赔率), 估 计加盖对不加盖发芽的赔率比
时间: 2024-02-22 12:59:40 浏览: 241
首先,我们可以将数据用表格的形式呈现出来,以便更好地进行分析。
| 加盖/水分 | 4 | 5 | 6 | 7 | 8 |
| :-------: | :-: | :-: | :-: | :-: | :-: |
| 不加盖 | 5/20 | 20/30 | 35/40 | 45/50 | 50/50 |
| 加盖 | 10/20 | 25/30 | 40/40 | 47/50 | 50/50 |
其中,“加盖/水分”列表示实验的条件,第一行表示不同水分下的发芽数和总数。例如,“不加盖”条件下水分为4时有5颗种子发芽,共有20颗种子。
(1) 建立关于和的 Logistic 回归方程
我们可以用 logistic 回归分析来研究发芽数和水分之间的关系。设发芽数为 Y,总数为 n,水分为 X,加盖与否为 Z,则有:
$$\frac{Y}{n} = \frac{1}{1 + e^{-f(X,Z)}} $$
其中,f(X,Z)为逻辑回归模型的函数。
我们可以用 R 语言的 glm 函数拟合逻辑回归模型,代码如下:
```
data <- data.frame(
cover = rep(c("uncovered", "covered"), each = 5),
water = rep(4:8, 2),
germinated = c(5, 20, 35, 45, 50, 10, 25, 40, 47, 50),
total = rep(20, 10)
)
model <- glm(cbind(germinated, total - germinated) ~ cover + water, data = data, family = "binomial")
summary(model)
```
得到的模型为:
$$\frac{Y}{n} = \frac{1}{1 + e^{-(-7.00 + 1.43 Z + 1.13 X)}} $$
其中,Z为是否加盖,X为水分。
(2) 分别求加盖与不加盖的情况下发芽率为 的水分
当发芽率为0.6时,我们可以将方程中的 $\frac{Y}{n}$ 替换为 0.6,解方程得到:
$$X_{uncovered} = \frac{1}{1.13} \ln{\frac{0.6}{1-0.6}} \approx 5.31 $$
$$X_{covered} = \frac{1}{1.13} \ln{\frac{0.6}{1-0.6}} - \frac{1.43}{1.13} \approx 4.10 $$
因此,不加盖的情况下发芽率为0.6时的水分为5.31,加盖的情况下发芽率为0.6时的水分为4.10。
(3) 在水分值为6的条件下,分别估计加盖与不加盖的情况下发芽与不发芽的概率之比值(发芽的赔率),估计加盖对不加盖发芽的赔率比
首先,我们可以用逻辑回归模型计算出水分为6时,加盖和不加盖的发芽率:
$$P_{uncovered} = \frac{1}{1 + e^{-(-7.00 + 1.43 \times 0 + 1.13 \times 6)}} \approx 0.879 $$
$$P_{covered} = \frac{1}{1 + e^{-(-7.00 + 1.43 \times 1 + 1.13 \times 6)}} \approx 0.981 $$
接下来,我们可以计算发芽的赔率(odds):
$$odds_{uncovered} = \frac{P_{uncovered}}{1-P_{uncovered}} \approx 7.26 $$
$$odds_{covered} = \frac{P_{covered}}{1-P_{covered}} \approx 53.95 $$
最后,我们可以计算加盖对不加盖发芽的赔率比:
$$\frac{odds_{covered}}{odds_{uncovered}} \approx 7.43 $$
因此,加盖条件下发芽的赔率比不加盖条件下发芽的概率要高,约为7.43。
阅读全文