用r,读入文件Hirsch_Cancer_Cell.tab,检验其第一列(列名为hr0_D2)的数值分布是否为正态分布,并用qqnorm画该列的分位比较图(Q-Q plot)。检验其第一列(列名为hr0_D2)的数值与最后一列(列名为hr36_D3)的数值分布是否一样,并用qqplot画这两列的分位比较图
时间: 2023-07-14 10:13:31 浏览: 45
首先,我们需要安装和加载必要的包,如下所示:
``` r
# 安装必要的包
install.packages(c("ggplot2", "nortest"))
# 加载必要的包
library(ggplot2)
library(nortest)
```
接着,我们可以使用 `read.table()` 函数读入数据,并查看数据结构:
``` r
# 读入数据
data <- read.table("Hirsch_Cancer_Cell.tab", header = TRUE, sep = "\t")
# 查看数据结构
str(data)
```
根据数据结构,我们可以看到数据集包含了 71 行和 37 列。
现在,让我们检验第一列 hr0_D2 是否为正态分布,并画出 Q-Q plot:
``` r
# 检验 hr0_D2 是否为正态分布
hr0_D2 <- data$hr0_D2
nortest::ad.test(hr0_D2)
# 画 Q-Q plot
ggplot2::qplot(sample = hr0_D2, geom = "qq") +
ggtitle("Q-Q plot of hr0_D2")
```
根据 Shapiro-Wilk 正态性检验和 Q-Q plot,我们可以看到 hr0_D2 不是正态分布。
接下来,让我们检验 hr0_D2 和 hr36_D3 是否拥有相同的分布,并画出两列的 Q-Q plot:
``` r
# 检验 hr0_D2 和 hr36_D3 是否拥有相同的分布
hr36_D3 <- data$hr36_D3
nortest::ad.test(hr0_D2, hr36_D3)
# 画 Q-Q plot
ggplot2::qplot(sample = hr0_D2, sample.y = hr36_D3, geom = "qq") +
ggtitle("Q-Q plot of hr0_D2 and hr36_D3")
```
根据 Anderson-Darling 检验和 Q-Q plot,我们可以看到 hr0_D2 和 hr36_D3 的分布不同。