解释这段代码cal_correlation<-function(interaction_tab,ex1,ex2,filter){ cat('calculating correlation\n') if (ncol(interaction_tab)==2){ cl = makeCluster(parallel::detectCores() - 1) clusterEvalQ(cl,library(ggm)) clusterEvalQ(cl,library(corpcor)) clusterExport(cl,c("ex1","ex2","interaction_tab"),envir=environment()) corr <- parSapply( cl, 1:nrow(interaction_tab), #whole number of combinations function(i) { xcor=cor(t(ex1[interaction_tab[i,1],]),t(ex2[interaction_tab[i,2],]), method = "pearson") return(xcor) } ) stopCluster(cl) res<-cbind(interaction_tab,corr) res<-res[abs(res[,3])>filter,] return(res) }else if (ncol(interaction_tab)==3){#abandoned cl = makeCluster(parallel::detectCores() - 1) clusterEvalQ(cl,library(ggm)) clusterEvalQ(cl,library(corpcor)) clusterExport(cl,c("ex1","ex2","interaction_tab"),envir=environment()) mydata1 <- parSapply( cl, 1:nrow(interaction_tab), #whole number of combinations function(i) { cox_all=matrix(nrow = 3, ncol = 1) ce1_1= as.character(interaction_tab[i,1]) ce2_1= as.character(interaction_tab[i,2]) miRNA1= as.character(interaction_tab[i,3]) s1<-cbind(t(ex2[ce1_1,]), t(ex2[ce2_1,]), t(ex1[miRNA1,])) xcor=cor(s1,method = "pearson") cox_all[1,1]=xcor[2,1] cox_all[2,1]=xcor[3,1] cox_all[3,1]=xcor[3,2] return(cox_all) } ) stopCluster(cl) scc<-data.frame(mydata1) scc<-t(scc) res<-cbind(interaction_tab,scc) colnames(res)<-c('x','y','miRNA','x_y','mi_x','mi_y') #post process of corr res<-res[res$x_y>filter,]#select triplets with |pcc|>filter res<-res[abs(res$mi_x)>filter & abs(res$mi_y)>filter & (res$mi_y)*(res$mi_x)>0,] return(res) } }
时间: 2024-04-19 09:28:37 浏览: 129
这段代码定义了一个名为`cal_correlation`的函数。这个函数用于计算两个数据集之间的相关性,并返回相关性大于给定阈值的结果。
如果`interaction_tab`数据集的列数为2,函数将使用并行计算来计算每一行两个数据集之间的相关性。具体步骤如下:
1. `makeCluster(parallel::detectCores() - 1)`:创建一个并行计算的集群,使用的核心数为可用核心数减去1。
2. `clusterEvalQ(cl,library(ggm))` 和 `clusterEvalQ(cl,library(corpcor))`:在并行计算的集群中加载`ggm`和`corpcor`库。
3. `clusterExport(cl,c("ex1","ex2","interaction_tab"),envir=environment())`:将`ex1`、`ex2`和`interaction_tab`导出到并行计算的环境中。
4. `parSapply(cl, 1:nrow(interaction_tab), function(i) {...})`:对`1:nrow(interaction_tab)`进行并行计算,其中每个迭代`i`表示一行数据。
5. 在每个迭代中,首先从`ex1`和`ex2`中获取相应的行数据,然后使用`cor()`函数计算这两个数据集之间的皮尔逊相关系数。
6. 将相关系数存储在变量`xcor`中,并返回该值。
7. 结束并行计算的集群。
8.
相关问题
解释这段代码cal_correlation<-function(interaction_tab,ex1,ex2,filter){ cat('calculating correlation\n') if (ncol(interaction_tab)==2){ cl = makeCluster(parallel::detectCores() - 1) clusterEvalQ(cl,library(ggm)) clusterEvalQ(cl,library(corpcor)) clusterEx
cute(interaction_tab,ex1,ex2,filter){
cat('calculating correlation\n')
if (ncol(interaction_tab)==2){
cl = makeCluster(parallel::detectCores() - 1)
clusterEvalQ(cl,library(ggm))
clusterEvalQ(cl,library(corpcor))
clusterExport(cl, c("interaction_tab", "ex1", "ex2", "filter"))
clusterEvalQ(cl, cal_correlation_worker <- function(interaction_tab, ex1, ex2, filter) {
library(ggm)
library(corpcor)
df <- interaction_tab[filter, ]
correlation <- cor(df[[ex1]], df[[ex2]])
return(correlation)
})
result <- parLapply(cl, 1, function(x) {
cal_correlation_worker(interaction_tab, ex1, ex2, filter)
})
stopCluster(cl)
return(unlist(result))
} else {
stop("interaction_tab should have exactly two columns")
}
}
解释这段代码cal_correlation<-function(interaction_tab,ex1,ex2,filter){ cat('calculating correlation\n') if (ncol(interaction_tab)==2){ cl = makeCluster(parallel::detectCores() - 1) clusterEvalQ(cl,library(ggm)) clusterEvalQ(cl,library(corpcor)) clusterExport(cl,c("ex1","ex2","interaction_tab"),envir=environment()) corr <- parSapply( cl, 1:nrow(interaction_tab), #whole number of combinations function(i) { xcor=cor(t(ex1[interaction_tab[i,1],]),t(ex2[interaction_tab[i,2],]), method = "pearson") return(xcor) } ) stopCluster(cl) res<-cbind(interaction_tab,corr) res<-res[abs(res[,3])>filter,] return(res) }else if (ncol(interaction_tab)==3){#abandoned cl = makeCluster(parallel::detectCores() - 1) clusterEvalQ(cl,library(ggm)) clusterEvalQ(cl,library(corpcor)) clusterExport(cl,c("ex1","ex2","interaction_tab"),envir=environment()) mydata1 <- parSapply( cl, 1:nrow(interaction_tab), #whole number of combinations function(i) { cox_all=matrix(nrow = 3, ncol = 1) ce1_1= as.character(interaction_tab[i,1]) ce2_1= as.character(interaction_tab[i,2]) miRNA1= as.character(interaction_tab[i,3]) s1<-cbind(t(ex2[ce1_1,]), t(ex2[ce2_1,]), t(ex1[miRNA1,])) xcor=cor(s1,method = "pearson") cox_all[1,1]=xcor[2,1] cox_all[2,1]=xcor[3,1] cox_all[3,1]=xcor[3,2] return(cox_all) } ) stopCluster(cl) scc<-data.frame(mydata1) scc<-t(scc) res<-cbind(interaction_tab,scc) colnames(res)<-c('x','y','miRNA','x_y','mi_x','mi_y') #post process of corr res<-res[res$x_y>filter,]#select triplets with |pcc|>filter res<-res[abs(res$mi_x)>filter & abs(res$mi_y)>filter & (res$mi_y)*(res$mi_x)>0,] return(res) } }
这段代码是一个计算相关性的函数`cal_correlation`,其功能是计算两个变量之间的相关性,并返回相关性结果。
函数接受四个参数:
- `interaction_tab`:一个包含交互作用信息的表格,可能有两列或三列,表示两个或三个变量之间的交互作用。
- `ex1`:一个表示第一个变量的数据集。
- `ex2`:一个表示第二个变量的数据集。
- `filter`:过滤阈值,用于筛选相关性结果。
代码首先输出一条提示信息,然后根据交互作用表格的列数执行不同的操作。
如果交互作用表格有两列,代码会进行并行计算相关性。它使用`makeCluster`函数创建一个并行计算的集群,并在集群中加载`ggm`和`corpcor`库。然后使用`clusterExport`将`ex1`、`ex2`和`interaction_tab`导出到集群中。接下来,使用`parSapply`函数在集群中计算每个交互作用对应的相关性系数,并将结果保存在向量`corr`中。最后,通过停止集群并将结果与交互作用表格合并,得到最终的结果`res`。最后一行代码对结果进行了一些筛选,只保留相关性绝对值大于阈值`filter`的结果。
如果交互作用表格有三列,代码会进行类似的操作,但是计算的是三个变量之间的相关性。结果将保存在名为`scc`的数据框中,并对结果进行了一些后处理,筛选出满足一定条件的相关性结果。
最终,函数会返回计算得到的相关性结果。
阅读全文