通过网络查询连接函数使用方法,当关键字列名不一样时,如何代码实现? 例如: credit_t <- tibble(课程名 = colnames(score_t)[-1]) |> left_join(credit, by = _________) credit_t
时间: 2023-05-17 16:07:05 浏览: 249
可以使用参数 `by.x` 和 `by.y` 来指定连接的列名不一样时的对应关系,具体代码实现如下:
credit_t <- tibble(课程名 = colnames(score_t)[-1]) |>
left_join(credit, by = c("课程名" = "course_name"))
相关问题
运行下列代码,将基于 stringr:: words 的数据生成一个tibble,命名为tb_wordstb_words <- tibble( index = seq_along(stringr::words), words = stringr::words)
好的,可以运行以下代码将 `stringr::words` 生成的数据转化为 `tibble` 格式,并命名为 `tb_words`:
```R
library(tibble)
library(stringr)
tb_words <- tibble(
index = seq_along(stringr::words),
words = stringr::words
)
```
这里使用了 `seq_along()` 函数来生成一个整数序列,作为表格的第一列 `index`。同时,使用 `stringr::words` 函数生成单词向量,并将其作为表格的第二列 `words`。最后将这两列合并成一个 `tibble`,命名为 `tb_words`。
PCA_Plot_3=function (data,Annotation,VAR,Color) { # logcountdata row:genes,column: samples pca <- prcomp(data) pca_out<-as.data.frame(pca$x) df_out<- pca_out %>%tibble::rownames_to_column(var=VAR) %>% left_join(., Annotation) #df_out<- merge (pca_out,Annotation,by.x=0,by.y=0) # label_color<- factor(df_out[,group]) ggplot(df_out,aes_string(x="PC1",y="PC2")) +geom_point(aes_string(colour = Color)) } Deseq2_Deseq_function_2=function (Countdata,Coldata) { dds_fil <- DESeq2:: DESeqDataSetFromMatrix(countData =Countdata, colData = Coldata, design = ~Group) dds_fil_Deg<- DESeq2::DESeq(dds_fil) return(dds_fil_Deg) } pheatmap_singscore=function (pathways,data,Annotation) { Gene_select_anno= data[,colnames(data) %in% pathways] %>%t()%>%.[,rownames(Annotation)] # return(Gene_select_anno) # Anno_expression_data=Gene_select_anno[,c("SYMBOL",Group_select)] %>% as.data.frame() %>% distinct() %>% na.omit() # rownames(Anno_expression_data)=Anno_expression_data[,"SYMBOL"] # Annotation=group_anno["Gene_type"] # input= Anno_expression_data[,Group_select] # F2_pheatmap <- pheatmap::pheatmap(input, cellwigermline calling GATKdth = 10, cellheight = 12, scale = "row", # treeheight_row = 5, # show_rownames = T,show_colnames = T, # annotation_col= Annotation, # # annotation_row=Annotation, # annotation_legend=Label_def, # cluster_rows = T, cluster_cols = F,clustering_distance_rows = "euclidean") pheatmap::pheatmap(Gene_select_anno, cellwigermline=5, cellheight = 10,cellwidth = 10, scale = "row", treeheight_row = 5, show_rownames = T,show_colnames = F, annotation_col= Annotation, # annotation_row=Annotation, #annotation_legend=Label_def, cluster_rows = T, cluster_cols = F,clustering_distance_rows = "euclidean") } matrix.please<-function(x) { m<-as.matrix(x[,-1]) rownames(m)<-x[,1] m } 这是r语言的代码,告诉我每一条代码的作用和意义
PCA_Plot_3: 这个函数用来绘制主成分分析(PCA)的散点图。它接受四个参数:data(数据矩阵),Annotation(注释信息),VAR(行名),Color(颜色)。首先,它对数据进行主成分分析(prcomp函数),然后将主成分分析的结果转换为数据帧(pca_out)。接下来,它将行名转换为指定的VAR变量名,并将注释信息与主成分分析结果进行连接(left_join函数)。最后,它使用ggplot库绘制散点图,其中x轴表示PC1,y轴表示PC2,点的颜色由Color参数指定。
Deseq2_Deseq_function_2: 这个函数用于进行差异表达分析。它接受两个参数:Countdata(基因计数数据)和Coldata(样本注释信息)。首先,它使用DESeq2包中的DESeqDataSetFromMatrix函数将Countdata和Coldata转换为差异表达分析所需的数据集对象。然后,它使用DESeq2包中的DESeq函数进行差异表达分析,并返回结果。
pheatmap_singscore: 这个函数用于绘制热图。它接受三个参数:pathways(基因通路信息),data(基因表达数据),Annotation(注释信息)。首先,它从data中选择pathways对应的基因,并根据Annotation的行名对选定的基因进行筛选。然后,它使用pheatmap包中的pheatmap函数绘制热图,其中Gene_select_anno是待绘制的基因数据,Annotation用于注释列,cluster_rows参数表示是否对行进行聚类,clustering_distance_rows参数表示行聚类所使用的距离度量。
matrix.please: 这个函数用于将数据框转换为矩阵。它接受一个参数x(数据框),并将x的第一列作为行名,将x的其余列转换为矩阵。最后,它返回该矩阵。
阅读全文