setwd("D:\\生信\\TCGAload") #数据路径 > library("rjson") > json <- jsonlite::fromJSON("metadata.cart.2023-07-14.json") #metadata文件名 > View(json) > sample_id <- sapply(json$associated_entities,function(x){x[,1]}) > file_sample <- data.frame(sample_id,file_name=json$file_name) > count_file <- list.files('gdc_download_20230714_155413.592273',pattern = '*.tsv',recursive = TRUE) #Counts文件夹名 > count_file_name <- strsplit(count_file,split='/') > count_file_name <- sapply(count_file_name,function(x){x[2]}) > #下面的修改基因数 > matrix = data.frame(matrix(nrow=60660,ncol=0)) > #下面的修改样本例数 > for (i in 1:44){ + path = paste0('gdc_download_20230714_155413.592273',count_file[i]) #Counts文件夹名 + data<- read.delim(path,fill = TRUE,header = FALSE,row.names = 1) + colnames(data)<-data[2,] + data <-data[-c(1:6),] + data <- data[3] #数据类型,选择其中之一 3:unstranded;4:stranded_first;5:stranded_second;6:tpm_unstranded;7:fpkm_unstranded;8:fpkm_uq_unstranded + colnames(data) <- file_sample$sample_id[which(file_sample$file_name==count_file_name[i])] + matrix <- cbind(matrix,data) + } Error in file(file, "rt") : cannot open the connection In addition: Warning message: In file(file, "rt") : cannot open file 'gdc_download_20230714_155413.59227303953c9c-8b2b-4e61-bf59-ae75e67fe845/be87079d-9aba-406d-881b-c09077e837db.rna_seq.augmented_star_gene_counts.tsv': No such file or directory >
时间: 2024-04-16 16:24:43 浏览: 269
根据您提供的代码,您遇到了文件找不到的错误。错误信息显示无法打开文件 'gdc_download_20230714_155413.59227303953c9c-8b2b-4e61-bf59-ae75e67fe845/be87079d-9aba-406d-881b-c09077e837db.rna_seq.augmented_star_gene_counts.tsv',该文件似乎不存在。
请确保在运行该代码之前,您已经正确设置了工作目录并指定了正确的文件路径。还要确保此文件实际存在于指定的位置。
另外,请注意在读取文件时使用正确的文件路径和文件名。您可以通过在命令提示符下运行 `list.files('gdc_download_20230714_155413.592273', pattern = '*.tsv', recursive = TRUE)` 来检查文件是否存在。这将列出匹配模式 '*.tsv' 的所有文件。
如果问题仍然存在,请提供更多关于文件路径和结构的详细信息,以便我能够更好地帮助您解决问题。
相关问题
> library(data.table) > > # 设置工作目录 > setwd("/Users/imac/Desktop/summary_process") > > # 读取csv文件 > data <- fread("output_summary15.csv") > > # 选择需要的列 > cols <- c(V1, V2, V24, V15, V3.y, V7) Error: object 'V1' not found >
这个错误是因为`V1`等变量没有被定义。您需要将列名(或列索引)作为字符向量传递给`cols`变量。请尝试将`cols`定义为字符向量,像这样:
```
cols <- c("V1", "V2", "V24", "V15", "V3.y", "V7")
```
或者,您可以使用列索引而不是列名,像这样:
```
cols <- c(1, 2, 24, 15, 3, 7)
```
然后,您可以使用`data[, ..cols]`选择需要的列。
library(data.table) > > # 设置工作目录 > setwd("/Users/imac/Desktop/summary_process") > > # 读取csv文件 > data <- fread("output_summary15.csv") > > # 选择需要的列 > cols <- c("V1", "V2", "V24", "V15", "V3.y", "V7") > selected_data <- data[, ..cols] > > # 将列粘在一起 > text <- apply(selected_data, 1, function(x) { + paste(x["V1"], x["V2"], "blastx", x["V24"], x["V15"], "blastn", x["V3.y"], x["V7"], sep = "::")) Error: unexpected ')' in: "text <- apply(selected_data, 1, function(x) { paste(x["V1"], x["V2"], "blastx", x["V24"], x["V15"], "blastn", x["V3.y"], x["V7"], sep = "::"))" >
这个错误是因为在`paste()`函数中有多余的`)`。请将最后的`)`删除,像这样:
```
text <- apply(selected_data, 1, function(x) {
paste(x["V1"], x["V2"], "blastx", x["V24"], x["V15"], "blastn", x["V3.y"], x["V7"], sep = "::")
})
```
这将确保函数调用正确,并将结果存储在`text`中。
阅读全文