library(dplyr) # 读入两个csv文件 f1 <- read.csv("/Users/imac/Desktop/left_join/【1】output_summary.csv", stringsAsFactors = FALSE) f2 <- read.csv("/Users/imac/Desktop/left_join/fullnamelineage_staxids_X.csv", stringsAsFactors = FALSE) # 将f1的第一列按照;分割成多个列，只保留第一列 f1[f1 == ""] <- NA f1[, 1][is.na(f1[, 1])] <- "NA" f1_split <- data.frame(do.call("rbind", strsplit(as.character(f1[, 1]), ";", fixed = TRUE))[, 1, drop = FALSE]) colnames(f1_split) <- "staxids_X" # 在f1中添加新的列 f1 <- cbind(f1_split[, 1], f1[, -1]) f1[is.na(f1)] <- "" # 取第一个子串与f2的第一列进行比较 key <- strsplit(as.character(f1[i, 1]), ";", fixed = TRUE)[[1]][1] match_row <- f2 %>% filter(staxids_X == key) # 如果找到了匹配的行 if (nrow(match_row) > 0) { # 将右文件的后两列连接到左文件中 f1[i, 2:3] <- match_row[1, 2:3] } else { # 如果找不到匹配的行，用NA填充 f1[i, 2:3] <- NA } } # 输出结果到csv文件 write.csv(f1, "/Users/imac/Desktop/left_join/output.csv", row.names = FALSE)按照要求改一下这段代码，

时间: 2024-03-03 17:50:09 浏览: 97

好的，您的要求是将f1的第一列按照;分割成多个列，只保留第一个子串与f2的第一列进行比较，同时将匹配到的行的根和分类信息合并到f1的最后两列中，找不到匹配的行时，根和分类信息列中的值都填充为NA，并将结果输出到csv文件中。修改后的代码如下： ``` library(dplyr) # 读入两个csv文件 f1 <- read.csv("/Users/imac/Desktop/left_join/【1】output_summary.csv", stringsAsFactors = FALSE) f2 <- read.csv("/Users/imac/Desktop/left_join/fullnamelineage_staxids_X.csv", stringsAsFactors = FALSE) # 将f1的第一列按照;分割成多个列，只保留第一个子串 f1_split <- f1 %>% separate(col = V1, into = paste0("V", 1:10), sep = ";", fill = "right") %>% select(-starts_with("V")) %>% mutate(staxids_X = first(V1)) # 在f1中添加新的列 f1 <- cbind(f1_split[, "staxids_X"], f1_split[, -1]) # 取第一个子串与f2的第一列进行比较 for (i in 1:nrow(f1)) { key <- strsplit(as.character(f1[i, 1]), ";", fixed = TRUE)[[1]][1] match_row <- f2 %>% filter(staxids_X == key) if (nrow(match_row) > 0) { # 将右文件的后两列连接到左文件中 f1[i, c("root_x", "lineage_x")] <- match_row[1, c("root", "lineage")] } else { # 如果找不到匹配的行，用NA填充root_x和lineage_x f1[i, c("root_x", "lineage_x")] <- NA } } # 输出结果到csv文件 write.csv(f1, "/Users/imac/Desktop/left_join/output.csv", row.names = FALSE) ``` 请注意，由于您的数据文件路径可能不同，需要根据实际情况修改文件路径。

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通