在r里读一次new_list.csv，该文件地址为/Analysis_B/20220326_JNILI/014_seqtk/new_name/new_list.csv，规定第一列为样本号，第二列为fa文件旧的序列名，第三列是新的序列名，根据第一列内容每次filter出来一个样本的子集，用biostrings包的names函数为fa文件重新命名，fa文件地址为/Analysis_B/20220326_JNILI/014_seqtk/002_subseq/

好的，你可以使用以下代码来读取`/Analysis_B/20220326_JNILI/014_seqtk/new_name/new_list.csv`文件，过滤出每个样本的子集，并使用`Biostrings`包的`names()`函数重新命名序列。 ``` library(Biostrings) # 读取new_list.csv文件 new_list <- read.csv("/Analysis_B/20220326_JNILI/014_seqtk/new_name/new_list.csv", header = TRUE, stringsAsFactors = FALSE) # 遍历每个样本 for (sample in unique(new_list$Sample)) { # 过滤出当前样本的子集 subset <- new_list[new_list$Sample == sample, ] # 读取该样本的.fa文件 sequences <- read.fasta(paste0("/Analysis_B/20220326_JNILI/014_seqtk/002_subseq/", sample, ".fa")) # 将.fa文件中的序列名称修改为新名称 old_names <- subset$OldName new_names <- subset$NewName names(sequences) <- new_names[match(names(sequences), old_names)] # 保存修改后的.fa文件 write.fasta(sequences, file = paste0("/Analysis_B/20220326_JNILI/014_seqtk/002_subseq/", sample, "_new.fa")) } ``` 这里的`/Analysis_B/20220326_JNILI/014_seqtk/new_name/new_list.csv`文件中包含了三列数据：`Sample`、`OldName`和`NewName`。我们首先使用`read.csv()`函数读取该文件。然后，我们遍历`new_list.csv`文件中的每个样本，使用`unique()`函数获取样本列表。在遍历每个样本时，我们使用`new_list`数据框的`Sample`列过滤出当前样本的子集，即`subset`。然后，我们使用`read.fasta()`函数读取该样本的.fa文件，得到一个`DNAStringSet`或`AAStringSet`对象`sequences`。接着，我们使用`names()`函数将`sequences`对象中的序列名称修改为`NewName`列中的名称。这里使用了`match()`函数来找到`OldName`列和`sequences`对象中的名称的对应关系。最后，我们使用`write.fasta()`函数将修改后的.fa文件保存下来。需要注意的是，我们在保存修改后的.fa文件时，文件名中加了一个`_new`的后缀，以区别于原始的.fa文件。

相关推荐

9-2 Abstract List Lib.zip_lib/list_debug._list_nodded68x

geekos-0.3.0.rar_geekos_geekos project_geekos-0.3.0_list3/28387.

bbs_aspx.rar_/bbs/List5.Aspx

seqtk subseq /Analysis_B/20220326_JNILI/004_Trinity/${j}_trinity.fa /home/DuYD/0530/grep/${j}_new_grep_trinity.list > /home/DuYD/0530/seqtk_fasta/${j}_subseq.fasta bash: seqtk: command not found... 怎么回事

在r里读一次new_list.csv，规定第一列为样本号，第二列为fa文件旧的序列名，第三列是新的序列名，根据第一列内容每次filter出来一个样本的子集，用biostrings包的names函数重新命名

hdl_fl_para += -f ../../../hdl/$(project)/file_list/gate_file_list.f -f ../../../hdl/$(project)/file_list/std_list_be_rek.f

FileNotFoundError: [Errno 2] No such file or directory: '../record/test_list.csv

使用TensorFlow对https://raw.githubusercontent.com/SophonPlus/ChineseNlpCorpus/master/datasets/waimai_10k/waimai_10k.csv该文本进行文本分类

makefile hdl_fl_para += -f ../../../hdl/$(project)/file_list/mx2_core_rtl_for_netlist_file_list.f

train_df = pd.read_csv('../input/train.csv') test_df = pd.read_csv('../input/test.csv') combine = [train_df, test_df] 转述成Rstudio

data=pd.read_csv(root+"/steet_character_detector/data/mchar_data_list_0515.csv")

爬取这个网站所有文本和表格，http://124.95.133.164/work/xjlp/new_building.jsp?page=1

python中在路径为path文件中含有123_diff.csv 和123_o_diff.csv等多个以_diff.csv为结尾的csv文件,循环根目录找到有且只含有_diff.csv的csv文件的路径

for i in cat /home/IrisYe/20211131_Shandong_Tick/003_Trinity/grep_trinity.list/${j}grep_trinity.list

最新推荐

毕业设计+编程项目实战+报名管理信息系统-基于ASP.NET技术(含完整源代码+开题报告+设计文档)

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

hive中 的Metastore

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

MATLAB柱状图在数据分析中的作用：从可视化到洞察

软件工程每个学期的生活及学习目标

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

hive中的Metastore