Error in .Call2("fasta_index", filexp_list, nrec, skip, seek.first.rec, : reading FASTA file gencode.v29.primary_assembly.annotation_UCSC_names.gtf: ">" expected at beginning of line 1 >

这个错误提示看起来是在读取FASTA文件时出现问题，而不是在读取GTF文件时出现问题。可能的原因是你的代码中使用了读取FASTA文件的函数，但是输入的文件实际上是GTF文件，导致出现了格式错误。请检查你的代码，确保你正在使用正确的函数来读取GTF文件，例如使用`GenomicRanges`包中的`readGFF`函数，而不是用于读取FASTA文件的函数。如果你的代码中没有问题，那么请检查你的输入文件是否正确，是否为GTF格式的文件。你可以尝试使用文本编辑器打开输入文件，检查第一行是否以`>`开头，如果是，则说明该文件实际上是FASTA格式的文件，而不是GTF格式的文件。

import osfasta_file = r"E:\泛基因组分析\ORF\ORF_xml\PRRSV.fasta"new_id_file = r"E:\泛基因组分析\ORF\ORF_xml\prr.txt"new_fasta_file = r"E:\泛基因组分析\ORF\ORF_xml\prrsv.txt"if not os.path.exists(fasta_file): print(f"Error: Fasta file does not exist: {fasta_file}") exit()if not os.path.exists(new_id_file): print(f"Error: New id file does not exist: {new_id_file}") exit()try: with open(new_id_file, "r") as f: new_ids = [line.strip() for line in f]except FileNotFoundError: print(f"Error: Failed to read new id file: {new_id_file}") exit()try: with open(fasta_file, "r") as f, open(new_fasta_file, "w") as nf: for line in f: if line.startswith(">"): # 获取当前id在新id列表中的索引 id_str = line.strip().lstrip(">") if id_str.isdigit(): index = int(id_str) - 1 else: try: index = new_ids.index(id_str) except ValueError: print(f"Error: Id not found in new id file! ({id_str})") exit() # 替换为新id nf.write(f">{new_ids[index]}\n") else: nf.write(line)except FileNotFoundError: print(f"Error: Failed to read fasta file: {fasta_file}") exit()

这段代码的作用是将一个fasta格式的序列文件中的ID替换为一个新的ID，新ID存储在一个文件中。具体来说，代码首先检查fasta文件和新ID文件是否都存在，如果不存在则输出错误并退出程序。然后读取新ID文件中的ID列表，并将fasta文件中的ID替换为新ID。替换后的结果写入一个新的fasta文件中。如果读取文件或替换ID时出现错误，则输出错误并退出程序。需要注意的是，这段代码中的变量名并不一致，fasta_file在代码中被称为fasta_file和fasta_file，new_id_file在代码中被称为new_id_file和new_ids_file。这样的变量命名不规范会增加代码的阅读难度，应该尽可能保持一致性。

library(Biostrings) # 读取CSV文件 csv_file <- "/Users/imac/Desktop/new_list/JN_1901.csv" csv_data <- read.csv(csv_file) # 读取FASTA文件 fasta_file <- "/Users/imac/Desktop/fa/JN_1901_subseq.fa" fasta_data <- readDNAStringSet(fasta_file) # 根据CSV文件的内容修改FASTA文件的序列名称 for (i in 1:nrow(csv_data)) { old_name <- csv_data$OldName[i] new_name <- csv_data$NewName[i] # 在FASTA文件中查找并替换序列名称 names(fasta_data) <- gsub(old_name, new_name, names(fasta_data)) } # 将修改后的FASTA数据写回文件 output_file <- "/Users/imac/Desktop/fa/JN_1901_subseq_modified.fa" writeDNAStringSet(fasta_data, output_file)修改一下这串代码

这段代码本质上是将一个 CSV 文件中的内容读入到一个数据框（data frame）中，然后再将一个 FASTA 格式的文件读入到一个 DNAStringSet 对象中。接着，使用一个循环遍历 CSV 文件中的每一行，根据旧的序列名替换为新的序列名，并将修改后的 DNAStringSet 对象写回到一个 FASTA 格式的文件中。如果你要修改这段代码，可以根据自己的需求对 CSV 文件和 FASTA 文件的路径进行修改，然后再根据 CSV 文件的内容对 FASTA 文件的序列名进行修改。如果你不需要修改 FASTA 文件的序列名，也可以直接删除循环部分的代码。下面是修改后的代码示例： ```r library(Biostrings) # 读取CSV文件 csv_file <- "/Users/imac/Desktop/new_list/JN_1901.csv" csv_data <- read.csv(csv_file) # 读取FASTA文件 fasta_file <- "/Users/imac/Desktop/fa/JN_1901_subseq.fa" fasta_data <- readDNAStringSet(fasta_file) # 根据CSV文件的内容修改FASTA文件的序列名称 for (i in 1:nrow(csv_data)) { old_name <- csv_data$OldName[i] new_name <- csv_data$NewName[i] # 在FASTA文件中查找并替换序列名称 names(fasta_data) <- gsub(old_name, new_name, names(fasta_data)) } # 将修改后的FASTA数据写回文件 output_file <- "/Users/imac/Desktop/fa/JN_1901_subseq_modified.fa" writeDNAStringSet(fasta_data, output_file) ``` 注意，在修改代码之前，你需要根据自己的实际情况修改 CSV 文件和 FASTA 文件的路径。

阅读全文

Error in .Call2("fasta_index", filexp_list, nrec, skip, seek.first.rec, : reading FASTA file gencode.v29.primary_assembly.annotation_UCSC_names.gtf: ">" expected at beginning of line 1 >

相关推荐

fasta_filter脚本：按片段大小过滤reads的利器

phylip2fasta.py：转换phylip格式到fasta格式的工具

FASTX.jl：生物信息学中的FASTA和FASTQ文件处理工具

phylip2fasta.py_fasta_phylip_

filter_fasta_by_size.rar_fasta_filter 过滤脚本_按大小过滤reads

fasta-35.3.6.tar.gz_Waterman_fasta_fasta program_sequence alignm

extract_seq.py_fasta_extract_sequence_

合并数据与生物信息学工具：i.mx_virtualization_user's_guide实例

Seqund网络应用：从.sff到.fasta/.fastq的基因组数据转换

基于springboot+vue的体育馆管理系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

二叉树的创建，打印，交换左右子树，层次遍历，先中后遍历，计算树的高度和叶子节点个数

鸿蒙操作系统接入智能卡读写器SDK范例

【天线】基于matlab时域差分FDTD方法喇叭天线仿真（绘制电场方向图）【含Matlab源码 9703期】.zip

QT 下拉菜单设置参数 起始端口和结束端口

基于springboot+vue的大学生就业招聘系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

大家在看

libomp140.x86-64.dll

多文档应用程序MDI-vc++、MFC基础教程

遥感图像处理教程，以ENVI为例，仅供参考。

amd主板现代待机规范S0i3

ADS函数大全

最新推荐

基于springboot+vue的体育馆管理系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

二叉树的创建，打印，交换左右子树，层次遍历，先中后遍历，计算树的高度和叶子节点个数

鸿蒙操作系统接入智能卡读写器SDK范例

【天线】基于matlab时域差分FDTD方法喇叭天线仿真（绘制电场方向图）【含Matlab源码 9703期】.zip

QT 下拉菜单设置参数 起始端口和结束端口

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

QT 下拉菜单设置参数起始端口和结束端口

QT 下拉菜单设置参数起始端口和结束端口