PLEK: 长链非编码RNA和mRNA预测工具的开源实现指南

需积分: 19 0 下载量 142 浏览量 更新于2024-11-03 收藏 53.88MB GZ 举报
资源摘要信息:"PLEK:基于 k-mer 方案的长链非编码 RNA 和 mRNA 的预测器-开源" PLEK是一个开源的软件工具,专门用于预测长链非编码RNA (lncRNA)和mRNA。长链非编码RNA是生物体内一类重要的非编码RNA,它们长度通常大于200个核苷酸,不编码蛋白质,但在基因表达调控中扮演着重要角色。PLEK基于一种称为k-mer的方案来区分lncRNA和mRNA,这种方法利用了核苷酸序列中短的核苷酸序列(即k-mer)的出现频率差异来进行预测。 安装PLEK首先需要满足几个先决条件: 1. Linux操作系统:PLEK是为Linux平台设计的,因此需要在一个Linux环境下进行安装和运行。 2. C/C++编译器:PLEK的安装过程中需要使用到gcc和g++编译器来编译C/C++编写的源代码。 3. Python环境:PLEK需要Python 2.5.0或更高版本的支持。用户可以通过访问Python官方网站(***来下载并安装适合的Python版本。 安装步骤如下: 1. 下载PLEK。用户需要从SourceForge网站上的PLEK项目页面下载最新版本的PLEK。下载文件是一个tar.gz格式的压缩包,需要解压以便进行后续操作。 2. 解压PLEK压缩包。通过Linux命令行使用tar命令解压下载的PLEK.1.2.tar.gz文件。解压后,用户会得到PLEK.1.2目录,该目录内包含了PLEK的所有源代码和相关文件。 3. 编译PLEK。进入PLEK.1.2目录,并使用python PLEK_setup.py命令来编译PLEK。这个过程中,PLEK的Python脚本会自动检测系统中是否安装了必需的依赖,如C/C++编译器,并进行相应的编译设置。 4. 运行PLEK。在编译完成后,用户可以通过命令行参数来运行PLEK,例如使用参数指定输入的FASTA格式文件(包含待预测的RNA序列),输出文件的名称和位置,以及可选的线程数(-thread),序列最小长度(-minlength)等。具体用法可以通过在命令行输入python PLEK.py --help来获取。 在PLEK的使用示例中,提供了两个基本的命令: 1. 使用默认参数运行PLEK进行预测:$ python PLEK.py predicted_fasta - -thread 10,这个命令将预测文件predicted_fasta中的序列,并使用10个线程来进行计算,预测结果将输出到标准输出。 2. 指定输入输出文件名和线程数进行预测:$ python PLEK.py -fasta PLEK_test.fa -out 预测 -thread 10,这个命令将从PLEK_test.fa文件读取序列,输出预测结果到文件“预测”,并指定使用10个线程。 PLEK的标签为"开源软件",这表明PLEK的源代码是公开的,用户可以自由地下载、使用、研究、修改和分发。开源软件的优势在于它鼓励了社区合作,加速了创新进程,并允许用户根据自己的需求定制和改进软件。 总结来说,PLEK为生物学研究者提供了一个有效且易于使用的工具,用于识别和区分长链非编码RNA和mRNA。PLEK的安装和运行依赖于Linux环境和Python语言,它的开源特性也允许研究人员进一步发展和优化这一工具。