Pse-in-one:Web服务器生成DNA/RNA/蛋白质序列伪模式

1 下载量 145 浏览量 更新于2024-08-26 收藏 1.37MB PDF 举报
"一对一(Pse-in-one)是一种专门针对DNA、RNA和蛋白质序列的Web服务器,它能够生成各种伪成分模式,以帮助研究这些生物分子的复杂结构和功能。该服务器提供了丰富的分析工具,包括不同的向量模型,用于描述序列的组成、自相关性以及更高阶的关联性。" 在《Nucleic Acids Research》2015年的一篇研究论文中,作者介绍了这个Web服务器的工作原理和应用。图1展示了沿着DNA/RNA/蛋白质序列的顺序相关性,如图所示,(a) 描述了所有相邻残基之间的耦合,(b) 展示了第二相邻残基之间的耦合,(c) 和 (d) 分别是第三和第四相邻残基之间的耦合。这种序列间的关联可以通过用户定义的物理化学性质函数(如(Ri,Rj))来量化,具体细节可以参考相关文献。 表1列举了PseDAC-General针对DNA序列可生成的14种向量模型,分为三类: 1. 核酸组成: - (1) 基本基元(Kmer) - (2) 反向互补基元(RevKmer) 2. 自相关: - (3) 双核苷酸基的自协方差(DAC) - (4) 双核苷酸基的交叉协方差(DCC) - (5) 双核苷酸基的自交叉协方差(DACC) - (6) 三核苷酸基的自协方差(TAC) - (7) 三核苷酸基的交叉协方差(TCC) - (8) 三核苷酸基的自交叉协方差(TACC) 3. Pseudo Components:这里未提供具体模式,但通常指的是更高级别的序列特征,如长程相互作用或特定序列模式。 这些向量模型可以捕捉到序列中的局部和全局特性,如 dinucleotide 或 trinucleotide 的频率、空间分布和相互作用,这对于预测序列功能、结构以及它们在生物过程中的作用至关重要。通过Pse-in-one,研究人员无需编写复杂的计算代码,即可方便地对DNA、RNA和蛋白质序列进行深入分析,从而推进生物信息学的研究和发展。