火炬松热胁迫cDNA文库的EST-SSR预测分析

需积分: 5 0 下载量 50 浏览量 更新于2024-08-11 收藏 298KB PDF 举报
"火炬松热胁迫cDNA文库的EST-SSR预测 (2009年)" 这篇论文主要探讨了对火炬松(Pinus teada)在热胁迫条件下的cDNA文库进行EST(Expressed Sequence Tags)-SSR(Simple Sequence Repeats)预测的研究。EST是一种通过测序转录本片段来代表基因表达的短序列,而SSR则是一种微卫星DNA,由短的重复序列组成,常用于遗传标记和遗传多样性分析。 研究人员首先从火炬松热胁迫cDNA文库中获取了4283条EST序列,并使用cAP3软件进行拼接,最终得到了2062个uniGene,其中包括934个contig(连续序列)和1128个Singletons(单个未连接的EST)。uniGene是通过拼接ESTs形成的非冗余基因集合,它们代表了火炬松基因组中的不同基因或转录本。 通过对这些uniGene的分析,研究人员发现了110条EST-SSR标记,这意味着在拼接后的uniGene中,平均每4.32%的序列包含一个SSR位点,或者在火炬松的EST序列上,每14.6千碱基对(kb)就有一个SSR。这些重复基元中,二核苷酸和三核苷酸重复最为常见,分别占据了59.90%和36.36%的比例,四核苷酸和六核苷酸重复较少,分别为0.919%和2.73%,而五核苷酸重复则未被发现。 在所有重复基元中,AT这对二核苷酸的重复比例最高,达到了42.73%。在三核苷酸重复中,AAG和AGG的出现频率最高,均为7.339%。这些发现为开发新的火炬松分子标记和进行分子辅助育种提供了基础数据,有助于理解火炬松对热胁迫的遗传响应机制,并可能用于筛选耐热性更强的个体。 这项研究揭示了火炬松在应对热胁迫时的基因表达变化,特别是那些与SSR相关的基因,这将对理解植物的热适应性和遗传改良策略有深远影响。通过EST-SSR标记的预测,科学家可以更深入地探索火炬松的遗传结构和进化历史,以及在环境变化下的适应性。