自洽聚类分析大肠杆菌SD序列对基因表达的影响

需积分: 8 0 下载量 138 浏览量 更新于2024-08-07 收藏 460KB PDF 举报
"这篇论文是2008年内蒙古大学学报自然科学版上发表的一篇研究,主要探讨了使用自洽聚类法来识别大肠杆菌蛋白质编码基因的SD序列,以及这些序列对基因表达的影响。作者是王晓花和李宏。" 在原核生物,如大肠杆菌中,SD序列(Shine-Dalgarno sequence)是一个关键的序列,位于起始密码子上游,与16S rRNA的anti-SD序列配对,确保翻译的精确启动。SD序列的长度通常为4到5个核苷酸,位于起始密码子上游5到8个位置。SD序列的结构和位置对其功能,即启动翻译和选择正确的起始密码子,有着显著的影响。 在这项研究中,研究人员采用自洽聚类方法分析了大肠杆菌SD序列,将它们按照功能强度分为强、中、弱三类。他们发现了17种不同的碱基关联模式,并指出不同强度的SD序列有不同的偏好模式。例如,GGAGG模式被识别为弱SD序列的典型特征,而AAGGA则是强SD序列的特征模式。此外,同一碱基模式在不同距离(相对于起始密码子)时对基因表达的调控作用也有所不同。例如,GGAG模式中的A在强SD序列中位于-8位,但在弱SD序列中可能位于-7或-9位。 研究结果还揭示了一个趋势,即SD序列越强,其对应的基因表达水平越高;反之,SD序列越弱,基因表达水平越低。这表明SD序列的强度与基因表达调控之间存在直接关系。SD序列与anti-SD序列的配对程度和相对位置是决定翻译效率的关键因素。 尽管SD序列在不同物种间可能存在共性,但在同一物种的不同基因中,SD序列的形态、长度和位置的变异赋予了其在翻译调控上的多样性。然而,关于SD序列的全面理解还有待深入,例如,所有蛋白质编码基因是否都具有SD序列,以及SD序列的具体特征如何影响基因表达水平等具体问题。 这篇论文通过自洽聚类法提供了一种新的视角来理解和分类大肠杆菌的SD序列,对进一步探索原核生物的基因表达调控机制具有重要意义。