主要内容

预测和可视化RNA序列的二级结构

这个例子演示了如何使用rnafoldrnaplot函数来预测和RNA序列的二级结构。

介绍

RNA在细胞中起着重要的作用,同时作为遗传信息载体(mRNA)和功能元素(tRNA, rRNA)。因为一个RNA序列的功能在很大程度上是与它的结构有关,从其序列预测RNA结构已经变得越来越重要。因为碱基配对和基础叠加代表大多数的自由能的贡献折叠,二级结构的一个很好的估计不仅可以是非常有用的解释功能和反应活性,而且在RNA分子的三级结构的分析。

RNA二级结构预测使用加权热力学模型

RNA序列的二级结构是由其基地之间的交互,包括氢键和叠加。RNA二级结构预测的方法使用最近邻模型和最小化总自由能与RNA结构。最小自由能估计个体能量的贡献碱基对叠加求和,发夹、凸起、内部循环和多分支循环。这些元素序列的能量贡献——length-dependent和实验确定[1]。的rnafold函数使用最近邻热力学模型预测的最小自由能的RNA序列二级结构。更具体地说,该算法实现rnafold使用动态编程来计算所有可能的能量贡献基本子结构,然后预测二级结构通过考虑基本的结合子结构的总自由能最低。在这个计算,多层螺旋同轴相连的贡献不是占,和基因的形成(non-nested结构元素)是禁止的。

转移核糖核酸苯丙氨酸的二级结构

图示是小分子(73 - 93个核苷酸),在翻译转移特定氨基酸的多肽链增长核糖体的网站。虽然每个氨基酸至少存在一个tRNA分子类型,二级和三级结构都是守恒的各种tRNA类型中,最有可能因为维护可靠的必要性与核糖体的交互。我们考虑以下tRNA-Phe序列酿酒酵母和最小自由能预测二级结构使用功能rnafold

% = = =预测二级结构在括号中phe_seq =“GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAAUUCGCACCA”;phe_str = rnafold (phe_seq)
phe_str = ' (((((((. . ((((........)))) (((((.......))))) ..... (((((.......)))))))))))) ....”

在括号中,每个点代表一个未配对的基础,而一双同样嵌套,打开和关闭括号表示一个碱基对。RNA二级结构的替代表示可以使用函数rnaplot。例如,上面的结构预测可以显示为一个根树,叶节点对应于未配对的残留物和内部节点(根除外)对应于碱基对。您可以显示每个残留的位置和类型通过点击相应的节点。

% = = =阴谋RNA二级结构树rnaplot (phe_str“>”phe_seq,“格式”,“树”);

tRNA二级结构通常在图情节和类似于苜蓿叶。它显示四个碱基配对茎(或“武器”)和三个循环。四种茎一直得到广泛的研究和特征:受体抑制(位置1 - 7和66 - 72年),D-stem(10 - 13和22日至25日),反密码子茎第27 - 31(位置和39-43)和T-stem(职位调查和61 - 65年)。我们可以画出tRNA二级结构为一个二维图,每个残留了一个点和骨干之间的氢键被表示为线点。茎由连续的碱基配对残留物(蓝点),虽然是由未配对的循环系统残留(红点)。

% = = =阴谋使用点图表示的二级结构rnaplot (phe_str“>”phe_seq,“格式”,“点”);文本(500、200、“T-stem”);文本(100、600、反密码子干的);文本(550、650、“D-stem干”);文本(700、400、承兑人干的);

尽管所有的茎是重要的适当的分子的三维折叠和成功的相互作用与核糖体和tRNA合成酶,承兑人干细胞和反密码子茎尤其有趣,因为它们包括附件网站和反密码子三联体。附件站点(位置,74 - 76年)发生的3 '末端序列的RNA链,由C-C-A氨基酸受体茎。反密码子的三元组由3基地,一对互补的信使RNA的密码子。对于Phe-tRNA,反密码子序列A-A-G与mRNA(职位34-36)对密码子U-U-C,编码氨基酸苯丙氨酸。我们可以重新绘制这些区域结构和突出的受体抑制和反密码子使用选择属性:

aag_pos = 34:36;cca_pos = 74:76;rnaplot (phe_str“序列”phe_seq,“格式”,“图”,“选择”(aag_pos cca_pos]);

序列的分离成四个独立的茎被显示结构更好的欣赏是图阴谋。横坐标上的每个残留表示和半椭圆形线基地那一对相互连接。缺乏基因在二级结构是反映在相交线的缺失。这是预期tRNA二级结构和预期,因为动态规划方法不允许基因。

rnaplot (phe_str“序列”phe_seq,“格式”,“图”);

类似的观察可以通过显示二级结构为一个圆,每个基本由一个点表示在一个任意大小的圆的周长,和基地,对彼此相连的线。线条在视觉上聚集成四个不同的组,由未配对的残留物。我们可以通过使用隐藏未配对的残留物H.Unpaired,返回的句柄colorby属性设置为状态

(哈,H) = rnaplot (phe_str,“序列”phe_seq,“格式”,“圆”,“colorby”,“状态”);H.Unpaired。可见=“关闭”;传说;

正如您可以看到的,输出的rnaplot功能包括一个MATLAB®结构H组成的处理,可以用来改变各种残留方面的属性子集。例如,如果您设置配色方案使用colorby属性设置为残留根据残渣,点颜色的类型,你可以改变他们的财产使用适当的处理。

(哈,H) = rnaplot (phe_str,“序列”phe_seq,“格式”,“圆”,“colorby”,“残留”)
公顷=轴(Bioinfo: rnaplot:圆)属性:XLim: [1] YLim: 1.1000 [1] XScale:“线性”YScale:“线性”GridLineStyle:“-”位置:[0.1125 0.1100 0.6709 0.8150)单位:“正常化”的使用得到显示所有属性H =结构体字段:答:[1 x1线]C: [1 x1线]G: [1 x1线]U: [1 x1线]选择:(0 x1线)

H.G.颜色= (0.5 0.5 0.5);H.G.标志=‘*’;H.C.颜色= (0.5 0.5 0.5);H.C.标志=“+”;

转移核糖核酸守恒苯丙氨酸

尽管有一些差异主要序列,转运rna分子二级结构模式是守恒的跨三个系统领域。考虑的结构tRNA-Phe每个系统领域的一个代表生物:酿酒酵母真核生物的Haloarcula marismortui古生菌,栖热菌属酸奶的细菌。然后预测和绘制其二级结构使用山图表示。

酵母=“GCGGACUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAGUUCGCACCA”;豪迈=“GCCGCCUUAGCUCAGACUGGGAGAGCACUCGACUGAAGAUCGAGCUGUCCCCGGUUCAAAUCCGGGAGGCGGCACCA”;theth =“GCCGAGGUAGCUCAGUUGGUAGAGCAUGCGACUGAAAAUCGCAGUGUCGGCGGUUCGAUUCCGCCCCUCGGCACCA”;yeast_str = rnafold(酵母);theth_str = rnafold (theth);halma_str = rnafold(豪迈);h1 = rnaplot (yeast_str,“序列”、酵母、“格式”,“山”);标题(h1,“tRNA-Phe酿酒酵母的);传说隐藏;h2 = rnaplot (halma_str,“序列”豪迈,“格式”,“山”);标题(h2,“tRNA-Phe Haloarcula marismortui”);传说隐藏;h3 = rnaplot (theth_str,“序列”theth,“格式”,“山”);标题(h3,“tRNA-Phe栖热菌属酸奶的);传说隐藏;

由此产生的结构之间的相似性是引人注目的,唯一的区别是一个额外的D-loop的残渣Haloarcula marismortui显示在第一个平坡山阴谋。

gu摆动碱基对

除了沃森克里克碱基对(u g c),几乎每一个类的功能RNA礼物gu摆动碱基对。gu对数组的独特的化学结构和构象性质:他们对金属离子有很高的亲和力,他们几乎是热力学稳定的沃森克里克碱基对,和他们现在的构象的灵活性,不同的环境。第三位置的摆动对受体螺旋的tRNA非常高度保守的几乎所有的生物。这个保护表明gu对具有独特的特性,由其他双很难复制。你可以观察到碱基对类型分布在二级结构图通过着色碱基对根据他们的类型。

rnaplot (yeast_str“序列”、酵母、“格式”,“图”,“colorby”,“对”);

引用

[1]马修斯,D。萨比娜,J。朱克,M。,和Turner, D. "Expanded sequence dependence of thermodynamic parameters improves prediction of RNA secondary structure", Journal of Molecular Biology, 288(5):911-40, 1999.