RNA的结构与功能

DNA是遗传信息的载体,遗传信息的作用通常由蛋白质的功能来实现,但DNA并非蛋白质合成的直接模板,合成蛋白质的模板是RNA.正常细胞遗传信息的流向是:

与DNA相比,RNA种类繁多,分子量相对较小,一般以单股链存在,但可以有局部二级结构,其碱基组成特点是含有尿嘧啶(uridin,U)而不含胸腺嘧啶,碱基配对发生于C和G与U和A之间,RNA碱基组成之间无一定的比例关系,且稀有碱基较多。此外,tRNA还具有明确的三级结构。

表: RNA的分类

   细胞核和胞液  线粒体  功能 
核蛋白体RNA  rRNA  mt tRNA  核蛋白体组成成分 
信使RNA  mRNA  mt mRNA  蛋白质合成模板 
转运RNA  tRNA  mt tRNA  转运氨基酸 
不均一核RNA  hnRNA     成熟mRNA的前体 
小核RNA  snRNA     参与hnRNA的剪接、转运 
小胞浆RNA  scRNA/7SL-RNA     蛋白质内质网定位合成的信号识别体的组成成分 

注:原核细胞不含后3种RNA

(一)信使RNA(mRNA)与不均一核RNA(hnRNA)

遗传信息从DNA分子抄录到RNA分子中的过程称为转录(transcription)。在真核生物中,最初转录生成的RNA称为不均一核RNA(heterogeneous nuclear RNA,hnRNA),然而在细胞浆中起作用,作为蛋白质的氨基酸序列合成模板的是mRNA(messenger RNA)。hnRNA是mRNA的未成熟前体。两者之间的差别主要有两点:一是hnRNA核苷酸链中的一些片段将不出现于相应的mRNA中,这些片段称为内含子(intron),而那些保留于mRNA中的片段称为外显子(exon)。也就是说,hnRNA在转变为mRNA的过程中经过剪接,被去掉了一些片段,余下的片段被重新连接在一起;二是mRNA的5′末端被加上一个m7pGppp帽子,在mRNA3′末端多了一个多聚腺苷酸(polyA)尾巴。mRNA从5′末端到3′末端的结构依次是5′帽子结构,5′末端非编码区,决定多肽氨基酸序列的编码区,3′末端非编码区,和多聚腺苷酸尾巴。多聚腺苷酸尾一般由数十个至一百几十个腺苷酸连接而成。随着mRNA存在时间的延续,这段聚A尾巴慢慢变短。因此,目前认为这种3′末端结构可能与增加转录活性以及使mRNA趋于相对稳定有关。原核生物的mRNA没有这种首、尾结构。

1961年,Jacob和Monod首先提出了mRNA的概念。在真核细胞中,由于蛋白质是在胞浆中而不是在核内合成,因此显然要求有一个中间物将DNA上的遗传信息传递至胞浆中。后来的研究证实,这种中间物即信使RNA.mRNA的核苷酸序列与DNA序列相应,决定着合成蛋白质的氨基酸序列。它如何指导氨基酸以正确的顺序连接起来呢?不同的mRNA碱基组成和排列顺序都不同,但都只有A,G,C,U4种碱基。如果一个碱基就可以决定一个氨基酸,则只有四种变化方式,如果两个碱基决定一个氨基酸,则只有16种变化方式,都不能满足20种氨基酸的需要。1961年Crick和Brenner的实验得出了三个核苷酸编码一个氨基酸的结论,并将这种三位一体的核苷酸编码称做遗传密码(genetic code)或三联体密码,这样就可以有64种不同的密码,但此情况下必须假定有一些氨基酸使用两个以上的密码。这一假定很快就被证明是对的。遗传密码具有下列特征:

(一)三个核苷酸组成一个密码子,每个密码子由三个前后相联的核苷酸组成,一个密码子只为一种氨基酸编码。共有64个密码子;

(二)密码子之间不重叠使用核苷酸,也无核苷酸间隔;

(三)一种氨基酸可有多个密码子,这个特点称为密码子的简并性;

(四)密码子的通用性,所有生物从最低等的病毒直至人类,蛋白质合成都使用同一套密码子表,仅有极少的例外,如特殊细胞器线粒体,叶绿体所用的密码稍有不同。

表: 通用遗传密码及相应的氨基酸

第一个核苷酸5′  第二个核苷酸  第三个核苷酸3′ 
U  C  A  G 
U  苯丙氨酸  丝氨酸  酪氨酸  半胱氨酸  U 
苯丙氨酸  丝氨酸  酪氨酸  半胱氨酸  C 
亮氨酸  丝氨酸  终止码  终止码  A 
亮氨酸  丝氨酸  终止码  色氨酸  G 
C  亮氨酸  脯氨酸  组氨酸  精氨酸  U 
亮氨酸  脯氨酸  组氨酸  精氨酸  C 
亮氨酸  脯氨酸  谷氨酰胺  精氨酸  A 
亮氨酸  脯氨酸  谷氨酰胺  精氨酸  G 
A  异亮氨酸  苏氨酸  天冬酰胺  丝氨酸  U 
异亮氨酸  苏氨酸  天冬酰胺  丝氨酸  C 
异亮氨酸  苏氨酸  赖氨酸  精氨酸  A 
蛋氨酸  苏氨酸  赖氨酸  精氨酸  G 
G  缬氨酸  丙氨酸  天冬氨酸  甘氨酸  U 
缬氨酸  丙氨酸  天冬氨酸  甘氨酸  C 
缬氨酸  丙氨酸  谷氨酸  甘氨酸  A 
缬氨酸  丙氨酸  谷氨酸  甘氨酸  G 

表: 通用遗传密码与线粒体遗传密码之间的一些差异

密码子  通用编码  线粒体编码 
哺乳动物  果蝇  酵母菌  植物 
UGA  终止码  色氨酸  色氨酸  色氨酸  终止码 
AUA  异亮氨酸  蛋氨酸  蛋氨酸  蛋氨酸  异亮氨酸 
CUA  亮氨酸  亮氨酸  亮氨酸  苏氨酸  亮氨酸 
AGA  精氨酸  终止码  丝氨酸  精氨酸  精氨酸 

注:下标横线者为与通用编码不同的编码