DNA是遗传信息的载体,遗传信息的作用通常由蛋白质的功能来实现,但DNA并非蛋白质合成的直接模板,合成蛋白质的模板是RNA.正常细胞遗传信息的流向是:
与DNA相比,RNA种类繁多,分子量相对较小,一般以单股链存在,但可以有局部二级结构,其碱基组成特点是含有尿嘧啶(uridin,U)而不含胸腺嘧啶,碱基配对发生于C和G与U和A之间,RNA碱基组成之间无一定的比例关系,且稀有碱基较多。此外,tRNA还具有明确的三级结构。
表: RNA的分类
细胞核和胞液 | 线粒体 | 功能 | |
核蛋白体RNA | rRNA | mt tRNA | 核蛋白体组成成分 |
信使RNA | mRNA | mt mRNA | 蛋白质合成模板 |
转运RNA | tRNA | mt tRNA | 转运氨基酸 |
不均一核RNA | hnRNA | 成熟mRNA的前体 | |
小核RNA | snRNA | 参与hnRNA的剪接、转运 | |
小胞浆RNA | scRNA/7SL-RNA | 蛋白质内质网定位合成的信号识别体的组成成分 |
注:原核细胞不含后3种RNA
(一)信使RNA(mRNA)与不均一核RNA(hnRNA)
遗传信息从DNA分子抄录到RNA分子中的过程称为转录(transcription)。在真核生物中,最初转录生成的RNA称为不均一核RNA(heterogeneous nuclear RNA,hnRNA),然而在细胞浆中起作用,作为蛋白质的氨基酸序列合成模板的是mRNA(messenger RNA)。hnRNA是mRNA的未成熟前体。两者之间的差别主要有两点:一是hnRNA核苷酸链中的一些片段将不出现于相应的mRNA中,这些片段称为内含子(intron),而那些保留于mRNA中的片段称为外显子(exon)。也就是说,hnRNA在转变为mRNA的过程中经过剪接,被去掉了一些片段,余下的片段被重新连接在一起;二是mRNA的5′末端被加上一个m7pGppp帽子,在mRNA3′末端多了一个多聚腺苷酸(polyA)尾巴。mRNA从5′末端到3′末端的结构依次是5′帽子结构,5′末端非编码区,决定多肽氨基酸序列的编码区,3′末端非编码区,和多聚腺苷酸尾巴。多聚腺苷酸尾一般由数十个至一百几十个腺苷酸连接而成。随着mRNA存在时间的延续,这段聚A尾巴慢慢变短。因此,目前认为这种3′末端结构可能与增加转录活性以及使mRNA趋于相对稳定有关。原核生物的mRNA没有这种首、尾结构。
1961年,Jacob和Monod首先提出了mRNA的概念。在真核细胞中,由于蛋白质是在胞浆中而不是在核内合成,因此显然要求有一个中间物将DNA上的遗传信息传递至胞浆中。后来的研究证实,这种中间物即信使RNA.mRNA的核苷酸序列与DNA序列相应,决定着合成蛋白质的氨基酸序列。它如何指导氨基酸以正确的顺序连接起来呢?不同的mRNA碱基组成和排列顺序都不同,但都只有A,G,C,U4种碱基。如果一个碱基就可以决定一个氨基酸,则只有四种变化方式,如果两个碱基决定一个氨基酸,则只有16种变化方式,都不能满足20种氨基酸的需要。1961年Crick和Brenner的实验得出了三个核苷酸编码一个氨基酸的结论,并将这种三位一体的核苷酸编码称做遗传密码(genetic code)或三联体密码,这样就可以有64种不同的密码,但此情况下必须假定有一些氨基酸使用两个以上的密码。这一假定很快就被证明是对的。遗传密码具有下列特征:
(一)三个核苷酸组成一个密码子,每个密码子由三个前后相联的核苷酸组成,一个密码子只为一种氨基酸编码。共有64个密码子;
(二)密码子之间不重叠使用核苷酸,也无核苷酸间隔;
(三)一种氨基酸可有多个密码子,这个特点称为密码子的简并性;
(四)密码子的通用性,所有生物从最低等的病毒直至人类,蛋白质合成都使用同一套密码子表,仅有极少的例外,如特殊细胞器线粒体,叶绿体所用的密码稍有不同。
表: 通用遗传密码及相应的氨基酸
第一个核苷酸5′ | 第二个核苷酸 | 第三个核苷酸3′ | |||
U | C | A | G | ||
U | 苯丙氨酸 | 丝氨酸 | 酪氨酸 | 半胱氨酸 | U |
苯丙氨酸 | 丝氨酸 | 酪氨酸 | 半胱氨酸 | C | |
亮氨酸 | 丝氨酸 | 终止码 | 终止码 | A | |
亮氨酸 | 丝氨酸 | 终止码 | 色氨酸 | G | |
C | 亮氨酸 | 脯氨酸 | 组氨酸 | 精氨酸 | U |
亮氨酸 | 脯氨酸 | 组氨酸 | 精氨酸 | C | |
亮氨酸 | 脯氨酸 | 谷氨酰胺 | 精氨酸 | A | |
亮氨酸 | 脯氨酸 | 谷氨酰胺 | 精氨酸 | G | |
A | 异亮氨酸 | 苏氨酸 | 天冬酰胺 | 丝氨酸 | U |
异亮氨酸 | 苏氨酸 | 天冬酰胺 | 丝氨酸 | C | |
异亮氨酸 | 苏氨酸 | 赖氨酸 | 精氨酸 | A | |
蛋氨酸 | 苏氨酸 | 赖氨酸 | 精氨酸 | G | |
G | 缬氨酸 | 丙氨酸 | 天冬氨酸 | 甘氨酸 | U |
缬氨酸 | 丙氨酸 | 天冬氨酸 | 甘氨酸 | C | |
缬氨酸 | 丙氨酸 | 谷氨酸 | 甘氨酸 | A | |
缬氨酸 | 丙氨酸 | 谷氨酸 | 甘氨酸 | G |
表: 通用遗传密码与线粒体遗传密码之间的一些差异
密码子 | 通用编码 | 线粒体编码 | |||
哺乳动物 | 果蝇 | 酵母菌 | 植物 | ||
UGA | 终止码 | 色氨酸 | 色氨酸 | 色氨酸 | 终止码 |
AUA | 异亮氨酸 | 蛋氨酸 | 蛋氨酸 | 蛋氨酸 | 异亮氨酸 |
CUA | 亮氨酸 | 亮氨酸 | 亮氨酸 | 苏氨酸 | 亮氨酸 |
AGA | 精氨酸 | 终止码 | 丝氨酸 | 精氨酸 | 精氨酸 |
注:下标横线者为与通用编码不同的编码