基因组结构

真核生物的基因组DNA主要存放于细胞核中,此外也有少量位于粒线体或叶绿体内。原核生物的DNA则是保存在形状不规则的类核(nucloid)当中。基因是DNA的一段区域,保存了基因组里的遗传讯息,是遗传的单位,影响了生物个体的特定表征。基因中含有可转录的开放阅读框架,以及一些可调节开放阅读框架表现的调控序列,如启动子与强化子。

许多物种的基因组都只有一小部分可编译成蛋白质。以人类为例,在人类的基因组中只有1.5%属于含有蛋白质编码的外显子,另有超过50%属于无编码的重复序列。真核生物基因组中如此大量的非编码DNA,以及物种之间不寻常的基因组大小或C值差异,长久以来一直是个难题,人们称之为“C值谜”。不过这些不含蛋白质编码的DNA序列,仍可能合成出具有功能的非编码RNA分子,用以调控基因表现。

T7RNA聚合酶(蓝色)以DNA模板(橙色)为依据,合成mRNA(绿色)。染色体中的某些非编码DNA序列,本身具有结构上的功能。例如一般只带有少量基因的端粒与着丝粒,对于染色体的稳定性及机能而言显得相当重要。人类体内有一类大量存在的非编码DNA,称为伪基因,是一些因突变累积而变得残缺无用的基因复制品。这些序列通常只可算是分子化石,不过有时候也会因为基因重复与趋异演化,而成为新基因里的新遗传物质。