“这些东西还真的是……让咱们摸不到头脑啊。”
其实在人类基因组计划实施之前,对于这项人类历史上规模空前的世界性合作研究项目究竟该做些什么,存在一些争议。有一派观点认为,只需要测定编码蛋白质的那些遗传基因序列即可,因为对于遗传基因序列,我们只关心其中与基因相关的部分,而基因的一般定义就是用来编码一个蛋白质的遗传基因序列。
另外一派观点认为,既然要测,就应该测定人类染色体内所有的遗传基因序列,不管它是不是跟编码蛋白质有关。
这两个观点的差异主要来源于这么一个事实,在一个染色体所包含的完全遗传基因序列当中,编码蛋白质的部分只占非常非常小的份量,而大部分的遗传基因序列其实并不参与编码蛋白质,这样一些遗传基因序列一开始就被称为垃圾遗传基因,表达了人们对它们的存在价值的基本判断。
对一个物种而言,它的垃圾遗传基因确实就象是垃圾,因为还没有得到确切的证据能够表明它是有用的:它既不能给蛋白质编码、充当基因,也不能给RNA编码,也没有找到明显的与蛋白质等其他分子发生相互作用的迹象。当然,完全有可能它是行使了某种功能的,只不过是在“暗地下”进行,而我们还没有能力看到它行使功能的身影罢了。
既然我们对于如何发现垃圾遗传基因的作用现场还没有任何头绪,那么可以转而间接地去探讨它存在的价值,一个很好的途径是在物种的进化谱系上进行不同物种的遗传基因序列对比。
按照现代生物学的理解,遗传基因序列记载着一个物种全部的可遗传生命信息,那么处于不同进化地位的物种之间的进化关系。
威廉之前在帮助研究所进行解剖试验的时候,知道一些关于这些东西的事情。所以对他们还是有一些了解,所以也是帮助布利斯做出了一些贡献的。
应该是能够通过它们的遗传基因序列的继承和变化关系来表现的。可以想象,当一个新物种从它的原始物种进化出来以后,它不可能把全部的蛋白质都进行更换,相反,它能够产生的新生种类的蛋白质,应该只是很少量的,但对于它所具有的新的形态和功能而言,却又是关键的。
因此只有这样的蛋白质的编码信息才是在它的原始物种的遗传基因序列里面找不到的。同时其他大部分行使类似功能的蛋白质,都应该是以继承为主的。
现代根据遗传基因序列所进行的进化论研究确实证实了这点,对于生命而言非常基本的一些蛋白质,从大肠杆菌一直到人身上,都是非常类似的。
这些东西要是之前给叶东城听,估计现在已经是困得不行了,可是现在叶东城有了专业知识,对象还是林若曦,只能是开始听了。
相应的基因序列当然也差异很小。实际上,生物学家反过来利用了这点,通过对比同一个蛋白质在不同物种之间的基因差异程度,来度量它们在进化谱系上面的距离,甚至根据遗传基因碱基突变具有无关性和稳定突变速率的假设。
把基因变异看成是时光的刻度,从而可以依据这面进化之钟,确定物种之间的相对进化年龄。
在这里面既然编码蛋白质的遗传基因序列具有如此深厚的涵义,那么垃圾遗传基因序列呢?生物学家们从此受到启发,于是把不同物种之间的垃圾遗传基因也拿来作对比,结果是不比不知道,一比吓一跳!