更新:这只是个简单的通俗向的小回答,不是什么严肃的学术综述,甚至比我平时写的大多数答案都简单,详细的还得看教课书(比如Chromosomal DNA and Its Packaging in the Chromatin Fiber)、看文献,我也只是把已有的结论删掉大部分细节解释补充小部分新姿势重新编写。很多细节没有展开,如果感兴趣可以评论区提问,力所能及的我会回答,尽量不要太发散脑补,产生误解就不好了。
认为我写得不对的,如果能摆事实讲道理给文献,欢迎打脸,包括或者写的不好、写得不清楚的也欢迎指出。如果就是看着不爽为了撕而撕的,不管你写什么都有这样的,我实在懒得理了,干什么想不开在我的专业领域怼我…………
只多根据目前的讨论补充一点,这个题目的问题是为什么裸露DNA要和蛋白质结合。组蛋白的诸多功能很重要,组蛋白是怎么来的,这的确是个进化问题,但是完全是另一个话题,目前对于真核细胞如何起源的研究也并不充分到我们能够了解当时的自然选择压力是怎样的,从而解释“为什么”。如果错误的认为这种形式更高效就必然被进化保留,那么就会陷入了目的论式的什么好所以用什么的陷阱,不存在这样的主体意识替生命选择。
--
泻药。总的来讲这不是一个进化问题,而是物理约束的问题。
先念知乎十字真言:先问是不是,再问为什么。
原核生物含有裸露的DNA,而且这些裸露的DNA有遗传效应。
不是啊。原核生物同样有复杂的基因组结构,称为拟核染色体,是DNA和蛋白质结合,相互作用共同形成的。
如下示意图:
Nature Reviews Microbiology 8(3):185-95 · February 2010
快速生长的大肠杆菌基因组(exponential growth)长左边这样,更紧密;稳定期的长右边这样,更松散。
除了负责把DNA转录成RNA的RNA聚合酶以及相关的调控蛋白之外,还有若干蛋白质结合在DNA上,其中最重要的当属H-NS(蓝色球)。
如果学过一点生物,知道真核生物的染色体是DNA上缠着组蛋白(histone)。
原核生物的染色体同样也是DNA上缠着各种各样类似组蛋白功能的结构蛋白,比如大肠杆菌的“像组蛋白的拟核结构蛋白”,histone-like nucleoid-structuring protein (H-NS)。除此之外还有各种各样的其他蛋白质共同参与到DNA的折叠当中,即使在真核生物组蛋白也不是孤军奋战的。
这些蛋白有什么作用呢,和组蛋白在真核生物染色体内的作用有一定的区别,不同细菌类群中具体功能和对DNA的作用机理各有异同。但是总得来讲都可以分成两大类:
1)调节DNA的折叠结构
Nature Reviews Microbiology 8(3):185-95 · February 2010
2)也参与很多基因表达调控的过程。
除了包括负责RNA转录的一些调控因子和酶也会影响DNA结构的动态调整,不过他们的表达相对不那么恒定,会随着细胞的生理状态而发生变化。
存不存在裸露形态为主的DNA呢?也是有的,但是他们一般都太短了不足以编码整个细胞所需的基因,而是作为一个锦上添花的部分,携带一些和负责抗生素耐药性啊、两个细菌之间没羞没臊啊之类的基因,游离于细胞质中,称为质粒(plasmid)。(反过来不成立哦,质粒中也有和H-NS结合折叠包装的)。当然如果你是体外实验,想怎么来没人拦着,但是没有细胞没有遗传,题目中的遗传效应无从谈起。
再来谈谈为什么。
简单的讲,就是物理约束,物理约束,物理约束。
所有物种的DNA结合蛋白的系统中,有一件事是保守的,就是总是有蛋白质负责DNA高级拓扑结构(简单的讲就是DNA双螺旋的继续折叠)的组装。
不和蛋白质结合的核DNA长度一般都比细胞直径大多了。人的染色体DNA,如果裸露的话,平均有几个厘米长,而整个细胞直径普遍只有十几微米,差一百多倍,怎么装进去?
必须要打包压缩啊。
既然是打包,那么就有两种选择,像平时用耳机一样随便往口袋里一装,没有什么特定结构乱七八糟。什么时候细胞要分裂了,DNA一复制,两个细胞一分家,两头一扯缠成几个死扣,gameover。即使是小心翼翼地解线头,也需要天长地久还不一定解的开。
(SONY大法好)
还有一种选择,是利用各种辅助物(也就是组蛋白啦)折好叠好,分裂间期折叠成一个适合基因表达的状态,等到细胞分裂的时候,可控地进一步压缩成一条条短短的染色体,排排坐分果果。
(中文维基百科)
不用多说,两者之间,高下立现吧…没有一大堆蛋白质协助帮助,下面这个线头能扯得明白?
Study: Molecular Motors Shape Chromosome Structure
真核细胞比原核细胞可能更需要蛋白质的结合的原因是真核细胞是线性DNA,而原核细胞是环状的,可以通过如下超螺旋的方式,在没有蛋白质结合的情况下进行折叠压缩和结构调控,所以如质粒这样的小DNA有时候是不用和蛋白质结合的,但是基因组DNA太长了,只凭天然的超螺旋而没有蛋白协助调控折叠还是不够。
DNA supercoil - Wikipedia即使在不分裂的状态,保持一定的结构,为可能到来的下一次分裂做准备也是很有必要的。以人为例,不分裂的体细胞中,23对染色质在细胞核中也分别占据不同的位置,相互之间不能完全的如胶如漆你中有我。这样最起码的,染色质进一步压缩成染色体的时候,互相不会缠到一起去。毕竟爱是克制,喜欢才会放肆。
在成人男性纤维细胞上的23种(21+X+Y)人类染色质,中文维基
除此之外,细胞内的DNA必需要有蛋白质结合,才有可能调控其在三维空间中的结构。而三维空间中的构象,决定了在一维序列上不相邻的DNA序列和基因之间的相互调控关系。不同的细胞类型,往往有着不同的基因表达和调控关系,其中一部分就是通过不同的染色体结构来实现的。调控功能演变是和进化密切相关的。
来自ChromoNet
--稍作分割--
通过一个思想实验可以更好地说明打包的问题:(鉴于很多人对这部分不满意,觉得很容易反驳,我就放在最后稍作展开吧)
如果存在一个细胞,其基因组DNA是完全裸露的(空间结构全靠扩散),那么这个细胞总能够正常分裂,子细胞平分复制后的两个DNA的一个必要条件是,基因组DNA的大小足够小——小于分裂过程中最小的细胞核或原核细胞拟核区的直径,才不会在细胞里面打结(Spontaneous knotting of an agitated string)。 细胞能够正常分裂的另一个必要条件,是编码了足够多的酶来完成细胞分裂时所需的各项功能,这一条件需要基因组DNA的大小足够大。
实际上我们需要比较的是,对于特定的生物,“足够大”的需求——基因组大小(C-value),和“足够小”的需求——细胞核、拟核(nucleus size)大小。如果这个“足够大”总是大于“足够小”,那么不可能存在这样的一个细胞。比这更强的一个条件是,如果“足够大”的下限高于“足够小”上限,那么“足够大”总是大于“足够小”就是必然的了。
根据现有的真实实验所获得的信息,可以很好地验证这个强假设。
文特尔带队创造的最小生命Syn3.0,处于几乎删无可删的状态(图A),基因组DNA只有531kb(图B)。531kbDNA的大小差不多是174~177微米这个数量级(参考Nucleic acid double helix)。而Syn3.0的细胞直径小于1微米(图C)!所以不出意外的,这个DNA也需要蛋白质的帮助来折叠,而且有5个之多!C-value的下限估计为~170微米,环状DNA直径~56微米,小于这个值的细胞不太可能活下来。
Design and synthesis of a minimal bacterial genome而“足够小”呢?需要比一个物种正常的细胞核、或核区还要小。因为比表面积和扩散速率的问题,这个数值不可能无限大,大多数已知原核生物都在0.1~10微米(Bacteria - Wikipedia),单细胞真核生物的遗传核、多细胞真核生物的体细胞细胞核在1~10微米级,皆装不下170微米大的DNA。这个上限可以估计到已知的细菌里面,active细胞质直径最大的、肉眼可见的超大型细菌Epulopiscium fishelsoni——DNA复制后细胞分裂前的细胞大小为320微米长45微米宽(Gigantism in a Bacterium, Epulopiscium fishelsoni, Correlates with Complex Patterns in Arrangement, Quantity, and Segregation of DNA)。很尴尬,细胞质全用上(实际上不可能的)也不够装一个最小基因组的,即使最小基因组大小的DNA能够维持其原本的大小,也需要折叠才行…(我也期待发现其他更大大的细菌,推翻以上假设)…完。
--稍作分割结束--
综上所述,这件事实际上还是个物理约束的问题——编码了足够多基因的DNA体积过大,如果没有可控的特定的“打包”结构,细胞就无法分裂,产生子代,或者概率极低,还没轮到进化开始起作用,就已经成dead game了。
而实现这种特定结构,目前发现的,有环状DNA超螺旋和蛋白结合DNA并指导折叠两种手段,原核生物只凭超螺旋往往是不够的,所以也使用蛋白质。而真核生物由于是线性DNA只能使用蛋白质。
这件事从生命起源上也是说的通的,蛋白-核酸结合的复合体出现的时间,是要比可分裂的细胞这种复杂系统要早的多的。只需要<7个碱性和疏水氨基酸的随机连接就可能产生RNA结合蛋白,其产生的条件,比第一个酶、比自我复制的分子、等第一个细胞所需的必要物质的诞生条件都要小得多。而对于第一个细胞以前的“试运行系统”protocell(Protocell - Wikipedia)的研究,显示这些能和核酸结合的蛋白很可能是protocell组装所必须的物质。