百科问答小站 logo
百科问答小站 font logo



为什么人类 DNA 中大部分是非编码序列? 第1页

  

user avatar   tmszhu 网友的相关建议: 
      

正好跟我的专业有关,认真回答一下吧。这个问题远没有这么简单。基因组学发展到今天,围绕它的讨论和争议,从结构和功能基因组学,到生命进化,一直到哲学,甚至到学术资源政治版图的划分,可以写上一个很有趣的故事。

存在即合理。这个没错。但是,存在即有用吗?

譬如我们的阑尾和智齿,它们用处不大,麻烦不小,更多地是人类进化过程中留下的遗迹,绝非什么宝贝。

人类基因组中98.5%的非编码序列,也要辩证地来看。


早在20世纪六七十年代,人们就开始把非编码序列称为“垃圾DNA”了。然而人们很快就发现,不少非编码序列跟基因的转录调控密切相关。垃圾并不垃圾,生命也绝非仅有中心法则。那么非编码序列中都有些什么好东西呢?

教科书中经典的非编码DNA元件,如启动子和增强子,可动遗传因子,还有具有生物活性的小RNA,这些在 @李雷 的回答中已经介绍得比较清楚了。答主想给大家讲的是近几年的新发展,和学术界的思考和争鸣。

分子生物学发展的早期,科学家为了窥破生命这一黑箱,所设计的精妙绝伦的生物化学实验,实在令后生拍案叫绝!而在这高通量、大数据为王的新世纪,非编码DNA研究的主力毫无疑问是 ENCODE 计划。这是全球大规模合作的科研项目的典范,生物大数据的先驱。全球数十个科研团队,用最新开发的高通量实验方法,系统地,全面地扫描人类和其他生物各种组织中所有非编码DNA的生物活性。

他们用的方法有ChIP-seq(检测染色质和蛋白质的相互作用),RNA-seq(把细胞里的所有RNA分子作为一个整体测序),DNase-seq(把染色质上对DNA酶敏感的区域,也就是结构较疏松较暴露的区域给测序),等等等等。可惜当时还没有CRISPR,否则检测基因组区域的功能(不管编码非编码)是非常地合适(Canver et al., 2017)。现在人们已经开始跟进了。

时至今日,ENCODE网站数据页的截图,看看人类已经做了多么大量的工作:


2012年,ENCODE的研究成果集中喷发。《科学》杂志社的评论家Elizabeth Pennisi 总结道 :“本周有三十篇论文在《自然》、《科学》等期刊上发表,宣告了垃圾DNA这一理论的死刑。ENCODE计划已经发现,人类基因组的80%是有用的。”

这是 Pennisi (2012) 的配图,描绘了当时人们已经发现的有功能的非编码DNA元件。


最近的几年里,对非编码DNA的研究有了很大进展。大量激动人心的新发现,尚未被写进教科书,比方说:

长链非编码RNA(lncRNA)。人类基因组的绝大部分,不管编码不编码,都在随时被转录成RNA,其中不少还颇长(并非前几年热过的小RNA)。这些lncRNA不至于都是RNA聚合酶喝醉后随机转录的无用产品吧?其中一些也许用些功能吧?人们这样想着,对这一现象进行了大量研究,堪称近年前列的热门领域。时至今日已有数以万计的人类lncRNA被发现了(Hon et al., 2017),而且其中相当大比例有时间和空间的特异性(说明什么?说明可能有转录调控的功能呀。这是发育生物学家最喜欢看到的现象),但是从另一方面看,它们进化上的保守性并不显著(所以,遗传学家的兴趣可能稍微缺一点点)。

不少lncRNA已经被发现有功能,从转录调控到翻译调控,从衰老到癌症,到处都有它们在起作用,甚至还包括翻译成蛋白质(没错,先前认为的一些lncRNA其实还是编码的,这就尴尬了)。一个经典的有功能的lncRNA的例子是XIST。人类女性的两条X染色体,只有一条持续发挥功能,而另一条在发育的早期就会静默。那条静默的染色体,会表达出大量XIST这个lncRNA,像蚕茧一样把自身团团包裹,让它没有办法再发挥正常的功能。

这是 Ng et al. (2007) 的插图,显示XIST是如何包裹静默的X染色体的。

超级增强子(super enhancer)(Whyte et al., 2013)。它们是物理上接近的多个增强子,能够相互配合完成复杂的和更强的转录调控功能。可以理解为更高级的组织形式。也就是说,现在科学家已经不满足于研究单个的功能元件了,而是要研究多个元件的协同作用了。“增强子”这一概念本身就是多个转录因子结合位点(TFBS)的集合,现在又有了集合的集合。科学就是这么一层一层地推进的。


下面答主要画风一转了。

非编码DNA果真这么有用吗?在进化生物学界,存在着不同的声音。

休斯敦大学的教授Dan Graur是有名的反对派代表。他对ENCODE发出了强烈的质疑和抨击。他问:

什么才是“有用”或者“功能”呢?跑一个ChIP-seq,发现某段DNA和某个蛋白质有一定亲和力,就说明该DNA有功能吗?

比如你在街上踩到了一块口香糖,结果它粘在你的皮鞋上了。你能说粘口香糖是你的皮鞋的一个功能吗?

这里有他发表的战斗檄文:On the Immortality of Television Sets: “Function” in the Human Genome According to the Evolution-Free Gospel of ENCODE。想看中立的新闻报道可以戳 这里 (“Dan Graur要把垃圾DNA留在垃圾场!”)。

Dan Graur在自己课题组网站上放的自画像:

这里有Dan Graur的演讲视频:youtube.com/watch? ,大家可以感受下。而答主有幸体验过现场版,场面极其火爆,比Youtube视频里的火爆得多,是答主这辈子听过的学术演讲之最。当时观众席上还有不少进化生物学和基因组学大牛,各人心里怎么想的我不敢断言,至少都在开怀大笑。演讲一完毕,台上台下就爆发了激烈争论。

Dan Graur做了这样的比喻:在你家的车库里,也许堆满各种杂物。你每天都要用到它们吗?未必。其中大多数东西,只怕早就不再对你有用了,只是你懒得把它们丢掉而已。反正车库空间大,留着无妨,说不定哪一天突然发觉某些用处呢?

如果你对中性进化理论有一定了解,能够从中读出进化的语言吧。

这话究竟有没有道理,那就见仁见智啦。

除了这个不知疲倦的斗士Dan Graur,其他不少进化生物学家也对ENCODE的“80%”的乐观宣称颇有微词。加拿大Dalhousie大学的W. Ford Doolittle绝对是仍然在世的一号传奇,他写了 Is junk DNA bunk? A critique of ENCODE 一文。在批评ENCODE的同时,他也讨论了“功能”的定义和分类,其中也包括进化学者感兴趣的,基因组冗余度所带来的“未来”的功能。


对于一部分进化生物学家的质疑,ENCODE团队回应说(Kellis et al., 2014):他们认真思考总结了“功能”的定义,从三个方面来判断一段非编码DNA是否有功能:遗传学(如果把它删除,生命性状会改变),进化生物学(它在多个基因组中是保守的),和生物化学(观察到它与转录因子的结合)。该文同时讨论了三种方法的优缺点。

总之,口舌之争没意思,我就是给你摆数据。这么大一座数据的宝库,可以让全世界从里面发掘有价值的非编码DNA。这不已经有很多非常重要的发现的例子了吗?空谈误国,实干兴邦。道理就是这么简单。


不管人们怎么看待和定义“功能”,自然界中总是有令人惊奇的例外存在。2013年,Ibarra-Laclette et al. 发表了食肉植物丝叶狸藻(Utricularia gibba)的基因组序列。这是有花植物中最小的基因组之一,只有82MB。

通常,植物的基因组往往非常之大,里面充斥着大段的重复序列,它们是进化过程中频繁转座(transposition)和全基因组复制(whole genome duplication)的痕迹。植物似乎对这些耗时耗力的冗余DNA的容忍度特别高,抑或,它们其实对植物体是有至关重要的功能的,只是人们还没有发现?

然而丝叶狸藻的基因组却是个令人吃惊的例外。它只有3%的非编码序列。相比起人类的98%,简直可以忽略不计了。而它的基因数量却一点都不少。形成对比的是,丝叶狸藻的近亲番茄,有着比它大10倍的基因组。

这是文中图1a,显示丝叶狸藻在进化树上的位置。其实它这个分支经历了多次全基因组复制。然而某种神秘的选择压力让这个基因组反而比亲戚们更小。

这一事实显示,不管那些非编码DNA有什么了不得的功能,丝叶狸藻其实用不着它们(中的绝大多数),也能活得好好的。

同样是在《科学》上,Paul Gabrielsen 评论道 :“这一发现颠覆了垃圾DNA对生命是必需的这一观点。”


不同生物基因组中非编码序列的多寡,反映了一个古老的问题:C值困境(C-value paradox)。这个现象早在1970年代就被人注意到了。它说的是,生物体的复杂程度和基因组的长度的比例不是一定的,乃是高度变化的。用通俗的话说,就是有的生物非编码序列多,有的少。

与高等生物相反,细菌基因组里很少有非编码序列。病毒基因组更加夸张,甚至同一段序列也要两用:从左往右读是一个基因,从右往左又是另一个基因。这些小东西的基因组寸土寸金,不会为了潜在的进化可塑性而消耗宝贵的能源去保存不是马上用得到的DNA。

生物基因组对各种序列的取舍,本质上是不同进化策略的体现。基因组学的研究越深刻,从中就能发现越多对人很有启发的道理。


PS:有谁去下周在Portland的Evolution 2017?私信联系,咱们可以去喝一杯。


user avatar   li-lei-up 网友的相关建议: 
      

抛砖引玉

我揣测

———从进化的角度,没必要浪费———

是否生物根本不需要那么多蛋白来发挥作用

我们知道从DNA出来,有以下步骤,转录为RNA,翻译成蛋白质,也就是所谓的中心法则

如果一个功能RNA可以完成,那么继续走向蛋白质就是一种浪费。

而目前发现,RNA还真的可以顶替很多蛋白质的功能(此部分在第二部分讲)

要知道多了一步蛋白质,那就意味着

1,合成工序多了

2,需要的原料增加了

3,后续维护成本提高了(比如蛋白折叠错误的修复在生物体内消耗了大量的能量)

4,不确定性也增加了很多


而这对于生物来说,是极其不明智的。

事实上,不少时候,进化的一个结果就是去适应环境,在资源不是极大丰富的时候(那得共产主义哪),太多的消耗是不太合适的。

那么非编码区RNA有什么功能呢?

————非编码RNA————

首先,一般大家说编码,是指编码蛋白质。

而基因组大体是这样子,过去曾经有垃圾DNA的定义

编码区域就是图中的蓝色小线条,在基因组上极小。

当然,后来大家不叫垃圾基因了,

因为发现那些非编码区,事实上是发挥作用的,比如,可以编码非编码RNA


非编码RNA--洗白了的“垃圾RNA” - 基因编辑专区 - 生物谷

而且,这些RNA并非没有作用,而是在细胞中扮演了重要的角色

有的科学家预言ncRNA在生物中的意义不亚于蛋白质的重要作用。只是我们目前还处于发现非编码RNA的过程。

简单说一下

RNA可以做以下功能,你会发现,他们很多都是蛋白质具有的功能

a,参与基因的竞争结合

b,引导或者参与基因表达ll

c,作为细胞骨架成分

除此之外,

1,参与细胞自噬调控

2,参与表观遗传调控

3,调节肿瘤中的基因水平

4,参与糖类,脂肪和蛋白质等三大营养物质调控

5,参与染色体组装


更可怕的是,我们以为的非编码RNA,竟然可以编码短肽!(简直狂甩炫酷吊炸天啊)



Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO Journal, April 2014

Toddler: An Embryonic Signal That Promotes Cell Movement via Apelin Receptors. Science, 2014; 343 (6172): 1248636

Anderson D M, Anderson K M, Chang C L, et al. A micropeptide encoded by a putative long noncoding RNA regulates muscle performance[J]. Cell, 2015, 160(4): 595-606.




  

相关话题

  在生物学上女人可以继承香火吗? 
  动物会开车吗? 
  云南天坑里发现 2 个消失百年极危物种,具有哪些意义? 
  蚊卵与孑孓能够耐受咸水吗? 
  不同医生对「吃一小勺癌细胞」的后果看法截然相反,你还觉得医学是科学吗? 
  可以在环境中大量喷洒/涂抹对人无害的芽孢杆菌和真菌之类的来抑制其他可能的有害菌生长吗? 
  为何有134位诺奖得主力挺转基因? 
  石楠花闻起来有精液的味道,为什么很多学校种石楠花? 
  为什么野外动物被冻死的时候,有些会呈站立状态? 
  为什么合弓纲以尿素的形式排出体内含氮废料,而蜥形纲则以尿酸的形式排出? 

前一个讨论
一例一休与前瞻计划在岛内反对的声音很多,为什么蔡英文政府还要强推?长远来看这两项政策真的对台湾有帮助?
下一个讨论
有哪些给人极大心理阴影的非恐怖題材影视作品?





© 2024-04-28 - tinynew.org. All Rights Reserved.
© 2024-04-28 - tinynew.org. 保留所有权利