这个问题科学界吵了近百年。在国内,饶毅和方舟子都为孟德尔辩诬过。但关于其中的细节,感觉还有补充的必要。
为何孟德尔会受到怀疑?因为他的工作实在太过出色。那篇以详实周密的数据和简洁优雅的解释著称的《植物杂交实验》,被公认为超出时代的精彩之作,甚至比40年后再发现时期科学家所做的实验更精确。放在今天来看,达尔文的《物种起源》充满了动人例子,而没有精确的机制,可能都谈不上学术专著。但孟德尔的论文依旧堪称学术写作的标杆。
但过于完美的数据也的确令人疑惑。最早提出疑问的是生物统计学之父费舍尔(著名科普读物《女士品茶》的主角),他注意到孟德尔在检验显性性状的F2代是纯合子(AA)还是杂合子(Aa)时,采用的是通过自交观察F3代的方法。如果F3代均为显性则F2代为纯合子,如果有隐形则为杂合子。但由于对每株F2代只检查10株F3代,所以这里应该有0.056(0.75的10次方)的概率把杂合子误认为纯合子。也就是说对于实验中的600株显性F2代中,应该识别出222.5(200+400×0.0.056)株纯合子,但孟德尔的结果却是近于完美的201株。进一步通过卡方检验分析孟德尔的数据后,费舍尔得出数据与预期偏差的概率为0.99993。“大多数(如果不是全部)的实验数据有假,以便和孟德尔的预计相符。”费舍尔说道。
这组显性F2代纯合子杂合子比例数据是费舍尔怀疑的重点
这一批评引发了持续多年的争议,直到2007年Franklin Allan,A.W.F. Edwards,Daniel Hartl和Daniel Fairbanks在《遗传学》上发表论文并随即出版专著《孟德尔-费舍尔争论的终结》方告一段落。针对费舍尔的主要指控,他们认为,600株F2代不能一概而论,其中200株涉及的性状在F3代幼年即可识别,也就是能够获得超过10株的数据,不适用费舍尔的假设;而对剩余400株而言,孟德尔的结果是137(纯合子)∶263(杂合子),费舍尔的预期为148.4∶251.6,并没有显著差别。特别是其中的100株孟德尔曾得到40∶60的数据,并认为不可靠而再次实验得到35∶65,也就是说200株的结果应为75∶125,和费舍尔的预期74.2∶125.8几乎完全一致!对于费舍尔所认为“太好了以致不可能是真的”的数据,他们也做出了解释。最终得出结论:费舍尔对孟德尔的批评不能成立。
孟德尔的F2代性状分离数据是惊人的好,但与他人的结果相比,这又有多可疑呢?
此外,再发现时期的科学家很快就意识到,遗传因子除了自由组合外,也经常发生连锁。今天我们知道这是由于基因都位于染色体上的缘故。孟德尔观察了7组性状,而豌豆正好有7对染色体。难不成这7组性状恰好处在7条染色体上,才让孟德尔与连锁的发现失之交臂?事实却并非如此:7组性状中控制茎的长度和豆荚形状,以及种子形状和未成熟豆荚颜色的基因分别位于同1条染色体,理应观察得到连锁遗传。不过,孟德尔所论述的多性状杂交试验选用的性状是子叶颜色、种子形状和花的颜色,控制这3组性状的基因恰好位于不同的染色体上。有人猜测,孟德尔或许舍弃了不符合其理论的数据。但更为合理的解释是,孟德尔更关注豆粒本身的性状,而非植株和豆荚的性状,才忽视了连锁现象。考虑到多性状杂交实验中随着性状数增加,难度迅速上升,这是完全可以理解的。
孟德尔实验中性状的基因研究,能发现这些单基因控制的性状是何等的幸运与天才(何风华等,2013)
在孟德尔生前,他的理论从未得到认可。在争取当时著名的植物学家内格里的支持时,孟德尔曾寄给他140包种子希望对方重复。此外还尝试使用内格里所擅长的山柳菊开展遗传实验。但当时所不知道的是,山柳菊时常会无性繁殖,不适合开展杂交实验。在发现山柳菊的遗传与豌豆显著不同后,大为沮丧的孟德尔依然将结果回复给内格里,并在随后发表了相关论文,这也是孟德尔第二篇也是最后一篇植物学论文。一位坦然公开不利于自己理论的研究成果的学者,在没有其他证据的情况下,不应被污以造假或是挑选数据的嫌疑。
撰文/孙天任
本文为撰写“孟德尔:我的时代终将到来”(《科学世界》2017年7期)搜集资料时的杂感。需要补充的是,费舍尔虽然攻击孟德尔的数据,但他对孟德尔的方法和结论都及其赞赏。他曾说道:“从他们的结果来看实验性研究确凿无疑,在表达上毫无缺陷,并且对不止对一个、而是对当前感兴趣的许多问题的理解至关重要。”此外还需要指出,孟德尔是在没有任何统计工具的时代开展研究的,他对于何时停止收集数据、何时重复实验更多是依赖直觉,但这和造假无涉。