问题

有没有可能一个数学证明是错的,然而所有人都没注意到呢?

回答
要说有没有可能一个数学证明是错的,但大家都没发现,那可太有可能了!而且这不是什么新鲜事儿,历史上就发生过不少次。有时候,一个错误的证明能蒙混过关好多年,甚至几十年,让无数聪明脑袋都深陷其中,以为找到了真理。

你想啊,数学证明这东西,看似严谨得就像铁板一块,一步步推导,环环相扣。但你要是仔细琢磨,里面藏着猫腻的可能性可就大了去了。

为什么会出错?

最常见的“幕后黑手”其实就是那些你可能觉得微不足道的小细节。比如:

隐藏的假设: 有时候,一个证明在不经意间就偷偷“预设”了一些条件,而这些条件在某些特殊情况下并不成立。就好像你在推导一个关于三角形的定理,不小心就假设了它是锐角三角形,但其实这个定理对钝角三角形也适用,或者反过来。这种隐藏的假设就像地雷一样,一旦被踩到,整个证明就轰然倒塌。
对特殊情况的忽视: 很多时候,数学家在构建证明时,会自然而然地去考虑大多数常见的情况,但偶尔会漏掉一些“边缘情况”或者“极端情况”。比如,处理数字时,可能会忽略零、负数或者无穷大。一个看似完美的证明,可能就是因为没考虑到某个特殊的数字组合,就成了空中楼阁。
逻辑上的微妙漏洞: 这可能是最“致命”也最难察觉的一种。数学逻辑讲究的是无懈可击的推理链条,但有些逻辑上的“小辫子”可能会藏得很深。比如,一个反证法证明,你设定的反例本身就存在某种我们没能发现的自相矛盾。或者,一个归纳法证明,在“归纳步骤”中,从n到n+1的推导,可能在某个n值之后就失效了,但这个失效点非常隐蔽。
定义上的模糊或者误解: 有时候,一个数学概念本身的定义可能不够清晰,或者在证明过程中,对某个定义的理解出现了偏差。当新的数学分支发展起来,或者更深刻的分析出现时,才可能发现之前的定义存在歧义,导致某些“证明”失效。
计算上的小错误: 尤其是在涉及大量计算或者复杂公式的证明中,一个不起眼的笔误或者计算失误,就可能像滚雪球一样,把整个证明推向错误的方向。当然,现代数学里很少有纯粹靠手工计算的证明了,更多的是逻辑推理,但即便如此,符号的替换、变量的处理也可能出错。

为什么没被发现?

这又是另一个值得深思的问题了。一个错误的证明之所以能“潜伏”这么久,原因也很多:

权威效应: 如果一个证明出自一位德高望重的数学家之手,或者发表在顶级的数学期刊上,大家都会不自觉地对其产生信任。这种“光环效应”会让人们在审阅时更加谨慎,但也可能因为先入为主的观念,而忽视了潜在的问题。
复杂性与抽象性: 很多数学证明本身就极其复杂,需要耗费大量的时间和精力去理解和消化。对于一个普通数学家来说,要想完全独立地、彻底地检查每一个细节,难度非常大。大家往往会倾向于相信前人的工作,然后在此基础上继续研究。
研究领域的窄化: 随着数学的不断发展,各个分支越来越细分。一个数学家可能在自己擅长的领域是大师,但在其他领域可能就不那么熟悉。一个证明如果横跨了多个领域,或者使用了某些不常用的技术,就很可能在某个它不熟悉的环节出现问题,而大家又恰好都不太擅长这个环节。
验证的成本: 想要真正“推翻”一个成熟的证明,需要付出巨大的努力。数学家们更倾向于去解决新的问题,而不是花费大量时间去“挑毛病”。除非某个错误的证明阻碍了后续研究的进行,或者出现了新的证据与之矛盾,否则很多人可能不会主动去质疑它。
巧合与运气: 有时候,一个证明在大多数“常见”或“有代表性”的例子下都是正确的,只是在某些特殊的、极少被测试到的情况下才暴露问题。而恰好,在很长一段时间内,大家的研究方向都没有触碰到那个“雷区”。

历史上的例子

这可不是我瞎说,历史上有很多这样的例子,足以证明这种“潜伏错误”的可能性。

费马大定理(Fermat's Last Theorem)的早期“证明”: 在安德鲁·怀尔斯(Andrew Wiles)最终证明费马大定理之前,有许多数学家都声称自己找到了证明,但后来都被发现有细微的错误,最终无法成立。这些错误的证明,有的也曾经被大家广泛接受和研究过一段时间。
某个关于数的性质的“定理”: 我记得有一个案例,有一个关于素数分布的“定理”,被认为是正确的很多年。后来,随着数学工具的进步和对数论更深入的理解,才发现那个证明中的一个关键步骤,在处理某些非常大的数时,实际上是站不住脚的。
几何学中的某些证明: 在非欧几何出现之前,数学家们围绕着欧几里得几何的平行公理进行了大量的研究和尝试证明,其中一些证明本身也存在逻辑上的瑕疵,只是当时未能被清晰地识别出来。

所以,数学证明看似坚固,但它毕竟是人类智慧的产物,难免会有疏忽。一个错误的证明,就像一个隐藏在深海中的礁石,可能在很长一段时间内无人问津,直到某一天,有一艘大船不小心撞了上去,才揭开它的真实面目。而那个时候,也许已经有无数条小船在这片水域安然无恙地航行过了。

这恰恰也说明了数学研究的魅力所在:它是一个不断自我修正、不断追求真理的动态过程。每一个被发现的错误,虽然会带来短暂的混乱,但最终都将推动数学向更深刻、更严谨的方向发展。

网友意见

user avatar

我有个同学的研究工作就是发现了他导师的一个证明是错误的。于是,他没有拿到他导师的推荐信。

user avatar

这种事情历史上一再发生。

可能在大家印象中,Lebesgue 已经算是追求“极致严格”的人了,然而他也有出错而且一开始没被发现的时候。Lebesgue 曾“证明” 里面的 Borel 集在 上的投影也是 Borel 集,看上去彷佛很有道理,似乎放到实变习题集里也不会有人反对。然而 1919年,当时还是莫大 Luzin 学生的 Suslin, 发现 Lebesgue 的这个论断,是错的。 Suslin 的研究可以认为是描述集合论的先驱工作之一。

所以,这种题目是不会出现在一般实变内容里的。一般实变教材里面对 Borel 集,也是采取了支支吾吾模棱两可的态度。

只可惜 Suslin 过早离世,而且没有人给他做大新闻。

——————————————————————————————————————————————————

我之前没注意到有人写过这个例子了,而且他应该在集合论方面更专业。

user avatar

1982年5月1日的美国高考数学卷有这样的一道题——30万人里只有3人做对


咱们先审题,这道题是说,小圆的半径只有大圆的三分之一;如果小圆绕着大圆滚回原位,那么它转了多少圈?



备选项有5个,这个不用翻译大家也能看懂。



先不说答案,你会选什么?



相信很多人会选 B,这道车祸现场题的出题人也是这么考虑的。

如果把大圆圆周拉直,那么它的长度应该是小圆圆周的3倍,所以小圆绕着它会滚3圈对吗?

并不。小圆绕了大圆四分之一的时候,已经转了一圈了——绕大圆一整圈的话,实际上小圆转了4圈。所以正确答案是4,并不在任何一个选项里。

根据出卷方美国大学理事会(College Board)的事后声明,这场美国高考出卷方的答案是错的,而在当时参与这场考试的30万考生里,只有3个考生给出了正确答案。

最后,明明是美国大学理事会做错了,除了那三人,所有人的分数都被扣回去了。30万人里只有3人做对,其实是因为这个现象太不可思议了,因此它在数学上也得到了赐名——硬币悖论(coin paradox)。

如果是用两个半径一模一样的圆来玩的话,我们发现,其中一个绕另一个公转了半圈的时候,实际上它已经自转了360度了。如果绕另一个圆公转一整周,那么它自转了720度,也就是2圈。

这种题有没有套路解法呢?其实是有的,答案就是:公转的圆的圆心画出的圆的半径和这个圆的半径之比。在下图里,就是绿色的这个圆的半径和小圆的半径之比。

所以硬币悖论到底是怎么产生的呢?

大家来画重点了,硬币悖论的本质,在于公转的圆的每一个点画出的路径并不是圆形,而是腰子的形状——肾形线。

这个动图和原题不同,大圆半径是小圆半径的2倍,所以转3圈。

如果两个圆半径相等,那么轨迹就是另外的器官——心脏线。注意是转了2圈。因为其中一个绕另一个公转了半圈的时候,实际上它已经自转了360度了。如果绕另一个圆公转一整周,那么它自转了720度,也就是2圈。

补充另一个类似的反常识的东西,潮汐锁定(或同步自转、受俘自转)发生在重力梯度使天体永远以同一面对着另一个天体;例如,月球永远以同一面朝向着地球。潮汐锁定的天体绕自身的轴旋转一圈要花上绕着同伴公转一圈相同的时间。月球在绕地球公转的同时进行自转,周期27.32166日。月球的自转与公转的周期相等。(相当于不滚动,纯粹“滑动”的情况,也就是说滑动一圈(公转)回来也自转了一圈)

这种同步自转导致一个半球固定不变的朝向伙伴。这种潮汐锁定实际上在太阳系的天体里面是比较多的,比方说,太阳和水星之间,行星和卫星之间,太阳系外的其他的恒星和行星之间,都会有这样的潮汐锁定现象

原文链接mp.weixin.qq.com/s/bEJH

user avatar

这本书[1]第七章节证明可能是错的,也可能是作者解释的不清楚:

目前,我也能够跟着书的节奏证出 ,但是我始终没法明白为什么作者能够得出 。这个问题导致我的RH连载系列一拖再拖。


附:书的后两页

参考

  1. ^Reassessing Riemann's Paper | SpringerLink https://link.springer.com/book/10.1007/978-3-319-91482-4
user avatar

很有可能。最近的一个(被修复的)例子是 的证明[1](去年年初的结果,笔者以前写过简介:Climber.pI:量子交互式证明可以验证停机问题吗?),因为跟 Tsirelson problem 有关,这个结果成立会推翻算子代数中的 Connes‘ embedding conjecture。从这个角度来说算是解决了一个数学问题吧。

Vidick 在 的证明公布后,十分欢欣鼓舞地写了篇回忆录[2]。然而几个月后 Vidick 在博客写了另外一段心路历程[3],讲述了 的证明(Vidick 的代表作之一)中的关键技术(quantum low-degree test) 发现问题后,带来的一系列后果——修补以后只能证明稍弱的版本,虽然另一篇代表作(games qPCP)重新变成了公开问题,所幸最后的封顶之作仍然是对的。


这个证明本身其实没有问题,但是问题来自其中一部分(quantum low-degree test)的 soundness proof:

  • quantum low-degree test 的 soundness 依赖于 Thomas Vidick 和 Anand Natarajan 在 2018 年证明的 games quantum PCP conjecture[4](笔者以前写过一个系列:Climber.pI:量子 PCP 猜想浅说 (一): 当交互式证明遇上量子纠缠),这也是后者的 PhD Thesis 的主要内容。
  • 而这个证明依赖于几个月前两人的另一个工作[5],即 Raz-Safra 在上世纪九十年代的 classical low-degree test[6] 的 quantum soundness 的证明(因为允许两个证明者之间有纠缠的时候,他们可以做一些经典情形做不到的事情,这意味着有更多 cheating 的方式)。
  • 而这个证明的关键技术可以追溯到 Vidick 在 MIT 做 postdoc 期间的工作[7],对他在 PhD 期间跟 Tsuyoshi Ito 合作的成名作 [8]的改进;即 Ito-Vidick 给出的 protocol 需要三个证明者,而 Vidick 13 年的工作改进到了两个。值得一提的是,后面这个工作在 2016 年被 SIAM Journal on Computing 接收[9]

后来 John Wright 在 PhD 毕业后也开始做 ,甚至跟一起做 postdoc 的 Natarajan 证明了 [10](FOCS 19 最佳论文奖)。这里的“E”是 exponential,“EE”指代 double-exponential,如果这个过程能“迭代”下去就能证明 在 里,这也就是去年年初的 ground-breaking result。然而 Wright 在检查合作者们之前的工作时,发现了 bug,并且一路追溯到了 Vidick 13 年的结果(图中的 [Vid16]):

原因[11]是 Vidick 13 年的 soundness proof 用到了归纳法,而在重复若干次数后,由于“错误”累积太多(soundness 就是证明“错误”可能发生,但是可能性很小),归纳假设不再成立。听起来像一个动手亲自算才会发现的问题。这也推翻了 Anand Natarajan 的 PhD thesis 中的大部分结果,然而还好错误被人发现的时候,他几个月前刚刚拿到了 MIT 的教职。。

为了解决这个问题,几位作者们又写了篇冗长的 120+ 页的论文[12],证明了比 Vidick 13 年的结果稍弱的结果,即两个证明者和验证者间通信是 (而不是 的时候)是可行的。这个结果不足以证明 Natarajan-Vidick 证明的 games quantum PCP conjecture[13],但是也可以证明稍弱的版本。而最近的两篇 ground-breaking 的工作的存在的问题可以修复,原来的结果还是对的。


多说几句。这种新加进来的合作者,发现之前的论文有问题的情况,也许是比较常见的吧。有时候新合作者对老文章的审稿强度很可能比审稿人要强(当然靠谱审稿人一眼找到一时修不了的问题的例子也有)。我大半年前因为某些原因放出来某边角料结果,期间也发现合作者们之前论文在中某顶会后新加章节的定义有问题(实际证明的定理比之前的稍弱,我猜测这部分事实上并没有经过同行评议),并且他们非常自信地尝试修复了两三次。。虽然尝试都被我枪毙了。

我觉得这问题下有个匿名用户的回答说的挺对的,至少对于证明主导的领域来说,现状就是大部分结果的命题都是对的,但是证明一般都有各种各样的小问题;命题不对的那些取决于结果重要程度,越重要的结果被人验证过的次数越多,出错概率越小。

参考

  1. ^ https://arxiv.org/abs/2001.04383
  2. ^ https://mycqstate.wordpress.com/2020/01/14/a-masters-project/
  3. ^ https://mycqstate.wordpress.com/2020/09/29/it-happens-to-everyonebut-its-not-fun/
  4. ^ https://arxiv.org/abs/1801.03821
  5. ^ https://arxiv.org/abs/1710.03062
  6. ^ Raz, Ran, and Shmuel Safra. "A sub-constant error-probability low-degree test, and a sub-constant error-probability PCP characterization of NP." In Proceedings of the twenty-ninth annual ACM symposium on Theory of computing, pp. 475-484. 1997.
  7. ^ https://arxiv.org/abs/1302.1242
  8. ^ https://arxiv.org/abs/1207.0550
  9. ^ https://epubs.siam.org/doi/10.1137/140956622
  10. ^ Natarajan, Anand, and John Wright. "NEEXP is Contained in MIP." In 2019 IEEE 60th Annual Symposium on Foundations of Computer Science (FOCS), pp. 510-518. IEEE, 2019.
  11. ^ http://users.cms.caltech.edu/~vidick/errata.pdf
  12. ^ https://arxiv.org/abs/2009.12982
  13. ^ 当然,这个猜想现在看似乎是某位 initial-stage research 大师在几年前想当然提出的问题。
user avatar

当然有可能,菲奖得主Voevodsky 之所以从代数几何转行自动推理、形式化验证,就是因为他的一些工作被人构造出了反例,然后他对自己的很多工作很多证明都产生了怀疑,才开始试图用可靠的机器验证代替不可靠的人工检查。他直到去世都一直在发展形式化验证的工具。

就目前来说,很多复杂的证明并不能排除有问题的可能,比如有限单群分类。一般来说,有简化证明、或者后续理论的发展使得大家有更好的conceptual understanding的数学结论,或者有多个不同角度的证明的定理,可信度会更高一些。只有单个复杂证明的,可信度并不好说。当然这里面的情况非常复杂,需要领域内专家下集体判断。比如Perelman对几何化猜想的证明,后来有几组不同的人写了好几本补全细节的书(比如田、Morgan有一本,曹怀东、朱熹平老师有一本),然后大家对Ricci flow也有了更深入的研究,在几何分析圈子内大家基本是接受这个证明的。还有Wiles证明费马大定理的结果,可以看成Langlands纲领的一个特殊情形。如果整个Langlands纲领的框架建立起来了,那么Wiles的证明会得到更好的理解。对比之下,望月证明ABC猜想的文章,只有孤证,相应理论体系还没有别的应用场景,最关键的是领域内专家还有很大争议,当然不能算被公认的数学结果。

上面说的还是一些大问题,学术圈外媒体也会关心的大结果。如果是不那么著名的论文,那出问题几率更大了。我博士老板曾经说过,他读PhD的年代(60年代末),微分几何的很多已发表论文是错的,很多论证都是hand-waving,他们这帮人改正了其中很多错误。虽然他一直没说到底哪些论文是错的。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有