我有个同学的研究工作就是发现了他导师的一个证明是错误的。于是,他没有拿到他导师的推荐信。
这种事情历史上一再发生。
可能在大家印象中,Lebesgue 已经算是追求“极致严格”的人了,然而他也有出错而且一开始没被发现的时候。Lebesgue 曾“证明” 里面的 Borel 集在 上的投影也是 Borel 集,看上去彷佛很有道理,似乎放到实变习题集里也不会有人反对。然而 1919年,当时还是莫大 Luzin 学生的 Suslin, 发现 Lebesgue 的这个论断,是错的。 Suslin 的研究可以认为是描述集合论的先驱工作之一。
所以,这种题目是不会出现在一般实变内容里的。一般实变教材里面对 Borel 集,也是采取了支支吾吾模棱两可的态度。
只可惜 Suslin 过早离世,而且没有人给他做大新闻。
——————————————————————————————————————————————————
我之前没注意到有人写过这个例子了,而且他应该在集合论方面更专业。
1982年5月1日的美国高考数学卷有这样的一道题——30万人里只有3人做对
咱们先审题,这道题是说,小圆的半径只有大圆的三分之一;如果小圆绕着大圆滚回原位,那么它转了多少圈?
备选项有5个,这个不用翻译大家也能看懂。
先不说答案,你会选什么?
相信很多人会选 B,这道车祸现场题的出题人也是这么考虑的。
如果把大圆圆周拉直,那么它的长度应该是小圆圆周的3倍,所以小圆绕着它会滚3圈对吗?
并不。小圆绕了大圆四分之一的时候,已经转了一圈了——绕大圆一整圈的话,实际上小圆转了4圈。所以正确答案是4,并不在任何一个选项里。
根据出卷方美国大学理事会(College Board)的事后声明,这场美国高考出卷方的答案是错的,而在当时参与这场考试的30万考生里,只有3个考生给出了正确答案。
最后,明明是美国大学理事会做错了,除了那三人,所有人的分数都被扣回去了。30万人里只有3人做对,其实是因为这个现象太不可思议了,因此它在数学上也得到了赐名——硬币悖论(coin paradox)。
如果是用两个半径一模一样的圆来玩的话,我们发现,其中一个绕另一个公转了半圈的时候,实际上它已经自转了360度了。如果绕另一个圆公转一整周,那么它自转了720度,也就是2圈。
这种题有没有套路解法呢?其实是有的,答案就是:公转的圆的圆心画出的圆的半径和这个圆的半径之比。在下图里,就是绿色的这个圆的半径和小圆的半径之比。
所以硬币悖论到底是怎么产生的呢?
大家来画重点了,硬币悖论的本质,在于公转的圆的每一个点画出的路径并不是圆形,而是腰子的形状——肾形线。
这个动图和原题不同,大圆半径是小圆半径的2倍,所以转3圈。
如果两个圆半径相等,那么轨迹就是另外的器官——心脏线。注意是转了2圈。因为其中一个绕另一个公转了半圈的时候,实际上它已经自转了360度了。如果绕另一个圆公转一整周,那么它自转了720度,也就是2圈。
补充另一个类似的反常识的东西,潮汐锁定(或同步自转、受俘自转)发生在重力梯度使天体永远以同一面对着另一个天体;例如,月球永远以同一面朝向着地球。潮汐锁定的天体绕自身的轴旋转一圈要花上绕着同伴公转一圈相同的时间。月球在绕地球公转的同时进行自转,周期27.32166日。月球的自转与公转的周期相等。(相当于不滚动,纯粹“滑动”的情况,也就是说滑动一圈(公转)回来也自转了一圈)
这种同步自转导致一个半球固定不变的朝向伙伴。这种潮汐锁定实际上在太阳系的天体里面是比较多的,比方说,太阳和水星之间,行星和卫星之间,太阳系外的其他的恒星和行星之间,都会有这样的潮汐锁定现象
这本书[1]第七章节证明可能是错的,也可能是作者解释的不清楚:
目前,我也能够跟着书的节奏证出 ,但是我始终没法明白为什么作者能够得出 。这个问题导致我的RH连载系列一拖再拖。
附:书的后两页
很有可能。最近的一个(被修复的)例子是 的证明[1](去年年初的结果,笔者以前写过简介:Climber.pI:量子交互式证明可以验证停机问题吗?),因为跟 Tsirelson problem 有关,这个结果成立会推翻算子代数中的 Connes‘ embedding conjecture。从这个角度来说算是解决了一个数学问题吧。
Vidick 在 的证明公布后,十分欢欣鼓舞地写了篇回忆录[2]。然而几个月后 Vidick 在博客写了另外一段心路历程[3],讲述了 的证明(Vidick 的代表作之一)中的关键技术(quantum low-degree test) 发现问题后,带来的一系列后果——修补以后只能证明稍弱的版本,虽然另一篇代表作(games qPCP)重新变成了公开问题,所幸最后的封顶之作仍然是对的。
这个证明本身其实没有问题,但是问题来自其中一部分(quantum low-degree test)的 soundness proof:
后来 John Wright 在 PhD 毕业后也开始做 ,甚至跟一起做 postdoc 的 Natarajan 证明了 [10](FOCS 19 最佳论文奖)。这里的“E”是 exponential,“EE”指代 double-exponential,如果这个过程能“迭代”下去就能证明 在 里,这也就是去年年初的 ground-breaking result。然而 Wright 在检查合作者们之前的工作时,发现了 bug,并且一路追溯到了 Vidick 13 年的结果(图中的 [Vid16]):
原因[11]是 Vidick 13 年的 soundness proof 用到了归纳法,而在重复若干次数后,由于“错误”累积太多(soundness 就是证明“错误”可能发生,但是可能性很小),归纳假设不再成立。听起来像一个动手亲自算才会发现的问题。这也推翻了 Anand Natarajan 的 PhD thesis 中的大部分结果,然而还好错误被人发现的时候,他几个月前刚刚拿到了 MIT 的教职。。
为了解决这个问题,几位作者们又写了篇冗长的 120+ 页的论文[12],证明了比 Vidick 13 年的结果稍弱的结果,即两个证明者和验证者间通信是 (而不是 的时候)是可行的。这个结果不足以证明 Natarajan-Vidick 证明的 games quantum PCP conjecture[13],但是也可以证明稍弱的版本。而最近的两篇 ground-breaking 的工作的存在的问题可以修复,原来的结果还是对的。
多说几句。这种新加进来的合作者,发现之前的论文有问题的情况,也许是比较常见的吧。有时候新合作者对老文章的审稿强度很可能比审稿人要强(当然靠谱审稿人一眼找到一时修不了的问题的例子也有)。我大半年前因为某些原因放出来某边角料结果,期间也发现合作者们之前论文在中某顶会后新加章节的定义有问题(实际证明的定理比之前的稍弱,我猜测这部分事实上并没有经过同行评议),并且他们非常自信地尝试修复了两三次。。虽然尝试都被我枪毙了。
我觉得这问题下有个匿名用户的回答说的挺对的,至少对于证明主导的领域来说,现状就是大部分结果的命题都是对的,但是证明一般都有各种各样的小问题;命题不对的那些取决于结果重要程度,越重要的结果被人验证过的次数越多,出错概率越小。
当然有可能,菲奖得主Voevodsky 之所以从代数几何转行自动推理、形式化验证,就是因为他的一些工作被人构造出了反例,然后他对自己的很多工作很多证明都产生了怀疑,才开始试图用可靠的机器验证代替不可靠的人工检查。他直到去世都一直在发展形式化验证的工具。
就目前来说,很多复杂的证明并不能排除有问题的可能,比如有限单群分类。一般来说,有简化证明、或者后续理论的发展使得大家有更好的conceptual understanding的数学结论,或者有多个不同角度的证明的定理,可信度会更高一些。只有单个复杂证明的,可信度并不好说。当然这里面的情况非常复杂,需要领域内专家下集体判断。比如Perelman对几何化猜想的证明,后来有几组不同的人写了好几本补全细节的书(比如田、Morgan有一本,曹怀东、朱熹平老师有一本),然后大家对Ricci flow也有了更深入的研究,在几何分析圈子内大家基本是接受这个证明的。还有Wiles证明费马大定理的结果,可以看成Langlands纲领的一个特殊情形。如果整个Langlands纲领的框架建立起来了,那么Wiles的证明会得到更好的理解。对比之下,望月证明ABC猜想的文章,只有孤证,相应理论体系还没有别的应用场景,最关键的是领域内专家还有很大争议,当然不能算被公认的数学结果。
上面说的还是一些大问题,学术圈外媒体也会关心的大结果。如果是不那么著名的论文,那出问题几率更大了。我博士老板曾经说过,他读PhD的年代(60年代末),微分几何的很多已发表论文是错的,很多论证都是hand-waving,他们这帮人改正了其中很多错误。虽然他一直没说到底哪些论文是错的。