百科问答小站 logo
百科问答小站 font logo



百度百科「幸存者偏差」中关于二战飞机的例子,前后解释有些矛盾,是怎么回事? 第1页

  

user avatar   zhou-zuo 网友的相关建议: 
      

是的,体现知乎(相对于百度)先进性的时候到了!

楼上的几位包括

@程毅南

老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。除了程老师举的空战的例子存疑,这个我后面说。

但是,你们都没有去仔细看那篇百度百科对不对~~~

那么,下面,我非常高兴地来贡献一个“以上都不对,看我的!”的答案:

题主所困惑的,不是他即使上网查询也弄不懂幸存者偏差是什么意思(那太蠢了),而是在百度百科中,前后文使用的案例内容是自相矛盾的,见

幸存者偏差_百度百科

第一个故事里面,说的是机腹中弹多,机翼中弹少,但是实际上机翼中弹了很难返航。

第二个更加详细的故事里面,则变成了机翼中弹多,“座舱与机尾发动机部位”中弹少,结果和上面相反。

到底特么的哪里中弹多!特么的哪里被打中容易挂啊!(╯‵□′)╯︵┻━┻

于是题主糊涂了。他糊涂不是弄不懂幸存者偏差,而是不明白百度百科的自相矛盾。

为了解决他的问题,我花了一个小时上网查资料,查出一个广泛传播于投资界、经济学界和鸡汤界的这么一个谣言段子,全文如下:

二次世界大战时,美英联军对德国展开了战略大轰炸。由于德国防空力量强大,美英空军损失惨重,国防部找来飞机专家,要求研究战斗机受损情况,对飞机进行改进。专家们检查了执行任务归来的飞机,发现所有飞机的机腹都伤痕累累,于是专家们建议,机腹非常容易受到防空炮火攻击,应该加强机腹的防护。最后国防部的改进要求却是,改进和加强对机翼的防护。因为国防部的一个统计学家发现,能够幸运返航的飞机,机翼都完好无损,这说明,被击中机翼的飞机都坠落了,而仅仅被击中机腹的飞机都返航了,应该加强防护的是机翼,而不是机腹。统计学里将这类因结果导致错误认知的情况,称为“幸存者偏差”。

放狗得知,这个段子在互联网上最早出自09年的某个BLOG上(欢迎各位补充更原始的出处),之后被小范围转载,之后被某财经专栏作家引用后较大范围转载,之后被各类网站大范围转载,并在今年通过读者等大众杂志转载之后达到了传播的高潮,如今你在百度上输入“幸存者偏差”,出来的10000多个结果90%是这个案例。

甚至,在知乎上都有人引用过这个案例:

成功的人都必须有很强的自我意识吗?

为了验证这个段子的不靠谱性,我特地问了问北航毕业的军迷同学,其答复曰“你傻逼么,当然是座舱和发动机最重要,机翼算个屁啊!”

好吧,一条好大好大的鱼。

感谢媒体和自媒体们对于知识的传播所做出的贡献,但是你们在引用案例的时候稍微过一下脑子,会让世界更好一点的。

我分析,最初的作者或许搞混了“机翼”和“尾翼”的区别(据说尾翼也是要害部位一旦被击中很难返航这个我不懂请大牛指正),随手写错,之后如蝴蝶效应一般,引发全民的不靠谱。

甚至在本题之中,尽管各位对于幸存者偏差的概念解释的都很好,但是题主的困惑就从这个段子而来,程老师在答题的时候又引用了这个错误的案例内容,那么只会让他更困惑,或者又产生一位不明就里的谣言传播者。

这不是正确的学术态度。

经济学在最近几年越来越有向鸡汤学发展的趋势,不得不说有这些段子的功劳。

下面,是在知乎上应该出现的对该题主的回答:

1. 幸存者偏差的概念,最简单来说就是:统计科目(中弹部位)和样本是否能被纳入统计(返航让你数弹孔)有相关性(打下来就回不来了),所以样本呈现的结果和实际结果存在偏差。用白话说,活下来的才能让你看到,所以那些死掉的真实情况你无从得知,于是你只能看到机翼中弹返航的飞机、和股市里面赚几十倍的股神。


2. 百度百科词条中,第一个关于飞机的案例是错的,它引用了一个广为传播谣言段子,排除了这个关于机翼和机腹的谬误之后,你理解这个概念应该没太大问题。


3. 百度百科虽然和维基一样是大众编辑,志愿者修订,不过做的远没有维基好,这类的冷门概念最好看英文维基,Survivorship bias

4. 不过,即使看着这两个矛盾的案例,也应该能明白作者想表达的幸存者偏差的概念吧。排除阻碍认知模糊信息的技能请题主再多推一点。


5. (本条是私货)不过,还是感谢题主提出的疑惑,其实驾驶舱和机翼哪个对于飞机更要害,并不是一个具备专业知识才能明白的问题。那么多人,在引用别人的话的时候,自己都不会好好读,我个人觉得,这是写文字的人所能做的最蠢的事情没有之一:引用即表明你对这些文字推崇备至,你特么自己都不好好读,骗狗呢!

答题完毕。

知乎的先进性,我来维护。

================================

感谢大家挑的BUG,“发动机在尾翼”这个谬误,是我从百度百科的另一个案例中引用的,原文为:

沃德客气但坚定地说: 「将军,我尊敬你在飞行上的专业,
  但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿
  最少发现弹孔。」

艾玛,这个段子也获得了广泛的传播,比上一个少一点,因为这个段子还是比较长的。

经过大家的指正,确实没有把发动机装在机尾的,但是同时下面有专业人士贴出的论文中,确实认为机尾和机腹一样属于要害部位,具体的原因有待专业人士解答。

这太可怕了,一个广为传播案例是错的,我用来纠正它的另一个广为传播的案例也是错的。

看你们丫以后还敢再在经济学文章中用飞机做案例不?


user avatar   ------ 网友的相关建议: 
      

我们来看这篇 1943 年的论文吧。

论文背景是,二战时,从战火中返航的飞机的伤痕呈现某种规律,有的部位中弹多,有的部位中弹少。为了提高飞机的防御力,直觉上似乎应该在弹孔密集处加强装甲。

不过这位专家说:到底哪里最需要防护,直觉说了不算,我算给你看。

(Cameron Moll 画的示意图)

这位专家是匈牙利裔犹太人,后来去美国做研究,二战前后达到个人学术成就的顶峰。

此时你是否想起了一头姓冯名诺依曼的超级神犇?

不过这里说的不是冯·诺依曼,而是亚伯拉罕·沃尔德(Abraham Wald)


沃尔德的名气比冯·诺依曼小一万倍,但在当时神牛辈出的学术圈也不是无名之辈。

诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。

弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」

(沃尔德台词:老乡见老乡,风头全抢光!快把话题转回我的论文)

========

沃尔德的论文题目是:
A Method of Estimating Plane Vulnerability Based on Damage of Survivors
一种根据幸存飞机损伤情况推测飞机要害部位的方法。

上图是正文第一页。开篇是定义参数,推出引理,列出数值分析方法等等。

铺垫了五十五页之后,沃尔德开始代入数据,演示如何计算飞机要害处。他用了一组虚构的数据:

400 架飞机参与轰炸行动,返回 359 架。在返回的这些飞机中, 240 架毫发无损, 68 架中弹 1 发,29 架中弹 2 发, 12 架中弹 3 发, 10 架中弹 4 发。另外还已知飞机的各部位面积及各部位中弹次数,其中发动机部位的弹孔分布最稀疏但对于没回来的飞机是怎么死的一无所知。

我的第一反应是:这道应用题是不是条件不足?
只了解返航的飞机的情况,完全不知道坠毁的飞机哪里中了弹,没有对照,怎么知道哪个部位是要害呢?

沃尔德毕竟是吃这碗饭的,前五十五页也不是白写的。推算结论如下表:

大意是说,根据这组虚构的数据,得出结论,发动机是最要命的地方,被击中一弹,就有 39% 的概率坠毁。

弹孔最稀疏处,恰恰是要害处,因为没怎么被击中要害的飞机才更有机会返航、进入统计样本。这就是「幸存者偏差」,更多描述请阅读 程毅南关于幸存者偏差」的答案

接下来,沃尔德马上推出升级版算法:只要知道返回的飞机何处中了何种子弹,我就可以算出飞机不同部位被不同武器击中之后的坠毁概率!此处使用的数据仍是虚构的,只为演示算法,结论如下:


沃尔德根据虚构的数据算出:
1. 飞机最怕被20毫米机炮击中发动机,挂掉的概率是 53.4% ;
2. 第二危险的是被7.9毫米机枪击中驾驶舱,有 19.4% 的概率坠毁;
3. 综合来说,发动机是最致命的地方;
4. 综合来说,被20毫米机炮击中掉血最多。


或许有人会说:我用膝盖都能想到发动机和驾驶舱是要害,还要你算给我看?更不用说你的数据还是虚构的了。

不过我的想法是,设计飞机的人不会没有考虑到发动机和驾驶舱的重要性,或许已经给予了充分甚至过分的保护了呢?加厚装甲的代价是损失飞行灵活性,不是想加就加的。

所以在这点上我同意 @欲三更 所说的,凭常识是不足以判断飞机哪里需要加固的。有了计算方法,我们才有办法知道对要害的保护有没有矫枉过正,有没有暴露出新的要害。

========

沃尔德的论文链接:cna.org/sites/default/f
今人对此文的分析:people.ucsc.edu/~msmang

这篇 1943 年的论文的实用价值在于:战场上我们很难找回坠毁的飞机,因而没有办法像 CSI 那样去给飞机验尸,但是不要紧,只要分析返回的飞机,使用统计学方法,就可以推算出那些挂掉的飞机的死因,以助改进飞机的设计。

总之,故事确有真实源头,不过故事中没有提到的是,飞机的要害部位与弹孔分布的关系,不是光凭空口推理的,而是一位优秀的统计学家以平生所学,花了近百页的篇幅,列了一百多个式子推导出来的。

沃尔德的结局令人惋惜。1950 年,四十八岁的他受印度政府邀请,携妻前往印度讲学。不料,航行至印度的尼尔吉里丘陵时,飞机坠毁,沃尔德和妻子都未能成为幸存者。


user avatar   Ivony 网友的相关建议: 
      

熊掌百科真是毁人不倦啊,Copy+Paste还能把这么简单的一段对话给弄的混乱不堪。

为什么总有东北小孩在冬天用舌头舔大铁门然后被粘上呢?

这个问题就是一个典型的幸存者谬误。

通俗点说就是能让你看到的都满足了某个特质,结果仅仅通过这些来研究就会认为所有的都具备这个特质,但事实上是不具备这个特质的你根本就看不到。

幸存者谬误实在是过分常见了,我可以随便举一大堆:

为什么地铁总是人满为患但还是亏本运营?

因为你总是人满为患的时段去挤地铁。

为什么中国盖的桥,修的路都是动不动就塌了。

因为没塌的不会有人报道。

为什么电视上香港人的房子都那么大,香港人还说房子太小,地太贵。

因为小房子上不了电视,机位没法摆。

为什么外国人都很有钱的样子。

因为没钱的来不了中国让你看见。

为什么新疆人都卖切糕和拉面?

因为卖葡萄和哈密瓜的在新疆。


user avatar   cheng-yi-nan 网友的相关建议: 
      

是时候体现知乎(相对百度)的先进性了!(握拳!)

幸存者偏倚(Survivorship bias)是一种常见的逻辑谬误(所以我说叫“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。

空战的例子这样解释:简单来说,专家根据返航飞机翼部和尾部等位置中弹最多的特点,判断出,如果要强化飞机装甲,应该强化翼部和尾部。但如果仅仅根据返航的飞机上的弹孔分布,来研究该加强飞机的哪部分时,就忽略掉了“飞机被击落”这个筛选的过程。也就是说,能返航的飞机都是躲过防空炮火筛选的、没有受过致命伤的。他们多中弹于翼部和尾部,而油箱和驾驶员仓位完好,这恰恰说明翼部和尾部不是致命伤,不应该加强;而油箱和驾驶员仓位受伤的飞机,基本没有活着回来的,因此油箱和驾驶员仓位才是真正致命的地方,这些部位受伤的飞机却因为被击落而被筛出研究样本,从而变成了“不会说话的死人”,或“沉默的数据”。

(其实我倾向于认为这样的研究确实存在过,请见Patrick Blackett和他的Operational Research,在二战中确实涉及到这样一个对于飞机弹孔的研究:

en.wikipedia.org/wiki/P

再举个例子,如果仅仅通过研究大学生来探究高中教育的问题,那就忽略了高考这个筛选器:没有通过高考、没有考上大学的人,他们才是在高中教育真正出现问题的人,而他们不在大学生的研究样本中。

现在看很多人在知乎上讨论的政治问题、经济问题、文化问题,也有此类逻辑谬误。大多数知乎网友的观点和见闻,大多来自于你们能接触到的,可以在网络传播、可以通过新闻媒体扩散的信息,而那些没什么人传播、上不了新闻,却天天发生的事情,我们都不了解。没有调查就没有发言权,就是这个意思咯。

(查了一下英文的source,对原文飞机中弹位置做了更改,感谢

@周祚




  

相关话题

  高Ti的infp和普通intp的区别在哪里? 
  中国社会压力是否已经超越了日本? 
  如何看待最近两年国内部分网民对留学生的歧视和恶意? 
  上了大学之后觉得自己什么都做不好,还敏感,每天都不开心,怎么办? 
  如何对R中每一行数据求和? 
  有哪些你以为自己不行了,结果硬撑过去的事情? 
  中国现在的堕胎率是多少 有统计过吗? 
  你遇过哪些概率极小的事? 
  如何看待对鸿星尔克「野性消费」100 天后,该品牌抖音旗舰店现在每天约 1 万人取关? 
  进入社会就意味着一定要吃亏吗,有没有不吃亏的人? 

前一个讨论
柏杨树下数白羊,可否添个下联(上联)?
下一个讨论
一同租房的室友打我的狗狗怎么办?





© 2024-05-18 - tinynew.org. All Rights Reserved.
© 2024-05-18 - tinynew.org. 保留所有权利