是的,体现知乎(相对于百度)先进性的时候到了!
楼上的几位包括
@程毅南老师,你们详细地解释了什么叫做幸存者偏差,我没有什么好补充的了。除了程老师举的空战的例子存疑,这个我后面说。
但是,你们都没有去仔细看那篇百度百科对不对~~~
那么,下面,我非常高兴地来贡献一个“以上都不对,看我的!”的答案:
题主所困惑的,不是他即使上网查询也弄不懂幸存者偏差是什么意思(那太蠢了),而是在百度百科中,前后文使用的案例内容是自相矛盾的,见
幸存者偏差_百度百科第一个故事里面,说的是机腹中弹多,机翼中弹少,但是实际上机翼中弹了很难返航。
第二个更加详细的故事里面,则变成了机翼中弹多,“座舱与机尾发动机部位”中弹少,结果和上面相反。
到底特么的哪里中弹多!特么的哪里被打中容易挂啊!(╯‵□′)╯︵┻━┻
于是题主糊涂了。他糊涂不是弄不懂幸存者偏差,而是不明白百度百科的自相矛盾。
为了解决他的问题,我花了一个小时上网查资料,查出一个广泛传播于投资界、经济学界和鸡汤界的这么一个谣言段子,全文如下:
二次世界大战时,美英联军对德国展开了战略大轰炸。由于德国防空力量强大,美英空军损失惨重,国防部找来飞机专家,要求研究战斗机受损情况,对飞机进行改进。专家们检查了执行任务归来的飞机,发现所有飞机的机腹都伤痕累累,于是专家们建议,机腹非常容易受到防空炮火攻击,应该加强机腹的防护。最后国防部的改进要求却是,改进和加强对机翼的防护。因为国防部的一个统计学家发现,能够幸运返航的飞机,机翼都完好无损,这说明,被击中机翼的飞机都坠落了,而仅仅被击中机腹的飞机都返航了,应该加强防护的是机翼,而不是机腹。统计学里将这类因结果导致错误认知的情况,称为“幸存者偏差”。
放狗得知,这个段子在互联网上最早出自09年的某个BLOG上(欢迎各位补充更原始的出处),之后被小范围转载,之后被某财经专栏作家引用后较大范围转载,之后被各类网站大范围转载,并在今年通过读者等大众杂志转载之后达到了传播的高潮,如今你在百度上输入“幸存者偏差”,出来的10000多个结果90%是这个案例。
甚至,在知乎上都有人引用过这个案例:
成功的人都必须有很强的自我意识吗?为了验证这个段子的不靠谱性,我特地问了问北航毕业的军迷同学,其答复曰“你傻逼么,当然是座舱和发动机最重要,机翼算个屁啊!”
好吧,一条好大好大的鱼。
感谢媒体和自媒体们对于知识的传播所做出的贡献,但是你们在引用案例的时候稍微过一下脑子,会让世界更好一点的。
我分析,最初的作者或许搞混了“机翼”和“尾翼”的区别(据说尾翼也是要害部位一旦被击中很难返航这个我不懂请大牛指正),随手写错,之后如蝴蝶效应一般,引发全民的不靠谱。
甚至在本题之中,尽管各位对于幸存者偏差的概念解释的都很好,但是题主的困惑就从这个段子而来,程老师在答题的时候又引用了这个错误的案例内容,那么只会让他更困惑,或者又产生一位不明就里的谣言传播者。
这不是正确的学术态度。
经济学在最近几年越来越有向鸡汤学发展的趋势,不得不说有这些段子的功劳。
下面,是在知乎上应该出现的对该题主的回答:
1. 幸存者偏差的概念,最简单来说就是:统计科目(中弹部位)和样本是否能被纳入统计(返航让你数弹孔)有相关性(打下来就回不来了),所以样本呈现的结果和实际结果存在偏差。用白话说,活下来的才能让你看到,所以那些死掉的真实情况你无从得知,于是你只能看到机翼中弹返航的飞机、和股市里面赚几十倍的股神。
2. 百度百科词条中,第一个关于飞机的案例是错的,它引用了一个广为传播谣言段子,排除了这个关于机翼和机腹的谬误之后,你理解这个概念应该没太大问题。
3. 百度百科虽然和维基一样是大众编辑,志愿者修订,不过做的远没有维基好,这类的冷门概念最好看英文维基,Survivorship bias
4. 不过,即使看着这两个矛盾的案例,也应该能明白作者想表达的幸存者偏差的概念吧。排除阻碍认知模糊信息的技能请题主再多推一点。
5. (本条是私货)不过,还是感谢题主提出的疑惑,其实驾驶舱和机翼哪个对于飞机更要害,并不是一个具备专业知识才能明白的问题。那么多人,在引用别人的话的时候,自己都不会好好读,我个人觉得,这是写文字的人所能做的最蠢的事情没有之一:引用即表明你对这些文字推崇备至,你特么自己都不好好读,骗狗呢!
答题完毕。
知乎的先进性,我来维护。
================================
感谢大家挑的BUG,“发动机在尾翼”这个谬误,是我从百度百科的另一个案例中引用的,原文为:
沃德客气但坚定地说: 「将军,我尊敬你在飞行上的专业,
但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿
最少发现弹孔。」
艾玛,这个段子也获得了广泛的传播,比上一个少一点,因为这个段子还是比较长的。
经过大家的指正,确实没有把发动机装在机尾的,但是同时下面有专业人士贴出的论文中,确实认为机尾和机腹一样属于要害部位,具体的原因有待专业人士解答。
这太可怕了,一个广为传播案例是错的,我用来纠正它的另一个广为传播的案例也是错的。
看你们丫以后还敢再在经济学文章中用飞机做案例不?
我们来看这篇 1943 年的论文吧。
论文背景是,二战时,从战火中返航的飞机的伤痕呈现某种规律,有的部位中弹多,有的部位中弹少。为了提高飞机的防御力,直觉上似乎应该在弹孔密集处加强装甲。
不过这位专家说:到底哪里最需要防护,直觉说了不算,我算给你看。
(Cameron Moll 画的示意图)
这位专家是匈牙利裔犹太人,后来去美国做研究,二战前后达到个人学术成就的顶峰。
此时你是否想起了一头姓冯名诺依曼的超级神犇?
不过这里说的不是冯·诺依曼,而是亚伯拉罕·沃尔德(Abraham Wald)。
沃尔德的名气比冯·诺依曼小一万倍,但在当时神牛辈出的学术圈也不是无名之辈。
诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。
弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」
(沃尔德台词:老乡见老乡,风头全抢光!快把话题转回我的论文)
========
沃尔德的论文题目是:
A Method of Estimating Plane Vulnerability Based on Damage of Survivors
一种根据幸存飞机损伤情况推测飞机要害部位的方法。
上图是正文第一页。开篇是定义参数,推出引理,列出数值分析方法等等。
铺垫了五十五页之后,沃尔德开始代入数据,演示如何计算飞机要害处。他用了一组虚构的数据:
400 架飞机参与轰炸行动,返回 359 架。在返回的这些飞机中, 240 架毫发无损, 68 架中弹 1 发,29 架中弹 2 发, 12 架中弹 3 发, 10 架中弹 4 发。另外还已知飞机的各部位面积及各部位中弹次数,其中发动机部位的弹孔分布最稀疏。但对于没回来的飞机是怎么死的一无所知。
我的第一反应是:这道应用题是不是条件不足?
只了解返航的飞机的情况,完全不知道坠毁的飞机哪里中了弹,没有对照,怎么知道哪个部位是要害呢?
沃尔德毕竟是吃这碗饭的,前五十五页也不是白写的。推算结论如下表:
大意是说,根据这组虚构的数据,得出结论,发动机是最要命的地方,被击中一弹,就有 39% 的概率坠毁。
弹孔最稀疏处,恰恰是要害处,因为没怎么被击中要害的飞机才更有机会返航、进入统计样本。这就是「幸存者偏差」,更多描述请阅读 程毅南关于「幸存者偏差」的答案 。
接下来,沃尔德马上推出升级版算法:只要知道返回的飞机何处中了何种子弹,我就可以算出飞机不同部位被不同武器击中之后的坠毁概率!此处使用的数据仍是虚构的,只为演示算法,结论如下:
沃尔德根据虚构的数据算出:
1. 飞机最怕被20毫米机炮击中发动机,挂掉的概率是 53.4% ;
2. 第二危险的是被7.9毫米机枪击中驾驶舱,有 19.4% 的概率坠毁;
3. 综合来说,发动机是最致命的地方;
4. 综合来说,被20毫米机炮击中掉血最多。
或许有人会说:我用膝盖都能想到发动机和驾驶舱是要害,还要你算给我看?更不用说你的数据还是虚构的了。
不过我的想法是,设计飞机的人不会没有考虑到发动机和驾驶舱的重要性,或许已经给予了充分甚至过分的保护了呢?加厚装甲的代价是损失飞行灵活性,不是想加就加的。
所以在这点上我同意 @欲三更 所说的,凭常识是不足以判断飞机哪里需要加固的。有了计算方法,我们才有办法知道对要害的保护有没有矫枉过正,有没有暴露出新的要害。
========
沃尔德的论文链接:http://cna.org/sites/default/files/research/0204320000.pdf
今人对此文的分析:http://people.ucsc.edu/~msmangel/Wald.pdf
这篇 1943 年的论文的实用价值在于:战场上我们很难找回坠毁的飞机,因而没有办法像 CSI 那样去给飞机验尸,但是不要紧,只要分析返回的飞机,使用统计学方法,就可以推算出那些挂掉的飞机的死因,以助改进飞机的设计。
总之,故事确有真实源头,不过故事中没有提到的是,飞机的要害部位与弹孔分布的关系,不是光凭空口推理的,而是一位优秀的统计学家以平生所学,花了近百页的篇幅,列了一百多个式子推导出来的。
沃尔德的结局令人惋惜。1950 年,四十八岁的他受印度政府邀请,携妻前往印度讲学。不料,航行至印度的尼尔吉里丘陵时,飞机坠毁,沃尔德和妻子都未能成为幸存者。
熊掌百科真是毁人不倦啊,Copy+Paste还能把这么简单的一段对话给弄的混乱不堪。
为什么总有东北小孩在冬天用舌头舔大铁门然后被粘上呢?这个问题就是一个典型的幸存者谬误。
通俗点说就是能让你看到的都满足了某个特质,结果仅仅通过这些来研究就会认为所有的都具备这个特质,但事实上是不具备这个特质的你根本就看不到。
幸存者谬误实在是过分常见了,我可以随便举一大堆:
为什么地铁总是人满为患但还是亏本运营?
因为你总是人满为患的时段去挤地铁。
为什么中国盖的桥,修的路都是动不动就塌了。
因为没塌的不会有人报道。
为什么电视上香港人的房子都那么大,香港人还说房子太小,地太贵。
因为小房子上不了电视,机位没法摆。
为什么外国人都很有钱的样子。
因为没钱的来不了中国让你看见。
为什么新疆人都卖切糕和拉面?
因为卖葡萄和哈密瓜的在新疆。
是时候体现知乎(相对百度)的先进性了!(握拳!)
幸存者偏倚(Survivorship bias)是一种常见的逻辑谬误(所以我说叫“谬误”而不是“偏差”),意思是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。这东西的别名有很多,比如“沉默的数据”、“死人不会说话”等等。
空战的例子这样解释:简单来说,专家根据返航飞机翼部和尾部等位置中弹最多的特点,判断出,如果要强化飞机装甲,应该强化翼部和尾部。但如果仅仅根据返航的飞机上的弹孔分布,来研究该加强飞机的哪部分时,就忽略掉了“飞机被击落”这个筛选的过程。也就是说,能返航的飞机都是躲过防空炮火筛选的、没有受过致命伤的。他们多中弹于翼部和尾部,而油箱和驾驶员仓位完好,这恰恰说明翼部和尾部不是致命伤,不应该加强;而油箱和驾驶员仓位受伤的飞机,基本没有活着回来的,因此油箱和驾驶员仓位才是真正致命的地方,这些部位受伤的飞机却因为被击落而被筛出研究样本,从而变成了“不会说话的死人”,或“沉默的数据”。
(其实我倾向于认为这样的研究确实存在过,请见Patrick Blackett和他的Operational Research,在二战中确实涉及到这样一个对于飞机弹孔的研究:
http:// en.wikipedia.org/wiki/P atrick_Blackett)
再举个例子,如果仅仅通过研究大学生来探究高中教育的问题,那就忽略了高考这个筛选器:没有通过高考、没有考上大学的人,他们才是在高中教育真正出现问题的人,而他们不在大学生的研究样本中。
现在看很多人在知乎上讨论的政治问题、经济问题、文化问题,也有此类逻辑谬误。大多数知乎网友的观点和见闻,大多来自于你们能接触到的,可以在网络传播、可以通过新闻媒体扩散的信息,而那些没什么人传播、上不了新闻,却天天发生的事情,我们都不了解。没有调查就没有发言权,就是这个意思咯。
(查了一下英文的source,对原文飞机中弹位置做了更改,感谢
@周祚)