百科问答小站 logo
百科问答小站 font logo



你所知道的的统计误用或统计(概率)悖论? 第1页

  

user avatar   zhu-wang-xiao-miao-o 网友的相关建议: 
      

低出生体重悖论(Low birth-weight paradox)

这是从一个与吸烟母亲所生孩子的出生体重和其死亡率有关,且明显自相矛盾的问题中所观察出的悖论[1],基于的事实是:吸烟母亲所生的低出生体重婴儿的死亡率,显著低于非吸烟者母亲所生的低出生体重婴儿。

之前,曾在某篇回答里讲过辛普森悖论(Simpson's paradox)[2],低出生体重悖论,实际上就是辛普森悖论[3]的一个例子,可以说是悖论中的悖论了。

这类悖论,实际上是概率和统计中的一种现象,其中正确的趋势会出现在单独的分组数据当中。但是,当这些组被合并后,正确的趋势开始逐渐消失,甚至是反转了。类似的问题,在社会科学和医学科学统计中也会经常遇到。

现如今,每个人都知道吸烟会导致肺癌,但这在 1950 年代,这并不是那么显而易见的事情,并且花了将近十年的时间来解决这场争论。然而,即使是在吸烟和癌症的争论平息之后,一个令人费解的重大悖论仍然存在。

传统认知上,体重低于一定数值的婴儿被归类为低出生体重儿童,而在特定人群中,低出生体重婴儿的死亡率明显高于其他婴儿;因此,低出生体重率较高的人群的儿童死亡率通常也高于其他人群。

1960 年代中期,有人指出,如果婴儿出生时体重过轻,母亲吸烟似乎对新生儿有益

这种所谓的出生体重悖论,是对正在形成的关于吸烟有害影响的医学共识的重大挑战,并且花了40多年的时间才得以解决,当时,许多人甚至把它看成是出生体重和死亡率之间所独有的矛盾。

事情是这样的,1959年,加州大学伯克利分校的生物统计学家雅各布·耶鲁沙米 (Jacob Yerushalmy) 发起了一项长期公共卫生研究,收集了旧金山湾区 15,000 多名儿童的数据,这些数据包括母亲的吸烟习惯、婴儿出生后第一个月的出生体重和死亡率等信息。

根据调查,出生时体重不足的低出生体重 (Low birth-weight,LBW) 婴儿的死亡率是正常出生体重婴儿的N倍以上,而且吸烟母亲的婴儿出生时平均体重比不吸烟母亲的婴儿轻,一个很自然的推论:这种较低的出生体重 (LBW) 会导致吸烟母亲婴儿出现较差的存活率。

然而,Jacob Yerushalmy的发现是:吸烟母亲的低出生体重婴儿比不吸烟母亲的存活率更高。就好像妈妈抽烟对低体重婴儿的成活有保护作用一样。

很明显,这是错误的结论,Yerushalmy 并没有愚蠢到相信并且宣布这种荒谬的说法,他表示吸烟与死亡率之间没有因果关系,但数据似乎很奇怪且违反直觉。现代流行病学家也认为,吸烟确实会增加婴儿死亡率。

不过,如何解释上述调查数据呢?

从60年代开始,争论便一直不断,直到2006年的一篇研究文章 Birth Weight “Paradox” Uncovered[4] 解释了这个问题,结论是:吸烟者所生婴儿的LBW和死亡率风险高于非吸烟者所生婴儿。

Distribution of birth weights among infants born to smokers and nonsmokers, United States, 1991 (national linked birth/infant-death data, National Center for Health Statistics). The line at 2,500 g indicates the cutoff point used to define low birth weight

但是,在LBW婴儿中,吸烟者所生婴儿的死亡率较低

你可以在下图中看到,死亡率显著的分界线,在2000g左右。(2,500g的线表示用于定义低出生体重的截止点)

Birth-weight-specific infant mortality curves for infants born to smokers and nonsmokers, United States, 1991 (national linked birth/ infant-death data, National Center for Health Statistics)

在LBW婴儿中,吸烟者所生婴儿的死亡率较低,原因何在?

通过使用因果图(Causal diagrams),作者揭开了这个悖论背后的原因

可以看到,吸烟可能有害并会导致 LBW,但还有其他更严重和有害的 LBW 原因,例如遗传缺陷、营养不良,以及等等。(图中“U”指向其它原因,即未测量的风险因素)

如果婴儿的母亲是吸烟者,这可以“解释”其婴儿低出生体重的原因,并且某种程度上排除严重出生缺陷(如遗传缺陷)的可能性;但是,如果母亲不是吸烟者,低出生体重的原因则很大可能是严重的出生缺陷,从而导致更高的死亡率。

当分析按出生体重划分时,这些未测量的风险因素 (U) 的存在,可能会导致吸烟死亡率之间的虚假关联。就好比,经常逆行的人患肺癌的概率低,而常系安全带则会增加癌症死亡率一样,一个统计上的误区。

以上,谢谢

参考

  1. ^ https://en.wikipedia.org/wiki/Low_birth-weight_paradox
  2. ^ https://www.zhihu.com/question/296683966/answer/1662679106
  3. ^ https://zh.wikipedia.org/wiki/%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA
  4. ^ Hernández-Díaz S, Schisterman E F, Hernán M A. The birth weight “paradox” uncovered?[J]. American journal of epidemiology, 2006, 164(11): 1115-1120.



  

相关话题

  如何通俗地理解「蒙特卡洛方法」,它解决问题的基本思路是什么,目前主要应用于哪些领域? 
  二项分布的个位数期望怎么算? 
  你所读的统计学方向,有哪些不错的讲义(Notes)? 
  三扇门的概率问题,直觉为什么会产生问题? 
  多元回归为什么总可以转为多元线性回归? 
  鹈鹕用 6% 概率抽中 2019 年状元签,如何评价 NBA 2019 年的乐透抽签仪式? 
  请问如何证明「X,Y 不相关,则 X,Y 不一定独立」呢? 
  我还是没有完全理解幸存者偏差,有人能解释一下吗? 
  二项分布的个位数期望怎么算? 
  当前政治科学界是如何看待统计学和计量经济学的? 

前一个讨论
DOM-based XSS 与存储性 XSS、反射型 XSS 有什么区别?
下一个讨论
极萨学院冷哲和冷哲是什么关系?





© 2024-11-25 - tinynew.org. All Rights Reserved.
© 2024-11-25 - tinynew.org. 保留所有权利