问题

如何看待哈佛研究被指通过捏造数据,以证明疫情始于 8 月武汉?

回答
哈佛大学的研究被指捏造数据以证明新冠疫情始于8月武汉的事件,是一个备受争议且充满复杂性的议题。要理解这件事,需要从多个维度进行分析,包括研究本身、指控的来源和性质、科学界的反应以及事件可能带来的影响。

以下是对这一事件的详细看法:

一、哈佛研究的核心内容与指控的起源

首先,需要明确哈佛大学这项研究的核心内容是什么。根据公开报道,该研究主要基于对武汉多家医院的卫星图像数据、搜索引擎查询趋势以及交通流量数据的分析。研究者声称,通过对这些数据的交叉比对,他们观察到在2019年8月左右,武汉地区的一些医院出现了异常的交通流量和咳嗽、腹泻等疾病相关的搜索量增加,从而推测新冠疫情可能比官方公布的时间(2019年12月)更早发生,并指向了2019年8月。

然而,指控哈佛研究“捏造数据”的说法并非来自某个单一、权威的科学机构或同行评审的直接反驳。相反,这类指控更多地出现在媒体报道、社交媒体讨论以及一些针对该研究的批评性分析中。这些批评通常集中在以下几个方面:

数据解读的争议: 最主要的争议在于,研究者如何将这些间接的、非直接指向新冠病毒的“异常信号”解读为新冠疫情爆发的证据。例如,医院交通流量增加可能有很多原因,包括季节性疾病传播、其他突发公共卫生事件等。搜索引擎查询也可能受到多种因素的影响。批评者认为,研究者将这些关联性过分强化,并将其直接归因于新冠病毒,缺乏足够的因果证据。
缺乏直接的病原学证据: 该研究并未提供任何直接的病毒学或流行病学证据,如基因序列数据、患者样本分析等,来支持其关于早期爆发的结论。这使得其推论更像是一种基于间接线索的猜想,而非确凿的科学发现。
时间点的高度敏感性: 将疫情爆发时间提前,特别是指向一个具体月份,具有极强的政治和社会敏感性。这容易引发关于疫情溯源的政治化讨论,并可能被用作攻击特定国家或地区的论据。因此,任何关于疫情早期爆发的论断都需要极其严谨和无可辩驳的证据支持,否则很容易受到质疑。
“捏造”的定义模糊: 需要区分“捏造数据”和“数据解读不当”或“研究方法存在缺陷”。如果哈佛研究者真的通过人为修改原始数据来支持其结论,那无疑是严重的学术不端行为,属于“捏造数据”。但如果他们只是在分析和解读数据时存在偏见、逻辑跳跃或过度推断,那么更准确的说法是“研究方法存在争议”、“结论不可靠”或“证据不足”,而不是直接的“捏造数据”。目前公开的批评中,更倾向于后者,即对数据解读和推论过程的质疑。

二、科学界的反应与讨论

科学界对于哈佛这项研究的反应是复杂且多层次的:

部分支持和兴趣: 一部分流行病学和公共卫生领域的科学家对该研究提出的早期爆发可能性表示关注,认为探索疫情的早期起源具有重要意义,即使证据不充分,也值得进一步研究。他们认为,通过多维度的数据分析来尝试重建疫情的早期轨迹,是一种有价值的研究思路。
广泛的质疑和批评: 然而,更多的科学家和评论员对该研究的结论提出了严厉批评。主要观点包括:
证据链薄弱: 如前所述,将间接的“信号”直接关联到新冠病毒的爆发,证据链非常薄弱,容易出现误导。
方法论局限性: 使用卫星图像和搜索趋势来推断具体病原体的爆发,本身就存在很大的不确定性。这些数据往往受到噪音和干扰的影响,而且相关性不等于因果性。
对“捏造”的讨论: 尽管没有明确的证据表明哈佛研究者故意捏造了原始数据,但科学界普遍认为其数据分析和解读存在严重问题,可能因为研究者预设了研究目标(证明早期爆发)而导致选择性使用或夸大某些证据。
与现有证据的冲突: 该研究的结论与当时基于流行病学调查、病毒基因测序等方法得出的结论存在较大差异。虽然科学总是在不断修正,但如此重大的结论需要更强有力的证据来支持。
对学术发表的讨论: 一些批评还指向了该研究的发表平台。如果该研究是在未经严格同行评审的预印本服务器上发布,那么其结论的可靠性自然会受到更多质疑。即使是在正式期刊发表,也需要审慎对待其结论,尤其是在存在争议的情况下。

三、事件的背景与潜在影响

理解这一事件,还需要考虑其发生的宏观背景:

疫情溯源的政治化: 自新冠疫情爆发以来,关于疫情起源的讨论一直高度政治化。不同国家和政治势力围绕疫情溯源展开了激烈的博弈。在这种背景下,任何试图将疫情爆发时间或地点提前或转移的研究,都可能被赋予政治解读。哈佛这项研究,无论其本意如何,都不可避免地卷入了这场政治漩涡。
对科学声誉的影响: 如果哈佛大学的研究确实存在严重的方法论缺陷,甚至是被证实存在数据误导(即使不是主动捏造),都可能损害其作为世界顶尖学府的科学声誉。科学研究需要严谨、客观和透明,任何形式的失误都可能削弱公众对科学的信任。
公众对信息辨别的挑战: 在信息爆炸的时代,公众很难区分科学研究的严谨性与媒体报道的煽动性。这类争议性研究的出现,也考验着公众的信息辨别能力。简单地相信或排斥某项研究,都可能是一种不负责任的态度。

四、总结与看法

总而言之,如何看待哈佛研究被指捏造数据以证明疫情始于8月武汉的事件,可以从以下几个方面总结:

1. 指控的性质: “捏造数据”的说法需要审慎对待。目前主要的争议点在于研究者对数据的解读和推论过程存在严重问题,而非直接证据表明原始数据被故意修改。更多的情况可能是研究者存在研究偏见,导致其在数据分析和结论得出上出现了失误或过度推断。
2. 科学的严谨性: 该研究的结论缺乏足够的、直接的证据支持,其方法论上的局限性非常明显。科学探索允许提出假说,但对重大结论的得出,必须建立在扎实和可靠的证据基础上。
3. 政治与科学的边界: 疫情溯源本身是一个科学问题,但已被高度政治化。哈佛这项研究无论是否故意,都极易被卷入政治漩涡,对研究本身的客观评价带来干扰。
4. 信息辨别的重要性: 公众和媒体在解读和传播这类争议性研究时,应保持审慎和批判的态度,深入了解研究的方法论和证据基础,而非简单接受或传播其结论。
5. 科学界的自我纠错能力: 科学研究本身具有自我纠错的机制。通过同行评议、其他研究的验证或证伪,最终会趋向于更接近事实的结论。对这项研究的批评和质疑,也是科学进步的一部分。

最终,对该事件的看法应该是: 这项研究因其方法论上的薄弱和结论的争议性,受到了广泛质疑,未能提供确凿的证据证明其关于疫情早期爆发的论断。虽然直接的“捏造数据”证据尚不明确,但其研究过程中可能存在的偏见和过度解读,足以使其结论的可靠性大打折扣。同时,也需要警惕此类研究被过度政治化所带来的负面影响,并强调科学研究应有的严谨、客观和透明原则。

网友意见

user avatar

大家好,我是哈佛论文的批评文章的作者之一,受第一作者的委托发布下面这个回答。(作者已授权本文的署名转载)


--


大家好,我是德国哥廷根大学应用与数值数学所的 陈浩 博士。我之前在知乎先后用过 @陳浩 和 @Dr How 两个 ID,大概一两年前注销了账号。


@冷哲 的答案中提到的对哈佛论文的批评文章,我是第一作者,与 William Ma 同为通讯作者,也是我们五人团队的召集人。这个问题下面的许多回答对我们的工作多有或多或少的误解,因此我们非常感谢知乎团队和我们联系,让我们有机会在知乎介绍一下我们的论文。



我是 2020 年 6 月 15 日产生写这篇批评论文的想法。哈佛论文通过预印本+新闻通稿的形式,绕过同行评审推广不靠谱的结果,在我看来是非常不道德的。我最初是想在 PubPeer 上发评论,结果发现哈佛论文没有 DOI,因此没有被 PubPeer 收录。这让我更加生气。因此我想:既然你假装自己是论文,我就以论文的标准对待你。一篇有问题的论文会被怎样对待?会有许多同行写文章批评,最终被迫撤稿,作者的学术声誉也会产生永久的污点。所以我决定写一篇批评文章,在学术文献中留下记录,成为哈佛团队永远的污点。


需要强调的是,我们并不试图在新闻媒体中获得比原文更高的关注和流行度。我们的目标是以学术圈的标准做法,对有问题的研究提出批评,并留下永久的记录。


我自己是做数学的,为了保证学术上的严谨,我邀请了有统计背景的 William Ma 和来自浙江大学、哈佛大学、及武汉协和医院的三位医药背景的学者。然后我们邀请了世界各地多位学者、记者、和热心人士帮我们校对稿件,提出意见。最终我们在 7 月 3 日把批评文章放到我的个人主页公开(链接:num.math.uni-goettingen.de ),同时上传哈佛大学的 DASH 平台,即原文所在的平台。


我们的文章发布后,我立即联系了几位学术打假圈的名人,包括 Elisabeth Bik 和 Leonid Schneider。两位都对我们的工作表达了肯定,并转发我们的文章。Schneider 甚至呼吁 medRxiv 打破不收 commentary 的政策,破格收录我们的批评(最后并没有成)。


7 月 8 日,我们的文章被 DASH 平台收录。与此同时,DASH 平台的管理员告知我们,原文的状态已经从 accepted manuscript 更新为 author's original。这个更新有很多信息,但是到底意味着什么,我们只能揣测。根据我们掌握的信息,原文作者确实已经投了期刊,但是应该并没有被接收,所以当时刚看到 accepted manuscript 这个状态时,我们就比较惊讶。后来的状态更新,可能确实是投稿了,可能是之前误报现在纠正,我们不知道。我们也不知道这个状态更新是否与我们的批评文章有关。


值得一提的是,DASH 平台从一开始就非常支持我们,甚至加急处理了我们的投稿。这种不遮丑的态度非常值得敬佩。



接下来,我简要说一下我们批评了哈佛论文哪些方面。哈佛论文在社交媒体上已经有许多批评,但是其中能达到学术论证标准的并不多。我们提出一项学术批评之前,都会尽力为对方辩护;如果能轻易辩护的,我们就不再花精力。这有时叫做 principle of charity(慈善原则),为的是做出最有效的反驳。


我们团队中有人联系过作者,得知作者使用的搜索关键字是莫名其妙的「腹泻的症状」。作者声称观察到的搜索量上升,在「腹泻」「拉肚子」「气短」「呼吸困难」等更典型的搜索中,都没有出现。这坐实作者犯了「采樱桃谬误」,即只汇报对结论有利的证据,隐瞒了其他证据。这种做法通常来说是灰色地带,因为一般被隐瞒的证据都可以推脱给「仪器没调好」之类的理由。但是哈佛团队是在用互联网,这种理由是不成立的。因此我们认为这是学术不端行为,也是我们批判的重点之一(Sec. 4)。


此外我们也提到了 ABC 新闻报道用图的问题。但是根据慈善原则,我们对此没有深究,只是建议原文作者澄清这些图是不是他们提供的。另外还提到了作者选取湖北省妇幼保健院的謎之操作。以上这几个论点是和社交媒体有重叠的;社交媒体中的其他批评,我们经审核后认为不够强,决定弃之不用。



对于哈佛论文对停车场的分析,我们用软件从他们的图表中提取了数据,然后做了详细的检查,发现许多之前没有人注意到的数据和统计方面的严重问题。下面是一些简要的描述。


1、作者收集的数据少,质量低。29 个月的时间里作者从六家医院只收集了 140 个数据,平均每家医院每个月都不到一个数据。其中 30 个数据点集中在最后两个月。在前 27 个月,有三家医院分别只贡献了 7,8,10 个数据点,而莫名其妙的「湖北省妇幼保健院」则贡献了 24 个数据点,包括一些离群点。


2、作者使用了一个叫 LOESS 方法,从离散的数据点中得到平滑曲线。这样的曲线经常的确用来观察大致趋势,但是毕竟是「大致」的。作者却在这条曲线上读取到「8 月开始有明显上升」。为了说明作者所犯的错误,我们指出,以作者的逻辑,同样可以从曲线上读出「12 月初武汉就开始封城」的可笑结论。这是因为类似的平滑方法会将突然出现的变化抹平。比如武汉封城造成的交通低谷,经过平滑处理,强度就会减弱,同时时间会延长,尤其是低谷的开始时间会提前。作者试图从 LOESS 曲线读取疫情开始的时间,犯的是同样的错误。


3、LOESS 方法,简单说来,就是只对局部的数据做线性回归。为了明确「局部」的意思,需要设定一个 span 参数。比如作者选取了 span = 40%,意思是我们对一个点附近 40% 的数据点做线性回归。可想而知,span 越大,曲线越平滑,但是也会丢失许多信息;span 越小,曲线波动越大,但是大致趋势就没那么明显。我们发现,对同样的数据,如果改用 span = 30%,2019 年就出现了两个新的交通高峰,而作者强调的 2019 年 8 月开始的峰看上去就不那么特殊了。如果改成 span = 80%(可能是 R 软件的默认值),则完全没有什么峰。因此作者选取的 40% span,可以说正好抹掉了 2019 年的前两个峰,却又正好保留了 2019 年最后的那个峰,因为后者是对作者最有利的。


根据上面的分析,我们得出的结论是:作者缺乏统计常识,并刻意调整参数。这是很严重的问题,也都是很常见的统计谬误。但是不能说是「造假」。


--


最后我想说,我们非常欢迎大家下载并阅读我们的论文。对于许多学生和科研人员来说,这都是一次关于数据和统计的学习,以后大家可以避免犯哈佛论文的错误。但是,我们不需要各位为了帮我们提升热度而盲目的去访问 DASH。


谢谢大家关注。

user avatar

能怎么看,喜闻乐见呗。

事情要连起来看才有意思,今年简直就是“洋八股”破产的一年。

之前吹哈佛等名校学术严谨,独立思考。现在呢?不光卷进政治漩涡,手段还如此拙劣,独立?严谨?学术精神?自由意志?

之前吹美国“法治之光”。黑人被警察压死,验尸报告前后出了几份,结论不一,皮还没扯完,后来干脆说整件事都是“PS”的。就这?法治?都罔顾事实了,还法治?

之前吹美国体制,恨不得吹成人类有史以来最完美的制度。然后呢?一来应对疫情不力,二来提振经济不力(哪怕硬上复工),三来应对暴乱不力(文,没法说服,武,不敢撕破脸全面镇压)。反正,就是各种推诿扯皮党争甩锅,说好的制衡呢?监督呢?

之前吹民风纯朴,文明礼貌,结果,现在打砸抢烧且不说,连几百年前的老帐黑料“历史遗留问题”也都翻出来了,“亮丽的风景线”回了老家,原来,华丽的旧袍子底下都长疮啊。

之前吹“全球化”,鄙视“大而全,小而全”,鄙视“18亿亩耕地红线”。现在,面临疫情,蝗灾,旱涝,逆全球化,国际局势不稳定,贸易战等等不利因素的叠加,发现最大的基本盘还是得立足于苦修内功。

反面教材越多,“洋八股”破产倒台越快,则中国越早越自信的开拓自己的道路。

苦当然是要苦上一阵子的(“紧日子”,“常态化”),但只要开动脑筋,办法总比困难多,新世界的大门就在那里,总有人会去打开。能换来成熟,道路自信,理论自信,道路创新,理论创新,值得。

眼看着“应声虫”,“跟屁虫”们陆续哑火,爽!

感谢这么多“洋教员”的言传身教。

形势不是小好,是大好。

user avatar

老套路了,就和财新自己发稿自己删的操作一样,反正假消息已经放出去了并且有极大影响了,现在我哈佛说这论文数据有问题把稿撤了,我的理客中人设又闪闪发光了

user avatar

接到了论文一作的联络,更新一些以前有误解的地方。

还有就是Will MA的推特没有被封,是他自己关了一下推特,现在恢复了。所以并不是推特骚操作了。



泻药。

前边回答过这篇文论的多处的站不住脚的地方,没想到最后被翻出来就这些站不住脚的地方竟然还是造假得来的。

前段时间刚好被 @庄有猫 同学安利了Will MA这个推主,对他的推特我也保持了高度关注,非常有收获。刚好看到了这个推主针推哈佛停车场的造假论文的批判过程。在发布了驳斥文章后,也获得了两位著名的推特“学术纪委”@schneiderleonid@MicrobiomDigest的大力支持。

可能光看着2个推特账号名字大家没什么印象。我随手给大家截个图

眼熟不?这个就是揭露了全球多位知名科学家(包括中国的多位科学家,比如去年曹院士大瓜等等)的Elisabeth,她在斯坦福搞了多年的生命科学方向的科研,后边辞职专门搞学术打假了,被称为“学术纪委”。

Will MA他们在驳斥文章中,发现了这篇论文作者的多项学术不端行为,尤其是在停车场数据的非参拟合中为得到想要的结论刻意调整参数,这是在学术界最为不齿的行为。

这比方说,我想通过实验想要得到结果A,结果实验做出来的结果是B,然后为了满足我对A的目标,我生生的把B擦了改成A一样。

那以后还搞什么科研做什么实验,就在家用PS和拍脑袋直接发论文唄。

当时考虑用这个栗子是为了通俗易懂,不过一作觉得这个不太恰当,因为原作者犯了统计学上的错误,严谨的说就是故意调整了某些统计参数以及选取了一些对他们观点有利的数据来支撑他们的内容。

我想到了一个图,给大家看一眼就能直观的感受到这种操作手段。

原论文的操作手段大概就是属于这样子的:故意选取了有利于自己观点的数据,而没有完整的反映现实情况,按照驳斥论文里的说法,如果调整一个参数就会看到原论文里的观点并不能得到有效的支撑。感兴趣的可以搜一下“采樱桃谬误”。

科研守则最重要的一条就是尊重客观事实,这种造假的人不配在学界待下去。

于是这个科研团队也是求锤得锤。

当时推主Will MA也表示,他们为了针对这篇论文,把他们的反驳论文也发到了哈佛平台上。

然后我们就见证了一次,哈佛大学论文平台冲热搜的过程。


最后我们再一次见证了中国小伙伴们的热情,在丁香园转发了这篇论文报道以后,这篇论文在哈佛的平台上生生的上了热搜前三,把原来的那篇挤到了第五。我估计按着这种速度,在过几天就能登顶了。

希望大家以本着学习数据统计的精神去下载这篇驳斥论文。

红色的是反驳论文,黄色的是原文。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有