大家好,我是哈佛论文的批评文章的作者之一,受第一作者的委托发布下面这个回答。(作者已授权本文的署名转载)
--
大家好,我是德国哥廷根大学应用与数值数学所的 陈浩 博士。我之前在知乎先后用过 @陳浩 和 @Dr How 两个 ID,大概一两年前注销了账号。
@冷哲 的答案中提到的对哈佛论文的批评文章,我是第一作者,与 William Ma 同为通讯作者,也是我们五人团队的召集人。这个问题下面的许多回答对我们的工作多有或多或少的误解,因此我们非常感谢知乎团队和我们联系,让我们有机会在知乎介绍一下我们的论文。
我是 2020 年 6 月 15 日产生写这篇批评论文的想法。哈佛论文通过预印本+新闻通稿的形式,绕过同行评审推广不靠谱的结果,在我看来是非常不道德的。我最初是想在 PubPeer 上发评论,结果发现哈佛论文没有 DOI,因此没有被 PubPeer 收录。这让我更加生气。因此我想:既然你假装自己是论文,我就以论文的标准对待你。一篇有问题的论文会被怎样对待?会有许多同行写文章批评,最终被迫撤稿,作者的学术声誉也会产生永久的污点。所以我决定写一篇批评文章,在学术文献中留下记录,成为哈佛团队永远的污点。
需要强调的是,我们并不试图在新闻媒体中获得比原文更高的关注和流行度。我们的目标是以学术圈的标准做法,对有问题的研究提出批评,并留下永久的记录。
我自己是做数学的,为了保证学术上的严谨,我邀请了有统计背景的 William Ma 和来自浙江大学、哈佛大学、及武汉协和医院的三位医药背景的学者。然后我们邀请了世界各地多位学者、记者、和热心人士帮我们校对稿件,提出意见。最终我们在 7 月 3 日把批评文章放到我的个人主页公开(链接:http://num.math.uni-goettingen.de/~hchen/documents/COVID19.pdf ),同时上传哈佛大学的 DASH 平台,即原文所在的平台。
我们的文章发布后,我立即联系了几位学术打假圈的名人,包括 Elisabeth Bik 和 Leonid Schneider。两位都对我们的工作表达了肯定,并转发我们的文章。Schneider 甚至呼吁 medRxiv 打破不收 commentary 的政策,破格收录我们的批评(最后并没有成)。
7 月 8 日,我们的文章被 DASH 平台收录。与此同时,DASH 平台的管理员告知我们,原文的状态已经从 accepted manuscript 更新为 author's original。这个更新有很多信息,但是到底意味着什么,我们只能揣测。根据我们掌握的信息,原文作者确实已经投了期刊,但是应该并没有被接收,所以当时刚看到 accepted manuscript 这个状态时,我们就比较惊讶。后来的状态更新,可能确实是投稿了,可能是之前误报现在纠正,我们不知道。我们也不知道这个状态更新是否与我们的批评文章有关。
值得一提的是,DASH 平台从一开始就非常支持我们,甚至加急处理了我们的投稿。这种不遮丑的态度非常值得敬佩。
接下来,我简要说一下我们批评了哈佛论文哪些方面。哈佛论文在社交媒体上已经有许多批评,但是其中能达到学术论证标准的并不多。我们提出一项学术批评之前,都会尽力为对方辩护;如果能轻易辩护的,我们就不再花精力。这有时叫做 principle of charity(慈善原则),为的是做出最有效的反驳。
我们团队中有人联系过作者,得知作者使用的搜索关键字是莫名其妙的「腹泻的症状」。作者声称观察到的搜索量上升,在「腹泻」「拉肚子」「气短」「呼吸困难」等更典型的搜索中,都没有出现。这坐实作者犯了「采樱桃谬误」,即只汇报对结论有利的证据,隐瞒了其他证据。这种做法通常来说是灰色地带,因为一般被隐瞒的证据都可以推脱给「仪器没调好」之类的理由。但是哈佛团队是在用互联网,这种理由是不成立的。因此我们认为这是学术不端行为,也是我们批判的重点之一(Sec. 4)。
此外我们也提到了 ABC 新闻报道用图的问题。但是根据慈善原则,我们对此没有深究,只是建议原文作者澄清这些图是不是他们提供的。另外还提到了作者选取湖北省妇幼保健院的謎之操作。以上这几个论点是和社交媒体有重叠的;社交媒体中的其他批评,我们经审核后认为不够强,决定弃之不用。
对于哈佛论文对停车场的分析,我们用软件从他们的图表中提取了数据,然后做了详细的检查,发现许多之前没有人注意到的数据和统计方面的严重问题。下面是一些简要的描述。
1、作者收集的数据少,质量低。29 个月的时间里作者从六家医院只收集了 140 个数据,平均每家医院每个月都不到一个数据。其中 30 个数据点集中在最后两个月。在前 27 个月,有三家医院分别只贡献了 7,8,10 个数据点,而莫名其妙的「湖北省妇幼保健院」则贡献了 24 个数据点,包括一些离群点。
2、作者使用了一个叫 LOESS 方法,从离散的数据点中得到平滑曲线。这样的曲线经常的确用来观察大致趋势,但是毕竟是「大致」的。作者却在这条曲线上读取到「8 月开始有明显上升」。为了说明作者所犯的错误,我们指出,以作者的逻辑,同样可以从曲线上读出「12 月初武汉就开始封城」的可笑结论。这是因为类似的平滑方法会将突然出现的变化抹平。比如武汉封城造成的交通低谷,经过平滑处理,强度就会减弱,同时时间会延长,尤其是低谷的开始时间会提前。作者试图从 LOESS 曲线读取疫情开始的时间,犯的是同样的错误。
3、LOESS 方法,简单说来,就是只对局部的数据做线性回归。为了明确「局部」的意思,需要设定一个 span 参数。比如作者选取了 span = 40%,意思是我们对一个点附近 40% 的数据点做线性回归。可想而知,span 越大,曲线越平滑,但是也会丢失许多信息;span 越小,曲线波动越大,但是大致趋势就没那么明显。我们发现,对同样的数据,如果改用 span = 30%,2019 年就出现了两个新的交通高峰,而作者强调的 2019 年 8 月开始的峰看上去就不那么特殊了。如果改成 span = 80%(可能是 R 软件的默认值),则完全没有什么峰。因此作者选取的 40% span,可以说正好抹掉了 2019 年的前两个峰,却又正好保留了 2019 年最后的那个峰,因为后者是对作者最有利的。
根据上面的分析,我们得出的结论是:作者缺乏统计常识,并刻意调整参数。这是很严重的问题,也都是很常见的统计谬误。但是不能说是「造假」。
--
最后我想说,我们非常欢迎大家下载并阅读我们的论文。对于许多学生和科研人员来说,这都是一次关于数据和统计的学习,以后大家可以避免犯哈佛论文的错误。但是,我们不需要各位为了帮我们提升热度而盲目的去访问 DASH。
谢谢大家关注。
能怎么看,喜闻乐见呗。
事情要连起来看才有意思,今年简直就是“洋八股”破产的一年。
之前吹哈佛等名校学术严谨,独立思考。现在呢?不光卷进政治漩涡,手段还如此拙劣,独立?严谨?学术精神?自由意志?
之前吹美国“法治之光”。黑人被警察压死,验尸报告前后出了几份,结论不一,皮还没扯完,后来干脆说整件事都是“PS”的。就这?法治?都罔顾事实了,还法治?
之前吹美国体制,恨不得吹成人类有史以来最完美的制度。然后呢?一来应对疫情不力,二来提振经济不力(哪怕硬上复工),三来应对暴乱不力(文,没法说服,武,不敢撕破脸全面镇压)。反正,就是各种推诿扯皮党争甩锅,说好的制衡呢?监督呢?
之前吹民风纯朴,文明礼貌,结果,现在打砸抢烧且不说,连几百年前的老帐黑料“历史遗留问题”也都翻出来了,“亮丽的风景线”回了老家,原来,华丽的旧袍子底下都长疮啊。
之前吹“全球化”,鄙视“大而全,小而全”,鄙视“18亿亩耕地红线”。现在,面临疫情,蝗灾,旱涝,逆全球化,国际局势不稳定,贸易战等等不利因素的叠加,发现最大的基本盘还是得立足于苦修内功。
反面教材越多,“洋八股”破产倒台越快,则中国越早越自信的开拓自己的道路。
苦当然是要苦上一阵子的(“紧日子”,“常态化”),但只要开动脑筋,办法总比困难多,新世界的大门就在那里,总有人会去打开。能换来成熟,道路自信,理论自信,道路创新,理论创新,值得。
眼看着“应声虫”,“跟屁虫”们陆续哑火,爽!
感谢这么多“洋教员”的言传身教。
形势不是小好,是大好。
老套路了,就和财新自己发稿自己删的操作一样,反正假消息已经放出去了并且有极大影响了,现在我哈佛说这论文数据有问题把稿撤了,我的理客中人设又闪闪发光了
接到了论文一作的联络,更新一些以前有误解的地方。
还有就是Will MA的推特没有被封,是他自己关了一下推特,现在恢复了。所以并不是推特骚操作了。
泻药。
前边回答过这篇文论的多处的站不住脚的地方,没想到最后被翻出来就这些站不住脚的地方竟然还是造假得来的。
前段时间刚好被 @庄有猫 同学安利了Will MA这个推主,对他的推特我也保持了高度关注,非常有收获。刚好看到了这个推主针推哈佛停车场的造假论文的批判过程。在发布了驳斥文章后,也获得了两位著名的推特“学术纪委”@schneiderleonid和@MicrobiomDigest的大力支持。
可能光看着2个推特账号名字大家没什么印象。我随手给大家截个图
眼熟不?这个就是揭露了全球多位知名科学家(包括中国的多位科学家,比如去年曹院士大瓜等等)的Elisabeth,她在斯坦福搞了多年的生命科学方向的科研,后边辞职专门搞学术打假了,被称为“学术纪委”。
Will MA他们在驳斥文章中,发现了这篇论文作者的多项学术不端行为,尤其是在停车场数据的非参拟合中为得到想要的结论刻意调整参数,这是在学术界最为不齿的行为。
这比方说,我想通过实验想要得到结果A,结果实验做出来的结果是B,然后为了满足我对A的目标,我生生的把B擦了改成A一样。
那以后还搞什么科研做什么实验,就在家用PS和拍脑袋直接发论文唄。
当时考虑用这个栗子是为了通俗易懂,不过一作觉得这个不太恰当,因为原作者犯了统计学上的错误,严谨的说就是故意调整了某些统计参数以及选取了一些对他们观点有利的数据来支撑他们的内容。
我想到了一个图,给大家看一眼就能直观的感受到这种操作手段。
原论文的操作手段大概就是属于这样子的:故意选取了有利于自己观点的数据,而没有完整的反映现实情况,按照驳斥论文里的说法,如果调整一个参数就会看到原论文里的观点并不能得到有效的支撑。感兴趣的可以搜一下“采樱桃谬误”。
科研守则最重要的一条就是尊重客观事实,这种造假的人不配在学界待下去。
于是这个科研团队也是求锤得锤。
当时推主Will MA也表示,他们为了针对这篇论文,把他们的反驳论文也发到了哈佛平台上。
然后我们就见证了一次,哈佛大学论文平台冲热搜的过程。
最后我们再一次见证了中国小伙伴们的热情,在丁香园转发了这篇论文报道以后,这篇论文在哈佛的平台上生生的上了热搜前三,把原来的那篇挤到了第五。我估计按着这种速度,在过几天就能登顶了。
希望大家以本着学习数据统计的精神去下载这篇驳斥论文。
红色的是反驳论文,黄色的是原文。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有