这下真的我上我也行了。
前排声明,本人非相关专业,一名985测绘工程本科生,看完了论文尝试复现,什么精度评定的过程就都省略了,试着模拟出 Maryland 的“零号病人”出现概率分布图,也就是下面这张
首先如论文所说从美国卫生部官方网站下载产品 COVID-19 Diagnostic Laboratory Testing (PCR Testing) Time Series
产品长这样,关键信息是【日期date】【每日新增报告数new_results_reported】【报告类型overall_outcome】,其中报告类型包含【阳性Positive】【阴性Negative】【未知Inconclusive】
经整理后如下,其中最后两行分别是阳性检测率(=阳性检测数/总检测数)与其15天平滑值(前7天+后7天,论文中也是如此)
因为数据量小,因此直接就在Excel中计算了
下图蓝色散点是阳性检测率的原始观测值,黄色线是15天平滑值
和论文中对比一下看看,嗯,完美符合。(下图中的圆点就是上图的平滑值,但是不知道为什么图例上写的是observational data原始观测值)
然后就到了拟合的时间了,看看论文用的什么模型
我超,两个参数的指数函数。。。彳亍
中间有一大段甚至在解释为什么用检测阳性率y(t)(Testing Positive rate)套进现有感染数N(t)的模型中,因为“他们唯一的区别只是相差一个常数倍”。。。彳亍
(这里有一定疑问,疫情初期检测数(分母)波动非常大,检测阳性率并不能真实反映自然界中的感染率,甚至能否用指数函数进行拟合都是一个问题,我没有看到相关的分析,论文默认每天的检测样本相当于是从自然界中随机抽取的样本)
MATLAB打开,输入代码
syms t f=fittype('exp(a+b*t)','independent','t','coefficients',{'a','b'});
嗯,这就是模型
然后按照论文的三个步骤进行处理(用到的是 2020/3/18-2020/4/15 共29天的数据)
第一步:对目标每日阳性率进行15天的平滑处理,以减少随机噪声的影响
第二步:取区间内连续的14天作为拟合数据,使用二参数指数模型得到拟合函数,然后进行精度评定。。。(略)。。。
将参与NAAT计划(也就是参与检测)的人数记为M,检测阳性率为y(t)。如果要求出首例病人出现的时间,就令 y(t)M=1,同理50例、100例。
这里就出现了一个问题,你的M值是多少?论文声称是参与核酸检测的人数(86939),但是经本人验证,论文选用的是总人口数(6045680)。后者大约是前者的70倍,这就导致拟合结果往前推动了三个月。
究竟是无心之过还是想尽一切办法将时间向前推,带着论点找论据,我无从得知。
第三步:以14天为拟合窗口大小,1为步长,在区间内进行滑动。对每个窗口重复步骤2来获得结果t,应用核密度估计得到t的概率分布。
直接用matlab自带函数ksdensity,写成代码就是
for i=1:16 cfun=fit(x(i:i+13),y(i:i+13),f); t_1_expect_Out(i) = startDate + (log(y_1_expect)-cfun.a)/(cfun.b); end [f,xi] = ksdensity(t_1_expect_Out);
其中f是纵坐标概率密度值,xi是横坐标时间
最后进行对概率密度分布进行绘图,并在图中标出最大值所在日期和50%概率所在日期
%最大概率 [m,index] = max(f); maxDate = datestr(xi(index),'yyyy-mm-dd') %50%概率 mid = ksdensity(t_1_expect_Out, 0.5,'function','icdf'); midDate = datestr(mid,'yyyy-mm-dd') %绘图 plot(xi,f) datetick('x','yyyy-mm-dd','keeplimits','keepticks') line([xi(index),xi(index)],[0,m],'linestyle','--','color','r') text(xi(index),m*2/3,maxDate,'color','r','HorizontalAlignment','center') line([mid,mid],[0,m],'linestyle','--','color','b') text(mid,m*1/3,midDate,'color','b','HorizontalAlignment','center')
首先是第一例出现的日期
最大概率出现日期和50%概率日期有3-4天的细微差别,这主要是因为论文最开始对数据进行平滑时,剔除了初期的检测数据,认为它们不可靠。我懒得做了,对结果没有大的差别。
然后是50例和100例的日期概率分布,同样和论文进行对比
同样只有5天左右差别,然后是100例
有3天左右的差别。
所有这一切,都是基于M=6045680,也就是马里兰州人口数的这一错误基础上。如果按照作者本人声称的检测数86939进行计算,“零号病人”出现的时间将晚3个月左右。
由于我既不是医学/生物相关专业,又不是数据处理相关专业的学生,希望有人能够对我这次复现实验提出宝贵的建议。
另外我本人是绝对支持对美国进行的溯源研究与舆论战,但是你得基于事实与科学,不是吗?
一直不能理解,一说起新冠溯源美国,就有一大堆人出来喊实事求是装理中客。一说起西班牙大流感,一说起 Chinese Virus,就没有人喊美国人实事求是了。
为什么美国人可以自信的在根本没有一致定论的情况下就断言新冠起源中国,流感起源西班牙,而中国人每次说新冠可能起源于国外,都变成了「提都不能提的事」,每次一提都会被自己人狂喷?
所以各位还记得关于「武汉医院停车场航拍对比」的那篇论文吗?以匪夷所思的姿势,单凭停车场停车的几张照片就论证了新冠溯源武汉。我tm看了直呼好家伙。可那个时候,知乎上的各位甚至还没现在这么激动。
所以,为什么别人能编文章黑我们,我们没人激动还主动转发,我们编个文章黑别人各位就这么激动,生怕被转发到国外去,难道境外势力的渗透真的有这么严重吗?既然你一眼就能看出这文章是编的,为何要那么高潮,而不去想想为什么这种文章在这种时刻被发表出来?
就这事儿吧,我的看法是:
1,虽然没有确切证据表明新冠溯源美国或者欧洲,但同样也没有确切证据表明新冠溯源中国,所以,既然国外民众以及国家领导人都可以信誓旦旦的说新冠起源中国,那么我们普通民众口嗨说新冠起源美国也是完全合理的。
2,不要真的把国外的普通民众的智商很当回事,如果真能翻译成英文发到世界各地,必定也还是有很多民众相信的。然后,让一部分米国民众对自己的政府表示质疑,这个目的就达到了。
至于让专家相信。。。这种文章本来就没指望让领域内专家相信好吧。
旗鼓相当
iPad刚出现的时候曾经有机会。那时候iPad上是有死亡空间和质量效应等当时3A的正统外传的。独立剧情,贴合触屏游戏的新机制,基本买断没有垃圾抽卡微购物和内嵌广告,好评如潮。还有一批战地和gta换皮游戏,以及无尽之剑系列这种打算一代代把自己发展成手游3A的巨作。
然而游戏厂商、硬件厂商和玩家最终还是看透了彼此。
玩家用钱投票给了一代比一代拉跨的消消乐、抽卡二次元、换皮页游。智能手机与平板行业变得极度内卷和同质化,连3D touch这种增强互动性的功能最终也得让位给更大电池、更高清屏幕和更大摄像机。
游戏厂商则借坡下驴,传统厂商肯搬运换皮阉割旧作已经是大大地有良心了。手游厂商肯像Gameloft一样坚持不懈地出一堆换皮3D射击/赛车也算是非常有良心的了,更多的新兴小制作组则要么靠某个小游戏一飞冲天然后榨干ip等死,要么生产垃圾页游骗钱。东亚则被日本溢出的赌博文化侵略,都开始玩儿抽卡了。
那什么是没良心的厂商呢?那就是腾讯,看到无尽之剑大火,买下无尽之剑,把有系列小说做背景层层递进的三部曲揉在一起,做出个骗充钱、扰乱剧情的垃圾“新作”、然后再把高质量的原作全球下架。无尽之剑也算是彻底死透了。
所以呢,这个问题其实不在于iPad性能怎么样。iPad现在已经能装M1,M1再垃圾iPad pro散热再烂也已经吊打所有消费级手机/平板和一大堆笔记本电脑。再等等几年苹果继续放卫星性能只会更强,但再强又有什么用?已经没人稀得给移动设备造正经的单机买断制游戏了。switch能火是因为switch有任天堂给做游戏供血,换成苹果和索尼来做哪怕动用黑科技把主机显卡塞进去又有什么用?苹果arcade吹了半天不过是个界面清新的4399,索尼有必要把个掌机做到可以威胁ps5的地步吗?
现在的移动端游戏现状就像是2018美国海军建了条核动力大和战列舰一样。一看硬件数据,嚯,吓死个人,700mm主炮,核炮弹,装甲可防御当年大和号贴脸直射。船员个个都是安纳波利斯海军学院的精神小伙儿。就是没人需要他出海打仗了。
两类词的来源不一样。英语的底层是日耳曼语,然后诺曼征服之后又被讲法语的贵族深深影响。
pig这个词来自日耳曼语。现在德语的“猪”也还是pig。饲养动物能直接接触这些活物的基本都是农民。所以他们对动物的用语也就保留下来了。
pork这个词来自法语。古时的肉食者基本非富即贵。他们见到的基本都是烹饪好的熟肉,而平民很少能吃到肉。所以对于肉类的称呼更多地来自于贵族的语言。