科学猫科普
关于昨日哈佛大学武汉出现新冠病毒时间的论文:犯了“先入为主症”和“水土不服症”
发布时间:2020-06-11 来源:科学猫科普 浏览:29

今早看到刷屏的新闻:“哈佛大学医学院一团队提出新冠肺炎可能去年8月末就开始在武汉传播的可能性,外交部回应”。

相关报道如下,美国有线电视新闻网记者:“中方表示病毒溯源问题要由科学专业人士进行研究。哈佛医学院在美国是顶尖的专业团队,你是对他们的研究方式表示质疑,还是需要了解更多情况之后才能作出具体回应?”

华春莹:“你说哈佛医学院是顶尖的,但是国际上还有很多顶尖医学家、疾控专家和顶尖医学杂志,都发表过很多观点。我不是科学家,也不是医学专家,没有资格去评判。但是感觉仅从交通车流量来得出关于病毒的结论,这是常人不可以想象的。假设今天在外交部南楼附近车流量比平时增加了几倍,你能就此得出什么重大结论呢?我觉得这种研究方式非常牵强。

事实上,在病毒源头问题上,针对中国已经有太多的阴谋论,对中国实在是太不公平了。国际社会当务之急是团结合作,尽可能控制疫情蔓延,抢救更多生命。终有一天,真相会大白于天下。中国的牺牲和贡献,值得更加公正、公平、客观的评价。

中国国新办前两天发布的《抗击新冠肺炎疫情的中国行动》白皮书中有大量翔实材料,建议你们认真读一读并大力推荐报道。”

我立刻找来论文仔细的读了一遍:

https://dash.harvard.edu/bitstream/handle/1/42669767/Satellite_Images_Baidu_COVID19_manuscript_DASH.pdf?sequence=3&isAllowed=y

本以为是个多重大的发现,结果读完之后是哭笑不得,真不敢相信这是多个号称多个“世界一流”的团队联合发表的结果,我现在给大家详细解读一下我认为其中的问题。

首先说医院的车辆作为病患人数的统计方法问题,我是个学化学的,但是在裤子大上本科的时候做过两年的大物实验,这已经足够告诉我他们的方法可以说是“无中生有、暗度陈仓、凭空想象、凭空捏造”

下面是文章中给的图:

我看了一下研究方法,说是从谷歌地图中一共找到了2019.1.9-2020.4.30中随机出现的111张图,进行车辆分析,左上角是201810月某一天,中上是201910月某一天,结果作者们说左上有110辆车的图就是“正常“,中间有160辆车的图可能是因为新冠病毒。但凡有点统计知识的人,你们听了之后是什么感想?!一个停车场的车辆统计属于经典的泊松分布问题,110160的波动完全是正常的,事实上,如果定义了110是“正常”车辆,在任何时间截取图片,0-220的波动都是正常的(不懂的去查一下泊松分布,对泊松过程来说100%的波动都是正常的)。而且,通过下图来看,这两张照片已经是最极端的对比了(60%的波动),我还是把机会留给懂得数据科学的人来打他们的脸吧!

难道是这些团队连最基础的统计学知识都没有吗?肯定不是,这其实是个心理学问题,就是那个“你觉得邻居偷了你的斧子,他不管干什么都像是偷过斧子的表现”的经典寓言,也就是先入为主的偏见。英语里也有俗话:“when you have a hammer in hand, everything looks like a nail(当你手里拿着个锤子,你看啥都像钉子)”。所以在偏见面前,科学家们也看到了他们想看的结果,这也是我每次都问学生的一句话:“你发给我的结果是客观的,还是你想看到的?!”

看到这里你觉得有道理?其实不然,作者和我的分析都犯了一个错误(虽然我的分析更科学),那就是做了“真空中的球形鸡”的假设。因为国内大多医院位于老城区,停车位不是病人能够随便使用的,除非情况紧急,这些车位一般只给员工使用。所以,这些车辆八成都是医护人员的,分析他们的车辆不知道有啥意义。即便这个医院大公无私,都给病人用,还有个问题,中国的汽车市场还没有饱和,尤其是这一两年在各种赔本促销、0元购二手车等各种市场手段刺激下,买车的人数激增,车辆和去年相比多完全没有什么值得大惊小怪的。所以说对中国国情不了解也是被打脸的第二个因素,也就是水土不服。

接看看下面,文章中说通过度娘使用cough(对应中文“咳嗽”)和diarrhea(对应中文“痢疾”或者“拉肚子”)索引搜索在2019.9-11月呈现的上升趋势我并没有看到,反而是下降或者是低于往年平均的水平。不知道他们的结果是怎么来的,我觉得又是“无中生有、暗度陈仓、凭空想象、凭空捏造”。

大家可以自己打开网站搜索:http://index.baidu.com/v2/index.html#/

关键词:“痢疾”搜索结果:2019.9-2019.11是下降趋势

关键词:“拉肚子”搜索结果:2019.9-2019.11是下降趋势

关键词:“咳嗽”搜索结果:2019.9-2019.11低于往年平均

总之,在这个信息透明的时代,纸是包不住火的。但是就怕有人打着数据科学的旗号,利用不科学的方法,哗众取宠,最后唯一下场就是被真正的科学和事实打脸。真相只有一个,那就是经得起推敲,让我们拭目以待。



(责任编辑:陈潭)

(版权说明,转载自:科学猫科普公众号)