参考文献

注册

 

发新话题 回复该主题

岑少宇哈佛新冠论文的漏洞,你以为就那么几 [复制链接]

1#
北京扁平疣治疗好医院 http://pf.39.net/bdfyy/bdfhl/210404/8812994.html

6月8日,美国哈佛医学院公布了一篇尚未经过同行评议的论文,在太平洋两岸火了一把。

论文标题是“医院交通与搜索引擎的数据分析,提示年秋季有早期疾病活动”,什么疾病呢?标题没有明说,看下去就知道,当然是全球瞩目的新冠病*肺炎了。

作者们在摘要里说,年夏末秋初,医院的停车量和百度上“咳嗽”的搜索量都增加了,虽然“咳嗽”可能和流感季相符,但“腹泻”更多地是个具有新冠特征的症状,“只和当前流行病相联系”(onlyshowsanassociationwiththecurrentepidemic)。“这些信号都早于12月,突出新颖的数字信息对监测新传染病的价值。”

摘要里还不敢明言新冠就是夏末秋初爆发的,但显然已经明确联系起来。

可我就纳闷啦,有些新冠病人有腹泻,但引起腹泻的病那可多了去了。你们不知道武汉夏末秋初有多热是吧?东西时间放得长了,吃坏肚子很正常啊。

我迫不及待地打开论文,想看看作者们到底是怎么想、怎么做的。

你猜怎么着,他们还真的煞有介事地说:“我们发现,8月对腹泻的搜索有独特的增长,过去的流感季里没有观察到,与咳嗽的搜索趋势也不相符。虽然令人惊讶,但这一发现与最近的一项研究一致,那项研究确认胃肠道症状是新冠的特征之一,可能是现有相当一部分病人的主诉。”

然而,流感季原文用了复数,显得好像以前一直没有,年真的很特别的样子。但图说明确写着,只是年1月到年5月。因此8月仅有年与年比较,根本不说明问题。

我详细看了看方法,作者声称用WebPlotDigitizer在百度指数的页面上提取“咳嗽”与“腹泻”的“相对搜索量”(relativesearchvolume),也没有具体解释什么是“相对搜索量”。也许就只是“搜索指数”的数值吧,毕竟百度并不公布“绝对搜索量”,但为什么不写明呢?

不大了解中国网络的外国研究者,会不会被volueme和index搞糊涂,不方便查验呢?

论文作者后来又在讨论搜索数据时承认:“尽管此方法在复制时间序列时显示有效,但使用自动化工具(提取数据),生成数字图像,确实意味着提取的时间与数值是近似值。”

没想到,观察者网编辑一查验“百度指数”,发现不管怎么理解所谓的“相对搜索量”,“咳嗽”的曲线形态是一致的,但“腹泻”的曲线形态完全不同,根本不存在8月的独特增长。这个问题怎么解释?还能认为只是近似值的问题吗?

蓝线为咳嗽,红线为腹泻

所谓显示“复制时间序列时有效”的参考文献,我看了,是纽约市-年流感季的推特数据,换了一个完全不同的平台就真的有效?事实就是打脸了。

就算按照论文作者的图表,“腹泻”搜索有暴增(第一根虚线的左侧一小段),但同时“咳嗽”搜索在下降。假如真是新冠,必定存在大量有消化道症状、没有呼吸道症状的患者。

但我看了论文作者引用的那项“胃肠道症状”研究,这类患者在新冠病人中占多少?只有3%!这个问题,他们又怎么解释?

不要以为论文引用了什么,就一定是站它的,其实可能只是浑水摸鱼。

“咳嗽”搜索的问题,当然也不攻自破。只要看看作者自己的图片,就能发现,年流感季的“咳嗽”搜索,迅猛增长发生的月份比年流感季更早。

更重要的是,每年流感季的时间、强度都不同,单把流感季的相关特征拿来比较,根本无法推断是否有新的疫情发生。更何况只有两年的比较。

论文作者在讨论搜索数据时,自己也坦承“不能给增长的原因下结论”,但又“假设有广泛的社区传播”,明明缺乏严密的逻辑、靠谱的证据,还要如此推论,这是学术还是话术?

剩下的就是停车问题了。论文作者说,“10月和11月医院停车量增加了,‘咳嗽’搜索也增加了”。普通人看了,都知道这是废话,这不是流感季理所当然会有的情况吗?

医院的人数,完全无法和特定疾病相联系,你根本医院是看什么病,就算真的都是呼吸系统疾病,又能说明什么问题呢?

看上去,年的停车量比年相应月份的高,但论文的“结果”部分,只是描述了年的曲线形态,根本没有与年的具体比较,只是说“至年间,医院停车量总体呈增长趋势”,难道自己也对仅仅两年的比较有点心虚?

其实一搜索就能发现,“据武汉交警介绍,武汉市机动车保有量……年年末达到万辆;随后,每年以30万辆左右的速度递增,年年底突破万辆。”停车量整体增长是很正常的。

还有更复杂的,武汉的轨道交通建设也热火朝天。年10月1日,武汉地铁7号线、11号线东段一期开通试运营。12月28日,武汉地铁纸坊线正式开通运行。年2月19日,武汉地铁2号线南延线开通,9月25日,武汉地铁蔡甸线正式开通试运营,11月6日,武汉轨道交通8号线三期开通试运营。

也就是说,两种出行方式的基本情况变化都很大。在具体某一时刻,你根本无法判断机动车用户、轨道交通用户的增减情况。

论文作者里好像有懂中文的呀,这些信息都查不到?是不是查到了也不敢说?因为本来证据就薄弱,如果再承认背景条件变动如此剧烈,这论文就没法看了。

其实论文的方法还有更多问题。作者声称搞了一个全面的医院名单(a

分享 转发
TOP
发新话题 回复该主题