Monday, May 25, 2020

蛮族勇士【新冠追踪】美国应无恙——被污染的数据背后

(美股之家,2020-05-24)
        这一篇,是我对美国的新冠病情数据的集中吐槽。美国的新冠数据,遭遇了极严重的污染,想要算出美国现在每周到底有多少新增的新冠病人,简单的去看美国CDC发布的新增确诊数据,是不行的。作为全网首屈一指的数据大师,本文将会尝试清理数据污染,推算出美国较为真实的确诊数据。相信我,本文将会令你们发现真正的数据之美。
        最令人烦躁的事情在于,从45日开始,CDCProbably病例也列入数据统计,也就是将我们惯称为疑似病例的数据,也作为确诊数据发布出来。注意,它这个Probably病例,不仅包含确诊数据,还包括死亡数据。下面给出的是美国Probably病例的定义,CDC官网链接为(https://www.cdc.gov/coronavirus/2019-ncov/cases-updates/cases-in-us.html):
         (英文原文截图,略)
这段话的翻译为:
        一个可能的病例或死亡是由下列情况之一定义的:
        符合临床标准和流行病学证据,但未对COVID-19进行确认性实验室检测
        符合设定的实验室证据以及临床标准或流行病学证据
        符合重要记录标准,但未对COVID19进行确认性实验室测试
        也就是说,美国45日之后的数据口径,类似于我国湖北省在212日那天,将一万多宗“临床确诊”数据纳入确诊数据,在扯淡程度上是完全一样的。并且,我国也还只是纳入了临床确诊数据,美国是连死亡病例中根本没进行过核酸检测,只不过临死前咳嗽了几次的病例,也作为Probably病例纳入了统计。
        对这种数据口径,我实在是不知道应该怎么评价。不说民主党各州无视重复检测的问题,将每一宗核酸检测阳性结果都视为一个新增病人的扯淡之处了,单单这个将疑似病例统统视为确诊病例的问题,美国人自己就把自己的数据给严重污染了。就美国的这种极度扯淡的新冠数据统计模式,也不知道他们哪来的勇气敢嘲笑中国的新冠数据统计不科学。当然了,这事其实也与美国国内剧烈的党争有关,CDC其实是站民主党的,能给特朗普添堵,让大家根本搞不清楚新冠的现状,算是CDC的一种政治抉择。也正因为这样的原因,特朗普跟CDC的专家们也是渐行渐远,两边一步步开始相互对骂,特朗普时不时就威胁说要炒掉CDC的各路专家,这就是原因。
        要理解美国的病情到底发展到什么程度了,唯有无视饱受污染的确诊数据,回头来看真正的阳性检测数据以及就诊数据,这些数据都是CDC挨个数人头的结果,无从污染,CDC即使再有政治倾向,也不敢在这种数据上造假。下面是美国截至第20周(516日)的商业实验室抗体阳性检测数据趋势(按例给出网址:https://www.cdc.gov/coronavirus/2019-ncov/covid-data/covidview/index.html,每次都能给出官方数据来源的做法真的是很酷有没有?),注意,美国有三类实验室可以进行新冠核酸检测,分别是商业实验室、公共卫生实验室以及临床实验室,其中商业实验室承担了最多的检测任务。
         (图表略)
        注意,上面的图,左边的曲线图各位只看那条黑色的线就好了。第十四周美国商业实验室的整体检测的阳性率为23.1%,到第20周下降到了7.9%。右边的表为具体检测数据。即便不计其中的重复检测(一个人可以进行多次检测),截至516日的第20周,美国商业实验室检测出来的阳性病例为70080宗。较第14周峰值的125154宗,降幅高达44.0%。这种降幅本来应该在确诊数据中体现出来,然而美国由于从45日之后将疑似数据也列入确诊数据进行统计,所以居然长期维持每天2万来宗的确诊病例。为了让各位更加清晰的了解美国的确诊数据到底被污染到了什么样的程度,我不辞辛劳的将美国三大实验室的全部阳性检测数据都进行了汇总,与CDC发布的确诊数据进行了比较,见下图。各位,下图将会刷新你们的认知。你们将会认识到,为了帮助民主党在竞选中获胜,CDC无聊到了什么样的地步(顺便说一句,也就是在我这里,各位才能看到如此深刻的数据分析啊):
         (图表略)
        单单第二十周,美国三大实验室合计的阳性检测结果为8.89万例,这其中当然包含有大量的重复检测结果,因为一个病例为了进行确诊方面的验证,有可能进行多次检测,同时,在病人的治疗过程中也会进行多次检测,以了解其病情进展,是否已经痊愈。因此在理论上,纯粹的阳性检测结果,一定会比确诊病例的数据要大,并且是要大得多。然而在美国,这一切神奇的颠倒了过来。第二十周美国CDC发布的确诊病例高达16.37万例,较阳性检测结果数据高出了足足84%。也就是说,即便不考虑重复检测的问题,在第二十周的确诊数据中,也有超过8成是所谓的Probably病例。
        各位,之所以出现这种确诊患者数>阳性检测数的扯淡情况,实在是由于美国式的联邦行政体制造成的。卫生管辖权并不统一归属于联邦政府,而是分散在各州手里。各州委托各类型实验室进行检测,然后由各州卫生部门进行汇总,并在汇总过程中加入它们认定的Probably案例。在此过程中,一方面各实验室无权剔除重复检测案例(在没有统一的人口登记的情况下, 事实上各实验室也缺乏技术手段剔除重复检测的情况);另一方面,联邦政府对于各州卫生部门夸大病情数据的行为,也没有监督权限。如此综合下来,美国的确诊和死亡数据就遭遇了极严重的污染,一天天丧失可信度。
        14-20周,美国三类实验室的合计阳性诊断数为86.87万例,同期CDC发布的新冠确诊数合计为130.61万例,两者之间的差值达到了43.74万例,这个差值,也就是所谓的Probably病例。如果将这部分莫名其妙的数据剔除的话,美国的总体确诊量至少被高估了五成!至于死亡数据被高估了多少,更是无从统计。所以特朗普多次公开发火,要求CDC改变目前的扯淡统计口径,这就是原因。在这里顺手甩一个我国媒体的相关新闻链接:https://baijiahao.baidu.com/s?id=1666652951695591839&wfr=spider&for=pc  ,在文盲式的中文媒体的世界里,特朗普公开质疑CDC的数据统计口径,是其弱智和无能的表现,广大中文媒体根本不理解该质疑背后的原因,当然了,要求它们去理解这么高深的问题,也实在是强人所难。就这样吧。
        接下来的数据,是住院数据,这也是挨个数人头的结果,是无法Probably的,毕竟不可能有一个可能在住院的病人,薛定谔的病人在现实中是不存在的,所以这个数据也是相对可信。我直接放上数据表(链接地址:https://www.cdc.gov/coronavirus/2019-ncov/covid-data/covid-net/purpose-methods.html):
        截至516日的第二十周,根据CDC方面挨个数人头的结果,美国的当期住院总人数只剩下1.51万人,对比其141万的累计确诊人数(我不厌其烦的强调一次,其中至少包含了43.7万的Probably病例),确诊病人的当期住院率低到只有可怜的1.1%。这已经相当于没有住院病患了。各位,你们一定要清楚的认识到,自始自终,美国的医疗系统没有经受任何冲击,即便是所谓的重灾区纽约市,大张旗鼓的邀请了美国海军医疗舰“安慰号”过去,搞得好像病床数特别不够似的。结果安慰号331日到达纽约,51日撤离,统共1000多张床位,总共仅接收了182名患者,船上的500张床位中只有71张被占用。
        而面对这样的住院数据,对于CDC发布的浮夸的死亡数据,我简直无从吐槽。第20周)CDC发布的新冠死亡人数累计为3.83万人(当然,这里面也含有Probably病例),对应当周仅1.51万人的住院人数,这也就意味着一个极其荒谬的结论:每个住院患者都必须死2.5次,死一次之后还要爬起来再死一次,然后还得恢复到半死状态重新死一次,不然根本就死不够人。
        数据说到这里,我们可以对美国现在的实际确诊人数做一个合理推测了。第20周的阳性检测量8.89万例,其中住院病人每周必须进行一次核酸检测,以跟踪病情进展,这里需要扣除1.51万例。剩下的阳性检测数据,我们推定每个确诊病人都会做两次检测,以验证第一次的阳性检测结果。这样算起来,(8.89-1.51)÷2=3.69万例。这大概就是美国第20周的真正的确诊病例数量。对这个推理的结果,我们需要拿出门诊数据来进行验证。如果它与门诊数能够形成对应,在数量级上相一致的话,那就形成了数据上的逻辑链,也就意味着我们挖掘出了被CDC刻意隐藏的真相。
        下图美国的门诊数据,主要是ILI(包含新冠在内的发热病人门诊数据)以及CLI(包含新冠在内的肺炎病人门诊数据)的演变情况(数据链接:https://www.cdc.gov/coronavirus/2019-ncov/covid-data/covidview/05212020/covid-like-illness.html)。注意,门诊数据也是无法夸大的,它同样无法搞出Probably来。
        (图表略)
        在具体数据上,ILI门诊量在第十二周达到峰值的84534宗,到第20周已经下降到11736宗,降幅86%CLI门诊量在第十二周的峰值为107625宗,到第20周已经下降到35359宗,降幅67%。这都是相关病情大幅度缓解的标志。当然了,无论ILI还是CLI,都不光是新冠,这里面还包含了流感和社区型肺炎等疾病。要知道年初原本就是普通感冒、流感和社区型肺炎的高发期,美国每年的流感门诊人数约为100万人,社区型肺炎就诊人数约为50万人。单就第20周而言,CLI+ILI的门诊量合计4.7万宗,考虑到其中的普通感冒、流感和社区型肺炎的存在,真正的新冠病人门诊量,应该就是3万余宗。这个数据,就与我们前面做出的推理相互印证,形成了完整的数据链条。根据我们前面的推理模式,我们可以计算出美国截至第20周(516日)的真实的每周病情发展数据,也就是下表的数据:
         (图表)
        根据推算,从第十四周到第20周,美国的累计实际确诊人数约为34.10万。这才是真正的确诊人数。也唯有在这样的数据之下,我们才能理解,为何第二十周的当期住院人数只有1.51万人。根据世界各国的经验,新冠的重症率约为20%,欧美各国普遍执行重症住院的政策,轻症一般都是在家自我隔离。在此期间美国累计34万人确诊,其中约两成重症,也就是累计约7万人会住院,在7周的时间内这七万病人陆续入院和出院,病房里现在还剩下1.5万人,这才是一个合理的数据。
        在本文的最后,我想要吐槽的是:民主党为了阻止特朗普连任,早已经到了不择手段的地步了,夸大一点新冠确诊数据,根本就不算什么。这几年来民主党针对特朗普的种种动作,通俄指控幼稚得就跟小孩玩泥巴似的;至于通乌克兰的弹劾案,通篇看下来,纯属无稽之谈。民主党各州长现在拿着这套扯淡的数据,坚持不复工,意图以本州经济自杀的方式,阻止特朗普连任,这才是最令人匪夷所思之处。无底线的党争无处不在,强大如美国,也不能免俗啊。呵呵,呵呵,呵呵哒。