每天坐在家里看到实时的疫情变化趋势,看到黄线与红线陡峭上升,你是否很恐慌呢?被传染人数何时增长到头呢?
图一:2020年1月30日12点腾讯新闻疫情实时追踪截图
疫情的传播有其必然的生命周期,初期缓慢增长,中期快速增长,后期缓慢增长直至消亡,其最终的结果也是可以预测的,我们可以采用Gompertz模型预测本次新型冠状病毒肺炎的发展趋势。Gompertz模型的基本原理与对2003年北京非典趋势的预测案例参见上一篇博客:https://measures.blog.csdn.net/article/details/104109588。
如果我们采用该方法预测一下当前的新型冠状病毒肺炎的趋势会是如何呢?我们可以尝试一下:
根据国家卫健委发布的官方数据,我们得到下表:
日期 |
序号 |
累计确诊病例数目 |
现有疑似病例数目 |
确诊新增 |
新增疑似 |
合计新增疑似病例人数 |
1月20日0-24时 |
1 |
291 |
54 |
77 |
27 |
54 |
1月21日0-24时 |
2 |
440 |
136 |
149 |
82 |
136 |
1月22日0-24时 |
3 |
571 |
393 |
131 |
257 |
393 |
1月23日0-24时 |
4 |
830 |
1072 |
259 |
680 |
1073 |
1月24日0-24时 |
5 |
1287 |
1965 |
457 |
1118 |
2191 |
1月25日0-24时 |
6 |
1975 |
2684 |
688 |
1309 |
3500 |
1月26日0-24时 |
7 |
2744 |
5794 |
769 |
3806 |
7306 |
1月27日0-24时 |
8 |
4515 |
6973 |
1771 |
2077 |
9383 |
1月28日0-24时 |
9 |
5974 |
9239 |
1459 |
3248 |
12631 |
1月29日0-24时 |
10 |
7711 |
12167 |
1737 |
4148 |
16779 |
备注:1月21日的官方数据缺少武汉的疑似病例数据,我们是根据前后两天新增疑似病例推算补全,可能与实际有误差,但是不会显著影响总体预测结果。
注意在上表中现有疑似病例数目与合计新增疑似病例数量是不相等的,因为现有疑似病例有可能转为确诊病例,也可能不是此病,该数值并非一直增长,在疫情的后期应该是下降的,合计新增疑似病例列是新增疑似病例列的合计,它是递增的,该列代表了曾经判定为疑似病例的人员数量。根据上表可以看到,合计疑似病例有16779人,实际确诊的有7711人,而未确诊的仍然有12167人,后两者的合计并不等于合计疑似病例人员数量。在新浪、腾讯发布的疫情图中并没有合计新增疑似病例人数的趋势曲线,我们对该列画出趋势图如下:
图二 截止到2020年1月29日24时累计疑似病例人数变化趋势
对上述的合计疑似病例数人数采用Gompertz模型进行拟合得到:
参数 最佳估算
---------- -------------
K 44479.8219281314
a 0.000105465175254513
b 0.800181467427765
K为预测的极限值,即疑似病例人数极限值为:44480。
基于上述结果整理图形如下:
图三 采用Gompertz曲线对疑似病例人数的拟合预测(日期:2020年1月30日)
近一步观察,对于累计确诊数与疑似病例人数进行相关性分析,发现二者是强相关的!
图四:累计确诊人数与合计新增疑似病例人数的回归分析
如果将疑似病例人数的极限值44480代入上述的回归方程中,可以计算累计确诊病例人数的95%预测区间:
回归方程:累计确诊病例数目= 304 + 0.4359 合计新增疑似病例人数
变量 设置
合计新增疑似病例人数 44480
拟合值
拟合值 标准误 95% 置信区间 95% 预测区间
19693.2 633.010 (18233.5, 21152.9) (18093.1, 21293.4) XX
即最终累计确诊人数的95%预测区间为(18093, 21293)。
对于预测结果的说明:
1 由于1月20日前的数据没有全国的官方数据,所以我们采用的是1月20号之后的数据。
2 采用Gompertz预测在疫情的中后期预测效果是比较好的,前期有可能误差较大。
3 我们可以每天统计数据持续进行趋势预测以获得更可靠的结果。
4 疑似病例人数并不代表确诊人数!疑似也可能没被传染!原则上确诊人数应该小于疑似人数。疑似的人员也会耗费医疗资源进行观察与护理。
5 随着检测技术的改进,也有可能疑似病例减少,而确诊人数快速增加,甚至没有新增疑似病例,而只有新增确诊病例,此时我们可以对确诊人数进行Gompertz曲线拟合。
6 未知的疫情未来是可怕的,可以预测的疫情未来是可以采取预防措施的。按当前拟合结果进行初步预测,要想控制住疫情,还有至少35天的硬仗要打!不能掉以轻心!未来仍然有很大的不确定性,比如各地是否继续延长放假时间,复工后是否传染会扩大等等,我们可以继续观察趋势的变化。