来源:体外诊断原料网综合整理自城市数据团、大河网、网络等
日前,一个名为“ 城市数据团”的小程序,测算了全国各地的奥密克戎感染进度。
截止12月18日,全国感染进度100%的城市已累计达17个,其中石家庄市、保定市、甘南藏族自治州、克孜勒苏柯尔克孜自治州均在12日就达到首轮感染峰值。成都市、武汉市等76个市达峰进度已超过50%。
数据来自多方的搜索引擎数据,比如百度、搜狗、头条、医药网站等。
某科技公司首席经济学家陈沁说,很早以前就有类似的技术来预测和估计流感情况。这属于统计学里的 抽样调查法。
本质上是人们感染后,会上网搜索相关症状的解决方法,比如 发烧、咳嗽、头疼等,借助这些 关键词,我们可以看到在短时间内相关搜索数量的快速增加,从而判断群体感染进程。
这样的数据与真实世界有一定的拟合关系,用于实况监测相当有效。
如下图:
搜索指数与新增病例数量高度相关
在这些地区,“發燒”、“fever“、“発熱”等搜索数量有一个明显的波动和达峰过程。
放开管控后,上述地区的指数预测数据与新增数据基本同步,证明了该方法的有效性。
回到国内,我们看看北京、上海、武汉、石家庄等地的数据变化,可以看出,“发烧”的搜索指数的确与当地疫情情形有明显联系。北京、保底、石家庄等地人们在搜索引擎的搜索数据于11月左右迅速上升。
部分城市发烧搜索指数
专家:有一定参考价值
但有优化空间
通过搜索引擎数据建立模型预测疫情走势,该预测数据的参考价值有多大?
“仅通过搜索数据建立起来的预测模型,准确度通常并不高。”专家郭涛告诉小编。
针对不同城市,预测感染何时达到顶峰、退却、第一波进度等,在一定程度上,无论是对公共政策的制定者、政府、还是公众来说,都有一定参考价值,有助于大家了解疫情的走势。
但是从现实角度出发,目前运用搜索引擎,尤其是仅依托于百度的数据,王鹏觉得可能有所失真。
移动互联网时代和PC端时代有差异,首先现在很多人不一定都在手机端搜索,即使手机端的搜索引擎也有很多源,不一定都用百度,国产的其他搜索引擎也很多。
另外,很多人可能不在搜索引擎上进行搜索,也可能在社交平台或短视频平台搜索,所以说相关的搜索数量,数据本身是存在一些问题的。
END返回搜狐,查看更多
责任编辑: