肺炎疫情防控背后,有多少“大数据”在支撑?
春节假期已近尾声,返程高峰即将到来,疫情防控工作进入关键期。1月29日召开的中央应对疫情工作领导小组会议对此做出判断“当前疫情正处于扩散阶段,局部地区有迅速上升趋势”。在此背景下,如何有效防控疫情“返程传播”成为对战疫情的重中之重。
相较于17年前的SARS,此次疫情表现出更强的传播性,感染人数曲线更为陡峭,对于疾病防控提出更高挑战。好在17年来,中国在疫情防控方面已建立了更加完备的制度体系、保障策略、应对措施,信息披露也更加及时透明,再加上大数据等创新科技的快速发展,在疫情防控工作中起到重要作用。
目前已有微信、360等互联网平台上线“确诊患者交通工具同乘查询系统”、“疫情数据实时更新系统”、“发热门诊分布地图”等功能。
一、
在1月28日央视《新闻1+1》,国家卫健委高级别专家组成员李兰娟院士连线白岩松时表示,专家正利用大数据技术梳理感染者的生活轨迹,追踪人群接触史,成功锁定感染源及密切接触人群,为疫情防控提供宝贵信息。
李院士在连线中提到,某位患者曾表示自己并无重点疫区接触史,但经过大数据排查,发现其曾经至少接触过三位来自重点疫区的潜在患病人士。可见大数据技术通过追踪移动轨迹、建立个体关系图谱等,在精准定位疫情传播路径,防控疫情扩散方面的重要作用。
追踪移动轨迹、建立关系图谱,在大数据技术日渐成熟的今天已不是新闻,在位置数据方面,除了航空、铁路、公路、轮渡等交通部门统计的出行数据外,在用户授权的前提下,中国移动、中国联通、中国电信三大运营商基于手机信令能够有效定位用户的手机位置,互联网企业也可以通过APP授权调用用户手机位置数据。
此外,地图、打车等APP提供的移动出行服务,电商、外卖平台等APP内的送货地址数据,以及移动支付位置数据等,也可以作为位置数据的有效补充。而关系图谱则可通过各类社交平台、通信网络、通话记录、转账记录等数据搭建。
将不同时间段的授权位置数据进行纵向串联,能够有效绘制出手机持有者的移动轨迹。这类个体数据,正如李兰娟院士提到的,可以用于追踪被感染者的疾病传播路径、定位感染源,配合关系图谱更可锁定被感染者曾经接触过的人群,以便及时采取隔离、治疗等防控措施,避免疫情更大范围扩散。为防控春运返程高峰时可能发生的传染事件提供有效工具。
而将这些个体数据集合形成的群体数据,则能够清晰显示重要疫区的人员流入及流出方向、动态及规模,如百度、腾讯等互联网企业均已基于授权数据制作此次春运期间的人口迁徙地图,可据此观察各城市的人口流入、流出状况,尤其是重点疫区人口流出方向。
这些数据有利于定位疫情输出的主要区域、预测地区疫情发展态势、预测地区潜在染病人群,为疾病防控部门及地区政府分类制定春运返程计划、有针对性地出台交通管制措施等提供决策支撑。
除此之外,将同一时点不同个体的位置数据进行横向整合,还能够清晰展现出特定时间点曾经到过疫情高风险地区的人群,并可据此监测人群密度及动向。
如某大数据公司以疫情始发地为分析重点,利用位置数据定位自2019年11月起曾经去过疫情始发地的人,为潜在感染者的发现及自我隔离等提供信息参考。而这些人群密度地图、高染病区域地图、地区交通管制措施等数据信息还能为个人规划返程路线提供有效参考。
二、
面对新型冠状病毒肺炎确诊人数的持续增长,大众密切关注疫情的传播态势。
疫情还会传播多久?感染者还会大幅增加吗?哪里感染风险高?何时能够进入安全期?传染源都有哪些?
要解决这些问题,需要找出关键影响因素、分析疫情传播特征、搭建疫情发展模型,这其中大数据可发挥关键作用。
首先是优化数据采集。在大数据技术广泛应用之前,医疗数据采集具有明显的滞后性,这对在疫情传播早期阶段快速获取传播数据、分析疫情传播机理造成制约。而借助于医疗数据联网、各类智能设备数据归集渠道等,大数据时代的疫情传播数据采集更为及时、准确,可定位到个体、某一具体街区等,为疫情发展模型的搭建提供数据基础。
其次是丰富数据维度。除医疗数据外,疫情传播往往还涉及气候温湿度、地质、交通、社会行为、城市卫生等多维度因素影响,大数据技术的发展使得这些影响因素均可以数据形态展示,同时使得多维度、大规模的数据处理成为可能,可实现上万量级的影响因子建模,这极大地丰富了疫情发展模型的分析维度,对于定位疫情传播的关键影响因素,并据此提出针对性防治建议有重要作用。
最后是模型优化训练。海量数据基础为疫情发展模型提供丰富的优化、训练素材,模型的不断迭代对于优化模型参数、提升模型预测精准度有重要意义。
现阶段,北大、西安交通大学、南京医科大学、香港大学以及英国兰开斯特大学等国内外研究团队已运用大数据技术搭建疫情传播模型,基于已感染病例、感染患者增速、感染区域、区域交通网格等因素,对病毒的传染源、传播速度、传播路径、传播风险等进行评估、预测。
三、
疫情在全国范围内的传播引发对医疗物资、生活物资等多维度资源的需求激增,而春节期间有限的生产供应能力难以在短时间内快速满足。基于此,提升物资调配效率,以有限资源保障医疗救助工作顺利开展,是当前疫情防控的重点。
现阶段各类资源需求信息的发布较为分散,以医疗物资保障为例,陆续有医院通过各自网站、媒体、社交平台等对外发布短缺物资清单。
但公布渠道的分散化,不利于防控机构统筹监测,也不利于捐赠者查询,还有可能出现因医院知名度不同而产生的物资获取差异,或重复捐赠等问题,不利于资源有效调配及使用。
基于此,已有志愿者基于公开需求数据爬取等方式建立资源对接平台,如“湖北医疗物资需求信息平台”等,将医疗资源需求按照城市、医院、类别等维度分类呈现,通过数据抓取等技术手段,展示需求物资名称、需求数量、联系方式及物资运输方式等信息,并支持信息查询,同时在后台统计整体需求数据,时时更新。
这有利于物资短缺信息的及时、有效展示,提升资源调配机构及捐赠者的信息获取速度,提高资源配置效率。而针对历史短缺数据的归集整理以及对资源对接时效的统计分析,也可帮助有关部门预测未来资源需求情况,科学筹划下阶段资源供应及调配。
此外还有一些企业及志愿人士,愿意为疫情防治工作提供无偿的服务支持。鉴于此,已有资源对接平台扩大数据爬取范围,将企业、组织、志愿者等在互联网上零散发布的无偿资助信息归集展示,标注联系人、申请条件、服务时间、服务区域等信息。
由于时间限制,目前已上线的无偿服务信息主要集中在交通运输领域,标注联系方式、配送时间、服务区域、申请条件等信息,供医院、交通管制地区居民、大批物资捐赠者等申请使用。除此之外,也有平台归集为医护人员免费提供的酒店、为居民提供的义诊等服务信息,助力疫情防控工作,相信随着时间推移,相关物资对接平台将逐步完善,全国性物资调配平台也有望上线。
四、
新型冠状肺炎疫情来势汹汹,全面考验国家及民众的危机应对能力,与17年前的SARS相比,中国在此次疫情防控工作中展现出了更高的医疗救治水平、更快的防疫反应速度、更透明的信息披露机制、更迅速的数据报送体系,同时将大数据等新一代创新科技,广泛应用于疫情追踪溯源、路径传播、发展模型预测、资源调配等领域。