Top
首页 > 正文

防疫战争: 大数据迁徙追踪技术的全球实践

在《中华人民共和国传染病防治法》中,条款规定:“国家、省级疾病预防控制机构负责对传染病发生、流行以及分布进行监测,对重大传染病流行趋势进行预测……”这类疾病预防控制机构更应当充分运用法律依据,开展更多的大数据技术防控运用。 疫情发生后,工信部还向各大运营商等调度部署了疫情防控大数据支撑服务,要求“运用大数据分析,支撑服务疫情态势研判、疫情防控部署以及对流动人员的疫情监测、精准施策,迫在眉睫”。
发布时间:2020-03-25 09:11        来源:互联网经济杂志 赛迪智库电子信息研究所        作者:麻策 浙江垦丁律师事务所联合创始人

引言

南方周末发表的《买票都实名制了,为何还借媒体找密切接触者》引起了我极大的好奇和困惑。文章报道称:截至1月28日晚,全国至少有117趟火车、35架航班和3条地铁线路正在(通过网络等媒体)紧急寻找确诊患者的同行乘客,这是“因为实名制找人要太多的手续”。为此,2020年1月27日,几位程序员还迅速研发了“2019-nCoV新型肺炎确诊患者相同行程查询工具”。

但是,这种原始的网络找人方式显然仍易产生漏网之鱼,因为疫情非常之时网络信息(包括谣言)太多,即使有人看到了也可能基于各种原因而不上报。我自己也没有想到,浙江的杭州和温州会分别由于湖北人员空降和湖北返工密集原因,突然间成为新的重点防疫区所在。

我的好奇和困惑在于,全球以及中国抗击传染病应该是一项比较成熟的安排,难道全球视野下,没有更具优势的方式进行密切接触者的识别和追踪么?特别是在中国春运人群大迁徙的背景下,有没有方式对传染病迁徙路径进行实时分析并作出疫区预判呢?

本文也仅能对本文所描述的大数据技术方法进行说明,兴许还存在更优的大数据解决方案,不赘言。

一、关于传染流行病学防治

“有效隔离”是传染流行病学防治的第一良药,世界卫生组织在《关于2019新型冠状病毒疫情的突发事件委员会第二次会议的声明》中认为:“只要各国采取强有力的措施,及早发现、隔离和治疗病例,追踪接触者,并提倡针对风险程度采取相应的减少社交接触的措施,仍然有可能阻断病毒传播。”

而“有效隔离”的重中之重是“有效识别”,包括对(1)确诊病例个体的有效识别;(2)对密切接触者的有效识别;(3)对密切接触者迁徒路径的有效识别。做到了有效的识别,才能进行有效隔离,并有效的调配社会资源,精准预测疫情蔓延所在。

在这次中国新型冠状病毒疫情中,对来自重点防疫区(例如湖北)以及爆发防疫区(例如浙江温州)的人员,目前各省市已经将来自该地区的人员视为“密切接触者”予以重点关注,浙江杭州因为湖北地区航空接收,浙江温州因为湖北返温人员潮出现等原因,疫情严峻形式徒然上升,各地出现了直接劝返,以及对这些迁徙流入的密切接触者进行强制隔离观察的现象。

不过,目前的“有效识别”,似乎仍然停留在直接观察和较为简单初级阶段的识别,例如,对可见的“鄂”字车辆进行严防死守、对身份证显示为湖北籍的重点盘查,对飞自湖北境内的航班进行医学隔离,以及要求所有被盘查的人员主动申报是否来自湖北,同乘交通工具人员的主动上报等等。

但这一招对于那些短暂停留或路过重点防疫区以及爆发防疫区的人员,对提前离开该类防疫区,以及对这些人员沿途以及目的地所在人群的迁徙影响,甚至在特定行政区存在刻意隐瞒疫情等等例外情况下,似乎就不那么有效识别了。随着疫情的变化,密切接触者的范围也会发生比较大的变化。

微信截图_20200325091012

二、移动电话网络CDR大数据

潮落礁起,平常被吹乎神技的大数据技术,在这场防疫之战中似乎并没有任何惊艳于公众的华彩亮相。国外倒是有媒体报道某人工智能公司早在2019年的12月底,就首次利用了新闻报道以及旅行者数据确定了下一步可能会出现新型冠状病毒的地区。不过,我们目前主要依赖于群防群控、地毯式布控,坚信自上而下网格管理的“人定胜天”之道,目前来看,这些传统防治方法确实比所谓的大数据技术来得更靠谱。那么,大数据技术是不是真的无用武之地呢?

至少从全球流行病防控史上来看,有一种大数据技术的应用和作用已经被发现并成熟运用,那就是移动电话网络大数据。

移动电话网络是重叠的无线电覆盖区域的蜂窝,由无数的手机基站塔产生,覆盖范围从几百米到几公里不等。人们在打电话和使用网络时,通过这些基站的蜂窝网络将人们的电话连接到其他电话用户或互联网。我们以前的漫游收费,以及现在当坐着动车高铁穿梭于不同省市时收到的“欢迎到此一游”的识别你所在之处的短信广告,就是基于这个原理而实现。

早在2009年,德国报纸《时代周刊》(Die Zeit)就进行了一项详细的试验,经同意,他们使用德国某政府官员在六个月内的移动电话呼叫详细记录(CDR)数据,详细分析并成功绘制出了该官员六个月内的全部行踪轨迹,包括每天停留的地点、夜晚休息的地点以及和他人的通信(电话和短信)日志。

通过CDR大数据分析,可以有效分析疫区人群或密切接触者的迁徙路径,并据此估计每个地区传染病的严重程度,推断当地居民受到感染的风险,当地行政机关可以据此发布不同等级的风险预警。

微信截图_20200325091027

三、全球传染病抗争简史中的CDR运用

事实上,这种移动电话网络CDR“大数据技术”早已被应用于除了传染病防疫之外的很多人道主义救助之中。例如在土耳其难民融合项目中,350余万迁徙于土耳其的难民中,90%以上早已生活在联合国难民署经营的难民营之外,CDR“大数据技术”被联合国用于难民融合本地化的评估工作。

CDR“大数据技术”还用于分析地区贫困指数,并据此作为精准扶贫的佐证数据。例如,纽约大学布法罗分校的Neeti Pokhriyal使用来自900万个CDR数据在塞内加尔创建了“贫困图”。在该图中,链接的粗细表示区域之间交换的呼叫和文本的数量。圆圈的大小指示总的传入和传出呼叫和文本。

海地地震中的CDR技术运用至今仍令人耳目一新。2010年1月,在造成22.25万人死亡、19.6万人受伤的海地大地震中,CDR“大数据技术”被首次应用于人道主义行动中,用于实时监控震后人群分布情况,以便于社会物资的分配。

地震在当地时间16:50分左右开始,地震造成的恐慌驱使人们大量地离开海地首都太子港,而大量救援物资到达太子港后却不知向何处进行调度分配。当时的Flowminder研究团队联系了海地两家电信运营商,但只有其中一家,即Digicel同意将其CDR数据共享进行研究,Flowminder研究团队对1.92亿个注册呼叫中的190万张SIM卡进行了数据清理和过滤,并从中近乎实时地分析出人员迁移的总体规模和运动趋势。

针对饱受疟疾困扰的肯尼亚,CDR技术用于人口流动的量化。在《手机和疟疾:模拟人类和寄生虫的旅行》研究报告中,研究人员认为:“在许多疟疾流行国家,手机几乎普及了,这为以前所未有的动态规模检查国家人口流动提供了一种新方法。移动电话已在全球范围内迅速采用,它提供了一种独特的方式来随时间推移,跟踪数百万个体并了解疟疾流行人群的动态。使用移动电话作为人类传感器来测量人类活动模式是一个迅速发展的领域。从移徙工人、季节性放牧者,从农村到城市的移民以及难民,在从疟疾到霍乱和艾滋病毒等传染病的传播中都发挥着重要作用。”

微信截图_20200325091039

2009年,墨西哥猪流感(H1N1)疫情暴发,政府于2009年4月实施的控制H1N1流感爆发的措施,包括在4月16日发布第一批H1N1流感病例医疗警报,在4月27日至4月30日关闭学校;并从5月1日至5月5日暂停所有非必要活动。CDR技术及数据被用于分析人员的动向,以便政府作出实时的应对,CDR技术证明了政府的这些措施成功地减少了被病毒感染的人数,并将大流行高峰推迟了两天。

2014年,埃博拉病毒(Ebola)肆虐西非,据世界卫生组织发表数据显示,埃博拉出血热疫情肆虐的利比里亚、塞拉利昂和几内亚等西非三国的感染病例(包括疑似病例)已达19031人,其中死亡人数达到11325人(美国CDC数据),这是被世界卫生组织视为近代最为紧急的国际公共卫生事件。此后,埃博拉病毒又分别于2017-2019年连年曝发,致死率达到50-90%,可谓人类共敌。

2014年,埃博拉病毒在几内亚、塞拉利昂和利比里亚以及向尼日利亚、塞内加尔的迅速传播,可能源发于几内亚一个小村庄的一个18个月大的男孩被蝙蝠感染,另外更是由于当地区域恐慌性迁徙所致。

四、中国的大数据机遇

从CDR大数据技术应用的实践来看,最大的法律障碍在于个人隐私权益的保护和商业数据的共享问题。上述各个典型案例中,各大数据分析机构也不时被各电信运营商排斥和不理睬,无法拿到CDR数据并进行分析。

在中国,个人信息收集使用的的条款,目前还没有得到有效的实践。个人建议,在这次全国疫情契机下,官方机构可以尝试激活“与公共安全、公共卫生、重大公共利益直接相关的”个人信息,并在保障网络数据安全的情况下提供研究使用。

实际上,部分电信运营商确实开始研究和开发了大数据产品。例如联通大数据公司开发的人口大数据产品,表示可以“结合运营商的人员属性、位置、爱好等数据,与政府数据关联融合,提高数据的实时性、准确性,分析工作人口、过路人口、实有人口、人口迁徙、人口热力等情况,及时了解辖区各类人员的变化”。疫情发生后,工信部还向各大运营商等调度部署了疫情防控大数据支撑服务,要求“运用大数据分析,支撑服务疫情态势研判、疫情防控部署以及对流动人员的疫情监测、精准施策,迫在眉睫”。

不过,这些电信运营商在中国非典以来,有没有认识到CDR数据的重要战略意义,以及目前有没有针对传染病这类重大公共卫生事件进行CDR的研究,不得而知。至少从目前来看,这些宝藏型数据可能仍然没有被充分利用,也可能会错过这次全国疫情“赐予”他们的良机。

因此,呼吁行政主管部门能够把这些数据匿名化后,作为政府数据资源开放给更多的研究机构进行研究,用社会的力量,别让疫情的结局只留下灾难和遗憾。

因为更多的可能,在这场新型冠状病毒防疫战争中,中国兴许会对全球传染病防治作出标杆性的历史贡献,中国大数据产业和技术也可能会给全人类创造新的价值图景。

这样的历史机遇,请别让它溜走!

每日必读

专题访谈

合作站点