logo好方法网

城市内部登革热时空预测方法、系统及电子设备


技术摘要:
本发明涉及一种城市内部登革热时空预测方法,包括:采集城市内部登革热相关数据并进行预处理;构建反映城市内部区域空间关系的图结构;选择用于登革热时空预测的输入特征;根据预处理后的城市内部登革热相关数据、构建的图结构、选择的输入特征,对GCN模型进行构建与训  全部
背景技术:
近几十年来,作为一种蚊媒传播传染病,登革热(dengue  fever)已在热带与亚热 带地区流行,尤其是新加坡、马来西亚等东南亚国家和地区。在中国,处于亚热带地区的广 东省尤其是广州市作为经济发达、贸易活跃和人员流动频繁的地区,每年夏秋季节均会受 登革热病毒侵袭。广州市2014年登革热病例多达三万七千多例,对居民生命健康产生了较 严重的威胁。 在目前尚缺有效疫苗的情况下,媒介控制(如喷洒灭蚊剂消除成蚊、清除伊蚊孳生 地等)仍然是登革热防控的主要方式。在此背景下,对登革热未来发病数量和发病位置进行 准确预测预警成为防控的关键。 目前已存在不少登革热预测预警的相关研究,研究者主要基于传统统计模型和机 器学习模型对研究区域未来的登革热病例数量进行预测。然而,目前的研究都是对国家、州 (省份)或城市未来一段时段(如1周、2周、1个月等)的病例数进行整体时序预测,但对城市 内部进行精细空间尺度(如乡镇/街道行政)的预测却较为鲜见。城市内部精细空间尺度的 登革热预测颇具挑战性,其主要原因在于城市人口密集而内部人口流动频繁,疾病在城市 内部区域之间的传播更为迅速,对每个区域单独建模进行预测容易忽视区域之间的空间关 系而无法达到较好的预测效果。
技术实现要素:
有鉴于此,有必要提供一种城市内部登革热时空预测方法、系统及电子设备。 本发明提供一种城市内部登革热时空预测方法,该方法包括如下步骤:a.采集城 市内部登革热相关数据并进行预处理,所述城市内部登革热相关数据包括:所研究城市的 登革热病例数据、气象数据、人口分布数据、乡镇矢量文件;b.构建反映城市内部区域空间 关系的图结构;c.选择用于登革热时空预测的输入特征;d.根据预处理后的城市内部登革 热相关数据、构建的图结构、选择的输入特征,对GCN模型进行构建与训练。 其中,该方法还包括步骤e:对所述GCN模型的预测性能进行评估。 所述的步骤a具体包括: 对采集的登革热病例数据预处理:将病例家庭住址转为经纬度坐标;确定每个病 例所在乡镇;根据每个病例的发病日期,统计每个周次每个乡镇的发病病例数量,构成W*N 的病例数量矩阵,W为周次数量,N为乡镇数量; 对采集的气象数据预处理:获取城市内所有气象观测站所记录的每日平均温和降 雨量,使用克里金法分别对其进行空间插值;将插值后的数据分周次聚合至乡镇级别,统计 每个周次每个乡镇的平均温和累积降雨量,构成W*N的平均温矩阵和累积降雨量矩阵; 对采集的人口分布数据预处理包括:将人口分布数据聚合至乡镇级别,获取每个 4 CN 111554408 A 说 明 书 2/9 页 乡镇的总人口。 所述的步骤b具体包括如下步骤: 获取乡镇与乡镇之间的邻接关系; 将乡镇视为点,乡镇之间的邻接关系视为边,构建图结构。 所述的步骤c具体包括: 选择文献中常用的、与登革热传播和爆发有密切关系的特征作为输入特征。 所述的GCN模型由一层输入层、至少两层隐藏层及一层输出层构成;所述至少两层 隐藏层后分别使用整流线性函数ReLU和双曲正切函数tanh作为激活函数。 步骤d中所述对GCN模型进行训练包括: 根据所述GCN模型的输入、输出需求及不同预测窗口,整理K套数据集,每套所述数 据集均划分为训练集和验证集; 使用每个预测窗口下的训练集分别对构建的GCN模型进行训练。 所述的步骤e具体包括: 将每个预测窗口下的验证集,分别输入对应训练好的GCN模型,获得未来第t周的 预测结果; 使用击中率评估预测性能:第t周预测结果的击中率定义如下: 其中,Nm ,t表示将第t周所预测的城市内部所有乡镇病例数量按照从高到低排名, 排名前m%的高风险街镇的实际病例数量之和;Nt表示第t周该城市的实际病例总数量。 本发明提供一种城市内部登革热时空预测系统,该系统包括预处理单元、图结构 构建单元、选择单元、模型构建单元,其中:所述预处理单元用于采集城市内部登革热相关 数据并进行预处理,所述城市内部登革热相关数据包括:所研究城市的登革热病例数据、气 象数据、人口分布数据、乡镇矢量文件;所述图结构构建单元用于构建反映城市内部区域空 间关系的图结构;所述选择单元用于选择用于登革热时空预测的输入特征;所述模型构建 单元用于根据预处理后的城市内部登革热相关数据、构建的图结构、选择的输入特征,对 GCN模型进行构建与训练。 其中,所述系统还包括:评估单元,用于对所述GCN模型的预测性能进行评估。 本发明还提供一种电子设备,包括: 至少一个处理器;以及 与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处 理器执行,以使所述至少一个处理器能够执行上述1至8任一项所述的城市内部传染病扩散 模拟方法的以下操作: 步骤a:采集城市内部登革热相关数据并进行预处理,所述城市内部登革热相关数 据包括:所研究城市的登革热病例数据、气象数据、人口分布数据、乡镇矢量文件; 步骤b:构建反映城市内部区域空间关系的图结构; 步骤c:选择用于登革热时空预测的输入特征; 步骤d:根据预处理后的城市内部登革热相关数据、构建的图结构、选择的输入特 5 CN 111554408 A 说 明 书 3/9 页 征,对GCN模型进行构建与训练,以使用所述GCN模型进行登革热时空预测。 相比于现有技术对国家、省(州)和城市的整体时序预测,本发明面向城市内部各 区域,实现了更细空间尺度上的预测,在预测城市内部各区域未来的登革热病例数量时,充 分考虑各区域之间的空间关系,有助于捕捉登革热在城市内部的传播特征,有效提高预测 性能,提升登革热的精准防控水平。 附图说明 图1为本发明城市内部登革热时空预测方法的流程图; 图2为本发明实施例提供的城市内部区域空间关系构建过程示意图; 图3为本发明实施例提供的图卷积神经网络模型的结构示意图; 图4为本发明城市内部登革热时空预测系统的硬件架构图; 图5为本发明实施例提供的城市内部登革热时空预测方法的硬件设备结构示意 图; 图6为本发明实施例一广州市乡镇尺度的登革热预测效果对比示意图。
分享到:
收藏