logo好方法网

基于数据质量控制的道路网重型货车交通流量预测方法


技术摘要:
本发明涉及一种基于数据质量控制的道路网重型货车交通流量预测方法,针对GPS流量数据及收费站监测数据两种数据源划分三类数据路段,分别采取不同的预测方法。针对有GPS流量数据的路段,由于GPS数据存在获取不够全样问题,采用先分段常系数法扩样再长短时循环神经网络预  全部
背景技术:
近年来,重型货车增比逐年上升。基于现有的道路资源,重型货车的增加会导致车 辆拥堵现象并影响居民的日常出行,货车与客车的交通矛盾十分突出。管理部门常常采取 特殊时段限行等政策来进行调控,但往往由于数据缺失和理论支撑不足等问题导致政策效 果不佳。充分利用多种数据,采取科学的理论方法,对重型货车交通流进行准确的预测,可 以为解决全路网重型货车拥堵等问题提供理论支持。 目前,多源化的数据给精准的交通流量预测带来可能的同时也对交通流量预测方 法提出了更高要求。重型货车由于政策要求必须安装GPS定位仪,因此可以实时监测车辆的 运动轨迹,实现对有GPS数据路段的预测。但是现实中常常存在定位仪安装覆盖面不全、仪 器损坏、通讯干扰、线路故障、采集频率混乱、环境影响等原因导致原始数据缺失,需要对无 数据路段和有GPS交通流量数据路段进行交通流量预测。此外,收费站数据收集的便利性, 可以对监测数据路段的重型货车交通流量进行预测,进而获得全路网货车交通流量。 上述三类路段数据具有质量不同和类型不同的特点,为了提高预测效果,需要分 别挖掘数据特征,采用不同的方法进行针对性的预测。已有研究往往仅针对某一种路段进 行分析和预测,研究不够全面,普适性不强。本方法更加全面的考虑实际工程问题,更具有 实际应用价值,在整体路网的交通流预测中,重型货车的交通流量与实际流量更为接近,便 于重型货车管控策略为规划人员和管理人员及时制定可靠的措施提供了理论参考依据,进 而更有效的减少车祸和交通拥堵。
技术实现要素:
为克服上述的问题,本发明目的在于提供一种基于数据质量控制的道路网重型货 车交通流量预测方法。 本发明通过以下方法达到目的: 一种基于数据质量控制的道路网重型货车交通流量预测方法,包括如下步骤: 步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据; 步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔 进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据 路段和无数据路段; 步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测 数据路段; 步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短 时循环神经网络方法进行流量预测; 4 CN 111583628 A 说 明 书 2/9 页 步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测; 步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预 测。 步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量。 在上述方案的基础上,步骤1所述GPS轨迹数据包括:记录时间、经度、纬度以及车 牌号; 在上述方案的基础上,所述步骤2具体包括:将城市路网进行编号形成路段ID,将 每个路段ID按照1h的时间间隔将GPS数据进行合计,形成带有路段属性和时间间隔属性的 交通流量数据,筛选出有GPS交通流量数据路段和无数据路段,所述有GPS交通流量数据路 段为:有GPS数据的路段;所述无数据路段为:无GPS数据的路段。 在上述方案的基础上,步骤3所述断面流量为出、入口流量之和。 在上述方案的基础上,步骤4具体包括如下步骤: 步骤41:对步骤2筛选出的有GPS交通流量数据路段按照道路等级和流量范围采用 分段常系数法进行扩样。 步骤42:对扩样后的数据进行标准化处理。 步骤43:利用长短时循环神经网络方法进行交通流量预测。 步骤44:将预测后的交通流量进行反标准化处理。 步骤45:将反标准化后的数据与交通调查数据进行对比。 步骤46:采用总量控制法进行重型货车交通流量调整。 在上述方案的基础上,步骤41所述道路等级包括公路等级和城市道路等级,从公 路等级和城市道路等级两方面细分10个等级; 所述公路等级包括:高速公路、一级公路、二级公路、三级公路、四级公路; 所述城市道路等级包括:快速路、主干路、次干路、支路、其他,所述其他代表不属 于上述城市道路等级的其余路段。 在上述方案的基础上,步骤41具体包括如下步骤: 步骤411:将所有路段交通流量按照时间间隔进行合计; 步骤412:选择合计后最大流量的时段作为排序依据,将所有路段ID的交通流量进 行降序排序; 步骤413:将排序后交通流量所呈现的分布函数进行参数估计, yi=ke-ax b    (1) 其中,yi代表路段i的流量,x代表降序后的路段序列,k、a、b代表分布函数的估计 参数; 步骤414:将所有路段按照流量进行区间分段,根据概率密度函数计算该区间下的 扩样系数。 其中,mi ,j为路段序号[i,j]区间的扩样系数。xi,xj代表序列为i,j的路段序列编 号。 在上述方案的基础上,步骤42具体为:将路段ID所有流量进行筛选,选出最大交通 5 CN 111583628 A 说 明 书 3/9 页 流量,将每个交通流量与该最大交通流量的比值归一化到[0,1]区间中。 在上述方案的基础上,步骤43具体包括如下步骤: 步骤431:将所有交通流量数据分为训练集和测试集。 步骤432:设定参数。 步骤433:模型训练和调参,将模型训练到最佳状态。 步骤434:重型货车交通流量预测,将训练好的模型对测试集数据进行预测,并采 用平均绝对误差(MAE)、百分比误差(MAPE)、均方根误差(RMSE)、解释方差分数(EVS)进行模 型效果评估。 解释方差分数(EVS)计算公式为: 其中,Yt为t时刻的交通流量, 为t时刻的预测交通流量。 在上述方案的基础上,步骤432所述参数包括:隐藏层units大小,时间步长 timesteps,每次输入样本数batch_size,激活函数,损失函数,循环步数epotch。 在上述方案的基础上,步骤5具体包括如下步骤: 步骤51:选取道路等级、车道数与宽度作为自变量,路段的交通流量作为因变量, 形成数据集; 步骤52:计算目标路段与其他有流量数据路段之间的欧式距离; 步骤53:按照欧式距离进行降序排序; 步骤54:选取欧式距离最小的K组数据,将K组数据的因变量值,取平均值即可表示 目标路段重型货车流量值,所述因变量值为路段货车流量。 步骤55:最后对预测结果进行评估,将均方差作为误差评估指标,当误差仍较大 时,可采取更改K值的方式,使预测结果更加接近于真实情况。 在上述方案的基础上,步骤6所述对监测数据路段采用长短时循环神经网络方法 的具体步骤与步骤43相同。 本发明的有益效果: 本发明所述一种基于数据质量控制的道路网重型货车交通流量预测方法,从多角 度考虑多种数据类型和质量情况下的流量预测,从工程实践出发,以GPS交通流量数据和监 测交通流数据的为依托,结合实际情况分析数据特点,提出针对性预测方法可以更加准确 地刻画未来重型货车交通流量实际数量。为缓解重型货车交通拥堵、改善道路运行条件提 供技术支持和理论参考。 附图说明 本发明有如下附图: 图1是郑州市路段分布图; 图2是高速公路交通流量排序后指数分布图; 图3是有GPS交通流量数据路段预测方法流程图; 图4是长短时循环神经网络LSTM预测效果图; 6 CN 111583628 A 说 明 书 4/9 页 图5是原始GPS数据、扩样数据、扩样后预测数据、交通调查数据的对比示意图; 图6是K最近邻算法流程图; 图7是采用K最近邻算法得到预测与原流量对比图; 图8是采用长短时循环神经网络得到监测数据路段预测流量与原流量对比图; 图9是本发明所述基于数据质量控制的道路网重型货车交通流量预测方法流程 图。
分享到:
收藏