1、1基于 kNN 和 SCATS 交通数据的路段行程时间估计方法摘要: 为了改善利用 SCATS 交通数据估计路段行程时间的效果,通过分析 SCATS 实际交通数据获取时间间隔不一致的特征,构建了 SCATS交通数据虚拟时间序列,将利用因子分析法提取的累计贡献率在 85%以上的主因子作为交通模式特征向量的构成要素,用欧氏距离作为当前交通模式特征向量和历史交通模式特征向量相似性的测度指标,以路段行程时间估计误差最小为目标选取当前交通模式的近邻数,对交通模式之间距离的倒数进行归一化处理,确定了相似交通模式的行程时间权重,设计了基于 SCATS 交通数据的路段行程时间估计方法.实例结果表明:与多元线性
2、回归方法相比,本文方法估计的路段行程时间平均绝对误差、平均绝对百分比误差和均方根误差分别平均减少了 9.68 s、8.07%和 4.5 s. 关键词: 悉尼自适应交通控制系统;路段行程时间估计;k 近邻算法;因子分析 中图分类号: U491 文献标志码: ATravel Time Estimation Method Using SCATS 路段行程时间是反映道路交通状态最为直观有效的交通参数,是进行交通拥挤管理和动态路径诱导的重要基础,在智能交通系统中有着广泛的应用.感应线圈是目前应用最为广泛的交通数据采集手段,以此为基2础的路段行程时间估计方法一直是国际交通工程领域的重要研究课题之一1. 目
3、前,在基于感应线圈数据的路段行程时间估计方法中,针对高速公路等连续流交通设施的研究成果较多24,由于受交通信号控制、复杂车辆组成及道路环境等因素的影响,针对间断流交通设施的相关研究成果较少,而且多沿袭针对连续流交通设施的研究思路57,以布设在距离停车线较远位置的线圈获得的固定采样间隔的流量、速度、道路占有率等数据为基础,建立延误估计模型,间接估计路段行程时间,或者直接建立路段行程时间的估计模型. 悉尼自适应交通控制系统(Sydney coordinated adaptive traffic system, SCATS)是世界范围内应用最广泛的交通信号控制系统之一,利用其交通数据对行程时间进行估
4、计,对于低成本改善交通控制、交通诱导和交通指挥的协调性具有重要的现实意义.由于 SCATS 中线圈布设位置及获取的交通数据种类均具有特殊性,目前相关研究成果还较少,且均假设 SCATS 线圈能够按照某种固定的采样间隔提供交通数据,甚至以目前尚无法提供的某些数据为前提.例如,假设 SCATS 线圈经过调西南交通大学学报第 48 卷第 2 期姜桂艳等:基于 kNN 和 SCATS 交通数据的路段行程时间估计方法整后可输出 2 s 内的流量数据8;假设 SCATS 线圈可提供 5 min 采样间隔的地点速度和时间占有率数据9等.这些假设均不符合 SCATS 系统的实际情况,在短期内难以通过工程手段加
5、以实现. k 近邻(knearest neighbor, kNN)算法是一种以最相似样本和模式识别为基础的非参数回归方法,在分类和估计等领域得到了广泛应用.3其中,特征向量的选取是影响 kNN 算法效果的关键因素之一.现有成果基本都是采用人工方法确定特征向量的组成,不仅主观性强、劳动强度大,而且极易存在信息冗余. 针对上述问题,本文将首先对 SCATS 实际交通数据的特征进行深入分析,在提出并构建虚拟时间序列的基础上,将 kNN 算法与因子分析算法相结合,设计了一种路段行程时间估计方法,并采用某特大城市 SCATS实际交通数据进行了验证和对比分析.1SCATS 交通数据的分析与处理 1.1 S
6、CATS 交通数据的特征 SCATS 采用设置在车道下游靠近停车线的感应线圈获取流量及平均车头时距等交通流运行参数数据,以路口为单位记录周期、绿灯时长及饱和度等交通信号控制参数数据. SCATS 以绿灯信号相位为时间单位获取交通数据,而相位时长是动态变化的,因此,各个采样间隔内的交通数据不具有严格的时间可比性. 路段行程时间估计的时间尺度通常为 5、10 或 15 min 等固定时间间隔1113,但在 SCATS 中获取交通数据的时间间隔却不严格一致,这增加了设计有效路段行程时间估计方法的难度.1.2 SCATS 交通数据虚拟时间序列的构建 1.2.1 虚拟时间序列 为了能够得到固定采样间隔的
7、 SCATS 交通数据时间序列,本文提出了虚拟时间序列概念,其基本原理是将每个信号周期 T 内的到达车辆及其速度由随机分布虚拟成均匀(匀速)分布.设置长度为 (5、10 min等)的虚拟采样间隔,并将其插入 SCATS 交通数据的时间轴,如图 1 所示.此时,SCATS 实际采样间隔仍是其绿灯信号相位,而虚拟采样间隔则为设定的时间长度 .可以通过对实际采样间隔内的相应数据进行转换,4获得每个虚拟采样间隔内的交通数据. 3.3.2 对比分析 虽然文献89分别提出了一种基于 SCATS 交通数据的路段行程时间估计方法,但由于二者采用的数据形式与 SCATS 实际交通数据不同,无法将其作为本文的对比
8、方法. 考虑到多元线性回归(multiple linear regression, MLR)是目前城市道路路段行程时间估计中应用最广泛的方法之一5,因此,将其选为对比方法,对本文方法的有效性进行验证.以前述约定的标定集合和测试集合数据为基础,采用本文方法和 MLR 方法,对组合路段 AC 和 CA进行路段行程时间估计,相应的误差指标如表 1 所示. 从表 1 中可以看出,在分别以标定数据集合和测试数据集合为基础估计路段行程时间时,本文方法针对两个实验路段的 3 种误差指标均明显优于 MLR 方法.在测试数据集合中,与多元线性回归方法相比,本文方法路段行程时间估计结果的 MAE、MAPE、RMS
9、E 平均值(组合路段 AC 与 CA的平均值)减少了 9.68 s、8.07%、4.5 s. 方法标定集合 19.3515.4725.04 测试集合 20.0916.9226.18MLR 的本质是利用一簇相似交通模式建立多元线性回归方程,但对与回归方程相似程度较低的交通模式而言,其路段行程时间的估计效果会较差.而 kNN方法以与当前交通模式最为相似的 k 个历史模式作为估计的基础,在一定程度上克服了 MLR 存在的问题,因此,能够改善路段行程时间的估计效果.4 结束语路段行程时间是体现交通流运行状态的最重要的交通参数.现有的基于 SCATS 交通数据的路段行程时间估计方法采用的数据形式与5SC
10、ATS 实际交通数据不同,且均假设可以按照固定周期获得交通数据.而SCATS 是自适应感应控制系统,其采样时间间隔并不是固定的. 本文针对 SCATS 实际交通数据的独特性,设计了一种新的路段行程时间估计方法,并根据我国某特大城市的实际数据进行了验证和对比分析.结果表明,本文设计的新方法能够改善路段行程时间的估计效果. 需要说明的是,受目前工程条件的限制,本文未能对自然路段行程时间的估计效果进行分析,本文方法在其他道路上的应用效果也有待进一步验证.参考文献:1SMITH B L, HOLT R B, PARK B B. Travel time estimation for urban free
11、way performance measurement: understanding and improving upon the extrapolation methodCTransportation Research Board 83rd Annual Meeting. Washington D C: National Research Council, 2004: 120. 2TURNER S M, EISELE W L, BENZ R J, et al. Travel time data collection handbook, VA 22161 USAR. Springfield:
12、National Technical Information Service, 1998. 3PALACHARLA P V, NELSON P C. Application of fuzzy logic and neural networks for dynamic travel time estimationJ. International Transactions in Operational Research, 1999(6):145160. 4NAM D H, DREW D R. Traffic dynamics: methods for estimating freeway trav
13、el times in realtime from flow measurementsJ. Journal of Transportation Engineering, ASCE, 61996, 122(3): 185191. 5VAN A B, VAN J M, MUSTE M R, et al. Travel time estimation in the GERDIEN projectJ. International Journal of Forecasting, 1997(13): 7385. 6XIE C, CHEU R L, LEE D H. Calibrationfree arte
14、rial link speed estimation model using loop dataJ. Journal of Transportation Engineering, ASCE, 2001, 127(6): 507514. 7张和生,张毅,胡东成. 路段平均行程时间估计方法J. 交通运输工程学报,2008,8(1): 8996. ZHANG Hesheng, ZHANG Yi, HU Dongcheng. Estimation method of average travel time for road sectionsJ. Journal of Traffic and Trans
15、portation Engineering, 2008, 8(1): 8996. 8CHEU R L, LIU Q, LEE D. Arterial travel time estimation using SCATS detectorsCProceedings of the 7th International Applications of Advanced Technologies in Transportation Engineering. Cambridge: American Society of Civil Engineers, 2002: 3239. 9姜桂艳,李继伟,张春勤.
16、城市主干路拥挤路段基于地点交通参数的行程速度估计J. 吉林大学学报:工学版,2010,40(5): 12031208. JIANG Guiyan, LI Jiwei, ZHANG Chunqin. Travel speed estimation for congested arterial road segment based on spot 7traffic parametersJ. Journal of Jilin University: Engineering and Technology Edition, 2010, 40(5): 12031208. 10MACK Y P. Local
17、 properties of kNN regression estimatesJ. SIAM, Journal Algebraic and Discrete Methods, 1981, 2(3): 311323. 11姜桂艳,李继伟,张春勤. 城市主干路路段行程时间估计的 BPR修正模型J. 西南交通大学学报,2010,45(1): 124129. JIANG Guiyan, LI Jiwei, ZHANG Chunqin. Modified BPR functions for travel time estimation of urban arterial road segmentJ. J
18、ournal of Southwest Jiaotong University, 2010, 45(1): 124129. 12CHANG W A, RAMAKRISHNA R S. A genetic algorithm for shortest path routing problem and the sizing of populationsJ. IEEE Transactions on Evolutionary Computation, 2002, 6(6): 566 579. 13张赫,杨兆升,王炜. 基于实时交通流信息的中心式动态路径诱导系统行车路线优化技术研究J. 公路交通科技,
19、2004,21(9): 9194. ZHANG He, YANG Zhaosheng, WANG Wei. Research on vehicle route optimization of centrally dynamic route guidance systems based on real time traffic flow informationJ. Journal of Highway and Transportation Research and Development, 2004, 821(9): 9194. 14薛薇. SPSS 统计分析方法及应用M. 北京:电子工业出版社,2004: 132156. (中文编辑:秦萍玲英文编辑:兰俊思)