1、1城市公共自行车服务系统运行状况和效率分析基于温州市鹿城区公共自行车系统运营实践的研究摘 要本文基于温州市鹿城区公共自行车系统的 20 天内借车和还车原始数据,构建模型对公共自行车的使用频次分布、供求状况和自行车租赁的站点位置特征进行了分析,进而探讨了公共自行车系统的有效性,挖掘其背后的系统运行规律和机理,并分析了这一系统的其他特征,如潮汐现象等,最终建立在长期可持续发展的基础上提出解决方案。针对累计借还车频次、各日借车卡数量和累计借车次数分布的计算,我们主要采用 MATLAB 遍历过所有数据并进行统计运算,得到累积分布结果的二维直方图,采用拟合的方法得到其近似分布。我们还构建了自行车用户群体
2、的效用函数模型,探讨高于某一保留效用阈值的城市居民采用公共自行车出行偏好程度。发现用户选择公共自行车出行的效用函数关于出行时间的变化近似为一个矩形脉冲函数,其拐点约为 28 分钟。当出行时间少于 28 分钟时,用户更倾向于选择公共自行车出行;在 28 分钟之后,用户倾向于选择其他的交通工具,仅在随机因素的作用下选择公共自行车。在公共自行车服务系统站点设置和锁桩数量的配置的分析中,我们在鹿城区公共自行车管理中心网站上找到每个自行车站点的位置,在电子地图服务提供商网站上查询出该站点位置的坐标。对于距离的界定,我们采用欧氏距离、直角距离和地图实际距离三种方法度量站点间距。第三种方法较为精确,我们采用
3、颜色替换,形态学处理,道路生长细化的方法客服了第三种方法的度量困难,最终获得城市道路信息,用于两地之间的实际道路路径求取。我们将一天中的 24 小时划分成以 0.2 小时为间隔的若干时段,分别统计落入每个时段的借还车频次,即可用来反映借还车频次时刻分布,我们发现许多站点都存在较明显的早晚高峰现象,反推出的效用函数具有稳定性和可靠性,表明我们的研究是可信的。在峰值的搜寻中,我们借助 MATLAB 使用均值滤波的方法减弱随机因素造成的影响, 对站点的借还车高峰时刻进行统计。通过计算等效时间峰值统一不同站点的时间峰值维数,然后采用 K-means 算法进行聚类分析,从而根据借还车高峰时刻对站点进行了
4、归类。基于上述初步结果,我们提取了数据中蕴含的信息,进而对鹿城区的公共自行车系统配置效率和运营状况进行分析和评价。我们发现,公共自行车系统存在明显的“潮汐现象”,在高峰时段可能有供不应求的问题,亟需建立良好的调度系统已平衡供求关系。我们拓展了前面的研究,从站点选址的社会福利优化问题以及合理的配套调度机制设计几个角度进一步分析了公共自行车服务系统的运行规律,并提出了相应的改进2建议。关键词:公共自行车 效用函数 分布估计 统计分析 聚类分析3一 问题提出1.1 题目背景与研究意义在倡导健康、节能、环保的生活理念的今天,公共自行车得到了越来越多城市居民的青睐,在国内掀起了一场“绿色革命” 1。作为
5、同城短区间非机动载人设备,公共自行车是具有可持续发展性的重要代步手段,日益成为人们生活中不可或缺和替代的主要交通工具之一。作为公共交通末端交通工具的公共自行车不仅弥补了公共交通线网密度不足的缺陷,而且向公共交通提供客源,如图 1 所示。我国现已有众多城市主动将自行车纳入公共交通领域,意图让公共自行车交通与公共交通实现无缝对接,破解交通末端“最后一公里 “难题,实现低碳出行,美化城市。随着公共自行车的普及使用, 如何构建合理、高效的公共自行车服务系统是一个非常关键的问题。自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。浙江省温州市鹿城区公共自
6、行车系统的数据能够为我们的机制设计提供参考。根据温州市鹿城区公共自行车管理中心网站(http:/)提供的数据,鹿城公共自行车的投放量约为 5000 辆,设立 180 个服务网点。启动当天,首先在五马街区和新城街区推出 80 个服务网点,其余 100 个服务网点计划在 10 月设立。服务网点主要位于机关、企事业单位、商业楼宇、公共场所、住宅小区等人员密集地区,间距一般在 300 米至 500 米 2。本文试图基于温州市的地形环境和公共自行车站点建设的现有情况,构建数学模型探讨温州市市民公共自行车的使用水平和分布规律,并对城市自行车服务系统进行评价。目前,我国公共自行车的系统建设尚处于初步阶段,我
7、们的研究不仅针对特定城市的公共自行车系统进行了系统性分析,而且能够为全国其他城市的公共自行车系统优化建设提供参考。图 1:城市公共自行车系统出发点 目的地服务点公交车站服务点公交车站服务点41.2 问题重述借助鹿城区公共自行车客流数据和站点分布图,本文试图解决以下几个问题:首先,分析公共自行车的使用频度和每次使用的时长:我们统计各站点 20 天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序,并统计分析每次用车时长的分布情况。其次,基于借车卡数据对使用主体区分,统计 20 天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车
8、卡累计借车次数的分布情况。然后,我们试图寻找所有已给站点合计使用公共自行车次数最多的一天,并按照以下几个角度探讨站点客流量特点和规律:1) 我们合理界定两站点之间的距离,在此基础上找出自行车用车的借还车站点之间(非零)最短距离与最长距离,对借还车是同一站点且使用时间在 1 分钟以上的借还车情况进行统计。2) 我们选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。3) 寻找各站点的借车高峰时段和还车高峰时段,在给出的温州市鹿城区地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。进而建立在前面分析
9、的基础上,我们探讨上述统计结果携带了哪些有用的信息,并由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。最后,我们试图找出公共自行车服务系统的其他运行规律,提出改进建议。二 问题分析城市公共自行车系统是一个复杂的系统, “牵一发而动全身” ,其机制的设计和模式的优化是城市公共基础设施建设服务的核心。在这一部分中,我们对要解决的问题进行梳理整合,为后文的研究构建逻辑架构。2.1 基本思路针对本文的几个关键问题点,我们首先从数据出发,通过对公共自行车使用频率和时长的数据观察统计,分析其中规律,进而采用效用函数合理刻画用户需求和选择模式,合理预测出行时间,建立模型刻画用户偏好。然后我们采
10、用题目中给定的地图,借助电子地图寻找借还车频次高峰,并基于数据和初步结论探索最后的开放式问题公共自行车系统的运行规律和政策建议。2.2 具体分析我们首先进行数据的预处理,利用 Matlab 导入数据,对数据进行整合,剔除异常值和缺漏值,得到用于分析的样本数据。我们分以下几个步骤解决:51) 针对问题一,即计算公共自行车的使用频度和每次使用的时长,我们遍历过所有数据之后,即可以得到各站点每天的借车还车频次的统计数据。对每个站点的全部 20 天的借车与还车数据分别求和,既可以得到每个站点的累计借车与还车频次。用还车时间减去借车时间可以得到用户的用车时间,精确到秒。2) 利用用户效用函数来刻画用户的
11、选择行为,建立自行车出行时间分布的效用函数模型。求解效用函数模型的具体形式,对用户群体的偏好特征进行分析。3) 针对问题二,我们按照借车卡区分不同用户个体,对用户群体的需求模式进行探索,方法类同问题一。通过累计各个借车人在 20 日中累计借车次数,我们做出频率分布图,拟合得到借车频次的近似分布特征。4) 针对问题三,共有三种方法界定站点距离欧式距离,直角距离和实际地图距离,我们可以分别用三种方法求解。第三种方法最为精确,但实现难度较大,我们尝试采用 MATLAB 画图的方法,利用题目给出的地图计算实际距离。在此基础上,寻找借还车频次高峰,并对站点位置、锁桩数量的优劣进行评价。5) 第四、第五问
12、要求我们发散思维,寻找数据背后的运行规律,我们建立在数据特征的基础上,进一步挖掘公共自行车系统的运行特点,并回顾和借鉴了一些现有研究的方法,最终提出政策建议。三 基本假设H3.1:假设该城区所有的用户都是同质的,即有相同的效用函数。由于生活地理位置和风俗人情接近,影响出行状况的外界不可抗因素相近,这一假设比较合理,并可以简化我们的分析。当用户同质时,我们可以采用代表性用户的效用函数完成推导过程。H3.2:不同用户出行需求不同,我们假设用户需要出行的时长( )近似服从指数分T布。H3.3:假设公共自行车站点设置在研究时间区间内没有明显变更,借车站点序号没有较大的变化,我们可以在一个相对静态的公共
13、自行车硬件系统环境下进行分析。四 符号说明符号 意义mnijaA第 个站点第 天的借车次数ijijbB第 个站点第 天的还车次数站点数目的最大值n天数的最大值6五 数 据预处理分析发现公共自行车系统的数据记录中存在错误的数据记录。因此,在对系统使用情况进行统计分析之前,首先要对数据进行预处理,以去除这些错误数据。分析发现,数据记录错误的形式包括以下几种:1) 借车站点序号错误,例如 2012 年 11 月 8 日的序号为 No.16548 的记录,借车站点为“调试站 1”,站点序号为 1000;2) 还车站点序号错误,例如 2012 年 11 月 8 日的序号为 No.30983 的记录,还车
14、站点名称为空白,站点序号为 29999;3) 借还车时间错误,例如 2012 年 11 月 8 日的序号为 No.30983 的记录,借车时间为“2012/11/5 17:50:07”,还车时间为“2012/11/5”,还车时间只有日期没有时刻;4) 用车时间间隔错误,例如 2012 年 11 月 5 日的序号为 No.19436 的记录,借车时间为“2012/11/5 14:24:43”,还车时间“2012/11/5 14:31:23”,实际用车时间为 6 分 40 秒,记录用车时间为 0 分钟。综上所述,制定筛选条件对错误数据进行滤除。正确的数据需要满足的条件为:1) 借车站点序号小于 1
15、000;2) 还车站点序号小于 1000;3) 借还车时间格式正确,且还车时间晚于借车时间;4) 还车时间减去借车时间所得到的时间间隔(精确到秒)与记录中的时间间隔的误差小于 2 分钟。我们使用 MATLAB 导入数据,并编写程序根据上述条件对全部 20 天的数据记录进行筛选,最终得到一共 637336 条记录,其中借车时间范围为 2012/11/1 5:59:38 至2012/11/20 21:33:57,还车时间范围为 2012/11/1 6:02:12 至 2012/11/21 7:37:20。数据一共有 180 个借车站点,站点序号分别为 ;180 个还车站点,序号范围107,918和
16、借车站点相同。六 公共自行车总体使用情况统计分析6.1 借车还车频次统计针对导入的数据,使用 MATLAB 编写程序对各站点每天的借车还车频次进行统计,0ia第 个站点的累计借车频次iib第 个站点的累计还车频次T用户需要出行的时长()Ut用户自行车出行的效用Qx标准正态分布的累计分布函数7并分别使用矩阵 来表示借车频次和还车,12,1,2mnijmnijabmjnAB 频次的统计结果。其中 表示第 个站点第 天的借车次数, 表示第 个站点第 天ij jijbij的还车次数。 和 分别表示站点数目的最大值和天数的最大值,根据数据记录的范围,分别取 。18,20程序初始化后建立 和 两个矩阵并把
17、它们置为零矩阵。程序遍历所有数据mnn记录,读取每一条数据记录之后,都对该条数据记录中借车日期、借车站点、还车日期、还车站点所对应的矩阵中的元素加 1。遍历过所有数据,即得到各站点每天的借车还车频次的统计数据。对每个站点的全部 20 天的借车与还车数据分别求和,可得每个站点的累计与还车频次,第 个站点的累计借车与还车频次分别用 和 来表示,显i 0iaib然有:(6.1)01niijiijab各个站点的每天与累计借车与还车频次如表 1 和表 2 所示,限于篇幅,表 1 和表2 中仅列出了前 10 个站点前 10 天的借还车频次以及累计频次,完整的数据请参见附录。表 1:各个站点的每天与累计借车
18、频次(部分)站点 1ia2i3ia4i5ia6i7ia8i9ia10i累计1 91 148 35 152 124 107 88 15 9 6 17602 114 112 25 82 135 135 120 41 21 15 17443 179 188 47 60 194 189 189 73 65 13 26724 235 286 86 255 243 322 259 112 65 66 52325 139 165 67 167 161 164 168 53 33 16 24126 105 100 50 102 117 118 134 47 19 13 17607 106 109 14 55
19、143 137 157 34 35 5 16758 95 80 15 47 106 116 114 36 41 10 15339 353 365 177 303 400 460 393 167 124 86 648310 354 359 198 311 366 334 376 165 82 53 5821表 2:各个站点的每天与累计还车频次(部分)站点 1iai3ia4i5ia6i7ia8i9ia10i累计1 93 145 48 167 116 103 98 23 11 4 18212 117 110 27 88 125 136 127 53 22 16 18113 176 193 65 74
20、 199 187 219 115 54 9 29154 224 297 108 283 242 310 297 115 87 61 55825 154 153 80 166 182 176 190 61 49 16 261386 112 97 41 116 119 119 132 56 33 15 18297 106 106 23 59 140 134 157 67 19 3 17988 89 89 15 41 101 110 110 54 23 4 14789 334 351 171 315 408 447 400 178 121 72 641610 341 332 216 314 361
21、326 347 150 84 52 5741对累计借车频次和还车频次进行排序,得到的结果如表 3 所示,表 3 中仅给出借车与还车频次最高的前 10 名站点,完整的排序结果见附录。表 3:站点的借还车频次排序借车站点累计频次排序 还车站点累计频次排序排名 站点序号 累计借车频次 排名 站点序号 累计还车频次1 42 12286 1 56 123082 56 11950 2 42 121483 19 9864 3 19 99854 63 9670 4 63 99455 49 9270 5 49 93986 33 8068 6 33 83927 47 7747 7 69 78488 64 7607
22、 8 47 77319 69 7567 9 101 768310 101 7525 10 64 75586.2 用车时间的区间频次统计用还车时间减去借车时间可以得到用户的用车时间,精确到秒。我们首先分析用车时间的范围,通过统计全部 637336 条记录,发现最短用车时间为 2 秒,最长用车时间为 6601.5 分钟,即 4 天 14 小时 1 分 30 秒。我们采用 来表示t用户的用车时间,以 100 分钟为间隔首先初步统计各用车时间区间内的用车频次,如表 4 所示。表 4:用车时间的区间频次统计区t间0,1),20),3)0,4)650,)60,)频率 0.9967 0.9992 0.999
23、6 0.9998 1.0000 1从表 4 中可以看出,虽然用车时间的范围较大,但是 所占的比例为20t0.9992,说明绝大多数用车时间小于 200 分钟。因此我们只对用车时间小于 200 分钟的情况进行统计。此外,用车时间小于 1 分钟的情况通常为用户在同一站点迅速借车并还车,和用户真正使用公共自行车的情况不同,因此 的情况也不予统计。1t统计用户用车的时间得到用户用车时间的均值为 15.5907 分钟,标准差为 11.64299分钟。以 1 分钟为单位统计用户用车时间的频次,得到图 2。观察图 2 可以发现,当用车时间较短的时候,用户用车的频次随时间的增长而增长,在约 8 分钟左右达到最
24、大值,20 天内约有 3.5 万次借车时间为 8 分钟,之后用户用车的频次随时间的增加而减少。为了定量刻画用户用车时间的分布以及分布产生的机理,我们构建了一个效用函数模型,如 6.3 节所示。图 2:用户用车时间的频次分布6.3 效用函数模型公共自行车的推广主要针对的人群有三类:短距离出行者、长距离换乘出行者和非常规目的出行者等。短距离出行者具体是指在自行车的出行适宜的范围(5km )内,用公共自行车的单一交通方式完成的出行的,包括通勤、购物以及娱乐为目的的交通出行者。长距离换乘出行者指使用公共自行车作为公共交通的一个换乘工具的日常通勤者或者节假日出门娱乐、探访亲友或者购物的人群。非常规目的出
25、行者是指以健身或者旅游为目的的出行者。用户使用公共自行车出行与否显然和出行的时间相关,出行时间间接反映了出行距离的远近,自行车是一种人力驱动的出行交通工具,在短时间条件下,出行者体力充沛,其速度优势得到体现,但是在时间超过一定的程度,其速度优势就完全暴露。因此出行时间是自行车方式选择的重要因素。表 8 反映了统计资料中披露的部分城市自行车出行时耗分布。从表 8 来看自行车交通的出行时间大部分都控制在在 30 分钟以内。绝大部10分城市自行车出行时间控制在 20 分钟以内的比例达到了 60%以上,时间控制在 30 分钟以内的比例都达到了 85%左右(郑州除外) ,出行时间超 30 分钟的出行比例
26、较小,我们可以认为,自行车的最佳出行时耗在 30 分钟以内。 3表 8:部分城市自行车出行时耗分布(% ) 1出行时耗 10min 20min 30min 40min 50min 统计年份郑州 4.2 42.5 62.3 89.2 93.8 2000苏州 18.4 62.7 81 87 94 2000无锡 28.1 65.9 87.1 93.3 96.9 1996常熟 40.2 80.8 95.6 96.8 97.7 2001昆山 7.4 62.4 84.8 96.5 97.4 2001我们构建了一个模型来描述用户用车时长的分布规律。我们假设用户需要出行的时长是一个随机变量,用 来表示,并用
27、表示 的概率密度函数。用户根据自T()pTt己的出行需求选择要采用的交通工具。显然,用户选择出行交通工具需要考虑一些因素,例如出发起点、出发终点、出行距离、出行用时、出行时段以及交通路况、天气等一系列因素。用户会综合考虑这些因素以确定出行所采用的交通工具。我们引入效用函数来描述用户选择自行车出行的偏好。效用函数是对用户使用公共自行车获得的综合收益的量化,显然,当收益较高的时候,用户更倾向于使用公共自行车。设用户采用公共自行车出行的效用函数为 ,则可以设用户使用公共自行()Ut车的条件 为效用函数大于某一阈值 ,这一阈值可以视为用户选择出行方式的保留1S效用。如式(6.2) 所示:(6.2)1:()St由于除了 之外其他因素也可能影响用户使用公共自行车的效用,所以 应该是t ()Ut以 为参数的随机变量。为了简化起见,设效用函数是和距离相关的确定部分 与一t u随机变量的和,即(6.3)()Utun式(6.3)中, 为 的函数, 是一个随机变量,用以刻画影响用户选择的随机因()ut素。由于随机因素可以看成许多正、负的随机分布的综合效应,根据中心极限定理,我们可以假定 服从正态分布,即 。n2(,)nN将式(6.3)代入式 (6.2)中可得1 数据参见单晓峰(2007):城市自行车交通合理方式分担率及其路段资源配置研究,东南大学博士论文,2007