论文——基于统计分析的公共自行车服务系统评价模型研究.doc

上传人:滴答 文档编号:1256584 上传时间:2019-01-19 格式:DOC 页数:53 大小:2.43MB
下载 相关 举报
论文——基于统计分析的公共自行车服务系统评价模型研究.doc_第1页
第1页 / 共53页
论文——基于统计分析的公共自行车服务系统评价模型研究.doc_第2页
第2页 / 共53页
论文——基于统计分析的公共自行车服务系统评价模型研究.doc_第3页
第3页 / 共53页
论文——基于统计分析的公共自行车服务系统评价模型研究.doc_第4页
第4页 / 共53页
论文——基于统计分析的公共自行车服务系统评价模型研究.doc_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、1基于统计分析的公共自行车服务系统评价模型研究摘要本文针对温州市鹿城区公共自行车管理中心提供的数据,首先对所给数据进行预处理,建立了相关统计模型,运用SPSS20.0、matlab等软件进行统计分析,最后应用关联度分析法对系统进行评价,并提出改进建议。针对问题一:在已处理好的数据基础上,建立了频率与频数、用车时长的统计模型,利用SPSS软件分别统计各站点20天中每天及累计的借车及还车频次,得到每天和累计的借车和还车频次(见表五和表六) ;并对所有站点按累计的借车和还车频次排序(见表七和表八) ;对每次用车时长的分布情况进行统计分析,画出其分布图(见图一和图二) ,由图可知:每天用车时长分布形状

2、非常相似且近似服从 分布。2针对问题二:在已处理好的数据基础上,建立了使用公用自行车的不同借车卡数量的统计模型,利用 SPSS 统计 20 天中每天使用不同借车卡数量,其中最大的为第 20 天的 19885;统计了每张借车卡累计借车次数的分布图(见图三) ,对图形分析可得:借车次数在 10 次以内的占 ,借车次数在 10 至 30 次54.86%占 ,借车次数在 30 至 50 次占 ,借车次数在 50 以上占 ,最35.8%7.11.75%大借车次数高达 次。12针对问题三:根据问题一的分析,已给站点累计所用公共自行车次数最大的一天是第 20 天。对于第一小问:利用第 20 天数据,运用 f

3、loyd 算法求得两站点间最短时间,将站与站间的距离定义为两站间的最短时间与自行车速度之积,同时考虑到了速度和时间的随机误差影响;利用距离的定义,通过 matlab计算得两站点最长距离为: ,最短距离为: 。利用问题一中的频数模型,对6750.8借还车是同一站点且使用时间在分钟以上的借还车情况进行统计,得借车频次表(见表十一)和用车时间分布图(见图四) 。对于第二小问:根据问题一的统计,第 20 天的借车和还车频次最高的站点分别为 42(街心公园)和 56(五马美食林) ,利用 SPSS 统计出两站点借、还车时刻和用车时长的分布图(见图五,图六,图七) ,由图形分析可知:借还车的高峰期与人们上

4、下班的时间非常吻合,在借还车时间上大体都在一小时以内。第三小问:将第 20 天数据从点到 22 点每半小时作为一时段,分别统计各站点各时段借还车频数,利用matlab 编程求出借还车高峰时段(见表十二) ,并对具有借车高峰时段与还车高峰时段的站点进行归类。 (见表十四)针对问题四:根据前三个问题的统计结果,结合公共自行车服务指南,确定评价公共自行车服务系统站点设置和锁桩数量的配置的主要指标有:借车频数、还车频数、可借比例、可还比例、锁桩数目,建立了基于灰色关联分析法和聚类分析的公共自行车服务评价模型,得到评价结果:180 个站点分成有优劣之分的三个类(见表十五) 。针对问题五:通过查阅相关资料

5、知:公共自行车的其他运行规律主要是借还车时间有限制,用车时间集中在短时间内等。针对此问题提出了相关建议。关键词:公共自行车服务系统 统计分析 灰色关联度分析 聚类分析2一、 问题重述1.1 问题背景公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。1.2 问题提出了解公共自行车服务模式和使用规则的基础上,根据附件提供的数据,建立数学模型,讨论以下问题:1. 分别统计各站点 20 天中每天及累计的借车频次和还车频次,并对所有站点按累计的借

6、车频次和还车频次分别给出它们的排序。另外,试统计分析每次用车时长的分布情况。2. 试统计 20 天中各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。3. 找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。对借还车是同一站点且使用时间在 1 分钟以上的借还车情况进行统计。(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段

7、各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。4. 请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。5. 找出公共自行车服务系统的其他运行规律,提出改进建议。二、问题分析题目提供了 20 天公共自行车借车和还车等原始数据,本文的关键就是通过分析处理所给数据,建立数学模型来研究公共自行车服务系统,并对公共自行车服务系统进行评级及提出改进建议。2.1 问题一分析要统计各站点 20 天中每天和累计的借车和还车频次,查阅资料知 ,频数1为频率和频数,对于借车与还车频数,可引入 0-1 变量表示各站第 天借车和

8、还i车在 次记录中出现的频数,各站每天和累计的借车频数就是借出车站号在每j天出现的次数和总天数的借车频数和,各站每天的借车频率是借出车站号在每天出现的次数与每天的有效数据,累计的借车频率是累计借车的频数比上总有效数据,对于借车每天及累计的频数类似,从而可建立相应的统计模型。根据以上分析,可统计出各站点 20 天中每天和累计的借车和还车频次,进而可对所有站点累计的借车和还车频次排序。分析每次用车时长的分布情况,可运用相3关软件将分布情况作出。2.2 问题二分析要统计 20 天每天使用公共自行车的不同借车卡的数量,对于各天的借车人数相当多,为此先用相关软件对有效数据进行处理,即将重复的借车卡,累计

9、到不同借车卡的一行中,可得到没有重复的不同借车卡数据,引入 0-1 变量表示第 张卡第 个数据中出现的情况,累计求和,就可得到各天不同借车卡的数ij量,即得相应统计模型,再运用相关软件分析每张借车卡累计次数的分布情况。2.3 问题三分析(1)由于站点之间的实际距离很难得到,且城市里人流量较大,自行车行驶速度不可能很大,应比较均匀,所以定义两站点之间的距离,可根据物理中距离与时间和速度的关系定义距离,其中时间的获取可通过数据中所给的站与站之间的用时加以处理后得到。该定义的距离会应不同的骑车速度和时间,导致两站点距离不同,因此速度和时间需要引进误差,且将两相同站点的距离定义为 0,为此可得到距离的

10、定义。对于借还车是同一站点且用时一分钟以上的借还车情况直接利用 SPSS 进行统计即可得出相应结果。(2)根据问题一得到结果,可找到所有站点使用自行车次数最大一天,借车频次高和还车频次最高的站点,根据相应站点的数据,可应用相关软件将各站点的借、还车时刻的分布及用车时长的分布求出。(3)题中给出数据的借车还车时间段为 ,要求各站点借车还6:021:车的高峰时段,可对总的时间段进行划分,考虑到数据量以及统计的精确度,可采用一定时间间隔作为一个时间段,分别统计各个站点在每个事件段内的借车频数以及还车频数,则最高借还车频数对应的时间段即为高峰时段,进而能得出高峰时段各站点的借车频次和还车频次,此处统计

11、工作量可能较大。再对其整体分析,即能得到具有共同借车高峰时段和还车高峰时段的站点的归类情况2.4 问题四分析要对目前公共自行车服务系统站点设置和数量的配置做出评价,要根据前几问统计的数据,找出相应的指标,根据问题一,可让借车频数和还车频数作为其中指标,从数据的初步分析来看,借车、与还车频数可能大,说明车流量比较多,从这方面,也可根据题目所提供的站点地理位置,可以知道各个站台的得可借比例(可借车位比上总车位)和可还比例(可借车位比上总车位) ,作为其中指标,对于数量的配置,根据各站锁桩的数量等作为其中指标,为此可得到相应指标对自行车服务系统进行评价,运用灰色关联分析法,求出各个站点的关联度,进行

12、排序,可再用 SPSS 聚类分析分成三类,求出每一类的均值,从而进一步确定出类别间的优劣。2.5 问题五分析要找出自行车服务系统的其他运行规律并提出改进意见,要先对问题中所有数据的一个时间分布情况、借车高峰、还车高峰、以及站点中桩位设置的合理性,进行改进。而改进的方法可能从现有数据和系统流程不能解决,因此可通过查找其他服务系统中号的服务规则进行改进。4三、符号说明第 个站的频数18iy i第 天数据记录的有效总数(剔除后的数据)(,20)kN k第 个时间在第 次记录中的出现次数ijZitj第 张卡出现的频数iH第 个站到第 个站的距离ijdij第 个站到第 个站的所用最短时间ijt时间合成误

13、差1速度随机误差2第 个站点的频率ipi第 天借记卡总数kZk第 个站到第 个站在数据中出现的次数218,nC ij人骑自行车的平均速度v第 个站到第 个站的时间集中数据ijt ij第个 站到第 个站的时间集中数据ji ji测量数据时的不确定度,AB四、模型假设1、以自行车车站号做为借车车站的唯一标识2、附件中所给的数据能准确描述公共自行车系统管理与运营状况3、自行车行驶的过程中,以匀速行驶,行驶过程中不会停留4、异常数据的剔除,不影响数据的整体性五、数据预处理观察整个数据发现有许多异常数据,对任意一天的数据统计发现共提供了181 个站点,但是 108 号站点是空缺值。根据用车时间、用车方式、

14、换车锁桩号、温州鹿城公共自行车服务指南等信息剔除一些不合理数据。5 剔除部分用车时间在 分钟:02:对于数据中用车时间 0 的,借车者从用一车站借出、同一车站还回,而且借还车桩号基本相同,其可能原因是车辆发现自行车有问题就立即还回和在借车成功后 20 秒内自行车未推出,则 20 秒后自动锁上(温州鹿城公共自行车服务指南) ,这样的情况自行车都属于没有使用;对于数据用车时间 1 和 2 的,可剔除同一车站提出同一车站还回,可能原因为车有问题立即还回,车是没有使用的,系统有计算出了该类车的用车时间,因此可以剔除这样的情况的数据,但该数据中有借还车地点不一样不能剔除,因为可能两站之间距离很小能在分钟

15、左右完成。以下表(表一)为例:12:表一:用车时间为 的数据02:借出车站号 借车锁 还车车站号 还车锁 用车时间 用车方式94 9 94 18 0 会员卡借车169 8 169 8 0 会员卡借车13 5 13 4 1 会员卡借车42 4 42 10 1 会员卡借车19 19 19 19 2 会员卡借车55 1 55 1 2 会员卡借车 剔除部分用车时间在 分钟:35:根据温州鹿城公共自行车服务指南无法借、还车处理办法第四条,即借车时听到语音提示“通讯故障暂停使用” ,请等待 分钟后,换桩借车。可以35:知道在同一车站提出同一车站还回借还车桩一样的,且用车时间在 分钟内35:这样的数据,自行

16、车可能是无法使用,但系统又在计算用车计时,对于这样的数据可以剔除。以下表(表二)为例:表二:用车时间为 的数据借出车站号 借车锁 还车车站号 还车锁 用车时间 用车方式13 1 13 1 3 会员卡借车181 20 181 20 3 会员卡借车49 20 49 20 4 会员卡借车70 20 70 20 4 会员卡借车1 1 1 1 5 会员卡借车64 1 64 1 5 会员卡借车 剔除还车桩桩号为 0 的数据:数据中有极少数的车桩号为 0,而且车桩号为 0 的同时,用车时间也为 0,该原因可能为借车者没有还车而导致或该桩号的车被盗,这样的数据是没有意义的,理应剔除。以下表(表三)为例:表三:

17、还车桩桩号为 0 的数据借出车站号 借车锁 还车车站号 还车锁 用车时间 用车方式82 11 0 0 0 会员卡借车99 14 0 0 0 会员卡借车 剔除用车方式为还车故障的数据:在所有数据中有极少的数据借车时间和还车时间差值并不等于用车时间,在用车方式上写了还车故障,这一部分数据也会影响结果因当剔除,以下表6(表四)为例:表四: 用车方式为还车故障统计表借出车站号 借车锁 还车车站号 还车锁 用车时间 用车方式4 4 47 8 0 还车故障71 14 44 19 0 还车故障 剔除数据还车车站号不存在的数据:根据温州鹿城公共自行车站点地图可以知站号最大号为 6055,但有些数据还车车站号不

18、存在,该类数据有 2 个分别是在第 5 天中的借出车站号为 9,还车车站号为 29999(不存在)和第 7 天中借出站号为 43,还车车站号为 29999的,这一类型的数据对研究没有意义应当剔除。 剔除调试站的数据在 20 天的数据整理中,发现有 4 天中出现了调试站,这些调试站分别在第8,9,15,16 天中。调试站借车桩位和还车桩位都为 1000,而且一直都在桩位上用车时间为 0,因此对数据的研究没有意义应当剔除。剔除的所有数据详见附录 1。六、模型的建立与求解6.1 问题一的解答6.1.1 模型一的建立需要统计各站点 20 天中每天和累计的借车频次,查阅资料知频次为频率和频数 ,分别建立

19、频率与频数的模型。设 为 0-1 变量,即1 ijx10ijx第 i站 在 第 次 记 录 中 出 现第 站 在 第 j次 记 录 中 不 出 现为第 个时间在第 次记录中的出现次数, 为 0-1 变量ijZitj ijf10i itj tf用 车 时 间 为 在 第 次 记 录 中 出 现用 车 时 间 为 在 第 j次 记 录 中 不 出 现建立模型一:每天各站的频数: 12011,kNniij kyxnjN 各站累计的频数: 201 201,kNniij kjyxj 每天各站的频率: 20,iikpin 7各站累计的频率: 201,iikypinN用车时长: 1inijtjjZf6.1.

20、2 模型一的求解 借、还车频次的计算根据题目所给数据,代入以上模型,利用 SPSS 进行求解,得各站 20 天中每天及累计的借车和还车频次,部分数据见下表(表五,表六) ,具体数据见附录 2。表五:20 天中每天和累计的借车频次借车频次 借车频次 借车累计频次站点编号 第 1 天频数第 1 天频率 第 20 天频数第 20 天频率 累计频数 累计频率1 85 0.00253 84 0.00214 376 0.000642 102 0.00303 106 0.002701 415 0.000703 170 0.00505 177 0.00451 704 0.001194 227 0.00674

21、278 0.00708 1085 0.001845 129 0.00383 136 0.00346 545 0.00092 177 123 0.00365 259 0.00659 3306 0.00559178 52 0.00154 101 0.00257 1284 0.00217179 284 0.00843 370 0.00943 5092 0.0086180 48 0.00143 149 0.00379 1945 0.00329181 59 0.00175 170 0.0043 2131 0.00361表六:20 天中每天和累计的还车频次还车频次 还车频次 还车累计频次站点编号第 1 天

22、频数第 1 天频率 第 20 天频数第 20 天频率 累计频数 累计频率1 87 0.00258 80 0.00204 1563 0.00265 2 105 0.00312 101 0.00257 1592 0.00269 3 167 0.00496 171 0.00436 2674 0.00453 4 216 0.00641 288 0.00734 5170 0.00875 5 144 0.00428 139 0.00354 2421 0.00410 177 123 0.00365 259 0.00660 3306 0.00560 178 52 0.00154 101 0.00257 128

23、4 0.00217 179 284 0.00843 370 0.00943 5092 0.00862 180 48 0.00143 149 0.00380 1945 0.00329 181 59 0.00175 170 0.00433 2131 0.00361 8 累计频次的排序对以上统计的所有站点累计的借车频次与还车频次,根据频率或频数中的其中一个进行排序,因为频率的计算会有小数的误差,为了方便统计,用频数进行排序,排序结果见下表(表七,表八) ,具体见附录 2。表七:累计借车频次的排序序号 站点号 借出车站 频数1 42 街心公园 115132 56 五马美食林 111513 19 开太百

24、货 91924 63 体育中心西 9031 177 90 拉菲度假酒店 542178 86 测试点 391179 162 望江路广化桥路口 282180 153 妇女儿童中心 254由上表可知,累计借车频数最大的站点号为 42(街心公园) ,借车频数为11513,最小的站点为 153(妇女儿童中心) ,借车频数为 254。其差异原因主要是由于地理位置的不同,街心公园在地图中明显位于交易繁华的位置,周围有商场有酒店,借车数相对较多,而妇女儿童中心周围比较空旷人流活动少。表八:累计还车频次的排序序号 站点号 借出车站 频数1 56 五马美食林 115092 42 街心公园 113753 19 开太

25、百货 93134 63 体育中心西 9306 178 90 拉菲度假酒店 568179 162 望江路广化桥路口 299180 153 妇女儿童中心 272由上表可知,累计还车频次最高的站点号为 56(五马美食林) ,还车频数为11509,最小的站点为 153(妇女儿童中心)还车频数为 272。其差异原因主要是地理位置的不同,五马美食林在地图中查看可知,其周围是社区和商城人流密集。 每次用车时长的分布对于每次用车时长的分布情况,根据题目中数据,用 spss 统计出分布时间对应的频数可画出用车时长的分布直方图。随机抽取 20 天中某几天用车时间与20 天累积数据用车时间的分布对比图(图一,图二)

26、 。 (20 天每天的分布图及累计分布图详见附录 3)9图一:第二天,第十三天时间分布图图二:第 20 天,20 天累积时间分布图由图形分布情况可以看出:每一天和 20 天内用车时长的分布情况基本相同,而且作出 20 天所有用车时长的分布情况,其状况也相同。因此分析用车时长可以用 20 天内累计的数据。通过查找分布图可知,用车时长的分布近似服从分布。对分布情况观察发现时间基本集中在 内,而超过 1 小时的用车2 560时间却很少。6.2 问题二的解答6.2.1 模型二的建立对于统计 20 天中各天不同借车卡的数量,将公共自行车每天的数据按借卡号顺序排列,且将同种借卡号出现的次数累积起来,其累积

27、的次数就是借记卡的数量。假设 为第 张卡出现的频数, 为第 天借记卡总数, 为 0-1 变量,iHkZijq10ijq第 i张 卡 在 第 j次 记 录 中 出 现第 张 卡 在 第 次 记 录 中 不 出 现建立模型二:10111,kZNiij knHqnjN 6.2.2 模型二的求解根据题目所给数据,运用 SPSS 将 20 天数据中出现的每张借车卡累计借卡次数统计出来,如下表九表九:不同借车卡数量天数 不同借车卡数量 使用自行车数量 天数 不同借车卡数量 使用自行车数 量1 16657 33640 11 14921 300392 17284 34648 12 18070 355553 9

28、501 15584 13 19359 387264 14486 29780 14 19334 387235 17819 35739 15 18521 360616 18541 37415 16 11202 178027 18747 37649 17 15243 296528 10462 15551 18 15144 296359 6918 10278 19 19047 3769210 4029 6357 20 19885 39140由上表(表九)可知,第 20 天借车人最多,且自行车使用次数也最多,第3 天借车人最少,但是自行车使用次数最少的一天是第 10 天,根据题目中数据,运用 SPSS,将 20 天每张借车卡累计使用次数画出,其分布情况如下(图三) 。图三:借车卡累计借车次数分布图由上图(图三)以及统计的数据可知借车次数在 10 次以内的人最多,而大部分的人借车次数都在 30 次以内。借车次数在 50 次以上的人数非常少。对此进行统计得到如下结论:借车次数在 10 次以内的人占 ,借车次数都在54.86%10 至 30 次占 以内,借车次数都在 30 至 50 次占 以内,借车次数35.8%71在 50 次以上的占 ,最大借车次数高达 次.17126.3 问题三的解答

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。