精选优质文档-倾情为你奉上纽约出租车出行状况调查作者:李少泉来源:今日财富2018年第25期基于纽约2016年1-6月出租车出行记录,分析了纽约出租车行驶数据,探究出租车每次行程的出行时间与出租车所在公司、乘客人数、上车日期、是否周末以及行驶距离之间的关系。描述性分析部分,首先基于数据进行统计,计算出平均每天出租车出行时间、平均行驶路程、出行高峰期等数据特点,其次利用Arcgis软件,将所有出租车上车下车地点画在纽约市地图上,研究人们送别或迎接亲朋好友的习惯。对于出租车出行时间的预测,本文首先使用了多元线性回归模型,再利用向前向后逐步回归,之后引入主成分分析法,利用六个主成分回归新的线性模型,于是进一步改进使用神经网络拟合,分别建立了Levenberg模型、贝叶斯模型以及量化梯度下降算法,分别都建立了有十个隐含层的神经网络模型,效果有较大改善,平均绝对误差分别为:286s,281s,293s。一、数据来源及说明数据主要来源于机器学习竞赛网站kaggle,分析了2016