1、北京信息科技大学毕业设计(论文)题 目: 北京市房价走势分析 学 院: 理 学 院 专 业: 信息与计算科学 学生姓名: 班级/学号 信计 0701 / 2007011345 指导老师: 起止时间: 2011 年 2 月 21 日 至 2011 年 6 月 17 日 摘 要 - I -摘 要房价问题是近年来的一个热点社会话题。本文搜集了 2008 年 7 月至 2011 年 5 月的北京房屋均价数据以及北京几个主要区县的房屋均价,利用灰色预测理论和回归分析方法对数据进行建模,分别进行了模型验证,两种建模方法得出了一致的结论:2011 年 6 月-12 月房价呈稳定上升趋势。本文得出的结论可以给
2、北京市的政策决策者提供了一个参考性方案。关键词:房价走势;灰色预测;回归分析;数学建模;数据拟合;matlab;Abstract - II -AbstractHigh house prices in recent years become a hot social topic. This article collected Beijing housing price data from July 2008 to May 2011 and several major districts of Beijing housing price, using Gray prediction theory
3、and regression analysis to model data, model validation were carried out, this two models obtained the same conclusion, June 2011 to december of house prices show steady upward trend. The conclusion of this article can provide policy makers in Beijing a reference of the program.Keywords: house price
4、s; grey prediction theory; regression analysis; mathematical modeling; data fitting; matlab目 录 - III -目 录摘 要 .IAbstract.II第一章 概 述 .3第一章 概 述 .- 1 -第二章 房价走势分析的灰色预测模型 .- 1 -2.1 灰色预测模型的建立 .- 1 -2.2 灰色预测模型的检验 .- 3 -第三章 回归分析介绍 .- 1 -3.1 回归分析的一般步骤 .- 1 -3.2 多元线性回归的 Matlab 实现 .- 1 -3.3 回归分析预测法(Regression An
5、alysis Prediction Method) .- 2 -3.3.1 回归分析预测法的分类 .- 2 -第四章 房价走势的回归分析模型 .- 1 -4.1 房价问题的模型假设 .- 1 -4.2 房价问题的模型建立与分析 .- 2 -4.2.1 房价问题的模型推导 .- 2 -2.3.1 房价变化情况和预测 .- 7 -2.4 模型的改进与推广 .- 8 -第五章 总 结 .- 1 -参考文献 .- 1 -概 述 - 1 -第一章 概 述房价问题是当前政府和老百姓最关心的问题之一,高房价近年来已经成为一个热点的社会话题,关于其形成原因和解决办法的言论和文章层出不穷。房价高就意味着如果你现
6、在买房子,以后花钱会比较困难,因为你付出得太多。这牵涉到社会财富分配的问题,所以很敏感。房地产问题的实质是社会财富分配的矛盾近几年的“两会”期间,住房问题一直是中国老百姓最重要、最关心的话题。2010 年政府工作报告指出:“坚决遏制部分城市房价过快上涨势头,满足人民群众的基本住房需求。建设保障性住房 300 万套。增加中低价位、中小套型普通商品房用地供应,加快普通商品房项目审批和建设进度。规范发展二手房市场,倡导住房租赁消费。盘活住房租赁市场。 ”温家宝总理在政府工作报告中提出:“抑制投机性购房。加大差别化信贷、税收政策执行力度。完善商品房预售制度。完善土地收入管理使用办法,抑制土地价格过快上
7、涨。加大对圈地不建、捂盘惜售、哄抬房价等违法违规行为的查处力度。 ”另外一组数据,也说明了房价问题是民生问题的要害:从 2004 年房价开始抬升和 2009 年到达高点这两个时期的经济状况来看,2004 年我国国内生产总值约 13.6 万亿,财政收入 2.64万亿,城镇居民可支配收入在 9422 元;2009 年我国国内生产总值在 33.5 万亿,财政收入 6.85万亿,城镇居民可支配收入在 17175 元。这几年 GDP 平均增长在 10%以上,国内经济总量翻了 2.5 倍,财政收入翻了 2.6 倍,城镇居民收入只增加了不到一倍。中国经济这几年增长是很快的,前几年 GDP 的增加达到百分之十
8、几,但是存款利息却非常低,短期的储蓄利息接近于零,所以大家把钱拿出去炒股炒房的意愿比较强烈。但是,由于中国人口老化是不可避免的,最终房子的需求是会下降的,所以从长远来说炒房子不会成功。问题在于这十年怎么办? 如果还是那么多人炒,利息又那么低,会不会引起社会不稳定? 在国家逐步加强宏观调控,抑制房地产市场过热的大背景下,北京住房价格出现大幅增长,引起了社会各界的密切关注。电视剧:蜗居“在全国热播,也说明老百姓对房价的关心。到底北京房子的价格是升还是降呢?本文一方面通过调研前几年北京的买房数据,对数据整合处理,建立数学模型进行预测;另一方面讨论影响房地产价格的主要因素,找出了价格和其主要因素之间的
9、关系,通过其他因素的价格变化,来推测北京的房价走势。文章安排如下:第二章利用查找的数据,采用灰色预测模型进行建模,对房价走势进行预测;第三章利用回归分析建模方法,建立房价与影响房价主要因素之间的数学模型,得出房价稳定上升的结论;最后对文章进行总结。房价走势分析的灰色预测模型 - 2 -第二章 房价走势分析的灰色预测模型本章不考虑影响房价的具体因素,调研了北京市 2008 年 7 月到 2011 年 4 月的数据,采用灰色 GM(1,1 )模型进行预测分析,并做了模型验证。在验证合理的基础上对 2011 年的房价走势做预测分析。2.1 灰色预测模型的建立北京 2008 年 7 月2010 年 1
10、2 月的房屋平均价格如表 1 所示,表 1 2008 年 7 月-2010 年 12 月的价格表时间 2008 年 7月2008 年 8月2008 年 9月2008 年 10 月 2008 年 11 月 2008 年 12月价格 13077 12889 12908 12659 12023 11579时间 2009 年 1月2009 年 2月2009 年 3月2009 年 4 月 2009 年 5 月 2009 年 6 月价格 11473 11345 11409 11717 11987 12364时间 2009 年 7月2009 年 8月2009 年 9月2009 年 10 月 2009 年 1
11、1 月 2009 年 12月价格 13037 14001 14811 15236 15951 17455时间 2010 年 1月2010 年 2月2010 年 3月2010 年 4 月 2010 年 5 月 2010 年 6 月价格 18683 19300 20079 22448 23187 22660时间 2010 年 7月2010 年 8月2010 年 9月2010 年 10 月 2010 年 11 月 2010 年 12月价格 22182 22078 22358 22969 23146 23242设表 1 中的数据为原始序列 ,即有:(0)X(0)(0)(0)(0)(0)=372=189
12、3=12984=12659=123xxxxx, , , ,()()()()()61594757, , , ,(0) (0) (0) (0)(0)86748xxxxx, , , ,() ()() () ()=23=1598=149=18632=193, , , ,(0) (0) (0) (0) (0)17924325xxxxx, , , ,() () () () ()68644, , , ,房价走势分析的灰色预测模型 - 3 -对 做一阶累加,生成序列记为 ,结果见表 2(0)X(1)X表 2序号(k) 1 2 3 4 5 6时间 2008 年 7月2008 年 8月2008 年 9月2008
13、年 10 月 2008 年 11月2008 年 12 月x(0) 13077 12889 12908 12659 12023 11579x(1) 13077 25966 38874 51533 63556 75135序号(k) 7 8 9 10 11 12时间 2009 年 1月2009 年 2月2009 年 3月2009 年 4 月 2009 年 5 月 2009 年 6 月x(0) 11473 11345 11409 11717 11987 12364x(1) 86608 97953 109362 121079 133066 145430序号(k) 13 14 15 16 17 18时间
14、2009 年 7月2009 年 8月2009 年 9月2009 年 10 月 2009 年 11月2009 年 12 月x(0) 13037 14001 14811 15236 15951 17455x(1) 158467 172468 187279 202515 218466 235921序号(k) 19 20 21 22 23 24时间 2010 年 1月2010 年 2月2010 年 3月2010 年 4 月 2010 年 5 月 2010 年 6 月x(0) 18683 19300 20079 22448 23187 22660x(1) 254604 273904 293983 316
15、431 339618 362278序号(k) 25 26 27 28 29 30时间 2010 年 7月2010 年 8月2010 年 9月2010 年 10 月 2010 年 11月2010 年 12 月x(0) 22182 22078 22358 22969 23146 23242x(1) 384460 406538 428896 451865 475011 498253GM(1,1)的具体模型及计算式,设非负原始序列 (0)()(0)(0)X1,2,xxn对 作一次累加,得到生成数列为(0)X(1)()(1)(1),其中, (1)0()kixx于是 的 GM(1,1)白化形式的微分方程为
16、(0)- (1)(1)()dxaut其中, 为待定参数,au房价走势分析的灰色预测模型 - 4 -根据表 2 的数据,得出: (1)(1)(0) ()()(0) (1)(1)2233Y,2xxBnxn,即有:Tau参 数 YB参数向量 可用最小二乘法求取,即 1()TTauBY把求取的参数代入(1-1)式,并求出其离散解为:-(2)(1)(1)akxkxe(1-2)式称为 GM(1,1)模型的时间相应函数模型,它是 GM(1,1)模型灰色预测的具体计算公式通过用 MATLAB 的计算得出:a=-0.0158,u=4902预测模型为:-(3)(1)(1) 0.473032516325.16xxe
17、2.2 灰色预测模型的检验本文利用 2011 年 1 月至 5 月份的数据对模型进行检验。灰色模型的精度检验一般有三种方法:相对误差大小检验法,关联度检验法和后检验法。本文采用第一种方法相对误差大小检验法。设 按 GM(1,1)建模法以求出 ,并将 做一次累减转化为 ,即(1)X(1)(0)X(0)()(0)(0),2,xxn计算残差得: (0)()(1),Eee其中, (0)(0)2ekxkn计算相对误差得: (0)1%,2,erlknx房价走势分析的灰色预测模型 - 5 -计算平均相对误差得: 1rel()nkrl通过计算,得出残差检验,如表 3 所示计算得平均相对误差为: 1rel()0
18、.2359nkrel计算的相对误差如表 3 所示,序号 1 代表是 2011 年 1 月份的数据,以此类推,序号 5 代表 2011 年 5 月份的数据。表 3序号(k) (0)xk(0)xk(%)()relk1 23928 21732 0.09177532 24580 22571 0.08173313 25026 23424 0.06401344 25011 24291 0.02878735 25047 25171 0.0049506由误差计算结果看出,平均相对误差为 0.02359,说明模型精度较高。利用公式(3)对 2011 年 6-12 月的房价进行预测,如表 4 所示:表 4时间 2
19、008 年6 月 2008 年7 月 2008 年8 月 2008 年9 月 2008 年10 月 2008 年11 月 2008 年12 月预测房价 26065 26974 27897 28834 29787 30754 31737从我们预测的结果可以得出,2011 年的房价走势稳步上升的趋势。回归分析介绍 - 6 -第三章 回归分析介绍回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归
20、分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。3.1 回归分析的一般步骤在具体讲解回归方法之前,我们先简单介绍一下回归分析的一般步骤。一个完整的回归分析通常包括了以下几步:1:对数据进行预处理,选择合适的变量进行回归分析。在建立回归模型的时候,选择哪些变量进入模型是首先要考虑的问题,对于变量的选取,既要考虑实际问题的背景也要考虑变量数据的统计特征。2:作散点图,观察变量间的趋势,初步选取回归分析方法。同时利用散点图剔除异常
21、点。3:进行回归分析,拟合自变量与因变量之间的经验公式。4:拟合完毕之后进行残差分析,检验模型是否恰当。残差分析主要包括检验残差是否独立,以及残差是否服从正态分布两方面。5:利用拟合结果进行预测控制。需要注意的是,在处理实际问题的时候,一定要以问题的专业背景为基础,而不是拘泥于固定的数学方法。3.2 多元线性回归的 Matlab 实现多元线性回归的命令是 regress,此命令也可用于一元线性回归。格式如下:1:确定回归系数的点估计值,用命令:b=regress(Y ,X ) 。2:求回归系数的点估计和区间估计,并检验回归模型,用命令:b,bint,r,rint,stats=regress(Y,X,alpha)3:画出残差及其置信区间,用命令:rcoplot(r,rint)上述命令中,各符号的含义如下:01.pyx