1、房价的 影响 因素分析及预测模型 基于北京市相关数据的实证研究 摘要 房地产既是我国国民经济的支柱产业,也是 关系重大的民生问题。本文以北京市 经济适用房销售价格 、 北京市生产总值 等相关数据为例,分析房价的主要影响因素,建立房价 与其影响因素的关系 模型 对北京市房价进行准确预测 ,并 根据得出的预测结果 对房地产发展提出合理性意见: 问题一,建立影响房价的指标体系, 利用 SPSS16.0 软件将各指标数据进行折线图描述,将变化偶然性较大的货币供应量删除, 建立 主成分分析 模型提取主成分, 将各指标对各主成分的贡献率加权得到每个指标 的总贡献率,比较得出影响北京市 房价的六项主要指标
2、依次为: 居民家庭人均收入 , 房地产开发投资额 , 北京市生产总值 , 经济适用房销售价格 , 人均住宅建筑面积 , 新增保障性住房 面积 。 问题二,建立逐步回归模型, 根据 SPSS16.0 软件 的 运行结果显示,被 剔除的前六个变量与问题一得出的六项主要指标一致,证明结论正确。建立多元回归分析模型,由 SPSS16.0 软件实现得到北京市房价与其主要影响因素的关系模型为: 。 问题三,建立曲线估计模型,通过 SPSS16.0 软件拟合得到各指标变量随时间拟合的曲线方程 (见表 3 1) ,将预测房价与实际值进行比较,其 平均误差仅为5.14%,说明预测效果良好 。 利用 MATLAB
3、7.0 软件运行得到各指标及房价在 2000至 2015 年的房价 (见表 3 6)稳中有升。 问题四,根据所得预测结果、北京房地产市场结构、政府相关政策,结合经济学知识,对北京市房地产发展提出合理建议。 最后,对所建模型进行了 优缺点评价, 在模型推广种介绍了这几个模型的广泛应用。 关键词 : 房价预测、影响因素、主成分、线性回归、曲线拟合 一、 问题重述 1.1 问题的背景及条件 俗话说;“安居才能乐业!”在我国的传统观念中房子就家,不管住别墅还是住瓦房,每一个家庭都必须有自己的住房,因此住房问题本生就是关系国计民生的大问题。同时,随着改革开放以来我国经济的高速发展,人民生活质量得到了极大
4、提高,对住房质量、住房环境、小区配套服务等的要求也随之不断提高。近十年来我国一些城镇的商品房价格上涨过快,过高的房 价使城镇却中低收入者无力购买住房 ,为了社会持续稳定的发展 ,政府一直出台各种文件,从宏观层面对房地产市场进行调控。但由于各部门配合不协调,加上恶意炒房的炒家操作,房地产的价格在过去的几年时间里快速地上涨,房价成了各种社会矛盾的焦点。 近几年来,保障房建设正在加速推进 ,中共中央政治局常委、国务院副总理李克强在全国保障性安居工程工作会上强调,要认真贯彻落实党中央、国务院的决策部署,大规模实施保障性安居工程,加大投入,完善机制,公平分配,保质保量完成今年开工建设 1000 万套的任
5、务,努力改善群众住房条件。 1.2 问题的提出 在上述背景条件以及题目给出的提示下,第一步我们需要对物价水平、国内生产总值、国民收入水平、金融政策、税收政策、土地、城市化率、各类保障性住房的投入使用等房地产价格的影响因素进行实证研究,找到影响房价的主要指标。 在第一步的基础上,第二步利用所学的数学基础知识,建立房地产价格与包括城镇住房保障规模在内的主要因素或指标之间联系的数学模型。 利用第二步所建立的关于房地产价格的数学模型,根据有关政策和规划对未来几年我国或某一地区在不同的保障房建设力度下就房地产价格趋势进行仿真或预测,并根据模型的需要对 未来的情况作适当的假设。 最后,根据上述建立的数学模
6、型和仿真结果,向相关单位、 人士 等提出房地产价格相关问题的咨询建议。 二、问题分析 2.1 问题的重要性分析 在上文已经提到住房是关系国计民生的大问题,虽然近几年来房地产业对我国各项经济指标的增长做出了巨大贡献,但高速上涨的房价使众多中低收入阶层的住房问题陷入窘境,贫富差距的矛盾日益突出,房价也成为了各种社会问题的焦点,已经威胁我国社会的持续性发展。 近段时间以来,从中央到地方的各级人民政府都相继出台了各种法律法规文件对房地产市场进行调控,公租房、廉租 房和经济适用房等各类保障性住房也正在加大力度建设之中。利用科学的方法分析得出房价的主要影响因素,建立预测模型预测近期的房价不仅有利于普通百姓
7、更直观地根据市场、政策环境的变化分析房地产的变化,更重要的是,这将有利于政府部门合理地对房地产市场进行调控,使房价更合理、房地产市场的发展更稳健,从而解决民生问题,使老百姓安居乐业。 2.2 目前有关方面对本问题的研究 房地产相关行业以及政府的研究机构从未停止过对房价及相关问题的研究,出现了众多的研究方法。在房价的影响因素分析方面,彭聪 【 1】 、赵丽丽 【 2】 、李晨【 3】 分别通过回归分析、灰色关联分析、因子分析等方法,选取影响房地产价格的主要指标,说明住宅实际建造成本和实际生产总值对住宅价格有着显著的影响,而人口数和所有者实际资本成本的影响作用则不明显 ,并提出相应的改善措施和建议
8、。乔志敏 【 4】 用实证分析表明生产成本的波动对房地产价格的波动有较强作用。 在确立房地产价格与各主要影响因素之间的联系方面,严焰 【 5】 利用岭回归方法本文采用岭回归方法,以香港市场为样本,构建房价模型。曾俊杰 【 6】 基于回归分析和灰色关联分析做了多目标规划的房地产定价模型。曹瑞 【 7】 利用多项式回归模型讨 论了影响房价的主要因素并建立对房价的分析模型。 总体来讲,国内学者对我国房价的研究主要从两个方面进行,一是从宏观经济方面的条件及微观经济方面的市场供求原理,来观察可能影响房价涨跌的因素;二是采用特征价格法,即针对组成房地产的各种特征属性,通过微观经济中的消费者效用理论,来分析
9、特征属性的隐含价格对该商品价格的影响。 2.3 问题的思路分析 本题主要是通过确定房价的主要影响因素,找到房价与各主要影响因素的变化关系,建立房价的预测模型,成为房地产市场调控的重要依据。选取具有代表性的样本是科学研究的基本前提,北 京是我国的首都,也是第一批保障性住房建设的试点城市, 因此本文选取北京的相关数据进行实证研究。 问题一: 在收集大量 数据以及参考相关文献 的基础上,确立房价主要影响因素的指标体系,并 采用解决主要因素提取问题最广泛、最精确的方法之一的主成分分析方法,通过对载荷矩阵中各指标对所提取主成分的 总 贡献率的比较,即得到对房价产生影响的各主要指标。 问题二:在前人的研究
10、成果中,我们可以发现建立房价与 各主要指标之间的关系模型的主要方法是各种回归分析方法,本文采用 思路最清晰明了、得到的关系式最精准的逐步回归分析法。通过逐步回归分析 ,即得到房价与各主要指标的联系,同时将结果与问题一中得到的各主要指标进行比较,可检验得到的主要指标是否一致,从而对提取出的各主要指标进行验证。 最后利用多元线性回归方法对房价与各主要影响因素 进行拟合,得到房价与保障住房在内的各主要影响因素之间的关系模型。 问题三:根据房价与保障性住房在内的各主要影响因素之间的关系模型,以及 北京市“十二五”规划中关于保障性住房建设的规划,我们可以利用数 学软件对“十二五”期间(即 2011201
11、5年)北京市的房价进行仿真预测。 问题四:根据 已经得到的模型及仿真结果,加上对房地产相 关情况的了解及当前的国内外宏观经济环境 等 ,最后对相关部门、单位及个人 提出 合理性 的建议。 三、模型假设 (1)假设经济性适用房的销售价格可以代表保障性住房的价格,从而进行本题的研究。 (2)假设在本文预测的 2011至 2015年期间,国家对房地产市场的宏观调控政策不发生重大改变,与现行的政策基本一致。 (3)假设在本文预测的 2011至 2015年期间,不发生 重大自然灾害(如 08年汶川地震)、金融危机(如 08年美国次贷危机引起的世界金融危机)、战争等不可抗拒的、影响房地产市场发展的外力因素
12、。 (4)房地产价格 受众多因素的影响,受比赛时间所限,假设只考虑本文所研究的 11个因素,以外的其他因素对房产价格的影响可暂时忽略。 (5)假设本文数据挖掘及处理研究过程中只出现有系统误差,无随机误差。 ( 6) 假设本文所研究的各项因素的误差是不 相 关的。 四、符号说明 符号 意义 单位 原始指标个数 个 第 i 个原始指标 北京市房地产价格 元 第 i 个主成分 个 所提取主成分个数 个 的相关系数矩阵 的特征值 对应的党委特征向量 随机误差 五、模型的建立与求解 5 1问题一:确定影响房地产价格的主要因素 5 1.1 主成分分析的基本原理 根据题意要求和相应的分析,对于问题一本文采用
13、主成分分析方法。主成分分析法是利用降维的思想,通过研究指标体系的内在结构关系,把多指标转化成少数几个互相独立而且包含原有指标大部分信息( 80 85以上)综合指标的多元统计方法,本文在提取主成分是要求提取达到 90%以上的信息,其优点在于利用该方法所确定的权数是基于数据分析而得到的指标之间的内在结构关 系,不受主观因素的影响,而且得到的综合指标(主成分)之间彼此独立,减少信息的交叉,从而使分析评价结果具有客观性和可确定性。 主成分分析是对于原先提出的所有变量,通过线性变换建立尽可能少的新变量,使得这些新变量是两两不相关的,且这些新变量在反映数据的信息方面尽可能保持原有变量或数据的信息和特点。数
14、学上的处理就是将原来 个指标作线性组合,作为新的综合指标,如果将选取的第一个线性组合即第一个综合指标记为 ,自然希望 尽可能多的反映原来指标的 信息,这里的 “信息”用 的方差来表达,即 越大,表示 包含的信息越多。因此在所有的线性组合中所选取的 应该是方差最大的,故称为第一主成分。如果第一主成分不足以代表原来 个指标的信息,再考虑选取即选第二个线性组合,为了有效反映原来信息, 已有的信息就不需要出现在 中,用数学语言表达就是要求,称 为第二主成分,依此类推可以构造出第三,四, ,第 个主成分。 通过查阅中华人民共和国国家统计局网站 【 8】 、北京市统计信息网 【 9】 ,中国知网 【 10
15、】 ,我们得到北京市的 物价水平、生产总值、 收入水平、金融政策、税收政策、土地、城市化率 、保障性住房面积、销售价格等统计数据,并在查阅大量相关文献的情况下,得到如表 1所示的影响房价的指标体系 (见表 1 1)。 最后本文选取从 2001年至 2010年期间房价及各指标的统计数据进行实证分析(见附 1)。 表 1 1 影响房价的 指标体系 指标 意义 单位 经济适用房销售价格 元 北京市生产总值 亿元 恩格尔系数 % 居民家庭人均收入 元 新增保障性住房面积 万平方米 人均住宅建筑面积 平方米 CPI 城市化率 贷款利率 房地产开发投资额 亿元 货币供应量 亿元 商品房销售价格 元 本文将
16、所搜集整理的各指标数据按时间进行 绘图描述 ,得到各指标的 描述图(如图 1 1) 图 1 1 各指标按时间序列拟合曲线图 如上图所示, 在 2000至 2010年 11年间,由于近几年我国通货膨胀严重,人民币贬值, 导致 X11货币供应 量各年份的 丈夫偏差太大 , 由于无法预料未来一段时间内人民币或发生货币通货膨胀还是通货紧缩以及其变化程度, 故将这一因素删除,最后 将影响房价 的指标确定为表 1 1中的前十个指标。 5 1 2主成分分析法的数学模型 及实证分析结果 设有样本容量为 的 个变量,通过变换将原变量 转换成主成分(用 表示),主成分是原变量的线性组合,且具有正交特征,即将 综合
17、成 个变量 ,可用多项式表示: 或 矩阵 满足 ,即 为正交矩阵,其中 为单位阵,且 由下列原则决定: ( 1) 与 ( )不相关; ( 2) . 主成分分析法步骤如 下: ( 1) 假定输入一 个 决策表 ,其中 为论域,为条件属性集, D为决策属性集。需输出条件属性的主成分 。 ( 2) 按 对原始数据 进行标准化处理,使每个属性均值为 0,方差为 1。 在 SPSS16.0软件运行下得到 描述性统计分析 ( 见 表 1 2)。 表 1 2 各指标的 描述性统计分析 Descriptive Statistics Mean Std. Deviation N 商品房销售价格(元) 7551.7
18、8 3284.391 22055 经济适用房销售价格(元) 3110.27 500.801 22055 北京市生产总值(亿元) 7625.40 3400.748 22055 恩格尔系数( %) 37.554 1.1961 22055 居民家庭人均收入(元) 12445.361 6275.8115 22055 人均住宅建筑面积(平方米) 24.2421 5.00433 22055 CPI 1.01527 .019847 22055 城市化率 .8146 .02935 22055 贷款利率 6.18917 .477327 22055 房地产开发投资额 (亿元 ) 1538.838 594.3632
19、 22055 新增 保障性住房面积(万平方米) 243.7262 58.71080 22055 ( 3) 根据概率论中 的 相关系数 公式:计算原始数据集的相关系数矩阵 。 在 SPSS16.0软件运行下得到 的相关系数矩阵 ( 见 表 1 3)。 表 1 3 的相关系数矩阵 Correlation Matrix 经济适用房销售价格(元) 北京市生产总值(亿元) 恩格尔系数( %) 居民家庭人均收入(元) 人均住宅建筑面积(平方米) CPI 城市化率 贷款利率 房地产开发投资额(亿元 ) 保障性住房面积(万平方米) 经济适用房销售价格(元) 1.000 .791 -.054 .848 .701
20、 -.344 .272 .320 .819 .230 北京市生产总值(亿元) .791 1.000 -.088 .909 .908 .078 .615 .376 .973 -.111 恩格尔系数( %) -.054 -.088 1.000 .248 -.378 .426 -.704 .060 -.233 -.085 居民家庭人均收入(元) .848 .909 .248 1.000 .741 .113 .257 .282 .864 .062 人均住宅建筑面积(平方米) .701 .908 -.378 .741 1.000 -.032 .752 .256 .958 .081 CPI -.344 .
21、078 .426 .113 -.032 1.000 .018 .139 -.069 -.357 城市化率 .272 .615 -.704 .257 .752 .018 1.000 .282 .642 -.251 贷款利率 .320 .376 .060 .282 .256 .139 .282 1.000 .283 -.217 房地产开发投资额 (亿元 ) .819 .973 -.233 .864 .958 -.069 .642 .283 1.000 .048 保障性住房面积(万平方米) .230 -.111 -.085 .062 .081 -.357 -.251 -.217 .048 1.000 ( 4) 计算相关系数矩阵 的特征值 及其对应的单位特征向量 ,并将特征值按由大到小的顺序排列,即 。 ( 5) 计算主成分的方差贡献率和累计方差贡献率。第 个主成分方差为,主成分 的累计方差贡献率为 其中 的值最大,则说明 综合 信息的能力最强,主成分值得选取一般为使得累计方差贡献率 (或特征值大于 1)的前 个特征值。