1、 1 济南市 商品房 价格影响因素分析 一、 提出问题 (一) 研究的问题 1998 年,中国实施房地产市场的改革,变原有的福利分房制度为商品房买卖制度,由此一个新的市场 房地产市场在中国诞生了。 12 年过去了,中国的房地产市场经历了怎样的变化?这其中,我们最关心的房价究竟受到那些因素的影响?又会有怎样的发展? 本文以定性假设得出自变量开始,通过对房价的定量研究,试图找到影响房地产价格的真正因素,并建立线性模型,预测房价的发展。同时,本文以济南市为例,使得研究更具实际意义。 (二) 数据来源 济南市统计信息 http:/ 在应用统计学中,我们要求样本的个数必须大于 15 个,但是中国房地产市
2、场的产生也不过只有 12 年,而济南市统计局所公布的济南市统计年鉴也只有 2003 2010 年,所以本文只能用有限的信息来分析济南市房价的影响因素。 二、 定性分析 为了研究济南市房地产价格的影响因素,首先对影响房价的因素进行定性的分析。 作者认为,影响房价的因素可能有:生产总值、人均可支配收入、年末总人口数、储蓄存款余额、土地交易价格指数、建筑材料出厂价格指数、房地产投资额、居民消费价格指数。在这些因素中,除了储蓄存款余额 可能与房地产销售价格呈反比关系之外,其余因素与房地产销售价格呈正比关系。 因此,选取房屋销售价格为解释变量 y,选取生产总值、人均可支配收入、年末总人口数、储蓄存款余额
3、、土地交易价格指数、建筑材料出厂价格指数、房地产投资额、居民消费价格指数为被解释变量,依次设为 x1、 x2、 x3、 x4、 x5、 x6、 x7、 x8。 数据的搜集如下表: 2 年份 房屋销售价格指数 Y 生产总值(亿元) X1 人均可支配收入(元) X2 年末总人口数(万) X3 储蓄存款余额(万元) X4 土地交易价格指数X5 建筑材料出厂价格指数 X6 房地产投资额(万元)X7 居民消费价格指数X8 2001 101.8 1057.92 9564.99 569.00 5346413 101.9 98.71 621984 100.3 2002 102.5 1190.12 10094.
4、13 575.01 6438616 102.1 100.88 764599 98.8 2003 103.1 1352.16 11012.86 582.56 7583475 103.5 100.22 897967 99.9 2004 110.3 1600.27 12005.06 590.08 8705457 104.4 102.25 1101613 102.5 2005 107.6 1876.61 13578.46 597.44 10244200 105.8 98.19 1210872 101.1 2006 104.3 2185.1 15340.2 603.35 11825655 104.9 1
5、00.15 1600507 100.9 2007 105.2 2554.3 18005.1 604.85 12666590 105.0 99.48 1932069 103.9 2008 107.2 2987.00 20807.4 603.99 15885280 102.7 100.92 2741166 105.7 2009 104.5 3351.4 22721.7 603.27 19115340 101.9 102.18 3325576 100.3 三、 相关分析 (一) 散点图 由散点图可直观看出, 解释变量与被解释变量之间的线性关系并不明显。 同时,图像明3 显 存在异常值,即 2004与
6、 2005年的房屋销售价格明显属于离群点 。 (二) 相关矩阵 对解释变量及被解释变量进行相关分析,可得相关矩阵: Correlations y x1 x2 x3 x4 x5 x6 x7 x8 y Pearson Correlation 1 .296 .260 .508 .287 .535 .291 .227 .601 Sig. (2-tailed) .439 .500 .162 .454 .138 .448 .557 .087 N 9 9 9 9 9 9 9 9 9 x1 Pearson Correlation .296 1 .998* .874* .992* .013 .354 .983*
7、 .550 Sig. (2-tailed) .439 .000 .002 .000 .974 .350 .000 .125 N 9 9 9 9 9 9 9 9 9 x2 Pearson Correlation .260 .998* 1 .846* .989* -.040 .353 .988* .553 Sig. (2-tailed) .500 .000 .004 .000 .919 .351 .000 .123 N 9 9 9 9 9 9 9 9 9 x3 Pearson Correlation .508 .874* .846* 1 .850* .479 .186 .779* .611 Sig
8、. (2-tailed) .162 .002 .004 .004 .192 .632 .013 .081 N 9 9 9 9 9 9 9 9 9 x4 Pearson Correlation .287 .992* .989* .850* 1 -.028 .406 .989* .470 Sig. (2-tailed) .454 .000 .000 .004 .943 .278 .000 .202 N 9 9 9 9 9 9 9 9 9 x5 Pearson Correlation .535 .013 -.040 .479 -.028 1 -.377 -.158 .269 Sig. (2-tail
9、ed) .138 .974 .919 .192 .943 .318 .684 .483 N 9 9 9 9 9 9 9 9 9 x6 Pearson Correlation .291 .354 .353 .186 .406 -.377 1 .446 .071 Sig. (2-tailed) .448 .350 .351 .632 .278 .318 .228 .855 N 9 9 9 9 9 9 9 9 9 x7 Pearson Correlation .227 .983* .988* .779* .989* -.158 .446 1 .478 Sig. (2-tailed) .557 .00
10、0 .000 .013 .000 .684 .228 .193 N 9 9 9 9 9 9 9 9 9 x8 Pearson Correlation .601 .550 .553 .611 .470 .269 .071 .478 1 Sig. (2-tailed) .087 .125 .123 .081 .202 .483 .855 .193 N 9 9 9 9 9 9 9 9 9 *. Correlation is significant at the 0.01 level (2-tailed). 在相关分析中,解释变量 y与被解释变量 x1、 x2、 x3、 x4、 x5、 x6、 x7、
11、 x8的 Pearson4 相关系数 分别 为: 0.296, 0.260, 0.508, 0.287, 0.535, 0.291, 0.227, 0.601。可见解释变量与被解释变量 的相关性不高。 四、 回归分析 (一) 建立全模型 采用进入法,得到模型综述、方差分析表、回归系数表 及残差分析图 如下: Model Summaryb Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .985a .971 .765 1.3309 3.020 a. Predictors: (Constan
12、t), x8, x6, x5, x4, x3, x2, x1 b. Dependent Variable: y ANOVAb Model Sum of Squares df Mean Square F Sig. 1 Regression 58.549 7 8.364 4.722 .341a Residual 1.771 1 1.771 Total 60.320 8 a. Predictors: (Constant), x8, x6, x5, x4, x3, x2, x1 b. Dependent Variable: y Coefficientsa Model Unstandardized Co
13、efficients Standardized Coefficients t Sig. Correlations Collinearity Statistics B Std. Error Beta Zero-order Partial Part Tolerance VIF 1 (Constant) 9.268 165.514 .056 .964 x1 .035 .037 10.319 .946 .518 .296 .687 .162 .000 4.048E3 x2 -.006 .005 -11.272 -1.262 .427 .260 -.784 -.216 .000 2.718E3 x3 -
14、.582 .324 -2.908 -1.798 .323 .508 -.874 -.308 .011 89.039 x4 1.840E-6 .000 3.028 1.133 .460 .287 .750 .194 .004 243.273 x5 2.274 1.604 1.241 1.418 .391 .535 .817 .243 .038 26.094 x6 .618 .591 .316 1.046 .486 .291 .723 .179 .322 3.105 x8 1.464 .442 1.157 3.312 .187 .601 .957 .568 .241 4.154 a. Depend
15、ent Variable: y 5 回归分析得到的回归方程为: y = 9.268 + 0.035 x1 - 0.006 x2 - 0.582 x3 + 1.840E-6 x4 + 2.274 x5 + 0.618 x6 + 1.464 x8 6 由全模型回归分析可知: 修正后的 R2 = 0.765,方程的拟合程度较好; 回归方程的 F值 = 4.722, P值 = 0.341 0.05,因而回归方程没有通过检验; 回归系数的 P值均大于 0.05,即回归系数全部没有通过检验。 (二)模型诊 断 1、 分别用年份和残差为横轴和纵轴作散点图,得时间残差图(如下)。该散点图用于检验异方差性,由下
16、图可知,解释变量与被解释变量之间存在较明显的异方差性。 2、 分别用残差滞后项和残差为横轴和纵轴作散点图,得滞后项残差图(如下)。该散点图用于检验自相关性,由于大部分点都落在第二四象限,因而随机扰动项存在负相关。 3、 由共线性诊断表可知,最大的条件数 = 1488.123,可以判断出存在较为严重的共线性。同时可以知道, x0 x1 x2 的共线性较强, x3 x5 的共线性较强。 7 Collinearity Diagnosticsa Model Dimension Eigenvalue Condition Index Variance Proportions (Constant) x1 x
17、2 x3 x4 x5 x6 x8 1 1 7.784 1.000 .00 .00 .00 .00 .00 .00 .00 .00 2 .213 6.040 .00 .00 .00 .00 .00 .00 .00 .00 3 .002 70.117 .00 .00 .00 .00 .18 .00 .00 .00 4 .000 137.377 .00 .01 .02 .00 .00 .00 .03 .00 5 9.245E-5 290.178 .01 .01 .04 .00 .04 .01 .04 .49 6 6.753E-5 339.511 .00 .08 .01 .00 .56 .00 .36
18、 .39 7 4.045E-6 1387.203 .98 .88 .92 .13 .21 .16 .31 .11 8 3.515E-6 1488.123 .00 .01 .00 .87 .01 .83 .26 .00 a. Dependent Variable: y 五、 模型调整 (一) 剔除异常值 由 散点图可知, 2004 与 2005 年的房屋销售价格明显属于离群点,导致后面的相关性分析中,解释变量与被解释变量之间的相关性并不高。因而剔除 2004 年与 2005 年的数据后,重新进行回归分析。 (二) 逐步回归法 Variables Entered/Removeda Model Va
19、riables Entered Variables Removed Method 1 x8 . Stepwise (Criteria: Probability-of-F-to-enter = .100). 2 x6 . Stepwise (Criteria: Probability-of-F-to-enter = .100). 3 x5 . Stepwise (Criteria: Probability-of-F-to-enter = .100). a. Dependent Variable: y 进过逐步回归法进行筛选后,只留下 x5、 x6、 x8三个变量 进行线性回归。比较三种模型,即只
20、有 x8进行回归分析,只有 x8和 x6进行回归分析,以及同时有 x8、 x6、 x5进行回归分析。 8 1、对于三种模型,得到的模型综述、方差分析表、相关系数表如下: Model Summaryd Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .882a .778 .734 .9388 2 .981b .963 .944 .4301 3 .997c .993 .987 .2095 3.306 a. Predictors: (Constant), x8 b. Predictors: (
21、Constant), x8, x6 c. Predictors: (Constant), x8, x6, x5 d. Dependent Variable: y ANOVAd Model Sum of Squares df Mean Square F Sig. 1 Regression 15.462 1 15.462 17.542 .009a Residual 4.407 5 .881 Total 19.869 6 2 Regression 19.129 2 9.564 51.705 .001b Residual .740 4 .185 Total 19.869 6 3 Regression
22、19.737 3 6.579 149.912 .001c Residual .132 3 .044 Total 19.869 6 a. Predictors: (Constant), x8 b. Predictors: (Constant), x8, x6 c. Predictors: (Constant), x8, x6, x5 d. Dependent Variable: y Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. Correlations Collinearity S
23、tatistics B Std. Error Beta Zero-order Partial Part Tolerance VIF 1 (Constant) 38.017 15.778 2.409 .061 x8 .652 .156 .882 4.188 .009 .882 .882 .882 1.000 1.000 2 (Constant) -34.485 17.816 -1.936 .125 9 x8 .671 .071 .909 9.400 .001 .882 .978 .907 .996 1.004 x6 .703 .158 .430 4.452 .011 .374 .912 .430
24、 .996 1.004 3 (Constant) -67.351 12.379 -5.441 .012 x8 .625 .037 .846 16.912 .000 .882 .995 .795 .883 1.133 x6 .805 .082 .493 9.861 .002 .374 .985 .463 .884 1.132 x5 .265 .071 .197 3.723 .034 .317 .907 .175 .786 1.273 a. Dependent Variable: y ( 1)三种模型的修正后 R2 分别为 0.734、 0.944、 0.987,因而第三种模型的方程拟合程度最高;
25、 ( 2)三种模型对于的回归方程的 F值分别为 17.542、 51.705、 149.912,且 P值均小于 0.05。因而 三种模型均通过检验,且第三种模型的回归效果最好; ( 3)模型 1 与模型 2 的常数项的 P值分别为 0.061、 0.125 0.05,即 模型 1 与模型 2 的常数项没有通过检验。但是模型 3 的所有参数均通过检验,并且 VIF值均小于 10,偏相关系数也都接近 1。因而模型 3是最佳模型,得到的回归方程 为: y = -67.351 + 0.625 x8 + 0.805 x6 + 0.265 x5 2、 逐步回归模型诊断 ( 1) 由于模型 3 中含有三个解
26、释变量,因而残差时间图检验异方差性较为麻烦,改为用Spearman等级相关系数检验异方差性。 Correlations X5 X6 X8 ABSE1 10 Spearmans rho X5 Correlation Coefficient 1.000 -.324 .418 .559 Sig. (2-tailed) . .478 .350 .192 N 7 7 7 7 X6 Correlation Coefficient -.324 1.000 -.072 -.321 Sig. (2-tailed) .478 . .878 .482 N 7 7 7 7 X8 Correlation Coeffic
27、ient .418 -.072 1.000 .414 Sig. (2-tailed) .350 .878 . .355 N 7 7 7 7 ABSE1 Correlation Coefficient .559 -.321 .414 1.000 Sig. (2-tailed) .192 .482 .355 . N 7 7 7 7 由相关分析可知: x5、 x6、 x8 三个解释变量与 ABSE的等级相关系数分别为: r5 = 0.559,r6 = -0.321, r8 = 0.414。 对应的 P值分别为: P5 = 0.192, P6 = 0.482, P8 = 0.355,三变量的 P值均大于 0.05,即残差的绝对值与三个自变量不存在显著的相关关系,不存在异方差。 ( 2)分别用残差滞后项和残差为横轴和纵轴作散点图,得滞后项残差图(如下)。该散点图用于检验自相关性,由于大部分点都落在第二四象限,因而随机扰动项存在负相关。 因而必须采用迭代法或差分法消除负 自相关。 ( 3)由相关系数 表可知, 所有参数均通过检验,并且 VIF值均小于 10,因而不存在显著的共线性。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。