1、1北京商品住宅房价研究摘要北京市商品房的销售价格差异巨大,本文通过建立合理的假设,对影响北京市商品住宅房销售价格的重要因素和着些因素对销售价格的影响进行分析,从实际数据结果加深对北京市房地产销售价格的认识,从而给购房者或者房地产开发商提供一定的参考建议。对于问题一,首先用百度进行数据的搜集,利用收集的数据采用EXCAL进行数据的整理与计算,最终得到需要的数据。然后利用SPSS中的数据缺失值检测功能,发现该数据比较完整,没有缺失值。再利用SPSS的绘图功能画出住宅房价与房屋面积的散点图。发现住宅房价与房屋面积有一定关系。画出区县和住宅房价的箱图,发现不同的区县会对住宅的房价具有一定的影响,由于不
2、同的区县位于不同的环线,通过不同区县的分析,从而可以确定不同环线上的房屋的房价不一样且位于中心城区的房价较高。通过查资料可知,不同环境的小区房价也有一定的区别,且环境优良的小区房价较高。对于问题二,对房屋面积和已售统计均价进行相关性分析,分析得出两者之间呈弱相关关系。房屋面积对已售统计均价有一定影响。对区域和已售统计均价先进行正态检验,发现他们能通过显著性检验,接着进行比较分析,分析得出两个样本之间的均值差异有显著性。对于问题三,不同的商品住宅类型共有三类中小普通商品住宅、大户型普通商品住宅、中高档商品住宅。根据所查的数据将中小普通商品住宅,大户型普通商品住宅、中高档商品住宅的均价分别算平均值
3、,并作为各种房屋均价的估计值。关键词北京商品住宅房价,SPSS,EXCEL,相关性分析,散点图,箱图,独立样本T检验,显著性检验2一、问题重述内容要点住房问题关系民生之根本,近年来随着经济的发展,北京作为我国的经济政治文化中心,房价也普遍在波动中呈上涨趋势。外地人购房拉高房价,有数据表明北京市1/3以上的商品住房卖给了在北京务工,工作生活的外地人,且北京二三环内的高档的商品房占50以上。使得生活在北京的人们背负着沉重的经济负担。由于一线城市的房价迅速上涨,外地(包括境外人士)到这些城市购房比例也比较高。众所周知,北京市商品房的销售价格差异巨大,从最低的6000元/平方米左右,到最高可达1100
4、00元/平方米左右。可想而知,差异如此之大也是由于各方面的因素导致的。问题一请确定影响北京商品住宅房销售价格的重要因素;问题二请尽可能量化上述因素对销售价格的影响;问题三分析不同类型商品住宅房的价格差异,对每种类型的房屋均价予以估计,从而给购房者或者房地产开发商提供一定的参考建议。二问题分析本文主要目标是要分析地理位置,房屋面积,小区环境对北京商品住宅房的影响关系,其总体研究方法是通过对现有数据进行统计规律分析,找出北京商品住宅房与环境因素(区县、环线、住宅面积、小区环境)的关系状况,并通过查找资料了解地理位置或地理环境对北京商品住宅房的影响,最后结合第一个问题和第二个问题,分析不同类型商品住
5、宅房的价格差异,对每种类型的房屋均价予以估计,从而给购房者或者房地产开发商提供一定的参考建议。鉴于此目的,针对本文具体3个问题,可以进行具体分析21针对问题一的分析本问题主要根据网上查找的详细资料进行相关统计分析,这些房价信息主要有行政区域、已售统计数据、累计已售数据、累计未售数据等进行统计描述,本文主要从以下几点进行考虑1通过SPSS软件的查缺失值功能,检测所查数据是否有缺失值,并通过EXCEL软件计算所需要的数据。2通过SPSS软件画每户面积和已售统计均价的散点图,找出两者之间的关系。3将每个区域的已售统计均价画成箱图,分析地区差异对已售统计均价的影3响。4由于不同区县都位于不同的环线,根
6、据不同的区县与已售统计均价的关系分析得出环线对已售统计均价的影响。5通过分析和查资料寻找小区环境与已售统计均价的关系。最后在按上述思想进行北京商品住宅房的价格分析,其统计的工具主要是EXCEL和SPSS,利用EXCEL丰富的公式编辑,统计等功能进行处理。22针对问题二的分析本问题欲研究北京商品住宅房价格与地理位置的关系,主要需要注意以下几点1在第一问已有的已分析的数据基础上进行数据统计,主要统计方法是通过SPSS统计出在不同地区、不同环线的价格差异,进而可以分析出地理位置对房屋价格的影响;2对搜集的数据进行整理及统计计算,先按不同行政区域的房价价格统计,并计算出商品住宅房价格的变动,再通过不同
7、行政区域分析出不同环线的房屋的价格变动;从上面的统计数据可以看出,该问是一个多元统计问题,即地理位置对北京商品住房价格的影响,主要分析思想如下先整体按不同区域分析,分析过程为在EXCEL中画出不同行政区域的价格条形图;利用SPSS统计软件对房屋面积和房屋均价进行相关性分析,分析其之间的相关性;利用SPSS软件对不同区县和房屋均价进行正态检验,分析结果是否通过显著性检验,是否能够进行方差分析;利用SPSS软件对不同区县和房屋均价进行独立样本T检验,判断两个样本之间的均值差异是否有显著性。整个过程需要做大量的统计分析,包括绘图及数据归纳整理,主要工具有EXCEL和SPSS。23针对问题三的分析本问
8、题首先要通过资料文献了解地理位置和环境因素对北京商品住宅房价格变动的影响,根据这些信息最大化地提取关于影响北京商品住宅房价格因素指标,再结合所查的数据,根据不同小区环境、不同环线、不同房屋面积分析不同类型商品住宅房的价格差异,最后给地产开发商提供一定的参考建议。三、模型假设及符号说明31模型假设1假设所查的数据中所有数据是合理可靠的。42假设所查数据中每一个房地厂所建的房子全为商品住宅房。3假设除地理位置区县,环线,舒适度(房屋面积,小区环境外,影响商品住宅房价格的其他因素保持不变。4假设在最近几年间,没有发生重大经济或房地产事件。5假设数据代表整个城市数据,数据具有代表性。32符号说明V4每
9、户面积V5已售统计面积V6已售统计均价V8平均每户面积V10累计未售套数四、模型的建立与求解41针对问题一的模型建立及求解由问题分析可知,这属于多信息变量的统计描述模型,该问题主要是对商品住宅房价格信息进行统计描述,其方法是分别对商品住宅房价格信息行政区域,房屋面积进行统计,该操作在EXCEL和SPSS中进行。由于通过SPSS的统计发现所查数据1中商品住宅房的信息没有缺失值。如下图表1所示,说明该数据很好。因此没有必要对数据做修复处理。(数据见附件1)统计量名称行政区域已售统计V4V5V6累计已售V8累计未售V10退房有效100210021002100210021002100210021002
10、10021002缺失00000000000表1由于所下载的数据表数据种类较多,因此剔除了几项不需要的数据分别有已售统计的销售金额,累计已售面积。由于需要考虑面积对商品住宅房价的影响,且表中没有每户的面积数。因此通过EXCEL表的计算很容易得出每户的面积数。由于该数据为当天的统计数据,有大量的房地产当天没有房屋销售,因此截取了前段的有房屋销售的进行统计分析。(数据见附件2)5通过SPSS软件可以画出每户面积和已售统计均价的散点图如下,图1可以清晰地看出已售统计均价和每户面积具有相关性。且房屋面积较大的住房价格较高,因此房屋面积影响了商品住宅房的价格。图16图2从上图,图2中可以明显的看出,位于东
11、城、西城、朝阳和海淀的房价较其他区域较高,且位于偏远地区如昌平、平谷、顺义房价较低,因此不同的区县影响了商品住宅房的房价。二环跨过四个中心城区分别是东城、西城、宣武和崇文区;三环四环跨过五个近郊区朝阳、海淀、门头沟、丰台,通州;五环跨过四个远近郊区房山区、顺义区、昌平区、石景山、大兴区;六环跨过四个远郊区密云县、延庆县、怀柔区、平谷区。从图2中可以看出东城、西城、宣武和崇文区的统计均价都比较高,且有的房价达到了八万,所以二环的商品住宅房价较高,朝阳、海淀、门头沟、丰台,通州的房价中等,不算太高,有的达到了四万左右;房山区、顺义区、昌平区、大兴区的房价达到了两万五,所以五环的房价相对而言较低;密
12、云县、延庆县、怀柔区、平谷区的房价均在两万元以下,所以六环的房价最低,因此不同的环线影响了商品住宅房的房价,且位于北京城区的房价较郊区较高且越到偏远郊区房价越低。小区环境包含四个环境,分别是治安环境、绿化环境、商业环境和教育环境,这四个环境的好坏对我们以后的生活有很大的影响,它直接影响了以后我们在这个小区的生活质量。7治安环境是指小区周围的治安状况,买房前许多人都会事先了解当地的偷盗数量和犯罪情况;绿化环境指小区内的绿化情况,小区的绿化率越高,小区内的空气质量就越好。如果要买现房,许多人优先会考虑的是小区的绿化情况;商业环境是指小区周围是否有超市、商场等购物场所。如果离小区不远的地方有大型的家
13、具、建材卖场,人们就更会选择在该小区购房;教育环境是指配套的幼儿园、小学、初中、高中等。如果该小区为学区房,孩子入学的问题就可以迎刃而解了。那么人们购买该小区的可能性会很大2。有了以上这些优点的小区,那么该小区的房价也会相应的增高,从而会导致人们的购房压力急剧上升。因此小区的环境不同,也会导致商品住宅房价的不同。综上所述,区县、环线、房屋面积和小区环境都会影响商品住宅房的价格。42针对问题二的模型建立及求解由问题分析可知,这属于多信息变量的统计描述模型,该问题主要是对商品住宅房价格信息进行统计描述,其方法是分别对商品住宅房价格信息行政区域,房屋面积进行统计,该操作在EXCEL和SPSS中进行。
14、对于统计均价和房屋面积采用相关性分析。相关关系是现象间不严格的依存关系,即个变量之间不存在确定性的关系,相关关系中当一个或几个相互联系的变量取一定数值时,与之相应的另一变量也会发生变化。但其关系值不是固定的,往往按照某种规律在一定范围内变化。通过查阅资料找到相关系数的相关强度如下表2相关系数08100608040602040002相关强度极强相关强相关中等程度相关弱相关极弱相关或无关表28表4通过表3的分析,发现PEARSON相关性系数为0293,因此每户面积和已售统计均价具有弱相关性。虽然每户面积对已售统计均价有影响,但相关性不强。(数据见附件3)对于区县和商品住宅房的销售价格使用独立样本T
15、检验。由于行政区域为分类变量,而SPSS只能研究数值与数值之间的关系。因此只能新建一个变量为区域是数字变量,将行政区域该分类变量转化成数值变量放入区域变量中,从而进行正态检验。通过正态检验,由上表4发现SIG0119005因此不相关。可以使用独立样本T检验。独立样本T检验是分析数值变量和分类变量之间的关系。两独立样本T检验此方法主要用于检验两个样本知否来自具有相同均值的总体。在显著性水平取005的前提下,SIG值大于005就表明不能否定原假设。SIG值越大,表明原假设成立的概率越大,也就是这个因素对结果越不可能有明显影响。看方差是否齐性,由下表5可以发现SIG值小于005,说明两组的方差不齐,
16、SIG相关性每户面积已售统计均价每户面积PEARSON相关性1293显著性(双侧)003N9999已售统计均价PEARSON相关性2931显著性(双侧)003N9999在01水平(双侧)上显著相关。表3模型汇总和参数估计值因变量已售统计均价方程模型汇总参数估计值R方FDF1DF2SIG常数B1线性002242919991191964116103157自变量为区。9为000可以看出两个样本之间的均值差异有显著性。那么就会拒绝H0假设,说明不同的区县对商品住宅房价有很大影响。表543针对问题三的模型建立及求解商品住宅可分为不同的类型,可根据商品住宅的容积率、建筑面积以及价格来分类,按此分类标准可分
17、为三类中小普通商品住宅、大户型普通商品住宅、中高档商品住宅。(一)中小普通商品住宅中小普通商品住宅需要同时符合三个条件容积率大于10;商品住宅单套建筑实际面积小于90平方米;商品住宅单套实际成交价小于同级别土地商品住宅平均交易价格12倍。(二)大户型普通商品住宅同时符合以下三个条件为一般商品住宅,容积率大于10;商品住宅单套建筑面积,大于等于90平方米小于144平方米;商品住宅单套实际成交价小于同级别土地商品住宅平均交易价格12倍。(容积率是指总建筑面积与建筑用地面积的比值。由于高层建筑的存在,容积率数值可以大于1。)(三)中高档商品住宅符合以下三个条件之一的为中高档商品住宅,容积率小于等于1
18、0,商品住宅单套建筑面积大于等于144平方米,商品住宅单套实际成交价大于等于同级别土地商品住宅平均交易价格12倍以上。在商品住宅体系中,中小普通商品住宅占有高达62506667的比例、大户型普通商品占总数22222500,中高档商品住宅仅仅占有11111250的比例3。因为中小普通商品住宅有广大的客户需求群体。因此中小普通商品住宅相对于大户型普通商品住宅和中高档商品住宅的价格较低。大户型普通商品住宅的房屋面积相对较大,因此价格相对有点高,但也能满足部分人的需要。中高档商品住宅配置较好,房屋面积很大。由于价格很高因此只有小部分富豪能购买。单个样本检验检验值0TDFSIG双侧均值差值差分的95置信
19、区间下限上限已售统计均价135561370002048048817492872346810区24172137000823275689110当每户面积为50100平时,通过EXCEL的筛选功能选出EXCAL表中房屋面积从0到90的数据,将已售统计均价乘以总房屋面积获得每户的价格,然后求和,且将房屋面积求和,将该数据除以总房屋面积获得已售统计均价平均为26855元/平。因此中小普通商品住宅的房屋均价为26855元/平。同理可以算出大户型普通商品住宅的房屋均价为29095元/平。中高档商品住宅的房屋均价为36481元/平。对房地产开发商的建议有以下几点1、从高周转到精细需求开发。从青年社群社区、三代
20、混住亲情社区、退养社区、教育主题社区、中产美学社区、艺术主题社区上去精细定位产品并进行系统的价值开发。2、从土地开发到生活方式运营链建设。从土地能建多少房子到以“人”为主体需求的生活方式运营链建设。3、从空间滿足到情感体验。当基本功能满足已不是问题的时候,情感体验空间成为革新产品新的基础4。六模型的优缺点61模型优点1、本篇文章充分的利用了数学软件EXCEL,SPSS软件编辑功能,灵活地运用了EXCEL软件中数据的筛选和计算,SPSS软件中的正态检验、相关性分析、独立样本T检验。这几种方法结合在一起,使得问题的处理变得更加简洁。2、本文给出了大量的图形,条分缕析,虽直观易懂,但推理严密,深入浅
21、出,结果准确。模型可操作性强,推广应用起来也很方便。62模型缺点与改进1、由于本题是在前面的统计过程中都是在理想条件下进行的,实际上,还有可能由于数据采集得不全面,造成数据方面存在一定的误差;在近几年间发生了经济危机,导致房地产方面的金融风暴。考虑以上因素进行模型的建立。2、由于该数据为当天采集得数据有大量的房地产在当天没有房屋卖出,所以当天的已售统计的均价没有数值,且累计已售也没有均价给出导致只有99个数据可以使用,数据量不够大。所以可能会导致一些因素对销售价格的影响不够准确。改进方案以后多做实际的调查,获取大量的有效数据,从而研究出更加具有价值的结果。七模型评价与推广71模型评价本篇文章很
22、好地运用了正态检验、相关性分析和独立样本T检验。可以通过分析,清晰地看出数值变量与数值变量的关系和数值变量与分类变量的关系。72模型推广本文建立的相关性分析模型可以广泛的日常生活当中例如城市社区老年人的健康与生活方式的关系,抑郁,焦虑与生活事件的特点的关系。11八、参考文献1数据来源北京住宅成交数据中心,HTTP/DATAHOUSE163COM/BJ/2小区环境包含哪些方面,HTTP/JINGYANBAIDUCOM/ARTICLE/E4511CF32CE4E92B845EAFFAHTML3小区环境对商品住宅房房价的影响HTTP/BAODINGHOUSE163COM/14/0808/10/A34
23、A7QSJ025109LEHTML4给开发商的建议,HTTP/WENKUBAIDUCOM/VIEW/8C29BCACD15ABE23492F4D18HTML12三、附件描述性统计量STATISTICBOOTSTRAPA偏差标准误差95置信区间下限上限已售统计均价均值28548561420912922826000993115747标准差144114741412816381091119032517723868N99009999每户面积均值12996656501153914305标准差67615179172105001781916N9900999913AUNLESSOTHERWISENOTED,BOOTSTRAPRESULTSAREBASEDON100BOOTSTRAPSAMPLES14单个样本统计量STATISTICBOOTSTRAPA偏差标准误差95置信区间下限上限已售统计均价N138均值204804957414955317535412350401标准差177485539134614421251494798720774444均值的标准误1510857区N138均值8230134762893标准差400101413337154240均值的标准误341AUNLESSOTHERWISENOTED,BOOTSTRAPRESULTSAREBASEDON1000BOOTSTRAPSAMPLES