1、大数据在房地产市场分析中的应用摘要:大数据时代的到来为房地产市场分析提供了高效的数据分析工具,我们可以从大数据概念出发,探讨房地产大数据的构成和大数据分析技术在房地产市场中的应用。基于大数据管理模式的房屋全生命周期动态数据库,以及 GIS 空间数据和大数据分析方法的武汉市房地产市场分析的研究成果,对大数据在房地产市场分析中的应用予以总结与展望。 关键词:大数据,房地产市场,动态数据库,市场分析体系,片区市场分析,市场专题分析 中图分类号:F042 文献标识码:B 文章编号:1001-9138-(2016)05-0020-28 收稿日期:2016-02-06 1 引言 1.1 大数据概念 近年来
2、,大数据一词越来越频繁地被提及,它通常被描述为信息爆炸时代产生的海量数据。全球咨询公司麦肯锡指出:“大数据已经渗透到每一个行业和业务职能领域,决策将基于对海量数据的挖掘和分析而做出,大数据将日益成为重要的生产要素” 。关于大数据的内涵,研究机构Gartner 认为:“大数据是需要新的处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产” 。尽管目前尚未对大数据形成统一的认知,但是业界和学术界普遍认为大数据具有“4V”特征:体量大(Volume) ,大数据的数据量将达 PB、EB 、ZB 级;种类多(Variety) ,大数据是由文字、声音、视频、多媒体等组成的结
3、构化、半结构化和非结构化的多维异构数据;速度快(Velocity) ,在海量数据的情况下,大数据仍需做到实时处理;价值密度低(Value) ,应用价值大但价值密度低,通过对海量数据进行提取、处理和分析,才能获得很小一部分有用的信息。 1.2 大数据在房地产市场分析中的必要性 房地产业作为对国民经济和城市经济发展具有重大影响的产业部门,在发展中面临诸多问题,需要政府及有关部门在对房地产市场发展进行正确预判的基础上科学决策、积极引导,促进房地产业的健康发展。房地产市场拥有着海量的数据积累,房地产市场分析都将围绕这些数据展开,从而为政府及有关部门决策提供重要参考。面对数据信息的急剧增长,房地产市场分
4、析必须借助大数据的挖掘和分析技术,将海量数据转化成为有洞察力、决策力和有价值的知识,正确判断市场趋势、科学引导资源配置、服务社会经济发展。 2 房地产市场大数据的构成 房地产市场是一个由土地供应、房地产开发、房屋交易及开发企业、金融机构、经纪中介、购房者等多方参与的多层次、多结构的复杂大系统。房地产市场本身受物理世界(房屋本身) 、市场交易行为和人类社会活动(房地产相关的宏观经济环境)的综合作用,因此房地产市场大数据是有关房地产的位置空间数据、市场交易数据、参与主体动态行为数据以及与房地产相关的宏观经济、土地、人口、交通等的数据集合。 2.1 房屋基础数据 房屋既是构成房地产市场的基本物理单元
5、,也是房地产市场的交易对象。房屋基础数据包括:地理位置、房屋楼栋、建筑信息、配套设施及周边环境等。 2.2 房地产市场交易数据 交易活动是房地产市场的核心,房地产市场交易数据包括:商品房市场预售与成交量价数据、存量房市场成交量价数据、房屋抵押登记数据、房屋价格评估数据以及租赁市场量价数据等。 2.3 宏观经济、金融投资、土地、人口、交通数据 房地产业的发展状况与国民经济其他产业部门以及整个宏观经济环境紧密相关,因此房地产市场分析必须将房地产业置于整个经济系统和产业链条之中才可能得出客观有益的结论。与房地产业相关的数据包括:宏观经济、金融投资、土地规划及利用等级、土地交易信息、人口、交通及市政规
6、划等。 2.4 动态行为数据 购房者是房地产市场的主要参与主体,必须作为对市场发展具有重要影响的因素加以考量。在移动互联网时代,人们对网络信息已产生巨大的依赖性,人们通过移动互联网定制和获取有关服务时,也留下了有关需求选择、兴趣取向的重要信息,这些与房地产相关的动态行为数据中蕴含着大量对于房地产市场导向与反馈具有指示意义的人类行为模式,从中挖掘隐含信息将极大地丰富和拓展现有房地产市场分析的内容。2013 年 11 月,国家统计局已与阿里、百度等 11 家企业签署了大数据战略合作框架协议。 3 大数据分析及其在房地产市场中的应用 3.1 大数据分析及其种类 大数据分析是数据与信息、知识之间相互交
7、互的重要桥梁,大数据分析是通过分析获取传统信息分析方法无法获得的、智能的、深入的、有价值的信息和知识,其典型任务是通过对海量数据做统计性的搜索、比较,发现潜在关联,获取有用信息,从而实现模式挖掘与预测分析。大数据越来越强调日益膨胀的用户网络行为数据的积累,如何对这一类蕴含有宝贵市场信息的非结构化数据进行深入挖掘、分析、管理和应用,是我们面临的重大挑战。在房地产大数据挖掘与分析领域,主要有关联分析、聚类分析、演变和预测分析等。 关联分析,是寻找属性间的相关性,利用关联规则寻找在同一事件中出现的不同项的相关性,挖掘分析大量数据集合之间有趣的关联关系。比如通过房地产大数据分析,建立房地产相关服务与用
8、户行为之间的关联规则。 聚类分析,是将整个数据对象分成多个组群,在同一组群内部对象之间具有较高的相似度,而不同组群之间对象的差异较大。在房地产市场分析领域,借助聚类分析可以用来研究需求类型构成、片区市场分异,进而为楼盘开发类型的选择、区域房地产调控政策的制定提供科学依据。演变和预测分析,通过提取对象的重要数据进行建模,把握对象随时间变化的规律和趋势,进而进行合理预测。比如,结合人口构成变动、金融信贷发展趋势进行房地产消费趋向分析等。 3.2 大数据分析在房地产市场中的应用范围 寻找关联、发现知识、挖掘价值是大数据时代信息分析的真正需要。大数据背景下,房地产市场相关的研究工作都是围绕着海量的房地
9、产大数据展开的,基于数据挖掘算法,应用大数据分析技术,有效帮助我们从不断积累与更新的数据中提取有价值的信息,及时掌握市场发展动态、科学引导市场供需力量,合理制定产业调控政策。大数据分析在房地产市场中的实际应用日趋丰富,主要有以下几个方面: 房地产周期研究。研究房地产波动周期,寻找某个时间段内特定区域房地产的波动周期及规律,分析影响房地产波动周期的因素及其相互关系。 房地产市场发展趋势研究。分析房地产市场需求与国民经济增长、人均可支配收入、土地出让面积、房地产开发投资等因素之间的关系,运用统计回归、神经网络等方法建立模型、进行预测分析。 房地产经济预警指标体系研究。对房地产市场运行态势进行分析、
10、测度和判断,并对未来的发展状况进行预测、预报和预警,以便及时采用有效措施来平缓波动,促进房地产市场的健康、可持续发展。 房地产市场区域板块研究。针对房地产经济区域发展不均衡的现象,运用比较分析、聚类分析等方法对区域板块市场进行动态分析。 房地产市场供给研究。综合人口住房条件及分布、土地利用现状、市政规划、交通分布信息等,通过聚类及层次分析方法,科学测算区域内不同类型不同业态房屋的供给数量及各自的地理位置和发展计划。 房地产市场需求研究。利用关联分析和序列分析研究房地产客户的需求,发现购房者的消费行为模式,找出购房消费的影响因素,为制定差别化营销策略提供依据。 4 房地产市场分析中大数据应用研究
11、的初步成果 为适应大数据时代的发展要求,武汉市房产信息中心按照武汉市“智慧房管”顶层设计和“互联网+房管”建设目标,全面建成武汉市房屋全生命周期综合管理平台,极大地提升了房管信息化水平,为房地产大数据应用的开展奠定了坚实基础。基于该平台建设成果,建立了动态的房屋基础数据库,并开展基于 GIS 的武汉市房地产市场分析研究。 4.1 建立基于大数据管理模式的房屋全生命周期基础数据库 按照大数据管理模式,开展房屋基础信息调查,建设完成动态的房屋全生命周期基础数据库,掌握了武汉市全市域 8494 平方公里全部国有土地上的房屋基础信息。同时以房产管理图成果为基础,对已入库产权登记、物业管理、优保建筑、保
12、障房、房屋安全鉴定、白蚁防治、消防抗震等相关信息数据进行整合,以楼盘表为基础建立了覆盖各业务板块的主数据库,形成了以规划建设、市场管理、确权登记、使用维护和灭失注销五个房屋生命周期阶段和一个住房保障专题的平台总体结构。覆盖了全市 50 余万栋4.9 亿平方米房屋的基本信息,涵盖了 5000 多个商品房项目、1800 余个专业化物业小区、30 余万套保障性住房、209 处优秀历史建筑、3915 栋危房以及 110 余亿住宅维修资金的监管,影像化资料达 457 万卷(50TB) ,为实施全市域房屋的精细化管理提供了大数据支撑。 4.2 基于 GIS 的武汉市房地产市场分析体系研究 大数据分析以数据
13、全体或总体为分析对象,数据是核心和关键,强调从整体上观察数据的属性、特征、联系和规律。传统市场分析采用的数据抽样方法往往割裂了数据或现象之间的联系,因而分析结果难以保证准确和客观。该研究项目基于房屋全生命周期动态基础数据库,同时采集宏观投资、消费、金融贷款、土地成交、居民收入及部分开发企业、中介机构等数据,以 1998-2015 年武汉市房地产市场为研究对象,选取 1998-2015 年的总体年度及月度数据,利用 GIS 空间数据挖掘、在线联机分析等信息技术结合房地产市场分析方法,构建了一套全面、科学的房地产市场分析指标体系,对武汉市房地产市场进行了客观分析和系统研究(来源于华中师范大学合作研
14、究项目基于 GIS 的武汉市房地产市场分析体系研究课题成果) 。 基于房地产周期波动理论,根据武汉市 1998-2015 年房地产市场发展总体情况,确定房地产市场的四大影响因素:房地产政策、城市规划、城市经济基本面和市场参与主体行为。从理论、政策和适宜性三方面确定房地产市场的四个衡量维度,分别为规模适应性、结构合理性、变化稳定性和发展可持续性,具体选取指标见表 1,构建武汉市总体市场分析指标体系,对武汉市房地产市场总体景气状况进行判断。 分析采用武汉市房地产市场 1998-2015 年的年度数据对各维度的衡量指标进行计算,查看其历年走势,运用系统判定法中的多数原则确定各二级指标的合理区间并对各
15、指标的计算结果进行评价。最后根据因子载荷矩阵确定各二级指标的权重,将各二级指标标准化后加总得到规模适应性、结构合理性、变化稳定性和发展可持续性总指标,通过创建“四维玫瑰图”予以展示,市场四维玫瑰图理想状况与现实状况见图 1。四维玫瑰图的四个维度分别代表房地产市场规模适度、结构合理、变化稳定、发展持续,每一维度中将构成该维度的各个指标用不用颜色标识,对各衡量维度的整体状况、指标构成状况、指标值、合理范围及历史发展态势进行实时展示。 4.3 片区划分及板块市场分析 鉴于武汉市房地产市场区域发展不平衡,在进行片区市场分析前首先进行房地产市场片区划分(来源于华中师范大学合作研究项目基于 GIS 的武汉
16、市房地产市场分析体系研究课题成果) 。利用 GIS 平台空间数据,综合考虑土地综合质量、城市规划、行政区划并结合房地产市场自身特征,通过空间叠加分析的方法划定武汉市(三环线以内,根据市场状况适当扩展)48 个房地产市场片区(片区划分结果及 2015 年商品房成交活跃度)见图 2,并抽取部分片区从住房成交价格差异、土地开发强度差异、成交类型差异三方面对片区划分结果进行合理性验证。并选取片区市场分析指标,运用多指标聚类分析方法将武汉市 48 个片区市场分为七大类,并做片区市场演进趋势分析。以空间地理纬度演进阶段为横坐标,以时间演进阶段为纵坐标的片区市场演进时空图见图 3。 基于区域分异发展理论、市场供需理论,构建片区市场分析指标体系,对武汉市(三环线以内,根据市场状况适当扩展)各区域板块房地产市场运行状况进行分析。按照表 1 总体市场分析指标体系,根据片区房地产市场发展实际情况选取片区市场 2003-2015 年季度数据,计算分析指标,并通过指标合理区间对计算结果进行评价验证。 通过创建“片区市场供需平衡图”对片区房地产市场分析结果予以展示,科学判断市场发展趋势,片区市场供需平衡图见图 4。 4.4 房地产市场专题分析 大数据分析的一个重要方面是可视化分析,也即对数据进行归约、概化或图形描述等。通过空间集聚和近似计