1、房地产市场信息统计分析系统的构建与应用一、房地产市场信息统计分析系统建设的依据 依据 CJJT115-2007房地产市场信息系统技术规范 (下称规范 ) ,房地产市场信息系统是以计算机信息技术为基础,满足房地产开发、测绘、交易和登记等业务管理需要,并实现以上业务的信息采集、管理、统计和发布的信息系统。 规范规定房地产市场信息系统应包括 7 个子系统:统计分析与信息发布子系统;新建商品房网上备案子系统;存量房网上备案子系统;从业主体管理子系统;项目管理子系统;登记管理子系统;测绘及成果管理子系统。统计分析与信息发布子系统的建立是以其他 6 个子系统为基础,实现统计、分析和发布房地产市场信息的功能
2、。 随着除统计分析与信息发布子系统外的其他 6 个子系统的建立与完善,各系统之间的数据关联越来越紧密。虽然各子系统建立时都会有相应的统计分析功能,但各自统计产生的数据容易发生冗余。因此,建设能够综合各个子系统的数据并独立进行统计分析的统计分析与信息发布子系统刻不容缓。 二、房地产市场信息统计分析系统建设的解决方案 1.数据来源 房地产市场信息系统主要有 5 大类数据:基础数据、从业主体数据、业务数据、统计数据和发布数据。其中基础数据、从业主体数据、业务数据是由业务系统在处理各种业务过程中采集的,统计和发布数据则是通过对这些数据进行计算或提取而得到的。 7 个子系统与 5 大类数据及数据之间的关
3、系如图 1 所示。 测绘及成果管理子系统、登记管理子系统是基础服务层,共同维护基础数据,同时也产生部分业务数据;新建商品房网上备案子系统、存量房网上备案子系统、从业主体管理子系统、项目管理子系统是业务管理层,管理房地产市场活动中主要的业务数据,过程中调用基础数据和从业主体数据;统计分析和信息发布子系统是决策支持层,负责管理两类数据:关于房地产市场状态的统计数据和关于房地产市场行情的发布数据。统计数据是以基础数据、从业主体数据和业务数据为依据,提供对房地产市场信息的全面分析,形成统计报表、指标和指数等的统计分析数据,并可以进一步通过数据仓库和数据挖掘技术的引入提供决策支持功能。发布数据是以基础数
4、据、从业主体数据、业务数据和统计数据为依据,通过日常通报、报表、网站、报刊、电视、电台等途径发布的房地产市场的各种信息。 2.功能实现 统计分析和信息发布子系统作为房地产信息系统的一个子系统,能够独立运行,对历史数据的统计分析不依赖于其它子系统。因此,需要两台服务器和一个磁盘阵列来构建本系统。其中,一台服务器作为数据库服务器并管理磁盘阵列,另外一台用来构建数据的抽取、清洗与统计分析和信息发布应用服务。 统计分析和信息发布子系统的数据库采用 ORACLE 数据库,在服务器上安装 ORACLE 后,根据统计分析指标,按照新建商品房/存量房、区域、时间、价格、面积、房屋类型、购房对象等各类指标建立上
5、市商品房/存量房、签约、各种登记类型等的数据库表。这些表用来存放从基础数据库、业务数据库和从业主体数据库中抽取出来的数据。新建商品房网上备案子系统、存量房网上备案子系统、从业主体管理子系统、项目管理子系统、登记管理子系统、测绘及成果管理子系统这 6 个子系统都是基于 OLTP(On-Line Transaction Processing,联机事务处理)应用的,侧重于日常业务处理的优化设计,随着数据量的增加,系统的架构就不能满足统计分析的要求了。统计分析和信息发布子系统的数据是由其他子系统中的数据经过定期抽取、清洗所得,入库后的数据不再变化,数据量只会增加不会减少,其数据量更加庞大。因此,统计分
6、析和信息发布子系统的数据库应该倾向于对大量数据查询统计的优化设计。 为了从基础数据库、业务数据库和从业主体数据库中抽取合格的数据到统计分析和信息发布数据库,需要编写数据抽取和清洗的应用程序。各子系统都是独立运行的,不免存在冗余和相互排斥的数据。因此,从其他子系统中抽取统计分析指标所需的数据时,需要剔除各种冗余数据。对于相互排斥的数据,要建立一套规则(从业主体信息以从业主体管理子系统的信息为准;项目信息以项目管理子系统的信息为准;房屋基本信息以测绘及成果管理子系统的信息为准等) ,通过计算得到需要的数据。统计分析报表是每月提供,所以数据抽取的频率也为每月一次,可以通过建立计划任务来实现数据抽取和
7、清洗应用程序的自动运行。 最后,构建统计分析和信息发布应用服务程序。统计分析方面,应用服务可提供房屋类型、区域、价格段、面积段、时间段等单项或组合指标的统计分析报表,并产生各种曲线图、柱状图、饼图等图表和同比、环比数据。信息发布方面,包含从各子系统实时抽取的不涉及个人隐私的从业主体、项目、房源、交易等信息和一些能够发布的统计分析报表。统计分析和信息发布应用程序还需要加入权限控制,统计分析功能面向内部,需要设置用户和口令,信息发布功能面向公众,能够发布于互联网。 三、房地产市场信息统计分析系统存在问题及解决方案 1.统计时间点的不确定性 统计报表需要提供给多个部门,这些部门要求的统计时间点不同,
8、有月初的、月中的、月底的。而本系统是每月固定时间抽取,无法兼顾多个时间点的不同需求。 要解决这一问题的办法是各部门协调,尽量减少统计时间点的时间差,共用一套或几套报表,然后再在数据抽取方面寻找解决方案,建立对应时间点的数据抽取计划任务,并按照各自需求的时间点分类存放,统计时按照不同需求读取不同时间点的数据。 2.季度、年度报表的产生 由于系统数据抽取的频率为按月抽取,因此,月度报表很容易产生,而季度和年度报表的产生则相对复杂。 解决办法有两种:一种可以用月度数据累加得到,但各业务子系统在实际运行过程中历史数据会发生改变,这样得到的季度和年度数据会与实际数据产生偏差。另一种办法是再建立一套季度数据表和年度数据表,并分别建立数据抽取、清洗的计划任务,季度和年度报表产生时直接采用该季度数据表和年度数据表的数据,这种办法产生的季度和年度数据就比较准确。 马志刚/责任编辑