1、,深圳人口与医疗需求预测分析,队员:广西大学 数学与信息科学学院 刘 伟广西大学 数学与信息科学学院 黄建园广西大学 数学与信息科学学院 彭 伟指导老师:广西大学 数学与信息科学学院 吴晓层,模型建立,深圳人口预测模型,深圳医疗需求预测模型,深圳人口预测模型,深圳市户籍人口与非户籍人口分析,深圳市人口年龄结构增长预测模型,深圳人口数量增长预测模型,深圳医疗需求预测模型,影响深圳市医疗需求因素分析,全市及全区床位需求预测模型,各疾病于不同医疗机构的床位需求预测模型,深圳市户籍人口与非户籍人口分析,户籍人口比例图:,非户籍人口比例图,深圳市户籍人口与非户籍人口分析,非户籍人口比例图:,深圳市户籍人
2、口与非户籍人口分析,发现:1.户籍人口与非户籍人口占总人口的比例于2000年发生转变,户籍人口比例由原来的逐年下降转为逐年上升,非户籍人口比例由原来的逐年上升转为逐年下降。2.其变动特点的无后效性。利用马尔可夫预测方法,分析出未来深圳市的户籍与非户籍人口比例的发展态势。,符号说明:,深圳市户籍人口与非户籍人口分析,模型建立:,深圳市户籍人口与非户籍人口分析,将其化作矩阵形式得,其中,为状态转移矩阵,再由递推关系可以得到马尔可夫预测模型:,深圳市户籍人口与非户籍人口分析,深圳市户籍人口与非户籍人口分析,深圳市户籍人口与非户籍人口分析,深圳市户籍人口与非户籍人口分析,未来户籍与非户籍人口比例的变动
3、状况:,误差分析:,深圳市户籍人口与非户籍人口分析,发现:实际与预测比例之间的误差较小,整体平均相对误差仅为1.67%,说明模型的预测效果较好,能较为切实合理的反应出未来人口比例的变化。,深圳市人口年龄结构增长预测模型,问题分析: 纵观各种人口增长预测问题,都不约而同的涉及到三个基本因素,即生育率,死亡率,净迁移率. 而在常用的人口预测模型中,Leslie矩阵模型在处理年龄结构有其独特的优势。基于以下原则:应符合人口繁衍变化的自然特征。应能反映各年龄段人口数量随时间变动的特征。能根据不同社会的需求提供相应的选择。,符号说明:,深圳市人口年龄结构增长预测模型,假设研究的人群中最大年龄为M岁,将其
4、按年龄大小等间隔地划分为n个年龄段,各年龄段表达式如下:,以每5岁为一组,最大年龄为100岁,则其分组为04,9599岁,100岁以上,共n=21个年龄段),人口年龄的分布向量,人口年龄段的划分与离散化处理:,深圳市人口年龄结构增长预测模型,然后再对时间离散化,设初始时间为 ,并记 则 表示经过k个以 为周期间隔的时间段。,深圳市人口年龄结构增长预测模型,各年龄段变化率与人数变动的处理:,深圳市人口年龄结构增长预测模型,深圳市人口年龄结构增长预测模型,人口迁移因素的处理:,深圳市人口年龄结构增长预测模型,1、对于存活率与净迁入率数据的设定:我们观察题目附件24的数据并结合人口增长的规律分析发现
5、,存活率、净迁入率与人口数之间存在着以下关系:,也就是说,因此,我们便可以利用消除随机影响后的各年龄段人口数的变动,来代替存活率与净迁入率,简化了数据的收集工作,然后便可以结合Leslie矩阵,预测出未来深圳市人口年龄结构的变动情况。,深圳市人口年龄结构增长预测模型,2、对于实际生育率数据的设定:,实际生育水平关系到一个模型的准确度,而由于缺乏这方面相关的数据。因此,我们认为2000年深圳市各年龄段的实际生育率近似的等于2000年所进行的第五次人口普查中广东省城市人口各年龄段生育率。对于生育率数据出现的误差,我们加入了目标总和生育率进行调整,并选取最佳的目标总和生育率作为实际生育率的调整参数,
6、从而降低了预测的误差。,我们采用不同目标总和生育率进行调整,并将得到的预测数据与附件中所给出的实际数据之间的相对误差进行比较后发现,其预测误差均为1214%。,深圳市人口年龄结构增长预测模型,2005年不同目标总和生育率下各年龄别人口变化,深圳市人口年龄结构增长预测模型,2010年不同目标总和生育率下各年龄别人口变化,发现:当目标总和生育率为1的时候,模型的总体相对误差较少。因此,后文的预测结果皆基于目标总和生育率1来进行分析。,深圳市人口年龄结构增长预测模型,Leslie矩阵的建立:由于人口变量在时间上的递推关系,描述了人口发展变动过程的基本关系。而上述的发展过程,也可以将其表示成一种矩阵形
7、式,由此,从公式(1)可得到一个线性差分方程组,并将其以矩阵形式表示为:,深圳市人口年龄结构增长预测模型,其中,称L为Leslie矩阵,则称L为Leslie矩阵,深圳市人口年龄结构增长预测模型,于是,由此,若已知初始时刻该人口年龄结构的年龄分布向量 ,则可计算出 年该人群的年龄分布向量 ,从而对该人口年龄结构的数量作出科学的预测和分析。,深圳市人口年龄结构增长预测模型,由上图中可以看出,从2005年到2020年,014岁、3039岁、70岁及以上的年龄段人口的增长速率缓慢,基本维持不变,而1529岁、4069岁的年龄段人口的增长幅度较大。说明了深圳市未来十年仍然会有大量年轻的外来人口流入,同时
8、中老年人口的迅速增加也为深圳市人口老年化问题发出了信号。,深圳市人口年龄结构增长预测模型,深圳人口数量增长预测模型,问题分析:,近十年来,深圳市人口数量由于外来流动人口而迅速增加,预测未来人口数量的发展对深圳市的人口规划、政策制定都具有非常重要的实际意义。为得到深圳人口数量的发展趋势绘制出2001年2010年深圳市的年末常住人口的散点图以观察其发展趋势,观察发现该数据具有曲线增长趋势,考虑使用多次多项式拟合,重点采用二次多项式拟合运用线性最小二乘求出拟合多项式,并运用此拟合多项式预测未来十年深圳市的总人口数量。,模型假设:,不考虑战争、自然灾害等社会因素的影响。不考虑生存空间等自然资源的限制。
9、,符号说明:,深圳人口数量增长预测模型,2001年2010年的总人口数量散点图,深圳人口数量增长预测模型,取n=2,则二次多项式为解之,得,深圳人口数量增长预测模型,20012010年深圳市实际总人口数与拟合数据:,深圳人口数量增长预测模型,误差分析:,整体平均相对误差0.37%,深圳人口数量增长预测模型,影响深圳市医疗需求因素分析,模型准备:逐步回归是一种按照变量的边际贡献选择自变量的方法。边际贡献是某一变量加入到模型中或从模型中删除对回归平方和模型解释力(样本决定系数)的影响。如果一个变量加入到模型中或从模型中删除后对回归平方和或模型解释力变化不大,则可以认为该变量边际贡献较小,因此这一变
10、量就没有必要加入到模型中;反之,则认为该变量边际贡献较大,应当保留或加入到模型中。,多元线性回归变量定义:,影响深圳市医疗需求因素分析,目标:,建立一个包含所有对因变量有影响的变量,而不包含对因变量影响不显著的变量的回归方程。其具体的回归方程模型为: 其中 为回归系数。,影响深圳市医疗需求因素分析,2002年2010年深圳市的各项数据,影响深圳市医疗需求因素分析,在建立回归方程时,如果变量的单位选取不当,模型中各变量数量级会差异悬殊,往往会对模型的建立与解释照成影响,因此,为了使数量级别大体上一致,我们把死亡率乘以1000,对病床使用率乘以100,再运用软件对其进行多元逐步回归分析,依次得到相
11、应的回归方程为:,影响深圳市医疗需求因素分析,医疗床位数的方差分析表:,每个模型在整体上都是显著的(通过F检验),影响深圳市医疗需求因素分析,医疗床位数的系数检验表,影响深圳市医疗需求因素分析,P-P图:,表面残差基本符合正态分布随机假定,说明我们所拟合得到的模型(1)是有效可行的。,影响深圳市医疗需求因素分析,全市及全区床位需求预测模型,问题分析随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量,这些将导致深圳市未来的医疗需求与现在有较大的差异。通常的病床需求量可由以下公式计算:,对已有的数据进行二次指数平滑拟合和多项式拟合,比较两者的误差之后选择
12、三次多项式拟合,并以此为基础预测未来全市和各区医疗床位需求。,符号说明:,全市及全区床位需求预测模型,数据的预处理运用已经收集到的20022010年深圳市总人口数、住院病人数、平均住院天数、年平均病床工作日,计算出实际住院率,全市及全区床位需求预测模型,模型建立与模型求解:,20022010年深圳市的实际住院率和医院病床需求量,全市及全区床位需求预测模型,计算一次指数平滑值、二次指数平滑值其中 为已观察到的时间序t=1,2,T; 为权重系数,全市及全区床位需求预测模型,二次指数平滑拟合2002-2010年深圳市床位实际需求量:,全市及全区床位需求预测模型,模型二:多项式拟合,病床需求量呈曲线增
13、长趋势,故考虑采用二次多项式进行拟合,全市及全区床位需求预测模型,医院病床需求的二次拟合,二次拟合图形在2010年以后呈现出下降的趋势,但是根据前文回归分析所得到的结论来看医疗床位需求在未来的一段时间内是不可能下降的,故二次拟合不可取。转而采用三次多项式拟合,取n=3,则拟合后的三次多项式为,全市及全区床位需求预测模型,2002-2020年全市医院病床需求量三次拟合数据,全市及全区床位需求预测模型,预测2011-2020年深圳市床位需求量:,全市及全区床位需求预测模型,全市医院病床需求的三次拟合:,全市及全区床位需求预测模型,2010年各区人口数量及人口在全市中所占的比例,全市及全区床位需求预
14、测模型,2011-2020年深圳市各区的医疗床位需求量预测数据(单位:张),全市及全区床位需求预测模型,各疾病于不同医疗机构的床位需求预测模型,问题分析,要预测出不同疾病对于不同医疗机构的医疗床位需求,一方面得了解各种疾病的特征,考虑不同类型疾病的之间的差异,如患病率,发病人群的年龄、发病人群的特征、数量,平均住院天数等等,另一方面还得考虑医疗机构的在医疗服务状况,医疗配置以及医疗水平等方面因素的影响,如果站在患者的角度来看还得考虑患者对于医疗机构选择随着社会、经济、时间等因素的影响。因此,我们结合前文所得到的二次、三次多项式模型、Leslie模型,马尔可夫模型分别建立针对不同情况的医疗床位需
15、求模型。,模型准备:,名词解释平均病床开放日数:指区域内各医院每日晚12点钟开放病床数之和与365之比。平均住院天数:指出院人数实际住院总天数与实际出院数之比。医疗机构的划分,各疾病于不同医疗机构的床位需求预测模型,住院人员需求构成图,各疾病于不同医疗机构的床位需求预测模型,各级医疗机构的服务指标:,各疾病于不同医疗机构的床位需求预测模型,符号说明:,各疾病于不同医疗机构的床位需求预测模型,模型一:,某种病在某个特定医疗机构的床位需求量,一方面与病患选择该特定医疗机构的概率有关,另一方面也与该病住院人数与总住院人数的比例有关,因此,我们基于前文的三次床位需求预测模型,得到模型一:,各疾病于不同
16、医疗机构的床位需求预测模型,实例分析:,少儿肺炎各级医疗机构的床位需求预测,以少儿肺炎为例,根据深圳市2010年卫生统计年鉴有关少儿肺炎的相关数据,代入模型一即得各个年份的各级医疗机构床位需求预测值。,各疾病于不同医疗机构的床位需求预测模型,模型二,我们从深圳市卫生年鉴可以了解到,对于不同的疾病一般有着不同的住院天数,如慢性疾病的住院天数一般较长,急性疾病的住院天数一般较短。同时,不同医疗机构的病床工作日也存在着差异。根据文献可知,住院天数与病床工作日的差异,会对床位需求产生较大的影响。因此,我们将住院天数与病床工作日考虑进来,并基于前文的二次人口数量预测模型,得到模型二,各疾病于不同医疗机构
17、的床位需求预测模型,实例分析,脑血管病各级医疗机构的床位需求预测,各疾病于不同医疗机构的床位需求预测模型,以心脑血管为例,根据深圳市2010年卫生统计年鉴有关少儿肺炎的相关数据,代入模型三即得各个年份的各级医疗机构床位需求预测值。,模型三,考虑到一些疾病有较为明显的年龄分布特征,对于不同的年龄段有着不同的住院率,如肺癌在中老年人群间的发病率较高,在年轻人群间的发病率较低。因此,我们将把年龄别人口数量与年龄别住院率(以向量形式 表示)考虑进来,结合前文Leslie模型所得的年龄人口向量 ,得到模型三。,各疾病于不同医疗机构的床位需求预测模型,实例分析 根据文献12所给出的常见慢性疾病的年龄分布特
18、征,由下表我们可以了解到一些慢性疾病的年龄别患病率,考虑到如高血压、糖尿病等虽然患病率较高,长久以来会对身体及患者的生存质量造成很大的影响,但其实际住院率较低,患者一般是由于其引发的一系列并发症才会住院的,所以我们将不考虑高血压、糖尿病这种短期危害性较小的慢性疾病。而癌症因为其危害性较大,市民会对其较为重视,一般会选择住院治疗,因此,可以认为其近似等同与住院率。下面便以癌症(恶性肿瘤)为例,年龄别患病率结合模型三进行预测。,常见慢性疾病的年龄分布特征,各疾病于不同医疗机构的床位需求预测模型,2015年癌症按年龄别与各级医疗机构的床位需求预测值,各疾病于不同医疗机构的床位需求预测模型,2020年
19、癌症按年龄别与各级医疗机构的床位需求预测值,各疾病于不同医疗机构的床位需求预测模型,由2015与2020年比较可知,各年龄段癌症的患病人数正在逐步快速的增长,尤其是5069岁年龄段的癌症人数将近翻了一倍,其主要原因是由于深圳市慢慢开始步入老龄化的结果所造成的(由前文Leslie模型预测结果可以推断出)。因此,应适当的增加这方面的床位数与相关卫生技术人员。,模型四,各疾病于不同医疗机构的床位需求预测模型,考虑到深圳市时户籍人口与非户籍人口的生活经济状况的差异,对于非户籍人口来说,由于其生活条件、工作环境等方面相对较差,其患病率与同年龄别的户籍人口相比较高。因此,我们将户籍与非户籍人口之间差异的因
20、素考虑进来,并在模型二的基础上引入前文马尔可夫预测模型,得到模型四。,模型评价与改进,优点对于问题一,本文在分析近十年户籍人口与非户籍人口比例时,结合了马尔可夫模型,再以消除随机影响后的转移矩阵,得到了较高的精度,并分析了其数据变动背后的深层次原因。在预测人口年龄结构时,结合了深圳市的人口特点,加入了迁入人口因素,并在极度缺乏关于深圳市各项年龄别信息的情况下,仅利用题目所给附件23的数据并结合广东省的生育率进行调整,便建立了起一个较为符合深圳市特点的预测模型。在人口数量预测时,我们运用最小二乘法进行多项式拟合,得到了一个精度较高的二次模型。对于问题二,本文先利用多元回归分析,分析了床位需求与社
21、会经济因素、医疗配置、医疗运行指标方面的关系,为全市及各区的医疗床位需求模型提供参照,并据此建立了一个误差很小的三次拟合多项式模型。在分析不同疾病在不同医疗机构床位需求预测时,结合了各种疾病的特征、医疗机构的医疗服务状况,医疗配置以及医疗水平等方面因素,并利用前文所得到的二次、三次多项式模型、Leslie模型、马尔可夫模型,分别建立针对不同疾病状况的医疗床位需求模型。,缺点与改进在处理人口年龄结构预测模型时,由于缺乏深圳市各年龄别的实际数据以及对模型的考虑仍然存在一定的缺漏,因此,我们暂时无法得到一个十分准确的结果。对于医疗床位需求预测的模型,许多变量都是基于2010年的数据进行预测,如病患对于医疗机构的选择,我们可以运用前文所采用的马尔可夫预测法,对未来病患选择权重及发展趋势进行预测,但都由于缺乏相关数据而不得不止步。还有诸如疾病床位需求的季节性变化,疾病与社会经济发展关系的考虑等等,都可以切实的提高我们的模型的精度。,模型评价与改进,Thank You,