基于极值理论的河南省火灾数据分析.doc

上传人:99****p 文档编号:1716220 上传时间:2019-03-13 格式:DOC 页数:9 大小:30KB
下载 相关 举报
基于极值理论的河南省火灾数据分析.doc_第1页
第1页 / 共9页
基于极值理论的河南省火灾数据分析.doc_第2页
第2页 / 共9页
基于极值理论的河南省火灾数据分析.doc_第3页
第3页 / 共9页
基于极值理论的河南省火灾数据分析.doc_第4页
第4页 / 共9页
基于极值理论的河南省火灾数据分析.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、基于极值理论的河南省火灾数据分析摘要:进入 21 世纪以来,随着经济的飞速发展,造成火灾的各种因素越来越多,我国的火灾发生频率一直以来居高不下。本文基于河南省 2007 年至 2012 年的火灾数据,采用极值方法对河南省近 6 年的直接经济损失较大的极端火灾进行分析。得出河南省火灾直接经济损失重现水平,其中 5 年期重现水平为 322.3 万元,为下一步消防部门安排工作重心提供参考依据,为今后火灾数据的统计分析工作提供研究方向。 关键词:火灾形势;直接经济损失;极值理论 中图分类号: X928 文献标识码:A 近年来,随着经济社会的迅猛发展,致灾因素明显增多,火灾发生几率和控制难度相应增大,河

2、南省每年发生火灾五千多起,伤亡百余人,造成的直接财产损失超过 1 亿元,给人们的生命财产造成巨大损失,因此,人们希望能过预知灾害的发生,以便采取针对性的措施减少火灾损失。 火灾的发生具有很大意义上的随机性,并且造成火灾的原因多种多样,火灾过程复杂多变,对于火灾现象的研究现在仍在继续,通常采用统计的方法来对火灾原始数据进行分析。有些人认为采用统计的方法对火灾数据进行分析并不能帮助我们更好的理解火灾发生发展的整个屋里过程,然而极值分析可以通过火灾原始数据得到很多有用的信息。本文主要研究通过一元极值理论对 20072012 年河南省火灾原始数据进行分析。 一、利用极值理论进行火灾数据分析 (一)基础

3、极值理论 从概率的角度来看,随机变量中极端变异的数据称为极值;从统计学的角度来看,极值是随机变量中极大值和极小值的统称。极值统计理论对数据进行分析的主要任务就是根据基于某样本的观测数据的极值建立一个概率模型,但是这需要观测数据具有一定的特征,主要有以下三个要求:(1)观测数据是随机变量;(2)该随机变量的底分布保持不变,若有变化,也应该可以通过数据处理来降低这些变化带来的影响;(3)观测数据中的极值之间是相互独立的,不能有潜在的联系,若有联系,可以采用一些合理方法对其进行处理。极值类型定理又称最大值极限分布定理,它表明在经过线性变换后,独立同分布的极大值序列依分布收敛于一个非退化分布。也就是说

4、,在经过标准化以后,极值的渐进分布必为 Gumbel、Frechet、Weibull 三种类型之一。这一定理是极值理论的核心内容,它提供了类似于中心极限定理的极值收敛定理。 (二)阈值模型和选取 区组最大模型会造成数据的极大浪费,而我们关心的是分位数的估计,因此利用超过某一阈值的极值数据建模,这种抽取极值的方法就称为 POT 方法(Peak over threshold) ,即阈值法。考虑超过阈值 u 的那些观测值 X,可以利用超阈值分布或超出量分布函数来描述。广义Pareto 分布(generalized Pareto distribution) ,简记为 GPD 分布。GPD 分布专门用于

5、描述超过特定阈值的观测数据集的概率分布特征。 阈值越高,超过阈值的样本数就越少,则参数估计的方差增大。反之,虽然增加了估计精度,但又不符合超出量服从 GPD 分布的要求条件。然而,阈值的选取至今没有一个统一方法。如何合理的确定阈值仍是现阶段极值理论研究中亟待解决的问题。目前选取阈值的方法主要有图解法与计算法两大类。 (三)河南省火灾直接财产损失分析 以河南省 2007-2012 年 6 年间的火灾数据为基础进行分析,以图 1.1为例,为河南省火灾损失值数据的平均剩余寿命图及相应的 95%置信区间,阈值单位为“千元” 。由图可见,从 u=0 到 u=500 图形为曲线,从直到u=500 到 u=

6、4000 图形近似为直线,超过 u=1000,图形急剧下降。这表明应该取 u=1000,然而实际情况中在两万多个多个数据中超过 1000 的数据较少,造成数据的浪费。因此我们取阈值为 0 到 500 之间。进而,我们采用判断 u 值改变引起估计量的变化来确定 u 值。 在一个阈值取值范围内,利用超出量估计广义 Pareto 分布的参数,若初始阈值对应的超出量近似为广义 Pareto 分布,则对大于的值,形状参数的估计值应该保持不变。而却是 u 的函数,这里是区组最大值的极限分布,即广义极值分布中的尺度参数。 图 1. 1 河南省 2007-2012 年全省火灾直接经济损失平均剩余寿命图 由上述

7、情况可知,若选择作为阈值是合适的,那么相应的超出量服从广义 Pareto 分布,则考虑大于的 u,其相应的估计量与保持不变。考虑到抽取样本是随机进行的,这些估计量不可能都为常数,但是它们应该在一个能够接受的抽样误差范围内波动。根据平均剩余寿命图的作法,作以及关于 u 的曲线并计算相应的 95%置信区间,在曲线中能够使两个估计量保持为常数或在小范围内波动的最小 u 值即可以被选作阈值。通过对 0 到 500 之间平均选取的 100 个值进行 GPD 模型估计得出大致的阈值范围为(400,500) 。 从概率图来看,模型的拟合效果很好,绝大部分点都在直线上,从分位点来看,在经济损失低于 3000(

8、千元)时,所有点都在直线上,在高于 3000(千元)时仅有 1 个点偏离较大,可以作奇异点处理,因此通过阈值模型诊断图不能否定模型。从重现水平图上看以看出随着重现期的增加,重现水平上升趋势越来越快。 在采用阈值模型计算出估计量以后,可以与轮廓似然函数的结果进行对比,有可能能够得到更加精确的置信区间。图 1.5 为河南省火灾直接经济损失阈值模型中的轮廓似然函数。通过河南省全省火灾直接经济损失阈值模型中的轮廓似然函数得到形状参数的估计值为 0.106,95%置信区间为-0.535,0.748,根据似然函数微调后的 95%置信区间为-0.367,1.036,差别不大。其不同重现期重现水平如表 1.1

9、 及图 1.5 所示。表 1.1 中 40 年、50 年和 100 年重现水平的置信区间下限已经小于 0了,因此不考虑它们。 表 1. 1 2007-2012 年河南省火灾直接经济损失重现水平 重现期(年) 95%置信区间下限(千元) 重现水平(千元) 95%置信区间上限(千元) 1 919.12 1540.71 2162.30 2 1330.33 2230.48 3130.62 3 1507.12 2658.06 3809.00 4 1573.16 2972.76 4372.36 5 1582.40 3223.55 4864.70 6 1560.12 3432.90 5305.67 7 15

10、19.30 3613.08 5706.86 8 1467.12 3771.56 6075.99 9 1407.82 3913.22 6418.61 10 1344.03 4041.44 6738.85 20 658.99 4921.60 9184.21 30 30.93 5467.21 10903.48 40 - 5868.77 12261.84 50 - 6188.78 13398.50 100 - 7232.43 17422.65 图 1.3 河南省电气火灾直接经济损失重现水平 图 1.6 为基于阈值模型的河南省全省火灾直接经济损失 5 年期重现水平轮廓似然图。从图中可以看出,重现水平的置

11、信区间并不对称,并且随着重现期的增大,这种不对称性越来越明显。因此我们需要根据轮廓似然图对重现水平估计值的置信区间进行调整。最后得到 5 年期重现水平估计值为 3223.55 千元,95%置信区间为2190.04,9786.90,而根据统计数据在近 5 年内发生的直接经济损失最高的火灾为 4498.49 千元,调整后的置信区间也能够包括这场火灾,但比估计值更加保守。 图 1. 6 2007-2012 年河南省火灾直接经济损失 5 年期重现水平轮廓似然图 二、郑州市火灾数据极值分析 郑州市作为河南省的省会,经济发达程度较高,同时火灾发生频率也远远超过其他地市,郑州市 2007-2012 年六年间

12、共发生火灾 8197 起,占到了全省火灾总数的 37.8%,火灾形势比较严峻。郑州市火灾直接经济损失平均剩余寿命图及不同阈值的参数估计图见图 1.12 和 1.13。根据图1.12 可以看出从一开始即 u=0 时图形就已经为直线,因此根据平均剩余寿命图并不好判断 u 的具体值,只能根据不同阈值的参数估计来确定阈值。最终选择 u=50,整个数据集中超过阈值的有 186 个数据,占到总体的 2.27%。 图 1. 12 郑州市 2007-2012 年火灾直接经济损失平均剩余寿命图 图 1. 13 郑州市 2007-2012 年火灾直接经济损失阈值参数估计 图 1. 9 河南省 2007-2012

13、年全省电气火灾直接经济损失阈值模型诊断图 从概率图来看,模型的拟合效果很好,绝大部分点都在直线上,从分位点来看,在经济损失低于 300(千元)时,所有点都在直线上,在高于 300(千元)时仅有 3 个点偏离较大,可以作奇异点处理,因此通过阈值模型诊断图不能否定模型。从重现水平图上看以看出随着重现期的增加,重现水平上升趋势越来越快。 在采用阈值模型计算出估计量以后,可以与轮廓似然函数的结果进行对比,有可能能够得到更加精确的置信区间。通过河南省郑州市火灾直接经济损失阈值模型中 的轮廓似然函数得到形状参数 的估计值为 0.106,95%置信区间为-0.041,0.396,根据似然函数微调后的 95%

14、置信区间为-0.015,0.432,差别不大。仅有一场损失为 50 万的火灾没有落在置信区间里面,说明阈值模型较为准确。 图 1.15 为基于阈值模型的郑州市火灾直接经济损失 5 年期重现水平轮廓似然图。从图中可以看出,重现水平的置信区间并不对称,并且随着重现期的增大,这种不对称性越来越明显。因此我们需要根据轮廓似然图对重现水平估计值的置信区间进行调整。最后得到 5 年期重现水平估计值为 560.78 千元,95%置信区间为416.48, 970.73,而根据统计数据在近 5 年内发生的直接经济损失最高的火灾为 500 千元,调整后的置信区间能够包括这场火灾,而且比估计值更加保守。 图 1.

15、15 基于阈值模型的郑州市火灾直接经济损失 5 年期重现水平轮廓似然图 三、结论与展望 (一)结论 采用极值理论对河南省全省、河南省电气火灾、郑州市及洛阳市火灾数据进行分析,研究极端损失火灾事件的规律。在利用极值理论对极端损失火灾事故进行研究时,根据不同的数据集科学的选取不同的阈值,根据阈值模型计算火灾直接经济损失的重现水平,并通过重现水平的轮廓似然估计对置信区间进行调整,得到了重现期与重现水平表,其中河南省火灾直接经济损失 5 年期重现水平为 322.3 万元,郑州市为 56.1 万元,结果较为准确,为今后的消防工作提供了一定参考。 (二)展望 基于本文的研究情况,后续的研究工作应该集中在以

16、下几个方面: (1)在采用极值理论对火灾数据进行分析时,阈值的选取方法依然需要改进,因为本文中结果有少量点没有落在置信区间内。 (2)从分析结果来看,极端火灾损失事故的极端性越来越大,如何准确的对其进行预测需要更加深入的研究。 参考文献 1景国勋,王卫敏,温宏民.基于 BP 神经网络的河南省火灾风险评价J.中国安全科学学报,2007, (8). 2郭铁男.我国火灾形势与消防科学技术的发展J. 消防科学与技术,2005, (6). 3刘海生等.基于统计数据的全国火灾形势综合评价与预测J. 中国安全科学学报 2011 年第 6 期 4郑双忠等.基于火灾统计灾情数据的城市火灾风险分析J.中国安全生产科学技术 2005 年第 1 卷第 3 期 5王静虹等.城市火灾自组织临界性判断及大火灾损失极值分析J.科学通报 2010 年第 55 卷第 22 期 6Ramachandran GProperties of extreme order statistics and their application to fire protection and insurance problemsJFire Safety Journal,1982 5(1):59-76

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。