1、1寿命数据的参数模型摘 要:寿命分布是统计学中一类重要分布。人的寿命或者电子产品或其它物种等的寿命,其统计规律是许多行业必须重视和分析处理的。寿命数据的统计分析在大学的数理统计教材中较少涉及,本文系统的介绍这类问题的几个概念和几个常用的寿命参数模型,供学习者参考。 关键词:寿命分布;生存函数;危险函数;指数分布;韦布尔分布;伽玛分布;对数正态分布 医学以及保险精算等的研究中,需要对人的寿命作统计分析。工业生产中的产品可靠性,需要用产品的寿命来衡量。对寿命数据的统计模型和分析方法在一般大学的数理统计教材中较少涉及,以下详细介绍寿命分布的几个数字特征,函数特征。介绍指数分布,韦布尔分布,伽玛分布,
2、对数正态分布。 1 寿命分布的几个常用参数 设寿命 T 是一个非负连续型随机变量,T 的分布函数 F(t)=P(Tt) ,T 的密度函数为 f(t) 。 1.1 平均寿命与寿命的方差 用 T 的数学期望 来刻画总体 T 的“平均寿命” ,用方差 DT=E(T-ET)2 来刻画总体寿命的波动程度。ET,DT 是分布的重要数字特征。 1.2 生存函数(可靠度) 定义函数 2在生存分析中,S(t)称为生存函数,在可靠性统计中,S(t)又被称为可靠度。它刻画了寿命超过一定年龄 t 的概率,或者失效时间超过规定长度 t 的概率。 显然,对指定的 t,S(t)越大越好。 若有两个总体:T1,T2,其生存函
3、数分别为 S1(t)和 S2(t) ,满足 S1(t)S2(t) ,0t, 则总体 1 的寿命分布一致优于总体 2 的分布。 S(t)具备下列性质:S(0)=1;S(t)为 t 的下降函数;limtS(t)=0;S(t)=-f(t) 。 1.3 危险函数(失效率) 考虑 P(tt)表示个体已经存活过(产品有效工作过)时间 t,而在下一个时间间隔t 内死亡(失效)的条件概率。当t 很小时,则 , 即 这说明,当t 很小时,P(t0 为参数,设随机变量 Te() ,则 即指数分布的危险函数(失效率)为常数,而且它的条件寿命分布与无条件分布相同,这种性质叫无后效性。 4可以证明:若失效时间分布的危险
4、函数(失效率)为常数,则它一定是指数分布。 事实上 设 h(t)=0,则它的生存函数 ,恰好为指数分布的生存函数。 2.2 韦布尔分布 韦布尔分布的密度函数为 ,0t,其中 0,0 分别为形状参数和刻度参数。若 T 服从参数为 , 的韦布尔分布,则 当 =1 时 h(t)=1/,即指数分布的危险函数,因此指数分布是韦布尔分布的一个特例。 当 1 时,h(t)关于 t 单调上升。 2.3 伽玛分布 G(k,) 伽玛分布 G(k,)的密度函数为 其中 k0,0 为参数。显然 G(1,)=e() ,即指数分布也是伽玛分布的一个特例。 伽玛分布的数学期望和方差分别为 ET=k/,DT=k/2, 伽玛分
5、布的生存函数 S(t)和危险函数 h(t)都没有简单的表达形式。 m 为正整数时,G(m,)可看作 m 个独立同分布于 ()的随机变量的和的分布;设 T 服从 G(m,) ,则 2T 服从 x2(2m)分布。 2.4 对数正态分布 LN(,2) 对数正态分布 LN(,2)的密度函数为 5事实上若 lnTN(,2) ,则 T 服从对数正态分布 LN(,2) 。LN(,2)的期望和方差分别为 其生存函数与危险函数都没有简单的表达形式。对数正态分布作为寿命的模型有一个好处,就是将寿命或失效时间 T 作对数变换后,就得到大家最熟悉和最易分析处理的正态分布。 参考文献: 1 陆璇.应用统计M.北京:清华大学出版社,1999. 2 魏宗舒.概率论与数理统计教程M.北京:高等教育出版社,1987. 3 茆诗松.可靠性统计M.上海:华东师范大学出版社,1984. 4 张春华,陈循,杨拥民.常见寿命分布下环境因子的研究J.强度与环境,2001(4):7-12. 5 高尚.剩余寿命分布研究J.强度与环境,1995(3):61-64. 6 Ross S.Stochastic ProcessesM.何声武等译.中国统计出版社,1997.