随访资料的生存分析.PPT

上传人:国*** 文档编号:496190 上传时间:2018-10-15 格式:PPT 页数:43 大小:756.50KB
下载 相关 举报
随访资料的生存分析.PPT_第1页
第1页 / 共43页
随访资料的生存分析.PPT_第2页
第2页 / 共43页
随访资料的生存分析.PPT_第3页
第3页 / 共43页
随访资料的生存分析.PPT_第4页
第4页 / 共43页
随访资料的生存分析.PPT_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、随访资料的生存分析,山东大学公共卫生学院,第一节 概 述,随访资料是指对一批研究对象进行追踪观察所获得的有关其结局以及出现这种结局所经历的时间等方面的资料。 随访资料常因失访等原因造成某些数据不完全,需要用专门的方法进行统计处理。由于随访资料的分析最初起源于对寿命资料的统计分析,故称为生存分析(survival analysis),或称为生存时间分析。,生存分析的研究内容,生存分析的研究内容主要包括以下三个方面: 对生存时间进行统计描述; 寻找影响生存时间长短的“危险因素”(包括正危险因素和负危险因素); 估计生存率和生存时间长短,进行预后评价。,生存分析中的基本概念,生存时间死亡概率、死亡率

2、 生存概率、生存率、生存函数、生存率曲线半数生存期危险率函数死亡密度函数,生存分析中的基本概念(一)、生存时间(survival time):,1. 定义:狭义:指病人从发病到死亡所经历的时间。广义:从某个起始事件开始到规定的终点事件发生(出现反应)所经历的时间。也称失效时间(failure time)。如:某病从治疗到痊愈的时间、从接触某种危险因素到发病的时间、癌症患者从接受手术治疗到死亡的时间、婴儿出生到囟门闭合的时间、婴儿出生到第一颗乳牙萌出的时间均可称为生存时间。,生存分析中的基本概念(一)、生存时间(survival time):,2、特点:分布类型不易确定。一般不服从正态分布,少数

3、情况下近似服从指数分布、Weibull分布、Gompertz分布等,多数情况下往往是不服从任何规则的分布类型。影响因素多而复杂且不易控制。根据研究对象的结局,生存时间数据可分为两种类型: 完全数据(complete data) 截尾数据(截尾值、删失数据,censored data),生存分析中的基本概念(一)、生存时间(survival time):,生存时间的两种数据类型: 完全数据(complete data):观察对象在观察期内出现反应(终点事件),这时所记录到的时间信息是完整的,这种生存时间数据称为完全数据。 截尾数据(截尾值、删失数据,censored data):尚未观察到研究对

4、象出现反应(终点事件)时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存时间数据称为不完全数据或截尾值。截尾值能提供部分信息,即该研究对象实际的生存时间只会长于观察到的时间。,生存分析中的基本概念截尾值出现的原因有以下三种:失访:观察期内由于研究对象搬迁、不配合等原因造成失访;退出:观察期内研究对象意外死亡、死于其它疾病或改变治疗方案等而中途退出研究;终止:观察期结束时仍未出现结局。,生存分析中的基本概念(一) 生存时间(survival time):,3、生存时间资料的整理:对于随访资料,需要记录的原始数据包括开始观察的时点(起始事件发生的时间)、终止观察的时点、研究对象

5、的结局、可能的影响因素。生存时间为一反映时间长短的指标,属数值变量,可按下式计算:生存时间(t)=终止观察的时点-开始观察的时点,结局变量()反映终点事件是否发生,为一二分类的变量。通常用(t,)完整地表示一个观察对象的随访结果。,原始数据的记录和整理:教材151页表12-1和图12-1、图12-2。,生存分析中的基本概念(二) 死亡概率和死亡率:,1. 死亡概率(mortality probability):是指某单位时段开始时尚存的研究对象在该单位时段内死亡的可能性大小。 若该时段内有删失,则分母用校正人口数: 校正人口数=期初观察人数-删失数/2,生存分析中的基本概念(二) 死亡概率和死

6、亡率:,2.死亡率(mortality rate):指单位时间里研究对象的死亡频率或强度,即平均每千人(或万人、百人等)中的死亡人数。平均人口数=(该时段期初人口数+期末人口数)/2,生存分析中的基本概念(三)生存概率、生存率、生存函数,1.生存概率(survival probability):表示某单位时段开始时尚存活的个体到该时段结束时仍然存活的可能性大小。若该时段内有删失,则分母用校正人口数:校正人口数=期初观察人数-删失数/2,生存分析中的基本概念(三)生存概率、生存率、生存函数,2. 生存率和生存函数:生存率(survival rate) :指研究对象经历t个时段后仍存活的概率,即生

7、存时间大于等于t的概率,用P(Tt)表示。生存函数(survival function):生存率随时间t的变化而变化,即生存率是相对于时间t的函数,称为生存函数,记为S(t)。生存函数在某时点的值就是生存率。例如,S(5)=0.1832,习惯上说5年生存率为18.32%。,生存函数或生存率的计算,若前t个时段没有删失: 例如:,若观察期内有删失:假定观察对象在各个单位时段内是否生存的事件是相互独立的,其生存概率分别为p1,p2,p3,pt, 则根据概率的乘法原理得S(t)=p1p2p3pt。故生存函数又称累积生存概率(cumulative probability of survival),即将

8、时刻t尚存活看成是前t个时段一直存活的累计结果。,生存分析中的基本概念,(四)生存率曲线(survival curve):以时间为横轴、生存率为纵轴绘制的曲线。(五)中位生存期(median survival time,半数生存期):即生存时间的中位数,反映生存时间的平均水平。表示生存率等于50%时的时间。,(六)危险率函数(hazard function):,指t时刻尚存活的观察对象死于往后的一瞬间的概率。为一条件概率,即活到了t时刻的条件下死于往后一瞬间的概率。,危险率函数是生存分析的基本函数,不同人群的危险率模型不同,所用的分析方法也不同。危险函数与生存函数的关系:,(七)死亡密度函数(

9、mortality density function):,指全部研究对象中,在t t+t这一微小时段内的死亡概率,即研究对象在t时刻后的瞬时死亡概率。 死亡密度函数与生存函数和危险率函数的关系:,二、生存分析对资料的基本要求,样本含量应该足够大,且由随机抽样的方法获得。完全数据所占的比例不能太少,截尾值不能太多。删失原因无偏性。生存时间尽可能精确。因为许多常用的生存分析方法都在生存时间排序的基础上作统计处理,即使小小的舍入误差也可能改变生存时间顺序而影响结果。,三、生存分析常用的分析方法,非参数法:主要用于描述性分析(估计生存率)和单因素分析,如寿命表法、乘积极限法、时序检验等。参数法:一般用

10、作多因素预后分析,也可计算生存率和半数生存期,如指数模型、Weibull模型、Gompertz模型等。半参数法:即Cox回归模型,兼有非参数法和参数法的优点,既不依赖于生存时间的分布类型,又可以用作多因素分析,是生存分析中最重要的分析方法。,第二节 生存率估计的非参数法,一、乘积极限法 乘积极限法(product-limit method)是由Kaplan和Meier在1958年首先提出的,故又称Kaplan-Meier法。适用于样本含量较小的资料。,一、乘积极限法(Kaplan-Meier法),例1 用某中药+化疗(中药组)和化疗(对照组)两种疗法治疗白血病后,随访记录死前存活月数,结果如下

11、。试分别绘制生存率曲线并作比较。中药组:10 2+ 12+ 13 18 6+ 19+ 26 9+ 8+ 6+ 43+ 9 4 31 24对照组:2+ 13 7+ 11+ 6 1 11 3 17 7,SAS程序,DATA a1; group=t; INPUT t d ; Cards; 10 0 2 1 12 1 13 0 18 0 6 1 19 1 26 0 9 1 8 1 6 1 43 1 9 0 4 0 31 0 24 0 ; DATA a2; group=c; INPUT t d ; Cards; 2 1 13 0 7 1 11 1 6 0 1 0 11 0 3 0 17 0 7 0 ;

12、DATA aa; SET a1 a2; PROC lifetest plots=(s); TIME t*d(1); STRATA group; RUN;,图1 两种疗法治疗后白血病患者的生存率曲线,二、寿命表法(life-table method),当样本量较大时,通常将资料先整理成频数表形式,K-M法不适用,而用寿命表法计算样本资料的生存率及生存率的标准误。寿命表法(life table method)是采用编制定群寿命表的原理来计算生存率,首先求出患者在治疗后或健康者在预防措施后各时期的生存概率,然后根据概率的乘法法则,将各时期的生存概率相乘,即可得到自观察开始到各时点的生存率。,SAS程

13、序,data example2; keep Freq Years Censored; retain Years -.5; input fail withdraw ; Years + 1; Censored=0; Freq=fail; output; Censored=1; Freq=withdraw; output; Cards; 68 8 61 7 38 3 16 1 8 0 23 0 ; symbol value=circle c=blue; proc lifetest method=lt intervals=(0 to 6 by 1) plots=(s,h,p); time Years*

14、Censored(1); freq Freq; run;,SAS结果:生存率曲线,SAS结果:危险率曲线,SAS结果:死亡密度函数曲线,第三节 生存率比较的假设检验,常用的方法有log-rank 检验(时序检验)、Gehan比分检验和Breslow检验等。时序检验又称对数秩检验(log-rank test),可用于两组或多组生存率的比较。,时序检验,式中,A为实际死亡人数,T为按H0假设计算的预期残废人数。,第四节 Cox比例风险回归模型,一、问题的提出,二、Cox比例风险回归模型的基本形式,Cox模型中偏回归系数i 的意义是,当其它协变量都不变时,Xi 每变化一个单位,相对危险度的自然对数( )变化i个单位。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。