非线性回归模型拟合生存资料分析.doc

上传人:99****p 文档编号:1993397 上传时间:2019-03-26 格式:DOC 页数:6 大小:26.50KB
下载 相关 举报
非线性回归模型拟合生存资料分析.doc_第1页
第1页 / 共6页
非线性回归模型拟合生存资料分析.doc_第2页
第2页 / 共6页
非线性回归模型拟合生存资料分析.doc_第3页
第3页 / 共6页
非线性回归模型拟合生存资料分析.doc_第4页
第4页 / 共6页
非线性回归模型拟合生存资料分析.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、非线性回归模型拟合生存资料分析作者:张金旺 刘红 华琳 闫岩 李林【摘要】 运用非线性回归法拟合生存资料。方法:对原始数据作生存函数分析,用 PL 法估计的生存率作因变量,生存时间为自变量,建立多种非线性回归方程并作比较。结果:若生存资料符合某种特定的分布,选择参数模型分析更准确。 【关键词】 生存分析; 非线性回归; 拟合在医学研究中,凡涉及到肿瘤治疗的文章都离不开生存分析。生存分析主要有 3 类方法,分别为非参数法、半参数法和参数法。非参数法只适合处理简单的单因素问题,目前使用较多的是半参数模型,即Cox 回归模型。Cox 模型适用条件宽,便于作多因素分析,所以被医学工作者广泛使用。但它是

2、在假定不同个体的死亡风险在所有时间都保持一个恒定的比例的条件下提出的,有一定缺陷。当拟合资料服从已知分布时,采用参数模型作回归分析将更加合理,且精度更高1 。文献2讨论了生存分析中确定两种参数模型(指数模型和威布尔模型)的方法,其思想是将两种生存函数表达式作对数线性化,通过线性回归分析及对回归系数的检验和确定系数来判断生存资料更适合哪种模型。而实际应用中,有很多生存函数是非线性的,不能通过简单的取对数后线性化。文献3指出在有些情况下,非线性回归模型即使被转化为线性回归模型,但转化后的线性回归模型的正规方程组关于新回归系数是线性的,而关于原回归系数则是非线性的。所以本研究讨论直接使用非线性回归模

3、型拟合生存资料并用实例说明。1 非线性回归的基本思想非线性回归的基本思想是采用高斯 牛顿(GaussNewton) 迭代法求解非线性代数方程组,在最小二乘意义下确定函数中的参数值,使得残差平方和达到最小,确定系数达到最大。在求解非线性代数方程组的过程中必须先给出参数的初始值,若初始值选择不当,会造成迭代不收敛,使非线性回归无法进行下去。使用 SPSS 软件中的非线性回归模块还可得到回归参数的近似 95%置信区间及近似标准差。2 常见的生存函数模型常见的生存函数模型主要有以下几种4: 指数分布: S(t)=e-t,t0,0 , 称为尺度参数。 威布尔(Weibull)分布S(t)=e-(t),t

4、0,0 ,0 称为尺度参数, 称为形状参数。 对数正态分布S(t)=1-P(Tt)=1-JF(Zlnt012e-(x-u)222dxJF)其中 u 和 分别 lnT 的总体均数和标准差,u 称为位置参数, 称为尺度参数。 Logistic 分布S(t)=exp-(t-)/1+exp-(t-)/, - 其中 称为位置参数, 称为尺度参数。 伽玛分布(Gamma)S(t)=1-P(Tt)=1-JF(Zt0t-1e-t/ (),JF),0,t0其中 称为位置参数, 称为尺度参数。 极值分布S(t)=exp-exp(t-ub) ,-0其中 u 称为位置参数,b 称为尺度参数。 对数 Logistic

5、分布:S(t)=P(Tt)=P(lnTlnt)=exp-(lnt-)/1+exp-(lnt-)/,0 其中 称为位置参数, 称为尺度参数。3 实例分析实例引用文献5中的生存数据进行分析,判断数据适合的分布。数据见表 1。设生存时间 t 为自变量,用乘积极限法(PL)估计的生存率 S(t)为因变量,建立非线性回归模型拟合。由于对数正态分布与伽玛分布的模型表达式比较复杂,所以选择生存函数分别为指数分布, 威布尔分布,Logistic分布与极值分布作数据拟合。3.1 参数初始值的选取(表 2)表 1 乘积极限法估计生存率计算表5 (略)表 2 4 种模型的初始值选取(略)3.2 结果分析拟合优度检验

6、证明此资料可以用这 4 种分布拟合。模型的确定系数,参数估计值及置信区间见表 3。表 3 4 种模型的拟合结果(略)从表 3 中可以看到,以 PL 法估计的生存率 S(t)作为标准,采用威布尔分布函数模型作回归分析,得到的确定系数最高,拟合的效果最好。故该生存资料应选择威布尔模型探讨影响患者生存期的危险因素。4 种模型的拟合结果图见图 1。4 讨论在生存资料分析中 Cox 模型虽然应用广泛,但有适用范围和局限性,不能随便套用。可通过残差分析检验资料是否满足 Cox 模型应用的条件1,以保证结果的准确性。若生存时间服从特定概率分布(如指数分布、威布尔分布、对数正态分布),应采用参数回归模型进行多

7、因素分析,可提高精度和准确度。图 1 4 种模型拟合结果图(略)采用非线性回归拟合法可以帮助确定生存时间更适合的分布,如本资料威布尔分布的拟合效果最好。只要知道模型的表达式,就可以采用非线性回归模型进行拟合。当然, 还应作拟合优度检验以确定资料适合的分布。对于那些可线性化的非线性回归模型来说,在 SS 回归=(yi-i)2 极小的意义下,直接作非线性拟合的结果要比线性化后拟合的效果好。但非线性回归必须指定合理的参数初始值,否则可能迭代不收敛。采用非线性回归拟合法可以得到模型参数的近似 95%置信区间。本资料中参数的置信区间较大是因为样本量较小,可通过增大样本量的方法缩小置信区间。【参考文献】1 贾红英,等.几种生存分析参数模型拟合法及其应用.中国卫生统计,2004,21(4):201204.2 杨肇,等.生存分析中确定两种寿命分布的方法.中国卫生统计,2003,20(1):911.3 葛新权.线性化非线性回归预测模型质疑.预测,1999,1:7778.4 孙尚拱,编著.医学多变量统计与统计软件.北京:北京医科大学出版社,2000,10.5 余松林,著.医学统计学.北京:人民卫生出版社,2002.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。