1、1毕 业 论 文艾滋病疗法的评价及疗效的预测2摘 要艾滋病治疗的目的,是尽量减少人体内 HIV 的数量,同时产生更多的CD4,至少要有效地降低 CD4 减少的速度,以提高人体免疫能力.对于问题 1,我们通过对题中所给的附件 1 里的数据进行分类排序分析.对CD4 和 HIV 的数据按照时间(周)从小到大进行排序,生成有较强规律性的数据序列,对于每个时间点 CD4 的数据,我们分别求其平均值,并对于人数较多的时间对应的 CD4 的值,从中挑出来,作成表格和图形,找出其极大值、极小值和稳定值的一组数据,运用灰色预测模型进行假设,建立相应的微分方程模型进行预测,运用 Matlab 软件计算我们需要的
2、数据,从而找出极大值、极小值和稳定值出现的时间点(周).对应于 HIV,我们做同样的分析.最后我们综合分析得到结论:病人在测试用药的 40 周后的第 28 周停止用药最好.对于问题 2,我们对题中附件 2 里的数据先按疗法分为 4 类,再分别将每一类疗法的数据按年龄排序,分为 3 个阶段,挑选出对我们有价值的数据,求其平均值,并对于人数较多的时间对应的 CD4 的值,从中挑出来作成表格和图形,对这些阶段的数据进行分析,我们得出第 4 种疗法最优.然后对疗法 4 的所有数据(不分年龄)进行总体分析,再运用灰色模型,建立相应的微分方程模型进行预测,运用 Matlab 软件计算我们需要的数据,从而找
3、出极大值、极小值和稳定值出现的时间点(周).最终我们得到如下结论:病人在第 52 周时停止用药最好.对于问题 3,治疗费用的多少直接影响到病人对疗法的选择,我们运用层次分析法,第一步构建层次分析模型;第二步求本层次要素相对于上一层次要素的权重;第三步运用和法求判断矩阵的特征向量;第四步计算最大特征值,对判断矩阵进行一致性检验;第五步综合计算结果,最终得到结论:接受疗法1 是病人最满意的疗法.关键词:灰色预测模型 层次分析法 HIV 的浓度 CD4 的值 残差检验一、问题重述3艾滋病是由艾滋病毒引起的.这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命.人类免疫系统的
4、CD4 细胞在抵御 HIV的入侵中起着重要作用,当 CD4 被 HIV 感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致 AIDS 发作. 艾滋病治疗的目的,是尽量减少人体内 HIV 的数量,同时产生更多的CD4,至少要有效地降低 CD4 减少的速度,以提高人体免疫能力.迄今为止人类还没有找到能根治 AIDS 的疗法,目前的一些 AIDS 疗法不仅对人体有副作用,而且成本也很高.许多国家和医疗组织都在积极试验、寻找更好的 AIDS 疗法.现在得到了美国艾滋病医疗试验机构 ACTG 公布的两组数据.我们要解决的问题是:1、利用题中所给附件 1 的数据,预测继续治疗的效果,或者确定最佳治疗终
5、止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗).2、利用题中所给附件 2 的数据,评价 4 种疗法的优劣(仅以 CD4 为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间.3、艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60 美元, 400mg didanosine 0.85 美元,2.25 mg zalcitabine 1.85 美元,400 mg nevirapine 1.20 美元.如果病人需要考虑 4 种疗法的费用,对 2 中的评价和预测(或者提前终止)有什么改变.二、问题分析问
6、题 1 是依据同时服用 zidovudine,lamivudine 和 indinavir 这 3 种药物的 300 多名病人每隔几周测试的 CD4 和 HIV 的浓度(每毫升血液里的数量),预测继续治疗的效果,或者确定最佳治疗终止时间.我们运用灰色预测模型GM(1,1)模型来进行假设,需要对数据进行分析,通过灰色模型和相应的计算来预测未来时间里 CD4 和 HIV 的浓度及相关数据.灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况.问题 2 是将
7、 1300 多名病人分为 4 组,每组按 4 种疗法中的一种服药,大约每隔 8 周测试一次 CD4 的浓度.最后评价 4 种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间.我们运用灰色预测模型,来预测4 种疗法的治疗效果,即我们要通过数据找到规律,通过相应的计算(运用EXCEL 软件)来预测未来时间里 4 种疗法在不同年龄段 CD4 的浓度及相关数据,找到哪一种疗法疗效较好,与问题 1 的方法相同,运用灰色模型预测出继续治疗的效果. 问题 3 中病人需要考虑 4 种疗法的费用,第 1 种疗法病人第一个月需花费48 美元,第 2 个月需花费 25.5 美元,以后两种疗法交
8、替进行,每两个月需花费 73.5 美元;第 2 种疗法病人每月需花费 103.5 美元,每两月需花费 207 美元;第 3 种疗法病人每月需花费 73.5 美元,每两月需花费 147 美元;第 4 种疗法病人每月需花费 109.5 美元,每两月需花费 219 美元;因个人经济状况的不同,4这 4 种疗法费用的多少可能会影响到病人选择哪一种疗法,对于此问题,我们需要将这 4 种疗法预测的治疗效果和其所需费用综合考虑,运用层次分析法进行分析,决定采取何种疗法.三、模型假设1、对于题中附件 1 里的数据我们假设如下:将其按测试的时间排序,其中在同一时间段测试结果数量少于 30 个的数据,我们忽略不计
9、(例如,对于第六周测试时只有 11 个人,我们将把这十一个数据忽略);2、假设题中附件 2 里同一时间里的数据过少时,我们在计算时也将这些数据忽略不计;3、假设影响病人治疗的只有费用和疗效两个因素,不考虑其它因素;四、符号定义及说明1、 (0)X为原始序列2、 为生成累加序列3、 为相对残差序列4、 为平均相对残差 5、 a称为发展系数6、 u称为灰色作用量7、 为待估参数向量8、 0为绝对残差序列9、CD4(Date)为测试 CD4 的时刻(周)10、Log(CD4 count+1) 为测得的 CD4 浓度11、 max为最大特征值12、 CI为检验判断矩阵一致性的指标13、 R为一致性比例
10、14、 为修正系数15、 iA和 j为本层次的要素 iA和 j(i,j=1,2,n)16、 kC为上一层次要素五、模型的建立与求解51、问题 1:首先,我们通过对题中所给的附件 1 里的数据进行分类排序分析.对 CD4和 HIV 的数据按照时间(周)从小到大进行排序,生成有较强规律性的数据序列,对于每个时间点 CD4 和 HIV 的数据,我们分别求其平均值,并对于人数较多的时间及对应的 CD4 和 HIV 的值,从中挑出来,作成表格和图形:表 1(不同时间点对应的 CD4 和 HIV 的均值)时间(周) 时间(周) 0 86.09524 0 5.0269463 137.7736 3 3.072
11、5494 133.5584 4 3.2404355 129.7541 5 3.0932207 147.9344 7 3.0803288 152.385 8 2.9566509 173.2813 9 2.58688523 203.0938 22 3.06250024 179.7246 23 2.81451625 169.5593 24 2.82963026 192.1538 25 2.52982539 213.6538 26 3.42608740 195.9894 38 2.96428641 174.8235 39 2.72083340 2.71071441 3.11785742 3.32727
12、3图 1(CD4 浓度随时间的变化图形) 图 2(HIV 浓度随时间的变化图形) 0501001502002500 20 40 60 01234560 20 40 60 对于这两个图,我们取它们的异常值,然后利用灰色模型预测下一个异常值出现的时间。首先我们介绍一下灰色模型的知识。灰色模型实质是对原始数据序列作为一次累加生成,使生成序列呈一定规6律,并用典型曲线拟合,从而建立其数学模型. 对已知原始数据列 (0)()(0)(0)1,2,Xxxn首先进行一阶累加,得新序数列为 (1)()(1)(1)(1)(1),x 利用 构成下述白化形式的微分方程: (1)(1)X()(1)dXauk其中 是待定
13、系数,利用最小二乘法求解参数 ;,au ,,1TaBYu式中 (1)(1)()()(1)(1)22342xBx(0)()(0),3,TYxn所以方程(1)的解为:(其中 k=1,2,3,n)(1)(1)0akuxkxe取 , 有(1)(0)(1)(0)1akuxkxe(2)(其中 ),然后将求得的参数回代模型进行精度检验.1,23,kn首先,取 CD4 的极大值所对应的时间作成一组原始序列,其相应的 和(0)X如下:(1)X表 2K 1 2 3 47CD4 (Date)周 3 9 23 39原始数据 (0)X 3 9 23 39累加后数据 13 12 35 77根据表 2,可知 ,在此 满足:
14、 是极大值.所对应(0),92(0)X的人数较多,具有普遍性.构造累加生成数列 ,构造数据矩阵(1)3,2574B 和数据向量 Y (1)(1)()()(1)(1)22 -7.50 1323 4. 42xBx(0)(0)934Yx计算 由 Matlab 计算得 1-0.64()731TaBYu得 ; ,然后计算得 ,将数据代入(2)式,得 -0.6217a5.948/9.5ua(1) 0643.kxke对于 CD4 的预测,我们代入数据分析:当 时(1) 0.6217*449.59.51.28(0)(1).70.54xx67.5228-39(39 周的序号)= 28.5228即从开始用药到第
15、28.5228+40=68.5228 周时出现极大值.下面取 CD4 的极小值点所对应的时间作成一组原始序列 表 3K 1 2 3CD4 (Date)周 5 25 418原始数据 (0)X5 25 41累加后数据 15 30 71下面取 CD4 的稳定点所对应的时间作成一组原始序列表 4K 1 2 3CD4 (Date)周 9 24 41原始数据 (0)X9 24 41累加后数据 19 33 74对它们进行类似于对 CD4 的极大值的处理方法,可以得到:CD4 出现极小值点在测试用药的 40 周后的第 23.850 周及出现稳定点在在测试用药的 40 周后的第 44.55 周.接下来,取 HI
16、V 的极小值所对应的时间作成一组原始序列,其相应的 和(0)X如下:(1)X表 5K 1 2 3 4HIV(Date)周 3 9 25 40原始数据 (0)X3 9 25 40累加后数据 13 12 37 77根据表 3,可知 ,构造累加生成数列 ,(0),92540(1)3,27X构造数据矩阵 和数据向量1B1Y()()(1)(1)1()()22 -7.50 1324 . 42xx(0)1(0)9354Yx计算 由 Matlab 计算得:1-0.64()731TaBYu得 ; ,计算得 将数据代入(2)式,得 -0.64a.7361u/-.5() 064 .kxke对于 HIV 的预测,我们
17、代入数据分析:当 时9(1) 0.64*431.51.547.xe(0)()7.0.x70.5474-40(40 周的序号)=30.5474即,HIV 出现极小值点在测试用药的 40 周后的第 30 周.下面取 HIV 的极大值点所对应的时间作成一组原始序列表 6K 1 2 3HIV (Date)周 4 26 42原始数据 (0)X4 26 42累加后数据 (1) 4 30 72下面取 HIV 的稳定点所对应的时间作成一组原始序列表 7K 1 2 3 4 5 6HIV(Date)周 4 7 8 23 24 40原始数据 (0)X4 7 8 23 24 40累加后数据 14 11 19 42 6
18、8 108对它们进行类似于对 HIV 的极小值的处理方法,可以得到:HIV 出现极大值点在测试用药的 40 周后的第 23 周及出现稳定点在测试用药的 40 周后的第20 周.综合上面对问题一 CD4 和 HIV 的预测,当 CD4 有下降趋势,HIV 有上升趋势时就及时停止用药为准则,进行综合考虑,我们得出结论:在测试用药的 40周后的大约第 28 周时停止用药.2、问题二:对于附录二的数据,我们先对其按疗法排序,再在每种疗法中按年龄排序,分别把各疗法的数据分成三个阶段:青年(15 岁30 岁),中年(30 岁50岁),老年(50 岁70 岁).绘出各个阶段各种疗法效果的曲线图:表 8(15
19、 岁30 岁各种疗法效果)时间 疗法 1 时间 疗法 时间 疗法 时间 疗法0 2.8852765 0 2.664564 0 2.699538 0 2.6603597 2.36 7 2.571718 7 3.4076 7 3.0531338 2.821553 8 2.455884 8 2.681452 8 2.92268815 3.0483875 9 2.81862 16 2.323462 12 3.09697516 2.46849 15 2.785094 17 3.091037 15 2.92648217 2.770636 16 2.426181 20 2.58836 16 3.339975
20、23 3.128983 21 2.76035 22 3.12296 17 3.6895251024 2.629217 23 2.311942 25 2.469834 23 2.9867526 3.192257 24 2.4273 28 2.76472 24 3.28047331 2.95525 25 2.753614 32 2.157846 31 2.96828832 2.633 26 2.6458 33 2.6493 32 3.07155733 2.272513 30 2.193067 39 2.40634 33 2.65298331 2.454525 34 3.1316232 2.4398
21、93 39 2.526433 2.4508834 2.2494535 2.4196539 2.558775对应图象如下:图 3(疗法 1 中 CD4 的曲线图) 图 4(疗法 2 中 CD4 的曲线图)cd4( 疗 法 )00.511.522.533.50 10 20 30 40cd4( 疗 法 )cd4( 疗 法 )00.511.522.530 10 20 30 40 50cd4( 疗 法 )图 5(疗法 3 中 CD4 的曲线图) 图 6(疗法 4 中 CD4 的曲线图)cd4( 疗 法 )00.511.522.533.540 10 20 30 40 50cd4( 疗 法 )cd4( 疗 法 )00.511.522.533.540 10 20 30 40 50cd4( 疗 法 )对于 15 岁到 30 岁,我们可由图中的数据统计出疗法 4 的 CD4 浓度的平均值最大,其它依次为疗法 3,疗法 2,疗法 1,并且疗法 4 中 CD4 的方差最小,依次为疗法 3,疗法 2,疗法 1,所以疗法效果由好到差排序为:疗法 4,疗法