1、临床试验数据管理与统计分析,第四军医大学卫生统计学教研室夏结来,临床试验,监查,CRF,统计分析,统计与临床报告,SFDA/CDE,批准与上市,数据管理,临床试验过程,一、临床试验的数据管理,数据管理的目的,数据管理的目的:以及时、有效的方式为支持新药批准上市提供与预期结果一致、精确、正确的临床试验数据,以便对此数据按预先制定的统计分析计划书进行统计分析。 数据管理的定义:将在临床试验中产生的大量数据及时填写、准确录入、计算机辅助人工审核校对、疑问问答校正,数据盲态下审核与锁定等全过程。,数据产生的过程,研究者填写CRF表监察员核查、传递给数据管理单位根据CRF建立录入程序双人双份独立录入核查
2、并产生数据疑问表(DQF)监察员将DQF交研究者复核并回答数据库修改并核查不良事件及合并用药编码盲态下的数据审核数据锁定数据传递(统计分析人员),数据管理流程,项目启动,管理计划,核查计划,CRF注释,录入程序,核查程序,数据录入,疑问管理,临床试验中心,质量检查,数据关闭,管理报告,数据审核,数据锁定,数据传递,数据管理计划(DMP),阐述该项目的数据管理过程、时间约定、项目组成员、数据核查计划、关键指标及非关键指标的约定、疑问管理方式等。 该计划由项目申办单位、统计单位和数据管理单位签署,做为该项目数据管理的依据。,核查与疑问管理,数据核查计划数据核查程序疑问表(DQF)的产生DQF的回答
3、DQF的返回及处理,数据核查目的,项目核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。,数据核查计划,通用数据项核查条件统一描述按病例报告表页码和各页数据项内容顺序撰写。所有已进入数据库的数据均需描述核查条件对各数据项应描述其核查范围和发疑问或确认的标准内容完成相同的页,可合并撰写(如各访视内容) 核查计划传递给申办方,申办方审核并提出修改意见核查计划签字后方生效,数据核查程序,核查程序是根据数据检查计划,在SAS 环境下按数据核查计划内容编写的核查
4、程序。 主要检查CRF表中数据缺失、误填、数据逻辑矛盾等问题。程序核查后人工校对,数据疑问常见类型,1 、补充: 病例报告表中有缺失的项目,或字迹不清楚的数据。2、 确认: A.入选/排除标准的确认: B.实验室检查:数值与临床意义判断与各个中心提供的正常值范围不一致。 C.时间的确认:所填写的时间不在试验时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。 D.合并用药的确认:填写数据与各访视所填内容有矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。 E.不良事件的确认:填写数据与各访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不清楚,无法做编码的
5、。,DQF的提问方式,1、XX项数据缺失,请补充2、出生日期为XXXX年XX月XX日,请确认3、WBC测定值为11x109/L,临床意义为“正常”,请确认4、访一时间为XXXX年XX月XX日,访二时间为XXXX年XX月XX日,不在时间窗内,请确认5、不良事件:“XXXX”,为方便编码,请进一步详细描述,疑问表式样举例,缺失值核查疑问表,DQF的回答,根据问题,查阅原始资料和CRF表所填内容,慎重回答 如果某一数据的修改,会影响其它数据时,请一并回答,疑问表修改说明,1.本疑问表是由第四军医大学数据管理中心发出 2.疑问仅是数据管理人员对有关数据存有疑惑而发出的询问,希望研究者给予明确答复 3.
6、数据修改必须以原始数据为依据,不能推论式回答 4.研究者如果认为数据无错误,在相应的方框内划,并签名确认 5.研究者如果认为数据确实有错误,在相应的方框内划,并注明错误形成原因,签名确认 6.疑问表中所列参考值范围是贵单位提供的,如果不符,以化验单上注明的为准 7.如果定性指标在CRF上已编号,例如 1=正常 2=异常无临床意义 3=异常有临床意义 4=未查,回答时使用相应的编号,疑问表修改说明(例),1.本疑问表是由第四军医大学数据管理中心发出 2.疑问仅是数据管理人员对有关数据存有疑惑而发出的询问,希望研究者给予明确答复 3.数据修改必须以原始数据为依据,不能推论式回答 4.研究者如果认为
7、数据无错误,在相应的方框内划,并签名确认 5.研究者如果认为数据确实有错误,在相应的方框内划,并注明错误形成原因,签名确认 6.疑问表中所列参考值范围是贵单位提供的,如果不符,以化验单上注明的为准 7.如果定性指标在CRF上已编号,例如 1=正常 2=异常无临床意义 3=异常有临床意义 4=未查,回答时使用相应的编号,疑问表修改说明(续),8.实验室指标的临床意义请结合参考值范围和您的临床经验作出判断 9.如果您将完成的病例误填做未完成,将产生本例是否脱落的疑问10.疑问表中所有问题必须回复,如果确实不能回答的也必须注明此疑问无法回答并签字11.疑问的多寡不是作为试验质量优劣评价的直接依据12
8、.您所签名确认的纸质疑问表效力高于CRF,务请认真填写13.如果您对我们发出疑问不解,请电话询问14.签字确认后的纸质疑问表原件请特快寄,编码(Coding),为便于统计分析,将研究者填写的合并用药和不良事件根据相应标准进行规范化处理的过程。不良事件编码: 1、如将上感、感冒等统一编码为上呼吸道感染 2、如将恶心呕吐拆分为两个AE编码,分别编码为“恶心”和“呕吐”合并用药编码(按药品通用名编码) EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素”,不良事件COSTART (FDA)WHO ART (WHO)MedDRA诊断和处理ICD-10-CM药物WHO Drug (WHO)PDR
9、,医学标准术语编码,患者数据列表中止试验患者方案偏离从疗效分析中剔除的患者人口统计学数据依从性和/或药物浓度数据(如果有)个例疗效反应数据不良事件列表(每名患者)按患者列表的个例实验室检查值(管理当局要求时)ICH E3(临床试验报告的结构与内容): Sec.16.2,数据清单和表格(1),患者表格人口统计学数据的汇总图表有效性数据的汇总图表安全性数据的汇总图表不良事件的描述死亡、其它严重不良事件以及其它重要的不良事件清单死亡、其它严重不良事件以及某些其它重要的不良事件叙述实验室检查异常值清单(每名患者)ICH E3(临床试验报告的结构与内容): Sec.14.1-14.3,数据清单和表格(2
10、),临床试验数据盲态下审核是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。参加数据审核会议人员,一般由主要研究者、统计分析员、数据管理员、监查员和申办者组成。,数据盲态审核会议,1、对双盲临床试验中的盲态进行审核。2、对数据中存在的需讨论的问题做出决定,重点在分析并决定统计分析人群。 3、对数据的整体质量做出评估。4、讨论并定稿统计分析计划。 5、决定是否锁定数据与揭盲。,1、目的与任务,1、数据管理员应准备一份数据管理报告,内容至少应包括:数据管理的过程及一般情况介绍、病例入组及完成情况(含脱落受试者清单) 、判断统计分析人群时涉及的项目及需讨论并
11、解决的问题(入选/排除标准检查、完整性检查、逻辑一致性检查、离群数据检查、时间窗检查、合并用药检查、不良事件检查等),2、准备工作,2、数据管理理员准备一份关键变量的清单,于会议前交相关人员进行会前审核以便更充分地发现并解决问题。 3、如果是双盲临床试验,申办方将各中心随试验用药下发的应急信件收回,交盲态审核用。4、提交临床试验总盲底。,1、全体参会人员通过对总盲底及应急信件的检查,对双盲临床试验的盲态做出判断。 2、数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。 3、主要研究者、申办方代表、统计分析人员、数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。,3、
12、一般程序,4、与会人员讨论并决定统计分析人群。5、统计分析计划的修正与定稿。6、决定是否锁定数据。7、当揭盲条件成立时,具体执行揭盲。 最后签署盲态审核决议,将锁定后的数据交统计分析人员进行统计分析。,数据盲态审核决议,二、临床试验统计分析,各阶段受试者流程。特别是报告随机分配到各组的人数、接受意向治疗(ITT)的人数、按方案完成治疗(PP)的人数以及对主要结局分析的人数。描述与计划的研究方案偏离的情况和理由。,意向治疗分析,一、受试者流程和分析人群,临床试验有效性分析应保罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的
13、分析是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。,ITT原则(意向治疗原则、Intention-To-Treat Principle),三类统计分析数据集及其关系,三类数据集即:符合方案数据集Per-Protocol Set 全分析数据集 Full Analysis Set 安全性数据集 Safety Set,随机入组病例特征描述,基线定义为随机入组时间,病例特征一般包括为患者的人口学信息、饮食运动情况、疾病情况等。根据变量的数字特征,采用t检验/Wilcoxon秩和检验对患者年龄、身高、体重、病程、生命体征等定量数据进行
14、比较。采用卡方检验Fisher确切概率检验或者Wilcoxon秩和检验对患者的性别、饮食控制、运动治疗、降糖药物治疗史、疾病史等分类变量进行基线比较。基线描述分析采用FAS数据集。,有效性评价常用统计分析方法,t检验方差分析协方差分析CHM 生存分析Logistic回归Cox比例风险模型,定性指标评价,对定性指标(如治疗是否成功),分别对各访视点(包括终点)按该指标的分类情况进行描述,计算各分类的例数和百分数,在=0.05显著水平下,采用按中心分层的CMH-2检验对两组进行比较。以此模型为基础计算评价终点时该指标的95%可信区间。,应用协方差分析(ANCOVA)在18周时评价SISBP变化这一
15、主要终点,以研究中心和治疗方法的因素,基线指标值为协变量。计算每个治疗组从基线变化的最小二乘均数和95%CI。计算95%CI显示最小二乘均数的差异。,定量指标评价的统计学方法,有效性分析,主要疗效指标(primary end points)次要疗效指标(secondary end points)同时对FAS数据集和PPS数据集作分析,两组比较的类型,优效(Superiority): 或 “试验组(E)优于对照组(C )” 等效(Equivalence): = 或 “试验组(E)与对照组(C )相当”非劣效(Non-inferiority ): 或 “试验组(E) 与对照组(C ) 差但不多”,
16、无效假设:试验组与对照组均数相等 Ho: C-T=0,备择假设:试验组与对照组均数不等,H1: C-T0,假设检验与两类错误,推论结果,拒绝,不拒绝,假设,正确,错误,把握度 1 - ,假设检验与两类错误,阳性对照试验的优效性检验(P0.05),非劣效/等效,(错!),误解,?,可信区间方法,有效/非劣效性/等效性决策准则建议依赖于参数差别的可信区间(confidence interval,缩写为CI )。CI方法可同样获得非劣效性/等效性乃至优效性的评价。 该方法在 ICH指导原则中予以推荐,指出对非劣效性或等效性试验安全性与耐受性评价, 应用可信区间比用假设检验更佳。,优效性比较,非劣效界
17、值M1的确定,M1的确定采用综合分析法, Meta分析法是常用的方法,当历史资料间同质性较好时可采用固定效应模型,否则需采用随机效应模型。根据模型计算出CP的95%双侧可信区间下限lCL。这个下限必须大于0,否则不能视其为阳性对照。考虑到疗效一致性的问题或者历史数据的质量,取M10)小于试验药物与安慰剂疗效差的95%可信区间下限lCL,即小于阳性对照药对安慰剂的优效性试验所观察到的差异。 如果拒绝H0,则有 T P C PM1 lCLM10。 因此可以间接推断试验药物优于安慰剂。,非劣效性比较(优于假定的安慰剂),非劣效性比较,Ho: CT M2Ha: CT M2其中M2(CM20。因此既可以
18、间接推断试验药物优于安慰剂,也可以推断试验药物非劣效于阳性对照。,非劣效性比较(非劣效于阳性对照 ),为评价某治疗糖尿病新药的有效性,采用随机、双盲双模拟、阳性对照药平行对照、多中心临床研究设计方案,整个试验过程历时18周,其中药物治疗16周,以16周测定的HbA1c 相对基线(0周)变化值作为主要疗效指标。根据临床经验规定如果试验组主要疗效指标不比阳性对照药差0.3,即可判定试验药有效,必要时还可进一步评价是否优于对照药。 这里提出的是一个非劣效检验的问题,根据对照药的有效性,由临床专家提出了0.3这一非劣效的标准,即:当两组主要疗效指标的总体差值不超过0.3时,该差距在临床上没有实际意义,
19、认为两组药物疗效相当。,举例(两均数之差),1、主要疗效指标治疗前后变化,2、各中心主要疗效指标治疗前后变化,3、主要疗效指标中心效应分析,ANOVA数据的图形表达,最小二乘法(最早称为回归分析法)是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配,由著名的英国生物学家、统计学家道尔顿(F.Gallton)达尔文的表弟所创。 ANOVA是利用线性回归模型研究变量之间存在关系 。最小二乘均数(LSmeans)是校正其他因素影响后的估计的独立效应大小,其95%CI为总体效应大小。,ANOVA中的最小二乘均数(LSmeans),4、主要疗效指标有效性分析,有效性判定: 试验组 对
20、照组 差值的 95% CI,不支持非劣,支持非劣,支持优效,某事件发生时间数据的生存分析,某事件发生时间(Time to event,简称TTE)是指实验开始到某事件(方案中规定的事件)发生的时间。例如药物起效时间、化疗后复发时间等,TTE数据的特点,由于临床试验受时间的限制或由于各种原因(退出、死亡等)导致失访,致使TTE数据不能被完全观测。例如病人一周时尚未起效,但第二周时失访,则起效时间7天。又如试验结束时病人仍未起效,则起效时间参加试验天数,TTE数据的特点,TTE数据一般呈偏态分布,TTE数据的特点,临床疗效评价中常见的是右删失TTE数据 如起效时间、复发时间、死亡时间。分析时要区别
21、对待:起效时间越短疗效越好复发时间越长疗效越好,TTE数据统计分析方法,KM法估计各组起效率或复发率并计算中位数起效时间或复发时间及其95%CI采用logrank法比较组间差异采用Cox模型进行起效率或复发率的多因素分析,实例1,表8.2.3.1.3 便血症状起效率 ITT PP 起效时间(小时) 乳膏组(Se) 栓剂组(Se) 乳膏组(Se) 栓剂组(Se) 0 0.00( 0.00) 0.00( 0.00) 0.00( 0.00) 0.00( 0.00) 12 21.84( 4.43) 19.77( 4.29) 22.35( 4.52) 20.24( 4.38) 24 31.03( 4.9
22、6) 29.07( 4.90) 31.76( 5.05) 29.76( 4.99) 36 36.78( 5.17) 34.88( 5.14) 37.65( 5.26) 35.71( 5.23) 48 45.98( 5.34) 40.70( 5.30) 47.06( 5.41) 41.67( 5.38) 60 48.28( 5.36) 48.84( 5.39) 49.41( 5.42) 50.00( 5.46) 72 82.76( 4.05) 80.23( 4.29) 82.35( 4.13) 82.14( 4.18) N(失访率%) 87( 2.30) 86( 9.30) 85( 2.35)
23、84( 7.14),Log-Rank 检验结果,表8.2.3.1.4 便血症状起效率Log-Rank 检验结果 ITT PP 统计量(DF) P值 统计量(DF) P值 LogRank检验 0.94( 1) 0.3315 0.40( 1) 0.5290,实例2,表8.2.2.1.1 不同时间未进展存活率(%)(PFS) ITT PP 未进展时间(周) 试验组(Se) 对照组(Se) 试验组(Se) 对照组(Se) 0 100.00( 0.00) 100.00( 0.00) 100.00( 0.00) 100.00( 0.00) 4 98.59( 1.40) 93.33( 4.55) 98.51
24、( 1.48) 100.00( 0.00) 8 91.55( 3.30) 82.56( 7.10) 91.04( 3.49) 95.65( 4.25) 12 77.50( 5.15) 48.50( 9.67) 76.32( 5.37) 56.19( 10.42) 16 67.37( 5.91) 44.46( 9.67) 66.02( 6.07) 51.51( 10.55) 20 65.39( 6.06) 44.46( 9.67) 66.02( 6.07) 51.51( 10.55) 24 56.42( 6.69) 39.52( 9.78) 56.96( 6.72) 45.78( 10.82)
25、N(失访率%) 71( 59.15) 31( 45.16) 67( 58.21) 23( 43.48),表8.2.2.1.2 未进展存活时间分布 ITT PP 四分位数 实验组(95%CI) 对照组(95%CI) 试验组(95%CI) 对照组(95%CI) 75% 12.14(9.14,21.86) 8.71(7.57,11.29) 12.14(9.00,21.86) 9.71(8.29,12.14) 50% 28.43(21.86,.) 11.86(9.71,29.43) 28.43(21.86,.) 20.14(11.29,.) 25% 38.00(28.43,.) 29.43(20.14
26、,.) 38.00(28.43,.) 29.43(20.14,.) N(失访率%) 71( 59.15) 31( 45.16) 67( 58.21) 23( 43.48),表8.2.2.1.3 不同时间未进展存活率Log-Rank检验结果 ITT PP 统计量(DF) P值 统计量(DF) P值 LogRank检验 4.40( 1) 0.0359 1.38( 1) 0.2393,患者暴露于研究药物的时间 研究时间(天)=(末次随访日期初诊日期)+ 1 治疗时间(天)= 按照患者实际用药天数计算 患者用药依从性=(发药量剩余量)应服药数量100%, 安全性评价指标 生命体征(心率、收缩压、舒张压)、体重、 实验室检查(心电图) 不良事件 ,安全性评价,生命体征、体重:对基线和每次访视时检查结果进行定量描述,组内采用配对t检验,组间采用两组t检验进行比较。心电图:采用治疗前后交叉表的形式描述各治疗周期心电图变化。实验室检查:采用治疗前后交叉表的形式定性描述其有临床意义的变化。不良事件的种类、严重程度、发生频率及与研究药物的关系将列表描述。,安全性评价统计分析方法,信,信,忠实执行SFDA颁布的法规忠实执行方案忠实于研究数据,达,达,正确的理解统计分析方法正确的运用统计分析工具正确的表达研究结果,雅,雅,规范数据管理过程规范统计分析过程规范统计分析报告,Thank you,X,