1、临床试验数据管理与统计分析,北京大学第一医院医学统计室(66115216)姚 晨,临床试验,监查,CRF,统计分析,统计与临床报告,SFDA/CDE,批准与上市,数据管理,临床试验过程,一、临床试验的数据管理,数据管理的目的,数据管理的目的:以及时、有效的方式为支持新药批准上市提供与预期结果一致、精确、正确的临床试验数据,以便对此数据按预先制定的统计分析计划书进行统计分析。 数据管理的定义:将在临床试验中产生的大量数据及时填写、准确录入、计算机辅助人工审核校对、疑问问答校正,数据盲态下审核与锁定等全过程。,数据产生的过程,研究者填写CRF表监察员核查、传递给数据管理单位根据CRF建立录入程序双
2、人双份独立录入核查并产生数据疑问表(DQF)监察员将DQF交研究者复核并回答数据库修改并核查不良事件及合并用药编码盲态下的数据审核数据锁定数据传递(统计分析人员),数据管理流程,项目启动,管理计划,核查计划,CRF注释,录入程序,核查程序,数据录入,疑问管理,临床试验中心,质量检查,数据关闭,管理报告,数据审核,数据锁定,数据传递,数据管理计划(DMP),阐述该项目的数据管理过程、时间约定、项目组成员、数据核查计划、关键指标及非关键指标的约定、疑问管理方式等。 该计划由项目申办单位、统计单位和数据管理单位签署,做为该项目数据管理的依据。,核查与疑问管理,数据核查计划数据核查程序疑问表(DQF)
3、的产生DQF的回答DQF的返回及处理,数据核查目的,项目核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。,数据核查计划,通用数据项核查条件统一描述按病例报告表页码和各页数据项内容顺序撰写。所有已进入数据库的数据均需描述核查条件对各数据项应描述其核查范围和发疑问或确认的标准内容完成相同的页,可合并撰写(如各访视内容) 核查计划传递给申办方,申办方审核并提出修改意见核查计划签字后方生效,数据核查程序,核查程序是根据数据检查计划,在SAS 环境下按数据核查
4、计划内容编写的核查程序。 主要检查CRF表中数据缺失、误填、数据逻辑矛盾等问题。程序核查后人工校对,数据疑问常见类型,1 、补充: 病例报告表中有缺失的项目,或字迹不清楚的数据。2、 确认: A.入选/排除标准的确认: B.实验室检查:数值与临床意义判断与各个中心提供的正常值范围不一致。 C.时间的确认:所填写的时间不在试验时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。 D.合并用药的确认:填写数据与各访视所填内容有矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。 E.不良事件的确认:填写数据与各访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不
5、清楚,无法做编码的。,DQF的提问方式,1、XX项数据缺失,请补充2、出生日期为XXXX年XX月XX日,请确认3、WBC测定值为11x109/L,临床意义为“正常”,请确认4、访一时间为XXXX年XX月XX日,访二时间为XXXX年XX月XX日,不在时间窗内,请确认5、不良事件:“XXXX”,为方便编码,请进一步详细描述,疑问表式样举例,DQF的回答,根据问题,查阅原始资料和CRF表所填内容,慎重回答 如果某一数据的修改,会影响其它数据时,请一并回答,编码(Coding),为便于统计分析,将研究者填写的合并用药和不良事件根据相应标准进行规范化处理的过程。不良事件编码: 1、如将上感、感冒等统一编
6、码为上呼吸道感染 2、如将恶心呕吐拆分为两个AE编码,分别编码为“恶心”和“呕吐”合并用药编码(按药品通用名编码) EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素”,不良事件COSTART (FDA)WHO ART (WHO)MedDRA诊断和处理ICD-10-CM药物WHO Drug (WHO)PDR,医学标准术语编码,患者数据列表中止试验患者方案偏离从疗效分析中剔除的患者人口统计学数据依从性和/或药物浓度数据(如果有)个例疗效反应数据不良事件列表(每名患者)按患者列表的个例实验室检查值(管理当局要求时)ICH E3(临床试验报告的结构与内容): Sec.16.2,数据清单和表格
7、(1),患者表格人口统计学数据的汇总图表有效性数据的汇总图表安全性数据的汇总图表不良事件的描述死亡、其它严重不良事件以及其它重要的不良事件清单死亡、其它严重不良事件以及某些其它重要的不良事件叙述实验室检查异常值清单(每名患者)ICH E3(临床试验报告的结构与内容): Sec.14.1-14.3,数据清单和表格(2),临床试验数据盲态下审核是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。参加数据审核会议人员,一般由主要研究者、统计分析员、数据管理员、监查员和申办者组成。,盲态下的数据审核会议,1、对双盲临床试验中的盲态进行审核。2、对数据中存在的需讨
8、论的问题做出决定,重点在分析并决定统计分析人群。 3、对数据的整体质量做出评估。4、讨论并定稿统计分析计划。 5、决定是否锁定数据与揭盲。,1、目的与任务,1、数据管理员应准备一份数据管理报告,内容至少应包括:数据管理的过程及一般情况介绍、病例入组及完成情况(含脱落受试者清单) 、判断统计分析人群时涉及的项目及需讨论并解决的问题(入选/排除标准检查、完整性检查、逻辑一致性检查、离群数据检查、时间窗检查、合并用药检查、不良事件检查等),2、准备工作,2、数据管理理员准备一份关键变量的清单,于会议前交相关人员进行会前审核以便更充分地发现并解决问题。 3、如果是双盲临床试验,申办方将各中心随试验用药
9、下发的应急信件收回,交盲态审核用。4、提交临床试验总盲底。,1、全体参会人员通过对总盲底及应急信件的检查,对双盲临床试验的盲态做出判断。 2、数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。 3、主要研究者、申办方代表、统计分析人员、数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。,3、一般程序,4、与会人员讨论并决定统计分析人群。5、统计分析计划的修正与定稿。6、决定是否锁定数据。7、当揭盲条件成立时,具体执行揭盲。 最后签署盲态审核决议,将锁定后的数据交统计分析人员进行统计分析。,二、临床试验统计分析,各阶段受试者流程。特别是报告随机分配到各组的人数、接受意
10、向治疗(ITT)的人数、按方案完成治疗(PP)的人数以及对主要结局分析的人数。描述与计划的研究方案偏离的情况和理由。,意向治疗分析,一、受试者流程和分析人群,临床试验有效性分析应保罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的分析是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。,ITT原则(意向治疗原则、Intention-To-Treat Principle),全分析集(Full Analysis Set)FAS 是指尽可能接近符合意向治疗分析原则(
11、ITT)的理想的受试者集。该数据集是从所有随机化的受试者中,以最少的和合理的方法剔除受试者后得出的。在选择全分析集进行统计分析时,对主要指标缺失值的估计,可以采用最接近的一次观察值进行结转。 符合方案集(Per Protocol Set) 符合方案集是全分析集的一个子集,在这个数据集中每位受试者是依从性好,不违背方案。一般是指全分析集中至少符合下列三个条件的受试者。 主要指标的基线值完备。 不违背方案,符合入选排除标准,未合并使用方案规定不能用药物 依从性好,有效性评价的两种分析数据集,二、随机入组病例特征描述,基线定义为随机入组时间,病例特征一般包括为患者的人口学信息、饮食运动情况、疾病情况
12、等。根据变量的数字特征,采用t检验/Wilcoxon秩和检验对患者年龄、身高、体重、病程、生命体征等定量数据进行比较。采用卡方检验Fisher确切概率检验或者Wilcoxon秩和检验对患者的性别、饮食控制、运动治疗、降糖药物治疗史、疾病史等分类变量进行基线比较。基线描述分析采用FAS数据集。,三、有效性评价(定量指标),对基线和不同访视点及其相对基线的评价指标变化进行统计描述,计算例数、均数、标准差、中位数、最小值、最大值。 采用协方差分析(ANCOVA)模型对治疗前后的评价指标变化进行两组间比较,此分析模型以基线评价指标为协变量,考虑分组、中心的作用。在此模型的基础上,计算各组的最小二乘均数
13、 (LSMEANS)、95% 可信区间以及两组变化值之差的的最小二乘均数 (LSMEANS)、95% 可信区间。对各研究中心结果的一致性的检验,应用在上述模型中增加治疗分组与研究中心交互作用项的协方差模型分析,并在0.10水平判断交互项是否有意义,即:是否存在交互作用。此外,对每组各指标治疗前后的变化将采用配对t检验进行比较。,三、有效性评价(定性指标),对定性指标(如治疗是否成功),分别对各访视点(包括终点)按该指标的分类情况进行描述,计算各分类的例数和百分数,在=0.05显著水平下,采用按中心分层的CMH-2检验对两组进行比较。以此模型为基础计算评价终点时该指标的95%可信区间。,应用协方
14、差分析(COANOVA)在18周时评价SISBP变化这一主要终点,以研究中心和治疗方法的因素,基线SISBP为协变量。计算每个治疗组从基线变化的最小二乘均数和95%CI。计算95%CI显示最小二乘均数的差异。如果双侧95%CI显示的差异小于6mmHg(18周时氯沙坦组SISBP平均变化值-氨氯地平为主治疗的平均SISBP变化值),则认为氯沙坦为主的治疗不劣于氨氯志平为主的治疗。根据95%CI评价组内变化值。研究规模可以提供90%的把握度,证实SISBP下降显示氯沙坦为主的治疗不劣于氨氯地平为主的治疗。,统计学新名词1、协方差分析(协变量)2、95%CI3、最小二乘均数4、不劣于(非劣效),有效
15、性评价的统计学方法,两组比较的类型,优效(Superiority): 或 “试验组(E)优于对照组(C )” 等效(Equivalence): = 或 “试验组(E)与对照组(C )相当”非劣效(Non-inferiority ): 或 “试验组(E) 与对照组(C ) 差不多”,无效假设:试验组与对照组均数相等 Ho: T-C=0,备择假设:试验组与对照组均数不等,H1: T-C0,假设检验与两类错误,推论结果,拒绝,不拒绝,假设,正确,错误,把握度 1 - ,假设被告无罪(犯罪嫌疑人),原告辩护律师获胜,假设检验与两类错误,阳性对照试验的优效性检验(P0.05),非劣效/等效,(错!),误
16、解,?,检验假设的构建和检验用统计量结论的推断,假设检验,可信区间提供一个围绕某统计量(如样本均数)的范围,这个范围可以以一定的可信度包含相应的参数(如总体均数).例如,样本均数的 95% 可信区间可以解释为:“有95%的把握认为总体均数在这个围绕样本均数的区间内.,),可信区间(Confidence Interval,CI),观察到试验组与对照组成功率之差 如:- 2% (样本率),200 名受试者, 有效性评价指标-成功率,试验药: 88%, 对照药: 90%, 95% CI: (-8.6% 4.6%),总体率范围,建立可信区间与进行假设检验的过程几乎是相同的:二者均需要标准误、统计量的抽
17、样分布,二者均找到统计量的判断界值. 如果一个可信区间的上限低于另一个可信区间的下限,那么两样本 t 检验也会同时提示两均数不相等.,可信区间与假设检验的关系,优效的定义,“E C” 的结果并非100%可信,“E 的真值”,因为 E C E C 0, ,E C 的 95% 可信区间 包含在区间 (0, ) 内 假设 E = C 的检验结果: P0.05,优效性试验的统计分析,试验组(E)是否优于对照组(C)?,步骤从试验结果判断差异的大小CI 包含于 (0, ) 假设检验的 p值 0.05(有统计学意义) 列出实际P值表明其对差异的支持程度如果统计学有意义,判断差异的临床价值,优效: E C
18、的 95% 可信区间,等效性试验的统计分析,E 是否等效于 C? 或, 确定差异在事先定好的范围 内,步骤选择一个临床等效的界值 计算差异的 95% 可信区间是否在 (, )内,等效: E C 的 95% 可信区间,支持等效,不支持等效,0,试验组好,对照组好,(,(,(,),),),不支持等效,+,非劣效的定义,绝对的相等 E = C 是不可能的非劣效: E 与 C相近,可以差一些,但不能太大,具体根据事先确定的界值 判断,95% 可信区间的下限大于 .,非劣效试验的统计分析,E 是否非劣于C(至少与C一样好)? 或, E与 C (阳性对照) 的差距在界值 以内,步骤选择临床非劣效的界值 计
19、算差异的 95% 可信区间是否在(, )内,非劣效: E C 的 95% 可信区间,非劣效与优效比较,为评价某治疗糖尿病新药的有效性,采用随机、双盲双模拟、阳性对照药平行对照、多中心临床研究设计方案,整个试验过程历时18周,其中药物治疗16周,以16周测定的HbA1c 相对基线(0周)变化值作为主要疗效指标。根据临床经验规定如果试验组主要疗效指标不比阳性对照药差0.3,即可判定试验药有效,必要时还可进一步评价是否优于对照药。 这里提出的是一个非劣效检验的问题,根据对照药的有效性,由临床专家提出了0.3这一非劣效的标准,即:当两组主要疗效指标的总体差值不超过0.3时,该差距在临床上没有实际意义,
20、认为两组药物疗效相当。,举例(两均数之差),1、主要疗效指标治疗前后变化,2、各中心主要疗效指标治疗前后变化,3、主要疗效指标中心效应分析,ANOVA数据的图形表达,最小二乘法(最早称为回归分析法)是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配,由著名的英国生物学家、统计学家道尔顿(F.Gallton)达尔文的表弟所创。 ANOVA是利用线性回归模型研究变量之间存在关系 。最小二乘均数(LSmeans)是校正其他因素影响后的估计的独立效应大小,其95%CI为总体效应大小。,ANOVA中的最小二乘均数(LSmeans),4、主要疗效指标有效性分析,有效性判定: 试验组 对
21、照组 差值的 95% CI,不支持非劣,支持非劣,支持优效,患者暴露于研究药物的时间 研究时间(天)=(末次随访日期初诊日期)+ 1 治疗时间(天)= 按照患者实际用药天数计算 患者用药依从性=(发药量剩余量)应服药数量100%, 安全性评价指标 生命体征(心率、收缩压、舒张压)、体重、 实验室检查(心电图) 不良事件 ,四、安全性评价,生命体征、体重:对基线和每次访视时检查结果进行定量描述,组内采用配对t检验,组间采用两组t检验进行比较。心电图:采用治疗前后交叉表的形式描述各治疗周期心电图变化。实验室检查:采用治疗前后交叉表的形式定性描述其有临床意义的变化。不良事件的种类、严重程度、发生频率及与研究药物的关系将列表描述。,安全性评价统计分析方法,Thank you联系人:姚晨,问题与解答,