临床医学研究数据管理与统计分析2015.ppt

上传人:h**** 文档编号:239685 上传时间:2018-07-26 格式:PPT 页数:69 大小:2.23MB
下载 相关 举报
临床医学研究数据管理与统计分析2015.ppt_第1页
第1页 / 共69页
临床医学研究数据管理与统计分析2015.ppt_第2页
第2页 / 共69页
临床医学研究数据管理与统计分析2015.ppt_第3页
第3页 / 共69页
临床医学研究数据管理与统计分析2015.ppt_第4页
第4页 / 共69页
临床医学研究数据管理与统计分析2015.ppt_第5页
第5页 / 共69页
点击查看更多>>
资源描述

1、临床医学研究数据管理与统计分析,主 讲 人:黄品贤所在部门:基础医学院预防医学教研室联系方式:联系电话:51322156网 址:http:/,统计分析,临床医学研究的过程,讲座内容,一、临床医学研究的数据管理二、临床医学研究的统计分析三、临床数据资料常见的统计分析方法应用问题,一、临床医学研究的数据管理,临床数据管理(Clinical Data Management,CDM),定义:是利用计算机技术、网络技术等对医学研究中获取的及时、可靠、完整和准确的大量数据进行及时填写、医学编码、双人双录、一致性审查、疑问校正、盲态审核、数据转换和锁定等全过程。,临床数据管理(Clinical data m

2、anagement,CDM),目的:保证临床研究过程的科学严谨,资料收集的真实可靠,资料存放的安全有序;将数据库文件按预先制定的统计分析计划书进行统计分析,最终得到真实、可信的研究结论。CDM应在设计研究方案与CRF时就体现数据的采集与管理。数据管理贯穿于临床研究的各个环节。,在进行临床医学研究之前,必须制定数据管理计划(Data Management Plan,DMP)。 临床数据管理计划包括:CRF的设计、数据库的设计、数据接收与录入、数据核查、数据疑问管理方式、数据存档、数据盲态审核、数据库锁定、数据备份与保存、 数据保密及受试者个人私密性的保护。,临床数据管理(Clinical dat

3、a management,CDM),临床数据管理计划,指定一有资格的数据管理员CRF在数据管理前的检查详细的编码表方便记忆的变量名与文件名按需产生的派生变量录入数据的自动控制与逻辑检查CRF中文字信息的处理缺失数据的处理(主要疗效指标和安全性指标),数据疑问管理方式及日志每个阶段数据管理的报告质量控制的细节,数据管理计划的修改或补充时间表数据管理软件与硬件数据格式的转换数据管理的中期报告,临床数据管理流程,数据产生的过程,研究者填写CRF表监察员核查、传递给数据管理单位根据CRF建立录入程序双人双份独立录入核查并产生数据疑问表(DQF)监察员将DQF交研究者复核并回答数据库修改并核查不良事件及

4、合并用药编码盲态下的数据审核数据锁定数据传递(统计分析人员),CRF,临床数据管理相关人员,课题负责人研究者监察员数据管理员合作研究组织,临床数据管理相关人员,课题负责人:数据质量的最终责任人。明确研究方案制定数据质量管理评价程序制定数据质量管理计划与操作指南设立稽查部门并进行定期系统性检查组织培训,临床数据管理相关人员,研究者确保CRF或其他记录的数据及时、完整与准确确保CRF上的数据与病历的源数据一致,并必须对其中的任何不同给出解释研究者可能犯的错误违反研究方案,如错误的访视时间源数据录入CRF时错误实验室仪器人为测量误差研究者造假,临床数据管理相关人员,监察员应根据源文档核查CRF上的数

5、据,一旦发现有错误或差异,应通知研究者,以确保所有数据的记录和报告正确和完整。临床监查中常见问题知情同意书缺失或签署存在问题无原始病历或原始病历中无记录(缺失或不全)CRF填写空缺、错误或不规范不良事件的记录不完整检验结果不能溯源(实验室数据、心电图、X光片等),临床数据管理相关人员,数据管理员参与设计CRF建立和测试逻辑检验程序对CRF作录入前的检查对录入数据库进行逻辑检查数据的有效性、一致性、缺失和正常范围等对发现的问题应及时清理(通过比对或向研究者发放数据质疑表(Query)而得到解决。)参加临床研究者会议,为研究团队及时提出改善与提高数据质量的有效措施。,合同研究组织(Contract

6、 Research Organization,CRO)国际临床试验数据管理首先要符合“人用药品注册技术要求国际协调会议-临床试验质量管理规范”(ICH-GCP, International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use-Good Clinical Practice)的原则性要求。,临床数据管理相关人员,合同研究组织(CRO)ICH-GCP指出课题可以将部分或全部数据管理委托给一个CRO,但是,申报者依然是数据质量和完整

7、性的最终责任人。CRO应当实施质量保证和质量控制。申报者与CRO需签订有效合同,在合同中需明确双方的责、权、利。申报者必要时应对CRO进行相关的培训,以保证其所提供的服务符合申报者质量标准要求。申报者需与CRO进行即时有效的管理、沟通和核查,以确保其遵守共同商定的流程的要求。申报者的质量管理计划中必须包括CRO的质量管理信息,同时必须明确流程和期望结果。,临床数据管理相关人员,核查与疑问管理,数据核查计划数据核查程序疑问表(Data Query Forms,DQF)的产生DQF的回答DQF的返回及处理,监查,数据核查目的,核查人员对CRF表中的各个指标的数值和相互关系根据临床试验方案要求进行核

8、查,对于缺失、逻辑矛盾、有误或不能够确定的数据,以疑问表的形式由临床试验监查员传递给临床试验中心,由研究者对疑问做出回答。,数据核查计划,按CRF页码和各页数据项内容顺序撰写。数据项核查条件统一描述数据库的所有数据均需描述核查条件应描述各数据项的核查范围和发疑问或确认的标准内容完成相同的页,可合并撰写(如各访视内容) 核查计划传递给申报人,申报人审核并提出修改意见核查计划签字后方生效,数据核查程序,核查程序是根据数据检查计划,可在SAS 环境下按数据核查计划内容编写的核查程序;也可利用EpiData的Check功能检查;也可通过数据网络输入平台进行核查。主要检查CRF表中数据缺失、误填、数据逻

9、辑矛盾等问题。程序核查后人工校对。,数据的差异性检验,原始数据的录入和导出,数据疑问的查找,数据疑问常见类型,补充: 病例报告表中有缺失的项目,或字迹不清楚的数据。确认:入选/排除标准的确认:实验室检查:多中心提供的正常值范围不一致时需要对观察指标进行临床意义的判断。时间的确认:所填写的时间不在研究时间范围内;或所填写的访视时间不在方案要求的访视时间窗内。合并用药的确认:填写数据与各访视所填内容有矛盾;使用了方案中明确禁止的药物,药物名称无法编码的。不良事件的确认:填写数据与各访视所填内容有矛盾;各项之间的逻辑关系有矛盾;判定为严重不良事件。不良事件描述不清楚,无法做编码的。,DQF的提问方式

10、,DQF的回答,根据问题,查阅原始资料和CRF表所填内容,慎重回答。如果某一数据的修改,会影响其它数据时,请一并回答。,疑问表修改说明,1.疑问表是由XXXXX大学数据管理中心发出2.疑问仅是数据管理人员对有关数据存有疑惑而发出的询问,希望研究者给予明确答复3.数据修改必须以原始数据为依据,不能推论式回答4.研究者如果认为数据无错误,在相应的方框内划,并签名确认5.研究者如果认为数据确实有错误,在相应的方框内划,并注明错误形成原因,签名确认6.疑问表中所列参考值范围如果不符,以化验单上注明的为准7.如果定性指标在CRF上已编号,例如 1=正常 2=异常无临床意义 3=异常有临床意义 4=未查,

11、回答时使用相应的编号,编码(Coding),为便于统计分析,将研究者填写的合并用药和不良事件根据相应标准进行规范化处理的过程。不良事件编码 1. 如将上感、感冒等统一编码为上呼吸道感染 2. 如将恶心呕吐拆分编码为“恶心”和“呕吐”合并用药编码(按药品通用名编码) EPIAO、罗可曼、利血宝和济脉欣等均编码为“红细胞生成素”,患者数据列表中止试验患者方案偏离从疗效分析中剔除的患者人口统计学数据依从性和/或药物浓度数据(如果有)个例疗效反应数据不良事件列表(每名患者)按患者列表的个例实验室检查值(管理当局要求时)ICH E3(临床试验报告的结构与内容): Sec.16.2,数据清单和表格(1),

12、患者表格人口统计学数据的汇总图表有效性数据的汇总图表安全性数据的汇总图表不良事件的描述死亡、其它严重不良事件以及其它重要的不良事件清单死亡、其它严重不良事件以及某些其它重要的不良事件叙述实验室检查异常值清单(每名患者)ICH E3(临床试验报告的结构与内容): Sec.14.1-14.3,数据清单和表格(2),是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。参加数据审核会议人员,一般由主要研究者、统计分析员、数据管理员、监查员和申报者组成。,数据的盲态审核,数据管理员:准备一份数据管理报告。 内容:包括数据管理的过程及一般情况介绍、病例入组及完成情况

13、(含脱落病例清单)、判断统计分析人群所涉及的项目及需讨论并解决的问题(入选/排除标准检查、完整性检查、一致性检查、离群值检查、时间窗检查、合并用药检查、不良事件检查等) 若采用盲法,需递交临床研究盲底。,数据的盲态审核,(1)全体参会人员检查总盲底及应急信件,对盲态做出判断。(2)数据管理员报告数据管理的一般情况及数据库中存在的需要讨论解决的条目。(3)主要研究者、统计分析人员、数据管理员共同就数据管理员提交的问题进行讨论并做出处理决定。(4)与会人员讨论并决定统计分析人群。(5)统计分析计划的修正与定稿。(6)决定是否锁定数据。(7)当揭盲条件成立时,具体执行揭盲。 最后签署盲态审核决议,将

14、锁定后的数据交统计分析人员进行统计分析。,数据的盲态审核,数据盲态审核决议,关于数据库的报告,需提供如下信息:关于数据库结构、域名的详细报告实验室数据的参考值范围用于建立、核查数据库的软件清单及简单说明各阶段数据核查的错误率的详细报告未解决的质疑数据清单未在数据库更正的质疑数据或错误的说明电子版本数据库的存放位置说明,二、临床医学研究的统计分析,让你学会用手中的少量数据对重大问题做出明智的决策,SPSS,医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等,是一门很高超的艺术。基本要求:完全、准确、有效地建立统计分析所要求的数据库。由统计学专业人员与数据管理员负责忠实于原

15、始数据恰当选用统计方法熟练使用统计软件等,二、临床医学研究统计分析,各阶段受试者流程。特别是报告随机分配到各组的人数、接受意向治疗(ITT)的人数、按方案完成治疗(PP)的人数以及对主要结局分析的人数。描述与计划的研究方案偏离的情况和理由。,意向治疗分析,一、受试者流程和分析人群,临床试验有效性分析应包罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的分析是最好的分析,其结果是每一个随机分配到试验组或对照组的受试者都应该完整地随访,记录研究结果,而不管他们的依从性如何。,ITT原则(意向治疗原则 Intention-To-

16、Treat Principle),三类统计分析数据集及其关系,三类数据集即:符合方案数据集(Per-Protocol Set):由完成且符合方案中各项规定的病例构成,简称PPS集 全分析数据集(Full Analysis Set):由符合入组条件并至少做个一次疗效评价的病例构成,简称FAS集或全数据集 安全性数据集(Safety Set):由使用过试验药物并至少做个一次随访且至少有部分安全性数据记录的病例构成,简称SS集,有效性分析,主要疗效指标(primary end points)次要疗效指标(secondary end points)同时对FAS数据集和PPS数据集作分析,两组疗效比较的

17、类型,优效(Superiority): 或 “试验组(E)优于对照组(C )” 等效(Equivalence): = 或 “试验组(E)与对照组(C )相当”非劣效(Non-inferiority ): 或 “试验组(E) 与对照组(C ) 差但不多”,确认试验药物疗效的假设检验方法,*试验药物的效应为T,标准药物的效应为C, 为界值优效性用 ,非劣效性用- ,等效性试验用- 和 。,差异性、等效性、非劣效性和优效性检验,误用:以显著性检验代替非劣效、等效和优效性检验区别:差异性检验是和0做比较,即两总体均数是否完全不等,而不管这种差别是否有专业意义;等效性检验、非劣效性检验和优效性检验是和做

18、比较,即检验在一定允许范围内的是否相等或不等,不仅要检验差别是否存在,而且更关注这种差别是否具有专业意义。,差异性、等效性、非劣效性和优效性检验,在等效性检验、非劣效性检验和优效性检验中的,即认为在一定范围内相等/等效的允许值,也叫等效临界值,一般认为应从专业角度反复论证并结合成本效益加以估计。根据以往经验,较为公认的值:如血压可取为0.67kPa(5mmHg)胆固醇可取为0.52mmol/L(20mg/dl)白细胞可取为0.5109/(500个/mm3)等当难以确定时,可酌取试验组均数的1/51/2个标准差,或对照组均数的1/101/5等,在生物利用度的等效性评价中,一般取标准参照品均数的1

19、/5,两组率的等效性检验取对照组样本的1/10 左右。,患者暴露于研究药物的时间 研究时间(天)=(末次随访日期初诊日期)+ 1 治疗时间(天)= 按照患者实际用药天数计算 患者用药依从性=(发药量剩余量)应服药数量100%, 安全性评价指标 生命体征(心率、收缩压、舒张压)、体重、 实验室检查(心电图) 不良事件 ,安全性评价,临床研究中的统计学分析,多因素方差分析(统计设计类型)协方差分析(随机设计、区组设计)多元线性回归分析(具体方法;入;出)Logistic回归(具体方法;入;出)生存分析 1)寿命表法 2)Kaplan-Meier法 3)Log-rank检验 4)Cox比例风险模型判

20、别分析(具体方法)聚类分析(具体方法)主成分分析与因子分析(旋转方法),临床研究中的多因素分析,典型相关分析对应分析统计预测综合评价综合评分法综合指数法层次分析法TOPSIS法秩和比法,研究类型研究对象来源、选择方法【标准:诊断标准(中医、西医)、入选标准、剔除标准,等】基本原则:随机、对照、重复、盲法;(分组方法:完全随机、配对、配伍、分层随机分组等;非随机化分组。各组样本量应相等或相差不多)样本含量估计:(参数、参考文献、计算公式、软件)观察方法及评价标准:(随访:有无失访、失访比例及失访的详细阐述) 、有无“知情同意”)均衡性检验:如年龄、性别、病情、病程等一般资料的具体分析结果。实验、

21、试验或调查资料的搜集过程等。研究中统计分析结果的规范表达。,临床研究设计方案统计表达,三、临床数据资料常见的统计分析方法应用问题,1. 误用t检验分析等级资料,文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验,表4 两组临床主要症状和结肠镜肠粘膜病变评分( ),:与西药组比较,P0.05,组间差异无统计学意义;:与治疗前比较,P0.05,组内差异有统计学意义;:与西药组比较,P0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。,1. 误用t检验分析等级资料,2.误用t检验处理重复测量的两因素试验设计,文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成统

22、计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。,辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。 在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。,文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。 停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第35组给含10%炭末的不同剂量的开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭

23、末的儿康宁。给药30min后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。,3.多因素非平衡组合设计的统计错误,辨析:(1)实验设计各对比组间混乱。各剂量组、儿康宁组与空白组是否具有可比性?不同剂量的口服液、丸剂和儿康宁之间是否具有可比性?(2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。(3)确切的统计量和P值。,原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。,3.多因素非平衡组合设计的统计错误,改进措施:(1)在分析时将实验拆分为:组合1:空白组与

24、模型组说明造模成功组合2:模型组+低剂量组+中剂量组+高剂量组各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁在相同剂量的情况下,口服液比丸剂和儿康宁都好(2)第一组采用成组t检验分析。 其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。,3.多因素非平衡组合设计的统计错误,4. 正确处理析因设计定量资料,文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响设计:研究者将66只SD大鼠随机抽取6只作为正常

25、组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90 min 5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。,n=30,各时点ni=6,辨析:对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资

26、料不满足方差分析时,可进行变量变换或采用秩和检验。若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。,4.正确处理析因设计定量资料,5. 误用2 检验分析结果变量为有序变量的资料,某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经RC表2检验,2=53.33 ,P 0.01 ,认为两组疗效之间的差异有统计学意义。,辨析:本资料属于单项有序的RC表,临床疗效有等级之分,对于等级资料可

27、采用Ridit分析或秩和检验。而不应用RC的2检验,RC表2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,2值仍为53.33,不会有改变。,确切的统计量P值。,6.误用2检验回答相关性问题,上述资料用2检验得:2 =163.01,P0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?,表 不同年龄冠状动脉粥样硬化程度的分布,辨析1:本资料为“双向有序且属性不同的二维列联表资料”,处理

28、这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察“两个有序变量之间是否呈相关关系”,而2检验结果是P0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2检验的统计量数值是不会变化的,说明2检验用于处理有序变量形成的二维列联表资料是不合适的。,6. 误用2检验回答相关性问题,辨析2:欲考察“两个有序变量之间是否呈相关关系”

29、,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。本例采用Spearman秩相关分析,得:rs=0.53215,P0.0001。结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。,6. 误用2检验回答相关性问题,7. 多值有序变量的高维列联表资料,“创伤性上颈椎损伤早期漏诊原因分析”中对1994年至2003年治疗的58例上颈椎患者进行回顾性分析,男35例,女23例,接受手术治疗或非手术治疗,假设两治疗组患者在年龄、性别、损伤类型构成无统计学差异。治疗结果见表l1。请问

30、:能否以“损伤类型”为依据,将此资料切割成多个二维列联表,一一采用秩和检验进行分析?或者通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析?,该资料原因变量有两个,分别为“损伤类型”和“治疗方式”,均为名义变量,结果变量为“疗效”,因此该资料属于结果变量为多值有序变量的三维列联表资料。以“损伤类型”为依据,人为地将此资料切割成多个二维列联表,一一采用秩和检验进行分析,这是用单因素分析法来处理同时受多个因素影响的定性资料,割裂了多因素之间的相互联系,易得出错误的结论。通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析,这是对高维列联表的“压缩”。但这种“压缩”不是总可套用的,仅当被合并掉的那个变量与保留下来的变量之间都是相互独立的关系时,才不会得出错误的结论。正确做法:本资料应采用CMH校正的秩和检验,此法通过加权的方法消除掉一个原因变量,着重研究另一个原因变量取不同水平条件下有序结果之间的差别是否具有统计学意义;若希望将两个原因变量对有序结果变量的影响都明确地显示出来,建议选用有序变量的多重logistic回归分析。,7. 多值有序变量的高维列联表资料,辨析:,11种形式的列联表,,规范数据管理过程规范统计分析过程规范统计分析报告,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。