1、病例-对照研究case-control study,一、基本原理,将研究人群按是否患病或是否具有某种状况分为两类,同时追溯他们既往暴露于某个(些)因素的情况。比较他们之间暴露上的差异,借以判断暴露因素与某病有无关联的一种观察性研究方法,暴露(exposure),指研究对象曾经接触过某些因素:物理因素、化学物质、生物因素具备某些特征:人口学特征、遗传处于某种状态:心理、精神暴露因素可以是有害的,也可以是有益的。暴露因素也叫研究变量(varible)。,病例-对照研究结构模式,回顾,病例,对照,暴露,未暴露,暴露,未暴露,实例,二、适用范围,1、适用于慢性病、罕见病的病因研究2、可用于筛检原因不明
2、疾病(事件)的致病因素3、可验证有关因素的病因假设,三、类型,1、病例与对照不匹配 成组病例对照研究2、病例与对照匹配 频数匹配 要求匹配的因素在两组中比例一致 个体匹配 1:1称为配比,1:2,1:3,1:4,四、研究方法,(一)研究对象的选择(二)样本量的计算(三)研究因素暴露史的收集与测量(四)资料的整理与分析,(一)研究对象的选择,1、病例的选择(1)对疾病的规定尽量使用国际/国内统一使用的诊断标准要自定标准时要考虑到假阳性和假阴性率的高低,将标准定在交叉点上(2)对病人其他特征的规定:年龄、性别(3)病人进入的标准(4)病人的来源:医院、社区,2、对照的选择(1)标准的规定 包含法
3、除外法(2)来源同一医院中诊断为其他疾病的病例社区人群中的非该病病例或健康人病例的配偶、亲戚、同事、邻居等,3、病例与对照的配合 (1)成组匹配 一组病例多组对照,多组病例一组对照(2)个体匹配 一个病例一个对照,或多个对照(3)匹配因素 已知混杂因素 可疑混杂因素 复合因素:年龄/性别 本次研究不研究的危险因素(4)匹配过头,4、匹配的优缺点(1)优点 利用自然对子,效果最佳; 较小的样本提高研究效率 排除了混杂因素,增加结果的真实性 结果易于解释(2)缺点 匹配因素确定难 样本数受限 匹配过头低估了研究因素的作用 花费多,投入大,(二)样本量的估计与计算,决定样本大小的四个条件: P0 :
4、一般(对照)人群中所研究因素的暴露比 RR:相对危险度a:类误差,显著性水平,5:类误差,把握度(1)80,(二)样本量的估计与计算,1、公式计算法 2、查表法,(三)研究因素的收集和测量,1、研究因素的确定: 根据研究病因假说确定研究因素 2、研究因素的测量: 暴露时间:开始时间、持续时间和终止时间 暴露程度:不同时间的暴露剂量和水平;累计暴露剂量和水平3、资料收集:问卷、记录、测量,(四)资料的整理与分析,1、资料的整理(1)原始资料的核查(2)原始资料分组、编码、录入,2、资料的分析(1)描述性分析 一般特征描述; 均衡性检验: 比较研究因素以外的各种特征在两组的可比性; 匹配因素的描述
5、: 计算在两组中的比例,(2)推断性统计将资料按每个因素整理成四格表检验两组暴露率是否有差异:卡方检验计算暴露与疾病的关联强度:OR值计算关联强度的可信区间: OR值的95%CI分层分析剂量-反应关系,1、不匹配不分层资料,口服避孕药(OC)与心肌梗死(MI)关系的病例对照研究,检验两组暴露率是否有差异,用2检验用途:考察暴露与疾病有无统计学关联,实例:X2 =7.70 6.63(X20.01(1),则p1,OC是MI的危险因素。OR的可信区间 Var(lnOR)=1/a+1/b+1/c+1/d=0.0826 OR 95% C.I.=1.253.75 95%CI 不含1,说明 OR值的大小不是
6、由于偶然造成。,2、不匹配分层资料,分层分析是把人群按某些因素或特征的有无以及某因素的水平分成不同层次,再分别对各层人群进行暴露与疾病关联分析。目的是排除这些因素或特征对暴露因素与疾病关联的混杂干扰。,分析步骤,按可能的混杂因素分层,每层整理成一个四格表,计算每层的2和OR;判断是否为混杂因素;如果两层OR值接近,谓之同质,可以计算总OR值(ORmh)、总2值和 ORmh95%CI;如果不同质,不能合并,分别计算,如果一定要出总的关联,可计算SMR。,病例对照研究分层资料整理表,母亲孕期接触放射线与儿童白血病的病例对照研究,OR=(30155)/(4570)=1.48,妊娠一次OR=(2338
7、)/(3722)=1.07,妊娠多次OR=(7117)/(3323)=1.08,两层资料是同质的,可以认为母亲妊娠次数不影响放射诊断与儿童白血病的固有关联,不是混杂因素。,ORmh=,当两层的OR值接近时,说明两个资料是同质的,计算总的OR值 Mantel-Haenszel OR,本例 ORMH=2338/120+7117/180/3722/120+3323/180=1.08,计算总的卡方值 Mantel-Haenszel X2MH,本例:X2 MH =(2338-3722)/120+(7117-3323)/1802/(60604575)/(1202119)+(4014030150)/(180
8、2179)=0.06估计总OR值95% C.I. Miettinen法,本例OR上限为2.00,下限为0.58.,分层后 ORMH=1.08 95%CI=2.00-0.58不分层 OR=1.48 95%CI=2.54-0.86分层前后OR值接近,即暴露因素导致疾病的危险程度没有显著性意义,3、暴露分级资料的分析,用来分析疾病和暴露的剂量反应关系 将资料整理成列联表做X2检验 计算各分级的OR值 :通常以不暴露或最低水平的暴露为参照。,男性每日吸烟的支数与肺癌的关系,1:1 配对资料分析,5、 1:1 配对资料,卡方检验 McNemar 公式 比值比 ORc / b OR 95%CI:Miett
9、inen 公式,1:1配对资料分析实例,外源性雌激素与子宫内膜癌配比资料因对子数较少,故用McNemar校正公式 X2=(b-c-1)2/(b+c)=19.53,p0.005 OR=c/b=9.67,五、常见的偏倚及其控制,在流行病学研究过程中,由于各种原因使所得结果与真实情况存在系统误差,即偏倚。一般有三类偏倚选择偏倚(selection bias) 信息偏倚(information bias) 混杂偏倚(confounding bias),(一)选择偏倚(selection bias),选择偏倚是指研究设计阶段,选择研究对象的方法有问题,使入选者与落选者在某些特征上具有系统差异 。(1)入
10、院率偏倚(Berkson bias):当利用医院病人作为病例和对照时,由于入院率的不同导致病例组与对照组某些特征上的系统差异。,(2)存活病例偏倚(Neyman bias):从现患病例得到的很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用。另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病关联误差。,检出征候偏倚(detection signal bias):病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度,而产生的系统误差。时
11、间效应偏倚(time effect bias):慢性疾病的病例对照研究,那些暴露后即将发生病变的人,已发生早期病变而不能检出的人,或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此而产生了结论的误差。,(二)信息偏倚(information bias),信息偏倚是指收集资料阶段,测量暴露或结局的方法有缺陷,使各比较组间产生系统差异 。回忆偏倚(recall bias) 调查偏倚,(三)混杂偏倚(confounding bias),研究暴露与疾病的因果关系时,混入外部因素,该外部因素与疾病和暴露都有一定的关联,此外部因素即为混杂因素(confounding
12、 factor)。 由于混杂因素的存在,影响了暴露与疾病间的关联强度,由此带来混杂偏倚。,(四)偏倚的控制,选择偏倚:随机选取、多医院选取、用新发病例等。信息偏倚:特殊目标记忆、培训、一致性调查等。混杂偏倚:设计时匹配,分析时分层或多因素分析。,六、结果的解释,偏性的作用 机会的作用 因果关系推断,七、优点,1. 特别适用于罕见疾病研究2. 对慢性病的研究可较快得到对危险因 素的估计3. 省时、省力,易于组织实施4. 可检验明确的危险因素的假设5. 一次研究可探索多个危险因素,八、缺点,1. 不适宜研究暴露率很低的疾病2. 容易出现选择性偏倚和回忆偏倚3. 混杂因素难以控制4. 因果时间先后难以判断,