1、1、如何确认某暴露(E)和某疾病(D)之间是否存在 病因关系?如何设计?2、如何探索胃癌的病因或危险因素?如何设计?3、如何通过流行病学研究设计探索某基因多态性和 肺癌的关系?4、如何评价暴露(E)和疾病(D)之间的联系强度?,讲课提纲,流行病学病因研究的一般思路,Case control study,Cohort study,分析性研究 Analytic Study,病例对照研究是通过对一组患有某种疾病人群(病例组)和一组或几组未患该病的对照人群(对照组)既往暴露于某个或某些可能危险因素(或保护因素)频率的比较,来考察这些因素是否与该病存在联系及联系的程度。 一种常用于广泛探索或初步验证病因
2、假设的分析性流行病学研究方法。,病例对照研究的基本原理,概念,设计原理,目标人群,1、分析性研究,属观察法2、回顾性研究3、时间顺序:从“果”“因”4、通常不能够确证因果关联,特点,历史,Case-control studies identified associations between lip cancer and pipe smoking (Broders 1920), breast cancer and reproductive history (Lane-Claypon 1926) and between oral cancer and pipe smoking (Lombard
3、and Doering 1928). All rare diseases.Case-control studies identified an association between smoking and lung cancer in the 1950s.,病例和对照不匹配 病例与对照匹配,病例对照研究的设计类型,病例与对照不匹配,病例组,对照组,样本人群,病例与对照匹配:频数匹配,某些特征,样本人群,病例与对照匹配:1:1匹配,某些特征,配对(pair matching),样本人群,病例与对照匹配:1:R匹配,1:2, 1:3 1:R,样本人群,病例与对照匹配的因素,混杂因素 (已知、可疑
4、)复合因素:年龄 + 性别,研究因素与疾病因果链中的中间变量只与可疑暴露有关而与疾病无关的因素,不能匹配的因素,病例与对照匹配的目的,提高研究(统计)效率。 研究效率2R/(R+1)控制混杂因素的混杂作用。,匹配带来的问题,增加工作难度(费用、时间)限制样本量匹配因素将无法再进行分析匹配过头 (overmatching)损害统计效率损害真实性损害费用效益,研究实例,Herbst AL, et al. NEJM 1971;284(16):787-881.,Adenocarcinoma of the vagina: association of maternal stilbestrol thera
5、py with tumor appearance in young women.,女性阴道腺癌与母亲服妊娠期用己烯雌酚,Objectives,To determine the factors responsible for the unusual occurrence of a rare tumor (vaginal adenocarcinoma) among 8 young women born between 1946 and 1951.,Methods,For each of these 8 cases, 4 matched controls (those who did not hav
6、e vaginal adenocarcinoma) were selected by examination of the birth records of the hospitals in which each patient was born. Females born within five days and on the same type of service (ward or private) as the eight cases were identified. The mothers of all these women were interviewed.,阴道腺癌病例与对照的
7、母亲主要暴露因素的比较,Mothers of 7 of 8 cases had been given diethyl stilbestrol (estrogen) during pregnancy while none of the mothers (0 of 32) of controls had taken stilbestrol during pregnancy (P 0.00001).,Results,This was one of the earliest landmark case control studies.,Case control studies are the best
8、 design for investigating the etiology of rare diseases. Case control study allows the investigator to simultaneously explore the multiple possible associations with a disease. The sample size required for case control studies is often considerably smaller. Case control studies are remarkably cost-e
9、fficient.,Certain important advantages of the case control design are apparent in this study,病例对照研究的实施,复习文献,提出假设 明确研究目的,选择适宜的对照形式 病例和对照的来源和选择 获取研究因素信息 数据整理、分析和结果解释,根据研究目的广泛探索病因,可采用不匹配或频数匹配深入探索或验证病因假说,可应采用匹配形式 根据病例数量 少 匹配; 多 匹配 或 成组 匹配可使用较小的样本获得较高的检验效率 Pitman效率递增公式:,选择适宜的对照形式,病例和对照的来源和选择,以医院为基础的病例对照研
10、究 Hospital-based case control study 以社区为基础的病例对照研究 Community-based case control study,病例的选择,病例的要求,新发病例(incidence cases) 现患病例(prevalence cases) 死亡病例(dead cases),病例的类型,最好是新发病例,From hospitals,From populations or communities,诊断正确、易获得;代表性差,普查或抽样调查资料疾病监测资料疾病登记报告系统等,代表性强;不易获得,病例的来源,对照的选择,病例对照研究设计中最困难、争议最多的方
11、面。 设置对照组的目的:假定所研究疾病和暴露之间没有关系,提供病例组暴露比例的估计值。 对照的基本要求:被选为对照的个体,不仅要求其不患某病,而且要求其暴露某个研究因素的可能性和病例相似。,原则,2、对照一定是未患所研究的疾病,如有可能,应尽 可能排除亚临床或处于潜伏期的疾病。,3、对照可为不健康者,但所患疾病病因不应与所研 究疾病的病因相同。,4、注意研究因素以外其他因素的均衡性。,5、无应答者事先要有统一合理的更换办法,慎重处理。,1、对照最好是全人群的一个无偏样本;或者是产生病 例的源人群(source population)中全体未患该病者 的一个随机样本。,来源,社区人群中的非病例或
12、健康人群。社会团体人群中的非该病病例或健康人。同一或多个医疗机构中诊断的其他病例。病例邻居或同一社区、住宅区内健康人或非该病病人。病例的配偶、同胞、亲戚、同学或同事等。,1 材料与方法1.1 对象选取“江苏省社区人群糖尿病流行特征的研究”中新确诊的2 型糖尿病247例为病例组;在与病例同地区(同城区、同乡村) 、同民族、同性别、年龄相差5 岁以内(95 %为同年龄,少数相差25 岁) ,此次调查血糖水平正常的人群中随机抽取,按12 的要求,共计494 人为对照组。,2 结果与分析2.1 病例组与对照组计量资料的比较病例组和对照组平均年龄分别为53.7612.48、53.8112.57岁,两者差
13、异无显著性意义(t =0.05, P = 0.957) ;病例组收缩压、舒张压、BMI、WHR 和2 小时血糖值均显著高于对照组。,样本含量的估计,1、人群中暴露者的比例。如人群中吸烟的比例 比例 样本量2、假定暴露造成的相对危险度(RR)。可通过既往研 究或查阅文献获得 RR 样本量3、要求的显著性水平,即第一类错误 样本量4、要求的把握度,即1- 1- 样本量,决定因素,Frequency matching design,0.05,Z1.96 0.10, Z1.28,p0Expected frequency of exposure in control groupq0=1p0,p1Expe
14、cted frequency of exposure in case group,Ncase Ncontrol,Ncase : Ncontrol =1 : c,Ncase Ncontrol,Individual matching design (1:1 ),获取研究因素信息,研究的因素 其它可疑的因素 可能的混杂因素等,回顾性调查,怎么调查?调查哪些内容?,Ascertainment of Exposure, Personal interviews Existing records Physical measurements and lab tests,Exposure, Yes / No I
15、ntensity Length of exposure, Questionnaire,一、资料的整理 1、原始资料的重新核查 2、资料的分组、归纳,或者编码、输入计算机 二、数据的统计学分析 1、描述性统计 1)描述研究对象的一般特征 2)均衡性检验 2、关联性的统计推断,病例对照研究的数据整理与分析,关联性的统计推断步骤,(1)将资料整理成表格形式。(2)病例和对照组暴露比例差异的显著性检验。 即回答E和D是否有联系?(3)估计暴露因素和疾病之间的联系强度。(4)结果解释 可能存在哪些偏倚?得出什么结论?,资料整理表格,病例组暴露比例:,对照组暴露比例:,显著性检验:2检验,关联强度?,不匹
16、配或成组匹配的资料分析,显著性检验,A case control study on the relationship between smoking and lung cancer,关联强度的概念及计算,相对危险度(relative risk,RR):率比、危险比 比值比(odds ratio, OR):比数比,交叉乘积比,概念:暴露组某病发病率(或死亡率)与非暴露组该病 发病率(或死亡率)之比。是反映暴露因素和疾 病关联强度的一个指标。公式: 意义:RR说明暴露组发病(死亡)的危险性是非暴露组 的多少倍。,相对危险度(relative risk,RR),相对危险度判断标准,Odds rati
17、o, OR 比值比、比数比,交叉乘积比,定义,病例组的暴露比值和对照组的暴露比值之比,可用来估计暴露和疾病之间的关联强度。,Probability that an event will happenOdds= Probability that the even will not happen,Probability that an event will happenOdds= 1 - (Probability that the event will happen),公式推导,Cases ControlsExposed abNot exposedcdTotal a + c b + d,Odds
18、of exposure among cases =Probability to be exposed among casesProbability to be unexposed among cases a / (a+c)Odds Ecases =- = a / c c / (a+c)Odds of exposure among controls =Probability to be exposed among controlsProbability to be unexposed among controls b/ (b+d)Odds Econtrols = - = b / d d/ (b+
19、d),通过比较病例组和对照组的暴露比值,测量暴露和疾病之间的关联强度。由于病例对照研究无法得知危险人群的大小,也即无法获得发病率资料,故无法计算相对危险度(RR),只能通过OR估计关联强度。 对于罕见病(发病率 5%)来说,通过OR可以很好估计RR。,理解,A case control study on the relationship between smoking and lung cancer,95% confidence interval of OR: Miettinen,95% confidence interval of OR: Woolf,解读:OR值及其95%可信区间(CI),
20、OR,OR1,OR2,OR4,OR3,0,江苏省社区人群2型糖尿病危险因素的流行病学研究,糖尿病家族史,不匹配或成组匹配分层数据资料的分析,Exposure,Outcome,Confounding variable,association,association,Confounding,The tabulation of the i th stratum,The relationship between alcohol drinking and esophagus cancer,Smoking (1),Non-smoking (2),叉生分析的应用,把饮酒与吸烟情况组成四种状态,如何分析吸烟和
21、饮酒这两个因素在食管癌发生中的单独作用和相互作用大小?,问题:,分级暴露资料的分析,(1)将资料整理成列联表,(2)各分级的2 检验(3)计算各分级的OR值(4)趋势性2检验剂量反应关系,男性每日吸烟的支数与肺癌的关系,1:1配对资料的分析,Dead donkey eating and food poisoning,df=1,P0.01,选择偏倚 selection bias入院率偏倚现患病例-新发病例偏倚检出征候偏倚时间效应偏倚信息偏倚 information bias回忆偏倚调查偏倚混杂偏倚 confounding bias,病例对照研究中的偏倚及其控制,选择偏倚 selection bi
22、as,入院率偏倚 admission rate bias,Berksons bias,目标人群,病例组与对照组(其他疾病的患者)入院率不同,解决办法:不同类型的多家医院。,现患病例-新发病例偏倚 prevalence-incidence bias, Neyman bias,目标人群,入选的为现患或存活病例不包括死亡病例、病程短的病例,解决办法:新发病例,检出征候偏倚 detection signal bias,unmasking bias,解决办法:早中晚期病例,暴露者较不暴露者更易因某些症状较早较频就医检查,提高了早期病例检出率如果入选者中早期病例较多的话,则暴露比例必然被虚假的,时间效应偏
23、倚 time effect bias,解决办法:提高检测早期病例的灵敏度,目标人群,某些个体尚处于早期病变阶段、缺乏适当的检测手段,因此易被视为无病个体入选病例组的个体中较多的为已进入临床疾病阶段、能够被检测出来的个体,信息偏倚 information bias,回忆偏倚 recall bias事件发生的时间间隔事件的重要性被调查者的构成询问的技术,解决办法:选择不易为人们忘记的重要指标做调查,并重视问卷的提问方式和调查技术,调查偏倚 investigation bias调查对象调查员仪器,解决办法:尽量采用客观指征,选择合适的人选参加调查,认真做好培训和质量控制,检查条件和时间等尽量一致,使
24、用的检查仪器应精良和要校准。,混杂偏倚 confounding bias,概念:既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素(extraneous factor)的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,叫混杂偏倚(confounding bias),该外来因素叫混杂因素(confounding factor 或 confounder)。措施:限制、匹配、分层分析、多因素分析,残余混杂(residual confounding),指在分析中由尚未被考虑的因素或变量引起的混杂,这些混杂因素可以直接观察到,亦可能无法观察到,后者则称潜伏性残余混杂因子。,1、特别适用于罕见病的研
25、究2、省力、省钱、省时间,易于组织实施3、同时调查多个暴露因素与疾病的关系4、不仅用于病因探讨,而且可广泛用于其他方面,病例对照研究的优点及其局限性,优点,1、不适于研究人群暴露比例很低的因素2、选择研究对象时,难以避免选择性偏倚3、暴露和疾病的时间先后常难以判断4、获取既往信息时,难以避免信息偏倚5、不能计算发病率和相对危险度6、通常不能够确证因果关联,局限性,总 结,病例对照研究就是“病例”、“对照”研究。,1、巢式病例对照研究(nested case control study)2、病例-队列研究(case-cohort study )3、病例交叉设计(case-crossover de
26、sign)4、单纯病例研究(case only study or case series study)5、病例-时间-对照设计(case-time-control design),病例对照研究的衍生类型,巢式病例对照研究,Nested case control study,NCCS,1973年由美国流行病学家Mantel最早提出,称其为综合性病例对照研究(synthetic case control study)。又称:套叠式病例对照研究 嵌入式病例对照研究 队列内病例对照研究 Case control study nested in a cohort,概念,将队列研究与病例对照研究相结合的一
27、种双向研究设计。在进行队列研究的基础上,收集队列成员的暴露信息以及有关混杂因素的资料,确认随访期内发生的病例数,然后以队列中发现的病例作为病例组,对照组来自同一个队列,进行病例对照研究。将病例对照研究与队列研究的设计思路重新组合杂交后形成的一种新的设计思路。,确定某一个人群作为研究的队列,收集队列中每个成员的有关资料信息和/或生物标本;队列随访,由发生在该队列内的某病(即所要研究的疾病)的新发病例组成病例组;为每个病例选取一定数量的研究对象作为对照组,对照应为该队列内部,在其对应的病例发病时尚未发生相同疾病的人,并且按年龄、性别等因素进行匹配(此即危险集抽样,risk-set sampling
28、 );分别抽出病例组和对照组的相关资料及生物标本进行检测;按病例对照研究的分析方法进行资料的统计分析和推论。,实施方法,确定某一人群作为研究队列,收集队列内每个成员的相关信息和生物标本,随访一段预定的时间,确定随访期内发生研究病例的全部病例组成病例组,用危险集抽样为每个病例抽取一定数量的对照组组成对照组,得出结论,抽取已收集到的两组成员相关信息和生物标本做必要的化验作统计分析,计算发病率、相对危险度,进行分层分析,条件Logistic回归分析或Cox回归分析,实施方法(续),优点,与传统的病例对照研究相比病例与对照来自于同一队列,降低了效应估计时的选择性偏倚且可比性好;暴露疾病因果时间顺序明确
29、,而且回忆偏倚小或可以避免,因果联系的推断更有力;统计效率和检验效率高于病例对照研究。与传统队列研究相比比队列研究节约了大量的人力、物力和财力;巢式病例对照研究可用于罕见病的研究。,缺点,需要既有队列,病例-队列研究,case-cohort study,概念:是以队列中所有随访的病例作为病例组,从整个队列中采用随机或分层随机抽样的办法,选取一定比例的样本作为对照组,然后用一定的统计方法比较分析两组资料,以探索影响疾病发生、疾病生存时间、预后等的因素。1986年Prentice RL提出,也称病例参比式研究(case-base reference study)。,实施方法,选择队列,确定病例组,
30、确定对照组,收集资料,统计分析,病例对照研究分析方法估计OR值用准似然危险度估计RR值用Cox模型进行多因素分析等等,估计关联强度,准似然危险度(pseudo risk):将子队列按有暴露史和无暴露史分为两个相对人群,分别计算暴露组和非暴露组的发病比率。,A1和A0分别表示子队列暴露组中的发病人数和非暴露组的发病人数,B1和B0有暴露组的人数和无暴露组的人数。,与巢式病例对照研究不同点,对照是随机选取,不与病例进行配比。 随机对照中的成员如发生被研究的疾病,既作为对照,又同时作为病例。 可以同时研究几种疾病,不同疾病有不同的病例组,但对照组都是同一组随机样本。,Im sosick.,Did I
31、 do anythingunusual rightbefore the illness,in comparison tomy usualroutine?,To answer this question, we need to do the comparison within the individual.,Illness,Controlperiod,Hazardperiod,It is a design that compares the exposure to a certain agent during the interval when the event does not occur
32、(control period), to the exposure during the interval when the event occurs (hazard period).,Case Crossover Design,It is related to prospective crossover design. “Crossover” means an experiment in which all subjects pass through both the treatment and placebo phases. Each individual serves as his or
33、 her own control.It is a matched case-control study but involves cases only and each individual serves as his/her own control.The data from a case crossover design can also resemble cohort data if the control data are units of person-time.,Hazard,Control,Event,Exposure,Case Crossover Design,HazardPe
34、riod,ControlPeriod,EventOnset,Exposure ?,Exposure ?,How to Analyze Case Crossover Data?,Since in the case crossover design we are comparing the exposure in the hazard periodto the exposure in the control period, and the individual serves as his or her own control,the analysis will be very similar to
35、 that ofa match case-control study.,Hazard,Control,Event,Exposure,Assuming the lengths of hazard period and control period are the same .,Collect the data in the hazard period and control period. Assemble the data into a 22 table as we do in the match case-control study.,Analysis of Case Crossover D
36、esign,Control Period,Hazard Period,Exposure,Non-exposure,Exposure,Non-exposure,a,b,c,d,Odds Ratio = b / c,Hazard,Control,Event,Exposure,95% CI = (b/c-1.96SD, b/c+1.96 SD),Example,Association of Cellular Phone Calls andMotor Vehicle Collisions,(Redelmeier DA, et al. NEJM 1993;329:1677-83),Event: Moto
37、r vehicle collision Exposure: Cellular phone call Hazard period: 10 min before the crash Control period: Same time period on the day before the collision,Example Cellular Phone Calls and Collisions,Comparing the cell phone use during the hazardperiod (10 min before the crash) and during thecontrol p
38、eriod (same time period but the day before the crash),9 pmMay 28,10 min,10 min,9 pmMay 27,Cell phone calls?,Example Cellular Phone Calls and Collisions,Data were collected from 699 drivers who had cellular phones and who were involved in motor vehicle crashes.,Control Period,Hazard Period,Exposure,N
39、on-exposure,Exposure,Non-exposure,13,157,24,479,Example Cellular Phone Calls and Collisions,Control Period,Hazard Period,Exposure,Non-exposure,Exposure,Non-exposure,13,157,24,479,Odds Ratio = 157 / 24 = 6.5,Conclusion:,Data were collected from 699 drivers who had cellular phones and who were involve
40、d in motor vehicle crashes.,试题分析,1. 病例对照研究2. 匹配3. 匹配过度4. Berkson偏倚5. 奈曼偏倚6. 混杂因子,一、名词解释,二、选择题,1. 某研究得出某因素与疾病的关系OR=1.1,95%的可信区间为0.71.5,这意味着 A. 总体OR值95%的可能是错误的 B. 总体OR值在0.71.5的机会为95% C. 总体OR值说明该因素与疾病无关,而95%可信区间说明有联系 D. 存在偏倚的可能性为95% E. OR值正负联系均存在2. 一项病例对照研究,500名病例中有暴露史者400例,而500名对照中有暴露史者100例,有暴露史者的发病率
41、A. 80% B. 40% C. 20% D. 100% E. 无法计算,3. 在有500名病例与500名对照的配对病例对照研究中,有400名病例和100名对照有暴露史,OR值应为 A. 18 B. 16 C. 20 D.10 E. 无法计算4. 在设计配对的病例对照研究时,确定配对条件的主要原则是 A. 对所研究疾病有影响的项目均应列为配对条件 B. 对所研究疾病有较大直接影响的项目均应列为配对条件 C. 对所研究疾病有较大直接影响但并非研究的项目应列为配对条件 D. 对所研究疾病有较大影响的项目不应列为配对条件 E. 以上均不是,5. 以医院为基础的病例对照研究,最常见的偏倚是 A.观察偏
42、倚 B.信息偏倚 C.混杂偏倚 D.选择偏倚 E.错分偏倚6. 病例对照研究中,病例的选择最好是 A.新发病例 B.现患病例 C.死亡病例 D.现患病例和死亡病例 E.新病例和死亡病例7. 就大多数病例对照研究而言,它们不具备下列哪个特点 A.耗资较少 B.可估计相对危险度 C.可计算发病率 D.可以选择没有疾病的人作对照 E.估计暴露史时可能出现偏倚,三、问答题,1. 病例对照研究的优点和局限性。2. 某医师探讨精神分裂症与遗传的关系,获得下列资料:精神分裂症患者有家族史、对照无家族史为32对;精神分裂症患者无家族史、对照有家族史为9对; 精神分裂症患者和对照皆有家族史为13对; 精神分裂症患者和对照皆无家族史为18对。 请回答: A.该研究属何种类型的研究。 B.列出该项资料的分析模式。 C. 进行显著性检验。 D. 计算比值比(OR)。 E. 对该研究结果加以解释。,3.某医院用病例对照研究探讨近期口服避孕药(OC)与心肌梗塞(MI)的联系,病例为该院25-49岁患心肌梗塞的妇女,对照为该地25-49岁女性的随机样本。两组均访问收集三个月前口服避孕药的资料。结果如下:,口服避孕药,A.对该数据进行分析,确定OC和MI是否存在统计学关联。B.确定OC和MI之间的关联强度。C.该项研究可能存在哪些偏倚?如何控制?,