1、描述流行病学,主 讲 人 周爱明2007年8月18日,第一节 概 述,描述性研究方法又称描述性流行病学研究,属观察性研究,既是流行病学调查研究中最常用的一种方法,又是流行病学研究方法体系中的基础。 开展现场流行病学研究,必须熟练掌握描述性研究、现况研究和生态学研究的基本理论和具体方法。,描述性研究方法是根据某一具体目的、目标和调查方法,收集、核对、整理、归纳资料,继而客观地描述疾病、健康状况、伤害或者公共卫生事件在人群、时间和地区的分布特征,通过比较,初步分析存在分布差异的原因,提出进一步研究的方向和制定初步防治对策。,描述性研究,【特征】属观察性研究无须事先设立对照组不能分析暴露与疾病之间的
2、因果联系,【种类】现况研究生态学研究常规历史资料分析个案调查病例报告,【应用】(1)描述疾病或健康状态在人群中的分布及其特征,或进行社区诊断,为疾病防制或制订促进健康的对策与措施提供依据;(2)描述、分析某些因素与疾病或健康状态之间的联系,从而为进一步研究疾病病因、危险因素提供线索;(3)为评价疾病控制或促进健康的对策与措施的效果提供信息。,现场调查资料的描述,通过爆发调查、监测系统、生命统计等途径收集资料、整理资料数据、进行统计分析并对资料进行有效的相关的描述和解释,也是我们流行病学工作者的首要任务。描述流行病学回答了以下问题:有多少人,什么时候、在什么地方被感染、主要危及人群是哪些人?对有
3、多少人,通常采用频数和率,3W(when、where、who)用时间、空间和人群间的分布来描述。,描述分布是进行流行病学测量(epidemiological measurement),因此,要运用适当的统计指标揭示疾病、健康状况、伤害或公共卫生事件“三间分布”数量上的变化。常用的测量指标有死亡率、发病率、罹患率、患病率、感染率、二代发病率、病死率以及其他专用指标。,疾病频率的测量,1.发病率 表示指在一定时期内(观察期间),可能发生某种疾病的特定人群中新发生该病的频率。计算公式为: 某年(期)某人群中发生某病病例数某病发病率- 同期平均人口数,反映疾病发生、发展及流行强度的指标,分子、分母来自
4、同一人群,应用描述疾病的分布,反映疾病发生的频率通过比较不同人群的发病率来探讨发病因素,提出病因假说评价防治措施的效果 局限 发病率资料较难得到。其准确性受疾病的报告登记制度以及诊断的正确性的影响。,反映疾病发生、发展及流行强度的指标,2.罹患率 与发病率一样,也是测量新发病例的指标,但它常用于较小范围或短期间的疾病流行。 观察期间的新病例 罹患率 - 同期暴露人口数,应用 性质同发病率,但观察时间短而灵活。 适用局部地区疾病的暴发或食物中毒、职业中毒、传染病暴发等情况的原因探讨。注意事项 应用时应注意分子、分母的准确性,注明观察的时间长短。,反映疾病发生、发展及流行强度的指标,3.累积发病率
5、(Cumulative incidence,CI): 指一个已知的无某种疾病的人群(Disease free group)经过一段特定的观察期后新发生该病的比例。计算公式为:,反映疾病发生、发展及流行强度的指标,累积发病率的特点:无病人群暴露于危险因素一定时期后发病的平均概率,取值范围为0-1;与观察期限相联系;与通常发病率的概念不同,分母不同。,反映疾病发生、发展及流行强度的指标,4.患病率 患病率是指某特定时间内总人口中某病新 旧病例所占的比例。 某时间内某病病例数 患病率- 该人群同期平均人口数,应用表示病程较长的慢性病的发生或流行情况。可为医疗设施规划,卫生设施及人力的需要量,医疗质量
6、的评估和医疗费用的投入提供科学的依据。不同地区患病率比较时,应注意标化。,发病率和患病率的主要区别,反映疾病发生、发展及流行强度的指标,5.感染率:在某个时间内能检查的整个人群样本中,某病现有感染者人数所占的比例。 可以通过病原学或血清学方法检测感染者。用于评价某些传染病特别是具有较多隐性感染的疾病的流行情况和防治工作的效果,预测某病的流行趋势。,6.死亡率(Mortality rate):表示在规定的观察期间内,人群中因某种疾病而死亡的频率。计算公式为: 某人群某年总死亡人数 死亡率 - 该人群同年平均人口数,应用用于衡量某一时期,一个地区人群死亡危险性大小的一个指标。可反映一个地区不同时期
7、人群的健康状况和卫生保健工作的水平,可为该地区卫生保健工作的需求和规划提供科学的依据。对于某些病死率高的疾病,死亡率与发病率很接近,常用作病因探索的指标死亡专率可直接比较,用于病因探索。,7.病死率 表示在一定时间内,患某病的病人中因该病而死亡者的比值。 一定时间内因某病死亡人数 病死率 - 同期确认的某病病例数,应用 多用于急性病,表明疾病的严重程度,反映诊疗水平。 注意事项 用病死率作为评价不同医院的医疗水平时,要注意可比性。 分母中患者情况不同,指标的意义不同,不能用医院的病死率代表所在地区的病死率。,死亡率与病死率的关系,反映疾病发生、发展及流行强度的指标,8.生存率 指在接受某种治疗
8、的病人或患某病的人中,经若干年随访(通常为1,3,5年)后,尚存活的病人数所占的比例。 随访满n年尚存活的病例数 生存率 - 随访满n年的病例数,反映疾病发生、发展及流行强度的指标,9.家庭二代发病率:(Secondary attack rate, SAR), 也称续发率。指某传染病在一定观察期内在家庭易感接触者中二代病例的百分比。观察期内原发病例接触后的新发病例数除以易感接触者总数,续发率的计算公式为:,图1 某SARS病例家属传播链,指征病例3.30死亡,散发( sporadic) 爆发(outbreak) 流行(epidemic)与大流行,疾病流行强度术语,散发的原因 该病在当地常年流行
9、或因预防接种的结果使人群维持一定的免疫水平,而出现散发。 以隐性感染为主的疾病,如脊髓灰质炎、乙型脑炎等。 传播机制不容易实现的传染病。 长潜伏期传染病,如麻风。,某单位食物中毒的爆发,发病人数,20,15,10,5,22 24 2 4 6 8 10 12 14,发病时间,9日,10日,爆发(Outbreak) 在一局部地区或集体单位中短时间内突然发生许多相同病例的现象。,流行(Epidemic) 某地区某病发病率显著超过历年的散发水平。 大流行(Pandemic) 某病的发病蔓延迅速、涉及地域广、人口比例大,在短期内可以越过省界、国界,甚至洲界,形成世界性流行。,例如:流感大流行,描述性研究
10、主要描述分布的三大特征 即:三间分布,时间分布,由于现场调查都是在一定时间范围内进行,因此我们必须知道如何整理时间资料,描述时间分布特征. 根据疾病、健康状况、伤害或公共卫生事件的性质,设置以年、季、月、周、日或时等时间单位,描述其病例或事件发生频率及变化趋势。 描述时间分布可分为短期波动(暴发)、季节分布、周期分布和长期趋势等层次,时间分布,过去情况(基线)、现况和将来的趋势标明暴露或控制时间。十年、年(长期趋势),预测未来,评价措施季节性,季节、月、周。一年资料不能说明季节性特征。日、时,根据目的选择时段不明原因,多种时段探索,从1991年12月7日开始的天数沙特医院儿童病房7名疟疾病人和
11、14名其他病人(出院后得疟疾),患其他疾病入院:出院后感染疟疾,疟疾患者,治疗前感染,时间曲线图病例人数较少时绘制发病时间线帮助显示病例关系,房间 6,房间 5,房间 4,房间 3,治疗期间感染,流行曲线,流行曲线可用于描述暴发可能的传播途径、流行的大致时间,比简单的病例线图要清楚得多。通常从一个简单的疾病发病时间图表中可得到大量的信息。如果疾病的潜伏期是已知的,就能相对准确地区别点源暴露、人传播人或是两者混合传播。另外,如果流行在继续,你还可以预测可能发生多少病例。当病例数较多时,采用直方图表示在适当的间隔时间(X轴)内所发生的病例数(Y轴)按发病时间的病例频率分布图作用利用潜伏期后推可能的
12、暴露时间区分暴露的类型预测病例数量,绘制流行曲线的要点,时间间隔的选择相等1/41/2潜伏期X轴的起点和终点首例发病前2个潜伏期末例发病后2个潜伏期如爆发未结束末例后不留空白时间段标记重要特征,流行曲线的类型,点源,点源传播:病例集中在某个时间段,流行曲线陡直上升,下降较缓暴露时间估计 1.峰值出现时间减去平均潜伏期; 2.首例发病时间减去最短潜伏期 ;3.末例发病时间减去最长潜伏期;,1、一个原发病例之后,流行曲线包括了几代病例;2、开始阶段病例数较少,然后病例缓慢增加;3、在爆发初始阶段每代病例之间间隔时间相等,具有明显的周期性;4、爆发高峰过后,由于易感人群的减少导致曲线快速下降,人传人
13、,持续同源持续暴露于同一传染源而爆发,流行曲线急速上升,达到峰值后,出现一个平台期;如果消除传染源,曲线下降陡直,传染源自然耗损,曲线缓慢下降.,持续同源,判断下列曲线为哪种传播模式,某中学A组链球菌感染病例的流行曲线,Onset by 4-hour intervals June 5-10, 2006,病例数,病例集中在某个时间段,流行曲线陡直上升,下降较缓,1999年纽约西尼罗病毒病例每周血清阳性数,7月 8月 9月 10月,灭蚊,2004年慈溪市逍林镇登革热病例发病日期分布,空间(地区)分布,在暴发或流行现场调查中,地区分布资料包括:居住地、工作地点、学校、娱乐场所、旅行地点等。有时疾病发
14、生在社区中一个独特的地方,如果能观察到这点,对病原体和暴露特性则可获得大量的线索和证据。地图供水系统、牛奶供应、垃圾处理排出口、风向、建筑物间的气流以及传播媒介的生态习惯在传播微生物或病原体和确定疾病的危险人群中扮演着重要角色。通过地区分布,了解疾病范围,病原存在何地,如何传播等,控制规范的重点地区,流行性出血热发病的地区分布,2007年1-7月宁波市出血热地区分布,伦敦霍乱死亡者居住地点分布,慈溪市观海卫镇副伤寒暴发疫情地区分布,某病病例分布图,住址分布,工作地点分布,波音747-100航班结核菌皮试阳性乘客和机组人员座位示意图,指示病例,人群分布,按人群特征进行流行病学分析的目的,在于全面
15、描述病例特征,并发现病例与普通人群的不同,这将有助于提出与危险因素有关的宿主特征,其他潜在危险因素以及传染源、传播方式和传播速度的假设。分析患者的特征,如年龄、性别、种族、职业或其他任何有用的描述病例特有的特征。如果发现一个特别的特征,通常会对查找危险人群提供一个线索,甚至找出一个特异的暴露因素。对疾病宿主、传播途径、高危人群认识越多,你将获得更特异和准确的信息,以决定如何防治疾病。,人群分布,先天特点年龄、性别、种族、血型获得特点免疫、婚姻、怀孕行为特点职业、吸烟、吸毒、生活习惯社会特点经济地位、医疗服务可及性等,人群分布,获得分母,计算率比较分析,不同人群组的比较寻找病例的共同因素鉴别病例
16、与一般人群的相似暴露因子,分析患者的特征年龄、性别、种族、职业或其他任何有用的描述病例特有的特征如果发现一个特别的特征,通常会对查找危险人群提供一个线索,甚至找出一个特异的暴露因素有些疾病首先侵犯一定年龄组人群有时患某疾病的人与职业明显相关,19791990年美国不同年龄性别种族体温过低死亡率,年龄组(岁),死亡率,白人女性,白人男性,其他种族女性,其它种族男性,狂犬病人群分布特征,发病人群中不同性别、年龄、职业的差异系因接触犬机会的多少所致,19801982年美国不同年龄组麻疹发病率,年龄组(岁),发病率(1/10万),用全部报告病例的年龄分布推断的不同年龄组估计发病率,表4 1996-20
17、05年宁波市霍乱发病年龄分布,中国出血热年龄分布,2004年8-10月象山县急性病毒性肝炎病例职业分布图,美国1991-1999年成人超重发生率 -行为危险因素监测系统,1991,1992,1993,1994,1995,1996,1997,1998,时间、空间和人群综合分析,1999,1992年46月沙特阿拉伯Tabuk伤寒发病分层曲线,描述性研究方法按在实际工作中的应用可分为,常规性调查工作: 如公共卫生监测、疾病报告登记、例行的病家访视等。 专题调查: 如暴发调查、应急事件的调查、现况调查、筛检、生态学研究等。所谓“常规”和“专题”并没有绝对的界限,例如,现况调查、生态学研究,有时可以利用
18、疾病报告登记资料、环境检测资料来完成。又如,在预防保健工作做得好的地区,可以把对某种疾病的筛检纳入常规的疾病防治工作。,在现场流行病学调查中,描述性研究常常是首当其冲采用的方法。例如,在发生突发事件时(如发生急性传染病暴发流行、食物中毒、不明原因疾病暴发流行等),因情况紧急,为了尽快控制流行,保障健康,减少损失,往往先根据对病例或事件分布描述的特征,得出初步结论,及时提出应急控制措施,边实施边调查,而不必等待应用分析性研究方法或实验室病原学诊断的结果再采取措施。例如,1988年上海发生甲型病毒性肝炎暴发流行,调查人员根据早期病例的分布与饮食史的关系,参照1983年该市甲肝暴发流行资料和对毛蚶大
19、量上市情况的了解,初步判断生食毛蚶是导致此次甲型肝炎暴发流行的原因,及时采取措施终止毛蚶销售,并同时进行深入的流行病学调查。最后证实“及时终止毛蚶销售”是完全正确的预防措施。 描述性研究方法不仅用于解决突发事件,在疾病和健康问题的研究与防治方面也有着广泛的应用。,现况调查,一、 基本概念 现况调查(prevalencestudy)是指在特定时间(时点或一个短时间)以个人为单位收集资料调查某人群、某种疾病患病率情况或某种健康状况流行情况。例如,若要掌握某个地区30岁以上人群高血压患病情况,就在确定的时间内(如1995年45月)对该地区30岁人群(一般采取抽样)按统一的方法测量他们的血压,并对有关
20、因素做好登记,然后统计分析该地区30岁的人群高血压患病率及相关因素。,现况调查方法的特点是,(1)短时间内揭示的人群疾病或健康特征,好像在一个时点上给被调查人群“拍照”,留下一个断面情况,故现况调查又称为横断面调查(cross sectional study)。因统计指标多用患病率,故又称患病率调查。 (2)收集的信息是调查当时所见,不是过去,亦非将来。 (3)暴露(或变量)与疾病或健康状况同时存在,不需做时间顺序分析。例如调查中某人患高血压,同时见到他的身体肥胖。高血压(疾病)和肥胖(暴露或变量)同时见于同一个个体,两者孰先孰后,一般难以区分。 (4)现况调查反映的是直到调查时该人群某疾病的
21、病例累积量,它不同于发病率研究(即队列研究及实验研究)。,1980 1981 1982 1983 1984 1985 1986,某病患病率=4/100100%=4%,图3-1 现况调查示意图,图3l表示1982年9月调查时计算某疾病的现患率,红线切割到的病例,即以第2、4、5、6号病人作病例数(分子)来计算患病率。如果调查的人群是100人,则1982年9月份该人群某病患病率为:,二、用途 (一)补充常规报告登记之不足,一个地区预防保健工作的内容是很多的,有许多常规报告登记制度还有待逐步建立,已有的报告登记系统可能还不够健全,因此,可以利用的信息是有限的。在这种情况下,开展必要的现况调查,可以补
22、充常规资料的不足。 有许多时候,现况调查是完全出于某种特殊的目的而进行的,例如开展一项幼儿先天畸形流行的调查,现况调查所得结果较快,不像报告登记那样需要较长的周期。,(二)现况调查用于下述条件的疾病最有益,(1)能定量测量的指标;(2)在时间上有变化的特征、变量或指标;(3)病程比较长;(4)发病频率较高。,(三)描述疾病和健康的分布,描述流行病学研究的资料主要来源于3个方面,即常规报告登记、现况调查和流行病学监测,流行病学监测实际上是一种重复性横断面研究。这3种现场调查方法所获资料可互相补充,(四)为人群预防保健服务及评估提供依据,通过现况调查,掌握某疾病发病数量、分布特征和高危人群,可采取
23、预防和干预措施;这些措施执行后的效果如何,可再做现况调查比较,做出评估 .,(五)探寻疾病病因线索,现况调查虽然不属于分析性流行病学研究方法,一般对病因研究的功效不大,但是它所调查得来的资料,往往可以提供病因研究的线索,可进一步用分析性研究加以验证。 例如,2004年9月份象山和宁海县甲肝病因的探索和查明,就是从描述该病的病例分布特征入手的。首先8月中旬在象山县西周流行甲肝,随后在象山丹城人群中流行。其分布特征为: 人群分布:年龄,儿童,中小学学生为主。 季节性分布:810月份。 地区分布:均发生在象山和宁海县居住区象山县西周某棒冰厂的白糖棒冰销售范围。根据分布特征,结合病例流行病学食白糖棒冰
24、调查,终于查明系由于食用象山县西周某棒冰厂的污染的棒冰所致。针对病因采取措施,防止了本病的再发生.,三、方法,现况研究是用来调查人群中疾病与健康状态和发病当时的情况,并研究健康或疾病分布状态与这些相关情况的关联的流行病学方法。,(一)普查,1基本概念 针对一定目的,在一定时间内对特定范围的人群内所有对象进行调查,称为普查。 2普查原则和方法 进行普查必须遵循流行病学研究的一般原则,同时应特别注意做到: 统一规定调查时间,各调查小组应在规定普查的时间内完成调查工作。 统一规定调查对象,并严格执行。 统一规定调查变量、统计指标,测试方法和技术应标准化。,3普查的优缺点,普查可以对调查的疾病早发现、
25、早诊断、早治疗。可以了解疾病和健康的分布特征,建立一个人群的疾病和健康的系统数据库,为进一步分析打下基础。通过普查可普及卫生保健知识。在普查的基础上,往往可以规划分析流行病学研究的蓝图。普查资料的价值取决于调查工作的质量。例如,漏查率是不是很低,系统误差是不是控制在最小范围等等。另外,普查工作量大、代价高,普查资料一般不能计算发病率。,(二)抽样调查,1、基本概念 在实际调查工作中,往往不需查出人群中某病的全部患者或可疑患者,只需了解某种疾病流行水平和有关因素,又因普查工作量大,力不能及,就从该人群中有计划地抽出必要数量的人进行调查,这就称为抽样调查(Sampling study)。样本要能够
26、代表总体。因此,必须做到随机化抽样和足够的样本大小。,2抽样调查的优缺点,此法省时、省人力、省物力,调查范围小,调查工作容易做到细致。但设计、实施与资料分析比较复杂,重复和遗漏不易发现,不适用于变异太大的变量调查;发病率很低的疾病,小样本抽样调查收效不大,当需扩大样本到近乎总体75时,倒不如直接普查。,3抽样调查方法,(1)简单随机抽样(simplerandomsampling):一般先有总体中各单位的编号,再用随机技术确定被调查单位简单随机抽样,在总体和样本含量较大时,实际操作比较困难,故在流行病学调查时很少单独使用。但简单随机抽样是理解随机抽样的基础,在多级抽样中也常用到,且后面估计样本大
27、小的方法也多是基于这种抽样方法的。,(2)系统抽样(systematic sampling),即按一定比例或一定间隔抽取调查单位(如1个人或1户)的方法。例如某乡有5000户,2万人口,今若抽样15家庭做家庭健康调查,则可每5户抽1户,抽到的户即作为调查单位。决定起点应是随机的。,(3)分层抽样(stratified sampling),把总体按若干标志(如年龄、性别、居住条件、文化水平等)分成若干层,然后在每层内抽取调查单位。由于各层中观察值变异度小些,其抽样误差较其他抽样为小,代表性能亦较好。若按一定比例自各层抽样,就叫按比例分层抽样,亦可称为最适分层抽样方法。,(4)整群抽样(clust
28、ersampling),就是从总体中随机抽取整群对象作为调查单位,对被抽到的整群单位中的每个个体进行调查。例如调查20所中学约20 000名学生的近视患病率,现拟抽查15的学生。这时可随机抽取4所学校做全体调查(假定每所有1000名左右)即可满足样本大小,且实行起来方便。整群抽样要求各“群”内变异和总体内变异相似。,(5)多级抽样(multistagesampling),将上述多种抽样方法综合应用。常用于大规模社会卫生调查。 (6)按容量比例概率抽样(PPS): 这是WHO推荐,现已被发展中国家广泛采用的调查免疫接种率的常规方法。,4抽样误差 又称随机误差,(randomerror)。由于总体
29、中调查单位个体变异,所以抽样误差不能完全避免。用不同的抽样方法从总体中抽取同样含量的样本,抽样误差各不相同。一般抽样误差大小依次为整群抽样、简单随机抽样、系统抽样、分层抽样。 抽样误差不可避免,但可通过增大样本或调查单位定得适当而得到控制。,四、样本大小的估计,样本过大或过小都是不恰当的。调查对象过多不但造成很大的花费,有时反而不易达到精密、迅速;而样本太小,抽样误差大,代表性差,影响对调查结果的正确判断。 确定样本大小有时可凭经验估计,例如,一般认为确定正常值范围样本最好在100例以上,肿瘤死亡率调查样本要在10万人口以上。一般计量资料样本含量可少些,计数资料多些。但相对精确的方法是根据下述
30、原则利用公式估算的:,患病率(或阳性率)的高低;资料的精确度,一般情况下容许误差定为10;显著性水平,可定为0.05或0.01;调查单位之间变异大小。计算样本大小的公式都是根据以上原则结合资料的性质得出的。 有以下几种样本大小估计的方法: (一)均数调查 样本大小可用下式估计: 式中,当a=0.05时,t=1.96;a=0.01时,t=2.583。S为总体标准差的估计值,应预先获得。d为允许的误差。,例如:某地拟抽样调查36岁的儿童是否存在营养性贫血状况。根据文献报道,正常儿童血红蛋白的标准差为7.9g/L,若希望误差不超过3g/L,如取=0.05,问需要调查多少儿童? 解: 即需要调查28人
31、,(二)率的调查 二项分布资料:某事件(如寄生虫病、慢性传染病、地方病的患病率、感染率等)呈离散型分布,属于二项分布性质的资料。这类性质的资料,一般用下述公式计算样本大小(根据允许误差为10%,显著性水平为0.05时) 式中n为样本大小,p为某病的患病率(或其他率),一般为经验资料,Q=1-P。此公式适用于患病率 例:某城区疾病控制中心拟调查该区居民HBsAg携带率。该城市居民HBsAg携带率估计为10%, 如果要求容许误差为10,需调查多少人? 本例符合应用公式33条件。 解: 即需要调查3600人。,Poisson分布资料:当某事件发生概率很低,呈高度离散型分布,例如,某种突变所致的遗传性
32、疾病、恶性肿瘤等疾病的分布,属Poisson分布资料,不适宜用上述公式计算样本大小,可直接查Poisson分布表。,五、常见的偏倚及其预防,1、选择偏倚:是指在选择调查对象过程中产生的系统误差(systematicerror),通常有以下几种:(1)选择性偏倚:在现况调查中由于时间短,可能用其他人代替没有找到的调查对象,破坏了调查对象的同质性。(2)无应答偏倚:调查对象不合作或不能或不愿参加,又未事后补查。应答率低于90%则难以调查结果来估计整个人群的研究现状。(3)幸存者偏倚:现况调查要调查的是患病率而非发病率。往往因无法调查死亡者,现存者发病影响因素往往与死亡者不同,反映的情况不一定真实。
33、,(1)调查对象所引起的偏倚:报告偏倚回忆偏倚 :由于种种原因被调查者由于隐瞒、记忆不准确等而引起的偏倚。(2)调查员偏倚:调查员对不同人群采取的调查态度上的差异而引起的。(3)测量偏倚:测量方法不规范、仪器不准确,或工作态度不认真而造成的偏倚。,2、信息偏倚:(informationbias) 指在收集资料的过程中产生的系 统误差。常见的有:,(二)偏倚的预防,1.选择偏倚的预防 严格遵循随机化原则选择调查对象,不随意更改设计方案。调查前做好宣传”发动工作,提高参与率、受检率和应答率,做好补调工作。 2信息偏倚的预防 设计好问卷,问题明确。严格培训调查员,端正调查态度,讲究调查艺术,争取调查
34、对象合作。测试仪器、试剂应标准化,严格操作规程,正确记录数据。,六、资料分析,(一)资料整理 现况研究的资料,首先应仔细检查、核实,进行补遗、纠错,力求资料正确、完整。如为编码调查表,应在校正准确的基础上,在电子计算机上建立数据文件库,再对资料进行系统的逻辑核对,在分析前清除一切逻辑差错。 (二)资料分析 分析的内容和步骤另外有专题讨论 。,第4节 筛 检,一、基本概念,筛检(screening)是指应用快速的试验、检查或其他方法,从外表健康的人群中查出某病的可疑患者的一种预防性措施。筛检一般不是诊断。筛检阳性者需要进一步确诊,确诊后进行治疗。 进行大规模现况调查时,一般先进行筛检,查出可疑病
35、例或感染者,再对他们进一步检查和确诊。筛检除了可以提供现况研究描述性资料,还由于是对外表健康的人群实行检查,所以可以早期发现某些疾病及其危险因素,早期治疗,促进痊愈,或延缓病情,减轻伤残。亦可发现疾病的易感者,以便采取预防措施。,按筛检对象不同,筛检可分为对整个人群的筛检(又称普检,mass screening),以及对高危人群的选择筛检(selecdve screening)。按筛检方法和目的可分为单项筛检和多项筛检,后者指一次筛检采用多项检测,筛检数种疾病。 筛检是一种群体预防医疗行动,是否实施筛检,需要考虑其必要性、可能性、可行性、有效性,应权衡得失,估计利弊,慎重决策。,二、筛检试验的
36、评价,所用筛检试验应符合简便、快速、安全可靠、经济、容易接受等原则。但目前完全符合这些条件的筛检尚少,有些只是相对比较适用。一项筛检是否适用于现场人群,必须经过筛检试验,评价其真实性、可靠性和收益等指标是否符合要求。,(一)真实性,真实性(validility)又称为准确性(accuracy),是指测量值与实际值的符合程度。采用敏感度(senstivvity)和特异度(specificitive)来衡量。先用该试验分别对一组已知有某病者和另一组无病者进行检查,所得结果如表31所列。计算该试验的敏感度和特异度。,3-1 筛检试验真实性评价模式,敏感度是指一项筛检试验能鉴定出真正病人的能力,用试验
37、 结果阳性人数占已有某病病人的百分率表示:敏感度(真阳性率)=A/(AC) 100%则假阴性率=1-敏感度= C/(AC) 100%特异度是指一项筛检试验能鉴定出真正无病者的能力,用试验结果阴性人数占已知无某病者的百分率表示:特异度(真阴性率)= D/(B+D) 100%则假阳性率=1-特异度= B/(B+D) 100%,3-2糖尿病患者和非糖尿病患者筛检试验,敏感度=65/70100%=92.9% 假阳性率=263/510100%=51.6%特异度=247/510100%=48.45 假阴性率=5/70100%=7.15,例如,以血糖水平110mgd1(或6.105mmo1L)为试验阳性标准
38、,检测70例糖尿病患者和510名非糖尿病患者口服葡萄糖2小时后的血糖统计结果列于表3-2,筛检试验的敏感度与假阴性率之和,特异度与假阳性率之和都是100,我们称他们之间是互补的。理想的敏感度和特异度均应为100,这实际上是不可能的。因为任何变量值在正常人与病人之间都有一定程度的重叠。例如,正常人与糖尿病人的血糖水平没有绝对的界限,而呈部分重叠。在筛检试验中,这种重叠部分的宽度,或者说假阳性率(互补特异度)和假阴性率(互补敏感度)高低,取决于筛检试验所定标准的高低。如果血糖筛检水平定低些,敏感度就上升,特异度下降;定高些则相反。,在确定一项筛检试验时,是取高敏感度还是高特异度,应根据所筛检的疾病
39、性质来权衡利弊。 下列情况应提高筛检的敏感度: 疾病严重但治疗后能明显改善预后,如宫颈癌。 疾病漏诊会造成严重后果。 鉴别诊断时需排除某种疾病。,而下列情况应提高筛检的特异度,误诊后会导致病人及其亲属心理创伤,或需做进一步复杂而昂贵的诊治,如某些癌症。缺乏有效疗法或治疗效果不理想的疾病,如艾滋病。鉴别诊断时最后需要确诊某种疾病。,当假阳性和假阴性的代价相差不大时,可将筛检标准定在敏感度等于特异度的分界处。,在评价筛检试验的真实性时,可将敏感度与特异度综合为一个指标,常用指标有以下3种(用表3-1中的符号代入): 粗一致性是评价该筛检试验正确划分有病和无病的能力,理想状态为100。 约登指数又称
40、正确指数,是把敏感度和特异度结合起来综合评价诊断试验准确性的指标,其值范围为01,越大越好。,A(真阳性)C(假阴性),B(假阳性)D(真阴性),采用两种或两种以上的检测方法筛检一种疾病称为联合试验。联合试验可以提高敏感度或特异度。联合试验分为串联和并联,1串联试验(serialtest) 先后用数种试验方法,只有全部试验均呈阳性时才定为筛检阳性,就是串联。串联可以提高特异度。例如先查尿糖,阳性者再查餐后2小时血糖,如血糖亦为阳性才视为筛检阳性,否则仍作为筛检阴性。如先查尿糖即为阴性,则血糖不必检测。2.并联试验(paralleltest) 同时采用数种试验,只要有一种试验结果呈阳性即视为阳性
41、。并联可以提高敏感度。例如同时检测尿糖和血糖,任何一种结果为阳性,都是进一步确诊的指征。表33是联合试验筛检糖尿病的假设数据。从表中计算结果可以看到联合试验对敏感度和特异度的影响。,表3-3 联合试验筛检糖尿病患者的结果,尿糖试验,血糖试验:,表3-3 联合试验筛检糖尿病患者的结果,串联试验,并联试验:,(二)可靠性,可靠性(reliahlity)又称可信度,是指在相同条件下一种检测方法对同一个体重复检测结果的稳定程度。影响可靠性的因素是多方面的,但主要有以下3个方面。 1. 受试个体变异 指同一指标在同一受试者身上重复测量时,结果表现不一致。如血压受生理、精神状态的影响,多次测量同一个人的血
42、压,结果会有差异。许多生理、生化和免疫学的测量指标都有个体本身的变异。控制的方法是规定在相同环境或条件下测量,受试者应处于情绪稳定状态。 2检测方法的变异 如测试仪器、设备、试剂等的改变引起的差异。控制的方法是使试验方法标准化,使用质优、稳定的仪器和试剂,对仪器进行校正等。 3. 观察者的变异 包括观察者间和观察者内的变异。前者是指不同观察者测试同一批个体结果的差异,后者指同一观察者对同一批个体进行重复测试结果的差异。控制的方法是技术上精益求精,判断时认真仔细。如果是实验室检验,应对一份标本做几次试验,或由不同试验者或不同实验室来测定。有的观测需要采用盲法。,(三)收益,筛检实施后收益或效果可
43、以从以下几方面来评价。 1. 预测值(predictive vevalue) 用筛检结果来估计受试者可能患某病的概率或可能没有患某病的概率,分别计算阳性预测值和阴性预测值(仍以表3-1的符号代入) 根据表32中数据计算,阳性预测值=(65328) 100=19.8, 阴性预测值=(247252) 100=98.0。,预测值的高低受敏感度、特异度和患病率三者影响,但三者影响大小不同。在患病率不变的条件下,特异度的改变对阳性预测值的影响比敏感度的改变大。当敏感度和特异度均不变时,阳性预测值随患病率增高而上升,因此,当某病患病率高时应用筛检试验收益就大。 如果患病率、敏感度和特异度都发生改变,则阳性
44、预测值可用公式估计: 阳性预测值= 敏感度 特异度 敏感度患病率+(1-特异度)(患病率),2发现病人的数量,用筛检发现并最终确定的患者愈多,并得到有效防治,对人群健康的维护和促进作用就愈大。发现病人的数量取决于目标人群某病患病率和所用筛检方法的敏感度;敏感度愈高、患病率愈高,发现病人的数量就愈多。一般在医疗保健条件差的地区,对常见病、多发病的初次筛检效果最显著。,3预后改善情况,对经过筛检查出的病人预后改善率及人群死亡率下降程度进行评价。例如,评价人群高血压筛检效益,是否能使脑卒中、心力衰竭和肾衰竭的发生率下降。,4成本效益分析和成本效果分析 一项值得采用的筛检试验必须考虑其经济效益。筛检的成本除包括其本身费用外,还要包括进一步诊断、治疗、随访以及有关的并发症处理等方面的费用。效益包括经济效益和社会效益。经济效益常用筛检出的病例数及由于早期发现而延长的生命和工作年限折算成货币单位来估计,再除以成本,计算出效益/成本比值,如果此比值大于1,则是合算的。,