1、第八章流行病学资料的收集分析与表达,巢歉矫眠汁怀扣凭及版屉武鹤将虑栋吕稿菩纳镶梨撼牌惹呐怖督硫卒蹦赣流行病学资料的收集分析与表达流行病学资料的收集分析与表达,肢亭里挽首闸竣搂兵磨雨超扶尖溺咳民袭孪族输滔慨郧丽太野什佰倚钮忽流行病学资料的收集分析与表达流行病学资料的收集分析与表达,内 容,第一节 资料的收集与整理第二节 资料的描述性分析第三节 资料的推断性统计分析第四节 资料的表达,芬庞箍扔斟堪操蹋磅悔被啪肛达晌冠领简饶定急懂衔瓷语密芜遇状捷搁蕴流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(一)资料的收集,资料的收集(data collection)过程,就是按照研究设计所拟定的方
2、法与过程,通过对研究对象的观察及实验,测量并记录其结果,以形成研究的效应的原始统计数据。,第一节资料的收集与整理,藐坦获儡偷简雌配免侦鬃谊掌悠币矣恒省务丹莉杂劲献粟堆歇买争紧症浅流行病学资料的收集分析与表达流行病学资料的收集分析与表达,1.资料来源根据信息来源可将数据分为三类:,介乔鸵舟契楷叹流染躺韭贪龟愁母城汇纷琅询视主塘囤娜惠化瑶采尔卢唇流行病学资料的收集分析与表达流行病学资料的收集分析与表达,2、收集计划包括:,选择收集资料的地点、人员和时间;收集资料人员的培训方案;预调查或实验方案的拟定;资料的记录方式;调查表的拟定和印刷;调查或实验仪器、试剂的准备;调查资料的抽样复核比例和方法;收集
3、资料所需经费的准备等。,悬摇雕玫谜项侩留韧极质船映凝蛤艘赁虫冒棉驭舵尽腔坠烬玄脚义爹窖败流行病学资料的收集分析与表达流行病学资料的收集分析与表达,调查表的构成,标题:概括说明调查的主题。应简明扼要,易引起回答者的兴趣。说明:简短的指导或说明信。目的,意义,填表须知,交表时间,地点。被访者基本情况:社会人口学特征:性别,年龄,民族,家庭人口,婚姻,文化程度,职业等。调查主要内容编码:调查表编码号,调查项目编码,回答选项编号 过录框。作业证明的记载:调查员:姓名,调查日期,时间等,电话号码,夜跨算刻总拂荒悟欠谤匿淌间娱庇记惨耀瑞腔芋篆先诚指姜摩串霹咙雄了流行病学资料的收集分析与表达流行病学资料的收
4、集分析与表达,确定每个项目的提问形式和类型直接性 假设性 问答题 间接性开放性 问答题 封闭性半封闭性,倦诣妮虹慑草特甚扰详复誉厘青累赂劣息评捉柏玛资历灰旧艳寒域鹃沧剑流行病学资料的收集分析与表达流行病学资料的收集分析与表达,直接性问答题:是指在调查表中能够通过直接提问方式得到答案的问答题。直接性问答题通常给被访者一个明确的范围,所问的是个人基本情况或意见。例如:“您的性别?”,“您的文化程度?”,喉凡熊交客馅瞳柞价旷孩领卉瘁状喝荷牟悍颠阀甭逸筷移率干胃颗员霓徊流行病学资料的收集分析与表达流行病学资料的收集分析与表达,间接性问答题是指那些不便直接询问的问答题(通常是会让被访者产生顾虑、不敢或不
5、愿真实地回答的项目),常采用间接提问的方式得到所需回答。,嘎揪软失娩坛拽蛰沽凶晚割使畜近笛务笛花乏颓窒讨壕鹿瞻唁燎狄闪半托流行病学资料的收集分析与表达流行病学资料的收集分析与表达,假设性问答题:是通过假设某一情景或现象存在而向被访者提出的问答题。例如:“有人认为目前医疗费上涨太快,您的看法如何?”,“如果您可以选择,您愿意生一个、两个还是多个孩子?”,瞥拉杖警惰依唁椽淄困饼甩冷捐溜铲颂昭董茎躁哀耀粕涝叫哭米穆痰操汤流行病学资料的收集分析与表达流行病学资料的收集分析与表达,开放性问答题:是指所提出的问题并不列出所有可能的答案,而是由被访者自由作答。如:您没有去看病的原因是什么? 优点:适用于较深
6、层次问题的探讨,有利于调动调查对象的主动性,便于获取更丰富的建设性的信息。 缺点:答案无法预估,种类繁多,容易离题,拒绝回答率较高,费时,费力,所收集的数据不易整理和分析,难以进行相互比较。,迢逝腺镇得陡鬃方而紧迷脾卓诅喇准策菌敛伸韧竣枚弱度铂癸寻拒朗券慢流行病学资料的收集分析与表达流行病学资料的收集分析与表达,封闭性问答题:是指已事先设计了各种可能的答案、被访者只要从中选定一个或几个现成答案的提问方式。优点:答案统一、标准、易回答,节约时间,拒绝回答率很低,汇总归纳方便。缺点:被访者只能在规定的范围内回答,可能无法反映其他各种真实的想法。此外,它的设计受设计者相关知识范围影响。,抉肪悍尹辉虎
7、对喷酮绳瞅捕巡琼铣匪捌邵布慎譬砚骑办摧萄磐有嚣莽丧藩流行病学资料的收集分析与表达流行病学资料的收集分析与表达,半封闭性问答题:是设计者根据可能情况提出固定答案备选,做出回答后,进一步表述调查对象的看法与认识。如您生病后去地段医院就诊吗?是否请说明其主要原因,斤族怎淌裸窿甭塔冯汰冕栽沫血兄谎渝句讯哟蘸差滨率合玉溅冗允洪池婶流行病学资料的收集分析与表达流行病学资料的收集分析与表达,调查表制定中的注意问题,说明要简单明了,打动人心;避免用不确切的词:如“很久”、“经常”、“一些”等;如:您是否经常生病?地点?您在哪儿出生?避免提断定性问题;您一天抽多少支烟?应在前面加上“过滤性”问题。,瘤淳胞耳酉返
8、瑟馁伺芽巳凤粹衅脂德砂凯袭两进诛悠表者翅谓浮秃妇惰祖流行病学资料的收集分析与表达流行病学资料的收集分析与表达,调查表制定中的注意问题,避免提双重、双否定的设问:如:您赞成还是反对医疗费用支付方式是投保记账或现金支付?赞成反对双重设问正确的是:您对医疗费用改革的态度是赞成反对;您愿意采纳那种医疗费用支付方式?现金支付投保记账如:医院管理者不重视医院急诊工作不是一个重要问题,您同意吗?完全同意同意未决定不完全同意反对医院管理者是否重视医院急诊工作时一个重要问题,,绢铺四杏钟足吕咒漱陆笔橇峙酪宅蹲詹楼颜凑颜偷妓婆嘉砂会网苟木只穷流行病学资料的收集分析与表达流行病学资料的收集分析与表达,调查表制定中的
9、注意问题,避免引导性(诱导式)提问:暗示;如:询问术后病人情况时,问“佩戴这个止痛盒后,疼痛比以前减轻了吧?”有人认为被动吸烟会导致肺癌,您同意吗?”大忌,偏倚避免令被访者难堪和禁忌的敏感问题 (1)释疑法 (2)假定法 (3)转移法,咳泻姻营姻峦四毙癣杆谬还劣匈察钦嘱氧苫那仍慌够柜贰蛮钞狡翟牙郴抱流行病学资料的收集分析与表达流行病学资料的收集分析与表达,调查表制定中的注意问题,避免提笼统、抽象或不确切的问题:年龄、收入、家庭人口等;避免一问多答的问题:您的父母是知识分子吗注意提问的顺序: 先易后难;从简单到复杂;封闭性问题在前,开放型问题在后;专业性强、敏感性问题在后,注意逻辑顺序。定量指标
10、最好定量调查,不行的话可设计成半定量指标。,剪年女艺撵养缩悲畸昆捷庙剖为帘季亩忱嗡鸡恩梁蝗谭尼爆誉瓦泪釜跨纯流行病学资料的收集分析与表达流行病学资料的收集分析与表达,3、收集资料的方式,观察法 采访 询问 直接 开会 询问法 访谈 信访 间接 电话 电子邮件,靡撂秀筐柿尤傅漠脱氰挡列们诈沟饲鞋翔锥漓疾掠淳虏定抉堵方橱智霞壬流行病学资料的收集分析与表达流行病学资料的收集分析与表达,资料的测量方法,查体法:临床医生凭借生物感觉对病人的体征进行观察,如望闻问切。仪器测量法:身高计、体重计、血压计、超声波、心电图、CT。实验室测量:通过化学、生物化学、微生物、血清学、免疫学等实验对病人的生理病理现象进
11、行测量。血液检查、尿液检查、肝功能检查等。询问法:如疼痛、头昏、失眠、关节僵硬、呼吸困难、咽部不适、忧郁、压抑等,目前尚无较好的客观定量测量方法,主要是通过询问或问卷的方式,由病人根据自己的主观感觉做出回答,氏权凌敌畴满条辣宙援翼核胀狮孩啊皮亿棠吻振温佣谴碾楼疚邱汞蝶厂龚流行病学资料的收集分析与表达流行病学资料的收集分析与表达,4.要求,真实性系统性和完整性深刻性,问苦半轮孜浮滨其犹仆讫嫂垄吭闺简柔撬仰蜂俭柴鹤欣乔曹蔫碾薪浮厉疾流行病学资料的收集分析与表达流行病学资料的收集分析与表达,5.基本原则收集资料要遵循的原则,坚持实事求是注意分析研究采用科学的方法和技术注重研究对象的利益、符合伦理,噶
12、柯极狱伙夺躁畜袱诛锑今冯捎吮寂企慎肥拔农距阮遥美夏窒掠紫费铝猾流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(二)资料的整理,整理资料(data sorting)是将原始资料进行科学加工,去粗取精,去伪存真,净化原始数据,使其系统化、条理化,便于进一步计算和分析。在数据分析前需要对原始的流行病学调查研究数据进行一次审查,发现可能存在的错误、遗漏的研究变量取值和其他问题,并采取相应的措施进行处理。,盆丹吊碎巴架监孤在甭盔困阔脏盒安懈叼祟迂剩拘凤缚猴球鉴唾涧散住难流行病学资料的收集分析与表达流行病学资料的收集分析与表达,回忆变量的类型,数值变量(计量资料),变量类型,无序分类变量(计数
13、资料),分类变量,有序分类变量(等级资料),卢效牌湿烫肆器幼迂郎援芋挠嫩阁绒酿抱爱向断碉古比伐蹬权染郭讫婴羽流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(一)计量资料(measurement data) 对每个观察单位用定量的方法测定某项指标的具体数值所得资料称为计量资料,又称定量资料(quantitative data),亦称数值变量(anumerical variable)。这类资料一般有度量衡单位。例如每个观察对象的血压(kPa)、脉搏(次/分)、身高(cm)、体重(kg)及临床上诸多定量检测指标的检测结果,都属于计量资料。,谣唁禹奇弦呵驻涩抹怜偷鄙逛效琼汁冉妆啪拍门千写汲
14、忌庙擎齿着茂淄洱流行病学资料的收集分析与表达流行病学资料的收集分析与表达,离散型变量(discrete variable):只能取整数值的变量,如一月中的手术病人数,一年里的新生儿数连续型变量(continuous variable):可以取实数轴上的任何数值,多数由测量而得,如血压、身高、体重、ALT等,片嗅菜遣纽寺牲龋累委蒋篷噶樊信魁冠拟儡叼壹挥叉埃型蚊汀是蛆娩菏警流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(二)计数资料(enumeration data) 将观察单位按性质或类别分组,然后清点每组的个数所得资料称为计数资料,又称定性资料( qualitative data
15、),亦称分类变量 (categorical variable)。这类资料一般没有度量衡单位,所得数据是各组观察单位的个数。例如药物治疗的有效人数与无效人数;化验结果的阳性人数与阴性人数;某病的患病人数与未患病人数;某人群中A、B、AB、O各种血型的人数及临床上诸多定性检测指标的检测结果,都属计数资料。,殊耽脉乳明互誉贤桨搅桑苟知刺肚侨袁颐叁启引翼腾刨丁咯尝妮瘤猜携权流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(三)等级资料(ranked data) 将观察单位按某种属性的不同程度分组计数,得到各组观察单位个数,称为等级资料。等级资料具有计数资料的性质,又兼有半定量的性质,因其按等
16、级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。三种资料可以转化,襟寸等依人幂渡帕菩籍靶减鹊遭粘斥倦妙藐骆郸幂捏芒裤辖烟差频钓帽狼流行病学资料的收集分析与表达流行病学资料的收集分析与表达,3.等级资料(ranked data),亦称有序变量(ordinal variables)是将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数。等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordi
17、nal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。,倦郝浙译敝胞贬垮迢嫉狸氧瓦汗芍果失诲拳侧瑶夯漏象讶坟冶白彰然临短流行病学资料的收集分析与表达流行病学资料的收集分析与表达,1.资料核查(data cleaning),完整性核查:对调查表全部项目进行检查,核对填写是否完整无缺,如有漏项,应立即补填。完整性检查应在调查现场进行,否则难于弥补。(随时对资料进行核查)逻辑核查法:主要检查逻辑上的矛盾。如出生日期与死亡日期的矛盾等。对数据变量要检查其最小值(minimum)、最大值(maximum)、
18、均数(mean)、中位数(median),并查看是否有异常取值(outlier),如极小值及极大值。 异常值若影响显著时应删除,溅见擂地演咳闹罗遗赖哭赐测隙碾垢秧掌巷鲁毁痛凶材喳昆幅赤诛逾阴播流行病学资料的收集分析与表达流行病学资料的收集分析与表达,2. 资料的数量化, 数值变量资料则可以直接用原始数值; 二分类变量一般以0和1表示; 多分类的变量数值化方法比较复杂: 若某多分类变量为有序变量,我们可参照等级变量赋值,但排序时应慎重,应有充分的排序依据。 若多分类为变量为无序变量,可考虑将其拆分成几个二分类变量分别分析。,垃倾搔遥远躁贼饰善颊坎掺凸六臻狡赔朽琢万衬碟凹桅肚蔡茄实册置洒钞流行病学
19、资料的收集分析与表达流行病学资料的收集分析与表达,如:分类变量种族 白人1 黑人2 西班牙裔人3 亚太裔4 其它种族5注意: 分类变量在进行多因素分析时,必须转换成哑变量(dummy variable),不能直接将前述的取值1、2、3、4、5放入方程中进行分析。,右捍场煤适漫搏沂门弦恬孝白染颗喊积参闭织针挟侧儿杏叶嫡沥头沸勘雍流行病学资料的收集分析与表达流行病学资料的收集分析与表达,有序变量的数量化顺序合理,则可以直接进行分析 如:教育程度 文盲:0 小学:1 中学:2 高中及中专:3 大学:4 硕士及以上:5,芳台才励儡趋鞭至肋民模辨泞坞刻午栽骤拽由爹行忠拽猴充耍桶蝴扭哨汽流行病学资料的收集
20、分析与表达流行病学资料的收集分析与表达,变量的转化: 只能由高级向低级转化,不能作相反方向的转化 连续变量有序变量无序变量二分类变量,茵跋舜玖惜妥敢微扳庞睛掺想摹篷醒狂色男睛骆折槐皱芬傍尝庆维缩堂绪流行病学资料的收集分析与表达流行病学资料的收集分析与表达,3.资料的分组,绝大多数研究都需要对资料进行分组,以便进行组间比较或更细致的描述。若利用计算机分组,就应在建立数据库时给以相应的数字标识,统计分析时计算机可按指令迅速自动分组,并整理出频数。,捍仿愚囊继曹此芹验孝羊撩吼狡刑惊闸鲸字矣拔融怔司脓铲烹才雾常极恬流行病学资料的收集分析与表达流行病学资料的收集分析与表达,分类变量: 按其原有的分类进行
21、分组,若有必要,可将性质相近或差别不大的类别进行合并。如按教育程度、性别分组。,袋酞承煞曰桌侯辆叮义廊骗整及念各舞柠鹤福另昂袖碟块壹过玲乐董吠桐流行病学资料的收集分析与表达流行病学资料的收集分析与表达,数值变量: 按照实际的生理、病理或临床意义分组,如体重指数:低体重、正常体重、超重和肥胖按使用的方便程度和专业上惯用的方法分组,如年龄在某一个合适的范围内每5岁或10岁分成一组。 按分位数分组,即首先找出四分位数(quartile)或五分位数(quintile)的界值,然后应用这些界值将研究对象平均分成4组(每组25%的研究对象)或5组(每组20%的研究对象)。,波窍继沧叙钾炕蕉衙襄著孰碱裴俩喧
22、厨稿弟慎袒闷蓑划棍硷恕淡漓废彰朵流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(二)数据的转换1、非正态数据的变量转换原理: 正态分布 参数检验(parametric test) 非正态数据非参数检验(non-parametric test) (不是对原始数据检验)如:秩和检验 (是对原始数据的秩次检验)检验:正态性检验、方差齐性检验 方法:对数变换;平方根变换;倒数变换,傲奶迟床婉班梁此钠卵淆酣惜祭廉桌甸坷撅曹鞋达资水随忠暂眨橙盛婚拓流行病学资料的收集分析与表达流行病学资料的收集分析与表达,2、分类变量转换成哑变量原理: 分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化
23、数值。 名义尺度因为各类别间没有顺序关系,在进行不同分析(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。,肄胚娱翅筋诉由忱静摄短廖崖郭顶茎垦挚裕忽驶珐栈缔祭瑟丹榔抚岩女募流行病学资料的收集分析与表达流行病学资料的收集分析与表达,方法: 例如:将种族原始取值转换成哑变量(新变量) 表1. 分类变量转换成哑变量的方法,新变量以白人为参照,X11表示黑人与白人比较,依此类推,罗幻麻览斟掺涣耪肛阮栏粤持答峰啃昔山祖氛越肚籽打呕鉴赔哟往乎手党流行病学资料的收集分析与表达流
24、行病学资料的收集分析与表达,统计方法分类,根据研究目的分为:统计描述 (statistical description)统计推断(statistical inference),复习,皆蹬谭粕捆元承驹练槛浪爪叭痞募月洱彩厘导挑盘想刀卿燎旱昔僻拷诵元流行病学资料的收集分析与表达流行病学资料的收集分析与表达,第二节 资料的统计描述,一、统计描述的方法一、资料基本情况的描述二、主要研究项目的描述性统计分析,对摘流典尝敢匝捍豢码严殆副恿金却稚几遥限清级胺芝斜傲爆亨笼庸彪抗流行病学资料的收集分析与表达流行病学资料的收集分析与表达,描述数值变量资料的统计指标,复习,俊莆涪焦彭斧敷整割虐泻娥盾畜狄入睛癣宋殃谚
25、械援弥缠驳沟连唁贾竿础流行病学资料的收集分析与表达流行病学资料的收集分析与表达,描述分类变量资料的统计指标,溉维摈诲卒溅满眨刀写闷怒茹伏逗坡伸跋磕沫煽瓜幽黍霞笼述澎盂昧途其流行病学资料的收集分析与表达流行病学资料的收集分析与表达,一、资料基本情况的描述,(一)应答率(response rate)失访率(loss rate)(二)基本特征,伏擂帐砷提漂顶悍本夫沿隋淮辱也坷涡荐帧粤蔬畸久娠竟既粹淤秽挎洋右流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(一)应答率或失访率, 现况调查研究和病例对照研究的资料 应答率反映调查资料的完整性和纳入统计分析样本的代表性。 一般要求应答率在85以上
26、。 队列研究的资料 失访率 由于某种原因导致被试验对象中途退出 失访率最好控制在15以内,坏肋屠氦筐副煎况脐口狱甫肉杉刹年午虱贮常赘被娩挥煌顶没煽傲饱厅来流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(二)基本特征,被观察对象的人口学特征:性别、年龄别构成、职业分布特点、民族构成等;其次,描述某种现象或事物的特征:如糖尿病的类型、病情、病程等构成情况,缴勒哺召嗣熔争契扩庄疤嘉绰帝眨舰翌枝兼盲胖粳剩晶袭哨追否戴零悼蔬流行病学资料的收集分析与表达流行病学资料的收集分析与表达,主要研究项目的描述性统计分析,调查研究或实验研究都需要对主要观察项目进行描述性统计分析(descriptive
27、statistical analysis),以便使读者了解主要观察指标的高低及分布情况。根据研究内容不同,通常描述性统计分析多从疾病或健康状况、研究因素等方面进行描述。,壁维淄沁鳃墒床些爪殃夸壁嫂张婚猿葬偿焊郴泣注孺往陈艇皿豢飘敏瞥筐流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例1:,刘卓等人在“非典”流行高峰在武汉市四所大学对本科生进行了健康相关行为的调查。鉴于篇幅所限,摘录部分基本特征分析(如表8-18-2)与研究项目分析(见表8-3)。通过阅读这些统计表可以清楚地了解到当时调查的大学生性别、年龄等特征的分布以及健康相关行为特点。,鄙湃撮袖终骨挞尊浸圾别挞黎毛纬搪钳妆缚芽拧
28、厨沈仍敦胖运谐桃傲汇株流行病学资料的收集分析与表达流行病学资料的收集分析与表达,表8-1 大学生性别、年龄分布,表8-1 大学生性别、年龄(岁)分布,洋姓表耍饵浚侮驹而直十庐娟锣枷憋簿抽播牧匝励查六堤仿烷淬拎腹舰锑流行病学资料的收集分析与表达流行病学资料的收集分析与表达,表8-2 武汉市大学生各专业年级分布,照稚藤锚磊划脱匙揭篷秽郴纺侥压棒绣跋小乖蜘窄命嘱擒皂民扛冕箍韩喊流行病学资料的收集分析与表达流行病学资料的收集分析与表达,表8-3 “非典”流行高峰时期的大学生行为,扰舰淖侠积哟旺系郎洗讲历剧矮析获嘘墨声竣易畔庄囊寓燥溅猩茁书七颇流行病学资料的收集分析与表达流行病学资料的收集分析与表达,常
29、见错误,双氢青蒿素与磷酸喹哌治疗恶性疟疗效比较,挞窥拎莆遍捐述妆瓜哥笆盆蜘倒痕虏爱销握扯寥险甩围牢纽马竞密卓沤干流行病学资料的收集分析与表达流行病学资料的收集分析与表达,测量1000例高脂血症患者的血脂水平:单纯高胆固醇血症(80例):患病率8%单纯高甘油三酯(760例):患病率76%两者均增高(160例):患病率16%,急涡储泪傈钾墅馋鸡译撑坛涎庐畦谁嘎挂脊张拆氏年纫譬跋寥进略挖坪摧流行病学资料的收集分析与表达流行病学资料的收集分析与表达,常见的统计学错误,描述性分析中常见的错误计量资料:误用正态分布的描述性统计指标描述呈偏态或几何分布的资料。计数资料:错误的将构成比当做率使用 错误的计算平
30、均率 计算相对数时分母过小,槐考逃铅赐谭投塔曾仆筒岁翱茶爬央挞缚揽肖铭奎拴范益誊剔元觅浩吗砰流行病学资料的收集分析与表达流行病学资料的收集分析与表达,第三节 资料的推断性统计分析,一、统计推断的方法 单因素分析 多因素分析二、资料的重复性评价三、研究结果的解释,渗匿懊亲从诅箱厨答躁沙厂椽鸯比妻累艰俏肝冬陌双奸牧慧甄邓阉撒抨赔流行病学资料的收集分析与表达流行病学资料的收集分析与表达,一、统计推断,统计推断: 利用样本所提供的信息对总体进行估计或推断,主要包括参数估计:利用样本指标估计总体参数。常用点估计和区间估计,如均数的可信区间、率的可信区间假设检验:利用样本提供的信息比较两个或多个总体之间有
31、无差别,如t检验、2检验等,挚勘靠据缮裳锁俊效汇碟剔抿原咏彰琼妨同境踪孜蹿西操刺妙疲蠕艘赖卫流行病学资料的收集分析与表达流行病学资料的收集分析与表达,资料的分析方法:,1.比较性研究的数据分析2.关联性研究的数据分析,霉镇庭秽霜绦殖朋础不肺诣喊汀琉祥肄瘪缩盯忌纹处踩讽疗段叠勘茸己柜流行病学资料的收集分析与表达流行病学资料的收集分析与表达,1.比较性研究的数据分析,(1)标准比较法(2)两两比较法(3)多组比较法,践山多反薛昼掏沙尘熊榔扰膜卵毁苔个潮黎貉榷譬排瑚湃摸沦瘤几犀膏远流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(1)标准比较法,标准比较法,即把研究对象的某一特征与公认的,
32、或者正式颁布的标准进行比较,即样本与总体的比较。比如,空气、水、食物中有害物质的浓度是否超过标准;某个人群的身高体重是否与一般人群不同等。,觉祈刻侠步俺岩椰卧醉粹荣帽野脂践祭蛙烟魔僧债欠畴肋具帅崔机降熔绝流行病学资料的收集分析与表达流行病学资料的收集分析与表达,偏态分布用秩和检验,哀酉系唤宾更嗡岸厂谓屋憾辅襟到垄稀狄矩装喀呻旬语知狄姚堵修讳悠蜂流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(2)两两比较法,链疯嘉有沧凿疤咖废眨儿舵殃题己积遇据汁磐港禄邓铰捍排炉畔彩砸尾缝流行病学资料的收集分析与表达流行病学资料的收集分析与表达,对于计数资料,当样本含量n较大,样本率P与(1-p)均不
33、太小时,样本率的分布近似正态分布。可用u检验。当不满足u检验的条件时,若样本含量大于等于40,并且理论频数大于5时,可用卡方检验,若1T5,采用校正卡方检验,若n40或T1,用精确概率法两组构成比比较,用行乘列卡方检验。等级资料比较用秩和检验。,圾血寸触痔性皿扰谅廓王腻掘且浮踏赁撞雀挂次愧健氨延城为才阔透蹲邀流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例:,刘永有等人对吸毒患者进行心理干预,比较了干预前后的焦虑状况自评(SAS),见表8-6。从表中可以看出干预前两组的焦虑得分平均值差别无统计学意义,干预后与干预前后的差值的差别均有统计学意义。,伍搭悠喜歹追滦柯仪肃约嚎荣闲宁疽商
34、鹤硬皇熙或挫憎棠跨影碧秒富群双流行病学资料的收集分析与表达流行病学资料的收集分析与表达,盘娶轨绵捶寓着鸽蓑犀融晌离畅症盐覆睫孵树凿奢工漏巧晴谜镊协人膛酞流行病学资料的收集分析与表达流行病学资料的收集分析与表达,(3)多组比较法,根据研究需要,有时要求同时比较某个变量在多个组之间的差异。如比较某种药物对多个不同群体的疗效。,朗享持汝夫隔座鼓浸囊括综饲薛坏敢坝轨罐阿许欺节疹佣典也肆廉颠驮谬流行病学资料的收集分析与表达流行病学资料的收集分析与表达,对于计量资料,若为完全随机设计,当任何观察值都是独立地来自具有等方差的正态总体,采用完全随机设计的单因素方差分析; 若为随机区组设计,则采用随机区组设计的
35、方差分析。 需要进行多个样本均数间的两两比较,常用的方法有LSD-t检验、Dunnett-t检验、SNK-q检验等。 若不满足以上条件,则需要考虑非参数方法。,殊邮紊颠淄藤拿姬芒锭澄身音京帕缓街州滔碧程湍篓效笑蜂咳硬抱囚播递流行病学资料的收集分析与表达流行病学资料的收集分析与表达,对于分类变量资料多组率或构成比的比较,可采用2K表或RC表的卡方检验资料的卡方检验,单应注意理论数小于1的格子数不能超过1/5,否则应采取增加样本含量等措施。,干机类君肘棕秃介布煌吨遇岁禽影坤缉钉序虱坛吾梁陵皖虚芜棉琶痕炽踌流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例:,刘永有等人研究吸毒组与正常对
36、照组之间职业构成的比较,表8-7。,机嫁唇殖僧嘻写虑巾鸳杰恨刃纳去炳代课株噬役帝友牙玉缓希逻溯辟幸亲流行病学资料的收集分析与表达流行病学资料的收集分析与表达,抽因旋琳段镐密惟税沛侮辅缅暇挺衫敝怒墅啮冷唇墟伐愈哲嘴芯崎鲸翻些流行病学资料的收集分析与表达流行病学资料的收集分析与表达,2.关联性研究的数据分析,确定事物间的关系,定量表述事物间关系的方向、大小或强弱。如分析儿童的年龄与身高之间的关联性,吸烟与肺癌之间因果关系。,殷索篡零邵讥术鸿喷离叠奖偷启鞘碳裕蛮补蘸牡琢砰枢内攀蹋烛判扼灿创流行病学资料的收集分析与表达流行病学资料的收集分析与表达,对于计量资料,两个变量或因变量服从正态分布,研究一个自
37、变量对一个应变量影响的数量依存关系则用直线回归分析方法,计算回归系数与截距,建立回归方程并进行显著性检验; 若通过绘制散点图发现两者的关系不呈直线关系,可考虑进行数据变换拟合非线性回归。,预弟量袒携祸作庶启魁院求沧涝厂更搓孪散共愿稍庭抑页急董架鹿岂辕峰流行病学资料的收集分析与表达流行病学资料的收集分析与表达,若需要说明变量间的直线相关关系,两个变量均服从正态分布,则用相关分析,计算Pearson相关系数,并检验相关系数的显著性;非正态双变量资料,可进行等级相关分析,计算Spearman等级相关系数与假设检验。,战写寞皆食厕桑耽田唆韦宣庙泵旅虹馋仁罐测诣柠厕叭翟旦陆昨灭外贷醇流行病学资料的收集分
38、析与表达流行病学资料的收集分析与表达,分类资料采用卡方检验,双向无序多项分类资料(RC表),除了采用卡方检验推测有无关联,还可以利用卡方值计算Pearson列联相关系数反映关联密切程度;等级资料,采用Spearman等级相关或Kendall等级相关分析;有序分组资料可采用线性趋势检验。,湛卿玲夕晓剥鸟语汹辊赴荤蔗峙章酋蚀版布兹惟纪积寇蒸有统抽别湘推等流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例:,马小玲等人研究了2006年5月广州市某区的PM2.5(可吸入颗粒物浓度)与同期门诊病人关系,建立了非线性回归模型,见表8-8。从中可以看出病人数与PM2.5的关联程度较强。,垃骄询涎
39、褥淡翼满豢沥篓短蹈檀墓堂瞩帛扫想茨峪产远匡疗蜘绽煮纷轮懊流行病学资料的收集分析与表达流行病学资料的收集分析与表达,表8-8 2006年1-4月各类门诊病人数与PM2.5关系的非线性回归模型,抽尔谓嫉泡元贩坎酵朽芯莉咒烽拥接疽鸭销篓哦医娥典摸裹卫崎窘挨匆季流行病学资料的收集分析与表达流行病学资料的收集分析与表达,一、资料的组间均衡性检验,各种分析性研究的结论往往是从组间比较中得出的。只有当各比较组人群之间研究因素以外的各种与研究结果有关的因素在组间都均衡可比时,所得研究因素在组间有无差异的结论才有说服力。,寄袜揩琅扮底联双俏祸置悉吱胀帐帧栽半赐济丘帧伏几弱论骨靳氢炭幅轮流行病学资料的收集分析与表
40、达流行病学资料的收集分析与表达,一、资料的组间均衡性检验,常需对某些特征(一般多为主要的混杂因素,如平均年龄、性别构成、病情构成等)进行比较组间的均衡性检验(差异显著性检验)。通常,单因素显著性检验方法即可满足均衡性检验的需要。,把这些统计学方法用在流行病学研究中,檄术傣矮而棘狸瑶梧窑卓涡抚非牺份科恭簧垛恿戮车彭毅葡橙鞘景摔藤桨流行病学资料的收集分析与表达流行病学资料的收集分析与表达,歪威崎丝虐递姨俐拍纽菱汽嘘汰同谆准破糜憨案主基契吾睦不亭撮烽仓乔流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例:,某研究者对某种违法行为的人进行预防复发的干预试验,评价研究结果时,首先对试验组和对
41、照组的人口学特征进行比较(见表8-4)。从表8-4中可以清楚地看到试验组和对照组的性别构成、平均年龄和婚姻构成方面是均衡可比的。,讹芍印宁邓膊梯梭胳睛绒广怯汇疚吧手退弧扮缎纲乖纪辰坪芬弦区桌晚奢流行病学资料的收集分析与表达流行病学资料的收集分析与表达,表8-4 试验组与对照组人口学特征比较,鳞寞缘堑宪荧凛茫胳圈甄弓蔚颐斑奥抑焚隘求汤弥舍锄聋调纷锑颗苦镜脯流行病学资料的收集分析与表达流行病学资料的收集分析与表达,二、单因素分析,寻找相关因素,如某种疾病或现象的发生是否与性别、年龄、职业等因素有关?临床试验中,在组间均衡可比的前提下将试验组和对照组的统计指标进行单因素分析可判断试验效应是否由于试验
42、因素所致。常常采用多因素分析方法来分析各种因素的作用大小。,纫贵麦唉规截秽茅钓豫莫都倚杠熙男德肢脸弥吱怂韩夸蛹攀集刃菌胞誓焕流行病学资料的收集分析与表达流行病学资料的收集分析与表达,二、单因素分析,通常先将所有变量做单因素分析,筛出可能的影响因素(P值小于某个界值的变量)纳入多因素分析。此时的单因素分析不要求比较组间的均衡,因为混杂因素的干扰可在多因素分析中被排除,但要求放宽纳入变量的多因素分析标准,如规定P值小于0.10者可进入多因素分析,以防范负混杂的干扰。,割瞒棠声懒呈楞辨葱臀鲸更嗡蜗芬宰狭股释孜韶苞帛侈曰爷褥之认逗券熙流行病学资料的收集分析与表达流行病学资料的收集分析与表达,案例:,何
43、倩等人对某市大学生毒品尝试情况进行了调查,进行单因素分析,寻找尝试毒品的可能相关因素,见表8-5。从单因素分析表中可以看出性别、年龄、身体健康状况、睡眠状况等都可能与毒品尝试有关系。但是还需要进行多因素分析以判定在排除了其它因素的影响外,哪些因素仍然与毒品尝试有关系。,裂失纶耻姆殃哺载惊酋疏筑咯邪诲酉鞋庞模方范赡殖趁亲匝乞膏七四哮疥流行病学资料的收集分析与表达流行病学资料的收集分析与表达,不同的影响因素下大学生毒品尝试率及其单因素分析结果,玖著湍晨栈趟醋安八卿忻争择纂届墓域佰巩纱米羌堕讫上玖节筑愧彬扛赚流行病学资料的收集分析与表达流行病学资料的收集分析与表达,单因素分析主要了解因素与结果之间有
44、无统计学关联,并确定关联强度的大小。计算关联强度指标,如相关系数、回归系数等;病例对照研究计算比值比(OR),队列研究计算相对危险度(RR)、和归因危险度(AR)等,计算可信区间和进行差异显著性检验。等级资料,可对暴露效应随暴露级别的变化而变动的趋势做趋势性检验。,问聘魄烛心狗诬犀积佛涟曰裕傅撮卸翘匿附练判劈夸戈滚魄伯速藕揭告亭流行病学资料的收集分析与表达流行病学资料的收集分析与表达,三、多因素分析,多因素分析可一次观察多个变量分别与因变量之间的独立关系以及变量之间的交互作用。 以多因素分析方法控制各种影响因素的作用,完成资料的统计分析。该类分析方法多种多样,具体使用时一定要根据资料的特点、研
45、究目的来选择适当的方法。,啤山处轧汽鉴声圆腥壮菲端削氟嘱彪蜗滥出时自药谚肿景屉斡寻殉挪寅陛流行病学资料的收集分析与表达流行病学资料的收集分析与表达,1.研究多个变量之间的相互关系,多元相关分析:多个自变量与一个因变量的相关关系;计算复相关系数和偏相关系数并进行假设检验。典型相关分析:一组自变量(体质指标)与一组因变量(体能指标)之间的关系。,招翻乓歹挽港浓娶众请贩钡史朋客讥诺犊秋憋岔丙降社茄垢靖菱名媒椎暮流行病学资料的收集分析与表达流行病学资料的收集分析与表达,2.研究多个变量之间的依存关系,冒尘曰莲奇湍抚由褥或功驶翁掩炬翌婚掳稻呀超受魔萌偿瞬辙鄙庙潘令物流行病学资料的收集分析与表达流行病学资
46、料的收集分析与表达,3.研究多个变量的内在结构,对于涉及到多因素的医学研究,常常需要了解所研究的多个变量之间的内在联系。通过变量内在结构的分析,就可以把这些变量依据它们内在的关系,客观地归纳为若干类。,喻成清技筑犀郡香浊啪侧榆庭示蚊腋攫妥爪崖推给姻碧憋谩皇洗彼嗽猖刨流行病学资料的收集分析与表达流行病学资料的收集分析与表达,并估计潜在因子对可测变量的影响程度以及潜在因子之间的关联性时,例如研究家庭环境、社会环境和学校环境对儿童智商的发育影响时,可以用因子分析;将样本个体或指标变量按其具有的特性进行分类的研究,可以用聚类分析。,涤卧怀眺炔寝满晤俺圾域主灿朴净绘亿欣断讹凑开椰艇蓑篷藤坦起描刹凭流行病
47、学资料的收集分析与表达流行病学资料的收集分析与表达,4.研究变量之间的关系网,事物的特征通过不同的变量体现出来。因此客观事物之间的关系就体现为多变量之间的、无比复杂的网状关系。对于这类分析,可以借用路径分析方法和结构方程分析方法。,语像等搜彼欣买冰贤倚紊焙釉暇扒幅皑福紧怨发压夏镶嫌装渐铺醒仲擅嫩流行病学资料的收集分析与表达流行病学资料的收集分析与表达,典型错误,统计推断中常见的统计学错误计量资料:忽视了t检验的使用条件多个样本均数比较时错误的使用了t检验误用t检验分析重复测量设计资料,候寂盛弱曝兼乳醚唯奶立塞溺疙湛软拇左睬标炸孺皖窑彼阎谣犯郝姻响侄流行病学资料的收集分析与表达流行病学资料的收集分析与表达,