1、医学研究中统计学方法的抉择,一、统计学方法应用的常见错误,(一)资料表达和描述中常见错误(二)计量资料分析中常见错误(三)计数资料分析中常见错误(四)相关与回归分析中常见的错误(五)统计结果的解释与表达中常见的错误,(一)资料表达和描述中常见错误,1编制统计表时存在的主要问题2绘制统计图时存在的主要问题3选用平均指标和变异指标时存在的主要问题4运用相对数时存在的主要问题,1编制统计表时存在的主要问题,例1 统计表纵、横标目颠倒1)原先表格设计形式表1(Y),2)差错分析原表主要错误是主、谓语位置颠倒;线条太多,并有竖线;百分比中有效数字位数不一;数字位数没对齐;误用“百分比”代替“感染率”;试
2、验组与对照组可在文中说明,不必列入表中。,表1(Y)不同溶液冲洗伤口效果比较,3)修正表1(X),2绘制统计图时存在的主要问题例2 统计图与资料类型不匹配1)原统计图式样图1(Y),图1(Y)两种方法扫床前后空气培养结果,2)差错分析 原表主要错误是用分段条图表达2个分组因素的资料。图1(Y)中阴影部分的高度实际上表示的是刷子法与毛巾法所对应的菌落数之差,读者很难看出,因而极易产生误解。,3)修正 复式条图用于表达具有2个或2个以上分组因素,每个因素又有若干水平的计量资料。本例有2个分组因素,即“扫床方法”与“观测时间”,前者有2水平(毛巾法和刷子法),后者有4水平(扫床前、扫床后即刻、扫床后
3、15min和扫床后30min)。用复式条图表达本资料的图形见图1(X)。,图1(X)两种方法扫床前后空气培养结果,例3 误用正态分布法描述呈偏态分布的资料 1)原先资料表达形式表3(Y),2)差错分析 由表3(Y)可以看出“愈合时间指数”的标准差大约是均数的2倍,据此基本上可以认为该资料呈偏态分布,而“平均数标准差”是表达正态分布资料的方法,说明其数据分布的集中趋势和离散趋势,它不能用于表达偏态分布资料的集中趋势和离散趋势。,3)修正 表达偏态分布资料的集中趋势应选用中位数,表达其离散趋势应选用第1 和第3四分位数的间距,其形式为“M(QR)”,其中M为中位数,QR=Q3-Q1,Q1和Q3分别
4、为第1和第3四分位数。,4运用相对数时存在的主要问题,2)差错分析 原表主要错误在于计算相对数的分母太小。相对数通常以100为基数,分母太小就显得过分夸张而失真,不但不能正确反映事实真相,还会造成错觉。,3)修正 一般地说,观察单位数足够多时,计算相对数比较稳定,能够正确反映实际情况。实际应用中,观察单位数小于20时,都不宜计算相对数,而直接给出个组观察的可能发生某事件的总例数和实际发生该事件的例数。,例5 误以“百分比”代替“百分率”1)原先资料表达形式表5(Y),2)差错分析原表主要错误是“百分比”代替“百分率”。,3)修正 百分比是反映某事物内部各组成部分在总量中所占的比重,而百分率是反
5、映某现象(事件)的发生强度或频率。从资料的性质来看,作者企图描述的是“病人手术前后各种心理问题”的发生强度,因此,表5(Y)中的“百分比”应改为“百分率”。,例6 误以“百分率”代替“构成比”1)原先资料表达形式表6(Y),2)差错分析 原表主要错误是“感染率(百分率)”代替“构成比(百分比)”。,3)修正 从资料的性质来看,作者企图描述的是“各病房医院感染情况”的比重(分量),因此,表6(Y)中的“感染率”应改为“构成比”。,(二)计量资料中分析常见错误,1t检验和方差分析的前提条件及误用 若是单组设计,必须给出一个标准值或总体均值,同时提供一组定量的观测结果,应用t检验的前提条件是该组资料
6、必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。 方差分析(F检验)与成组设计t检验的前提条件是相同的,即分布的正态性和方差齐性。 分析计量资料中常见的错误是:忽视t检验和方差分析的前提条件、误用t检验代替F检验、误用参数检验代替非参数检验、各种方差分析混用。,2误用t检验分析单因素多水平资料,例7 误用t检验进行多个均数间的两两比较1)原先的设计、资料、统计分析方法、结果与结论:某医院为了了解昏迷时血清甲状腺素的变化,分别测定病人和普通病人的血清的T3、T4、rT3,结果见表7(Y1)、表7(Y2)
7、。,作者采用t检验对表7(Y1)每两组的均数进行比较,经检验认为昏迷病人较普通病人的血清的T3、T4降低,rT3升高,其差异有非常显著性意义(P0.01);浅昏迷与中昏迷比较、中昏迷与深昏迷比较,血清的T3、T4降低,rT3升高,其差异有显著性意义(P0.05);浅昏迷与与深昏迷比较,血清的T3、T4降低,rT3升高,其差异有非常显著性意义(P0.05)。这说明昏迷程度越深,血清的T3、T4降低与rT3升高越明显。,2)差错分析 这是个单因素(昏迷)4水平(无、浅、中、高)的设计。t检验对每两组的均数进行比较,割裂了整体设计,无法说明整体差异是否有显著性意义。3)修正 若要得出“昏迷程度越深,
8、血清的T3、T4降低与rT3升高越明显”的结论,必须选用多元方差分析。,例8 误用t检验分析析因设计资料1)原先的设计、资料、统计分析方法、结果与结论:某学者为了提高住院精神病病人生活质量,对于住院精神分裂症病人给予生活技能训练。以某病63例病人为实验组,给予生活技能训练、社会技能训练、疾病知识教育及家庭干预等;另一病区49例病人为对照组,采用药物治疗和传统的护理。住院期间定期对两组病人进行NOSIE30、SAPS、SANS及总体幸福感量表评定,部分结果见表8(Y)。,3误用t检验分析析因设计资料,作者采用t检验,总积极因素和总评估增分值及总消极因素减分值实验组均明显高于对照组,差别有极显著性
9、意义(P0.01)。,2)差错分析 这是个两因素析因设计,一个因素是处理方式,分为2个水平(实验组与对照组);另一个因素是处理后测量时间(第2、4、6、8周)。从研究设计上说,作者采用t检验是错误的;此外,表8(Y)中多组数据的均数小于标准差,从资料性质上说,采用t检验也是错误的。3)修正 若经数据转换后,资料满足正态性和方差齐性,可采用析因设计资料的方差分析。若经数据转换后,资料仍不满足正态性或方差齐性,则采用完全随机设计的非参数检验。,4误用t检验分析重复测量设计资料,例9 误用t检验分析具有一个重复测量的3因素设计资料1)原先的设计、资料、统计分析方法、结果与结论:某学者为了探讨终末期肾
10、脏病行腹膜透析后的患者在服用血管紧张素转换酶抑制剂(ACEI)之后对促红细胞生成素(EPO)的疗效,选择16例接受EPO治疗的腹膜透析患者,随机分成A、B两组,另选10例未接受EPO治疗的腹膜透析患者,随机分成C、D两组;A、C两组不接受ACEI治疗,B、D两组还要同时接受ACEI治疗,测定实验前后每个患者血清EPO的浓度。统计学采用自身配对t检验及组间t检验,见表9(Y)。,2)差错分析 本例4组是2个两水平因素的组合,一个因素是“是否接受EPO治疗”,另一个因素是“是否接受ACEI治疗”,他们都有2个水平,即“是”与“否”,相互组合成4个实验组,见表里9(X);每个患者在试验前后两个不同时
11、间点上被重复测量了同一个指标的数值,即试验前后的数据并不是相互独立的,这种设计类型属于具有重复测量的实验设计,时间是与“重复测量”有关的一个试验因素。而采用t检验进行两两比较,则割裂了整体设计,不能准确估计和控制误差,因而无法得出可靠的结论。,3)修正 本例属于具有一个重复测量的3因素设计,应采用与之相对应的方差分析。通过分析,可以得到“是否EPO治疗”、“是否ACEI治疗”、“治疗前后”以及多项交互作用对EPO浓度的影响。,5误用参数检验代替非参数检验,例10 忽视t检验的前提条件1)原先的设计、资料、统计分析方法、结果与结论:某学者为探讨改善低出生体重儿胃肠蠕动功能的方法,选择40名低出生
12、体重儿分成两组,在鼻饲喂养的同等条件下,对其中一组应用腹部按摩法和肛管刺激法护理。主要结果见表10(Y)。,作者根据上述结果得出结论:腹部按摩法和肛管刺激法护理可有效改善出生体重儿胃肠蠕动功能。,2)差错分析从表10(Y)可以看出,日均排便次数、日均排便量和排完胎便天数的变异相对较小,即使这样,直接采用t检验也可能不恰当;残留奶量和日均腹胀次数均出现标准差大于均数的现象,显然变差较大,不能采用t检验。,3)修正先对日均排便次数、日均排便量和排完胎便天数进行正态性检验。由于从原文中无法获得原始数据,故无法进行。但可以进行方差齐性检验,对于日均排便次数,F=0.8842/0.6322=1.956,
13、查方差齐性检验用的F值表,得F0.05(19,19)0.05,可认为两总体方差齐性;同理计算,日均排便量和排完胎便天数的两总体方差也是齐性的。因此,这3个指标数据若符合正态分布,则原显著性检验方法是正确的。对于残留奶量和日均腹胀次数2个指标,解决问题的办法有2种。一种是通过对原始资料的数据转换(对数或开平方变换),使之满足正态性和方差齐性的要求,再行t检验;另一种方法是直接采用与分布无关的方法,如秩和检验和符号秩和检验等。,(三)计数资料分析中的常见错误,1关于22表资料3种分析方法的选用标准,2.分析普通22表资料存在的问题,例11 误将部分合计频数当作22表的原始频数1)原先的设计、资料、
14、统计分析方法、结果与结论表11(Y)。,2)差错分析作者将螺纹管消毒前后的“采样份数20”当作22表的原始频数,代入普通检验公式计算是错误的。“采样份数 20”实际上是每组各自的合计数。,3)修正先将表11(Y)改正为表11(X)。,例12 误用普通检验代替Fisher的精确检验1)原先的设计、资料、统计分析方法、结果与结论表12(Y)。,3)修正先将表11(Y)改正为表12(X)。,由于本例总频数n=2255%),从而得出“治疗组治愈率明显高于对照组”的结论。,2)差错分析 表14(Y)中总例数与其各部分例数之和不等,未作统计学显著性检验就下结论是草率的。,3)修正若只进行治愈率比较,应将表
15、格修改为表14(X)。,若要全面考察两组不同等级疗效是否存在差别,本例属于单向有序列联表资料,应选用秩和检验或Ridit分析。经计算,秩和检验结果为:Hc=3.3782,P=0.0661;Ridit分析结果为:与标准组(两组合并)相比,治疗组、对照组的P值均大于0.05。其结论为治疗组与对照组的疗效之间的差别无显著性意义。该结论与作者结论相反。,例15 根据样本率直观比较便得出结论1)原先的设计、资料、统计分析方法、结果与结论:169例剖宫产产后出血24例,出血率为14.2%;阴道分娩318例中产后出血68例,出血率为21.4%,见表15(Y)。,2)差错分析仅根据样本率直观比较便得出结论,缺
16、乏科学依据。,3)修正根据原文提供的资料可列出如下的四格表表15(X)。,例16 25表中0频数过多,结果可靠性差1)原先的设计、资料、统计分析方法、结果与结论: A组20例经末梢静脉给药均出现不同程度的局部刺激和静脉炎,B组经锁骨下静脉穿刺置管输注均未出现局部刺激和静脉炎表16(Y)。,2)差错分析 从表16(Y)看,末梢静脉组均为00以上,而锁骨下静脉组均为00,表中0频数过多,将导致计算结果的可靠性差。因此,作者将“局部刺激症状”分为5级欠妥。,3)修正将资料分成00和非00,整理成表16(X)。,例17 可能误用统计分析方法,得出错误结论1)原先的设计、资料、统计分析方法、结果与结论:
17、某学者研究盐酸地尔硫缓释片治疗心绞痛的效果,收集到如下资料表17(Y)。,2)差错分析,3)修正 显然原资料表17(Y)中“加重组”的例数太少,分别为“1”、“0”,应将其与无效组合并,整理成表17(X)。,由于本例是单向有序列联表资料,实验分组变量的水平数为2,故选用秩和检验。计算得Hc=14.1969,P=0.0002。结论为缓释片组的“有效+显效”率(94.32%)高于普通片组(82.59%),差别有非常显著性意义。,例18 根据32表资料的分析结果武断推测两两比较的结果1)原先的设计、资料、统计分析方法、结果与结论表18(Y)。,5分析RC表资料存在的问题,例19 各组间重要的非实验因
18、素有差异,不具备可比性1)原先的设计、资料、统计分析方法、结果与结论表19(Y)。,实验设计为将300人随机分为3组,分服3种药物,原文中说明病人性别、病程长短是有差异的。作者没有说明进行何种统计分析,但有如下的表述:“统计学处理表明二联组和前两种药物有显著性差异,其余两组无显著性差异。”,2)差错分析 原文中声明病人性别、病程长短是有差异的,这意味着各组间一开始就不具备可比性,资料应按性别和病程分别进行分析。用了何种统计分析方法处理资料应交代清楚,同时,还应写出统计量的具体数值,以便读者判别作者所选用的方法是否合理、计算是否正确。3)修正 本资料属于单向有序列联表资料,若排除了“性别、和病程
19、”等重要的非处理因素的影响之后,应选用秩和检验或Ridit分析。若进行秩和检验,计算得Hc=10.8934,P0.05所对应的实验因素一定是无用因素 1)“P0.05”等价于“某因素是无用因素”吗? 某研究者在研究多个实验因素对某产物的影响时,运用正交设计安排了全部实验因素。运用方差分析处理资料后发现“温度”这个实验因素所对应的P值是“P0.05”,便认为“温度”这个实验因素对产物的影响无显著性意义,于是,得出结论:“温度这个实验因素在本实验中是无关紧要的,可忽略不予考虑”。 2)差错分析 假定在上述问题中没犯型错误的前提下,来讨论所提出的问题。此时,“P0.05”与“某因素是无用因素“之间并
20、非等价关系!即使某个实验因素在实验中是不可缺少的,如果该因素在实验中所取的水平过于接近,它们对实验结果的影响自然也就相差无几了。此时的不显著,仅表明该因素的各水平对观测结果的影响几乎相同,而不代表该因素对观测结果无影响。,3)释疑 当发现某因素所对应的显著性水平为“P0.05”时,不要轻率地作出类似原作者的结论,一定要仔细检查一下该因素所取的水平是否过于接近。如果因素的水平已取到可能取值范围内的最小值、中等值和最大值,而且,设计符合实验设计的基本原则,并且所选取的试验点具有统计学上的依据,则可认为该因素在其取值范围内可取任何值,但此时仍得不出“该因素是无用因素,可忽略不予考虑“的结论。像“温度
21、”这样的实验因素,在某些实验中是必不可少的。如果问题中所涉及的不是像“温度”那样的实验因素,而是像“某种物质含量”那样的实验因素,无论它取多大含量(甚至含量为零),观测结果始终不受其影响。此时,才可认为该因素是无用因素,今后做类似实验时可不予考虑。,4解释有显著性意义的结果时存在的问题,例27 误解了“P0.01”与“P0.05”的真正含义 1)在解释“P0.01”与“P0.05”含义时常犯的错误:有些人在解释具有显著性意义的统计结果时,常根据P值是“0.05”还是“0.01”作出肯定程度不同的专业结论。例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P0.001 ”,则认为甲
22、药极显著地优于乙药;若得到“P0.01”,则认为甲药非常显著地优于乙药;若得到“P0.05”,则认为甲药显著地优于乙药。,2)差错分析 统计学上根据假设检验原理推算出来的P值,表示拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间差别的程度的大小。 3)释疑 如果事先规定拒绝零假设的显著性水平=0.05,当计算的结果为P时,可以作出的结论应当是相同的,即拒绝零假设,可以认为对比的两者之间的差别具有显著性意义。但下此结论时犯假阳性错误的概率在不同的场合下可能不等,视P值的大小而定。,5解释相关分析结果时存在的问题,例28 误认为“r0“就是零相关1)有一些人认为,“样本
23、直线相关系数r0就代表两变量之间呈零相关”。2)差错分析 这些人将“零相关”理解成所研究的两个变量之间无任何关系。在实际问题中,有时并非如此。例如,当某个变量呈曲线关系时,用直线相关系数r去描述两变量之间的关系时,也会得到近似等于零的r值。所以,当发现样本直线相关系数r0的资料时,不能简单地推断所研究的两个变量之间呈“零相关”。,3)释疑 判断两个变量之间是否存在直线相关关系,应从两个方面入手:其一,依据专业知识。如果专业上有理由认为某两个变量之间存在一定的关系,才有进一步探讨的基础。其二,依据假设检验理论。由样本资料算得的相关系数存在抽样误差,根据假设检验原理进行统计推断,看样本所代表的总体
24、相关系数存在抽样误差,根据假设检验原理进行统计推断,看样本所代表的总体相关系数是否为零。若推断的结果是总体相关系数为零,此时,只能认为所研究的两个变量之间不呈“直线关系”,但不能认为他们之间没有任何关系(因为它们之间可能呈非常好的曲线关系)。,例29 误认为“r0.7”就代表两变量之间呈高度相关关系1)“r=0.945”就表明两变量之间呈高度相关吗? 某研究者依据专业知识认为变量X与Y之间有一定的关系。通过抽样研究,获得了4个样品,测出4个样品的(X,Y)值,代入计算直线相关系数r的公式,得到样本直线相关系数r=0.945,发现此r值明显大于某些人给定的界限值0.7,故很有把握地断言所研究的两
25、个变量之间存在显著地直线相关关系。,2)差错分析 前面讲过,对于两个变量之间是否呈直线相关关系,应从专业和假设检验两个方面去考虑。上面的错误就在于没有进行假设检验,仅凭一个没有根据的界限值作出推断,往往都会得出错误的结论来。3)释疑 由样本信息推论总体的情况,必须排除抽样误差的影响,而误差的大小与许多因素有关,其中样本含量n的大小是必须考虑的。在本例中,n=4,自由度v=2,查直线相关系数临界值表可知,其临界值r0.05(2)=0.950,因r=0.9450.05,正确的统计结论应当是:接受H0(总体相关系数=0),可以认为所研究的两个变量之间不呈直线相关关系。,二、统计学方法的正确选择,(一)不同类型资料统计描述的常用指标 (二)计量资料统计推断的常用方法 (三)计数资料统计推断的常用方法 (四)等级资料统计推断的常用方法,表 26 不同类型资料统计描述的常用指标,表 27 计量资料统计推断的常用方法,表 28 计数资料统计推断的常用方法,表 29 等级资料统计推断的常用方法,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。