1、1,统计学傻瓜指南!,Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM翻译:acred(DXY),2,定义,统计学是搜集、整理、总结、分析数据以及依据数据进行推断的科学,统计描述,包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来,统计推断,包括进行推测、假设检验、确定关系然后作出预测,3,变量,定量的(Quantitative)离散的(Discrete)连续的(Continuous),定性的(Qualitative)有序的(Ordinal)分类的(Categorical),4,参数检验与非参数检验,参数检验:需要知道样本统计量的分布才能作出决断非参数检验:不
2、需要知道样本统计量的分布就可以作出决断,5,t-检验,在样本中比较连续变量的平均数,以检验两个均值之间的差异是否大于能被机遇所解释的差异,均值有差异,概率是多少?,6,应用条件,观测值(变量)相互独立从正态分布的总体中抽样得到样本量30,则使用正态曲线的z检验(二项检验,binomial test),7,t-检验的类型,单样本t检验:某个变量的样本均数与给定总体的已知均数相比,其差异是否有意义非配对或独立t检验:检验由两个独立样本估计的总体均数之间的差异是否有意义(如男性群体和女性群体)配对t检验:检验由相关样本估计的总体均数之间的差异是否有意义(如给同一组病人施加处理前后,测量值的均数),8
3、,2检验,用来检验定性变量间关联的强度用于分类数据,9,应用条件,数据应以频数的形式呈现被观察的病例总数应大于20任一类别或单元格内的理论频数应5(当任一单元格观测频数5:yates 校正)或(当任一单元格理论频数5:fisher精确概率)相比较的组别应大致相似,10,相关与回归,研究两个或两个以上变量之间关联的强度以及函数关系的方法,11,相关,指明变量间关联的强度,r=+1,r=-1,r=0,曲线,12,回归,揭示一个因变量与一个或多个自变量间数学关系的方法简单线性回归和多重回归适用于连续变量如血压、体重Logistic回归适用于二值响应,如生/死,13,测量值,若为参数Pearson相关
4、系数连续变量线性关系若为非参数Spearman等级相关两个均为连续变量Kendall等级相关 (Kendalls ) 两个均为有序变量或一个有序另一个连续,14,方差分析(ANOVA),用来揭示作用于一个因变量的几个分类自变量(称为因素)的主效应和交互效应,15,方差分析的类型,单因素方差分析(One-way ANOVA):检验一个因变量在一个分类自变量两组、三组或多组类别间的差异,16,两因素方差分析(Two-way ANOVA):分析一个因变量在两个自变量所形成的组间的差异,其中一个自变量可看作处理变量多因素方差分析*(n-way ANOVA):简言之,多因素方差分析处理多个自变量。应当注意,自变量的个数越多,可能的交互作用的数量也随之增多,17,如何选择恰当的统计检验方法,变量类型定量的(血压)定性的(性别)所研究问题的类型关联比较危险因素数据的构成独立的配对的匹配的,18,所研究的中心问题两变量(因变量,自变量)之间的联系,19,变量间比较(差异),*有1个单元格理论频数5,用fisher精确概率法 有1个单元格观测频数5,用yates校正,20,寻找危险因素,