1、临床医学科研中的常用统计方法南华大学公共卫生学院南华大学公共卫生学院 吴成秋吴成秋变量类型及处理变量类型及处理统计统计 方法选择的思路方法选择的思路主主 要要 内内 容容科研数据的考察科研数据的考察数据的统计描述方法数据的统计描述方法统计学检验方法的选择统计学检验方法的选择医学统计应用典型错误医学统计应用典型错误统计方法应用实例分析统计方法应用实例分析(一)判断资料的类型?(一)判断资料的类型?(二)判断资料的分布?(二)判断资料的分布?(三)计量正态分布资料方差齐性否?(三)计量正态分布资料方差齐性否? (四)研究设计的类型?(四)研究设计的类型?(五)单变量、多变量?(五)单变量、多变量?
2、(六)分析目的?(六)分析目的?一、统计分析方法选择的思路一、统计分析方法选择的思路返回目录v 总体:总体: 任何一种研究都有特定的研究对象,根据研任何一种研究都有特定的研究对象,根据研究目的确定的同质全部研究对象称作总体究目的确定的同质全部研究对象称作总体v 样本:样本: 根据随机化的原则从总体中抽出的有代表性根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集称作样本的一部分观察单位组成的子集称作样本v 同质与变异:同质与变异: 一个总体中有多个个体,具有一些共一个总体中有多个个体,具有一些共同的特征(即同质),同时也具有一定的差异(即变异同的特征(即同质),同时也具有一定的差
3、异(即变异)v 变量:变量: 表达总体中个体的特性的指标称为变量,变表达总体中个体的特性的指标称为变量,变量的取值称为变量值,统计学中的变量通常是指随机变量的取值称为变量值,统计学中的变量通常是指随机变量。变量可分为定量变量和定性变量两种量。变量可分为定量变量和定性变量两种二、变量类型及处理二、变量类型及处理(一)定量变量(一)定量变量 1、定量变量、定量变量 (数值变量数值变量 ): 是对每个观察对是对每个观察对象的观察指标用定量方法测定其数值大小,一般象的观察指标用定量方法测定其数值大小,一般有度量衡单位。由定量变量构成的资料称为有度量衡单位。由定量变量构成的资料称为 计量计量资料资料 (
4、数值变量资料数值变量资料 )2、分类:、分类: 分为离散型变量和连续型变量分为离散型变量和连续型变量v 离散型变量只能取整数值,离散型变量只能取整数值,v 连续型变量可以取实数值上任何数值连续型变量可以取实数值上任何数值二、变量类型及处理二、变量类型及处理(二)定性变量(二)定性变量 定性变量(分类变量资料):定性变量(分类变量资料): 分为无序分类变分为无序分类变量和有序分类变量(或等级变量)。是将观察单位的观量和有序分类变量(或等级变量)。是将观察单位的观察指标按性质或类别分组,然后分组汇总各组观察单位察指标按性质或类别分组,然后分组汇总各组观察单位数而得到的资料。数而得到的资料。v 无序
5、分类变量资料:无序分类变量资料: 若各类别之间无量的差别,若各类别之间无量的差别,汇总各类别的观察单位数而得到的资料,则称汇总各类别的观察单位数而得到的资料,则称 计数资料计数资料v 有序分类变量资料:有序分类变量资料: 若各类别之间有量的差别,若各类别之间有量的差别,汇总各类别的观察单位数而得到的资料,则称汇总各类别的观察单位数而得到的资料,则称 等级资料等级资料二、变量类型及处理二、变量类型及处理(三)变量的处理(三)变量的处理1、变量类型的转化:、变量类型的转化: 一种类型的变量可转一种类型的变量可转化为另一种类型的变量。但只能由高级向低级化为另一种类型的变量。但只能由高级向低级转化,即
6、按照连续型、有序、无序、二分类变转化,即按照连续型、有序、无序、二分类变量的顺序转化,不能作相反方向的转化。离散量的顺序转化,不能作相反方向的转化。离散型变量通过适当的变换或连续性校正后借用连型变量通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。续型变量或有序变量的方法来分析。二、变量类型及处理二、变量类型及处理(三)变量的处理(三)变量的处理2、分类变量的代码:、分类变量的代码: 输入计算机进输入计算机进行统计分析表示:如性别(男行统计分析表示:如性别(男 /女)、疾女)、疾病(有病(有 /无)、结局(存活无)、结局(存活 /死亡)等二分死亡)等二分类变量,采用代码类变量,
7、采用代码 0、 1表示,对于多分类表示,对于多分类变量,可以采用代码变量,可以采用代码 1、 2、 3、 4、 5 来来表示各个类别表示各个类别二、变量类型及处理二、变量类型及处理3、哑变量的设置:、哑变量的设置: 进行定量分析时,对于有进行定量分析时,对于有 g类类的多分类变量,需要用的多分类变量,需要用 g-1个取值为个取值为 0或或 1的哑变量来完的哑变量来完整地表达这些类别。整地表达这些类别。如治疗原发性高血压有中医、西医及中西医结如治疗原发性高血压有中医、西医及中西医结合三种不同的治疗方法,可用两个哑变量合三种不同的治疗方法,可用两个哑变量 X1、 X2表示表示,赋值方法为:,赋值方
8、法为: X1=(1 西医法,西医法, 0 其他其他 ), X2=(1 中西中西医结合法,医结合法, 0 其他其他 ),即,即 :(X1=0、 X2=0) 表示中医法表示中医法(X1=1、 X2=0) 表示西医法表示西医法(X1=0、 X2=1) 表示中西医结合法表示中西医结合法 二、变量类型及处理二、变量类型及处理返回目录1、资料类型的考察、资料类型的考察 v 若每个观察单位都有一个数值,而若每个观察单位都有一个数值,而无论这个数值是具有度量衡单位,还是无论这个数值是具有度量衡单位,还是没有度量衡单位的资料都是定量资料;没有度量衡单位的资料都是定量资料;v 若每个观察单位只有属性或类别之若每个观察单位只有属性或类别之分,而没有数值的资料都是定性资料。分,而没有数值的资料都是定性资料。三、 科研数据考察科研数据考察