1、医学科研和论文撰写中常用的数据处理和统计分析方法重庆市卫生信息中心 孙安龙2012.10.241企业资料企业资料目录 前言 医学统计方法的基本概念 常用医学统计方法的适用条件 医用期刊对医学统计学的要求 医学统计在期刊中的正确表达医学科研论文中的常见的统计学问题 数据的正确书写2企业资料企业资料前言 卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法,而统计方法的正确与否直接影响到论文的质量。 我们在编审稿件过程中,经常遇到统计学方法使用不当等问题。 3企业资料企业资料几个基本概念变量 :数值变量(定量变量)、分类变量(定性变量):无序分类、有序分类(等级 /半定量
2、)概率 :随机事件、概率、频率与概率的关系(样本含量大到总体时,频率就等于概率) 总体与 样本 :总体、样本、参数4企业资料企业资料数学上的分类q连续型资料 (continuous data) : 计量资料实数范围内任意取值q离散型资料 (discrete data)实数范围内只取整数值计数资料离散型计量资料如:脉搏次数 /分;人数 /家庭;白细胞计数 /L连续型变量: 即连续变化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重。离散型变量: 其取值是 0, 1, 2等不连续的量,是数轴上有限或无限的可数的值,两个数之间没有小数。如年新生儿数、月手术病人数、人的
3、牙齿数等。5企业资料企业资料变量转化只能由高级向低级转化,即从计量资料至等级资料至计数资料,但不能做相反方向的转化。提示:在研究设计中,对于能测量的指标,尽可能设计为定量指标,尽可能减少信息量的损失,并为分析过程中资料转化带来方便。定性指标可转化为定量指标,但较粗糙 。6企业资料企业资料概率概率 : 随机事件发生可能性大小的度量。当 n逐渐增大时,频率 f/n始终在一个常数左右作微小摆动,称该常数为随机事件 A的 概率,记为: P(A)只要观察单位数足够多,可将频率作为概率的估计值。0 P 1, P=1 必然事件, P=0 不可能事件。小概率事件:小概率事件: P 0.05,表示在一次实验或观
4、察中该事件发生的可能性很小。小概率原理:小概率原理: 小概率事件在一次实验或抽样中不可能发生,如果发生就怀疑检验假设的正确性。7企业资料企业资料抽样方法 简单随机抽样:从总体抽取样品时,使每个个体被抽到的机会均等,以使所抽取的样本数据能够很好地代表总体的抽样方法。(简单 /单纯):抽签法、随机数表法 系统随机抽样(间隔):将总体按某一标志(如时间)排序,然后按一定间隔抽取样本单位。 分层随机抽样:将总体按产品的某些特征划分为若干层(即小批),各层内分别用简单随机抽样法抽取一定数量的个体组成一个样本的方法。分层按比例随机抽样。 整群抽样法:先将总体按某个标志分成若干群,然后随机地抽取若干群,并由
5、抽中的群中所有个体组成样本。8企业资料企业资料几种常见的分布 分类变量的分布类型 二项分布:观察单位具有互相对立的一种结果,观察单位的观察结果相互独立(如:治愈 /未治愈、传染 /未传染) Poisson分布:二项分布的极限分布和特例,某事件发生率非常小时(小概率事件),则事件发生数 X所服从的概率分布 超几何分布: 数值变量的分布类型 正态分布 Weibull分布9企业资料企业资料t检验、 u检验 数值变量资料假设检验的最基本最简单的方法: t检验、 u检验; 仅适用于两个样本均数的比较 t检验的应用条件:样本含量较小( n30)或样本含量虽小但总体标准差已知时样本均数与已知总体均数的比较及成组设计两大样本均数的比较 应用 样本均数与已知总体均数 配对设计资料 成组设计资料两均数间10企业资料企业资料