1、统计学基础和 Epicalc软件应用安徽省疾病预防控制中心一、卫生统计基本知识 总体和样本 总体 (population) : 具有相同性质或属性的个体所组成的集合。 样本 (sample):从总体中抽出若干个体所构成的集合。计量资料、计数资料、等级资料 1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料( measurement data)。其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高( cm)、体重 (kg)、红细胞。 2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料( count data)。计数资料亦称
2、定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的 A、 B、 AB、 O 四种血型的人数等。 3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料( ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、 +、 +等。统计描述和统计推断 统计描述:对一个特定群体(总体、样本)的记录和
3、表达。( 1)数据资料的整理( 2)数据资料特征的计算( 3)概率分布和抽样分布 统计推断:根据样本资料的特性,对总体的特征进行预测和估计。t检验、 2 检验 、 F检验 、非参数检验常用的统计指标和统计量集中趋势的统计指标 算术均数( Mean):一般用于对称分布资料,特别是正态分布资料; 几何均数( G):常用于样本含有多个数量级的资料; 中位数( Median):常用于非正态和总体分布未知的资料; 百分位数( Px):常用于非正态态和总体分布未知的资料。离散趋势的统计指标 极差( R): R=最大值 -最小值 四分位间距( Q): Q= P75-P25, Q越大,变异越大。 方差( Va
4、riance) 标准差( Std)相对数 Rate(率): 指在某一确定人群中某些事件发生的频率。一个率由分子 (发生数 )、分母 (可能发生的总数 )、事件发生的特定时间和乘数组成。 Porprotion(比例): 是表示同一事物局部与总体之间数量上的比值 。 Ratio(比): 是两个变量的数值之商,表示分子和分母之间的数量关系。 流行病学指标 比值比( Odds Ratio): 某事物发生的可能性与不发生的可能性之比。 相对危险度( RR): RR表明暴露组发病或死亡的危险是非暴露组的多少倍。 率差( RD) :是暴露组发病率与对照组发病率相差的绝对值 。常见的概念分布 连续性资料正态分布、偏态分布等 分类资料二项分布、 Poission分布等常见的统计方法 1、 Z检验:率的检验,总体方差已知 。 2、卡方检验:分类资料。用于率的检验、拟合优度检验、关联性检验等。 3、 t检验: 2组样本均数间比较 , 连续性资料,服从正态分布。 4、 方差分析:多组样本均数比较,连续性资料,服从正态分布 5、 非参数检验:非正态资料或总体分布未知的资料