1、第三篇第三篇 医学统计学方法医学统计学方法 Statistical Methods in Medicine1第九章 数值变量资料的统计分析第九章 数值变量资料的统计分析第一节第一节 数值型资料的统计描述数值型资料的统计描述第二节第二节 正态分布和参考值范围的估计正态分布和参考值范围的估计第三节第三节 数值型资料的统计推断数值型资料的统计推断第四节第四节 t检验和检验和 u检验检验第五节第五节 方差分析方差分析2terminologystatistical description 统计 描述statistical inference 统计 推断parameter estimation 参数估 计
2、Frequency distribution 频 数分布frequency table 频 数表arithmetic Mean, average 算 术 平均 值standard deviation 标 准差variance 方差range 极差,全距,范 围geometric mean 几何平均 值median 中位数normal distribution 正 态 分布reference range 参考 值 范 围3统计分析包括 统计描述 和 统计推断 两大部分。l统计描述 (statistical description)是用统计指标、统计表和统计图描述资料的分析规律及其数量特征;l统计
3、推断 (statistical inference) 包括总体参数估计和假设检验两个内容。参数估计 :是用样本统计量估计总体参数所在范围。假设检验 :是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。 4第一节第一节 数值型变量资料的统计描述数值型变量资料的统计描述例 9.1 2002年某市 150名 2029岁正常男子的尿酸浓度 (mol/L) , 资料见表 9-1。 如何进行统计描述?5362.6 359.7 285.9 300.2 333.6 334.0 288.8 338.5 341.9 344.6 3375 298.3364.2 367.1 338.1 316.9
4、332.7 324.0 282.6 369.8 398.7 338.7 308.9 392.1368.7 352.6 378.2 346.1 278.6 318.3 323.2 322.6 382.1 322.6 309.6 352.0372.5 399.8 335.6 341.1 371.0 355.9 362.7 368.1 332.4 405.6 328.8 358.8405.9 362.7 316.3 338.7 402.6 379.4 329.6 354.6 331.4 349.6 419.5 324.6329.8 357.8 312.0 313.6 338.7 328.6 291.
5、3 329.7 361.8 392.4 414.9 319.7327.6 395.8 358.9 289.4 366.2 387.4 298.4 408.7 389.8 362.5 354.9 352.7316.6 348.9 348.7 401.6 334.6 308.9 367.0 345.6 401.6 357.1 304.6 338.5388.2 355.8 329.4 321.1 320.4 313.5 339.8 409.4 387.4 378.5 392.0 352.7376.2 388.4 344.6 308.6 347.0 428.7 369.1 311.4 376.3 34
6、9.4 289.2 366.8371.0 387.5 413.6 348.7 392.7 401.0 313.6 366.8 387.2 319.7 329.4 357.5348.5 346.8 406.6 357.6 338.7 341.6 349.8 289.4 366.2 357.5 298.4 336.8387.5 342.3 366.7 387.6 332.7 324.0表 9-1 2002年某市 150名 2029岁正常男子的尿酸浓度 (mol/L)6统计描述的内容:一、制频数 (分布 ) 表 (表 9-2)和频数分布图 (图 9-1)频数表的用途(1) 揭示资料的分布特征和分布类
7、型(2) 便于发现某些特大或特小的可疑值(3) 便于进一步计算 统计 指标和统计分析处理二、计算统计指标(1) 计算平均值 代表一组资料的平均水平;(2) 计算标准差 -反映资料的离散程度。三、绘制统计表和统计图 7一、编制频数分布表:制表步骤:(1)求 极差 或全距 (range): R=Xmax Xmin本例, R=428.7 278.6 150.1(mol/L)。(2)决定组数、组段数和划分组距 (class interval):根据样本含量的多少确定组数,一般设 8 15组。组段数 =取整 (极差 /组数 )。本例:组段数 =取整 (150.1/10)=15.0115划分组距:每组段的
8、起点和终点分别称为 下界 和 上界 。组距:本组内 的 上界和下界 之差。组 段的划分270 285 300 315 330 345 360 375 390 405 4204351 2 3 4 5 6 7 8 9 10 118(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算机将原始数据汇总,得出各组段中所包含的观察例数,即为频数,如表 9-2的第 (2)栏。将各组段及其相应的频数列成表格,即为频数表(frequency table), 如 表 9-2。所绘的图形见图 9-1。表 9-2 2002年某市 150名 2029岁正常男子的尿酸 浓 度的 频 数分布尿酸 浓 度(mol/L)频 数 频 率 (%)270 2 1.33285 9 6.00300 11 7.33315 22 14.67330 24 16.00345 27 18.00360 20 13.33375 15 10.00390 11 7.33405 8 5.33420435 1 0.67合 计 150 100.009资料的分布类型:1. 对称分布或正态分布;2. 偏态分布:高峰在左侧或右侧;3. 不规则分布:分布很散,无明显高峰10