1、 1 医学统计学课后习题答案 第一章 医学统计中的基本概念 练 习 题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E 有变异的医学事件 2. 用 样本 推论总体,具有代表性的样本 指 的是 A总体中 最容易获得 的 部分个体 B 在 总体中随意 抽取 任意 个体 C 挑选 总体中的 有代表性的部分个体 D 用配对方法抽取的部分个体 E 依照随机原 则抽取总体中 的部分个体 3. 下列 观测结果 属 于 等级资料的是 A 收缩压测量值 B 脉搏数 C住院天数 D 病情程度 E 四种血型 4. 随机误
2、差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E 仪器故障误差 答案 : E E D E A 二、简答题 常见的三类误差是什么?应采取什么措施和方法加以控制? 参考答案 常见的三类误差是: ( 1) 系统误差 :在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 ( 2)
3、随机测量误差 :在收集原始资料过程中,即使仪器初始 状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。 ( 3) 抽样误差 :即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间 仍可能有差异。这种差异是由抽
4、样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 抽样中要求每一个样本应该具有哪三性? 参考答案 2 从总体中抽取样本,其样本应具有 “ 代表性 ” 、 “ 随机性 ” 和 “ 可靠性 ” 。 ( 1)代表性 : 就是要求样本中的每一个个体必须符合总体的规定。 ( 2)随机性 : 就是要保证总体中的每个个体均有相同的几率被抽作样本。 ( 3)可靠性 : 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异 , 只有观察一定数量的个体方能体现出其客观规 律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难
5、,所以应以 “ 足够 ” 为准。需要作 “ 样本例数估计 ” 。 什么是两个样本之间的可比性? 参考答案 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣 ) 第二章 集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资 料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 C. 均数 D. 95P 百分位数 E. 频数分布 2. 算术均数 与 中位数相比, 其特点是 A不易受极端值的影响 B 能 充分利用数据 的 信息 C抽样误差 较 大 D更适用于偏态分布
6、资料 E更适用于分布不明确资 料 3. 一组原始数据呈正偏态分布 , 其数据的特点是 *正的反而小! A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成 频数表 的主要目的是 A化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征 5. 6人接种流感疫苗一个月后测定抗体滴度为 1: 20、 1: 40、 1: 80、 1: 80、 1:160、 1: 320,求平均滴度应选用的指标是 A. 均数 B. 几何均数 C. 中位数 D.
7、百分位数 E. 倒数的均数 答案 : A B D E B 二、计算与分析 1. 现测得 10名乳腺癌患者化疗后血液尿素氮的含量 (mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数 和 中位数。 参考答案 3 3 . 4 3 + 2 . 9 6 + 4 . 4 3 + 3 . 0 3 + 4 . 5 3 + 5 . 2 5 + 5 . 6 4 + 3 . 8 2 + 4 . 2 8 + 5 . 2 5 4 . 2 6 ( m m o l / L )10X 4 . 2 8 + 4 . 4 34 . 3 6 ( m
8、m o l / L )2M 2. 某地 100例 30-40岁健康男子血清总胆固醇值( mg/dl)测定结果如下: 202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 22
9、1 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156 ( 1)编制频 数分布表并画出直方图; ( 2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适; ( 3)计算百分位数 5P 、 25P 、 75P 和 95P 。 参考答案 ( 1) 编制 频数表: 某地 100例 30-40岁健康男子血清总胆固醇值 的频数表 甘油三脂 (
10、mg/dL) (1) 频数 (2) 累积频数 (3) 累积频率 (4) 110 2 2 2 125 4 6 6 140 11 17 17 155 16 33 33 170 27 60 60 185 12 72 72 200 13 85 85 215 7 92 92 230 5 97 97 245 3 100 100 合计 100 画直方图: 4 051015202530110 125 140 155 170 185 200 215 230 245胆固醇含量频数图 某地 100例 30-40岁健康男子血清总胆固醇值的频数分布 ( 2)计算均数和中位数: ( 1 1 0 + 7 . 5 ) 2 +
11、 ( 1 2 5 + 7 . 5 ) 4 + ( 2 4 5 + 7 . 5 3 1 8 2 . 9 ( m g / d l )100X ) 50 1 0 0 0 . 5 3 31 7 0 1 5 1 7 9 . 4 m g / d l27MP ( ) 从上述直方图能够看出:此计量指标近似服从正态分布,选用 算术均数 较为合适。 (算术均数适合描述分布对称的数据) ( 3) 计算百分位数 : 5 1 0 0 0 . 0 5 21 2 5 1 5 1 3 6 . 2 5 m g / d l 4P ( ) 25 1 0 0 0 . 2 5 1 71 5 5 1 5 1 6 2 . 5 m g /
12、d l16P ( ) 75 1 0 0 0 . 7 5 7 22 0 0 1 5 2 0 3 . 5 m g / d l13P ( ) 95 1 0 0 0 . 9 5 9 22 3 0 1 5 2 3 9 m g / d l5P ( ) 3 测得 10名肝癌病人与 16名正常人的血清乙型肝 炎表面抗原 (HBsAg)滴度如下表,试分别计算它们的平均滴度。 肝癌病人与正常人的血清乙肝表面抗原 (HBsAg)滴度 滴度倒数 正常人数 肝癌病人数 8 7 1 16 5 2 32 1 3 64 3 2 128 0 1 5 256 0 1 参考答案 肝癌病人与正常人的血清乙肝表面抗原 (HBsAg)滴
13、度 测定结果 滴度倒数 (X) 正常人数 ( 1f ) 肝癌病人数 ( 2f ) lgx 1f lgx 2f lgx 8 7 1 0.90 6.30 0.90 16 5 2 1.20 6.00 2.40 32 1 3 1.50 1.50 4.50 64 3 2 1.81 5.43 3.62 128 0 1 2.11 0.00 2.11 256 0 1 2.41 0.00 2.41 合计 16 10 - 19.23 15.94 11 19.23lg 1 5 .9 216G 12 15.94lg 39.2 610G 正常人 乙肝表面抗原 (HBsAg)滴度 为 1: 15.92 肝癌病人 乙肝表面
14、抗原 (HBsAg)滴度 为 1: 39.26 (李 康) 离散程度的统计描述 练 习 题 一、单项选择题 1. 变异系数 主要用于 A比较不同计量指标的变异程度 ( ps 比较相同计量单位数据变异度大小的是 标准差) B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似 正态分布 的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差 3. 某项指标 95%医学参考值范围表示的是 A. 检测指标在此范围,判断 “ 异常 ” 正确的概率大于或等于 95%
15、B. 检测指标在此范围,判断 “ 正常 ” 正确的概率大于或等于 95% C. 在 “ 异常 ” 总体中有 95%的人在此范围之外 D. 在 “ 正常 ” 总体中有 95%的人在此范围 E. 检测指标若超出此范围,则有 95%的把握说明诊断对象为 “ 异常 ” 4应用百分位数法估计参考值范围的条件是 A 数据服从正态分布 B 数据服从偏态分布 C 有大样本数据 D 数据服从对称分布 E 数据变异不能太大 5已知动脉硬化患者载脂蛋白 B的含量 (mg/dl)呈明显 偏态分布 ,描述其个体差6 异的统计指标应使用 A 全距 B 标准差 C 变异系数 D 方差 E 四分位数间距 答案: A E D
16、B E 二、计算与分析 1. 下 表 为 10例垂体催乳素微腺瘤的病人手术 前 后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。 表 手术前后患者血催乳素浓度( ng/ml) 例号 血催乳素浓度 术前 术后 1 276 41 2 880 110 3 1600 280 4 324 61 5 398 105 6 266 43 7 500 25 8 1760 300 9 500 215 10 220 92 参考答案 血催乳素浓度术前均值 672.4 ng/ml,术后均值 127.2 ng/ml。 手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适 。
17、术前: 672.4X , 564.65S 5 6 4 .6 5 1 0 0 % 8 3 .9 8 %6 7 2 .4CV 术后: 127.2X , 101.27S 1 0 1 . 2 71 0 0 % 7 9 . 6 1 %1 2 7 . 2CV 可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。 2. 某地 144例 30 45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为 0.85mmol/L的正态分布 。 试估计该地 30 45岁成年男子血清总胆固醇的 95%参考值范围; 血清总胆固醇大于 5.72mmol/L的正常成年男子约占
18、其总体的百分之多少? 参考答案 正常成年男子的 血清总胆固醇 测量值近似服从正态分布,故可按正态分布法处理。又因 血清总胆固 醇 测量值过高或过低均属异常,所以应计算双侧参考值范围。 下限: 1 . 9 6 4 . 9 5 1 . 9 6 0 . 8 5 3 . 2 8XS (mol/L) 上限: 1 . 9 6 4 . 9 5 1 . 9 6 0 . 8 5 6 . 6 2XS (mmol/L) 即该地区成年男子 血清总胆固醇 测量值的 95%参考值范围为 3.28 mmol/L 6.62 7 mmol/L。 该地 正常成年男子的血清总胆固醇测量值近似服从均数为 4.95mmol/L,标准差
19、为 0.85mmol/L的正态分布 ,计算 5.72mmol/L对应的标准正态分布 u 值: 5 .7 2 4 .9 5 0 .9 10 .8 5u 问题转化为求 u 值大于 0.91的概率。由于标准正态分布具有对称性,所以 u 值大于 0.91的概率与 u 值小于 0.91的概率相同。查附表 1得, ( ) 0.1814u ,所以说 血清总胆固醇大于 5.72mmol/L的正常成年男子约占其总体的 18.14%。 3. 某地 200例正常成人血铅含量的频数分布如 下表 。 ( 1)简述该资料的分布特征 。 ( 2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值
20、的 95%参考值范围。 表 某地 200例正常成人血铅含量 (mol/L)的频数分布 血铅含量 频 数 累积频数 0.00 7 7 0.24 49 56 0.48 45 101 0.72 32 133 0.96 28 161 1.20 13 174 1.44 14 188 1.68 4 192 1.92 4 196 2.16 1 197 2.40 2 199 2.64 1 200 参考答案 ( 1) 从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。 某地 200例正常成人血铅含量
21、(mol/L)的频数分布 血铅含量 组中值 频 数 累积 频数 累积频率 0.00 0.12 7 7 3.5 0.24 0.36 49 56 28.0 0.48 0.60 45 101 50.5 0.72 0.84 32 133 66.5 0.96 1.08 28 161 80.5 1.20 1.32 13 174 87.0 1.44 1.56 14 188 94.0 1.68 1.80 4 192 96.0 1.92 2.04 4 196 98.0 2.16 2.28 1 197 98.5 2.40 2.52 2 199 99.5 2.64 2.76 1 200 100 8 ( 2)因为正常
22、人血铅含量越低越好,所以应计算单侧 95%参考值范围。 百分位数法:第 95%百分位数位于 1.68 组段,组距为 0.24,频数为 4,该组段以前的累积频数为 188,故 95 ( 2 0 0 0 . 9 5 1 8 8 )1 . 6 8 0 . 2 4 1 . 8 0 ( m o l / L )4P 即 该地正常成人血铅值的 95%参考值范围 为小于 1.80mol/L 。 正态分布法:将组中值进行 log变换,根据题中表格,得到均值和标准差计算表。 某地 200例正常成人血铅含量 (mol/L )均值和标准差计算表 血铅含量 组中值 lg组 中 值 (x ) 频 数 (f ) 0.00
23、0.12 -0.92 7 -6.44 5.9248 0.24 0.36 -0.44 49 -21.56 9.4864 0.48 0.60 -0.22 45 -9.9 2.178 0.72 0.84 -0.08 32 -2.56 0.2048 0.96 1.08 0.03 28 0.84 0.0252 1.20 1.32 0.12 13 1.56 0.1872 1.44 1.56 0.19 14 2.66 0.5054 1.68 1.80 0.26 4 1.04 0.2704 1.92 2.04 0.31 4 1.24 0.3844 2.16 2.28 0.36 1 0.36 0.1296 2.
24、40 2.52 0.40 2 0.80 0.3200 2.64 2.76 0.44 1 0.44 0.1936 合计 200 -31.52 19.8098 计算均值和标准差: 3 1 .5 2 0 .1 5 7 6200X 219. 809 8 ( 31. 52) 2000.2731200 1S 单侧 95%参考值范围: 1 . 6 5 0 . 1 5 7 6 1 . 6 5 0 . 2 7 3 1 0 . 2 9 3 0XS 1lg (0 .2 9 3 0 ) 1 .9 6 ( m o l/ L) 即 该地正常成人血铅值的 95%参考值范围 为小于 1.96mol/L ,与百分位数法相比两者
25、相差不大。 (李 康) 第四章 抽样误差与假设检验 练习题 一、单项选择题 9 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 (标准误反映抽样误差的大小,正) 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体 , 当样本含量足够大时 , 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布
26、 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参 数是否不同 D. 检验总体参数是否不同 E. 检验样本的 P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的 95%可信区间为 7.2 109/L 9.1109/L,其含义是 A. 估计总体中有 95%的观察值在此范围内 B. 总体均数在该区间的概率为 95% C. 样本中有 95%的观察值在此范围内 D. 该区间包含样本均数的可能性为 95% E. 该区间包含总体均数的可能性为 95% 答案: E D C D E 二、计算与分析 为了解某地区小学生血红蛋白含量的平均水平
27、,现随机抽取该地小学生 450人,算得其血红蛋白平均数为 101.4g/L,标准差为 1.5g/L,试计算该地小学生血红蛋白平均数的 95%可信区间。 参考答案 样本含量为 450,属于大样本,可采用正态近似的方法计算可信区间。 101.4X , 1.5S , 450n , 1 .5 0 .0 7450X SS n 95%可信区间为 下限: /2 . 1 0 1 . 4 1 . 9 6 0 . 0 7 1 0 1 . 2 6XX u S (g/L) 上限: /2 . 1 0 1 . 4 1 . 9 6 0 . 0 7 1 0 1 . 5 4XX u S (g/L) 即该地成年男子红细胞总体均数
28、的 95%可信区间为 101.26g/L 101.54g/L。 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得 100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为 30mg/dl。问题: 如何衡量这 100名儿童总胆固醇样本平均数的抽样误差? 估计 100名儿童的胆固醇平均水平的 95%可信区间; 根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 参考答案 均数的标准误可以用来衡量样本均数的抽样误差大小,即 10 30S mg/dl, 100n 30 3 .0100X SS n 样本含量为 100,属于大样本,可
29、采用正态近似的方法计算可信区间。 207.5X ,30S , 100n , 3XS ,则 95%可信区间为 下限: /2 . 2 0 7 . 5 1 . 9 6 3 2 0 1 . 6 2XX u S ( mg/dl) 上限: /2 . 2 0 7 . 5 1 . 9 6 3 2 1 3 . 3 8XX u S ( mg/dl) 故该地 100名儿童的胆固醇平均水平的 95%可信区间为 201.62mg/dl213.38mg/dl。 因为 100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的 95%可信区间的下限高于正常儿童的总胆固醇平均水平 175mg/dl,提示患心脏病且胆固醇高的父辈
30、,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。 (李 康) 第五章 t检验 练 习 题 一、单项选择题 1. 两样本均数比较 ,检验结果 05.0P 说明 A. 两总体均数的差别较小 B. 两总体均数的差别较大 C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 E. 可以确认两总体无差别 2. 由两样本均数的差别推断两总体均数的差别 , 其差别有统计学意义是指 A. 两样本均数的差别具有实际意义 B. 两总体均数的差别具有实际意义 C. 两样本和两总体均数的差别都具有实际意义 D. 有理由认为两样本均数有差别 E. 有理由认为两总体均数有差别 3. 两样本均数比较 ,差别
31、具有统计学意义时 ,P值越小说明 A. 两样本均数差别越大 B. 两总体均数差别越大 C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 E. 越有理由认为两样本均数相同 4. 减少假设检验的类误差,应该使用的方法是 A. 减少类错误 B. 减少测量的系统误差 C. 减少测量的随机误差 D. 提高检验界值 E. 增加样本含量 5两样本均数比较的 t检验和 u检验的主要差别是 A. t检验只能用于小样本资料 B. u检验要求大样本资料 C. t检验要求数据方差相同 D. t检验的检验效能更高 E. u检验能用于两大样本均数比较 答案: D E D E B 二、计算与分析 1. 已知正常成年男子血红蛋白均值为 140g/L,今随机调查某厂成年男子 60人,