1、第 1 章 绪论 思考与练习参考答案 一、最佳选择题 1. 研究中的基本单位是指 ( D )。 A样本 B. 全部对象 C影响因素 D. 个体 E. 总体 2. 从总体中抽取样本的目的是( B )。 A研究样本统计量 B. 由样本统计量推断总体参数 C研究典型案例 D. 研究总体统计量 . 计算统计指标 3. 参数是指( B )。 A 参与个体数 B. 描述总体特征的统计指标 C描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是( E )。 A白细胞计数 B住院天数 C门急诊就诊人数 D患者的病情分级 E. ABO 血型 5关于随机误差下列不正确的是 (
2、C )。 A受测量精密度限制 B无方向性 C. 也称为偏倚 不可避免 E. 增加样本含量可降低其大小 二、名称解释 (答案略) 1. 变量与随机变量 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 随机事件 7. 频率与概率 三、思考题 1. 生物统计学与其他统计学有什么区别和联系? 答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计 学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学
3、原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。 2. 某年级甲班、乙班各有男生 50 人。从两个班各抽取 10 人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么? 答:不能。因为,从甲、乙两班分别抽取的 10 人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的 一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。 3
4、. 某地区有 10 万个 7 岁发育正常的男孩,为了研究这些 7 岁发育正常男孩的身高和体重,在该人群中随机抽取 200 个 7 岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。 (1) 该研究中的总体是什么? 答: 某地区 10 万个 7 岁发育正常的男孩。 (2) 该研究中的身高总体均数的意义是什么? 答:身高总体均数 的意义是 : 10 万个 7 岁发育正常的男孩的平均身高。 (3) 该研究中的体重总体均数的意义是什么? 答:体重总体均数的意义是 : 10 万个 7 岁发育正常的男孩的平均体重 (4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标
5、。 ( 5)该研究中的样本是什么? 答:该研究中的样本是: 随机抽取的 200 个 7 岁发育正常的男孩。 (宇传华 方积乾) 第 2 章 统计 描述 思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是( E )。 A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为 1015组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值 E. 写组段,如“ 1.53, 35, 56.5,” 2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是( A )。 A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较 5年级小学生瞳距和他
6、们坐高的变异程度,宜采用( A )。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数 P2.5与 P97.5的间距 4. 均数 X 和标准差 S的关系是( A )。 A. S越小, X 对样本中其他个体的代表性越好 B. S越大, X 对样本中其他个体的代表性越好 C. X 越小, S越大 D. X 越大, S越小 E. S 必小于 X 5. 计算乙肝疫苗接种后血清抗 -HBs的阳转率,分母为( B )。 A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数 6. 某医院的院内感染率为 5.2人 /千人日,则这个相对数指标属
7、于( C )。 A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从 0开始的图形为( D )。 A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可 二、简答题 1. 对定量资料进行统计描述时,如何选择适宜的指标? 答:详见教材表 2-18。 教材 表 2-18 定量 资料统计描述常用的统计指标及其适用场合 描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 非对称分布;半定量资料;末端开 口资料;分布不明 众 数 频数最多的观察值
8、 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数 的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 非对称分布;半定量资料;末端开口资料;分布不明 变异系数 标准差与均数的相对比 不同量纲的变量间比较;量纲相同但 数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。 答: 2005年某医院为了调查肺癌患者接受姑息手术治疗 1年后的情况,被调查者 150人,分别有 30人病情稳定, 66人处于进展状态, 54人死亡。 当研究兴趣
9、只是了解死亡发生的情况,则只需计算死亡率 54/150=36%,属于频率指标 。当研究者关心患者所有可能的结局时,则可以算出反映 3种结局的频率分别为 20%、 44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。 两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。 3. 应用相对数时应注意哪些问题? 答:( 1)防止概念混淆 相对数的计算是 两
10、部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 ( 2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。 ( 3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 ( 4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表 2-20。 教材 表 2-20 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表 示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条
11、分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数 、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 三、计算题 1. 某内科医生调查得到 100名 4050岁健康男子总胆固醇( mg/dl),结果如下 227 190 2
12、24 259 225 238 180 193 214 195 213 193 209 172 244 199 155 208 203 199 253 181 196 224 210 220 255 257 216 249 235 220 190 203 197 149 175 236 202 209 174 184 174 185 167 235 167 210 171 248 201 266 189 222 199 197 214 199 198 230 246 209 202 186 217 206 200 203 197 161 247 138 186 156 195 163 273 1
13、78 190 207 259 186 194 246 172 234 232 189 172 235 207 208 231 234 226 174 199 278 277 181 ( 1) 编制频数表,绘制直方图,讨论其分布特征。 答:频数表见练习表 2-1。根据直方图(练习图 2-1),可认为资料为基本对称分布,其包络线见练习图 2-2。 练习表 2-1 某地 100名 40 50岁健康男子总胆因醇 /( mg dl-1) Frequency Percent Valid Percent Cumulative Percent Valid 130 145 160 175 190 205 220
14、 235 250 265280 Total 1 3 11 12 25 15 13 11 5 4 100 1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0 100.0 1.0 3.0 11.0 12.0 25.0 15.0 13.0 11.0 5.0 4.0 100.0 1.0 4.0 15.0 27.0 52.0 67.0 80.0 91.0 96.0 100.0 280260240220200180160140总胆固醇2520151050FrequencyM e a n = 2 0 7 . 4 1S t d . D e v . = 2 9 . 8 2
15、N = 1 0 0练习图 2-1 直方图 280260240220200180160140总胆固醇2520151050FrequencyM e a n = 2 0 7 . 4 1S t d . D e v . = 2 9 . 8 2N = 1 0 0练习图 2-2 包络线图 ( 2)根据( 1)的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度。 答:利用原始数据,求出算术均数 4.207X mg/dl 和标准差 8.29S mg/dl。 ( 3)计算 P25,P75和 P95。 答:利用原始数据,求出 P25=186.8 mg/dl, P75=229.3 mg/dl, P95=259.
16、0 mg/dl。 2. 某地对 120名微丝蚴血症患者治疗 3个疗程后,用 IFA间接荧光 抗体试验测得抗体滴度如下,求抗体滴度的平均水平。 抗体滴度 1:5 1:10 1:20 1:40 1:80 1:160 1:320 例 数 5 16 27 34 22 13 3 利用上述频数表,得平均滴度为 1:36.3。 3. 某地 1975 1980年出血热发病和死亡资料如教材表 2-21,设该地人口数在此 6年间基本保持不变。 教材 表 2-21 某地 6年间出血热的发病与死亡情况 年 份 发病数 病死数 1975 32 4 1976 56 5 1977 162 12 1978 241 13 19
17、79 330 10 1980 274 5 试分析: ( 1)粗略判断发病率的变化情况怎样。 答:该地人口数在此 6年间基本保持不变,发病人数在 1979年前逐年上升, 1980年略有下降。可以认为发病率大致呈上升趋势, 1980年略有下降。 ( 2)病死率的变化情况怎样? 答: 病死率由各年度病死数除以发病数获得,病死率依次为 12.5%、 8.9%、 7.4%、 5.4%、3.0%和 1.8%,呈逐年下降趋势。 ( 3)上述分析内容可用什么统计图绘制出来? 答:由于没有给出该地人 口数,故不能计算发病率,可用普通线图表示发病数变化情况。病死率的下降情况可以用普通线图表示,下降速度则可以用半对
18、数线图表示。 ( 4)评述该地区出血热防治工作的效果。 答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高(体现在病死率下降)。 (张晋昕) 第 3 章 概率分布 思考与练习参考答案 一、最佳选择题 1. 某资料的观察值呈正态分布,理论上有( C )的观察值落在 SX 96.1 范围内。 A. 68.27% B. 90% C. 95% D. 99% E. 45% 2. 正态曲线下,从均数 到 64.1 的面积为( A )。 A. 45% B. 90% C. 95% D. 47.5% E. 99% 3. 若正常人的血铅含量 X 近似服从对数正态分布,则制定 X 的 95%参考值范围,最好采
19、用(其 中 XY lg , YS 为 Y 的标准差)( C )。 A. 1.96XS B. 5.975.2 PP C. )64.1(lg 1 YSY D. )69.1(lg 1 YSY E. 955PP 4. 在样本例数不变的情况下,若( D ),则二项分布越接近对称分布。 A. 总体率 越大 B. 样本率 p 越大 C. 总体率 越小 D. 总体率 越接近 0.5 E. 总体率 接近 0.1 或 0.5 5. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从( D )。 A. 二项分布 B. 正态分布 C. 偏态分布 D. Poisson 分布 E. 对称分布 6. Poisson 分布
20、的均数 与标准差 的关系是( E )。 A. B. C. D. E. 2 二、思考题 1. 服从二项分布及 Poisson 分布的条件分别是什么? 简答:二项分布成立的条件: 每次试验只能是互斥的两个结果之一;每次试验的条件不变;各次试验独立。 Poisson 分布成立的条件:除二项分布成立的三个条件外,还要求试验次数 n 很大,而所关心的事件发生的概率 很小。 2. 二项分布、 Poisson 分布分别在何种条件下近似正态分布 ? 简答: 二项分布的正态近似:当 n 较大, 不接近 0 也不接近 1 时,二项分布 B( n , )近似正态分布 N( n , )1( n )。 Poisson
21、分布的正态近似: Poisson 分布 )( ,当 相当大时( 20),其分布近似于正态分布。 三、计算题 1. 已知某种非传染性疾病常规疗法的有效率为 80%,现对 10 名该 疾病患者用常规疗法治疗,问至少有 9 人治愈的概率是多少? 解: 对 10 名该疾病患者用常规疗法治疗, 各人间对药物的反应具有独立性,且每人服药后 治愈 的概率均可视为 0.80,这相当于作 10 次独立重复试验,即 =0.80, n=10 的贝努利试验,因而治愈的人数 X 服从二项分布 0.80) (10,B 。 至少有 9 人治愈的概率为: 8 0 1010 )801(80C1)19(1)9( k kkk .X
22、PXP 3 7 . 5 8 %83750262401 . 至少有 9 人治愈的概率是 37.58%。 或者 )10()9()9( XPXPXP 010101019910 )801(80C)801(80C . 53780. 2. 据以往的统计资料,某地新生儿染色体异常率为 1%,问 100 名新生儿中染色体异常不少于 2 名的概率是多少? 解: )12(12)( XPXP 1)(0)(1 XPXP = 2 6 . 4 2 %0 . 2 6 4 20 . 3 6 7 90 . 3 6 7 91e!11e!011 1110 3. 调查某市 2000 年 110 名 20 岁男性青年的身高( cm)资
23、料如下: 173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5 168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2 170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5 166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5 181.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 1
24、73.1 176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8 178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2 168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0 175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6 175.8 164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 1
25、70.6 173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2 ( 1)试估计当年该市 20 岁男性青年中,身高在 175.0178.0( cm)内的占多大比例? ( 2)估计当年该市 95%以及 99%的 20 岁男青年身高范围。 ( 3)若当年由该市随机抽查 1 名 20 岁男青年,试估计其身高超过 180 cm 的概率。 解:用 SPSS 计算本题。 数据文件: data3-n.sav。 数据格式:数据库 2 列 110 行,变量 n 为男性青年序号 , x 表示身高 。 操作步骤: 操作 说明 Analyze Descr
26、iptive Statistics Descriptives Options Mean Std. Deviation Continue Variables: x OK 调用 Descriptives 过程 计算得均数 =174.766,标准差=4.150 9 Transform Compute 调 用 “ 变 量 计 算 (Compute Variable)”对话框 Target Variable P 定义目标变量“ P” Numeric Expression: CDF.NORMAL(178.0,174.766,4.1509)-CDF. NORMAL(175.0,174.766,4.1509)
27、 OK 当年该市 20 岁男性青年中,身高在 175.0178.0 cm内的 比例 Target Variable x1 该市 95%以及 99%的 20 岁男青年身高范围 间的比例 Numeric Expression: 174.766-1.96*4.1509 OK Target Variable x2 Numeric Expression: 174.766+1.96*4.1509 OK Target Variable x3 Numeric Expression: 174.766-2.58*4.1509 OK Target Variable x4 Numeric Expression: 174.766+2.58*4.1509 OK