统计学试题及其参考答案.doc

上传人:坚持 文档编号:2099969 上传时间:2019-04-24 格式:DOC 页数:16 大小:204.50KB
下载 相关 举报
统计学试题及其参考答案.doc_第1页
第1页 / 共16页
统计学试题及其参考答案.doc_第2页
第2页 / 共16页
统计学试题及其参考答案.doc_第3页
第3页 / 共16页
统计学试题及其参考答案.doc_第4页
第4页 / 共16页
统计学试题及其参考答案.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、统计学习题参考答案(因为时间匆忙错误难免,敬请谅解。感谢朱卫忠、李欣荣、朱志红、过晓强等同学的辛勤付出)名词解释1【频率与概率】:在重复多次后,出现“正面” (或“反面” )这个结果的比例称之为频率。概率是描述随机事件发生可能性大小的一个度量。设在相同条件下,独立地重复 n 次实验,随机事件 A 出现 f 次,则称 f/n 为随机事件 A 出现的频率。当 n 逐渐增大时,频率 f/n 始终在一个常数左右作微小摆动,则称该常数为随机事件 A 的概率,可记为 P(A) ,简记 P。 P42【正态曲线】:是一条中央高,两侧逐渐下降、低平,两端无限延伸,与横轴相靠而不相交,左右完全对称的钟形曲线,称为

2、正态曲线。P20-百度3【相关系数】:又称 pearson 积差相关系数,以符号 r 表示样本相关系数,符号表示其总体相关系数。它用来说明具有直线关系的两变量间相关的密切程度与相关方向。P1564【变异系数】:记为 CV,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。实质上是一个相对变异指标,无单位。P205【假设检验中的 P 值】:从假设检验的整个逻辑推理过程可看出, P 的含义是指从 H0 规定的总体中随机抽样,抽得等于及大于或(和)等于及小于现有样本获得的检验统计量(如 t、u 等)值得概率。P366【抽样误差】:由个体变异

3、产生、随机抽样造成的样本统计量与总体参数的差异,称为抽样误差。P277【可信区间】:可信区间的确切含义为从固定样本含量的已知总体中进行重复随机抽样试验,根据每个样本可算得一个可信区间,则平均有 1- 的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为 1-。P338【决定系数】:定义为回归平方和与总平方和之比。P1589【检验效能】:1- 称为检验效能,过去称为把握度。其意义为当两总体确有差异,按规定检验水准 所能发现该差异的能力。P4310【参考值范围】参考值范围也称为正常值范围,是指绝大多数“正常人”的某指标值范围。这里的“绝大多数”可以是 90、95、99等,最常用的是95。所

4、谓“正常人”不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。P23-百度选择题(红色答案为标准答案)1. 成组设计的方差分析中,必然有: D A.SS 组内 r0.05(n-2)时,可认为两变量 X 与 Y 间: D A.有一定关系 B.有正相关关系C.一定有直线关系 D.有直线关24. Y=14+4X 是 1-7 岁儿童以年龄 (岁)估计体重 (市斤)的回归方程,若体重换成公斤,则此方程: C A.截距改变 B.回归系数改变C.两者都改变 D.两者都不改变25.四格表的自由度为: B A.不一定等于 1 B.一定等于 1C.样本含量减 1 D.等于行数列数26.同一双变量

5、资料进行直线相关与回归分析,有: B A. r0, b0, b0C. r0 D .r=b27. 计算相对数的目的是: A A.为了表示实际水平 B.为了便于比较C.为了表示绝对水平 D.为了说明数据大小28.已知总体均数和标准差,要推断某一样本含量为 100,样本代表的总体是否与已知总体相同,该用什么方法? B A .t 检验 B. u 检验 C.X2 检验 D. t,u 检验均可29.经临床观察 80 例自发性气胸患者,病变结果是:肺部无病变 25 例(31.25%) 肺结核 23 例(28.75%),肺气肿 20 例(25%), 哮喘 6 例(7.5%),肺炎 4 例(5%),肺癌 2 例

6、(2.5%),对此资料,可用( ) 来表达: C A.直方图 B.直条图 C.构成图 D.线图30.欲比较甲,乙两矿工人矽肺患病的严重程度,但甲,乙两矿工人的工龄分布不同,此时适当的比较方法是: D A. 分工龄进行比较 B.用两个率比较的 X2 检验C.不具可比性,不能比较 D.对工龄进行标化后再比较简答题:1. 描述集中趋势的指标有哪些?其适用范围有何异同?P14-16答:常用的有算数均数、几何均数和中位数。算数均数,可用于反映一组对称分布的变量值在数量上的平均水平。几何均数,可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学上常适用于免疫学的指标。中位数,适用于各种分

7、布类型的资料,尤其是偏态分布资料和一端或两端无确切数值的资料。百分位数,重要用途是确定医学参考值范围。2 标准化的意义是什么?P81答:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。3 常用相对数的指标有哪些?它们的意义和计算上有何不同?P77-79答:常用的相对数指标有构成比、率、相对比等。 一、构成比 表示事物内部各个组成部分所占的比重,通常以 100 为例基数,故又称为百分比(prercentage) 。其公式如下: 公式(见书本) 该式可用符号表达如下: 二、率 表示在一定条件下,某现象实际发生的例数与可能发生这种现象的总数之比,用以

8、说明某种现象发生的频率,故又称为频率指标,以 100,1000,10000 或100000 为比例基数(K)均可,原则上以结果至少保留一位整数为宜, 三、相对比 表示有关事物指标之对比,常以百分数和倍数表示,4 二项分布、泊松分布和正态分布有何联系?答:正态分布:估计连续型随机变量正态分布资料的频数分布二项分布:在每次试验中只有两种可能的结果,而且是互相对立的 ;每次实验是独立的,与其它各次试验结果无关Poisson 分布:是一种单参数的离散型分布,表示单位时间或空间内某时间平均发生的次数当 n 较大或 不接近 0 或 1 时,二项分布可看成近似正态分布Poisson 可看做是二项分布的一种极

9、限情况 ,即 很小而 n 趋于无穷大时,二项分布近似于 Poisson 分布,而当 =20 时, Poisson 分布可作为正态分布来处理。5 方差分析要具备哪些条件 P56答:多个样本均数比较的方差分析其应用条件为:A 各样本是相互独立的随机样本,均来自正态分布总体;B 相互比较的各样本的总体方差相等,即具有方差齐性。6 多重比较主要的方法和使用特点答:一:LSD-t 检验:适用于一对或几对在专业上有特殊意义的样本均数间的比较。二:Dunnett-t 检验:适用于 g-1 实验组与一个对照组均数差别的多重比较;三:SNK-q 检验:亦称 q 检验,适用于多个样本均数两两之间的全面比较。7 析

10、因设计和随机区组设计有何异同点答:析因设计是一种多因素的交叉分组设计。它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。随机区组设计则单因素多因素均可。析因设计各处理组间在均衡性方面的要求与随机设计一致,各处理组样本含量应尽可 同;析因设计对各因素不同水平的全部组合试验,故具有全面性和均衡性. 随机区组设计只有一个处理因素,无交叉效应可言;析因设计属于多因素设计,既可分析因素的主效应,也可以分析因素之间的交互效应。8 实验设计主要有哪些类型 P562答:1 平行组设计;2 交叉设计;3 析因设计。9 相关与回归的联系与区别?答:联系表现为: 两者是相辅相成的,由相关分析法测定的

11、变量之间相关的密切程度,对是否有必要进行回归分析以及进行回归分析意义的大小起着决定的作用,相关程度大,进行回归分析的意义也大,相关程度小,进行回归分析的意义就小,甚至没有必要进行回归分析。同时,相关系数还是检验回归系数的标准,回归分析的结果也可以推算相关系数。因此,相关分析与回归分析是相互补充密切联系的,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应建立在相关分析的基础上。区别主要表现在: 1、相关关系是用来度量变量与变量之间关系的紧密程度的一种方法,在本质上只是对客观存在的关系的测度。回归分析是根据所拟合的回归方程研究自变量与因变量一般关系值的方法,可由已给定的自变量数值来

12、推算因变量的数值,它具有推理的性质。 2、在研究相关关系时,不需要确定哪个是自变量,哪个是因变量,但回归分析的首要问题就是确定哪个是自变量,哪个是因变量。 3、现象之间的相关关系的研究,只能计算一个相关系数;而回归分析时回归系数可能有两个,也就是两现象互为因果关系时,可以确定两个独立回归方程,从而就有两不同的回归系数。 10 某资料的 x 与 y 的相关系数 r=0.8,可否认为 X 与 Y 有较密切的相关关系?答:不能,从同一总体抽出得不同样本会得到不同的样本相关系数,所以要判断 X,Y 间是否有直线相关关系,就要检验 r 是否来自 P(像 P 的符号)不等于 0 的总体。11 应用直线回归

13、和相关分析应注意哪些问题?P158-159第一种答案:1.根据分析目的选择变量及统计方法;2.进行相关、回归分析前应绘制散点图;3.用残差图考察数据是否符合模型假设条件;4.结果的解释及正确应用。第二种答案:(第三版教材的标准答案)1)两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析,其中哪一个作为应变量主要是根据专业上的要求而定,同时直线回归要求至少对于每个 x 相应的 Y 要服从正态分布, x 可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量。2)进行直线回归分析前应绘制散点图,以检查数据是否满足模型基本假设,发现异常点并进行进一步处理。3)对结

14、果应有正确解释。反应两变量间数量上影响大小的统计童应该是回归系数的绝对值,而不是假设检验的 P 值。P 值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著” 。直线回归用于预测时应尽量避免不合理的外延。结果中的决定系数可表示两变量关系的实际效果。12 有序分类资料可作哪些检验?有何区别?答:(本题完全来自网络,请自己参考书本)医学上会用一、士、+、+来表示临床体检或实验室检查的测量结果,用治愈、好转、有效、无效来表示某种药物的临床效果。像这样一些取值中自然存在着次序的分类变量,称为有序分类变量或等级变量。对有序分类资料,若用RX C 表资料的检验,将损失关于等级的信息,

15、不合适的。因为 RX C 表的检验只能推断构成比之间的差别。此时,可以采用秩和检验推断不同处理组之间的等级强度差别。 l、两独立分类有序资料 一、分组变量为多分类有序资料,指标变量为二分类无序资料研究目的是比较分组变量不同水平下某指标变量的发生率,如:利用有序的检验指标判断患者是否患病,其实质是对该检验指标不同水平下患者患病率的比较;以及对不同年龄阶段某指标的阳性率的比较,都属于多个样本率比较的问题。对于这样的资料,可以将分组变量视为无序的,采用 x 检验进行多个样本率的比较。 二、分组变量为两分类无序资料,指标变量为多分类有序资料研究目的是比较分组变量两个不同水平下某指标变量的平均水平是否有

16、差异,如:两种药物疗效(治愈、好转、有效、无效 )之间的比较。两种疗法疗效的取值均为有序分类资料。对于这样的资料前面介绍的 X“检验己不再适用,因为它无法考虑分组变量(药物)不同水平下疗效取值的等级关系。此时可以采用秩和检验。 13 参数检验和非参数检验的区别何在?各有何优缺点 p132答: 参数检验与非参数检验的区别。1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。参数检验与非参数检验的优缺点。1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(50mg)

17、不能使用参数检验,而且要求资料的分布型已知和总体方差相等。2)非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似性。非参数检验适用那些情况?(1)等级顺序资料。(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。(3

18、)未知分布型资料(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。 14 非参数检验适合于哪些情况?p132答:1 开口的资料;2 方差不齐的计量资料;3 等级资料;4 总体分布为偏态或分布形式未知的计量资料。15 两样本均数比较的假设检验有 t 检验和 u 检验,试述这两种检验分别在什么条件下用,这两种检验间有什么联系? 答: 两样

19、本均数比较的 t 检验要求样本来自于正态总体,且方差齐性; u 检验要求两样本例数较大。 两样本均数比较的 t 检验和 u 检验之间的关系在于:当样本例数足够大时 t 界值等于 u 界值。 16 参考值范围能否用可信区间表示?为什么?p34答:参考值范围是对于个体观察值而言的包含了绝大多数正常人的某项生理生化指标的范围;可信区间是对于统计量而言的,是更具样本统计量计算得到的以一定的概率可能包含了总体参数在内的数值范围。所以参考值范围不能用可信区间表示。二者的区别体现在含义,计算公式和用途三个方面。 17 用哪些方法来解决四格表理论频数过小的问题?P114 或者P121第一种答案:(1)当 n4

20、0,但有 1T40 且无小于 5 的理论频数时,才适合用一般 2 检验。本例 n=370.05,尚不能认为两种方案在静脉炎副作用的发生率之间的差别有统计学意义。P 值在 0.05 附近,此时下结论应慎重,必要时增大样本量,重新进行分析。 3. 原文题目:盆腔动脉插管灌注化疗及栓塞治疗恶性滋养细胞肿瘤,用改良的 Seldingers 插管技术对 8 例经临床及病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后测血 hCG 放免测定值。结果见表4.5。采用一般 t 检验进行分析,治疗前后血 hCG 值经统计学处理有显著性差异( P0.05)。表 4.5 灌注治疗前后血 hCG 值(

21、pmol/L)病例 灌注治疗前 (X1)灌注治疗后 (X2) lgX1 lgX21 1280000 210000 6.1072 5.32222 75500 3300 4.8779 3.51853 12450 2210 4.0952 3.34444 1500000 9.3 6.1761 0.96855 10000 2500 4.0000 0.39796 9700 1203 3.9868 3.08037 15588 4825 4.1928 3.68358 4223 914 3.6256 2.9609注:由于本组数据相差较大,故取其对数使之成为正态分布,经 t 检验P0.05;本院血 hCG 放免测

22、定正常值为330pmol/L。 本资料数据成对出现,每对数据测自同一个病例,因而为自身配对设计。对于此类资料,一般计算每对数据的差值,用其差值的大小,反映两种处理之间效应之差的大小。原作者把治疗前后的数据当成是相互独立的数据,直接将治疗前与治疗后的数据按成组设计资料的 t 检验进行比较,这种处理方法与设计类型并不相符。另外,原作者注意到原始数据不满足 t 检验的前提条件之一正态性,因而对其进行对数变量变换,这种思想是正确的,但是变量变换的目的还是使数据满足正态性,同样还要对变换后的数据进行正态性检验,本资料取对数后,资料仍然不满足正态性的条件,故不适合进行 t 检验。计算治疗前后的差值,将资料

23、转换为单组设计的资料,比较差值的平均值与 0 之间的差别是否具有统计学意义,当然进行单组设计的 t 检验前仍要对数据作正态性检验,如不满足正态性的前提条件,可寻找适当的方法(如取对数,平方根变换等)对数据进行变量变换,变量变换后还要进行正态性检验,如满足条件,可用 t 检验,如仍不满足前提条件,可采用非参数检验如配对设计差值的符号秩检验进行分析。 4. 原文题目:猪活体脑片钙离子荧光强度的测定及对停循环后脑缺血损伤的评价,原文中资料的表达见表 3.1。表 3.1 猪小脑病理定量(%)组别 猪数(只) 空泡变性 轻度嗜酸 性 变性 中度嗜酸 性 变性 重度嗜酸 性 变性实验组 8 1120 1927 312 00对照组 8 28 2125 3126 3218“平均数标准差”是用来表达呈正态分布的资料,说明其数据分布的集中趋势和离散趋势。从表中数据可以看出,大部分标准差大于平均数,有的甚至是平均数的 4 倍,基本上可以认为此资料服从偏态分布,不适合用正态分布法说明此资料的集中趋势和离散趋势。 描述偏态分布资料

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 试题真题

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。