医学统计学课后答案.doc

上传人:sk****8 文档编号:4097236 上传时间:2019-09-25 格式:DOC 页数:12 大小:192.50KB
下载 相关 举报
医学统计学课后答案.doc_第1页
第1页 / 共12页
医学统计学课后答案.doc_第2页
第2页 / 共12页
医学统计学课后答案.doc_第3页
第3页 / 共12页
医学统计学课后答案.doc_第4页
第4页 / 共12页
医学统计学课后答案.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系) ,此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean) 。几何均数一般用 G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。中位数和百分位数:中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用 M表示。理论上数据集中有

2、一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。百分位数(percentile)是一种位置指标,以 PX表示,一个百分位数 PX将全部观察值分为两个部分,理论上有 X的观察值比 PX 小,有( 100-X)观察值比 PX大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是 P50 分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最

3、为常用。极差(range,记为 R) ,又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:QQ UQ L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地

4、反映资料的离散程度。方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。变异系数(coefficient of variance,CV)亦称离散系数( coefficient of dispersion) ,为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。3.答:常用的相对数指标有:比,构成比和率。比(ratio) ,又称相对比,是 A、B 两个有关指标之比,说明 A 为 B 的若干倍或百分之几,它是对比的最简单形式。其计算公

5、式为 位/率(rate) 又称频率指标,用以说明某现象发生的频率或强度。常以百分率()、千分率()、万分率 (1/万)、十万分率 (1/10 万)等表示。计算公式为: 位位位位位 K构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为: 10% 某 一 组 成 部 分 的 观 察 单 位 数构 成 比 同 一 事 物 内 各 组 成 部 分 的 观 察 单 位 总 数4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况下,直接进行两个总率的

6、比较,会产生错误的结论。此时,必须首先设法消除这种内部构成上的差别,才能进行比较。统计学上将这种方法称为率的标准化(standardization method of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。5(1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;组段 频数 频率(%) ;累计频数(%) 组中值108 3 2.5 2.5 109.5111 10 8.33 10.83 112.5114 22 18.33 29.17 115.5117 38 31.67 60.83 118.5120 20 16.67 7

7、7.5 121.5123 18 15 92.5 124.5126 7 5.83 98.33 126.5129132 2 1.67 100 129.5合计 120 100Frequencyheight (cm)108.01.014.017.0120.0123.0126.0129.0132.0135.00.05.010.015.020.025.030.035.0(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?答: 3109.52.15.38.201.5824.716.5239./10X=119.4135 1lg309.5lg12.l5.lg381.l20.5lg1824.l76

8、.5lg2139./0X =119.251256dM用均数较好.(3) 计算极差、标准差,用何者表示这组数据的离散趋势好?答:极差:22.62四分位数间距:5.915标准差:4.380736用标准差表示较好.6答:本例频数分布为偏态分布,长尾拖向 x 轴正方向,故为正偏态。适宜用中位数表示其平均水平,中位数为 4,四分位数间距为 4。7.40 名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平均滴度。抗体滴度 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512人数 1 5 6 2 7 10 4 5几何均数:exp(ln(4)+5ln(8)+16l

9、n(16)+2ln(32)+7ln(64)+10ln(128)+4ln(256)+5ln(512)/40)1288.答:此医生的分析是不正确的,原因在于:首先明确率的定义: 位位位位位 K发病率的分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病人数是人次数;分母为“同时期平均人口数”,而按率的定义应为“同时期暴露总人数该单位抽样检查 2839 名职工,其中高血压患者中,男性是 178 例,女性是 49 例,共 227 例,可以计算高血压患者占接受检查所有职工的构成比为 7.995773%至于 40 岁以上的患者占接受检查总人数的 90.3%,也是构成比;60 岁以上者占接

10、受检查总人数的 10.2%也是构成比,不能与发病率混为一谈。关于高血压与性别有关的结论也不妥。因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消除内部构成比的差异,即就是率的标准化,然后比较。第三章1 正态分布与标准正态分布的区别:正态分布是一簇单峰分布的曲线, 和 可以有任意取值;标准正态分布是一条单峰曲线, 和 有固定的值,=0,=1 。2 u = (x-)/= (-)/= -1查标准正态分布表,得 (-1)=0.1587,所以小于 - 者所占的比例为 15.87%。3 医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范围。选定同质的正常人作为研究

11、对象。所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。确定原则:选定同质的正常人群作为研究对象控制检测误差判断是否分组单、双侧问题选择百分界值确定可疑范围方法:正态分布法:适用于服从正态分布或近似正态分布的资料百分位数法:适用于不服从正态分布的资料对数正态分布法:适用于对数正态分布的资料4 如果资料服从正态分布,那么双侧 95%正常值范围为 1.96;如果资料不服从正态分布,那么双侧 95%正常值范围就不能用正态分布来做。5 1 人以下的概率:P(x1)=P(0)+P(1)=C 1000.200.810+C1010.210.89 =0.3758 人以上的概率:P(X8)=P(8)+

12、P(9)+P(10)=C1080.280.82+C1090.290.81+C10100.2100.80 =7.791056 二项分布的应用条件:观察单位只能有互相对立的两种结果之一。已知发生某一结果的概率 不变,其对立结果的概率则为 1-n 次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。7 二项分布和正态分布之间的关系:随着 n 的增大,二项分布逐渐逼近正态分布。当n 较大时,二项分布 B(n,)近似正态分布。举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区 12 岁男孩的身高,某学校

13、同年级女生的体重等属于正态分布。第四章1 标准差 标准误不同:意义上: 描述一组变量值的离散程度描述样本均数的离散称度1、标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好。1、标准误越小,说明样本均数和总体均数的差异越小,用样本均数估计总体均数的可靠性越大。应用上:2、 估计变量值的xus分布范围。2、用 估计总体均xts数的可信区间。与 n 的关系: n 越大,标准差越稳定 n 越大,标准误越小相同:1、都是描述变异度的统计指标2、 与 成正比,与 成反比;xnxn3、n 一定时,同一组资料,标准差越大,标准误也越大。2 水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结

14、论,是犯型错误的最大风险,是事前概率;P 值是指由 H0 所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝 H0,是事后概率。3 配对设计的差值的总体均数的可信区间表达公式: ,1ndts两均数差值的总体均数的可信区间表达公式:可以用可信区间回答假设检验的问题。可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均数的总体;用假设检验的方法,先

15、假设样本均数代表的总体均数等于某已知的总体均数,再判断样本提供的信息是否支持这种假设。 4 拒绝实际上成立的 H0,这类“弃真”的错误称为型错误或第一类错误;不拒绝实际上是不成立的 H0,这类“存伪” 的错误称为型错误或第二类错误。第一类错误的概率用 表示,第二类错误的概率用 表示。 越大, 越小;反之, 越小, 越大。拒绝 H0,只可能犯第一类错误,不可能犯第二类错误;不拒绝 H0,只可能犯第二类错误,不可能犯第一类错误。由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。5 t 检验的应用条件:独立性、正态性、方差齐性。u 检验的应用条件:适用于大样本资料。t 检验和 u 检验

16、的关系:随自由度的增加,t 分布逐渐趋向于标准正态分布。因此 u检验是 t 检验的一种近似检验方法。当自由度大于 50 时,近似程度比较满意。6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。假设检验应注意的问题: 要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因素外,其他影响结果的因素应一致。 选用的假设检验方法应符合应用条件。 结论不能绝对化。nstx 21212,21 正确理解差别有无显著性的统计意义:差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很

17、大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。 统计学意义与其他专业上的意义不同。7 H0:矽肺患者的血红蛋白与健康人相同,即 =0H1:矽肺患者的血红蛋白与健康人不同,即 0=0.05t = = |2.5914.0|2.7363/= 10-1=9,t 0.05,9=2.2620.05 ,不拒绝 H0,差别无统计学意义,尚不能认为新药与常规药物的疗效不同。9甲药:H0:甲药无效,即 d=0H1:甲药有效,即 d 0=0.05=5.2372= 10-1=9, t0.05,9=2.262t,p0.05,不拒绝 H0,差别无统计学意义,可以认为甲乙两药的疗效没有差别。第六章1 不满足正

18、态近似条件,所以采用直接计算概率法。H0:加维生素 C 的治愈率与不加相同,即 =0=0.6H1:加维生素 C 的治愈率高于不加维生素 C,即 0=0.05P(X8)=1-P(X9)=1-P(X=9)-P(X=10)=1-C109*0.69*0.41-C1010*0.610*0.40= 0.95360.05不拒绝 H0,差别无统计学意义,可以认为加维生素 C 的治愈率与不加相同。2 满足正态近似条件,采用正态近似法。H0:经健康教育后的高血压患病率与以前相同,即 =0=0.6H1:经健康教育后的高血压患病率比以前降低,即 u0.05,单侧 =1.64p0.05统计推断按 =0.05 水准,不拒

19、绝 H0,差别无统计学意义,尚不能认为两组治愈率有差别。5建立检验假设和确定检验水准H0:治疗三种类型病人的有效率相同,即 1 =2 =3H1:治疗三种类型病人的有效率不等或不全相等。检验水准 =0.05计算检验统计量 i CRi nATA1222= 286*( 712 + 272 +1042 + 422 + 242 +182 -1)=3.6389199*98 87*98 199*146 87*146 199*42 87*42确定 p 值查 2 界值表,得 p0.05统计推断按 =0.05 水准,不拒绝 H0,拒绝 H1,差别无统计学意义,尚不能认为治疗三种类型病人的有效率有差别。6建立检验假

20、设和确定检验水准H0:该三种人群有相同的血型分布,即 1 =2 =3H1:该三种人群的血型分布不等或不全相等。检验水准 =0.05计算检验统计量i CRi nATA1222 9312*(679 2 +1342 + +4352 - 1)= 71.1803720*1883 788*1883 546*6522 确定 p 值查 2 界值表,得 p0.05统计推断按 =0.05 水准,不拒绝 H0,差别无统计学意义,尚不能认为两种免疫学方法的阳性率有差别。第八章1 答:适用于有序分类资料、偏态分布资料、 变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。2

21、答:属于非参数检验。因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。但本题即使 n1 10,n 2n 1 10 时采用的是 u 检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。3 答:有序分类资料可做秩和检验、等级相关分析。4 答:(一)建立检验假设H0:两种药的治疗效果总体分布相同;H1:两种药的治疗效果总体分布不同;0.05;(二)编秩和求秩和 T两组治疗心绞痛疗效比较人数 秩和疗效(1)缓释片(2)普通片(3)合计(4)秩次范围(5)平均秩次(6)缓释片(7)普通片(8)显效有效无效加重

22、62 18533531144 9749197197981461471651661724912215616930382196780507171537822184676合计 n188 n284 172 6521 8357(三)计算检验统计量 T由于 n1 n2 , 则取 n2 组的秩和为 T,故检验统计量 TT 28357。(四)确定 P 值,做出推断结论由于 n210 ,T 分布已接近均数为 n1 (N1)/2,方差为 n1 n2 (N1)/12 的正态分布,按书上式(8.3) (8.4)求出 uc =3.7439uc 2.56, P0.01, 按 0.05 水准拒绝 H0,接受 H1,差异有统计学意义。可以认为缓释片和普通片治疗心绞痛的疗效有差别。5 答:(一)建立检验假设H0:治疗前后 HCG 值的总体分布相同;H1:治疗前后 HCG 值的总体分布不同;0.05;(二)计算检验统计量 T肿瘤患者灌注治疗前后 HCG 值病例号(1)治疗前(2)治疗后(3)差值(4)秩次(5)

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 重点行业资料库 > 自然科学

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。