1、1医学统计学习题集上海中医药大学预防医学教研室2医学统计学绪论习题一、名词解释1.同质和变异2.总体和样本3.抽样误差和误差4.概率和频率5.计量资料、计数资料和等级资料二、最佳选择题1.统计工作的前提与基础是:A.设计 B.收集资料 C.整理资料 D.校对资料 E.分析资料2.统计工作四个基本步骤是:A.设计,收集资料、整理资料和分析资料 B.收集日常生活资料,报告卡片,分析资料,总结C.收集统计报表,日常医疗工作资料,分析资料,描述资料D.收集专门内容报告卡片,进行整理,分析资料,核对资料E.收集病历,日常医疗工作资料,分析资料,归组3.统计中所说的样本是指:A.随意从总体中抽取出的部分个
2、体 B.依照研究者要求从总体中抽取出有意义的部分个体C.按照随机原则抽取总体中有代表性的部分个体D.依照研究者要求从总体中抽取的部分个体E.按分布的顺序抽取部分个体4.统计中所说的总体是指:A.随意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体C.根据时间来划分的研究对象的全体 D.根据地区来划分的研究对象的全体E.根据人群来划分的研究对象的全体5.总体的要求是:A.大量的 B.同质的 C.随机的 D.固定的 E.对称的6.对观察单位按某项指标等级顺序分组,再清点各组观察单位的个数所得资料称作:A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料7.对观察单位用定量
3、的方法测量某项指标所得的资料是:A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料8.样本指标值与总体指标值之差主要是指:A.随机测量误差 B.过失误差 C.容许误差 D.抽样误差 E.系统误差39.由于各种偶然的因素影响,造成同一对象的测定结果不完全一致,往往是有的稍高,有的稍低,这种差异是:A.系统误差 B.随机测量误差 C.抽样误差 D.偏倚误差 E.标准误差10.统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有:A.三种误差都不可避免 B.系统误差和抽样误差不可避免C.系统误差和测量误差不可避免 D.测量误差和抽样误差不可避免E.三种误差都可避免11.
4、抽样误差是指:A.个体值和总体参数值之差 B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差 D.样本统计量值和样本统计量值之差E.总体参数值和总体参数值之差12.某事件发生的概率为 1,即意味着:A.某事件发生的可能性为 1% B.某事件可能发生C.某事件可能不发生 D.某事件必然不发生E.某事件必然发生13.除哪项外,是随机抽样方法:A.单纯随机抽样 B.系统抽样 C.分层抽样 D.整群抽样 E.随意抽样14.随机事件概率 P 值应是:A.1 B.0 C.01 D.0.5 E.11015.一时性资料主要来源:A.日常工作记录 B.专用报告卡 C.统计报表 D.专题调查 E.病例档
5、案16.抽样调查是指:A.从总体中随机抽取有代表性的一部分进行调查 B.从总体中任意选择一部分进行调查C.从总体中选择典型进行调查 D.选择某一地区进行调查E.调查总体所包含的每一个个体17.医疗卫生工作对原始统计资料的要求:A.完整,准确,及时,要有适当的数量,代表性和对比条件B.字迹清楚 C.填写工整 D.避免重复 E.没有遗漏18.同性三胞胎的身长、体重均有不同,认为是_。A.变异 B.同质 C.系统误差 D.抽样误差 E.随机测量误差19.某医生对 100 名高血压病人采用某新疗法进行治疗,该研究的总体是_。A.全院收治的高血压病人 B.这 100 名高血压病人C.该医生收治的所有病人
6、 D.接受该新疗法的所有高血压病人E.所有高血压病人。20.某研究这在社区进行了 1000 名退休人员的冠心病患病率的抽样调查,计算的患病率为_。A.社区冠心病患病率参数 B.这 1000 名退休人员的冠心病患病率参数4C.所有退休人员的冠心病患病率参数 D.所有退休人员的冠心病患病率统计量E.这 1000 名退休人员的冠心病患病率统计量三、思考题1.某地一批人的血红蛋白值资料,比色法测得的具体值(如 135g/L),为何类资料?根据测得值进行分类(如“贫血”),为何类资料? 2.某疫苗皮下注射免疫结果观察对象 抗体滴度 目测判断抗体水平 免疫效果观察1 1:40 + 无效2 1:60 + 有
7、效 为何类资料? 为何类资料? 为何类资料? 3.数据类型的相互转换:如年龄(岁),为何类资料? 转换为“未成年、成人”,是何类资料? 再转换为“婴幼儿、青年、中年、老年”则又是何类资料?如治疗效果分类“无效、好转、显效、痊愈”为何类资料? 分别给予编码 0,1,2,3 后又为何类资料?。4.某医科大学抽查了 100 名健康女大学生的血清总蛋白含量(g/L),检查结果如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74
8、.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69
9、.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 试回答以下问题:1.这是总体还是样本资料? 2.上述资料的观察单位是什么?是数值变量还是分类变量?3.怎样对这样一个资料(分布规律)进行简单描述?参考答案二、最佳选择题1、A 2、A 3、C 4、B 5、B 6、E 7、A 8、D 9、B 10、D11、C 12、E 13、E 14、C 15、D 16、A 17、A 18、A 19、D 20、E5统计表与统计图一、最佳选择题1、欲比较两地 20 年来冠心病和恶性肿瘤死亡率
10、的上升速度,最好选用( ) 。A.普通线图 B.半对数线图 C.条图 D.直方图 E.圆图2、调查某地 6 至 16 岁学生近视情况,需描述近视学生的年龄分布可用( ) 。A.普通线图 B.半对数线图 C.条图 D.直方图 E.圆图3、比较某地在两个年份几种传染病的发病率可用( ) 。 A.构成比条图 B.复式条图 C.线图 D.直方图 E.圆图4、图示 7 岁男孩体重与胸围的关系,宜绘制( ) 。A.条图 B.百分条图 C.散点图 D.线图 E.直方图5、表示某地区某年死因的构成比,可绘制( ) 。A.条图 B.圆图 C.直方图 D.统计地图 E.线图6、关于统计表的制作,不正确的叙述是(
11、) 。A.统计表不用竖线和斜线分隔表、标目和数据 B.统计表的标题放在表的上方C.统计表包含的内容越多越好 D.统计表中的数字按小数点位次对齐E.统计表一般用纵标目和横标目说明数字的意义和单位7、关于统计图的制作( ) 。A.统计图的标题放在图的上方 B.线图中的线条越多越好C.直条图的纵轴必须从零开始 D.直方图的组距不必相等E、以上都不对8、比较 1955 年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是( ) 。A线图 B半对数线图 C直方图 D条图 E百分条图9、下列哪种统计图纵坐标必须从 0 开始( ) 。A半对数线图 B散点图 C条图 D线图 E百分条图10、比较 1949
12、1957 年间某市儿童结核病和白喉的死亡率(l10 万) (两种疾病死亡率数量相差很大) ,宜采用( ) 。A条图 B直方图 C线图 D半对数线图 E散点图11、要反映某一城市连续五年甲肝发病率的变化情况,应选用( ) 。A条图 B直方图 C线图 D散点图 E百分条图12、关于统计表的列表原则,哪项是错误的( ) 。A标题在表的上端, “简要说明表的内容”B横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧C线条主要有顶线,底线及纵标目下面的横线,不宜有斜线和竖线D数字右对齐,同一指标小数位数一致,表内不宜有空格E备注用“*”标出,写在表的下面13、下列哪些统计图适用于计数资料(
13、) 。6A条图、直方图 B线图、半对数线图 C条图、百分条图D散点图、线图 E百分条图、直方图14、半对数线图( ) 。A以对数的 12 值作纵横轴尺度 B必须以纵轴为对数尺度,横轴为算术尺度C必须以横轴为对数尺度,纵轴为算术尺度 D纵横轴之一为对数尺度,另一为算术尺度E纵横轴都必须为对数尺度15、分析胎儿娩出时的不同体重(g)和围产儿死亡率的关系,宜绘制( ) 。A散点图 B条图 C线图 D半对数线图 E直方图16、关于半对数线图,哪项是错误的( ) 。A纵轴为对数尺度,横轴为算术尺度 B纵坐标没有零点C通过绝对差值而不是相对比来反映事物发展速度D纵坐标各单元等距,但同一单元内不等距E当事物
14、数量相差悬殊时,比普通线图更适宜比较事物的发展速度17、编制统计表的基本原则A简单明了,层次清楚 B表式多样,标题合理 C主谓分明,系统全面D排列规则,数字工整 E表格整齐美观18、对于绘制统计图的说法,较正确的是A纵坐标的起点一律为 0B直条图是以各直线的面积大小来表示各指标的数值C是以各直线的面积大小来表示各指标的数值标题应简明扼要,一般放在图的上方D图例可放在图内任何地方,不宜太大E在绘制线图和直条图时,纵横坐标的长度的比例以 5:7 为宜19、应用统计图必须根据资料的性质和分析目的,正确选择适宜的图形是:A连续性分组资料宜选用直条图B比较两种和两种以上事物变化速度,宜选用普通线图C表示
15、某现象数量随另一现象而变动的幅度和趋势宜选用半对数线图D无连续关系的,相互独立的分组资料宜选用方图E要表示构成比与分布,可选构成图20、列频数表时,分的组段数一般为:A510 个 B1015 个 C1030 个 D1520 个 E20 个二、简答题1、在统计描述中,统计表和统计图分别起着什么作用?2、统计表的制作原则和要求有哪些?3、统计图的制作原则和要求有哪些?4、常用的统计图有哪几种,各适用于什么类型资料?75、统计表与统计图有何联系和区别?三、计算分析题1、对下表提出意见,并绘制改进后的统计表发病率职业 性别 例数例数 %工人男女合计10280182320232.925.012.6农民男
16、女合计77861637299.12.35.5职员男女合计1079119818102816.811.014.12、评价下表是否符合统计表的制作原则,并请改进。某地 EB 病毒抗体阳性人群药物干预治疗后 EB 病毒抗体阳性例数第一疗程 第二疗程1 月 2 月 3 月 1 月 2 月 3 月血清学指标血清学指标血清学指标血清学指标血清学指标血清学指标检查人数VCAEADNAse检查人数VCAEADNAse检查人数VCAEADNAse检查人数VCAEADNAse检查人数VCAEADNAse检查人数VCAEADNAse328 252 84 52 315 237 78 46 306 229 62 28 2
17、83 192 56 22 272 168 44 20 266 144 38 183、某地两年三种死因别死亡率资料如下表,请绘制适合的统计图描述该资料。某地两年的三种死因别死亡率(1/10 万)死因 1952 年 1992 年肺结核 163.2 24.7心脏病 72.5 83.4恶性肿瘤 57.2 156.34、某医生统计某市机械工业生产性外伤例数见下表,请用适当的统计图描述。1992 年某市机械工业生产性外伤分类外伤类型 病例数 百分比(%)创伤 381 40.57挫伤 305 32.48眼外伤 118 12.57烧伤 92 9.80其他 43 4.58合计 939 100.005、某医生在冠
18、心病药物的动物实验中得到以下结果,试用适当的统计图描述。8家兔服药后血清总胆固醇的变化服药后组别 服药前2 周 4 周 6 周 8 周 10 周 12 周实验组 53.6 815.8 898.7 1298.9 1232.5 1179.4 1096.8对照组 50.8 818.1 1081.1 1464.5 1645.5 1620.1 1411.06、某医生统计 168 例甲状腺功能亢进患者的年龄,结果如下表,请绘制合适的统计图。甲状腺功能亢进患者的年龄分布年龄 0 10 20 30 40 50 60 合计例数 1 13 51 61 35 6 1 168练习题解答一、最佳选择题解答1、B 2、D
19、 3、B 4、C 5、B 6、C 7、C 8、C 9、D 10、D11、C 12、B 13、C 14、D 15、A 16、C 17、A 18、E 19、E 20、B三、计算分析题解答1、答:该题没有标题,行的层次多,不应该有竖线,修改如下。表 1 某年某地不同职业居民高血压发病率男 女 合计职业 例数 发病数 发病率(%) 例数 发病数发病率(%) 例数 发病数发病率(%)工人 102 3 2.9 80 20 25.0 182 23 12.6农民 77 7 9.1 86 2 2.3 163 9 5.5职员 107 18 16.8 91 10 11.0 198 28 14.12、答:该表的层次太
20、多,描述资料不清楚,不方便比较。表的外框和竖线应该去掉。修改如下。表 2 某地 EB 病毒抗体阳性人群药物干预治疗后 EB 病毒抗体阳性例数第一疗程 第二疗程随访时间检查人数 VCA EA DNAse 检查人数 VCA EA DNAse1 月 328 252 84 52 283 192 56 222 月 315 237 78 46 272 168 44 203 月 306 229 62 28 266 144 38 183、该资料是比较两个年度三种死因的变化,适宜用直条图,绘制如下。94、答:该资料是描述生产性外伤的构成比,适宜用圆图或构成比直条图,绘制圆图如下。1992年 某 市 机 械 工
21、业 生 产 外 伤 性 构 成 比眼 外 伤13%烧 伤10%其 他5%创 伤40%挫 伤32%5、答:该资料是比较两组家兔的血清总胆固醇随时间变化而变化的趋势,适宜用线图。绘制如下。6、答:该资料是描述甲状腺功能亢进患者的年龄分布,适宜用直方图,绘制如下。10计量资料的统计描述一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布二、是非题1不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。 ( )2少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。 ( )3只要单位相同,用 s 和用 CV 来表示两组资料的离散程度,结论是完全一样的。 ( )4
22、四分位数间距也是描述连续分布数据离散度的指标。 ( )5理论上,对于正态分布资料,总体百分位数的 P5P95 和 1.96 范围内都包含 95%的变量值。 ( )三、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。A.全距 B.标准差 C.变异系数 D.四分位间距 E.方差2、用均数和标准差可以全面描述( )资料的特征/A.正偏态分布 B.负偏态分布 C.正态分布 D.对称分布 E.对数正态分布3、各观察值均加(或减)同一数后( ) 。A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4、比较身高和体重两组数据变异度大小宜采用( )
23、。A.变异系数 B.方差 C.极差 D.标准差 E.四分位间距5、偏态分布宜用( )描述其分布的集中趋势。A.算术均数 B.标准差 C.中位数 D.四分位间距 E.方差6、各观察值同乘以一个不等于 0 的常数后, ( )不变。A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7、 ( )分布的资料,均数等于中位数。A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态9、最小组段无下限或最大组段无上限的频数分布资料,可用( )描述集中趋势。A.均数 B.标准差 C.中位数 D.四分位间距 E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是( ) 。A.算术均数 B.中位数 C.几何均数 D.变异系数 E.标准差11、中位数是表示变量值_的指标。A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.以上都不对12、某项指标仅以过高为异常,且资料呈偏态分布,则其 95%的参考值范围为 。