1、独立性检验的基本思想及其初步应用河北乐亭一中 李金泉 邮编:063600 手机:13832809990练习一一、选择题1下面是一个 22列联表y1 y2 总计x1 a 21 73x2 2 25 27总计 b 46则表中 a、b 处的值分别为( )A94、96 B52、50 C52、54 D54、522关于独立性检验的说法中,错误的是( )A独立性检验依据小概率原理B独立性检验原理得到的结论一定正确C样本不同,独立性检验的结论可能有差异D独立性检验不是判定两类事物是否相关的唯一方法3利用独立性检验来考察两个分类变量 X和 Y是否有关系时,通过查阅下表来确定断言“X 与 Y有关系”的可信程度如果
2、k 5024,那么就有把握认为“X 与 Y有关系”的百分比为( )2 25% 75 2.5% 97.5二、填空题4、我们常利用随机变量 K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的 5. 某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别 专业 非统计专业 统计专业男 13 10女 7 20为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 (保留三位小数)k三、解答题6某研究小组为了研究中学生的身体发育情况,在某学校随机抽出 20名 15至 16周岁的男生,将它们的身高和体重制成 22列联表,
3、根据列联表的数据,可以有多大的把握认为该学校 15至 16周岁的男生的身高和体重之间有关系。超重 不超重 合计)k(K02P0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.00100.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828偏高 4 1 5不偏高 3 12 15合计 7 13 20独立性检验临界值表P(K2k 0) 0.025 0.010 0.005 0.001k0 5.024 6.635 7.879 10.828练习二一、选择题1高二第二学期期中考试,按照甲、乙两个
4、班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表优秀 不优秀 总计甲班 11 34 45乙班 8 37 45总计 19 71 90来源:学科网 ZXXK则随机变量 2K的观测值约为( )0.60 0.828 2.712 6.004来源:学科网2. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若 K2的观测值为 k=6.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有 99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有 99%的可能患有肺病;C.若从统计量中求出有 95
5、% 的把握认为吸烟与患肺病有关系,是指有 5% 的可能性使得推判出现错误;D.以上三种说法都不正确.3.通过随机询问 110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110计算得,22104307.865K2()Pk0050 0010 00013841 6635 10828参照附表,得到的正确结论是 A再犯错误的概率不超过 01%的前提下,认为“爱好该项运动与性别有关”B再犯错误的概率不超过 01%的前提下,认为“爱好该项运动与性别无关”C有 99%以上的把握认为“爱好该项运动与性别有关”D有 99%以上的
6、把握认为“爱好该项运动与性别无关”二、填空题4、统计推断,当_时,说事件 A 与 B 有关犯错误的概率不会超过 0.010。5.若由一个 2*2列联表中的数据计算得 k2=4.013,那么有 把握认为两个变量有关系三、解答题6、为考察某种药物预防禽流感的效果,进行家禽试验,调查了 100只家禽,统计结果为:服用药的共有60只家禽,服用药但患病的仍有 20只家禽,没有服用药且未患病的有 20只家禽(1)根据所给样本数据完成 22列联表;(2)请问能有多大把握认为药物有效?测试题一、选择题1对分类变量 X 与 Y 的随机变量 的观测值 K ,说法正确的是() 2A . k 越大, “ X 与 Y
7、有关系”可信程度越小;B . k 越小, “ X 与 Y 有关系”可信程度越小;C . k 越接近于 0, “ X 与 Y 无关”程度越小D . k 越大,“ X 与 Y 无关”程度越大2冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.根据以上数据,则( )A含杂质的高低与设备改造有关 B含杂质的高低与设备改造无关C设备是否改造决定含杂质的高低 D以上答案都不对3、分类变量 X和 Y的列联表如下y1 y2 总计x1 x b xbx2 c d cd总计 xc bd xbcd则下列说法正确的是( )Axdbc 越小,说明 X和 Y关系越
8、弱 Bxdbc 越大,说明 X和 Y关系越强C (xdbc) 2越大 ,说明 X和 Y关系越强 D (xdbc) 2越接近于 0 ,说明 X和 Y关系越强4、某医疗研究所为了检验新研发的流感疫苗对甲型的 H1N1流感的预防作用,把 1000名注射了疫苗的人与另外 1000名未注射疫苗的人的半年的感冒记录作比较,提出假设 : “这种疫苗不能起到预防甲型0HH1N1流感的作用” ,并计算出 ,则下列说法正确的是( ))635.(2KP01.A、这种疫苗能起到预防甲型 H1N1流感的有效率为 1%;B、若某人未使用该疫苗,则他在半年中有 99%的可能性得到甲型 H1N1;C、有 1%的把握认为“这种
9、疫苗不能起到预防甲型 H1N1流感的作用”D、有 99%的把握认为“这种疫苗不能起到预防甲型 H1N1流感的作用”5、在用独立性检验的方法检验某单位招聘行政工作人员和技术工作人员所招聘的男女人数时,得到了 K杂质高 杂质低旧设备 37 121新设备 22 202的观测值为 4.2。则下列说法正确的是( )2A、因为 =0.05,所以说明单位在两类工作岗位上的招聘中一定存在性别歧视;)2.4(KPB、因为 =0.05,所以说明单位在两类工作岗位上的招聘中不存在性别歧视;C、因为 =0.05,所以说明单位在两类工作岗位上的招聘中存在性别歧视的概率为 0.05;D、因为 =0.05,所以说明单位在两
10、类工作岗位上的招聘中存在性别歧视的嫌疑很大。).(26、调查 339名 50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎 未患慢性气管炎 总计吸烟 43 a205不吸烟 b121合计则表中 处的值分别为( )ba,A、 =248, 值无法确定 B、 =162 , =13 C、 =162, 值无法确定 D、 值无法确定,ababa=13二、填空题7、为了探究 50岁以上的人患慢性气管炎与吸烟有无关系时,提出的假设是 ;8、通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 11
11、0则 的观测值 (保留一位小数)2Kk9、假设有两个分类变量 X和 Y,它们的取值分别为 和 ,其 22联表为:21,x21,y1y2y总计1xa b a+b2c d c+d总计 a+c b+d a+b+c+d定义 ,则 越 (大或小) ,就有利于结论“X 和 Y有关系” ; 越 |cbaWWW(大或小) ,就越有利于结论“X 和 Y没有关系” ;10、某医疗研究所为了检验某种血清预防感冒的作用,把 500名使用血清的人与另外 500名未用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22列联表计算得 K23.918,经查对临界值表知 P(K23.
12、841)0.05.对此,四名同学作出了以下的判断:有 95%的把握认为“这种血清能起到预防感冒的作用” ;:若某人未使用该血清,那么他在一年中有 95%的可能性得感冒;:这种血清预防感冒的有效率为 95%;:这种血清预防感冒的有效率为 5%.则下列结论中,正确结论的序号是_(把你认为正确的命题序号都填上 )三、解答题11某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取 100件产品,检验后得到如下列联表:生产线与产品合格数列联表合 格 不合格 总计甲线 97 3 100乙线 95 5 100总计 192 8 200请问甲、乙两线生产的产品合格 率在多大程度上有关系?12.在
13、对人们的休闲方式的一次调查中,共调查了 120人,其中女性 60人,男性 60人。女性中有 40人主要的休闲方式是看电视,另外 20人主要的休闲方式是运动;男性中有 20人主要的休闲方式是看电视,另外 40人主要的休闲方式是运动。(1)根据以上数据建立一个 22的列联表;(2)判断性别与休闲方式是否有关系。13、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500位老年人,结果如下: 性别是否需要志愿者 男 女需要 40 30不需要 160 270(1)建立一个 22 的列联表;(2)能否有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?参考答案
14、练习一参考答案1、C 解析:a2173,a52.又a2b,b54.2、B 解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有失误,不是一定正确3、 解析:由表可知,因为 P( )=0.025,所以“X 与 Y有关系”的百分比为 1-0.025=024.5K97.5%。4、反证法5、4.844 解析:由公式 8.3027)1(502k6、解:根据公式 ,代入数据可求得: 5.934,根据独立性检验临界)()(dbcadban k值表可知 P(K25.024)0.025,所以我们有 97.5%的把握认为该校 15至 16周岁的男生的身高和体重之间有关系练习二参考答案1、 解析:由
15、 K 60.71945)38(9022.C 解析:A、B 都是对 K2的观测值的错误理解。3、C 解析:因为 ,所以说有 99%以上的把握认为“爱好该项运动与性别有关” 。0.)8(P4、 解析 :当 时,就有 99 的把握说事件 A 与 B 有关,即犯错误的概率不会超过 0.010.65.263525. 95% 解析:查表得知。6、解:(1)(2)假设 H0:服药与家禽得禽流感没有关系,K2 2.778,46)20(1由于 P(K22.706)0.10,所以大概有 90%的把握认为药物有效不患禽流感 患禽流感 合计服药 40 20 60未服药 20 20 40合计 60 40 100测试题参
16、考答案1.B 解析:因为 k 越小, “ X 与 Y 有关系”可信程度越小;因为 k 越大, “ X 与 Y 有关系”可信程度越大;2、A 解析:由已知数据得到如下 22列联表杂质高 杂质低 合计旧设备 37 121 158新设备 22 202 224合计 59 323 382因为 37202=5454,22121=2662,所以相差比较大,所以可以说含杂质的高低与设备改造有关。3、C 解析:因为| xdbc |趆大,说明 X和 Y关系越强。4、D 解析: 说明“这种疫苗不能起到预防甲型 H1N1流感的作用”的概率,所以)635.(2KP01.说有 99%的把握认为“这种疫苗不能起到预防甲型
17、H1N1流感的作用” 。5、D 解析:根据独立性检验,当 K 的观测值为 4.2时,有 95%的把握认为两个分类变量有关系,在本题2中单纯从这点讲,该单位在招聘工作中存在性别歧视的嫌疑很大,其概率高达 95%,但即使这样也不能100%就肯定该单位招聘中存在性别歧视另一方面,由于男女在选择工作岗位上的心理不同,也会造成各个岗位招聘人数的差异,导致计算的 K 的观测值过大,因此单纯从这个计算结果不能作出该单位在两2类工作岗位上的招聘中一定存在性别歧视的结论6、B 解析: =20543=162, =339-205-121=13。ab7、50 岁以上的人患慢性气管炎与吸烟有关系8、7.8 解析:221
18、04307.865K9、大 ,小 10、 11、解: 2的观测值 20(9753)0.521.76(3)(k,因此没有充分的证据显示甲、乙两线生产的产品 合格率有关系12.解:(1)22 的列联表 性别 休闲方式 看电视 运动 总计女 40 20 60男 20 40 60总计 60 60 120(2)假设“休闲方式与性别无关” 计算 ,因为 ,所以有理由认为假设“休k3.16060)24(1 01.)82.1(2KP闲方式与性别无关”是不合理的,即有 99.9%的把握认为“休闲方式与性别有关” 。13、解:(1)(2)K2 ,由于 9.9676.635,所以有 99%的把握认为该地区的967.43070)12(52老年人是否需要帮助与性别有关性别是否需要志愿者 男 女总计需要 40 30 70不需要 160 270 430总计 200 300 500