1、第二章课后作业【第 1 题】解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布) ,调查者取 500 块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500块糖果的颜色分布如下表 1.1 所示:表 1.1 理论上糖果的各颜色数橙色 黄色 红色 棕色 绿色 蓝色150 100 100 50 50 50由题知 r=6,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设:原假设: 类 所占的比例为:0HiA)6,.1(0ipi其中 为对应的糖果颜色, 已知,i ),.(0i 10ip则 检验的计算过程如下表所示:2颜色类别 in0in02)(iii
2、np1A172 150 3.22672124 100 5.7600385 100 2.25004A41 50 1.6200536 50 3.9200642 50 1.2800合计 500 500 0567.182在这里 。检验的 p 值等于自由度为 5 的 变量大于等于 18.0567 的概率。6r 2在 Excel 中输入“ ”,得出对应的 p 值为),067.18(chidst,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好5.0287.0p分布不相符。【第 2 题】解:由题可知 ,r=3,n=200,假设顾客对这三种肉食的喜好程度相同,即顾客选择这三种肉食的概率是相同的。所以我们可以进
3、行以下假设:原假设 )3,21(:0ipHi则 检验的计算过程如下表所示: 2肉食种类 ininpiiinp2)(猪肉 85 66.67 5.03958牛肉 41 66.67 9.88374羊肉 74 66.67 0.80589合计 200 200 7291.5在这里 。检验的 p 值等于自由度为 2 的 变量大于等于 15.72921 的概率。3r 在 Excel 中输入“ ”,得出对应的 p 值为),791.5(chidst,故拒绝原假设,即认为顾客对这三种肉食的喜好程度是0.0841.p不相同的。【第 3 题】解:由题可知 ,r=10,n=800,假设学生对这些课程的选择没有倾向性,即选
4、各门课的人数的比例相同,则十门课程每门课程被选择的概率都相等。所以我们可以进行以下假设:原假设 )10,.2(.0:ipHi则 检验的计算过程如下表所示: 2类别(课程) in0inp02)(iiinp1 74 80 0.45002 92 80 1.80003 83 80 0.11254 79 80 0.01255 80 80 0.00006 73 80 0.61257 77 80 0.11258 75 80 0.31259 76 80 0.200010 91 80 1.5125合计 800 800 125.在这里 。检验的 p 值等于自由度为 9 的 变量大于等于 5.125 的概率。10r
5、 2在 Excel 中输入“ ”,得出对应的 p 值为),125.(chidst,故接受原假设,即学生对这些课程的选择没有倾向性,.823749.p各门课选课人数的频率为 0.1。【第 4 题】解:(1)由题可知,r=3,n=5606,假设 1997 年 8 月中国股民投资状况的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设:原假设: 类 所占的比例为:0HiA)3,21(0ipi其中 为股票投资中对应的赢、持平和亏, 已知,)3,21(i )3,21(0ip30ip则 检验的计算过程如下表所示:2股票投资状况 in0inp02)(iiinp1A1697 560.6 2303.61
6、21321780 1121.2 387.1008232129 3924.2 821.24842合计 5606 5606 96137.52在这里 。检验的 p 值等于自由度为 2 的 变量大于等于 3511.96137r的概率。在 Excel 中输入“ ”,得出对应的 p 值为),791.5(chidst,故拒绝原假设,即认为 1997 年 8 月中国股民投资状况的调查数05.p据和比较流行的说法是不相符合的。(2)解:由题知股票投资中,赢包括盈利 10%及以上、盈利 10%以下,符合条件的股民共有 151+122=273 人;持平可以指基本持平,符合条件的股民共有240 人;亏包括亏损不足 1
7、0%和亏损 10%及以上,符合条件的股民共有517+240=757 人。由题可知,r=3,n=1270,假设 2003 年 2 月上海青年报上的调查数据和比较流行的说法是相符合。所以我们可以进行以下假设:原假设: 类 所占的比例为:0HiA)3,21(0ipi其中 为股票投资中对应的赢、持平和亏, 已知,)3,21(iA i30ip则 检验的计算过程如下表所示:2股票投资状况 in0inp02)(iiinp1A273 127 167.84252 2240 254 0.77165 3757 889 19.59955 合计 1270 1270 2137.8在这里 。检验的 p 值等于自由度为 2
8、的 变量大于等于 188.21372 的3r概率。在 Excel 中输入“ ”,得出对应的 p 值为),137.8(chidst,故拒绝原假设,即认为 2003 年 2 月上海青年报上的调查数据和05.p比较流行的说法是不相符合的。【第 5 题】解:由题意,我们将“开红花” 、 “开白花”和“开粉红色花”分别记为,并记 所占的比例为 ,本题所要检验的原假设为:321,Ai )3,21(ippqqH2 : 310 其中 ,这些 都依赖一个未知参数 。在原假设 成立时的似然函数1qpipp0H为 1321086324 )()()(qL则对 L(p)取对数得 )ln(l108)(lnpp从而有对数似
9、然方程 032)(lL即 。据此求得 p 的极大似然估计 ,从而得到 的极大p132)(08 45.pip似然估计 。它们分别为 0.2025、0.3025 和 0.495。由此得3,),(iii各类的期望频数的估计值 。它们分别为 24.3、36.3、132.20 和,21ni59.4。所以 2统计量的值为 0.1244.59)6(3.)(3.4)( 2222 这里 r=3,m=1,r-m-1=1。检验的 p 值等于自由度为 1 的 变量。利用 Excel可以算出 p 值 ,故接受原假设,即我们0.18.0),2.(chidst认为以上数据在 0.05 的水平下与遗传学理论是相符的。【第 6
10、 题】解:由题意,我们可以得到以下信息: 遗传因子的分布律为:(其中 p+q+r=1)遗传因子 ABO概率 pqr血型的分布律为:血型 OABAB概率 2rpr2qr2pq2将“O”血型、 “A”血型、 “B”血型和“AB”血型这四类血型分别记为,并记 所占的比例为 ,本题所要检验的原假设为: 41A., i )4,.1( ippqqrrrH 2 ,2 ,p : 423210 这些 都依赖两个未知参数 。在原假设 成立时的似然函数为 ipq0H581321324643678 582234 )()()1( ), pqqppprrrqL 则对 L(p,q)求对数得 pqqqpL 2ln58)ln(
11、l)ln(l)ln(748),(ln 对 求偏导数得 , 0582132870174ln 640436qpqpqpL利用 Mathematica 软件求解(程序编码及运行结果见附录)解得 p 和 q 的极大似然估计为 ,从而得 的极大似然估10.89,.i计 。它们分别为 0.37332、 0.43668、0.13220 和4,.1 ),(iii0.05780。由此得各类的期望频数的估计值 。它们分别为,.4i pn373.32、436.68、132.20 和 57.80。所以 统计量的值为 20329. 80.57)(0.13)(68.43)(.7)4( 2222 这里 r=4,m=2,r-
12、m-1=1。检验的 p 值等于自由度为 1 的 变量。有 Excel 可2以算出 p 值为 ,故接受 ,我们认为05. 942.0)1 ,32.0(chidst 0H以上数据与遗传学理论是相符的。附录 程序代码:NSolve(-748)/(1-p-q)+436/p+(-436)/(2-p-2*q)+0+(-264)/(2-q-2*p)+58/p=0,(-748)/(1-p-q)+0+(-872)/(2-p-2*q)+132/q+(-132)/(2-q-2*p)+58/q=0,p,q/MatrixForm利用 Mathematica 软件运行结果:Out21 /MatrixForm 0.981
13、q0.2863 p472575.6 .9 1注:在上述结果中由于p + q = 1-r 1,所以软件运行的结果中只有第四个解满足条件,即p和q的极大似然估计为 。10.89,2.0qp【第 7 题】解:由题知,在豌豆实验中,子系从父系(或母系)接受显性因子“黄色”和“青色”的概率分别为 p 和 1-p,而子系从父系(或母系)接受显性因子“圆”和“有角”的概率分别为 q 和 1-q。我们将豌豆实验中得到的“黄而圆的” 、 “青而圆的” 、 “黄而有角的”和“青而有角的”这四类豌豆分别记为 , , , ,则这四类豌豆的分布律如下1A234A表所示:豌豆类型 1A234A概率 )(2qp2)1(p2
14、)1(q2)1(qp将豌豆类型 所占的比例记为 ,则本题所要检验的原假设为:i 4,. i 242310 )1( ,)( : qpqpH这些 都依赖两个未知参数 。在原假设 成立时的似然函数为 ip,0H2628042341642316 322102135)()()( )()(),( qpqpq qpL 则对 L(p,q)求对数得)1ln(26)1ln(280)ln(423)ln(416l23ln416),(ln qpqpqpqpL 对 求偏导数得 ,012643lnqqLpp即得出下列方程: 08324126qp解得 p 和 q 的极大似然估计为 ,从而得 的极大似然估9.51,.0ip计 。它们分别为 0.56923、 0.17898、0.19157 和4,. ),(iii0.06023.由此得各类的期望频数的估计值 。它们分别为,.4i pn316.489、99.511、106.511 和 33.489。所以 统计量的值为 2082564.1 489.3)(51.06)(51.9)08(.3)( 222 这里 r=4,m=2,r-m-1=1。检验的 p 值等于自由度为 1 的 变量。利用 Excel2可以算出 p 值为 ,故接受 ,我们认05. 298.0)1 ,8564.(chidst 0H为观察数据与这样一个遗传学的模型是相符的。