1、第二章2.1 x e z z1 z2 A C D E F G x H for (i in 1:5)+ for(j in 1:5)+ Hi,j det(H)(2) solve(H)(3) eigen(H)2.5 studentdata write.table(studentdata,file=student.txt) write.csv(studentdata,file=student.csv)2.7count data_outline(x)3.2 hist(x,freq=F) lines(density(x),col=red) y lines(y,dnorm(y,73.668,3.9389),
2、col=blue) plot(ecdf(x),verticals=T,do.p=F) lines(y,pnorm(y,73.668,3.9389) qqnorm(x) qqline(x)3.3 stem(x) boxplot(x) fivenum(x)3.4 shapiro.test(x) ks.test(x,pnorm,73.668,3.9389)One-sample Kolmogorov-Smirnov testdata: xD = 0.073, p-value = 0.6611alternative hypothesis: two-sidedWarning message:In ks.t
3、est(x, “pnorm“, 73.668, 3.9389) :ties should not be present for the Kolmogorov-Smirnov test这里出现警告信息是因为 ks 检验要求样本数据是连续的,不允许出现重复值3.5x1 boxplot(x1,x2,x3,names=c(x1,x2,x3),vcol=c(2,3,4)windows()plot(factor(c(rep(1,length(x1),rep(2,length(x2),rep(3,length(x3),c(x1,x2,x3)3.6 rubber plot(rubber)具体有相关关系的两个变
4、量的散点图要么是从左下角到右上角(正相关) ,要么是从左上角到右下角(负相关) 。从上图可知所有的图中偶读没有这样的趋势,故均不相关。3.7(1) student attach(student) plot(体重身高)(2) coplot(体重身高 |性别)(3) coplot(体重身高 |年龄)(4) coplot(体重身高 |年龄+ 性别)只列出(4)的结果,如下图3.8 x f zcontour(x,y,z,levels=c(0,1,2,3,4,5,10,15,20,30,40,50,60,80,100),col=blue) windows() persp(x,y,z,theta=30,p
5、hi=30,expand=0.7,col=red)3.9 cor.test(身高 ,体重)根据得出的结果看是相关的。具体结果不再列出3.10 df stars(df)然后按照 G 的标准来画出星图 attach(df) df$G1 df$G2 df$G3 df$G4 df$G5 a stars(a)这里从 17 开始取,是因为在 df 中将 ID 也作为了一列3.11使用 P159 已经编好的函数 unison,接着上题,直接有 unison(a)第四章4.1(1)先求矩估计。总体的期望为 。因此我们有 。可解12()axd 12()aEx得 a=(2*E( )-1 )/(1-E( ).因此我
6、们用样本的均值来估计 a 即可。 在 R 中实现如下 x (2*mean(x)-1)/(1-mean(x)1 0.3076923(2)采用极大似然估计首先求出极大似然函数为(;)=1(+1)=(+1)=1再取对数为ln(;)=(+1)+(=1最后求导(;) = +1+=1好了下面开始用 R 编程求解,注意此题中 n=6.方法一、使用 unniroot 函数 f uniroot(f,c(0,1)方法二、使用 optimize 函数 g optimize(g,c(0,1),maximum=T)4.2用极大似然估计得出 .现用 R 求解如下=/=1x 1000/sum(x)4.3换句话讲,就是用该样本来估计泊松分布中的参数,然后求出该分布的均值。我们知道泊松分布中的参数 ,既是均值又是方差。因此我们只需要用样本均值作矩估计即可在 R 中实现如下 x mean(x)1 14.4 f nlm(f,c(0.5,-2)4.5在矩估计中,正态分布总体的均值用样本的均值估计。故在 R 中实现如下 x mean(x)1 67.4然后用 t.test 作区间估计,如下 t.test(x) t.test(x,alternative=less) t.test(x,alternative=greater)此时我们只需要区间估计的结果,所以我们只看 t.test 中的关于置信