1、1R,从零水平开始。国内真的没有一本像样的 R 教科书啊!勉强用用薛毅编的统计建模与 R 软件 吧,找不出更好的了工作环境仍是 linux。第二章答案:Ex2.1xhist(serumdata,freq=FALSE,col=“purple“,border=“red“,density=3,angle=60,main=paste(“the histogram of serumdata“),xlab=“age“,ylab=“frequency“)#直方图。col 是填充颜色。默认空白。border 是边框的颜色,默 认前景色。density 是在图上画条纹阴影,默认不画。angle 是条 纹阴影的倾
2、斜角度(逆时针方向),默认 45 度。main, xlab, ylab 是标题,x 和 y 坐标轴名称。lines(density(serumdata),col=“blue“)#密度估计曲线 。7x lines(x,dnorm(x,mean(serumdata),sd(serumdata),col=“green“) #正态分布的概率密度曲线 plot(ecdf(serumdata),verticals=TRUE,do.p=FALSE) #绘制经验分布图 lines(x,pnorm(x,mean(serumdata),sd(serumdata),col=“blue“) #正态经验分布 qqnor
3、m(serumdata,col=“purple“) #绘制 QQ 图 qqline(serumdata,col=“red“) #绘制 QQ 直线Ex3.3 stem(serumdata,scale=1) #作茎叶图。原始数据小数点后数值四舍五入。The decimal point is at the |64 | 30066 | 2333368 | 0088877770 | 3444444222272 | 000000077777775555555555574 | 03333333370000000468888876 | 555555522678 | 088855580 | 35526682 |
4、84 | 3boxplot(serumdata,col=“lightblue“,notch=T) #作箱线图。notch 表示带有缺口。 fivenum(serumdata) #五数总结1 64.3 71.2 73.5 75.8 84.3Ex3.4 shapiro.test(serumdata) #正态性 Shapori-Wilk 检验方法Shapiro-Wilk normality testdata: serumdataW = 0.9897, p-value = 0.6437结论:p 值0.05,可认为来自正态分布的总体。8 ks.test(serumdata,“pnorm“,mean(se
5、rumdata),sd(serumdata) #Kolmogrov-Smirnov检验,正态性One-sample Kolmogorov-Smirnov testdata: serumdataD = 0.0701, p-value = 0.7097alternative hypothesis: two-sidedWarning message:In ks.test(serumdata, “pnorm“, mean(serumdata), sd(serumdata) :cannot compute correct p-values with ties结论:p 值0.05,可认为来自正态分布的总体
6、。注意,这里的警告信息,是因为数据中有重复的数值, ks 检验要求待检数据时连续的,不允许重复值。Ex3.5 y f plot(f,y,col=“lightgreen“) #plot()生成箱线图 x y z boxplot(x,y,z,names=c(“1“,“2“,“3“),col=c(5,6,7) #boxplot()生成箱线图结论:第 2 和第 3 组没有显著差异。第 1 组合其他两组有显著差异。Ex3.6数据太多,懒得录入。离散图应该用 plot 即可。Ex3.7 studata data.frame(studata) #转化为数据框V1 V2 V3 V4 V5 V61 1 alic
7、e f 13 56.5 84.02 2 becka f 13 65.3 98.093 3 gail f 14 64.3 90.04 4 karen f 12 56.3 77.05 5 kathy f 12 59.8 84.56 6 mary f 15 66.5 112.07 7 sandy f 11 51.3 50.58 8 sharon f 15 62.5 112.59 9 tammy f 14 62.8 102.510 10 alfred m 14 69.0 112.511 11 duke m 14 63.5 102.512 12 guido m 15 67.0 133.013 13 ja
8、mes m 12 57.3 83.014 14 jeffery m 13 62.5 84.015 15 john m 12 59.0 99.516 16 philip m 16 72.0 150.017 17 robert m 12 64.8 128.018 18 thomas m 11 57.5 85.019 19 william m 15 66.5 112.0 names(studata) attach(studata) #将数据框调入内存 plot(weightheight,col=“red“) #体重对于身高的散点图 coplot(weightheight|sex,col=“blue“
9、) #不同性别,体重与身高的散点图 coplot(weightheight|age,col=“blue“) #不同年龄,体重与身高的散点图 coplot(weightheight|age+sex,col=“blue“) #不同年 龄和性别,体重与身高的散点图Ex3.8 x y f z contour(x,y,z,levels=c(0,1,2,3,4,5,10,15,20,30,40,50,60,80,100),col=“blue“) #二维10等值线 persp(x,y,z,theta=120,phi=0,expand=0.7,col=“lightblue“) #三位网格曲面Ex3.9 att
10、ach(studata) cor.test(height,weight) #Pearson 相关性检验Pearsons product-moment correlationdata: height and weightt = 7.5549, df = 17, p-value = 7.887e-07alternative hypothesis: true correlation is not equal to 095 percent confidence interval:0.7044314 0.9523101sample estimates:cor0.8777852由此可见身高和体重是相关的。Ex4.2指数分布, 的极大似然估计是 n/sum(Xi) x lamda x mean(x)1 1平均为 1 个。Ex4.4 obj x0nlm(obj,x0)