1、班级:信息 1101 姓名:臧晓玲 学号:201110010127第四章 习题一、习题 4.4解:(1)通过 SAS 的 proc princomp 过程对相关系数矩阵 R 做主成分分析,得到个主成分的贡献率以及累计贡献率如表 1 所表 1Eigenvalues of the Correlation MatrixEigenvalue Difference Proportion Cumulative1 2.85671099 2.04754728 0.5713 0.57132 0.80916372 0.26948848 0.1618 0.73323 0.53967524 0.08817514 0.
2、1079 0.84114 0.45150010 0.10855015 0.0903 0.93145 0.34294995 0.0686 1.0000从表中可以得到特征值向量为: 0.249 510.396 812.567第一主成分贡献率为:57.13 % 第二主成分贡献率为:16.18 %第三主成分贡献率为: 10.79% 第四主成分贡献率为:9.03 %第五主成分贡献率为:6.86 %进一步得到各主成分分析结果如表 2 所示:表 2EigenvectorsPrin1 Prin2 Prin3 Prin4 Prin5x1 0.463605 -.240339 -.611705 0.386635 -
3、.451262x2 0.457108 -.509305 0.178189 0.206474 0.676223x3 0.470176 -.260448 0.335056 -.662445 -.400007x4 0.421459 0.525665 0.540763 0.472006 -.175599x5 0.421224 0.581970 -.435176 -.382439 0.385024班级:信息 1101 姓名:臧晓玲 学号:201110010127(2)由(1)中得到的结果可知前两个主成分的累积贡献率为 73.32%,得到第一主成分、第二主成分为: 5421.04215.0347.0251
4、463.01 xxxxY 8769322 由于 是五个标准化指标的加权和,由此第一主成分更能代表三种1化工股票和两种石油股票周反弹率的综合作用效果, 越大表示各1Y股票的综合周反弹率越大。 中关于三种化工股票的周反弹率系数2Y为负,而关于两种石油的系数为正,它放映了两种石油周反弹率和三种化工股票周反弹率的对比, 的绝对值越大,表明两种石油周2反弹率和三种化工股票周反弹率的差距越大。二、习题 4.5解:(1)利用 SAS 的 proc corr 过程求得相关系数矩阵如表 3:表 3Correlation Matrixx1 x2 x3 x4 x5 x6 x7 x8x1 1.0000 0.3336
5、-.0545 -.0613 -.2894 0.1988 0.3487 0.3187x2 0.3336 1.0000 -.0229 0.3989 -.1563 0.7111 0.4136 0.8350x3 -.0545 -.0229 1.0000 0.5333 0.4968 0.0328 -.1391 -.2584x4 -.0613 0.3989 0.5333 1.0000 0.6984 0.4679 -.1713 0.3128x5 -.2894 -.1563 0.4968 0.6984 1.0000 0.2801 -.2083 -.0812x6 0.1988 0.7111 0.0328 0.4
6、679 0.2801 1.0000 0.4168 0.7016x7 0.3487 0.4136 -.1391 -.1713 -.2083 0.4168 1.0000 0.3989x8 0.3187 0.8350 -.2584 0.3128 -.0812 0.7016 0.3989 1.0000(2)从相关系数矩阵出发,通过 proc princomp 过程对其进行主成分分析,表 4 给出了各主成分的贡献率以及累积贡献率:班级:信息 1101 姓名:臧晓玲 学号:201110010127表 4Eigenvalues of the Correlation MatrixEigenvalue Diff
7、erence Proportion Cumulative1 3.09628829 0.72906522 0.3870 0.38702 2.36722307 1.44723572 0.2959 0.68293 0.91998735 0.21406199 0.1150 0.79794 0.70592536 0.20748303 0.0882 0.88625 0.49844233 0.26855403 0.0623 0.94856 0.22988831 0.09911254 0.0287 0.97727 0.13077577 0.07930623 0.0163 0.99368 0.05146954
8、0.0064 1.0000第一主成分贡献率为:38.70 % 第二主成分贡献率为:29.59 %第三主成分贡献率为: 11.50% 第四主成分贡献率为:8.82 %第五主成分贡献率为:6.23 % 第六主成分贡献率为:2.87 %其中前两个主成分的累计贡献率为 68.29%(3)通过上面的计算得到各主成分,见表 5:表 5EigenvectorsPrin1 Prin2 Prin3 Prin4 Prin5 Prin6 Prin7 Prin8x1 0.249607 -.241238 0.693918 -.376770 0.502313 -.018418 -.036543 0.045052x2 0.
9、519234 -.037607 -.071261 -.224871 -.424453 0.001760 -.282467 0.642950x3 -.018480 0.475439 0.577819 0.032379 -.510472 -.173344 0.381416 -.050854x4 0.254092 0.538081 -.021777 -.231066 0.010358 0.399113 -.471680 -.458432x5 0.021695 0.575449 -.048087 0.285368 0.516270 0.146109 0.159192 0.520977x6 0.4926
10、63 0.134676 -.145348 0.224222 0.177156 -.754966 -.081452 -.244442x7 0.317147 -.260682 0.286391 0.768116 -.090759 0.355165 -.130720 -.089297x8 0.509332 -.087081 -.271279 -.176990 0.026015 0.304720 0.708416 -.18082185093.7310 6927.05216.0425.031.21246xx xxxY 班级:信息 1101 姓名:臧晓玲 学号:2011100101270.871x-26
11、0.1347x6+570.381x4+4753624Y由于是 八个标准化标值的加权值,因此它反映了平均消费数据的1综合指标。对于 Y1,它反映了各省人均消费水平,除烟茶酒外,其他支出越高,其人均总体消费水平越高,而烟茶酒对其消费水平评价成反方向。在 Y2 中人均粮食,人均副食品,人均燃料,人均非商品的系数为负;人均烟茶酒、人居其他副食、人均衣着、人均日用品系数为正,说明 Y2 的绝对值越大,各省人均消费的在生活必需品与高档品差异越大。根据第一主成分的得分对各个省份进行排序,见表 6:表 6Obs location Prin1 Obs location Prin11 广东 6.89591 16
12、宁夏 -0.430402 上海 3.24842 17 湖南 -0.518023 北京 1.79214 18 陕西 -0.612744 浙江 1.51507 19 云南 -0.666705 海南 1.40116 20 新疆 -0.818506 福建 1.15390 21 青海 -1.113357 广西 1.05651 22 安徽 -1.114968 天津 0.43543 23 甘肃 -1.182239 江苏 0.15329 24 内蒙古 -1.2581910 辽宁 0.04520 25 贵州 -1.2593411 西藏 -0.13324 26 吉林 -1.2937012 四川 -0.13489
13、27 黑龙江 -1.3256713 山东 -0.14112 28 河南 -1.4859514 湖北 -0.17044 29 山西 -1.6844815 河北 -0.39220 30 江西 -1.96091三、习题 4.6班级:信息 1101 姓名:臧晓玲 学号:201110010127解:(1)通过 SAS 的 proc princomp 过程计算得到样本协方差矩阵见表 7:表 7Covariance Matrixx1 x2 x3 y1 y2 y3x1 97.3333333 17.8095238 12.0297619 58.7202381 22.3511905 61.5297619x2 17.
14、8095238 74.5799320 14.2185374 3.3261054 61.6215986 -3.8558673x3 12.0297619 14.2185374 76.9693878 41.6675170 31.2185374 66.1092687y1 58.7202381 3.3261054 41.6675170 779.1539116 310.1594388 192.4234694y2 22.3511905 61.6215986 31.2185374 310.1594388 510.0799320 156.1857993y3 61.5297619 -3.8558673 66.10
15、92687 192.4234694 156.1857993 485.3324830求得协方差矩阵的特征值以及各样本主成分的贡献率、累计贡献率结果如表 8:表 8Eigenvalues of the Covariance MatrixEigenvalue Difference Proportion Cumulative1 1097.39817 699.40213 0.5423 0.54232 397.99604 84.89703 0.1967 0.73903 313.09901 213.35419 0.1547 0.89384 99.74482 29.62682 0.0493 0.94315 7
16、0.11800 25.02504 0.0347 0.97776 45.09295 0.0223 1.0000从以上结果可看出前三个主成分贡献率已占 89.38%,大于剩下三个成分的总和,已包含原始数据的大量信息,所以保留前三个主成分即可。(2)通过 SAS 的 proc princomp 过程对其相关系数矩阵进行主成分分析,首先得到相关系数矩阵见表 9:班级:信息 1101 姓名:臧晓玲 学号:201110010127表 9Correlation Matrixx1 x2 x3 y1 y2 y3x1 1.0000 0.2090 0.1390 0.2132 0.1003 0.2831x2 0.20
17、90 1.0000 0.1877 0.0138 0.3159 -.0203x3 0.1390 0.1877 1.0000 0.1701 0.1576 0.3420y1 0.2132 0.0138 0.1701 1.0000 0.4920 0.3129y2 0.1003 0.3159 0.1576 0.4920 1.0000 0.3139y3 0.2831 -.0203 0.3420 0.3129 0.3139 1.0000求得协方差矩阵的特征值以及各样本主成分的贡献率、累计贡献率结果如表 10:表 10Eigenvalues of the Correlation MatrixEigenvalu
18、e Difference Proportion Cumulative1 2.12157166 1.03736370 0.3536 0.35362 1.08420796 0.08624620 0.1807 0.53433 0.99796176 0.12628298 0.1663 0.70064 0.87167877 0.29225146 0.1453 0.84595 0.57942731 0.23427477 0.0966 0.94256 0.34515254 0.0575 1.0000从以结果可看出前四个主成分贡献率已占 84.59%且第四个主成分的贡献率都占到总信息量的的 14.53%,与剩
19、下两个成分的总和差不多,所以保留前四个主成分即可。我认为基于协方差矩阵 S 的分析结果更合理。因为由协方差矩阵输出结果可以看出前三个主成分的贡献率就可达到 89.38%大于相S关系数矩阵 R 分析得到前四个主成分贡献率总和 84.59%,且空腹和摄入食糖的测量数据量纲相等无需进行标准化数据,所以基于协方差矩阵 S 的分析结果更为合理。班级:信息 1101 姓名:臧晓玲 学号:201110010127四、习题 4.8(1)通过 proc cancorr 过程求得以下结果:表 11Eigenvalues of Inv(E)*H= CanRsq/(1-CanRsq)CanonicalCorrelat
20、ionAdjustedCanonicalCorrelationApproximateStandardErrorSquaredCanonicalCorrelation Eigenvalue Difference Proportion Cumulative1 0.397112 0.396910 0.008423 0.157698 0.1872 0.1819 0.9723 0.97232 0.072889 . 0.009947 0.005313 0.0053 0.0277 1.0000两个特征值分别为121R15769802053.2计算得到各典型变量系数见表下表:Standardized Cano
21、nical Coefficients for the VAR VariablesV1 V2x1 1.2478 0.3180x2 -1.0330 0.7687Standardized Canonical Coefficients for the WITH VariablesW1 W2y1 1.1019 -0.0071y2 -0.4564 1.0030所以有第一对典型变量为:211456.093278YWXV第一对典型相关系数 ;3.0第二对典型变量为: 21203.7068YWXV第二对典型相关系数 89.(2)对典型变量进行显著性检验,结果见表 12,其中班级:信息 1101 姓名:臧晓玲 学号:201110010127P1=0.001 F1 0.83782737 462.33 4 19992 F1 0.37716288 6.60 4 42 0.00032 0.99711204 0.06 1 22 0.8031取显著水平为 0.05,其中第一对典型变量的检验 p 值为 0.003,小于0.05,所以第一对典型变量显著相关,而第二对典型变量的检验 p 值为 0.8031,大于 0.05,所以第二对典型变量不是显著相关。