1主成分分析主成分分析和因子分析和因子分析 在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。本章介绍的主成分分析和因子分析可用于解决这类问题。2 主成分分析(principal components analysis,简称PCA)是由霍特林(Hotelling)于1933年首先提出的。它通过投影的方法,实现数据的降维,在损失较少数据信息的基础上把多个指标转化为几个有代表意义的综合指标。1 1 主成分分析主成分分析31.1 1.1 主成分分析的基本思想主成分分析的基本思想 假如对某一问题的研究涉及 p 个指标,记为X1,X2, , Xp,由这 p 个随机变量构成的随机向量为X=(X1, X2, , Xp) ,设 X 的均值向量为,协方差矩阵为。设Y=(Y1, Y2 , , Yp) 为对 X 进行线性变