罗树生主成分分析主成分分析x2c1x1x2C1x1x2x3主成分分析(Principal Component Analysis,PCA)是一种数据降维技术,将多个具有较强相关性的实测变量综合成少量综合变量。一个度量指标的好坏除了可靠、真实之外,还必须能充分反映个体间的变异。如果有一项指标,不同个体的取值都大同小异,那么该指标不能用来区分不同的个体。由这一点来看,一项指标在个体间的变异越大越好。因此我们把“变异大”作为“好”的标准来寻求综合指标。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。主成分分析的几何解释平移、旋转坐标轴 如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Cl和C2。Cl和C2是两个新变量。根据旋转变换的公式:旋转变换的目的是为了使得n个样品点在Cl轴方向上的离 散程度最大,即Cl的方差最大。变量Cl代表了原始数据的绝大 部分信息,在研究某问题时,即使不考虑变量C2也无损大局。经过上述旋转变换原始数据的