一、主成分分析基本原理概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。 思路:一个研究对象,往往是多要素的复杂系统。变量太多无疑会增加分析问题的难度和复杂性,利用原变量之间的相关关系,用较少的新变量代替原来较多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这样问题就简单化了。 原理:假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵,记原变量指标为x1,x2,xp,设它们降维处理后的综合指标,即新变量为 z1,z2,z3, ,zm(mp),则系数lij的确定原则: zi与zj(ij;i,j=1,2,m)相互无关;z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP , 的所有线性组合中方差最大者。新变量指标z1,z2,zm分别称为原变量指标x1,x2,x