第七章 主成分分析 v 7.1 引言 v 7.2 总体的主成分 v 7.3 样本的主成分7.1 引言 v 主成分分析( 或称主分量分析,principal component analysis) 由皮尔逊(Pearson,1901) 首先引入,后来 被霍特林(Hotelling,1933) 发展了。 v 主成分分析是一种通过降维技术把多个变量化为少 数几个主成分( 即综合变量) 的统计分析方法。这些 主成分能够反映原始变量的绝大部分信息,它们通 常表示为原始变量的某种线性组合。 v 主成分分析的一般目的是:(1) 变量的降维;(2) 主成 分的解释。寻找主成分的正交旋转 v 旋转公式:7.2 总体的主成分 v 一、主成分的定义及导出 v 二、主成分的性质 v 三、从相关阵出发求主成分一、主成分的定义及导出 v 设 为一个 维随机向量, , 。考虑如下的线性变换 希望在约束条件 下寻求向量 ,使 得 达到最大, 就称为第一主成分。 v 设 为 的特征值, 为相应的单位特征向量,且相互正交。 则可求得第一主成分为 它的方差具有最大值 。 v 如果第一主成分所含信息不够多,还不足以代表原 始