主成分分析 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 在实际问题研究中,多变量问题是经常会 遇到的。变量太多,无疑会增加分析问题的难 度与复杂性,而且在许多实际问题中,多个变 量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关 分析的基础上,用较少的新变量代替原来较多 的旧变量,而且使这些较少的新变量尽可能多 地保留原来变量所反映的信息? 问题的提出: 事实上,这种想法是可以实现的,主成分分 析方法就是综合处理这种问题的一种强有力的工 具。 主成分分析是把原来多个变量划为少数几个 综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。 n 例如,某人要做一件上衣要测量很多尺寸,如 身长、袖长、胸围、腰围、肩宽、肩厚等十几 项指标,但某服装厂要生产一批新型服装绝不 可能把尺寸的型号分得过多 ?而是从多种指标 中综合成几个少数的综合指标,做为分类的型 号,利用主成分分析将十几项指标综合成3项 指标,一项是反映长度的指标,一项是反映胖 瘦的指标,一项是反映特体的指标。一、主成分分析的基本原理 假定有n个样本,每个样本共有p个变量 ,