主成分分析 11.1 什么是主成分分析及其基本思想 问题的提出: 在对某一事物进行实证分析研究中,为了更全面准确反映出事 物的特征及其发展规律,往往考虑与其有关系的多个指标,因此会 产生的问题: (1)为避免漏掉重要信息而考虑尽量多的指标 (2)随着考虑指标的增多增加了问题的复杂性,并且多指标之间 不可避免会造成信息的大量重叠(相关性),这种重叠有时甚至会 掩盖事物的真正特征与内在规律。 目的:11.1 什么是主成分分析及其基本思想 主成分分析(Principal Component Analysis,PCA)也称为主分量 分析,是一种数据降维技术,主成分分析正是研究如何将多个具有较强相 关性指标化为少数几个综合指标来解释原来变量绝大多数信息的一种多元 统计方法。把转化生成的综合指标称之为主成分。 11.1 什么是主成分分析及其基本思想 例1:某厂商要做一件上衣,需要测量很多尺寸,如 身长,体重,袖长,胸围,腰围,肩宽,肩厚等十几项指标 将多种指标综合成几个少数的综合指标,作为分类的型号,可综合成3项指标 : 一项反映长度的指标,一项反映胖瘦的指标,一项反映特体的指标。例2:医学研究中