§35 主成分分析方法.ppt

上传人:da****u 文档编号:1107460 上传时间:2018-12-07 格式:PPT 页数:21 大小:264.50KB
下载 相关 举报
§35 主成分分析方法.ppt_第1页
第1页 / 共21页
§35 主成分分析方法.ppt_第2页
第2页 / 共21页
§35 主成分分析方法.ppt_第3页
第3页 / 共21页
§35 主成分分析方法.ppt_第4页
第4页 / 共21页
§35 主成分分析方法.ppt_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、第五节 主成分分析方法 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 问题的提出 :事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种

2、降维处理技术。 一、主成分分析的基本原理 n 假定有 n个地理样本,每个样本共有 p个变量,构成一个 n p阶的地理数据矩阵( 3.5.1) n 当 p较大时,在 p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。定义:记 x1, x2, , xP为原变量指标, z1, z2, , zm( mp) 为新变量指标(3.5.2) n系数 lij的确定原则: zi与 zj( ij; i, j=1, 2, , m) 相互无关; z1是 x1,

3、x2, , xP的一切线性组合中方差最大者, z2是与 z1不相关的 x1, x2, , xP的所有线性组合中方差最大者;zm是与 z1, z2, , zm 1都不相关的 x1, x2, xP, 的所有线性组合中方差最大者。则新变量指标 z1, z2, , zm分别称为原变量指标 x1, x2, , xP的第一,第二, ,第 m主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量 xj( j=1, 2 , , p)在诸主成分 zi( i=1, 2, , m) 上的荷载 lij( i=1, 2, , m; j=1, 2 , , p)。从数学上容易知道,从数学上可以证明,它们分别是的相关矩阵的 m个较大的特征值所对应的特征向量。 二、计算步骤 ( 一)计算相关系数矩阵rij( i, j=1, 2, , p) 为原变量 xi与 xj的相关系数, rij=rji, 其 计算公式为:( 3.5.3) ( 3.5.4) (二)计算特征值与特征向量: 解特征方程 ,常用雅可比法(Jacobi) 求 出特征值,并使其按大小顺序排列 ; 分别求出对应于特征值 的特征向量 ,要求 =1,即 ,其中 表示向量 的第 j个分量。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。