.统计方法6 聚类分析第一节 基本概念 1分类问题直观解释:聚类分析就是用某种准则将靠近的点集归为一类对样本(观测值)进行聚类,也可以对指标(变量)进行聚类。2 距离样品之间的距离设p维空间内的点及定义两点之间的距离(1)欧氏距离(2)马氏距离其中是数据矩阵的协方差阵。马氏距离的优点是考虑了空间内的概率分布,在正态总体的情况下,有比较好的效果。距离的定义比较灵活,只要满足条件都可以作为聚类时的距离。变量之间的距离变量之间的距离要考虑到变量之间的相互关系。常用的距离如夹角余弦,相关系数等类和类之间的距离在聚类过程中,要涉及到类和类之间的合并,因此也要考虑类间的距离。如 类间最短距离设是样本i和样本j之间的距离,是类和类之间的距离 定义类间的最短距离为 =类似的可以定义类间的最长距离,平均距离等。 第二节 系统聚类法系统聚类方法是非常容易在计算机上实现的一种聚类方法,其聚类步骤为:1)将空间各点各自视为一类,计算每类间的距离
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。