“物以类聚”,对事物分门别类进行研究,有利于我们 做出正确的判断。 数理统计中的数值分类有两种问题: 判别分析 判别分析:已知分类情况,将未知个体归入正确类别 聚类分析 聚类分析:分类情况未知,对数据结构进行分类 通过分类,有利于抓住重点,从总体上去把握事物, 找出解决问题的方法。如将股票进行分类,可以投资 提供参考。 聚类分析(Cluster Analysis)简介 聚类分析是直接比较各事物之间的性质,将性质相近的 归为一类,将性质差别较大的归入不同的类的分析技术 。 要做聚类分析,首先得按照我们聚类的目的,从对 象中提取出能表现这个目的的特征指标;然后根据亲 疏程度进行分类。 聚类分析根据分类对象的不同可分为Q型和R型两大类 Q型是对样本进行分类处理,其作用在于: 1. 能利用多个变量对样本进行分类 2. 分类结果直观,聚类谱系图能明确、清楚地表达 其数值分类结果 3. 所得结果比传统的定性分类方法更细致、全面、 合理 二、聚类对象R型是对变量进行分类处理,其作用在于: 1. 可以了解变量间及变量组合间的亲疏关系 2. 可以根据变量的聚类结果及它们之间的关系, 选择主要变量进行回归