对数据进行聚类分析实验报告 对数据进行聚类分析实验报告 徐远东 任争刚 权荣 一、 基本要求 用 FAMALE.TXT、MALE.TXT 和/或 test2.txt 的数据作为本次实验使用的样本集,利用 C 均值和分级聚类方法对样本集进行聚类分析,对结果进行分析,从而加深对所学内容的理解和感性认识。 二、 实验要求 1、 把 FAMALE.TXT 和 MALE.TXT 两个文件合并成一个,同时采用身高和体重数据作为特征,设类别数为 2,利用 C 均值聚类方法对数据进行聚类,并将聚类结果表示在二维平面上。尝试不同初始值对此数据集是否会造成不同的结果。 2、 对 1 中的数据利用 C 均值聚类方法分别进行两类、三类、四类、五类聚类,画出聚类指标与类别数之间的关系曲线,探讨是否可以确定出合理的类别数目。 3、 对 1 中的数据利用分级聚类方法进行聚类,分析聚类结果,体会分级聚类方法。 4、 利用 test2.txt 数据或者把 test2.txt 的数据与上述 1 中的数据合并在一起,重复上述实验,考