精选优质文档-倾情为你奉上层次聚类的评价-共性分类相关系数(cophenetic correlation coeffieient,CPCC) 一个聚类树的共性分类相关性是指由聚类树得到的共性分类距离与构造树时的原始距离(相异性)之间的线性相关系数,因此它是对聚类树在多大程度上代表了样本之间相异性的度量。MATLAB中,用cohenetic计算该相关系数,输入参数为pdist函数输出的样本对距离向量Y和由linkage函数输出的层次聚类树Z,相关系数越接近于1,说明聚类效果越好。该系数的计算公式为:其中,是Y中样本i和j之间的距离,是Z(:,3)中样本i和j的共性分类距离,y和z分别是Y和Z(:,3)的平均值。聚类个数的选择Inconsistent函数用来计算层次聚类树矩阵Z中每次并类得到的链接的不一致系数,输入参数为linkage函数创建的聚类树矩阵Z和计算涉及的链接的层数d,可以理解为计算的深度,d省略时默认为2。输出参数为一个(n-1)*4的矩阵,第4列代表不一致系数。在并类过程中,如果某一次并类所对应的不一致系数较上一次有大幅