R聚类分析Clustering Analysis主讲人:吕朝晖西北大学智能信息处理实验室1目录什么是聚类距离度量方法几种常见的聚类方法练习2概述监督学习(supervised learning)无监督学习(unsupervised learning)半监督学习(Semi-Supervised Learning)概述3从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果监督学习就是最常见的分类问题监督学习的目标往往是让计算机去学习我们已经创建好的分类模型最典型的算法是KNN和SVM监督学习(supervised learning)4输入数据没有标记,也没有确定的结果样本数据类别未知,需要根据样本间的相似性对样本集进行聚类非监督学习目标不是告诉计算机怎么做,而是让计算机自己去学习怎样做非监督学习(unsupervised learning)5无监督学习的方法分为两大类:基于概率密度函数估计的直接方法基于样本间相似性度量的简介聚类方法:设法定出不同类别的核心或初始内核,然后依据样本与核心之间的相似性度量将样本聚集成不同的类别非监督学习(unsupervi