精选优质文档-倾情为你奉上分类Classification:分类是指将目标对象按照不同的标记进行分组,所有的标记都是已知的,这些对象往往都具有不同的特点。也就是说对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子。理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类预测的能力,这种提供训练数据的过程通常叫做(监督学习)。应用场景:银行贷款安全和风险、信用卡持卡用户进行分类KNN算法:K最邻近分类算法(K-Nearest Neighbor),最简单的机器学习算法之一。思路是:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某个类,则该样本也属于某个类别。如上图所示,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。决策树分类算法ID3:ID3算法是由Quinlan首先提出的。该算法