精选优质文档-倾情为你奉上朴素贝叶斯算法1. 算法简介朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。2. 算法定义朴素贝叶斯分类的正式定义如下:1)设为一个待分类项,而每个a为x的一个特征属性;2)有类别集合;3)计算。4)如果,则。其中关键是如何计算步骤3)中的各个条件概率。计算过程如下:(1)找到一个已知分类的待分类项集合,该集合称为训练样本集。(2)统计得到在各类别下各个特征属性的条件概率估计。即(3)如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:因为分母对于所有类别为常数,因此只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:可以看到,整个朴素贝叶斯分类分为三个阶段:第一阶段准备工作阶段,这个阶段的任务是为朴素贝叶斯分类做必要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性进行适当划