简单朴素贝叶斯分类器的思想与算法分析在数据仓库和数据挖掘应用中,分类是一种非常重要的方法分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型,即我们通常所说的分类器(Classifier)该函数或模型能够把数据集合中的数据记录映射到给定类别中的某一个值,从而可以应用于数据预测目前,分类的主要算法有贝叶斯算法、决策树算法(如ID3、C4.5等)、规则推导、人工神经网络、最近邻算法、支持向量机等等这些算法在许多现实数据集合上具有较好的预测精度其中朴素贝叶斯算法具有良好的可解释性等,在实践中的应用最为广泛朴素贝叶斯算法是基于统计理论的方法,它能够预测所属类别的概率简单朴素贝叶斯分类器假设一个指定类别中各属性的取值是相互独立的这一假设称为给定类别条件下的独立性(Class Conditional Independence)假设,它可以有效减少在构造分类器时所需要的计算量简单朴素贝叶斯算法的分类模型是基于Bayes定理的,下面就简单介绍一下Bayes定理设X为一个类别未知的数据样本,H为某个假设,C表示类别集合,若数据样本X属于一个特定的类别c,那么