精选优质文档-倾情为你奉上文本数据挖掘算法应用小结1、基于概率统计的贝叶斯分类2、ID3 决策树分类3、基于粗糙集理论Rough Set的确定型知识挖掘4、基于k-means聚类5、无限细分的模糊聚类Fuzzy Clustering6、SOM神经元网络聚类7、基于Meaning的文本相似度计算8、文本模糊聚类计算9、文本k-means聚类10、文本分类11、关联模式发现12、序列模式发现13、PCA主成分分析1、基于概率统计的贝叶斯分类算法概述:贝叶斯公式是由英国数学家( Thomas Bayes 1702-1763 )创造,用来描述两个条件概率之间的关系,比如 P(A|B) 为当“B”事件发生时“A”事件发生的概率,按照乘法法则:P(AB)=P(A)*P(B|A)=P(B)*P(A|B),可导出贝叶斯公式:P(A|B)=P(B|A)*P(A)/P(B)贝叶斯分类基本思想为:设决策变量为D,D1,D2,Di,Dk为n条记录组成的样本空间S的一个划分,将n条记录划分成k个记录集合,如果以P(D