数据挖掘中的文本挖掘张聪目录Contents一三二四结语文本挖掘过程文本挖掘的主要研究方向关于数据挖掘和文本挖掘一数据挖掘与文本挖掘Data Mining and Text Mining 数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 文本挖掘一般指文本处理过程中产生高质量的信息,其主要处理过程是对大量文档集合的内容进行预处理、特征提取、结构分析、文本摘要、文本分类、文本聚类、关联分析等操作。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘的分类二文本挖掘的主要研究方向Main Research Direction of Text Mining文本检索文本分类文本聚类网络浏览文档总结网络浏览文本挖掘技术可以通过分析用户的网络行为等 ,帮助用户更好地寻找有用信息一个典型的例子是 CMU的WebWatcher 。这是一个在线用户向导, 可以根据用户的实