数据数据挖掘中的文本挖掘挖掘中的文本挖掘张聪张聪目录目录ContentsContents一一三三二二四四结语结语文本挖掘过程文本挖掘过程文本挖掘的主要研究方向文本挖掘的主要研究方向关于数据挖掘和文本挖掘关于数据挖掘和文本挖掘一一数据数据挖掘与文本挖掘挖掘与文本挖掘Data Mining and Text MiningData Mining and Text Mining 数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。文本挖掘一般指文本处理过程中产生高质量的信息,其主要处理过程是对大量文档集合的内容进行预处理、特征提取、结构分析、文本摘要、文本分类、文本聚类、关联分析等操作。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘基于单文档的文本挖掘文本摘要信息提取基于文档集的文本挖掘文本分类文本聚类个性化文本过滤文档作者归属因素分析文本挖掘的分类二二文本挖