中文及英文的文本挖掘R语言所需要的包tm(textmining)门ava,Snowball,zoo,XML,slam,Rz,RWeka,matlab1文本挖掘概要文本挖掘是从大量的文本数据中抽取隐含的,求和的,可能有用的信息。通过文本挖掘实现Associate:关联分析,根据同时出现的频率找出关联规则Cluster:将相似的文档(词条)进行聚类Categorize:将文本划分到预先定义的类别里文档自动摘要:利用计算机自动地从原始文档中提取全面准确地反映该文档中心内容的简单连贯描述性短文。文本挖掘的运用主要有如下几方面智能信息检索同义词,简称词,异形词,同音字、赘字移除网络内容安全内容监控内容过滤内容管理自动分类检测和追踪市场监测口碑监测竞争情报系统市场分析2英文文本挖掘实例实现多个英文文档的聚类分析21文本预处理211读取文本内容#取得tm内部文件texts/crude/下的文件目录。library(tm,lib.loc=d:/ProgramFiles/