数据仓库与数据挖掘2 数据仓库与数据挖掘 第一章 数据仓库与数据挖掘概述 第二章 数据仓库的分析 第三章 数据仓库的设计与实施 第四章 信息分析的基本技术 第五章 数据挖掘过程 第六章 数据挖掘基本算法 第七章 非结构化数据挖掘 第八章 离群数据挖掘 第九章 数据挖掘语言与工具的选择 第十章 知识管理与知识管理系统3 第七章 非结构化数据挖掘 7.1 文本挖掘 7.2 Web 数据挖掘 7.3 空间群数据挖掘* 7.4 多媒体数据挖掘*4 7.1 文本挖掘 文本挖掘以文本型信息源作为分析的对象,利用定量计算 和定性分析的方法,从中寻找信息结构、模型、模式等各 种隐含的新颖知识。 文本挖掘的主要目标是获得文本的主要内容特征,如文本 涉及的主题、文本主题的类属、文本内容的浓缩等。文本 挖掘的具体实现技术主要有如下几种。5 7.1 文本挖掘 类别 描述 特征抽 取 文本特征包括:一般特征和数字特征 一般特征主要包括:名词 和名词 短语 数字特征主要包括:日期、时间 、货币 以 及单纯 数字信息 主题 标 引 利用主题词标 引代替关键词标 引。 文本分 类 预 先对 文本进 行特征抽取,它利用