数据挖掘中的文本挖掘.ppt

上传人:99****p 文档编号:1420426 上传时间:2019-02-25 格式:PPT 页数:22 大小:1.18MB
下载 相关 举报
数据挖掘中的文本挖掘.ppt_第1页
第1页 / 共22页
数据挖掘中的文本挖掘.ppt_第2页
第2页 / 共22页
数据挖掘中的文本挖掘.ppt_第3页
第3页 / 共22页
数据挖掘中的文本挖掘.ppt_第4页
第4页 / 共22页
数据挖掘中的文本挖掘.ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、数据 挖掘中的文本挖掘张聪目录Contents一三二四 结语文本挖掘过程文本挖掘的主要研究方向关于数据挖掘和文本挖掘一 数据 挖掘与文本挖掘Data Mining and Text Mining数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于 Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。文本挖掘一般指文本处理过程中产生高质量的信息,其主要处理过程是对大量文档集合的内容进行预处理、特征提取、结构分析、文本摘要、文

2、本分类、文本聚类、关联分析等操作。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘 的分类二 文本挖掘的主要研究方向Main Research Direction of Text Mining文本检索文本分类文本聚类网络浏览文档总结网络浏览文本挖掘技术可以通过分析用户的网络行为等 ,帮助用户更好地寻找有用信息一个典型的例子是 CMU的 WebWatcher 。这是一个在线用户向导, 可以根据用户的实际点击行为分析用户的兴趣 , 预测用户将要选择的链接 , 从而为用户进行导航 。文本检索文本检索主要研究对整个文档文本信息的表示 、存诸、组织和访问 ,即根据用户的检索要求, 从数据库中检索出相关的信息资料。主要检索方法有三种 :布尔模型是简单常用的严格匹配模型;概率模型利用词条间和词条与文档间的概率相关性进行信息检索;向量空间模型在于将文档信息的匹配问题转化为向量空间中的矢量匹配问题处理。文本分类文本分类是指按照预先定义的主题类别, 为文档集合中的每个文档确定一个类别。这样用户不仅可以方便地阅读文档, 而且可以通过限制搜索范围来使文档查找更容易 。近年来涌现出了大量的适合于不同应用的分类算法,如:基于归纳学习的决策树、基于向量空间模型的 K-最近邻、基于概率模型的 Bayes 分类器 、神经网络 、基于统计学习理论的支持向量机方法等

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。