一文看懂文本挖掘6页.doc

上传人:晟*** 文档编号:7441149 上传时间:2021-10-30 格式:DOC 页数:6 大小:16KB
下载 相关 举报
一文看懂文本挖掘6页.doc_第1页
第1页 / 共6页
一文看懂文本挖掘6页.doc_第2页
第2页 / 共6页
一文看懂文本挖掘6页.doc_第3页
第3页 / 共6页
一文看懂文本挖掘6页.doc_第4页
第4页 / 共6页
一文看懂文本挖掘6页.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

一文看懂什么是文本挖掘SAS中文论坛 今天一、什么是文本挖掘文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。文本挖掘是一个多学科混杂的领域,涵盖了多种技术,包括数据挖掘技术、信息抽取、信息检索,机器学习、自然语言处理、计算语言学、统计数据分析、线性几何、概率理论甚至还有图论。二、文本挖掘有什么用1.文本分类文本分类是一种典型的机器学习方法,一般分为训练和分类两个阶段。文本分类一般采用统计方法或机器学习来实现。2.文本聚类文本聚类是一种典型的无监督式机器学习方法,聚类方法的选择取决于数据类型。首先,文档聚类可以发现与某文档相似的一批文档,帮助知识工作者发现相关知识;其次,文档聚类可以将一类文档聚类成若干个类,提供一种组织文档集合的方法;再次,文档聚类还可以生成分类器以对文档进行分类。文本挖掘中的聚类可用于:提供大规模文档内容总括;识别隐藏的文档间的相似度;减轻浏览相关、相似信息的过程。3.信息检索

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 表格模板

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。