[]-数据挖掘Lecture-1.ppt

上传人:99****p 文档编号:1419359 上传时间:2019-02-25 格式:PPT 页数:46 大小:2.19MB
下载 相关 举报
[]-数据挖掘Lecture-1.ppt_第1页
第1页 / 共46页
[]-数据挖掘Lecture-1.ppt_第2页
第2页 / 共46页
[]-数据挖掘Lecture-1.ppt_第3页
第3页 / 共46页
[]-数据挖掘Lecture-1.ppt_第4页
第4页 / 共46页
[]-数据挖掘Lecture-1.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、数据挖掘王继民北京大学信息管理系2006年秋信息管理系信息管理系基本信息o 时间:o 地点:o 课程主页: http:/ 总学时 :o 教学方式 : 讲授o 教师: 王继民 信息管理系信息管理系课程主要内容o 绪论o 数据预处理o 概念描述:特征化和区分 o 关联规则挖掘o 分类和预测o 聚类分析o 复杂类型数据的挖掘o 数据挖掘的应用和发展趋势o 侧重于: 数据挖掘基本概念与技术 方法 的讲解,实例则偏向于 “文本 +Web+图书情报 ” 信息 挖掘 的 “方法 ”信息管理系信息管理系参考教材o Jiawei Han and MichelineKamber. Data Mining: Con

2、cepts and Techniques.Morgan Kaufmann Publishers, 2001. 范明、孟小峰等译,数据挖掘概念与技术,机械工业出版社, 2001年 8月o 相关学术论文o 其它参考书n 数据挖掘原理 , David Hand, Heikki Mannila和 Padhraic Smyth著,机械工业出版社 (2003)n 史忠植,知识发现,清华大学出版社, 2002n 李晓明 , 闫宏飞 , 王继民 . 搜索引擎原理、技术与系统 . 北京 : 科学出版社 . 2005 信息管理系信息管理系考核方式o 作业 + 数据挖掘实践:约 40%(实际的数据集 + 数据挖掘算

3、法 + Matlab或 SPSS实现)o 阅读报告:每人阅读一篇相关研究论文,约占 10%o 闭卷考试: 约 50%o 其中数据挖掘实践n 根据任务以 1-5人为一组,进行数据分析与知识挖掘n 数据来源既可以自己找也可以由教师提供n 依照本课程所学的技术方法,将结果写成一篇研究分析报告,期末与教师讨论。好的话,争取发表论文信息管理系信息管理系2006年春季课, 北大研究生分为 3组Library And Information Science Abstracts( LISA) 图书馆与信息科学文摘库 信息管理系信息管理系2006年春季课, 北大研究生分为 3组信息管理系信息管理系这是国内 :第

4、一支由情报学专业学生组成的参赛队伍 !第一支由非计算机专业学生组成的的参赛队伍 !信息管理系信息管理系第一讲 绪论 o 什么是数据挖掘 ? o 数据挖掘的步骤o 数据挖掘的主要功能n 概念 /类描述:特征化和区分 n 关联分析 n 分类和预测 n 聚类分析 n 孤立点分析 n 演变分析 o 在何种数据上进行数据挖掘o 数据挖掘技术的前景o 实例 : 中文 Web搜索引擎日志挖掘信息管理系信息管理系数据挖掘的发展动力-需要是发明之母o 数据爆炸问题 n 数据自动收集 工具和成熟的 数据库技术 使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。o 数据极大丰富 (data rich) , 知识极其匮乏 (knowledge poor) o 解决方法:数据仓库技术和数据挖掘技术n 数据仓库 (Data Warehouse)和在线分析处理 (OLAP)n 数据挖掘: 在大量的数据中挖掘感兴趣的知识 (规则,规律,模式,约束)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。