数据挖掘研究的新进展.ppt

上传人:da****u 文档编号:1127550 上传时间:2018-12-11 格式:PPT 页数:15 大小:74.50KB
下载 相关 举报
数据挖掘研究的新进展.ppt_第1页
第1页 / 共15页
数据挖掘研究的新进展.ppt_第2页
第2页 / 共15页
数据挖掘研究的新进展.ppt_第3页
第3页 / 共15页
数据挖掘研究的新进展.ppt_第4页
第4页 / 共15页
数据挖掘研究的新进展.ppt_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、数据挖掘研究的新进展复旦大学计算机与信息技术系汪卫数据挖掘研究n 数据挖掘研究的基础 机器学习 统计分析 数据库n 数据挖掘技术的产生 大规模的数据 数据分析的需要当前数据挖掘研究的主要方向n 数据挖掘研究的发展方向 新的应用领域n WEB访问分析n 入侵检测n 生物信息学n 新的工作形式n 流数据分析n 隐私保护n 新的数据类型n 文本数据n 图数据n XML数据n 数据挖掘的进一步深入生物数据挖掘n 应用领域 生物序列数据分析 基因芯片分析n 主要难点 数据规模大 数据的模糊性生物数据挖掘 -序列分析n 主要问题 从大规模的基因序列中提取相关模式n 基因序列的特征 序列长 每个单元不同的取

2、值少n 研究内容 基因序列中频繁模式的发现n 重复序列的发现 基因序列的聚类 基因序列的高效组织方法生物数据挖掘 -基因芯片分析n 主要问题 从大量的芯片数据中提取相关模式n 芯片数据的特征 序列短、序列数量长 有时采用的是局部信息n 研究内容 基因表达数据的聚类 基因表达数据的分类流数据分析n 应用领域 数据监控 超大规模数据处理n 主要特点 数据只能扫描一遍 最多只有 o(lgn)的空间可用来存储临时数据n 主要难点 无法形成一个精确的整体状态 现有的挖掘算法需要重新研究流数据分析n 研究内容 分类n 构造一个分类器,不断修正n 构造多个分类器,通过投票的方法进行预测 聚类n 针对流过信息建立数据摘要的方法n 动态调整现有分类 对新增类的判断方法和对老类的合并流数据分析n 研究内容 关联规则挖掘n 频繁模式的更新n 精确度分析 变化监测n 变化发生时刻的确定n 数据变化模式 高速流的处理方法n 数据采样n 并行处理面向隐私保护的数据挖掘n 主要背景 防止通过挖掘结果对原始细节数据进行反推理 主要应用于医疗数据的管理n 主要研究内容 敏感数据的标示 挖掘结果的裁减n 通过规则的推导预测生成的细节数据n 对挖掘结果进行裁减 裁减的效率研究

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。