ImageVerifierCode 换一换
格式:PPT , 页数:52 ,大小:1.24MB ,
资源ID:1420438      下载积分:15 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1420438.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(天体光谱数据挖掘技术.ppt)为本站会员(99****p)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

天体光谱数据挖掘技术.ppt

1、天体光谱数据挖掘技术太原科技大学计算机科学与技术学院张继福 2008年 11月一、概 述1) 数据挖掘 2)天体光谱数据挖掘 3)课题的研究意义二、主要研究工作1) 基于约束 FP树的天体光谱数据相关性分析2) 基于概念格的天体光谱离群数据挖掘 数据挖掘定义:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含的、未知的、潜在的有用信息和知识,为决策支持服务。 主要任务:关联规则、分类、聚类、离群数据等。常用的方法有:关联规则、决策树、神经网络、遗传算法、粗糙集、模糊集、概念格、统计分析等。天体光谱数据挖掘 我国正在建造一台大天区面积多目标光纤光谱望远镜( LAMOST),

2、是国家重大科学工程项目,也是世界上光谱获取率最高的望远镜。预计 LAMOST所观测到的光谱数据容量将有可能达到 4TB。急需一种新的以计算机为主的数据分析技术 , 分析和识别如此庞大的海量光谱数据。天体光谱数据处理主要内容 :预处理 (去噪、归一化等 )、 分类与识别 、 测量(红移等参数) 等。一条 Seyfert 2 光谱数据图 (红移为 0)天体光谱是天体电磁辐射按照波长的有序排列,蕴含着天体的重要物理信息,例如:天体的化学成份、天体的表面温度、直径、质量、光度以及天体的视向运动和自转 。 天文学家和天体物理学家通过分析天体光谱的信息,不仅可以研究宇宙中物质的分布特征,还可以研究天体的形

3、成和随时间的演化等重大科学问题 。主要的方法交叉相关分析与主成分分析( PCA)、人工神经网络、小波变换、贝叶斯统计、 SVM等。典型的成果1) Autoclass,基于贝叶斯统计的一种光谱分类方法,发现了一些以前未注意的光谱类型和谱线;2) Gulati等人采用两层 BP神经网络方法,用于恒星光谱次型的分类;3) Ellis等人采用交叉相关分析对光谱进行分类;4)邱波等人采用基于粗糙集的方法,进行了恒星光谱的分类识别;5)覃冬梅等人采用基于主分量分析法的二维恒星特征空间的快速光谱识别方法;6)刘中田等人提出基于小波特征的 M型星自动识别方法等。 课题的研究意义由于天文界对宇宙的认识还比较有限

4、, LAMOST巡天计划的一个重要任务是要发现一些新的、特殊类型的天体,因此,如何利用数据挖掘技术从海量天体光谱数据中发现未知的、特殊的天体及天体规律是数据挖掘值得研究和探索的新应用领域。面向特定任务的数据挖掘是当前数据挖掘领域发展的趋势之一。以 LAMOST项目为背景,对天体光谱数据挖掘技术进行了研究,其研究成果不仅具有重要的理论价值,而且可直接应用到 LAMOST中,为国家重大科学工程提供技术支撑。 退回退回引言 关联规则描述了属性之间的关联程度,也就是说有效地描述了数据集属性之间的相关性关系。 利用关联规则来描述天体光谱数据特征与其物理化学性质之间存在的、未知的相关性是可行性的,具有重要

5、的应用价值。 频繁模式集的生成 是提高关联规则挖掘效率的关键。 频繁模式生成主要有: Apriori和 FP两类算法。 Apriori算法优点 : 思路比较清晰,以递归统计为基础,剪枝生成频繁集;缺点 : 在生成频繁模式过程中,需要产生大量的候选项和多次遍历数据库, I/O代价太高,难以适应海量高维数据。 FP算法优点 : (l) 通过对 FP树的递归访问,产生频繁模式集,仅需要构造 FP树和条件 FP树,不需要产生候选项集;(2) 对事务数据库仅需两次遍历,第 l次遍历产生频繁 l-项集,第 2次遍历用于构造 FP树,从而降低了访问数据库的次数。缺点 : FP树需要占用大量内存。约束 FP树及其构造 一阶谓词逻辑与背景知识数据挖掘是从宏观角度利用积累的巨量数据进行知识抽象的高级阶段,是一项高级的智能活动,因此数据挖掘过程离不开背景知识的支持。关联规则挖掘过程也离不开背景知识的支持。面向关联规则挖掘的背景知识实际上是描述数据集中的对象与属性之间、属性与属性之间的约束关系,因此采用一阶谓词逻辑描述关联规则挖掘中的背景知识是可行的。

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。