ImageVerifierCode 换一换
格式:PPT , 页数:16 ,大小:2.21MB ,
资源ID:313084      下载积分:100 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-313084.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(大数据技术.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

大数据技术.ppt

1、大数据技术,张瑞芝计算机科学与技术16081200210009,Deep learning,Yann LeCun, Yoshua Bengio, Geoffrey Hinton Supervised learning Backpropagation to train multilayer architectures Convolutional neural networks Image understanding with deep convolutional networks Distributed representations and language processing Recurr

2、ent neural networks The future of deep learning,Supervised learning,监督学习是利用一组已知类别的样本调整分类器的参数,并使其达到所要求性能的过程,监督学习完成了从标记的训练数据来实现分类功能的机器学习任务。传统的方法是通过手工方法来设计良好的特征提取器,这需要大量的工程技术和专业领域知识。深度学习的关键优势在于使用了通用的学习过程从数据中学到良好的特征,从而避免了传统方法中所需的人工工程。,Backpropagation to train multilayer architectures,通过反向传播算法来训练多层神经网络反向

3、传播算法(Backpropagation)是目前用来训练人工神经网络的最常用且最有效的算法。,Convolutional neural networks,卷积神经网络是一种前馈神经网络,它包括卷积层和池化层,它的人工神经元可以响应一定覆盖范围内的周围单元,对大型图像的处理表现得很出色。 在BP神经网络中,每一层都是全连接的,这使训练变得困难。而CNN的卷积层每个节点与上一层某个区域通过卷积核连接,而与这块区域以外的区域无连接。但每个节点对应不同的卷积核导致训练量依然很大。为此,CNN提出了权值共享概念,即同一个卷积层内,所有神经元的权值是相同的。池化层夹在卷积层中间,其主要作用是逐步压缩减少数

4、据和参数的数量,也在一定程度上减少过拟合现象。其功能是把上一层输入数据的某块区域压缩成一个值。,Image understanding with deep convolutional networks,左图为人工智能专家李飞飞利用大数据来训练计算机视觉,通过深度CNN来教计算机理解图片。而且李飞飞共享了ImageNet。作为和大脑神经原理类似的卷积神经网络,使用ImageNet进行训练是非常合适的选择。,Distributed representations and language processing,要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,词向量就是用来将语言中

5、的词进行数学化的一种方式。Distributed Representation的基本想法是:通过训练将某种语言中的每一个词映射成一个固定长度的短向量,将所有这些向量放在一起形成一个词向量空间,而每一个向量则为该空间中的一个点,在这个空间上引入“距离”,则可以根据词之间的距离来判断它们之间的(词法、语义上的)相似性了。,下面的左、右两幅图中五个词在两个向量空间中的相对位置差不多,这说明两种不同语言对应向量空间的结构之间具有相似性,从而进一步说明了在词向量空间中利用距离刻画词之间相似性的合理性。,Recurrent neural networks,在RNN中,输入层和来自序列中上一元素隐藏层的信号

6、共同作用于当前的隐藏层,数据挖掘与医学数据资源开发利用,医学数据资料的状况 数据挖掘的应用 数据挖掘的方法以及具体应用 聚类分析(Clustering Analysis)关联分析(Correlation Analysis) 决策树(Decision Tree) 结论,聚类分析(Clustering Analysis),聚类分析是对输入集中的记录进行分类。根据一定的规则,合理地进行分组或聚类,并用显式或者隐式的方法描述不同的类别。聚类分析是一种探索性的统计分析方法,是在没有先验知识的情况下对数据资料进行分类,其实质就是按照资料的内在相似或相关程度将数据分为若干个类别,以使得类别内数据的“差异”尽

7、可能小,类别间“差异”尽可能大。,关联分析(Correlation Analysis),表示数据库中一组对象之间某种关联关系的规则,挖掘一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。关联规则的挖掘问题就是在给定的数据库中,找出满足最小支持度和最小置信度的关联规则。关联规则有如下优点:可以产生清晰有用的结果;支持间接数据挖掘;可以处理变长的数据;计算的消耗量可以预见。,决策树(Decision Tree),首先通过一批已知的训练数据建立一颗决策树;然后,利用建好的决策树,对数据进行预测。这是一种用树枝状展现数据受各变量影响情况的分析预测模型,根据对目标变量产生效应的不同,而制定分类规则,它是建立在信息论基础之上的对数据进行分类的一种方法。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较为常用。,结论,聚类分析、关联分析以及决策树是医学数据挖掘中的主要方法,三者的结合,可以对某一类疾病进行系统的分析,从疾病证候的分类,以及疾病与药物之间的关联、证候与药物的关联,到最后通过疾病的前期症状,对其的早期预测,以及定义相关疾病的诊疗路径提供了很大的帮助。,实例,基因测序、大数据分析精准治癌正在成为现实,Thank you,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。