Spark大数据处理系列之Machine Learnin.doc

上传人:晟*** 文档编号:13307683 上传时间:2022-07-31 格式:DOC 页数:7 大小:172KB
下载 相关 举报
Spark大数据处理系列之Machine Learnin.doc_第1页
第1页 / 共7页
Spark大数据处理系列之Machine Learnin.doc_第2页
第2页 / 共7页
Spark大数据处理系列之Machine Learnin.doc_第3页
第3页 / 共7页
Spark大数据处理系列之Machine Learnin.doc_第4页
第4页 / 共7页
Spark大数据处理系列之Machine Learnin.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

Spark大数据处理系列之Machine Learning超人学院机器学习和数据科学机器学习是从已经存在的数据进行学习来对将来进行数据预测,它是基于输入数据集创建模型做数据驱动决策。数据科学是从海里数据集(结构化和非结构化数据)中抽取知识,为商业团队提供数据洞察以及影响商业决策和路线图。数据科学家的地位比以前用传统数值方法解决问题的人要重要。以下是几类机器学习模型: 监督学习模型 非监督学习模型 半监督学习模型 增强学习模型下面简单的了解下各机器学习模型,并进行比较: 监督学习模型:监督学习模型对已标记的训练数据集训练出结果,然后对未标记的数据集进行预测;监督学习又包含两个子模型:回归模型和分类模型。 非监督学习模型:非监督学习模型是用来从原始数据(无训练数据)中找到隐藏的模式或者关系,因而非监督学习模型是基于未标记数据集的; 半监督学习模型:半监督学习模型用在监督和非监督机器学习中做预测分析,其既有标记数据又有未标记数据。典型的场景是混合少量标记数据和大量未标记数据。半监督学习一般使用分类和回归的机器学习方法;

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 公文范文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。