大数据中的流处理与批处理(共6页).docx

上传人:晟*** 文档编号:8011286 上传时间:2021-11-16 格式:DOCX 页数:6 大小:19.53KB
下载 相关 举报
大数据中的流处理与批处理(共6页).docx_第1页
第1页 / 共6页
大数据中的流处理与批处理(共6页).docx_第2页
第2页 / 共6页
大数据中的流处理与批处理(共6页).docx_第3页
第3页 / 共6页
大数据中的流处理与批处理(共6页).docx_第4页
第4页 / 共6页
大数据中的流处理与批处理(共6页).docx_第5页
第5页 / 共6页
点击查看更多>>
资源描述

精选优质文档-倾情为你奉上 对流处理与批处理的认识 说到对流处理与批处理的认识,首先要知道大数据系统中的一个最基本的组件:处理框架。所谓处理框架就是负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据。数据的计算则是指从大量单一数据点中提取信息和见解的过程。下面是一些常见的框架:(1)仅批处理框架:Apache Hadoop(2)仅流处理框架:Apache Storm,Apache Samza(3)混合框架:Apache Spark,Apache Flink。 首先,我们先了解批处理。批处理在大数据世界有着悠久的历史。批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。批处理模式中使用的数据集通常符合下列特征: 有界:批处理数据集代表数据的有限集合。 持久:数据通常始终存储在某种类型的持久存储位置中。 大量:批处理操作通常是处理极为海量数据集的唯一方法。 批处理非常适合需要访问全套记录才能完成的计算工作。例如在计算总数和平均数时,必须将数据集作为一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 公文范文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。