混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx

上传人:99****p 文档编号:1419968 上传时间:2019-02-25 格式:PPTX 页数:20 大小:1.87MB
下载 相关 举报
混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx_第1页
第1页 / 共20页
混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx_第2页
第2页 / 共20页
混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx_第3页
第3页 / 共20页
混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx_第4页
第4页 / 共20页
混合异构数据的清洗、存储、挖掘架构选型和设计策略.pptx_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、混合异构数据的清洗、存 储 、挖掘架构 选 型和 设计 策略提 纲 混合异构数据特点 混合异构数据分 类 混合异构 处 理流程 AdMaster混合异构数据平台架构 AdMaster数据 处 理流程 AdMaster混合异构数据分析 Q/A 混合异构数据特点 不同的数据 类 型 不同的数据量 级 不同的 访问 速度 不同的用 户类 型 不同的 访问 平台 不同的存 储设备 。 混合异构数据分 类数据内容数据特性数据 结 构使用 频 率数据 访问 量响 应时间在 线 数据短周期数据字段固定高度 结 构化、复 杂 、适合操作 计 算非常高( 热 数据) B、 MB级纳 秒、微秒、毫秒 级离 线 数

2、据长 周期(存档、 归纳 、 计 算 结 果)字段不固定结 构 简单一般(冷数据)GB、 TB、 PB级秒、分 钟 、小 时 、天 级数据采集Internet 非 结 构化数据结 构化数据 数据 预处 理清洗 集成 转换 归约 原始数据数据存储提 炼数据分析BatchPig HiveZookeeper(Tez)Online(HBase)Streaming(MapReduce) (Storm,S4)In-Memory Interactive(Spark)HPC MPI(OpenMPI)YARN Cluster Resource ManagementHDFSOS(操作系 统 )Mahout Flu

3、me Sqoop Oozie应 用服 务数据展示互 联 网广告 监测 全流程AdMaster混合异构数据平台架构Text Clustering Storm Data API Text Categorization MapReduce Open API API Service Data Mining System Distributed System Data Collect Text Analysis API Sentiment Analysis Spark Crawler Data Visualization App Layer JS/AS R Front-end Application Service ECharts

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。