大数据与分布式计算--课件.ppt

上传人:晟*** 文档编号:15184485 上传时间:2024-09-09 格式:PPT 页数:65 大小:4.93MB
下载 相关 举报
大数据与分布式计算--课件.ppt_第1页
第1页 / 共65页
大数据与分布式计算--课件.ppt_第2页
第2页 / 共65页
大数据与分布式计算--课件.ppt_第3页
第3页 / 共65页
大数据与分布式计算--课件.ppt_第4页
第4页 / 共65页
大数据与分布式计算--课件.ppt_第5页
第5页 / 共65页
点击查看更多>>
资源描述

大数据与分布式计算1HDFSHadoopDistributedFileSystem21990年,一个普通的硬盘驱动器可存储1370MB的数据并拥有4.4MB/s的传输速度,所以,只需五分钟的时间就可以读取整个磁盘的数据。20年过去了,1TB级别的磁盘驱动器是很正常的,但是数据传输的速度却在100MB/s左右。所以它需要花两个半小时以上的时间读取整个驱动器的数据。从一个驱动器上读取所有的数据需要很长的时间,写甚至更慢。如何解决?磁盘损坏数据丢失怎么办?如果需要存储计算1000T数据怎么办?3常用RAID技术4RAID类型访问速度速度数据可靠性数据可靠性磁磁盘利用率利用率RAID0很快很低100%RAID1很慢很高50%RAID10中等很高50%RAID5较快较高(N-1)/NRAID6较快较(RAID5)高(N-2)/N5HDFS系统架构67什么是HDFS?HadoopDistributedFileSystemHadoopDistributedFileSystem(HDFS)istheprimarystoragesystemusedbyHadoopapplications.HDFScre

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 公文范文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。