OpenStack里的三种存储.doc

上传人:sk****8 文档编号:4069969 上传时间:2019-09-23 格式:DOC 页数:6 大小:35KB
下载 相关 举报
OpenStack里的三种存储.doc_第1页
第1页 / 共6页
OpenStack里的三种存储.doc_第2页
第2页 / 共6页
OpenStack里的三种存储.doc_第3页
第3页 / 共6页
OpenStack里的三种存储.doc_第4页
第4页 / 共6页
OpenStack里的三种存储.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、OpenStack 里的三种存储发表于 2013-03-29 10:01| 6129 次阅读| 来源 Eric 或雪菲个人博客 | 1 条评论| 作者 Eric 或雪菲OpenStack 存储摘要:Openstack 通过两年多发展,变得越来越庞大。这也是为了满足更多不同的需求,体现出开源项目灵活快速的特性。Openstack 作为一个开放的系统,最主要是可以随时选择新的硬件供应商,当然也可以替换软件技术服务的提供商,不用动应用。这是开源本身的优势!OpenStack 其实有三个与存储相关的组件,这三个组件被人熟知的程度和 组件本身出现时间的早晚是相符的,按熟悉程度排列如下:Swift提供对象

2、存储 (Object Storage),在概念上类似于 Amazon S3 服务,不过swift 具有很强的扩展性、冗余和持久性,也兼容 S3 APIGlance提供虚机镜像(Image)存储和管理,包括了很多与 Amazon AMI catalog 相似的功能。(Glance 的后台数据从最初的实践来看是存放在 Swift 的)。Cinder提供块存储(Block Storage),类似于 Amazon 的 EBS 块存储服务,目前仅给虚机挂载使用。(Amazon 一直是 OpenStack 设计之初的假象对手和挑战对象,所以基本上关键的功能模块都有对应项目。除了上面提到的三个组件,对于 A

3、WS 中的重要的 EC2 服务,OpenStack 中是 Nova 来对应 ,并且保持和 EC2 API 的兼容性,有不同的方法可以实现)三个组件中,Glance 主要是虚机镜像的管理,所以相对简单 ;Swift 作为对象存储已经很成熟,连 CloudStack 也支持它。Cinder 是比较新出现的块存储,设计理念不错,并且和商业存储有结合的机会,所以厂商比较积极。Swift关于 Swift 的架构和部署讨论 ,除了官方网站,网上也有很多文章,这里就不重复.(也可以参考我之前在 OpenStack 中国行活动中上海站演讲的 PPT)。从开发上看,最近也没有太大的结构性调整,所以我想主要说说比

4、较适用的应用领域好了。从我所了解的实际案例来看,Swift 出现的领域有 4 个, (应该还有更多,希望大家看到实际用例能够指教)1.网盘。Swift 的对称分布式架构和多 proxy 多节点的设计导致它从基因里就适合于多用 户大并发的应用模式,最典型的应用莫过于类似 Dropbox 的网盘应用,Dropbox 去年底已经突破一亿用户数,对于这种规模的访问,良好的架构设计是能够支撑的根本原因。Swift 的对称架构使得数据节 点从逻辑上看处于同级别,每台节点上同时都具有数据和相关的元数据。并且元数据的核心数据结构使用的是哈希环,一致性哈希算法对于节点的增减都只需重定位环空间中的一小部分数据,具

5、有较好的容错性和可扩展性。另外数据是无状态的,每个数据在磁盘上都是完整的存储。这几点综合起来保证了存储的本身的良好的扩展性。另外和应用的结合上,Swift 是说 HTTP 协议这种语言的,这使得应用和存储的交互变得简单,不需要考虑底层基础构架的细节,应用软件不需要进行任何的修改就可以让系统整体扩展到非常大的程度。2.IaaS 公有云Swift 在设计中的线性扩展,高并 发和多租户支持等特性,使得它也非常适合做为 IaaS 的选择,公有云规模较大,更多的遇到大量虚机并发启动这种情况,所以对于虚机镜像的后台存储具体来说,实际上的挑战在于大数据(超过 G)的并发读性能,Swift 在OpenStac

6、k 中一开始就是作为镜像库的后台存储,经过 RACKSpace 上千台机器的部署规模下的数年实践,Swift 已经 被证明是一个成熟的选择。另外如果基于 IaaS 要提供上层的 SaaS 服务,多租户是一个不可避免的问题,Swift 的架构设计本身就是支持多租户的,这样对接起来更方便。3.备份归档RackSpace 的主营业务就是数据的备份归档,所以 Swift 在这个领域也是久经考验,同时他们还延展出一种新业务-“热归 档”。由于长尾效应,数据可能被调用的时间窗越来越长,热归档能够保证应用归档数据能够在分钟级别重新获取,和传统磁带机归档方案中的数小时而言,是一个很大的进步。4. 移动互联网和

7、 CDN移动互联网和手机游戏等产生大量的用户数据,数据量不是很大但是用户数很多,这也是Swift 能够处理的领域。至于加上 CDN,如果使用 Swift,云存储就可以直接响应移动设备,不需要专门的服务器去响应这个 HTTP 的请求,也不需要在数据传输中再经过移动设备上的文件系统,直接是用 HTTP 协议上传云端。如果把经常被平台访问的数据缓存起来,利用一定的优化机制,数据可以从不同的地点分发到你的用户那里,这样就能提高访问的速度,我最近看到 Swift的开发社区有人在讨论视频网站应用和 Swift 的结合,窃以为是值得关注的方向。GlanceGlance 比较简单,是一个虚机镜像的存储。向前端

8、 nova(或者是安装了 Glance-client 的其他虚拟管理平台)提供镜像服务,包括存储,查询和检索。这个模块本身不存储大量的数据,需要挂载后台存储(Swift,S3 。)来存放实际的镜像数据。Glance 主要包括下面几个部分:l API service: glance-api 主要是用来接受 Nova 的各种 api 调用请求,将请求放入RBMQ 交由后台处理,。l Glacne-registry 用来和 MySQL 数据库进行交互,存储或者获取镜像的元数据,注意,刚才在 Swift 中提到,Swift 在自己的 Storage Server 中是不保存元数据的,这儿的元数据是指保

9、存在 MySQL 数据库中的关于镜像的一些信息,这 个元数据是属于 Glance 的。l Image store: 后台存储接口,通过它获取镜像,后台挂载的默认存储是 Swift,但同时也支持 Amazon S3 等其他的 镜像。Glance 从某种角度上看起来有点像虚拟存储,也提供 API,可以实现比较完整的镜像管理功能。所以理论上其他云平台也可以使用它。Glance 比较简单,又限于云内部,所以没啥可以多展开 讨论的,不如看看新出来的块存储组件 Cinder,目前我对 Cinder 基本的看法是总体的设计不错,细节和功能还有很多需要完善的地方,离一个成熟的产品还有点距离。CinderOpe

10、nStack 到 F 版本有比较大的改变,其中之一就是将之前在 Nova 中的部分持久性块存储功能(Nova-Volume)分离了出来,独立为新的组件 Cinder。它通过整合后端多种存储,用 API 接口为 外界提供块存储 服务,主要核心是对卷的管理,允许对卷,卷的类型,卷的快照进行处理。Cinder 包含以下三个主要组成部分 API service:Cinder-api 是主要服务接口, 负责接受和处理外界的 API 请求,并将请求放入 RabbitMQ 队列,交由后端执行。 Cinder 目前提供 Volume API V2 Scheduler service: 处理任务队列的任务,并根

11、据预定策略选择合适的 Volume Service 节点来执行任务。目前版本的 cinder 仅仅提供了一个 Simple Scheduler, 该调度器选择卷数量最少的一个活跃节点来创建卷。 Volume service: 该服务运行在存储节点上,管理存储空间,塔处理 cinder 数据库的维护状态的读写请求,通过消息队列和直接在块存储设备或软件上与其他进程交互。每个存储节点都有一个 Volume Service,若干个这样的存储节点联合起来可以构成一个存储资源池。Cinder 通过添加不同厂商的指定 drivers 来为了支持不同类型和型号的存储。目前能支持的商业存储设备有 EMC 和 I

12、BM 的几款,也能通过 LVM 支持本地存储和 NFS 协议支持NAS 存储,所以 Netapp 的 NAS 应该也没问题,好像华为也在努力中。我前段时间还在Cinder 的 blueprints 看到 IBM 的 GPFS 分布式文件系统,在以后的版本应该会添加进来到目前为止,Cinder 主要和 Openstack 的 Nova 内部交互,为之提供虚机实例所需要的卷 Attach 上去,但是理论上也可以单独向外界提供块存储。部署上,可以把三个服务部署在一台服务器,也可以独立部署到不同物理节点现在 Cinder 还是不够成熟,有几个明显的问题还没很好解决,一是支持的商业存储还不够多,而且还不

13、支持 FC SAN,另外单点故障隐患没解决,内部的 schedule 调度算法也太简单。另外由于它把各种存储整合进来又加了一层,管理倒是有办法了,但是效率肯定是有影响,性能肯定有损耗,但这也是没办法的事了。Openstack 通过两年多发展,变得越来越庞大。目前光存储就出现了三种:对象存储、镜像存储和块存储。这也是为了满足更多不同的需求,体现出开源项目灵活快速的特性。总的说来,当选择一套存储系统的时候,如果考虑到将来会被多个应用所共同使用,应该视为长期的决策。Openstack 作为一个开放的系统,最主要是解决软硬件供应商锁定的问题,可以随时选择新的硬件供应商,将新的硬件和已有的硬件组成混合的集群,统一管理,当然也可以替换软件技术服务的提供商,不用动应用。这是开源本身的优势! 亮点 评论 : 杨 炳富:美好 总 在想像中,前途光明的,道路依旧没找到 / 迪八哥在魔都 :有不少 错误 , cinder 不在数据路径上, 还 真没有 overhead。 调 度算法在 Grizill 里 头 足 够复 杂 了。 swift 方面估 计 你只是看看没有做 过 , 远 不是想象那么成熟美好。 Glance 只做 简单 功能容易, 结 合 snapshot 和 fast provinsion,复 杂 度也增加。本文来自: Eric 或雪菲个人博客

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 自然科学

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。