题目:基于HBase的数据存储与管理研究目录摘要1一、概述1二、研究背景1三、HBase分布式数据库21、HBase与Hadoop及其组件的关系22、HBase系统架构33、HBase存储结构54、HBase数据模型9四、总结与建议12五、主要参考文献12高级数据库技术课程报告摘要在如今数据急剧膨胀的时代云计算应运而生,它为海量数据的存储和处理提供了一种新的解决方案,Hadoop作为Apache开源组织的一个分布式计算框架在很多商业应用中得到实践,它可以使用户在不了解分布式系统底层细节的情况下,开发分布式程序对大数据进行处理。Hbase数据库是基于Hadoop的Apache顶层项目,它是BigTable的开源实现,是一个面向列的非结构化数据库。本文首先介绍了Hadoop的子项目HDFS和MapReduce的作用以及对HBase数据的支持性,然后依次阐述了Hbase的主从式系统架构和Region集群中存储架构,介绍了StoreFile的compact和splite过程,详细分析了HLog、HFile和KeyValue存储