hbase笔记

tech2025-06-15  4

【1】HBase介绍 【2】单机部署 【3】伪分布式部署 【4】ubuntu16.04集群部署hbase

【1】HBase介绍

HBase(Hadoop Database)是一个高可靠性、高性能、面向列、可伸缩、 实时读写的分布式数据库,利用Hadoop HDFS作为其文件存储系统, 利用Hadoop MapReduce来处理 HBase中的海量数据,利用Zookeeper作为其分布式协同服务,主要用来存储非结构化和半结构化的松散数据(列存NoSQL数据库)。 #HBase的特点 1.容量大: 传统关系型数据库,单表不会超过五百万,超过要做分表分库,不会超过30列。 Hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个维度所支持的数据量级都非常具有弹性 2.面向列: 面向列的存储和权限控制,并支持独立检索,可以动态增加列,即,可单独对列进行各方面的操作 列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数量 3.多版本: Hbase的每一个列的数据存储有多个Version,比如住址列,可能有多个变更,所以该列可以有多个version 4.稀疏性: 为空的列并不占用存储空间,表可以设计的非常稀疏。不必像关系型数据库那样需要预先知道所有列名然后再进行null填充 5.拓展性: 底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加datanode节点服务(机器)就可以了 6.高可靠性: WAL机制,保证数据写入的时候不会因为集群异常而导致写入数据丢失 Replication机制,保证了在集群出现严重的问题时候,数据不会发生丢失或者损坏 Hbase底层使用H
最新回复(0)