大数据中Hive与HBase的区别与联系
发布时间:2019-12-23 12:48:28   来源:东方头条   评论 参与

二者区别

Hive:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。

Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。

hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。

HBase:HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。

hbase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作

hbase可以认为是hdfs的一个包装。他的本质是数据存储,是个NoSql数据库;hbase部署于hdfs之上,并且克服了hdfs在随机读写方面的缺点。二者联系Hbase和Hive在大数据架构中处在不同位置,Hbase主要解决实时数据查询问题,Hive主要解决数据处理和计算问题,一般是配合使用。

在大数据架构中,Hive和HBase是协作关系,数据流一般如下图:

通过ETL工具将数据源抽取到HDFS存储;

通过Hive清洗、处理和计算原始数据;

HIve清洗处理后的结果,如果是面向海量数据随机查询场景的可存入Hbase

数据应用从HBase查询数据;

① 康复在线网所有原创文章(含图片),未经允许不得转载或镜像;授权转载应在范围内使用,并注明来源。
② 部分内容转载自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
③ 如因作品内容、版权和其他问题需要同本网联系:2816822384@qq.com,请在30日内进行。

相关热词搜索:区别 数据 Hive HBase

上一篇:高山冰冻圈退缩将影响人类生存环境
下一篇:最后一页

主办单位:《康复在线网》出版公司。 网站低俗信息举报信箱
康复在线网:立足“华人的角度”
违法和不良信息举报中心