2025年HBase统计表行数(RowCount)的四种方法

科技前沿 • 2025-02-27 13:20 • 阅读 61

HBase统计表行数(RowCount)的四种方法背景对于其他数据存储系统来说统计表的行数是再基本不过的操作了一般实现都非常简单但对于 HBase 这种 key value 存储结构的列式数据库统计 RowCount 的方法却有好几种不同的花样并且执行效率差别巨大下面来研究下吧测试集群 HBase1 2 0

大家好，我是讯享网，很高兴认识大家。

背景：
对于其他数据存储系统来说，统计表的行数是再基本不过的操作了，一般实现都非常简单；但对于HBase这种key-value存储结构的列式数据库，统计 RowCount 的方法却有好几种不同的花样，并且执行效率差别巨大！下面来研究下吧~

测试集群：HBase1.2.0 - CDH5.13.0 四台服务器

注：以下4种方法效率依次提高

一、hbase-shell的count命令

这是最简单直接的操作，但是执行效率非常低，适用于百万级以下的小表RowCount统计！
在这里插入图片描述
讯享网

 hbase> count 'ns1:t1' hbase> count 't1' hbase> count 't1', INTERVAL =>  hbase> count 't1', CACHE => 1000 hbase> count 't1', INTERVAL => 10, CACHE => 1000

此操作可能需要很长时间，来运行计数MapReduce作业。默认情况下每1000行显示当前计数，计数间隔可自行指定。

默认情况下在计数扫描上启用缓存，默认缓存大小为10行。

行数为 3000W 的表测试结果：

讯享网hbase(main):001:0> count 'sda_crm_calls'

在这里插入图片描述
默认INTERVAL为1000行时花了80分钟。。

hbase(main):001:0> count 'sda_crm_calls', INTERVAL =>

在这里插入图片描述

INTERVAL为行时花了130分钟。。

二、scan方式设置过滤器循环计数（JAVA实现）

这种方式是通过添加 FirstKeyOnlyFilter 过滤器的scan进行全表扫描，循环计数RowCount，速度较慢！ 但快于第一种count方式！

基本代码如下：

小讯

2025年通过拼多多数据分析平台洞察行业类目的新趋势-拼多多商品详情数据接口-拼多多商品数据分析-拼多多API接口

上一篇 2025-03-26 07:40

自动挡汽车档位说明及图解（转）

下一篇 2025-03-13 14:47

2025年通过拼多多数据分析平台洞察行业类目的新趋势-拼多多商品详情数据接口-拼多多商品数据分析-拼多多API接口 1735992851
2025年Git——分支（详细解释） 1735992850
linux如何查看入口地址,宝塔Linux面板安全入口地址忘了（方法一） 1735992850
2025年linux系统在pe下查看ip地址,pe下查看原系统ip的方法_网站服务器运行维护 1735992849
2025年Oracle中的循环 1735992848
2025年主观唯心、客观唯心、朴素唯物、历史唯物、辩证唯物主义的内涵、区别和联系 1735992847
2025年8种垂直居中的方法 1735992846
2025年吉比特无源光网络三巨头：GPON、XG-PON和XGS-PON到底有啥区别？ 1735992846
2025年linux脚本的功能,Linux——Shell脚本的基本应用 1735992845
自动挡汽车档位说明及图解（转） 1735992853
如何实现增材制造？4大步骤帮你解决 1735992853
如何安装Nginx服务 1735992854
GOF 23种常用设计模式 1735992854
eARC是什么 1735992854
SARM简介：探索编程世界中的SARM技术 1735992855
2025年手搭我的世界基岩版服务器后台网站（LiteloaderBDS-SQLite-Spring Boot-Vue）Java后端+RESTful API；借助Three.js实现三维可视化展览交互界面 1735992856
2025年腾达老的路由器W311R-V2 升级固件为NH326 -路由器中继 1735992856
**免费WordPress插件，用于优化网站性能 1735992857

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/36565.html