小贝子编程

在单个作业中批量加载到多个 HBase 表

本文关键字：HBase 加载单个作业 mapreduce hbase
更新时间 : 2023-08-29
英文 : Bulk load to multiple HBase tables in single job

我想使用单个mapreduce作业将数据批量加载到多个表中。由于数据量很大，迭代数据集两次并使用多个作业加载会很耗时。有什么办法可以做到这一点吗？提前谢谢。

我正在使用Hbase。但是我还不需要批量加载。但是我遇到了这篇文章，可能会对您有所帮助。

http://hbase.apache.org/book/arch.bulk.load.html

批量加载功能使用 MapReduce 作业以 HBase 的内部数据格式输出表数据，然后将生成的 StoreFiles 直接加载到正在运行的集群中。与仅使用 HBase API 相比，使用批量加载将使用更少的 CPU 和网络资源。

最新更新

从html [web app using flask]中的python文件获取信息
磁盘[admin]未配置，请在' config/ filessystems .php '中添加磁盘配置
如何从子组件中设置父组件中的变量
我如何排序我的捆绑器依赖之间是一个开发依赖或不是?
Weka RF 不会给出任何混淆矩阵或预期结果
我想简化这个javascript代码.有许多子元素
如何将列表转换为元组，我尝试了基于谷歌搜索，它从未工作过
键和值的哈希集
目标链接并不总是出现在iframe中
0x800700b7向IIS部署网站错误
条形码扫描器何时创建com端口，何时不创建?
在SQL中创建一个没有join的视图
在React中使用jQuery仅用于更改样式(颜色，边框等)是可以的吗?
UseState没有更新组件属性
c语言 - 我有一个将字符串作为参数的函数.v手动输入字符串有效，但使用 scanf 不起作用
无法解析google工作表中的范围
如何在顺风中使用柔韧
无法将数据插入数据库
r语言 - 闪亮的应用程序输出显示在控制台，而不是在主面板
ModuleNotFoundError for 'sklearn' as subdependency of numpy
语句中未声明的标识符导致的负索引'for'
MariaDB vs MySQL:列定义中的默认表达式不工作
在SQL表中有一个默认时间
vb.net stream_writer encoding
我们可以在powershell中调用Bat命令而不调用/调用Bat文件吗?
如何修复类型错误：'int'对象不可迭代
Discord Bot JS:编辑来自先前斜杠命令交互的回复
在喷气背包撰写更好的缩放行为
如何从外部react连接到nextjs的websocket
什么是GLFW中的用户指针?

在单个作业中批量加载到多个 HBase 表

相关内容

最新更新

热门标签：