我在HBase中有一个表,我想对它执行更新。例如,如果pred(row) == true
(pred
是用Java编写的函数),我想将列更新为一个值。
我可以使用MapReduce吗?起初我认为我可以,但现在我看到MapReduce用于从一个表中读取并写入另一个表(或磁盘)。然后,我考虑实现一个并行扫描,它将使用多个线程在整个表上迭代,但似乎我在重新发明轮子。
对于此任务,不需要MapReduce。您可以连接到HBASE并从java应用程序本身完成工作。下面的代码有点帮助
HTable table = new HTable(HBaseConfiguration.create(), "MYTABLE");
Scan scan = new Scan();
scan.addFamily(Bytes.toBytes("myfamily"));
ResultScanner scanner = table.getScanner(scan);
for (Result result = scanner.next(); (result != null); result = scanner.next()) {
for(KeyValue keyValue : result.list()) {
// Make use of keyValue.getKeyString() and keyValue.getValue() here
}
}
更新特定行的代码片段如下
Put p = new Put(Bytes.toBytes("row1"));
p.add(Bytes.toBytes("myfamily"),
Bytes.toBytes("fieldname"),Bytes.toBytes("NEWVALUE"));
table.put(p);