我正在尝试调试一个问题,我正在尝试运行手动扫描以找出发生了什么。
但是,似乎有些扫描可以工作,但大多数扫描由于某种原因而失败。
我们的 hbase 表中的键设置为hash_servername_timestamp,例如
123_servername.domain.com_1234567890. The hash can run from 0 to 199.
当我运行时:
scan 'server_based_data', {FILTER => "KeyOnlyFilter(( AND (PrefixFilter('0_'((", COLUMNS => 'raw_data:top', TIMERANGE =>[1498514400000, 1498515000000]}
我返回了一些行:
ROW COLUMN+CELL
0_app128021.sjc6.mydomain.com_1498514460 column=raw_data:top, timestamp=1498514502321, value=
0_app128021.sjc6.mydomain.com_1498514580 column=raw_data:top, timestamp=1498514622400, value=
<snip snip>
<snip snip>
0_app128021.sjc6.mydomain.com_1498514700 column=raw_data:top, timestamp=1498514742839, value=
179 row(s) in 177.4260 seconds
但是,如果我运行:
scan 'server_based_data', {FILTER => "KeyOnlyFilter(( AND (PrefixFilter('1_'((", COLUMNS => 'raw_data:top', TIMERANGE =>[1498514400000, 1498515000000]}
我收到错误
ROW COLUMN+CELL
ERROR: Call id=86, waitTime=60002, operationTimeout=60000 expired.
Here is some help for this command:
Scan a table; pass table name and optionally a dictionary of scanner
specifications. Scanner specifications may include one or more of:
<snip snip>
<snip snip>
我假设"0_"有效,因为从词典上讲,与"1_"或"199_"相比,它是第一个,但我对为什么"1_"不起作用感到困惑。 有人可以向我解释为什么这不起作用吗?
我还假设如果我增加超时期限,它可能有助于使其工作。 有人可以告诉我如何增加从 hbase shell 扫描的超时期限吗?
要更改 HBase shell 的超时期限,可以使用以下命令进行hbase.client.operation.timeout
或hbase.client.scanner.timeout.period
:
001:0> @shell.hbase.configuration.get("hbase.client.scanner.timeout.period")
=> "60000"
002:0> @shell.hbase.configuration.setInt("hbase.client.scanner.timeout.period", 120000)
003:0> @shell.hbase.configuration.get("hbase.client.scanner.timeout.period")
=> "120000"
或者(不是从 shell 中(,您可以编辑hbase-site.xml
中的值,但它需要重新启动群集才能让 HBase 注意到更改。如:
<property>
<name>hbase.client.scanner.timeout.period</name>
<value>120000</value>
</property>