我的环境:哈多普 1.0.4蜂巢 0.12HBase 0.94.14普雷斯托 0.56
所有软件包都安装在伪计算机上。这些服务未在本地主机上运行,但在具有静态 IP 的主机名上。
Presto conf:
coordinator=false
datasources=jmx,hive
http-server.http.port=8081
presto-metastore.db.type=h2
presto-metastore.db.filename=/root
task.max-memory=1GB
discovery.uri=http://<HOSTNAME>:8081
在 presto cli 中,我可以成功获取 hive 中的表:
presto:default> show tables;
Table
-------------------
ht1
k_business_d_
k_os_business_d_
...
tt1_
(11 rows)
Query 20140114_072809_00002_5zhjn, FINISHED, 1 node
Splits: 2 total, 2 done (100.00%)
0:11 [11 rows, 291B] [0 rows/s, 26B/s]
但是当我尝试从任何表中查询数据时,结果始终为空:(无错误信息)
presto:default> select * from k_business_d_;
key | business | business_name | collect_time | numofalarm | numofhost | test
-----+----------+---------------+--------------+------------+-----------+------
(0 rows)
Query 20140114_072839_00003_5zhjn, FINISHED, 1 node
Splits: 1 total, 1 done (100.00%)
0:02 [0 rows, 0B] [0 rows/s, 0B/s]
如果我在 Hide 中执行相同的 sql,结果显示表中有 1 行。
hive> select * from k_business_d_;
OK
9223370648089975807|2 2 测试机 2014-01-04 00:00:00 NULL 1.0 NULL
Time taken: 2.574 seconds, Fetched: 1 row(s)
为什么 presto 无法从 HIVE 表中获取?
看起来这是一个通过 org.apache.hadoop.hive.hbase.HBaseStorageHandler
使用 HBase 的外部表。目前尚不支持此功能,但一个邮件列表帖子表明,如果您将适当的jar复制到Hive插件目录,则可能是可能的:https://groups.google.com/d/msg/presto-users/U7vx8PhnZAA/9edzcK76tD8J