我想启用两个应用程序实例来共享单个 HDFS 集群,但应用程序的每个实例都需要自己的 Hive 数据库。
有没有办法在群集中配置多个独立的 Hive 服务器/元存储,以便每个应用程序都可以使用群集中的数据?
应用程序的每个实例都需要自己的 Hive 数据库
然后在蜂巢中做CREATE DATABASE my_own_database;
。
在其他应用中执行任何查询之前,请先运行"USE my_own_database;
"或"SELECT * FROM my_own_database.table
否则,当然,您必须安装和配置一个单独的Hive元存储Java进程,指向不同的数据库(甚至单独的服务器(
在蜂巢站点中.xml
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:<protocol>://<host>:<port>/<databasename></value>
</property>
然后,应用程序必须hive.metastore.uris
设置为指向该实例