如何将其他库添加到TEZ中以支持其他HDF后端



当我将mapReduce用作Hive后面的执行引擎时,我可以将替代后端使用到我的defaultfs.impl。使用类似的语法:

LOCATION 'protocol://address:port/dir';

我想使用TEZ执行引擎而不是MapReduce,但无法弄清楚在哪里添加我的垫片库(JAR文件),以便tez识别我的新协议。

这些目录进入了什么目录?我需要将指令添加到tez-site.conf?

附加输入:

Vertex failed, vertexName=Map 6, 
vertexId=vertex_1504790331090_0003_1_01, diagnostics=[Vertex 
vertex_1504790331090_0003_1_01 [Map 6] killed/failed due 
to:ROOT_INPUT_INIT_FA
ILURE, Vertex Input: item initializer failed, 
vertex=vertex_1504790331090_0003_1_01 [Map 6], 
java.lang.RuntimeException: java.lang.ClassNotFoundException: Class 
org.apache.
hadoop.fs.nfs.NFSv3FileSystem not found
    at 
org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2241)
    at         org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2780)
    at     org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2793)
    at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:99)
    at     org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2829)
    at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2811)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:390)
    at org.apache.hadoop.fs.Path.getFileSystem(Path.java:295)
    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1227)
    at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.getSplits(OrcInputFormat.java:1285)
    at org.apache.hadoop.hive.ql.io.HiveInputFormat.addSplitsForGroup(HiveInputFormat.java:307)
    at org.apache.hadoop.hive.ql.io.HiveInputFormat.getSplits(HiveInputFormat.java:409)
    at org.apache.hadoop.hive.ql.exec.tez.HiveSplitGenerator.initialize(HiveSplitGenerator.java:155)
    at org.apache.tez.dag.app.dag.RootInputInitializerManager$InputInitializerCallable$1.run(RootInputInitializerManager.java:273).....

我已经将NFS连接器JAR文件添加到/usr/hdp//Hiveserver2/lib并重新启动了我的Hive服务器。我还向Hive-conf.xml添加了AUX路径:

<property>
  <name>hive.aux.jars.path</name>
  <value>file:///netappnfs/hadoop-nfs-connector-2.0.0.jar</value>
</property>

我认为我需要加载班级,但不确定如何在Hive中进行。在通用的hadoop中,它的加载:

      <name>fs.AbstractFileSystem.nfs.impl</name>
  <value>org.apache.hadoop.fs.nfs.NFSv3AbstractFilesystem</value>

蜂巢有什么等效的?

将jar详细信息添加到hive-site.xml(/etc/hive/conf)。

IE

property>
  <name>hive.aux.jars.path</name>
  <value>file:///location/fle.jar</value>
</property>

重新启动蜂巢

最新更新