纱线上的 Flink:如何在本地客户端中添加外部 jars 类路径



我试图部署我的应用程序以使用 cli 在纱线上闪烁,不幸的是,它失败了,出现以下异常

java.lang.NoClassDefFoundError: Lredis/clients/jedis/JedisCluster;
    at java.lang.Class.getDeclaredFields0(Native Method)
    at java.lang.Class.privateGetDeclaredFields(Class.java:2583)
    at java.lang.Class.getDeclaredFields(Class.java:1916)
    at org.apache.flink.api.java.ClosureCleaner.clean(ClosureCleaner.java:72)
    at org.apache.flink.streaming.api.environment.StreamExecutionEnvironment.clean(StreamExecutionEnvironment.java:1548)
    at org.apache.flink.streaming.api.datastream.DataStream.clean(DataStream.java:183)
    at org.apache.flink.streaming.api.datastream.DataStream.flatMap(DataStream.java:551)
    at org.apache.flink.streaming.api.scala.DataStream.flatMap(DataStream.scala:594)
    at com.hypers.hwt.realtime.top.HwtRealTimeTopRunner.executeLateStream(HwtRealTimeTop.scala:138)
    at com.hypers.hwt.realtime.top.HwtRealTimeTopRunner.run(HwtRealTimeTop.scala:72)
    at com.hypers.hwt.realtime.top.HwtRealTimeTop$.main(HwtRealTimeTop.scala:265)
    at com.hypers.hwt.realtime.top.HwtRealTimeTop.main(HwtRealTimeTop.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.flink.client.program.PackagedProgram.callMainMethod(PackagedProgram.java:528)
    at org.apache.flink.client.program.PackagedProgram.invokeInteractiveModeForExecution(PackagedProgram.java:419)
    at org.apache.flink.client.program.ClusterClient.run(ClusterClient.java:381)
    at org.apache.flink.client.CliFrontend.executeProgram(CliFrontend.java:838)
    at org.apache.flink.client.CliFrontend.run(CliFrontend.java:259)
    at org.apache.flink.client.CliFrontend.parseParameters(CliFrontend.java:1086)
    at org.apache.flink.client.CliFrontend$2.call(CliFrontend.java:1133)
    at org.apache.flink.client.CliFrontend$2.call(CliFrontend.java:1130)
    at org.apache.flink.runtime.security.HadoopSecurityContext$1.run(HadoopSecurityContext.java:43)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1709)
    at org.apache.flink.runtime.security.HadoopSecurityContext.runSecured(HadoopSecurityContext.java:40)
    at org.apache.flink.client.CliFrontend.main(CliFrontend.java:1130)

我已经使用 -yt 参数来分发我的外部 jar,但仍然失败。实际上,flink 提交作业需要 3 个步骤:

  1. 在客户端中包装代码并构建图形
  2. 客户端将作业提交给作业管理器
  3. 作业管理器
  4. 将作业分发给任务管理器

问题

在长时间的测试中,我发现此异常发生在步骤1中。step1 由 YarnClusterClient 在本地运行。而且我知道这个问题可以通过在 $FLINK_HOME/lib 中添加我的外部 jar 来解决,但它会导致与其他应用程序冲突

期望

所以我想知道是否有任何方法可以在本地添加外部jars类路径?

添加

class LateFlatMap(conf: FlinkJedisClusterConfig) extends RichFlatMapFunction[(PvAccBean, UvAccBean), Iterable[(String, Array[Byte])]] {
  var jedisCluster: JedisCluster = null
  override def open(properties: Configuration): Unit = {
   val genericObjectPoolConfig = new GenericObjectPoolConfig()
       genericObjectPoolConfig.setMaxIdle(conf.getMaxIdle())
       genericObjectPoolConfig.setMaxTotal(conf.getMaxTotal())
       genericObjectPoolConfig.setMinIdle(conf.getMinIdle())
   jedisCluster = new JedisCluster(conf.getNodes(), conf.getConnectionTimeout(),
   conf.getMaxRedirections(), genericObjectPoolConfig)
 }
 @Override
  override def close(): Unit = {
   jedisCluster.close()
 }
 ...
} 

基本上我看到了两种可能性:

  1. 通过构建一个胖罐子将您的 3rd 方库添加到您的作业罐中。每个主要的构建系统都可以这样做(例如Maven程序集插件或SBT程序集插件(。这将是我的首选解决方案
  2. 如果你想将你的第三方库用于所有的 flink 作业,你可以在启动集群之前将它们添加到 flinks jars 目录中。这也将起作用,但为您提供的灵活性较低。

希望有帮助

尝试了 -C 和 -yt 组合的所有选项,在类路径中添加了外部 jar 并在 yarn.ship.directory 中添加,但在初始化 mq 连接工厂时失败。放在 flink 库中时同样有效。仍然想知道这在 2020 年底不起作用<</p>

div class="one_answers">

尝试使用

bin/start-scala-shell.sh local -a <full_external_jar_path>

最新更新