如何转换 Kafka 流事件并将其发送到另一个主题,前提是可以转换



我想构建一个简单的Kafka流,尝试根据某些条件转换事件。如果事件可以转换,则转换后的事件将进入不同的主题。如果无法转换该事件,则会再次将其存储在同一主题中,以供将来尝试。

假设我有这个:

case class Foo(a: String, b: String, c: Boolean)
def translate(value: String): Option[Foo] = {
  // ...
  // Returns an Option of Foo
}

所以我需要这样的东西:

val builder: StreamsBuilder = new StreamsBuilder()
builder
  .stream(topic)
  .map[String, String]((key, value) => translate(value))
  // If translate(value) is Some(value) send the value to a topic
  // Otherwise, send the original value (without being transformed) to the same topic

我完全被这个问题困住了。我遇到的最接近的事情是尝试创建一个带有布尔值的结构,告诉我事件是否可以转换,然后使用.branch创建不同的流。例如,像这样:

def translate(value: String): (Boolean, Option[CPCTTMDataTransformed]) = {
  val eventTransformed = transform(value)
  eventTransformed match {
    case Some(value) => (true, Option(value))
    case None => (false, None)
  }
}

然后尝试做这样的事情:

builder
  .stream(topic)
  .map[String, (Boolean, Option[Foo])]((key, value) => translate(value))
  .branch(
    (_, element) => element._1,
  )
  .foreach {
    // Send the "true" to one topic and in the "false", send the original message to the original topic 
  }

但是,当然,我需要原始事件才能将其发送到主题。

我虽然有更复杂的结构,但最后我总是回到基于Some - None条件分支流的问题。

也许使用处理器 API。您有一个Processor进行翻译,如果翻译成功,则context.forward(To.child("translated"))否则context.forward(To.child("retry"))

您可以手动将Topology插入在一起:

Topology topology = new Topology();
topology.addSource("source", topic);
topology.addProcessor("translator", () -> new TranslateProcessor(), "source");
topology.addSink("translated", resultTopic, "translator");
topology.addSink("retry", topic, "translator");

最新更新