我想构建一个简单的Kafka流,尝试根据某些条件转换事件。如果事件可以转换,则转换后的事件将进入不同的主题。如果无法转换该事件,则会再次将其存储在同一主题中,以供将来尝试。
假设我有这个:
case class Foo(a: String, b: String, c: Boolean)
def translate(value: String): Option[Foo] = {
// ...
// Returns an Option of Foo
}
所以我需要这样的东西:
val builder: StreamsBuilder = new StreamsBuilder()
builder
.stream(topic)
.map[String, String]((key, value) => translate(value))
// If translate(value) is Some(value) send the value to a topic
// Otherwise, send the original value (without being transformed) to the same topic
我完全被这个问题困住了。我遇到的最接近的事情是尝试创建一个带有布尔值的结构,告诉我事件是否可以转换,然后使用.branch
创建不同的流。例如,像这样:
def translate(value: String): (Boolean, Option[CPCTTMDataTransformed]) = {
val eventTransformed = transform(value)
eventTransformed match {
case Some(value) => (true, Option(value))
case None => (false, None)
}
}
然后尝试做这样的事情:
builder
.stream(topic)
.map[String, (Boolean, Option[Foo])]((key, value) => translate(value))
.branch(
(_, element) => element._1,
)
.foreach {
// Send the "true" to one topic and in the "false", send the original message to the original topic
}
但是,当然,我需要原始事件才能将其发送到主题。
我虽然有更复杂的结构,但最后我总是回到基于Some
- None
条件分支流的问题。
也许使用处理器 API。您有一个Processor
进行翻译,如果翻译成功,则context.forward(To.child("translated"))
否则context.forward(To.child("retry"))
。
您可以手动将Topology
插入在一起:
Topology topology = new Topology();
topology.addSource("source", topic);
topology.addProcessor("translator", () -> new TranslateProcessor(), "source");
topology.addSink("translated", resultTopic, "translator");
topology.addSink("retry", topic, "translator");