SPARK SQL:使用KAFKA订阅的结构流式传输



我正在尝试使用kafka流式SQL结构。我正在为Kafka选项寻找此强制性选项订阅[Java Regex String]。显然只有3个值:"分配,订阅"或"订阅"

当我谷歌搜索此选项时,最有用的信息出现在以下:https://jaceklaskowski.gitbooks.io/mastering-apache-park/content/spark-streaming/spark-streaming-kafka-consumersstrategy.html

任何人都可以在我的3个选项中对我介绍最明显的区别吗?对于Spark SQL

,将反映出的不同行为是什么

我不熟悉Spark,但是,对于Kafka消费者,有三个选项:

  1. 分配:手动分配主题分区(即,您可以执行所需的任何分区分配)。因此,如果您有多个消费者,并且想平衡负载,以便您需要注意两次分区。
  2. 订阅:指定您要从中读取的一组主题。消费者组管理将进行分区的实际分配(即,如果您组中有多个消费者,则分区将分配给组中的所有消费者)
  3. 模式:类似于(2),但是您指定了一个正则并订阅所有与正则匹配的主题

相关内容

  • 没有找到相关文章

最新更新