如何在火花流测试中使用火花卡桑德拉连接器时模拟 cassandra 的数据



我有一个完全用scala编写的代码,它使用Spark流从kafka主题获取json数据,然后在经过一些处理后将其转储到cassandra和另一个kafka主题。现在我需要为此代码编写一个单元测试。我需要有关如何编写此类测试以及如何在使用 spark Cassandra 连接器时模拟数据的帮助。

您可以使用与连接器本身一起开发的Spark-cassandra-connector-embedded 。只需将 Maven 或 SBT 依赖项添加到您的项目中,例如 SBT 的以下内容:

"com.datastax.spark"  %% "spark-cassandra-connector-embedded" % {latest.version}

最新更新