小贝子编程

Spark使用模式注册表(avro)读取kafka流的最佳实践

本文关键字：kafka 最佳读取模式注册表 avro Spark scala apache-spark apache-kafka avro confluent-schema-registry
更新时间 : 2023-09-15
英文 : Best practice for Spark to read kafka streams with schema registry (avro)?

Spark是否有任何最佳实践来处理在Avro中使用模式注册表序列化的kafka流？特别是对于Spark结构化流？

我在中找到了一个例子https://github.com/ScalaConsultants/spark-kafka-avro/blob/master/src/main/scala/io/scalac/spark/AvroConsumer.scala。但是我未能加载AvroConverter类。我在mvnrepository.com中找不到名为io.confluent:kafka-avro-serializer的工件。

您需要在build.sbt:中添加Confluent repo

val repositories = Seq(
"confluent" at "http://packages.confluent.io/maven/",
Resolver.sonatypeRepo("public")
)

请参阅：https://github.com/ScalaConsultants/spark-kafka-avro/blob/master/build.sbt

最新更新

为什么我的Django数据库刷新命令不起作用
在html和angular上使用canvas的动态id
如何制作合适的函数包装器
Regex显示字符串中的第一组数字
Python:对文本页面(文件)中的脚注重新编号的算法
AuthClient 不是一个类型，因此它不能用作类型参数 - Dart 包googleapis_auth
如何在mysql查询中格式化unix时间戳并剥离后缀?
表示Last_Name + First_Name有一条特定值的记录
Django Form这么多字段
Default如何将create_function更改为匿名函数?
Pandas组按行数百分比排序
从Word文档转换为PDF，显示错误的标题
UE4 -对特定角色施加伤害
堆栈中的帧指针是什么?这个框架到底是什么?(汇编中的堆栈)
如何使string.strip()剥离多个字符?
Git 连接问题。 "fatal: unable to connect to github.com....."
使用SingleStore连接两个带有整数字符串的表
将用户输入的值替换为React中由状态分配的值
如何从JSchema获取父对象名称/映射JsonObjects到新的父对象
为pandas数据框架列添加字符串，其中包含多个逗号分隔值
我试图在python中创建一个虚拟环境，但我得到错误:未能找到内置解释器python_spec=python3.5的发现
Spark 相当于 postgres json 函数 ->
API 无法处理我的请求，因为模板文字使 API 动态化
如何在VBA中引用UserForm中文本框的值?
获取(count(column1) + count(column2))的和
Cypress -如何使用Cypress命令验证PDF文件中的数据
JS reduceRight是导致数组成为对象，我怎么能修复逻辑?
是否有办法在SQL中创建一个临时2d数组?
如何使用特定列中的id在R中绑定data.frames
如何隐藏源代码，而我运行react-app-rewired构建和react-app-rewired启动

Spark使用模式注册表(avro)读取kafka流的最佳实践

相关内容

最新更新

热门标签：