我有一些来自 kafka 提供程序的示例 Avro 消息,它看起来是这样开始的:
00000000 4f 62 6a 01 04 16 61 76 72 6f 2e 73 63 68 65 6d |Obj...avro.schem|
00000010 61 ef bf bd 24 7b 22 74 79 70 65 22 3a 22 72 65 |a...${"type":"re|
那ef bf bd 24
我期望的架构长度为 2332 字节。我无法确认锯齿形变体(为什么永远不会为负的长度会是锯齿形的?(是正确的值。我认为它在 200K 范围内。
我相信这就是为什么我在使用它的 avro-tools jar 来获取元、getschema 或转换为 json 时遇到麻烦的原因。
对于该工具版本的Avro Tools版本(1.8.2(或带有java 1.8.0_102-b14的平台Mac OS,这是一个特殊的已知问题吗?
这看起来像是被错误编码了吗?因为所有使用这些工具的调用都给了我:
$ java -jar ~/Downloads/avro-tools-1.8.2.jar tojson dt20170607hr08_1496793109907_11_8229967.bin.1
log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
Exception in thread "main" java.lang.IllegalArgumentException
at java.nio.ByteBuffer.allocate(ByteBuffer.java:334)
at org.apache.avro.io.BinaryDecoder.readBytes(BinaryDecoder.java:288)
at org.apache.avro.file.DataFileStream.initialize(DataFileStream.java:112)
at org.apache.avro.file.DataFileStream.<init>(DataFileStream.java:84)
at org.apache.avro.tool.DataFileReadTool.run(DataFileReadTool.java:71)
at org.apache.avro.tool.Main.run(Main.java:87)
at org.apache.avro.tool.Main.main(Main.java:76)
看起来您在 Avro 文件中只有一条记录。 生成 Avro 文件的系统正在运行旧版本。 我在运行 1.7.7 的 Nifi 时遇到了类似的问题。 通过将两条记录合并到 Avro 文件中,我们能够解决此问题。
Avro 1.8.2 修复了该错误。
1.7.7和 1.8.0/1.8.1 都有单条记录问题。
https://issues.apache.org/jira/browse/AVRO-1888