我正在使用这个Avro模式:
Price-state.avsc
{
"namespace": "com.company.model",
"name": "Product",
"type": "record",
"fields": [
{
"name": "product_id",
"type": "string"
},
{
"name": "sale_prices",
"type": {
"name": "sale_prices",
"type": "record",
"fields": [
{
"name": "default",
"type": {
"name": "default",
"type": "record",
"fields": [
{
"name": "order_by_item_price_by_item",
"type": [
"null",
{
"name": "markup_strategy",
"type": "record",
"fields": [
{
"name": "type",
"type": {
"name": "type",
"type": "enum",
"symbols": ["margin", "sale_price"]
}
}
]
}
]
},
{"name": "order_by_item_price_by_weight", "type": ["null", "string"]},
{"name": "order_by_weight_price_by_weight", "type": ["null", "string"]}
]
}
}
]
}
}
]
}
它在此网站上正确验证,因此我假设架构有效。
我在构建 JSON 文件时遇到问题,该文件随后应使用上述架构进行编码。
我正在使用这个 JSON 进行一些测试:
test.json
{
"product_id": "123",
"sale_prices": {
"default": {
"order_by_item_price_by_item": {
"markup_strategy": {
"type": {"enum": "margin"}
}
},
"order_by_item_price_by_weight": null,
"order_by_weight_price_by_weight": null
}
}
}
运行时java -jar avro-tools-1.8.2.jar fromjson --schema-file prices-state.avsc test.json
我得到:
线程"main"中的异常 org.apache.avro.AvroTypeException: 未知的联合分支markup_strategy
我在这里读到,由于 JSON 编码,我必须将东西包装在联合中,所以我尝试了不同的组合,但似乎没有人工作。
命名空间解析问题。以这个简化的模式为例:
测试.avsc
{
"name": "Product",
"type": "record",
"fields": [
{
"name": "order_by_item_price_by_item",
"type": [
"null",
{
"type": "record",
"name": "markup_strategy",
"fields": [{
"name": "type",
"type": {
"name": "type",
"type": "enum",
"symbols": ["margin", "sale_price"]
}
}]
}
]
}
]
}
使用以下 JSON,它可以很好地验证
test.json
{
"order_by_item_price_by_item": {
"markup_strategy": {
"type": "margin"
}
}
}
现在,如果您要在架构之上添加一个命名空间,例如
测试.avsc
{
"namespace": "test",
"name": "Product",
"type": "record",
"fields": [
...
然后你还需要改变你的test.json,否则你会得到
线程"main"中的异常 org.apache.avro.AvroTypeException: 未知的联合分支markup_strategy
final_test.json
{
"order_by_item_price_by_item": {
"test.markup_strategy": {
"type": "margin"
}
}
}
因此,当在联合类型中并且您正在使用用户指定的名称对 Avro 的命名类型(记录、固定或枚举(进行 JSON 编码时,该类型的名称也需要在命名空间名称前面加上前缀以进行解析。
详细了解命名空间和 JSON 编码。
弗朗切斯科的回答很棒,并解释了这个问题!
以防万一任何人(甚至是我未来的自己(需要另一个包含可选字段和命名空间的示例:
- schema - StackOverflowSchema.avsc
{
"type": "record",
"name": "StackOverflowExampleSchema",
"namespace": "com.schemata.stackoverflow",
"fields": [
{
"name": "exampleEntity",
"type": {
"type": "record",
"name": "ExampleEntity",
"namespace": "com.stackoverflow",
"fields": [
{
"name": "description",
"type": ["null", "string"]
},
{
"name": "currentAmount",
"type": {
"type": "record",
"name": "MonetaryAmount",
"namespace": "com.acme.common",
"fields": [
{
"name": "currencyCode",
"type": ["null", {
"type": "enum",
"name": "CurrencyCode",
"symbols": ["AED", "USD"],
"default": "USD"
}
]
},
{
"name": "amount",
"type": {
"type": "int"
}
}
]
}
},
{
"name": "totalAmount",
"type": ["null", "com.acme.common.MonetaryAmount"]
}
]
}
}
]
}
- 示例文件 - stackoverflow.json
{
"exampleEntity": {
"description": {
"string": "some optional description"
},
"currentAmount":{
"amount": 10",
"currencyCode": {
"com.acme.common.CurrencyCode": "USD"
}
},
"totalAmount": {
"com.acme.common.MonetaryAmount": {
"amount": 20,
"currencyCode": {
"com.acme.common.CurrencyCode": "USD"
}
}
}
}
}
currentAmount
和totalAmount
都有com.acme.common.MonetaryAmount
类型。
虽然前者是必填字段,但后者可以null
。
同样在MonetaryAmount
中,我们要求(amount
(和可选(currencyCode
(。
以下命令生成 avro 消息:
java -jar avro-tools-1.11.0.jar fromjson --schema-file ./StackOverflowSchema.avsc stackoverflow.json > stackoverflow.avro