Golang xml.取消聚合接口类型



在golang中使用xml包时,我在解组非同质类型列表时遇到问题。考虑以下XML文档,其嵌套元素是非同质类型的列表:

<mydoc>
  <foo>Foo</foo>
  <bar>Bar</bar>
  <foo>Another Foo</foo>
  <foo>Foo #3</foo>
  <bar>Bar 2</bar>
</mydoc>

下面的golang代码用于测试XML un/mashalling(也可以在这里进行):

package main
import "encoding/xml"
import "fmt"
const sampleXml = `
<mydoc>
  <foo>Foo</foo>
  <bar>Bar</bar>
  <foo>Another Foo</foo>
  <foo>Foo #3</foo>
  <bar>Bar 2</bar>
</mydoc>
`
type MyDoc struct {
  XMLName xml.Name `xml:"mydoc"`
  Items   []Item
}
type Item interface {
  IsItem()
}
type Foo struct {
  XMLName xml.Name `xml:"foo"`
  Name    string   `xml:",chardata"`
}
func (f Foo) IsItem() {}
type Bar struct {
  XMLName xml.Name `xml:"bar"`
  Nombre  string   `xml:",chardata"`
}
func (b Bar) IsItem() {}
func main() {
  doMarshal()
  doUnmarshal()
}
func doMarshal() {
  myDoc := MyDoc{
    Items: []Item{
      Foo{Name: "Foo"},
      Bar{Nombre: "Bar"},
      Foo{Name: "Another Foo"},
      Foo{Name: "Foo #3"},
      Bar{Nombre: "Bar 2"},
    },
  }
  bytes, err := xml.MarshalIndent(myDoc, "", "  ")
  if err != nil {
    panic(err)
  }
  // Prints an XML document just like "sampleXml" above.
  println(string(bytes))
}
func doUnmarshal() {
  myDoc := MyDoc{}
  err := xml.Unmarshal([]byte(sampleXml), &myDoc)
  if err != nil {
    panic(err)
  }
  // Fails to unmarshal the "Item" elements into their respective structs.
  fmt.Printf("ERR: %#v", myDoc)
}

您将看到doMarshal()生成的XML文档正是我所期望的;然而,doUnmarshal()未能将"Item"元素反序列化为它们各自的结构。我尝试了一些更改,但似乎没有什么能让它们正确地解组(为myDoc.Items创建存储,将"Items"的类型更改为[]*Item[和其他],篡改XML标记,等等)。

有什么想法可以让xml.Unmarshal(...)反序列化不相关类型的元素列表吗?

正如其他评论所指出的,如果没有一些帮助,解码器就无法处理接口字段。在容器上实现xml.Unmarshaller将使它做你想做的事(操场上的完整工作示例):

func (md *MyDoc) UnmarshalXML(d *xml.Decoder, start xml.StartElement) error {
    md.XMLName = start.Name
    // grab any other attrs
    // decode inner elements
    for {
        t, err := d.Token()
        if err != nil {
            return err
        }
        var i Item
        switch tt := t.(type) {
        case xml.StartElement:
            switch tt.Name.Local {
            case "foo":
                i = new(Foo) // the decoded item will be a *Foo, not Foo!
            case "bar":
                i = new(Bar)
                // default: ignored for brevity
            }
            // known child element found, decode it
            if i != nil {
                err = d.DecodeElement(i, &tt)
                if err != nil {
                    return err
                }
                md.Items = append(md.Items, i)
                i = nil
            }
        case xml.EndElement:
            if tt == start.End() {
                return nil
            }
        }
    }
    return nil
}

这只是@evanmcdonnal建议的一个实现。所有这些都是根据下一个Token的名称实例化适当的Item,然后用它调用d.DecodeElement()(即让xml解码器来完成繁重的工作)。

注意,解组的Items是指针。如果你想要价值观,你需要做更多的工作。为了正确处理错误或意外输入数据,还需要对其进行更多扩展。

最新更新