Go 解析器未检测到有关结构类型的文档注释



我正在尝试使用 Go 的解析器和 ast 包阅读关于结构类型的 Doc 注释。在此示例中,代码仅使用自身作为源。

package main
import (
    "fmt"
    "go/ast"
    "go/parser"
    "go/token"
)
// FirstType docs
type FirstType struct {
    // FirstMember docs
    FirstMember string
}
// SecondType docs
type SecondType struct {
    // SecondMember docs
    SecondMember string
}
// Main docs
func main() {
    fset := token.NewFileSet() // positions are relative to fset
    d, err := parser.ParseDir(fset, "./", nil, parser.ParseComments)
    if err != nil {
        fmt.Println(err)
        return
    }
    for _, f := range d {
        ast.Inspect(f, func(n ast.Node) bool {
            switch x := n.(type) {
            case *ast.FuncDecl:
                fmt.Printf("%s:tFuncDecl %st%sn", fset.Position(n.Pos()), x.Name, x.Doc)
            case *ast.TypeSpec:
                fmt.Printf("%s:tTypeSpec %st%sn", fset.Position(n.Pos()), x.Name, x.Doc)
            case *ast.Field:
                fmt.Printf("%s:tField %st%sn", fset.Position(n.Pos()), x.Names, x.Doc)
            }
            return true
        })
    }
}

函数和字段的注释文档输出没有问题,但由于某种原因,"FirstType 文档"和"SecondType 文档"无处可寻。我错过了什么?Go 版本是 1.1.2。

(要运行上述内容,请将其保存到main.go文件中,然后go run main.go

好问题!

查看go/doc的源代码,我们可以看到它必须在readType函数中处理相同的情况。在那里,它说:

324     func (r *reader) readType(decl *ast.GenDecl, spec *ast.TypeSpec) {
...
334     // compute documentation
335     doc := spec.Doc
336     spec.Doc = nil // doc consumed - remove from AST
337     if doc == nil {
338         // no doc associated with the spec, use the declaration doc, if any
339         doc = decl.Doc
340     }
...

特别要注意它需要如何处理 AST 没有附加到 TypeSpec 的文档的情况。为此,它回落到GenDecl 。这为我们提供了有关如何直接使用 AST 来解析结构的文档注释的线索。调整问题代码中的 for 循环以添加*ast.GenDecl的案例:

for _, f := range d {
    ast.Inspect(f, func(n ast.Node) bool {
        switch x := n.(type) {
        case *ast.FuncDecl:
            fmt.Printf("%s:tFuncDecl %st%sn", fset.Position(n.Pos()), x.Name, x.Doc.Text())
        case *ast.TypeSpec:
            fmt.Printf("%s:tTypeSpec %st%sn", fset.Position(n.Pos()), x.Name, x.Doc.Text())
        case *ast.Field:
            fmt.Printf("%s:tField %st%sn", fset.Position(n.Pos()), x.Names, x.Doc.Text())
        case *ast.GenDecl:
            fmt.Printf("%s:tGenDecl %sn", fset.Position(n.Pos()), x.Doc.Text())
        }
        return true
    })
}

运行此操作可给我们:

main.go:3:1:    GenDecl %!s(*ast.CommentGroup=<nil>)
main.go:11:1:   GenDecl &{[%!s(*ast.Comment=&{69 // FirstType docs})]}
main.go:11:6:   TypeSpec FirstType  %!s(*ast.CommentGroup=<nil>)
main.go:13:2:   Field [FirstMember] &{[%!s(*ast.Comment=&{112 // FirstMember docs})]}
main.go:17:1:   GenDecl &{[%!s(*ast.Comment=&{155 // SecondType docs})]}
main.go:17:6:   TypeSpec SecondType %!s(*ast.CommentGroup=<nil>)
main.go:19:2:   Field [SecondMember]    &{[%!s(*ast.Comment=&{200 // SecondMember docs})]}
main.go:23:1:   FuncDecl main   &{[%!s(*ast.Comment=&{245 // Main docs})]}
main.go:33:23:  Field [n]   %!s(*ast.CommentGroup=<nil>)
main.go:33:35:  Field []    %!s(*ast.CommentGroup=<nil>)

而且,嘿!

我们已经打印出了失传已久的FirstType docsSecondType docs!但这并不令人满意。为什么文档没有附加到TypeSpec?如果没有与结构声明关联的文档,go/doc/reader.go文件不遗余力地规避此问题,实际上生成了一个假GenDecl并将其传递给前面提到的readType函数!

   503  fake := &ast.GenDecl{
   504   Doc: d.Doc,
   505   // don't use the existing TokPos because it
   506   // will lead to the wrong selection range for
   507   // the fake declaration if there are more
   508   // than one type in the group (this affects
   509   // src/cmd/godoc/godoc.go's posLink_urlFunc)
   510   TokPos: s.Pos(),
   511   Tok:    token.TYPE,
   512   Specs:  []ast.Spec{s},
   513  }

但为什么会这样呢?

想象一下,我们稍微改变了问题中代码的类型定义(像这样定义结构并不常见,但仍然有效 Go):

// This documents FirstType and SecondType together
type (
    // FirstType docs
    FirstType struct {
        // FirstMember docs
        FirstMember string
    }
    // SecondType docs
    SecondType struct {
        // SecondMember docs
        SecondMember string
    }
)

运行代码(包括ast.GenDecl的情况),我们得到:

main.go:3:1:    GenDecl %!s(*ast.CommentGroup=<nil>)
main.go:11:1:   GenDecl &{[%!s(*ast.Comment=&{69 // This documents FirstType and SecondType together})]}
main.go:13:2:   TypeSpec FirstType  &{[%!s(*ast.Comment=&{129 // FirstType docs})]}
main.go:15:3:   Field [FirstMember] &{[%!s(*ast.Comment=&{169 // FirstMember docs})]}
main.go:19:2:   TypeSpec SecondType &{[%!s(*ast.Comment=&{215 // SecondType docs})]}
main.go:21:3:   Field [SecondMember]    &{[%!s(*ast.Comment=&{257 // SecondMember docs})]}
main.go:26:1:   FuncDecl main   &{[%!s(*ast.Comment=&{306 // Main docs})]}
main.go:36:23:  Field [n]   %!s(*ast.CommentGroup=<nil>)
main.go:36:35:  Field []    %!s(*ast.CommentGroup=<nil>)

没错

现在,结构类型定义有了自己的文档,GenDecl也有了自己的文档。在第一种情况下,发布在问题中,文档附加到GenDecl,因为 AST 看到类型定义的括号版本的"收缩"的各个结构类型定义,并希望处理所有定义相同,无论它们是否分组。变量定义也会发生同样的事情,如下所示:

// some general docs
var (
    // v docs
    v int
    // v2 docs
    v2 string
)

因此,如果您希望使用纯 AST 解析注释,您需要知道这就是它的工作原理。但是,正如@mjibson所建议的那样,首选方法是使用 go/doc .祝你好运!

您需要使用 go/doc 包从 ast 中提取文档:

package main
import (
    "fmt"
    "go/doc"
    "go/parser"
    "go/token"
)
// FirstType docs
type FirstType struct {
    // FirstMember docs
    FirstMember string
}
// SecondType docs
type SecondType struct {
    // SecondMember docs
    SecondMember string
}
// Main docs
func main() {
    fset := token.NewFileSet() // positions are relative to fset
    d, err := parser.ParseDir(fset, "./", nil, parser.ParseComments)
    if err != nil {
        fmt.Println(err)
        return
    }
    for k, f := range d {
        fmt.Println("package", k)
        p := doc.New(f, "./", 0)
        for _, t := range p.Types {
            fmt.Println("  type", t.Name)
            fmt.Println("    docs:", t.Doc)
        }
    }
}

使用注释解析所有结构//Typescript:interface

func TestStructDoc(t *testing.T) {
err := filepath.Walk(".",
    func(path string, info os.FileInfo, err error) error {
        if err != nil {
            return err
        }
        if info.IsDir() {
            fmt.Println(path, info.Size())
            fset := token.NewFileSet()
            d, err := parser.ParseDir(fset, path, nil, parser.ParseComments)
            if err != nil {
                t.Fatal(err)
            }
            for k, f := range d {
                fmt.Println("package", k)
                p := doc.New(f, "./", 0)
                for _, t := range p.Types {
                    fmt.Println("  type", t.Name)
                    fmt.Println("    docs:", t.Doc)
                    if strings.HasPrefix(t.Doc, "typescript:interface") {
                        for _, spec := range t.Decl.Specs {
                            switch spec.(type) {
                            case *ast.TypeSpec:
                                typeSpec := spec.(*ast.TypeSpec)
                                fmt.Printf("Struct: name=%sn", typeSpec.Name.Name)
                                switch typeSpec.Type.(type) {
                                case *ast.StructType:
                                    structType := typeSpec.Type.(*ast.StructType)
                                    for _, field := range structType.Fields.List {
                                        i := field.Type.(*ast.Ident)
                                        fieldType := i.Name
                                        for _, name := range field.Names {
                                            fmt.Printf("tField: name=%s type=%sn", name.Name, fieldType)
                                        }
                                    }
                                }
                            }
                        }
                    }
                }
            }
        }
        return nil
    })
if err != nil {
    t.Fatal(err)
}

}

不是你的问题,但对于其他任何搜索并想知道为什么他们的代码没有正确解析注释的人来说:

确保您记得传递parser.ParseComments标志!!

最新更新