如何向 Mallet SimpleTagger 添加单词级功能



我一直在浏览这篇包含SimpleTagger示例的博客文章。

它说:

给定一个输入文件"示例",如下所示:

CAPITAL Bill  noun
        slept non-noun
        here non-noun
where all but the last token on each line is a binary feature, and the last token on the line is the label name

那么,如何在此处添加单词级功能?

示例:单词中的音节数、单词的长度等

最后一个

标记之前的所有内容都被视为一个功能。在此之前,您应该能够添加任意功能:

CAP SYL1 CHAR4 Bill noun
SYL3 CHAR9 responded non-noun
...

相关内容

  • 没有找到相关文章

最新更新