我一直在浏览这篇包含SimpleTagger示例的博客文章。
它说:
给定一个输入文件"示例",如下所示:
CAPITAL Bill noun
slept non-noun
here non-noun
where all but the last token on each line is a binary feature, and the last token on the line is the label name
那么,如何在此处添加单词级功能?
示例:单词中的音节数、单词的长度等
最后一个
标记之前的所有内容都被视为一个功能。在此之前,您应该能够添加任意功能:
CAP SYL1 CHAR4 Bill noun
SYL3 CHAR9 responded non-noun
...