我是NLP的新手,被要求使用Mallet执行命名实体识别(NER)。我有一个文本,我给每个单词的特征向量。我想训练一个模型,以后我可以在新的文本文件上测试。我的问题是如何创建这样的模型,模型的输入是什么。我可以使用一些代码示例:)谢谢!
UW的夏飞写了一个很好的MALLET指南。
您可以在本页底部找到一个与MALLET进行编程(Java)交互的示例。
MALLET快速开始序列标记,就在MALLET主页上,准确地描述了如果你已经有了特征向量,如何做到这一点。