关于西班牙语文本处理的警告 斯坦福大学核心NLP 类型中的数字 > 列 ...可能是优先级



我已经从当前版本3.9.2下载了斯坦福 https://stanfordnlp.github.io/CoreNLP/index.html CoreNLP

下载了西班牙语 JAR

http://nlp.stanford.edu/software/stanford-spanish-corenlp-2018-10-05-models.jar

将其放在应用程序根文件夹中。

启动服务器:

C:\Stanford>java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer - port 9000 -timeout 15000

加载 http://localhost:9000

输入文本"Sí, sabes que ya llevo un rato mirándote",选择"西班牙语"并提交。

在控制台读数中,有很多警告,例如:

[池-1-

线程-1] 警告 edu.stanford.nlp.pipeline.TokensRegexNERAnnotator - 类型中的数字 [ejecución] 的列可能是优先级:1

输出表明默认值工作正常,但是什么配置错误导致此警告?

此问题应在将来的版本中解决。 输出并不意味着性能,只是西班牙语的规则文件缺少一列。 我们已经修复了这些文件,因此在 4.0.0 中,这些警告应该会消失。

最新更新