小贝子编程

关于西班牙语文本处理的警告斯坦福大学核心NLP 类型中的数字 > 列 ...可能是优先级

本文关键字：数字优先级类型文本西班牙语处理警告 NLP 核心斯坦福大学 stanford-nlp
更新时间 : 2023-09-17
英文 : Warnings on Spanish text processing Stanford CoreNLP Number in types > column for ... is probably priority

我已经从当前版本3.9.2下载了斯坦福 https://stanfordnlp.github.io/CoreNLP/index.html CoreNLP

下载了西班牙语 JAR

http://nlp.stanford.edu/software/stanford-spanish-corenlp-2018-10-05-models.jar

将其放在应用程序根文件夹中。

启动服务器：

C：\Stanford>java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer - port 9000 -timeout 15000

加载 http://localhost:9000

输入文本"Sí， sabes que ya llevo un rato mirándote"，选择"西班牙语"并提交。

在控制台读数中，有很多警告，例如：

[池-1-

线程-1] 警告 edu.stanford.nlp.pipeline.TokensRegexNERAnnotator - 类型中的数字 [ejecución] 的列可能是优先级：1

输出表明默认值工作正常，但是什么配置错误导致此警告？

此问题应在将来的版本中解决。输出并不意味着性能，只是西班牙语的规则文件缺少一列。我们已经修复了这些文件，因此在 4.0.0 中，这些警告应该会消失。

相关内容