我已经从当前版本3.9.2下载了斯坦福 https://stanfordnlp.github.io/CoreNLP/index.html CoreNLP
下载了西班牙语 JAR
http://nlp.stanford.edu/software/stanford-spanish-corenlp-2018-10-05-models.jar
将其放在应用程序根文件夹中。
启动服务器:
C:\Stanford>java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer - port 9000 -timeout 15000
加载 http://localhost:9000
输入文本"Sí, sabes que ya llevo un rato mirándote",选择"西班牙语"并提交。
在控制台读数中,有很多警告,例如:
[池-1-线程-1] 警告 edu.stanford.nlp.pipeline.TokensRegexNERAnnotator - 类型中的数字 [ejecución] 的列可能是优先级:1
输出表明默认值工作正常,但是什么配置错误导致此警告?
此问题应在将来的版本中解决。 输出并不意味着性能,只是西班牙语的规则文件缺少一列。 我们已经修复了这些文件,因此在 4.0.0 中,这些警告应该会消失。