如何使用StanfordCoreNLP jar在Java Map/Reduce作业中进行语义分析

我目前从事资本市场建模工作。我正在使用Impala存储来自各种数据来源的数据，即金融新闻。

我已经使用Impala将这些数据存储在形式为articleID,ArticleDATA的表中。

我的下一步是对所有记录逐行进行语义分析。

我一直在阅读这些资源

执行和测试斯坦福核心nlp示例

http://nlp.stanford.edu/software/corenlp.shtml

https://www.openshift.com/blogs/day-20-stanford-corenlp-performing-sentiment-analysis-of-twitter-using-java

http://nlp.stanford.edu/sentiment/code.html

我正在使用Java在Eclipse中进行Map/Reduce工作，不知道如何使用JAR来帮助我进行分析。

p.S：我负责指挥java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt在样本数据上，它工作了，但通过命令行。我想知道如何在eclipse、map/reduce中做到这一点。

当前的输出情绪是积极的，中性的，消极的，但我需要它为1,0，-1。我想这很容易弄清楚，所以这里不是优先事项。！

我不知道该怎么做。

感谢

我想明白了。。问题到此结束。必须使用JAR中的Sentiment文件。试错。然后做了一个MApReduce工作。

相关内容