如何使用StanfordCoreNLP jar在Java Map/Reduce作业中进行语义分析



我目前从事资本市场建模工作。我正在使用Impala存储来自各种数据来源的数据,即金融新闻。

我已经使用Impala将这些数据存储在形式为articleID,ArticleDATA的表中。

我的下一步是对所有记录逐行进行语义分析。

我一直在阅读这些资源

执行和测试斯坦福核心nlp示例

http://nlp.stanford.edu/software/corenlp.shtml

https://www.openshift.com/blogs/day-20-stanford-corenlp-performing-sentiment-analysis-of-twitter-using-java

http://nlp.stanford.edu/sentiment/code.html

我正在使用Java在Eclipse中进行Map/Reduce工作,不知道如何使用JAR来帮助我进行分析。

p.S:我负责指挥java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt在样本数据上,它工作了,但通过命令行。我想知道如何在eclipse、map/reduce中做到这一点。

当前的输出情绪是积极的,中性的,消极的,但我需要它为1,0,-1。我想这很容易弄清楚,所以这里不是优先事项。!

我不知道该怎么做。

感谢

我想明白了。。问题到此结束。必须使用JAR中的Sentiment文件。试错。然后做了一个MApReduce工作。

相关内容

  • 没有找到相关文章

最新更新