我目前从事资本市场建模工作。我正在使用Impala存储来自各种数据来源的数据,即金融新闻。
我已经使用Impala将这些数据存储在形式为articleID,ArticleDATA
的表中。
我的下一步是对所有记录逐行进行语义分析。
我一直在阅读这些资源
执行和测试斯坦福核心nlp示例
http://nlp.stanford.edu/software/corenlp.shtml
https://www.openshift.com/blogs/day-20-stanford-corenlp-performing-sentiment-analysis-of-twitter-using-java
http://nlp.stanford.edu/sentiment/code.html
我正在使用Java在Eclipse中进行Map/Reduce工作,不知道如何使用JAR来帮助我进行分析。
p.S:我负责指挥java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt
在样本数据上,它工作了,但通过命令行。我想知道如何在eclipse、map/reduce中做到这一点。
当前的输出情绪是积极的,中性的,消极的,但我需要它为1,0,-1。我想这很容易弄清楚,所以这里不是优先事项。!
我不知道该怎么做。
感谢
我想明白了。。问题到此结束。必须使用JAR中的Sentiment文件。试错。然后做了一个MApReduce工作。