如何使用 imdb Movie_Reviews语料库在 SVM 分类 (NLP) 中实现否定特征



我试图理解NLP中的否定功能,所以我想实现它。我正在研究 imdb 电影评论数据集。考虑我有以下数据-

Movie was great but it's overly sentimental and at times terribly mushy , not to mention very manipulative but great action

从上面我可以提取出它过于感伤,有时非常糊涂的负面陈述,现在我只剩下这些选择——

  • 我提取特定的行,直到它以一些标点符号结束,然后我只是从肯定语句中删除这一行并在其余内容。
  • 我提取特定行并用负和标记该行将其添加到否定语句列表中以训练相同的语句。

不确定我在这里做了什么,所以请确切地建议我应该如何处理否定特征以即兴分类。

我正在使用scikit-learn svm。SVC() 分类器

您可以使用否定检查此NRC情感分析系统以进行文本分类。这很好解释。他们还声称他们的 SemEval 2014 提交在否定处理方面有重大改进(我还没有读过)。

我假设你正在解决电影评论的类似任务,所以这一定是你要找的。

相关内容

  • 没有找到相关文章

最新更新