预定义的多重文本分类



朋友,我们正在尝试解决一个只有评论的问题的问题,但是.CSV文件中没有评分。.CSV中的每一行都是客户对特定产品的一项评论,让电视。

在这里,我想将该文本分类为该产品的域专家给出的下面定义的类别:

  • 质量
  • 客户
  • 支持
  • 积极的反馈
  • 价格
  • 技术

一些评论如下:

  1. 最近购买了该产品,感觉到市场上很棒的产品。
  2. 长期以来一直在等待该产品,但失望
  3. 建筑质量不是很棒
  4. LED屏幕非常完美。喜欢这个产品
  5. Damm!2个月前购买了这台电视,猜猜是什么,屏幕显示直线,质量差的LED屏幕
  6. 这具有非常复杂的选项,该电视的文档并不是那么用户友好
  7. 我无法使用智能设备连接到此电视。根本不起作用
  8. 客户支持非常差。我不推荐这个
  9. 效果很好。很棒的产品

现在,在10个不同客户的10个评论中,我如何将它们分类到给定的存储桶中(您可以调用多标签分类或使用情感分析的命名实体识别或信息提取,或者是任何事物(

我尝试了所有NLP Word频率计数相关的内容(在R(和引用StanfordNLP(https://nlp.stanford.edu/software/software/crf-ner.shtml(等等。但无法获得混凝土解决方案。

有人可以指导我如何解决这个问题?谢谢!!!

大多数NLP框架将处理多类分类。在r中本身的单词计数不太准确。您可以探索的Python库是Spacy。也可以使用Google,AWS,Microsoft之类的商业API。您将需要每个类别的例子进行培训。请随时发布您的代码以及您看到的问题或性能差距以寻求进一步的帮助。

相关内容

  • 没有找到相关文章

最新更新