文本分类问题:此类分类的名称和方法



>我有一个由文本段和相应标签组成的标记数据集。每个标签由三部分组成,可以为给定的文本段分配多个或零个标签。

Sample Data is given below:
text segment                              action        performed       person  
---                                       ---           ---             ---
"I went outside to play and not drink."   {play,drink}  {yes,no}        {1st,1st}
"He is not playing."                       play          no              3rd
"The weather is cold today."               N/A           N/A             N/A

任务是预测任何给定文本段的标签,其中每个标签由三个部分(动作、执行、人员(组成,并且文本段可能有零个或多个标签。

有十五个用于操作的分类器,两个用于执行,两个用于人。批注数据大小为 6000 个文本段,其中 4000 个文本段至少分配有一个标签。

这种类型的文本分类叫什么(多类标签除外(?

另外,对于这种类型的分类问题,建议使用哪种分类方法?

这不是一个分类问题。虽然你可以为此目的折磨分类模型,但你需要的NLP技术是"依赖解析"和"语义角色标记"。Spacy是一个很好的python库,用于进行依赖解析。

相关内容

  • 没有找到相关文章

最新更新