>我有一个由文本段和相应标签组成的标记数据集。每个标签由三部分组成,可以为给定的文本段分配多个或零个标签。
Sample Data is given below:
text segment action performed person
--- --- --- ---
"I went outside to play and not drink." {play,drink} {yes,no} {1st,1st}
"He is not playing." play no 3rd
"The weather is cold today." N/A N/A N/A
任务是预测任何给定文本段的标签,其中每个标签由三个部分(动作、执行、人员(组成,并且文本段可能有零个或多个标签。
有十五个用于操作的分类器,两个用于执行,两个用于人。批注数据大小为 6000 个文本段,其中 4000 个文本段至少分配有一个标签。
这种类型的文本分类叫什么(多类标签除外(?
另外,对于这种类型的分类问题,建议使用哪种分类方法?
这不是一个分类问题。虽然你可以为此目的折磨分类模型,但你需要的NLP技术是"依赖解析"和"语义角色标记"。Spacy是一个很好的python库,用于进行依赖解析。