自动 NLP 实体提取



我已经使用自动自然语言处理 - 实体提取训练了模型。现在,我已经训练了这个模型,从文本中提取每个实体下的单个关键字,但是我想在两个实体下标记单个关键字以创建层次结构。示例 - 目前关键字"Lazada"标记为"Lazada_Ecommerce",但我想在两个实体下标记这个关键字 - 子实体"Lazada"和主要实体"电子商务"。如果有人建议是否可以使用Google自动NLP-Entity Extract模型以及如何进行,那将非常有帮助。

谢谢 萨蒂什·库马尔 数据科学家

Google NLP 实体提取不支持实体层次结构。预测的结果包括一个实体数组,对应于文本中检测到的每个实体。

https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google.cloud.automl.v1.PredictResponse

包括属性"有效负载",它是一个数组:

https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google.cloud.automl.v1.AnnotationPayload

注意:如果"子实体"只能有一个"主实体",那么您可以管理模型外部的实体层次结构,即训练模型预测"Lazada"和其他子实体,并在外部识别"Lazada"和其他属于主要的"电子商务"类别。但是,如果您的实体模型可以在多个主实体下有一个"Lazada"实体,那么您当前的解决方案将是合适的(例如,"Lazada_Ecommerce"、"Lazada_SomeOtherMainEntity"等(。

最新更新