Apache Open NLP中的自定义模型



我目前正在使用自定义模型,我正在为自己的用例培训。我的用例是根据是否是地址更改请求对电子邮件进行分类。如果可以从单个句子中理解地址更改请求,则它的工作正常,没有问题。但是,如果需要从多个句子中理解地址更改请求,则它不起作用。在下面提供的例子很少: - 示例1: - 这正在起作用1。a(培训文件: -

Guys I wish to <START:contactupdate> change my address <END> .

我的新地址是CV1 4ED的西米德兰兹市考文垂多塞特路68号。完成后,请确认。谢谢。

b(具有以下句子的测试模型: - 字符串输入="我希望更改地址的人。我的新地址是68 Dorset Road,Coventry,West Midlands,CV1 4ED。请确认您完成后。谢谢。";//工作

  1. 示例2: - 这不起作用。假设地址更改请求只能从多行推导。

    "我的旧地址不再有效。需要更新。"

在这种情况下如何训练我的模型?如何为上述自定义标签指定?

您可以帮忙吗?我被困。非常感谢

您不起作用是什么意思?您想检索的东西没有检索?或当标签分布在多行上时,培训崩溃了?

通常,在此过程中训练的(默认情况下(模型(默认情况下(试图检测您正在训练的东西的共同功能。通常,这些是诸如人物,组织,位置之类的命名实体。在许多语言中,这些语言包含典型特征(例如前缀Mr./mrs。,后缀Corp。,分别为"街道"(。这可以通过模型拾取,并应用于新数据中,从而识别您要识别的任何一种。但是,您要做的事情已经是非常高级的NLP。由于短语越长,可能的变化就越大,因此获得共同点变得越难。我要说的是,对于您的用例,人们通常使用解析(选区或依赖解析(或其他更复杂的工具,而不仅仅是这种相对平坦的模式识别。因此,您可能需要研究这些。我不知道您可以使用多少数据,您可以从中推断出不同的方式来表达在客户数据库中更改地址的愿望。如果合理(即不仅是几个句子(,您可能需要手动注释它们,解析语料库,在解析树/图表上使用机器学习来获取感兴趣的句子,然后以这种方式进行操作。如前所述,在我看来,NLP非常高级,而不是一个开箱即用的解决方案。

如果我正确理解您的问题,我认为您正在尝试对电子邮件进行分类以找出是否要更改地址。但是模型示例看起来像是命名实体。我认为,最好使用Apache OpenNLP的"文档分类器"功能。

您可以为可能的句子提供不同的示例,这些句子可以归类为地址更改。" adversion_change"," general_inquiry"等可以是类别。这样,您可以使用多种句子来添加尽可能多的不同的杂种。这很容易&amp;文档分类培训的基本教程&amp;用法。

最新更新