WIT.AI:它如何确定意图并从用户表达式中分类实体



我已经研究了wit.ai已有几天了。我找到了wit.ai bot引擎的要点:

  • 基于故事 - 创建问候的故事,订购披萨,订购笔记本电脑,询问预报
  • 基于角色的实体 - 位置:表格,位置:to。在这里"从"one_answers"到"是"位置"实体的角色
  • 复合/嵌套实体 - 汽车(型号,颜色,模态)。这里的型号,颜色,模态可以嵌套在汽车实体下
  • 搜索策略:特质,自由文本,关键字
  • 通过创建一些故事来理解bot
  • 在比赛中得分为置信度
  • 用户表达式长度256在最大值
  • 从预定义的关键字列表中进行搜索,匹配的表达
  • 嵌套上下文
  • 用户定义的实体,预定义的实体
  • 基于实体的行动:如果只有,如果总是有条件,则
  • 对于给定的用户表达式WIT搜索关键字列表中的匹配,免费文本
  • 对于给定的用户表达式WIT搜索实体下列出的表达式中的关键字位置
  • 在给定用户表达式中缺少信息的分支
  • 机智的代词支持?不故事#1用户:小部件x 2000多少?机器人:它的价格为30美元。故事#2用户:在哪里可以买到窗口小部件x 2000?机器人:在您当地的百思买。故事#2用户:小部件x 2000多少?机器人:它的价格为30美元。用户:我可以在哪里购买? - 错误 - 使用上下文
  • 对话意识到的实体提取尚未实施
  • 是否有可能使wit.ai bot记住/重复整个故事的上下文?检查上下文是否存在
  • 是否可以在wit.ai中设置默认意图?不,可以检查置信值,设置置信度的阈值,低于阈值特定响应
  • 您可以优先在wit.ai中对实体进行排名吗?否

现在我想知道WIT如何检测用户表达的意图,并使用WIT.AI中创建的bot的故事对实体进行了分类。

如果有人了解WIT.AI中使用的基础技术/ML算法,请在此线程中分享。我希望这对像我这样的人会有所帮助。

预先感谢。

wit.ai的两个主要部分是:

  1. 意图分类
  2. 实体提取

对于实体提取,它使用了他们最近开源的小鸭库,您可以在那里的算法上找到详细的描述。

对于意图分类,我想他们使用文本分类方法,这些方法基于单词或更高级的单词嵌入方法,例如word2vec。

您还可以查看类似的完全开源项目,例如RASA,或用于上述任务的Spacy。

最新更新