如何提高 LUIS 模型的性能



如果你已使用语言理解服务 (LUIS(,它是 Microsoft 中认知服务套件的一部分,你可能已经到了需要提高模型在预测意图方面的性能的地步。

LUIS 允许你基于以交互方式或批量提供的示例言语来训练模型。此外,我希望聊天日志显示模型错误分类的话语,以便我可以将它们用作新训练数据集的基础。

我想这样的功能将来会发布,但与此同时,有没有人有这种情况的解决方法?

我认为实现

这一点(手动(的一个好方法是将所有错误分类的消息路由到某种存储或日志,以便将来可以使用它们来重新训练LUIS模型。事实上,可以使用 LUIS API 对日志中的数据进行动态且轻松的调用。

因此,流程将是这样的:

1( 用户向机器人发送消息。

2( 机器人逻辑尝试使用 LUIS 模型匹配消息的意图。

3(找不到意图或与结果关联的值非常低。

4( 获取该消息并将其存储在某个位置(来自存储在 Azure Blob 存储中的简单 txt 文件(或数据库(表存储、DocumentDB 或 SQL Server(中。

5( 制作一个简单的程序,对于日志中的每一行,你选择一个意向,然后调用 LUIS API 进行重新训练。

所以,当我问这个问题时,我找到了最接近我的想法。

在 luis.ai 的"MyApps"页面上,可以下载聊天日志,在其中可以看到用户与机器人之间的整个交互集。这可能是挑选错误分类的意图的良好起点。

我附上了屏幕截图以指示链接

唯一需要注意的是,日志聊天格式目前处于.csv,可读性不强。希望 LUIS 尽快支持 json 格式的日志。

最新更新