将文章文本与预先存在的类别列表进行匹配



我是 Azure 认知服务的新手,虽然我很确定它可以帮助我解决问题,但我不太明白该使用它的哪一部分......

以下是我想做的:

我们有博客文章,比如~1k,这些博客文章都有类别和标签(每个有多个(。我想做的是根据内容"猜测"每篇文章的正确类别/标签,然后在输入时将其作为建议呈现给编辑("看起来这篇文章是关于:健康、幸福,......"(。我们已经在系统中拥有的~1k文章目前被正确标记/分类,所以我想使用这些数据源进行这种"猜测"。

我以前使用过 Azure 搜索,似乎实体识别和 KeyPhraseExtraction 的某种组合可能是朝着正确方向前进的一种方式?Azure 认知服务似乎也有一个支持 TextAnalytics 的 API,可以执行类似操作。我有点困惑为什么这是两件不同的事情(或者它们不是?

这似乎也是一个完全常见的问题(根据分类的其他文本将文本与预定义的类别进行匹配(,所以我想知道我是否只是在这里错过了一个明显的解决方案?

提前谢谢。

我认为 Azure 认知文本分析 API 是最好的选择,因为你需要在对存储进行标记/分类之前进行实时分析。

文本分析可以返回命名实体的列表,你可以将这些实体映射到可用的标记/类别并呈现给用户。

Azure 认知搜索需要索引器和技能组来处理目标文本,最终结果是将处理后的结果存储到专门用于搜索的索引。

最新更新