以 solr 为单位的匹配字符串的频率



我正在我的应用程序中索引pdf。我想在每个pdf中显示搜索字符串的频率。我正在使用调试查询 = true 并解析调试结果。我正在设置 debug.explain.structured=true。

例如:输入 foo 然后它将列出发生此 foo 的所有 pdf。输出覆盖.pdf找到 2 个匹配项(仅举个示例)

这工作正常,但是当我搜索多个单词时的情况。输入 - 和 酒吧

调试结果的格式将更改。好的,我也解析了这种格式,但它只给出了 foo 的频率,但没有给出 bar。

任何人都可以告诉我如何获取搜索单词的频率。我已经检查了术语频率,但我们也不能在那里给出多个单词。

为此使用突出显示怎么样?它将在文档中为每个匹配项创建一个条目

您可以对此查询使用分面。它还将返回该方面的计数。

最新更新