如何从思考狮身人面像中的文本中提取关键字



使用摘录方法,我有一些带有 5 个单词的关键字,但没有带有突出显示关键字的原始文本。

如何提取标记化的关键字并在原始文本中突出显示它们?

狮身人面像允许您指定在匹配项周围检索五个以上的单词:http://sphinxsearch.com/docs/current.html#api-func-buildexcerptshttp://pat.github.io/thinking-sphinx/excerpts.html

但我认为没有任何方法可以返回整个原始文本 - 你可以around设置为非常非常大,但狮身人面像可能不是为了可靠/快速地处理这个问题而构建的。也许值得研究其他工具来处理这方面?

最新更新