小贝子编程

Postgres全文搜索:通过在空白处进行拆分或提供一个令牌数组来生成tsvector

本文关键字：一个令牌数组 tsvector 搜索文搜索 Postgres 空白处拆分 postgresql full-text-search
更新时间 : 2023-09-20
英文 : Postgres full-text search: make a tsvector by splitting on whitespace or by providing an array of tokens

我有一个文本搜索问题，需要系统地搜索生成的文本，即而不是人类书写的自然语言文本。

典型的ts_tovector('english', 'foo bar baz')并不是特别有用。在某些情况下，它会生成标记，我知道这些标记会导致假阳性搜索结果。

相反，我真的只想在一个字符串中提供令牌，其中每个令牌由空格分隔，或者提供一个有序令牌数组。

例如，类似于to_tsvector(array["foo", "bar", "baz"])的东西应该产生三个标记：foo、bar和baz。这似乎是一件非常基本的事情，但到目前为止，我还没有找到任何关于该功能的明确文档。

这确实是一件基本的事情，您所要做的就是使用simple文本搜索配置：

to_tsvector('simple', 'foo bar baz')

相关内容