看这里
我正在尝试使用tsvector来计数术语的频率。我想我几乎在那里,但我找不到一种方法从向量结构中获得项。
我所做的是,在创建tsvector列之后:
select term_tsv, count(*) count from (select unnest(term_tsv) term_tsv from document_tsv) t group by term_tsv order by count desc;
结果如下:
stem_tsv | count
------------------------+-------
(3,{9},{D}) | 1
我不知道括号代表的是什么表达式。有人能告诉我怎么从壳中提取这个词吗?谢谢你。
我发现下面列出了最常见的10个条目,官方手册上有写。
SELECT * FROM ts_stat('SELECT vector FROM apod')
ORDER BY nentry DESC, ndoc DESC, word
LIMIT 10;
仅供记录