我试图在MySQL中搜索用户只有一个字段。表看起来像这样:
ID BIGINT
TITLE TEXT
DESCRIPTION TEXT
FILENAME TEXT
TAGS TEXT
ACTIVE TINYINT
现在,如果用户只输入blah blubber
,则搜索必须检查每个单词是否出现在TITLE
, DESCRIOTION
, FILENAME
或TAGS
字段中。结果本身应该按相关性排序,即字符串在记录中出现的频率。我得到了这个示例数据:
ID | TITLE | DESCRIPTION | FILENAME | TAGS | ACTIVE
1 | blah | blah | bdsai | bdha | 1
2 | blubber | blah | blah | adsb | 1
3 | blah | dsabsadsab | dnsa | dsa | 1
在本例中,ID 2必须位于顶部(2x blah, 1x blubber),然后是1 (2x blah),然后是3 (1x blah)。这个过程应该是动态的,这样用户也可以输入更多的单词,而相关性就像输入一个或几个单词一样。
这可能只在MySQL中实现,还是我必须使用一些PHP?这究竟是如何运作的呢?
非常感谢你的帮助!问候,Florian
编辑:这是我尝试了Tom Mac的答案后的结果:
我有四条这样的记录:
ID | TITLE | DESCRIPTION | FILENAME | TAGS | ACTIVE
1 | s | s | s | s | 1
2 | 0 | fdsadf | sdfs | a,b,c,d,e,f,s,a,a,s,s,as,sada | 1
3 | 0 | s | s | s | 1
4 | a | a | a | a | 1
现在,如果我搜索字符串s
,我应该只得到前三个记录,按相关性s排序。这意味着,记录应该是这样排序的:
ID | TITLE | DESCRIPTION | FILENAME | TAGS | ACTIVE
2 | 0 | fdsadf | sdfs | a,b,c,d,e,f,s,a,a,s,s,as,sada | 1 <== 8x s
1 | s | s | s | s | 1 <== 4x s
3 | 0 | s | s | s | 1 <== 3x s
现在,我试着这样查询(表的名称是PAGES
):
select t . *
from (
select
match(title) against('*s*' in boolean mode)
+ match(description) against('*s*' in boolean mode)
+ match(filename) against('*s*' in boolean mode)
+ match(tags) against('*s*' in boolean mode)
as matchrank,
bb . *
from pages bb) t
where t.matchrank > 0
order by t.matchrank desc
这个查询返回如下:
matchRank | ID | TITLE | DESCRIPTION | FILENAME | TAGS | ACTIVE
2 | 2 | 0 | fdsadf | sdfs | a,b,c,d,e,f,s,a,a,s,s,as,sada | 1
这是因为通配符吗?我认为,字符串*s*
也应该找到一个值,只有s
…
这可能对您有所帮助。它只是假设你的MySQL表使用MyISAM引擎:
create table blubberBlah (id int unsigned not null primary key auto_increment,
title varchar(50) not null,
description varchar(50) not null,
filename varchar(50) not null,
tags varchar(50)not null,
active tinyint not null
) engine=MyISAM;
insert into blubberBlah (title,description,filename,tags,active)
values ('blah','blah','bdsai','bdha',1);
insert into blubberBlah (title,description,filename,tags,active)
values ('blubber','blah','blah','adsb',1);
insert into blubberBlah (title,description,filename,tags,active)
values ('blah','dsabsadsab','dnsa','dsa',1);
select t.*
from
(
select MATCH (title) AGAINST ('blubber blah' IN BOOLEAN MODE)
+MATCH (description) AGAINST ('blubber blah' IN BOOLEAN MODE)
+MATCH (fileName) AGAINST ('blubber blah' IN BOOLEAN MODE)
+MATCH (tags) AGAINST ('blubber blah' IN BOOLEAN MODE) as matchRank,
bb.*
from blubberBlah bb
) t
order by t.matchRank desc;
编辑
此解决方案的另一个假设是您搜索的字符串长度>= 4个字符。如果有可能'搜索'字符串即'blubber'或'blah'将是1,2或3个字符长,那么你可以随时前往你的my.cnf文件并在[mysqld]
配置选项下添加ft_min_word_len=1
。然后重新启动MySQL,你就可以开始了。
最后一件事:如果您正在考虑使用这种方法,那么您应该为每个列添加一个FULLTEXT INDEX。因此:
ALTER TABLE blubberBlah add fulltext index `blubberBlahFtIdx1`(`title`);
ALTER TABLE blubberBlah add fulltext index `blubberBlahFtIdx2`(`description`);
ALTER TABLE blubberBlah add fulltext index `blubberBlahFtIdx3`(`filename`);
ALTER TABLE blubberBlah add fulltext index `blubberBlahFtIdx4`(`tags`);
您可以在MySQL文档中找到更多关于BOOLEAN FULLTEXT搜索的详细信息。
不是以布尔模式搜索,而是使用Match() Against()来确定分数。