如何在Lua中进行多模式搜索?(我设置了Lpeg(。
例如,假设我在一行中接收字符串,我一次处理一个字符串,对它们进行大写并将其称为msg
。现在我想获取msg
,并检查它是否具有以下任何模式:首先是MUFFIN MOOPHIN MUPHEN M0FF1N
。我如何在不必写一个巨大的if(or or or or)
的情况下检查msg
是否有这些(如果不止一个也没关系(?
您可以做的一件事是制作一个要查找的单词表,然后使用gmatch
迭代字符串中的每个单词,并检查它是否在该表中。
#!/usr/bin/env lua
function matchAny(str, pats)
for w in str:gmatch('%S+') do
if pats[w] then
return true
end
end
return false
end
pats = {
['MUFFIN'] = true,
['MOOPHIN'] = true,
['MUPHEN'] = true,
['M0FF1N'] = true,
}
print(matchAny("I want a MUFFIN", pats)) -- true
print(matchAny("I want more MUFFINs", pats)) -- false
一个迟到的答案,但你可以构建一个模式来不区分大小写地匹配所有单词(只有在后面没有字母数字的情况下(,捕捉主题和单词索引中的匹配位置,匹配的单词如下:
local lpeg = require("lpeg")
local function find_words(subj, words)
local patt
for idx, word in ipairs(words) do
word = lpeg.P(word:upper()) * lpeg.Cc(idx)
patt = patt and (patt + word) or word
end
local locale = lpeg.locale()
patt = lpeg.P{ lpeg.Cp() * patt * (1 - locale.alnum) + 1 * lpeg.V(1) }
return patt:match(subj:upper())
end
local words = { "MUFFIN", "MOOPHIN", "MUPHEN", "M0FF1N" }
local pos, idx = find_words("aaaaa bbb ccc muPHEN ddd", words)
-- output: 16, 3