当试图验证字符串是否仅由字母字符组成时,我想到了两种可能的regex解决方案。
第一个检查字符串中的每个字符是否为字母数字:
/^[a-z]+$/
第二个尝试在字符串中的某个位置查找而不是字母数字的字符:
/[^a-z]/
(是的,我可以在这里使用字符类。)
长字符串的性能是否存在显著差异?(如果有什么不同的话,我猜第二种变体更快。)
只要看一下,我就会说第二种方法更快。
然而,我做了一个快速的非科学测试,结果似乎没有结论:
Regex Match与Negation。
p.S.我从第一种方法中删除了组捕获。这是多余的,只会让它慢下来。
编写以下快速Perl代码:
@testStrings = qw(asdfasdf asdf as aa asdf as8up98;n;kjh8y puh89uasdf ;lkjoij44lj 'aks;nasf na ;aoij08u4 43[40tj340ij3 ;salkjaf; a;lkjaf0d8fua ;alsf;alkj
a a;lkf;alkfa as;ldnfa;ofn08h[ijo ok;ln n ;lasdfa9j34otj3;oijt 04j3ojr3;o4j ;oijr;o3n4f;o23n a;jfo;ie;o ;oaijfoia ;aosijf;oaij ;oijf;oiwj;
qoeij;qwj;ofqjf08jf0 ;jfqo;j;3oj4;oijt3ojtq;o4ijq;onnq;ou4f ;ojfoqn;aonfaoneo ;oef;oiaj;j a;oefij iiiii iiiiiiiii iiiiiiiiiii);
print "test 1: n";
foreach my $i (1..1000000) {
foreach (@testStrings) {
if ($_ =~ /^([a-z])+$/) {
#print "match"
} else {
#print "not"
}
}
}
print `date` . "n";
print "test 2: n";
foreach my $j (1..1000000) {
foreach (@testStrings) {
if ($_ =~ /[^a-z]/) {
#print "match"
} else {
#print "not"
}
}
}
然后运行:日期<perl_file>;日期
它不是100%科学的,但它给了我们一个好主意。第一个Regex需要10或11秒才能执行,第二个Regex则需要8秒。