我今天早上在代码审查中发现了一些错误的代码,但是我不知道为什么。
$line =~ /^[1-C]/;
这一行应该计算为1
和C
之间的十六进制字符,但我假设这一行不这样做。问题不是什么匹配,而是这个匹配什么?我可以打印出字符类中的所有字符吗?像下面这样?
say join(', ', [1-C]);
唉,# Examples:
say join(', ', 1..9);
say join(', ', 'A'..'C');
say join(', ', 1..'C');
# Output
Argument "C" isn't numeric in range (or flop) at X:developersPERLTest.pl line 33.
1, 2, 3, 4, 5, 6, 7, 8, 9
A, B, C
它匹配从U+0030("1")到U+0043 ("C")的每个代码点
简单的答案是使用
map chr, ord("1")..ord("C")
不是"1".."C"
,如下所示:
$ perl -Mcharnames=:full -E'
say sprintf " %s U+%05X %s", chr($_), $_, charnames::viacode($_)
for ord("1")..ord("C");
'
1 U+00031 DIGIT ONE
2 U+00032 DIGIT TWO
3 U+00033 DIGIT THREE
4 U+00034 DIGIT FOUR
5 U+00035 DIGIT FIVE
6 U+00036 DIGIT SIX
7 U+00037 DIGIT SEVEN
8 U+00038 DIGIT EIGHT
9 U+00039 DIGIT NINE
: U+0003A COLON
; U+0003B SEMICOLON
< U+0003C LESS-THAN SIGN
= U+0003D EQUALS SIGN
> U+0003E GREATER-THAN SIGN
? U+0003F QUESTION MARK
@ U+00040 COMMERCIAL AT
A U+00041 LATIN CAPITAL LETTER A
B U+00042 LATIN CAPITAL LETTER B
C U+00043 LATIN CAPITAL LETTER C
如果您安装了Unicode::Tussle,您可以从以下shell命令中获得相同的输出:
unichars -au '[1-C]'
您可能对浪费时间浏览Unicode代码图表感兴趣。
这是一个测试regexpr范围的简单程序:
use strict;
use warnings;
use Test::More qw(no_plan);
for(my $i=ord('1'); $i<=ord('C'); $i++ ) {
my $char = chr($i);
ok $char =~ /^[1-C]/, "match: $char";
}
生成如下结果:
ok 1 - match: 1
ok 2 - match: 2
ok 3 - match: 3
ok 4 - match: 4
ok 5 - match: 5
ok 6 - match: 6
ok 7 - match: 7
ok 8 - match: 8
ok 9 - match: 9
ok 10 - match: :
ok 11 - match: ;
ok 12 - match: <
ok 13 - match: =
ok 14 - match: >
ok 15 - match: ?
ok 16 - match: @
ok 17 - match: A
ok 18 - match: B
ok 19 - match: C
1..19
[1- 9a -C]是否匹配1和C之间的十六进制数
[a char
- an another char
]匹配Unicode表中两个字符之间的所有字符