我想验证一个字符串,其中每个字母应该是阿拉伯语或英语字母或符号-.ـ
或空格之一。
/^([u0600-u06ffu0750-u077fufb50-ufc3fufe70-ufefca-zA-Z- .ـ]+)$/
对JS
有效,但对pcre(php)
无效。所以我尝试了另一种解决方案来避免验证中的u
。
/^[p{Arabic}a-zA-Z- .ـ]+$/
这个正则表达式没有给我任何错误,并且完全按照我的需要工作
但是PHP
没有,我在php中测试了相同的文本
if ( preg_match('/^[p{Arabic}a-zA-Z- .ـ]+$/', "engعربlisي هنا.hـ") )
die("T");
else
die("F");
代码的结果是F
而不是T
,这是为什么?
PHP正则表达式中的Unicode块本身不足以匹配Unicode字符串。
您需要一个/u
修饰符来强制PHP使用Unicode匹配。
u (PCRE_UTF8)
这个修饰符打开与Perl不兼容的PCRE的附加功能。模式和主题字符串被视为UTF-8。此修饰符在Unix上的PHP 4.1.0或更高版本以及在win32上的PHP 4.2.3中可用。从PHP 4.3.5开始,检查模式和主题的UTF-8有效性。无效的主题将导致preg_*
函数不匹配;无效的模式将触发级别为E_WARNING的错误。自PHP 5.3.4以来,五个和六个八位字节的UTF-8序列被认为是无效的。(2007-08-28);
:
if ( preg_match('/^[p{Arabic}a-zA-Z- .ـ]+$/u', "engعربlisي هنا.hـ") )
// ^^
die("T");
else
die("F");
输出T
.
参见IDEONE demo