Javascript Unicode Redex 匹配的不是字母或数字



我想转换这个:

var result = mystring.replace(/[^a-zA-Z0-9]+/g, ' ');

到一个有效的 unicode 版本,这样我就可以只索引字母和数字。例如,我不想要 [-_%<>...]。 由于JS本身不支持此功能,因此我正在使用xregexp。

这似乎没有给我任何结果...我的字母和数字部分是否正确?

<script src="https://unpkg.com/xregexp/xregexp-all.js"></script>
<script>
var s = `joanthan------______++++++ <me> bornss $%^&` asdfasdf+++áeé´sé´s , н, п, р, с, т, ф, х, ц, ч`;
var r1 = XRegExp.replace(s, /[^p{L}p{N}]+/g, ' ');
var r2 = s.replace(/[^a-zA-Z0-9]+/g, ' ');
console.log(r1);
console.log(r2);
</script>

思潮?谢谢!

为了将 Unicode 属性转义与 RegExp(以及扩展的 XRegExp)一起使用,您需要设置 Unicode 标志。

const s = `joanthan------______++++++ <me> bornss $%^&` asdfasdf+++áeé´sé´s , н, п, р, с, т, ф, х, ц, ч`;
let r1 = s.replace(/[^p{L}p{N}]+/gu, ' ')
console.log(r1);

根据他们的文档replace支持两个匹配参数;stringRegexp.话虽如此,它不会解析字符串表达式,因此将被视为文字字符串替换。要使用xregex,您首先必须创建一个表达式实例,然后将其用作参数。

var s = `joanthan------______++++++ <me> bornss $%^&` asdfasdf+++áeé´sé´s , н, п, р, с, т, ф, х, ц, ч`;
var match = XRegExp('[^\p{L}\p{N}]+', 'g');
var r1 = XRegExp.replace(s, match, ' ');
var r2 = s.replace(/[^a-zA-Z0-9]+/g, ' ');
console.log(r1);
console.log(r2);
<script src="https://unpkg.com/xregexp/xregexp-all.js"></script>

最新更新