我试图找到所有前面有散列的单词,如果它们放在句子末尾后面的话。(这些:#示例#FOO#hello_world#FOO-bar#2012#special-äüöå#俄罗斯-Русский#阿拉伯语-العربيد)
这是RegExp:
var regex:RegExp = /#[w-]+?(?= #|$)/g;
这是文本:
Lorem ipsum dolor#sit_amet,consetetur sadipscing,sed#diamnomyeirmod tempor#invidunt-ut。#示例#FOO#hello_world#FOO-bar#2012#special-äüöå#俄罗斯-Руский#阿拉伯语-العربي
除非包含特殊字符,如#special-äüöå#Russian-Русский#arabic-العربي
如何扩展RegExp以识别特殊字符和非拉丁语言?
谢谢。Uli
不应该使用字符类[w-]
,而应该使用[^#]
。