是否有包含/排除在idn中的Unicode字符类别列表



我想让一个正则表达式匹配使用Unicode类别的IDN。净引擎)。防止欺骗对我的目标来说不是必需的,所以不需要排除令人困惑的字符。

我发现了一些单独字符的列表(例如https://www.icann.org/en/system/files/files/idna-protocol-2003-2008.txt),但是我想要字符分类,所以当新的Unicode版本出来时,我就不必更新了。

此处提到的所有字符" Unicode代码点和应用程序的国际化域名(IDNA)"带有字符状态"pvalidate"。此外,状态为"CONTEXTJ"one_answers";CONTEXTO"在特定的上下文条件下有效。

如果你想更深入地了解这个话题,可以浏览一下通用接受指导小组发布的文档。

最新更新