使用XML模式验证语言



我正在编写XML文件的XSD,该文件在UTF-8中编码,该文件可能包含许多不是ASCII英语的语言。

是否有一种可能的方法来验证某些语言(特别是不使用英语字母(如希伯来语或阿拉伯语)的语言)才能通过验证?

您可以使用模式刻面中的正则表达式来控制可能出现哪些字符集,例如

<xs:pattern value="p{IsHebrew}*"/>

,但我不知道您在实践中如何利用这一点:大多数语言都允许使用外语脚本,例如指的是外国人的名字。

确实要小心地区分字符与编码。它们是完全不同的概念。像这样的图案方面说明了哪些字符,它不会限制它们的编码方式。

最新更新