如何获取下一个按字母顺序排列的unicode字符



如何在Ruby 1.8.7中获得按字母顺序紧跟在给定字符后面的unicode字符?

如果你的意思是"代码页中的下一个",那么你总是可以用字节来破解并找出答案。如果你按顺序浏览代码页,你可能会陷入没有指定字符的洞里。如果你能想象这样一个术语的话,这将意味着"Unicode教唆"。

如果你的意思是"按字母顺序排列",那么你就倒霉了,因为这并不意味着什么。字母顺序的概念因语言而异,有时甚至与上下文有关。有些语言甚至根本没有字符的固定顺序。这就是为什么有些系统除了有编码之外还有排序规则的原因。排序规则定义了顺序,但出于排序的目的,许多字母通常被认为是等价的,这使事情更加复杂。

Ruby 1.8.7通常也不知道Unicode,并假装所有东西都是一个包含一个字节字符的8位ASCII字符串。Ruby1.9可以将多字节UTF-8解析为单独的字符,这可能会使这项练习变得更容易。

最新更新