将Unicode转换为UTF 32



如何将U+0065转换为UTF-32格式?

U+0065
0000 0000 0110 0101
UTF-32
xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxxx

将U 0065转换为UTF-32:

 0000 0000 0000 0000 0000 0000 0110 0101

结果是0x00000065

是正确的吗?

是的,这是正确的。

UTF-32始终使用32位编写。Unicode将CodePoint定义为使用21位的U 10FFFF。因此,UTF-32值始终与CodePoint本身相同。

因为u 0065在U 0000..U 007F范围内,它使用8位(01100101)编写在UTF-8中。在UTF-16中,使用16位(00000000 01100101)和UTF-32使用32位(00000000 00000000 00000000 01100101)。

在UTF-32中相同。

最新更新