在UTF-32中相同。
如何将U+0065
转换为UTF-32格式?
U+0065
0000 0000 0110 0101
UTF-32
xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxxx
将U 0065转换为UTF-32:
0000 0000 0000 0000 0000 0000 0110 0101
结果是0x00000065
是正确的吗?
是的,这是正确的。
UTF-32始终使用32位编写。Unicode将CodePoint定义为使用21位的U 10FFFF。因此,UTF-32值始终与CodePoint本身相同。
因为u 0065在U 0000..U 007F范围内,它使用8位(01100101
)编写在UTF-8中。在UTF-16中,使用16位(00000000 01100101
)和UTF-32使用32位(00000000 00000000 00000000 01100101
)。