是否有任何其他utf -8编码的代码点使用ESC字节0x1B?



是否存在任何Unicode码点,其utf-8表示中的一个字节是ESC字节(0x1B),不包括0x1B码点本身?

上下文:ESC字节用于ANSI转义码(在终端中),我想知道该字节是否可以作为utf-8字节序列的一部分出现。

不,UTF-8多字节序列中的所有字节都设置了第7位。只有单字节ASCII范围0-127有位7清除,其中包括字节0x1B(其位模式为00011011),因此没有其他编码码点将包含0x1B字节:

https://en.wikipedia.org/wiki/UTF-8

U + 07 ff110 xxxxx10 xxxxxx1920U +飞行符1110 xxxx10 xxxxxx10 xxxxxx61440U + 10飞行符11110 xxx10 xxxxxx10 xxxxxx10 xxxxxx1048576

相关内容

  • 没有找到相关文章

最新更新