字节1 字节2 字节3 字节4 代码点 U + 007 f 0 xxxxxxx 128 U + 07 ff110 xxxxx 10 xxxxxx1920 U +飞行符1110 xxxx 10 xxxxxx 10 xxxxxx61440 U + 10飞行符11110 xxx 10 xxxxxx 10 xxxxxx 10 xxxxxx1048576
是否存在任何Unicode码点,其utf-8表示中的一个字节是ESC字节(0x1B),不包括0x1B码点本身?
上下文:ESC字节用于ANSI转义码(在终端中),我想知道该字节是否可以作为utf-8字节序列的一部分出现。
不,UTF-8多字节序列中的所有字节都设置了第7位。只有单字节ASCII范围0-127有位7清除,其中包括字节0x1B
(其位模式为00011011
),因此没有其他编码码点将包含0x1B
字节:
https://en.wikipedia.org/wiki/UTF-8