我们需要多少字节来编码阿拉伯语演示表单和阿拉伯语(范围 0600–06FF)?



我对表示阿拉伯字符所需的存储空间有点困惑。 如果我从 https://en.wikipedia.org/wiki/Arabic_Presentation 理解它,请告诉我

在阿拉伯语演示表单-B(范围FE70-FEff(中,utf-8编码需要3个字节,utf-16需要4个字节。

在阿拉伯语(范围 0600–06FF,255 个字符(中,使用 utf-8 编码需要 2 个字节。 UTF-16 中需要多少字节。

每种编码的优点是什么?我们什么时候应该更喜欢一个而不是另一个在隐写技术中使用它。

UTF-16 对 0-65535(0 到 FFFF 十六进制(范围内的每个代码点只采用一个代码单元(2 个字节(。存储大小通常不是选择 UTF 的好标准。通过在 UTF-8 和 UTF-16 之间切换可以获得的任何大小节省几乎总是可以通过使用通用数据压缩(例如 gzip(来超越;仅当数据总量很大时,这才有意义。

选择UTF用于隐写术也是可疑的。无论哪种方式,"攻击者"都将您的数据视为文本,并且与预期内容的偏差将同样可见。

最新更新