对于包含 1000 位的文件(霍夫曼算法),我们可以期望的最大压缩是多少?



有多少包含 1000 位的文件,其中 1 以 10% 的概率为 0 - 90% 的概率可以用霍夫曼代码压缩?

也许是两倍。

但前提是您不包括将霍夫曼代码描述与数据一起发送的开销。对于 1000 位,该开销将主导问题,并决定您的最大压缩率。我发现对于这么小的样本,125 字节,由于开销,通用压缩器将其降低到只有大约 100 到 120 字节。

自定义霍夫曼代码仅用于来自此类流的字节,假设另一端已经知道代码,则系数为 2.10。你能希望的最好的是熵,例如用算术码,它给出 2.13。

最新更新