我想知道以下哪种情况将通过应用于具有重复数据的二进制数据的无损算法来实现最高比率。
我假设压缩比取决于模式是否正确?
- 大小
- 重复次数
例如二进制数据:
10 10 10 10 10 1010 图案 (10) 尺寸 2,图案 (10) 重复 8
1001 1001 1001 1001图案 (1001) 尺寸 4,图案 (1001) 重复 4
0000000 11111111图案(0)尺寸1,图案(0)重复8; 图案(1)尺寸1,图案(1)重复8;或0000000 11111111图案(0000000)尺寸8,图案(0000000)重复8;图案(11111111)尺寸8,图案(11111111)重复1;
以上哪项可实现最高和最低的压缩比?
提前谢谢。
野外不太可能看到的序列。 这个问题的意义何在?
普通压缩机是面向字节的。 因此,任何导致重复相同字节的模式都将提供最高的压缩比。 例如 1032:1 在放气极限中。 其他简单的短模式重复将获得非常高的压缩比。 例如,再次 1032:1 表示两个或三个重复字节的模式的压缩。
在这些荒谬的极端情况下,压缩限制是压缩格式的函数,而不是数据的函数。