当文件彼此相似时,gzip或zip会压缩到更小的大小吗



我对压缩类似文件的许多版本感兴趣。这些文件是PDF,它们之间(通常是微小的(差异。

我的问题是:zip或gzip算法是否能够利用这些文件之间的相似性来改进压缩?还是单独处理每个文件?

我看过http://www.infinitepartitions.com/art001.html来自GZip算法是如何工作的?,它检查了算法本身,但没有回答实现是否单独处理所有文件。

后续问题:如果没有,是否有文件压缩算法能够利用文件之间的相似性来帮助压缩?

zip编号。文件彼此独立压缩。gzip本身只会压缩一个文件。您需要的是tar和gzip,其中tar将把文件放在彼此相邻的位置(带有中间的头(,然后gzip将整个文件压缩为一个流,生成一个.tar.gz文件。

这将能够利用彼此相距约32K的相似性。如果你的文件比32K大得多,那么你应该尝试xz而不是gzip,生成一个.tar.xz文件。

相关内容

  • 没有找到相关文章

最新更新