在处理gzip文件时,我遇到了这个非常奇怪的问题。我正在尝试下载此文件https://www.sec.gov/Archives/edgar/daily-index/2014/QTR2/master.20140402.idx.gz
当我在档案中查看文件的内容时,它是完美的。
然而,当我解压缩内容并试图查看它们时,一切都是胡言乱语。
是文件出了问题,还是我看不到这里的任何东西?
如果我没记错的话,idx文件就是Java文件。它也可以是纯文本存档格式,在本例中就是这样。
在Linux上,尝试运行
gunzip master.20140402.idx.gz
这将把它提取到一个idx文件中,您应该能够用任何文本读取器(如vi(打开该文件,因为vi几乎可以打开任何东西。
在Windows上,您可以从命令行使用WinZip,带有:
wzunzip -d master.20140402.idx.gz
然后,您可以使用IE、Edge或写字板之类的工具来检查文件,这将自动加载可读环境。
编辑:
所以,我下载了这个文件,并能够使用上面的命令提取并在vi、IE和写字板中查看它,所以如果你看到了胡言乱语,请尝试重新下载它。它应该是.gz格式的104kb,并且提取了533kb。