在未发现编码的情况下打印未知编码的文件



我有一个二进制文件,其中99%的字符是标准ascii,1%可以是任何字符(包括零(,所以我认为它不符合任何标准编码。我想把这个文件的内容打印到屏幕上,我不介意奇怪的字符怎么出现。有没有像这样的函数

string = any_old_junk_binary_to_string(binary)

哪一个可能会用一些通用的标记字符取代它不喜欢的字符,甚至省略那个字符?

是的。您可以使用errors参数进行解码,如下所示:

string = binary.decode('ASCII', errors="replace")

这将用替换任何无效字节�.根据您希望对无效字符执行的操作,还有其他可用选项,请参阅此页以获取完整列表。

最新更新