将MHT文件的不同内容类型提取为多个MHT文件



我正在编写一个mht脚本来解析mht文件,从父级提取部分消息,并将它们写入一个单独的mht文件

我写了下面的函数,它在file_location打开一个mht文件,搜索特定的content_id,并将其写入一个新的mht文件

def extract_content(self, file_location, content_id,extension):
    first_part = file_location.split(extension)[0]
    #checking if file exists
    new_file = first_part + "-" + content_id.split('.')[0] + extension
    while os.path.exists(new_file):
        os.remove(new_file)
    with open(file_location, 'rb') as mime_file, open(new_file, 'w') as output:
        ***#Extracting the message from the mht file***
        message = message_from_file(mime_file)
        t = mimetypes.guess_type(file_location)[0]
        #Walking through the message
        for i, part in enumerate(message.walk()):
            #Check the content_id if the one we are looking for
            if part['Content-ID'] == '<' + content_id + '>':
                ***witing the contents***
                output.write(part.as_string(unixfrom=False))

显然,在application/pdf和application/octet流的情况下,我无法打开IE中的输出部分。

我该如何编写这些内容类型如application/pdf和application/octet流到mht文件中,这样我就可以在IE中查看图像或pdf了?

感谢

试试这个:

...
if m['Content-type'].startswith('text/'):
                    m["Content-Transfer-Encoding"] = "quoted-printable"
                else:
                    m["Content-Transfer-Encoding"] = "base64"
                m.set_payload(part.get_payload())                        
                ****Writing to output****
                info = part.as_string(unixfrom=False)
                info = info.replace('application/octet-stream', 'text/plain')
                output.write(info)
...

告诉我它是否有效。

相关内容

  • 没有找到相关文章

最新更新