你好,我有一个Python程序,它能够从gmail中获取电子邮件。一切都很好,除了有一堆
......"ransition99/xhtml">=0D=0A<head>=0D=
=0A<ml; =0D=0A=0D=0Acharset=3DUTF-8" />=0D=0A<title>Untitled Document</title>=0D=0A</head>=0D=0A=0D=0A=0D=0A<body>=0D=0A=0D=0A<p>=0D=0A border=3D=
"0" =0D=0A=0D=0Asrc=3"......
诸如此类的东西。剥离电子邮件中的HTML会解决这个问题吗?我甚至不知道如何引用这些内容,电子邮件是用什么特定的语言写的吗?
ps。。我不得不删除一些,因为我不能发布图片。
它以可打印的引号进行编码。
>>> quopri.decodestring('''=0D=0A border=3D=
... "0"''')
'rn border="0"'