电子邮件引用可打印编码混淆



我正在使用Python构建MIME编码的电子邮件,并且与亚马逊SES编码的MIME相同的电子邮件有所不同。

我使用 utf-8 和引号可打印进行编码。

对于字符"å"(即顶部有一个小圆圈的字母"a"(,我的编码产生

=E5

而其他编码产生

=C3=A5

它们在我的 gmail 中看起来都不错,但我觉得编码不同很奇怪。 其中之一是对的,另一个是错的吗?

下面是我的 Python 代码,以防万一。

====

cs = charset.Charset('utf-8')
cs.header_encoding = charset.QP
cs.body_encoding = charset.QP
# See https://stackoverflow.com/a/16792713/136598
mt = mime.text.MIMEText(None, subtype)
mt.set_charset(cs)
mt.replace_header("content-transfer-encoding", "quoted-printable")
mt.set_payload(mt._charset.body_encode(payload))

好的,多亏了 Artur 的评论,我能够弄清楚这一点。

字符的 utf-8 编码是两个字节,而不是一个字节,因此

您应该期望看到两个带引号的可打印编码,而不是一个,因此 AWS SES 编码是正确的(不足为奇(。

我发送的是 unicode 文本而不是 utf-8,它只会导致一个引用的可打印字符。 事实证明,它之所以有效,是因为Gmail支持Unicode。

对于我问题中的 Python 代码,我需要手动将文本编码为 utf-8。 我以为MIMEText会为我做这件事,但事实并非如此。

最新更新