电子邮件引用可打印编码混淆

我正在使用Python构建MIME编码的电子邮件，并且与亚马逊SES编码的MIME相同的电子邮件有所不同。

我使用 utf-8 和引号可打印进行编码。

对于字符"å"(即顶部有一个小圆圈的字母"a"(，我的编码产生

=E5

而其他编码产生

=C3=A5

它们在我的 gmail 中看起来都不错，但我觉得编码不同很奇怪。其中之一是对的，另一个是错的吗？

下面是我的 Python 代码，以防万一。

====

cs = charset.Charset('utf-8')
cs.header_encoding = charset.QP
cs.body_encoding = charset.QP
# See https://stackoverflow.com/a/16792713/136598
mt = mime.text.MIMEText(None, subtype)
mt.set_charset(cs)
mt.replace_header("content-transfer-encoding", "quoted-printable")
mt.set_payload(mt._charset.body_encode(payload))

好的，多亏了 Artur 的评论，我能够弄清楚这一点。

字符的 utf-8 编码是两个字节，而不是一个字节，因此

您应该期望看到两个带引号的可打印编码，而不是一个，因此 AWS SES 编码是正确的(不足为奇(。

我发送的是 unicode 文本而不是 utf-8，它只会导致一个引用的可打印字符。事实证明，它之所以有效，是因为Gmail支持Unicode。

对于我问题中的 Python 代码，我需要手动将文本编码为 utf-8。我以为MIMEText会为我做这件事，但事实并非如此。

相关内容

最新更新

热门标签：