Python3:转换撇号unicode字符串



我有一个带撇号的字符串值,如下所示:

"I\xE2\x80\x99m going now."

如何获得正确的撇号值?

"I`m going now."

正如您所知,xE2x80x99是一个unicode字符U+2019 RIGHT SINGLE QUOTATION MARK,但我有一个字符串表示,而不是字节。。。

也许这就是您想要的:

utf8_apostrophe = b'xe2x80x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"

旁白:我在将UTF-8编码的推文中的一个单引号转换为普通单引号时遇到了这种情况。

import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)

它产生

I'm going now

最新更新