我有一个带撇号的字符串值,如下所示:
"I\xE2\x80\x99m going now."
如何获得正确的撇号值?
"I`m going now."
正如您所知,xE2x80x99
是一个unicode字符U+2019 RIGHT SINGLE QUOTATION MARK
,但我有一个字符串表示,而不是字节。。。
也许这就是您想要的:
utf8_apostrophe = b'xe2x80x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"
旁白:我在将UTF-8编码的推文中的一个单引号转换为普通单引号时遇到了这种情况。
import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)
它产生
I'm going now