我们如何在变量中存储"हिन्दी"tag<span class="sdr-full-width">हिन्दी</span>
的值?我尝试使用 xpath 表达式来提取它,但得到u0939u093fu0928u094du0926u0940
unicode 字符。
那你做对了!
如果您的环境可以显示梵文符号,则此代码:
t = u"u0939u093fu0928u094du0926u0940"
print t
应显示
हिन्दी
在 UnicodeData 模块的帮助下,我甚至可以一次表达一个字符:
>>> for c in t:
print(c, unicodedata.name(c))
ह DEVANAGARI LETTER HA
ि DEVANAGARI VOWEL SIGN I
न DEVANAGARI LETTER NA
् DEVANAGARI SIGN VIRAMA
द DEVANAGARI LETTER DA
ी DEVANAGARI VOWEL SIGN II
我不能说更多,因为我真的不明白这个词的含义......