如何识别字符的 unicode 值?



>我正在尝试从我的文本文件中替换此值

谷歌说它是u"\u2022",但是当我这样做时,什么都没有打印

from unidecode import unidecode
text = open('file.txt','r+')
l=[]
for i in text.readlines():
if  unidecode(u"u2022") in i:
print "confirmed %r" % i

如果我进入文件并用星号替换值,它会打印出这些行。

我尝试将角色放入其自己的文件中

from unidecode import unidecode
import unicodedata
text = open('unicode_char.txt','r+')
for i in text:
print unidecode(i)

这服务于UnicodeDecodeError:"ascii"编解码器无法解码位置0中的字节0xe2:序号不在范围内(128(

编辑-

我想通了。

point = unichr(8226)
encoded = point.encode('utf-8')
for i in text.readlines():
if encoded in i:
print i

如果您正在寻找特定字符,您可以尝试将其直接复制并粘贴到代码中,即

if 'ߦ' in i:
...

但其中一些可能会很痛苦,所以试试这个:

if chr(2022) in i:
...

对不起,如果我误解了这个问题

最新更新