阿拉伯语/波斯语未正确打印到屏幕



我遵循这个教程,一切都很好,我预处理和训练我的模型,但是当我想找到与以下代码的相似性时:

model = gensim.models.Word2Vec.load("wiki.fa.word2vec.model")
print model.most_similar(U'ماه')

矢量格式不正确:

[(u'u0631u0648u0632', 0.6399222612380981), (u'u0647u0641u062au0647', 0.5578583478927612), (u'u0645u0627u0647u0647u0627u06cc', 0.5577661991119385), (u'u062fu0631u0645u0627u0647', 0.5260834097862244), (u'u0634u0627u0645u06afu0627u0647', 0.5142802596092224), (u'u06ccu06a9u0645u0627u0647', 0.48211610317230225), (u'u0642u062fu06ccu0631u0641', 0.4799095690250397), (u'u06ccu06a9u0633u0627u0644', 0.47623544931411743), (u'u0645u0627u0647u0647', 0.46996498107910156), (u'u062du0648u062a', 0.4551585912704468)]

有人知道如何解决这个问题吗?

你指的是unicode字符串吗?我认为结果很好,你可以把Unicode字符串改回python字符串:

text=u'u0631u0648u0632'
text2=u'u0647u0641u062au0647'
print(str(text))
print(str(text2))

结果如下:روزهفته

最新更新