通过查找类似的字符串来填充null值,panda



我想创建一个神经网络,使用以下数据帧来查找视频游戏销售:https://www.kaggle.com/gregorut/videogamesales

有没有一种方法可以通过从Name列中找到类似的命名游戏并将其对应的年份放在null值中来填充Year列的null值。

那是数据帧的头部

Name           Platform       Year            Genre       Publisher 

1                Wii Sports        Wii         2006.0          Sports      Nintendo   
2         Super Mario Bros.        NES         1985.0          Platform    Nintendo   
3            Mario Kart Wii        Wii         2008.0          Racing      Nintendo   
4         Wii Sports Resort        Wii         2009.0          Sports      Nintendo   
5  Pokemon Red/Pokemon Blue        GB          1996.0      Role-Playing    Nintendo

NA_Sales    EU_Sales    JP_Sales    Other_Sales         Global_Sales  
41.49       29.02       3.77            8.46                82.74  
29.08        3.58       6.81            0.77                40.24  
15.85       12.88       3.79            3.31                35.82  
15.75       11.01       3.28            2.96                33.00  
11.27        8.89       10.22           1.00                31.37  

我的建议是在数据帧列名"Year"one_answers"name"上使用"K-Nearest Neighbour"算法。它将在"年份"列中填充空值。

您可以使用Word2Vec创建单词嵌入相似性的向量。然后,可以使用这些单词嵌入向量对Year列进行多类预测。

相关内容

  • 没有找到相关文章