我想创建一个神经网络,使用以下数据帧来查找视频游戏销售:https://www.kaggle.com/gregorut/videogamesales
有没有一种方法可以通过从Name列中找到类似的命名游戏并将其对应的年份放在null值中来填充Year列的null值。
那是数据帧的头部
Name Platform Year Genre Publisher
1 Wii Sports Wii 2006.0 Sports Nintendo
2 Super Mario Bros. NES 1985.0 Platform Nintendo
3 Mario Kart Wii Wii 2008.0 Racing Nintendo
4 Wii Sports Resort Wii 2009.0 Sports Nintendo
5 Pokemon Red/Pokemon Blue GB 1996.0 Role-Playing Nintendo
NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales
41.49 29.02 3.77 8.46 82.74
29.08 3.58 6.81 0.77 40.24
15.85 12.88 3.79 3.31 35.82
15.75 11.01 3.28 2.96 33.00
11.27 8.89 10.22 1.00 31.37
我的建议是在数据帧列名"Year"one_answers"name"上使用"K-Nearest Neighbour"算法。它将在"年份"列中填充空值。
您可以使用Word2Vec
创建单词嵌入相似性的向量。然后,可以使用这些单词嵌入向量对Year
列进行多类预测。