稀疏矩阵在神经网络中的应用



我已经开始做一个名为Talking Data User Demographics的项目。在这个项目中,我需要找到一个手机数据提供给我的人的性别和年龄组。在给我的数据集中,我只能找到几乎70%的数据的手机型号和手机品牌,剩下的30%有事件、事件标签、地点和许多其他功能,包括型号和品牌。所以,我想分别为有事件的设备和没有evnts的设备建立一个模型。作为寻找正确模型的一部分,我使用了各种算法。当我尝试神经网络时,我对没有事件的设备的日志丢失较少,因此,我也想过对有事件的设备尝试同样的方法,但它给出了错误"不支持稀疏矩阵"。但如果是这样,当我有了没有事件的设备的模型时,它运行得很好。下面我附上了一个片段作为我所说的证据,请帮助我理解这一点,任何建议都将不胜感激。

所附文件包含一个代码,即使在model.fit((中使用稀疏矩阵时,该代码也能完美地运行该代码。1st image

现在,在下面的附加文件中,它给出了稀疏矩阵传递给model.fit((第二个图像时的错误

请浏览整个代码以获得最佳参考。代码片段

3

只是一个建议:不要在神经网络中使用稀疏矩阵,因为它会提供糟糕的结果。只需在运行NN之前使用PCA变换稀疏矩阵。例如,scikit中的PCA学习选项白化,这对梯度下降也很有用。

在您的示例中,您希望比较使用两个不同数据集运行的两个模型。两种不同的模型和两个不同的数据集可能提供完全不同的结果。将它们进行比较毫无意义。

最新更新