当您不确定测试功能/属性时,哪种机器学习算法最适合方案



eg:对于培训,您使用用户用这些数据填充所有字段(约40个字段),并以预期的输出和预期的输出。

我们现在构建一个模型(可能是人工神经网,SVM或逻辑回归等)。

最后,一个用户现在以表格中的3个字段输入,并期望预测。

在这种情况下,我可以使用的最好的ML算法是什么?

我认为这将取决于您问题的特定上下文。您试图根据哪种输入来预测什么?

例如,Netflix等公司使用推荐系统来预测基于非常稀疏的功能向量的电影的评级(用户对目录中所有电影中所有电影的现有评分)。

另一种选择是开发一些从稀疏特征空间到常见的潜在空间的映射算法,您可以在其中使用SVM或神经网络进行分类。我相信本文做类似的事情。您还可以查看类似的论文,以转换来自两个不同域的数据(例如,您的培训与测试集,其中两者都包含相似的信息,但一个都有完整的数据,而另一个则没有)常见的潜在分类空间。在独立于域的分类上实际上有很多。

要查找的关键字(带有一些链接可以使您开始):生成对抗网络(GAN),域 - 对抗培训,独立于域的分类,转移学习。

最新更新