基本上我有一个训练集和测试集,训练集是我将测试各种模型和特征选择的东西,我知道训练集的输出标签,它们是 10 个不同的类别,但我被告知/给定其中一个特定类在训练集中有 0 个给定的样本/出现。
我该如何处理?
我知道我可以对不平衡的集合使用过采样/欠采样,但如果其中一个类出现 0 次,它会有所帮助吗?
您的用例属于最初作为零数据学习引入的零镜头学习领域。它依赖于构建基础类的可分离表示形式,其方式可以泛化到给定样本之外。这不是一个容易解决的问题,但根据您的数据和问题空间,这可能是可行的。一些帮助您入门的资源:
- 零数据学习
- 深度学习书籍:表征学习