如何使用scikit学习与约束进行交叉验证



输入:

  • 我有一个图像的数组X,其中每一行都是代表一个人的例子
  • 另一个数组CCD_ 2用于它们的标签,其中标签是介于1和7之间的整数
  • 以及ids的最后一个数组,其中ids[i]表示X[i]处的第i个人的id。(同一个人有相同的身份证,同一个人可能有不同的照片。)

是否可以对Xy进行分区,使同一个人不同时进入测试和训练集?

我认为我需要使用sklearn.cross_validation.train_testrongplit。有人能解释一下"分层"的作用吗?这是做我想做的事情的正确方法吗?

分层采样意味着sklearn将尝试将训练和测试拆分中的类的比率与整体数据的比率相匹配。

y标签中包含哪些信息?听起来您需要像LabelKFold或LabelShuffleSplit这样的东西,其中标签在您的情况下将是ids

相关内容

  • 没有找到相关文章

最新更新