我想将过采样过程(如SMOTE过采样)添加到scikit的管道中。但是变压器只支持fit
和transform
方法,并且没有提供增加样本和目标数量的方法。
一种可能的方法是将管道拆分为两个通过SMOTE采样连接的独立管道。
有什么更好的解决方案吗?
我们当前的Pipeline
不支持更改步骤之间的样本数,因为Transformer.transform
方法不返回同样需要重新采样的y
参数。这是目前设计的一个已知限制。它可能会在未来的版本中得到修复,但我们还没有开始对此进行研究。