在python中使用Scikit-learn Pipeline vs list append



我想使用自己的函数进行文本数据预处理,然后应用计数矢量器。我可以为这两个作品使用管道吗?

是的,你可以。Scikit-learn具有CountVectorizer类,它是一个转换器,您可以按照scikit-learn API创建文本数据预处理转换器。

这个漂亮的博客向您展示了如何构建自定义转换器以及如何在管道中使用它,请遵循它。

最新更新