TPOT:仅使用多输出回归器



我想使用tpot。我拥有的数据仅包括多输出连续变量(即输出形状为:(n_samples,n_output_variables(,其中所有项目均为floats(。

使用Sklearn的MultiOutputRegressor类可以实现这一点。但是,由于我有100多个不同的输出变量,因此我想避免为每个单独的输出应用TPOT。

现在,如何使用TPOT仅搜索多输出模型?有没有办法告诉TPOT只能使用多输出模型(例如决策者(?

关于具有多个输出的回归器:

您有一个多输出回归问题。我建议您检查此答案:多输出回归。

有一些回归变量,可以在目标上进行本机上支持多重输出,例如KneighBorsRegressor,deciestReReerGressor,GradientBoostingRegressor,ExtratreeSregressor和RandomForeStRegrestor。如果您已经提到的MultiOutputRegressor,则其他(例如SGDRegressor,ElasticNETCV等(可以与多个输出一起使用。


关于TPOT和多个输出回归:

当前TPOT可以与所有本地支持多个输出的回归仪一起使用,但是您必须调整文件,因为它尚未实现,请查看https://github.com/epistasislab/tpot/issues/issues/971。如果您想将其他回归器(单个输出(与MultiOutputRegressor进行比较,那么TPOT当前只能让您一次选择一个。那就是您只能指定几种算法之一,然后搜索最佳管道。然后,您可以使用另一种算法重新运行。

关于您要搜索哪种算法的问题:首先查看官方文档,然后阅读" "部分,自定义TPOT的操作员和参数。如果您只想使用一些特定的算法,那么实现此目的的一种方法是复制回归的标准TPOT配置(https://github.com/epistasislab/tpot/tpot/blob/master/master/tpot/tpot/config/regressor.py (,将其包含在您的代码和删节中(或添加(您不(或确实(不希望将其包含在搜索中的所有算法。

最新更新