为排名模型创建Catboost池时出错



我正在尝试使用Catboost库构建一个排名模型。我在训练集中创建Pool时出现以下错误。

CatBoostError: catboost/private/libs/data_types/query.cpp:25: Error: queryIds should be grouped

我用来对行进行分组的列是一个字符串列数组。在我在中看到的例子中,它们大多是一个整数数组。以前有人遇到过类似的问题吗?

我遇到了同样的问题同时使用低于代码的

train_data = Pool(
data=input_data[['input_col']],
label=input_data[['score']],
group_id=input_data[['query_id']],
text_features=text_features
)

query_idinput_data进行排序后得到解决

最新更新