我正在尝试使用Catboost库构建一个排名模型。我在训练集中创建Pool时出现以下错误。
CatBoostError: catboost/private/libs/data_types/query.cpp:25: Error: queryIds should be grouped
我用来对行进行分组的列是一个字符串列数组。在我在中看到的例子中,它们大多是一个整数数组。以前有人遇到过类似的问题吗?
我遇到了同样的问题同时使用低于代码的
train_data = Pool(
data=input_data[['input_col']],
label=input_data[['score']],
group_id=input_data[['query_id']],
text_features=text_features
)
用query_id
对input_data
进行排序后得到解决