当用户ID和产品ID是非数字时,如何获得稀疏.csr_matrix



我正在尝试创建一个建议系统,以创建一个稀疏矩阵。我正在尝试使用稀疏。

将数据类型转换为分类后,我正在尝试以下代码。我还尝试了稀疏。coo_matrix

SUI = sparse.csr_matrix((train['item_count'].astype(float), (train['user_id'], train['item_id'])))

显示以下错误:

typeError:未订购分类用于操作最大您可以使用 .as_ordered()将分类更改为有序的一个

有什么办法可以执行非数字用户ID和产品ID?

我们需要将这些非_numeric ID转换为数字ID。我们可以通过以下代码来做到这一点。

user_id = user_id.astype('category').cat.codes

最新更新