我正在尝试构建一个旅游行程推荐系统。我正在使用ML.NET Builder
推荐
使用的数据为。csv文件training.csv
要预测的列(评级):RatingRounded用户列:UserId项目列:ItemId训练时间:10
但每次我开始训练时,最佳质量(RSquared)总是0.0000火车
RSquared: 0.0000模型:矩阵分解
当我预测模型时,它总是返回Nan预测评级
我错过什么了吗?为什么它一直返回NaN,我的csv文件中有超过2k的数据
我试着搜索issue,它说我的数据集不够。但我有大约2000 +的数据是真的不够还是我错过了什么?不应该使用ML.NET模型生成器吗?
问题可能出在变量类型上。您的userID和itemID是长字母数字。如果它们代表不同的旅行路线和用户,则为数据类型选择'categorical'。
如果它假设它们是数字或文本变量,那么它将尝试适合回归到每个itemID中包含的内容,当每个ID中真正的特殊字母和数字序列不是有意义的位-它只是一个ID(一个类别的标签)。
RSquared(0)表示目前没有发现ID的内容与评级之间的关系。