我同意audioscrobbler的示例数据集,它总共有75K个用户和50K个项目。但我的太小了,因为我在路的起点。所以很高兴知道Myrrix中使用的最小数据集是什么。问这个问题的原因是一个警告:
信息:聚合2013年8月14日下午10:15:41 net.myrix.online.generation.DegateGenerationManager$RefreshCallable runFactorization信息:分解完成2013年8月14日下午10:15:41 net.myrrix.online.generation.generation-recomputeSolver警告:X'*X或Y'*Y的inf标准值较小(0.9254986853162671);尝试递减模型.als.lambda2013年8月14日下午10:15:41 net.myrix.online.generation.DegateGenerationManager$RefreshCallable呼叫警告:还无法计算有效的生成;等待更多数据
感谢所有能够帮助的人
我只能摄取一个只有10行关联的文件。顺便说一句,Myrrix现在正在迁移到Oryx,你可以问Sean Owenhttps://groups.google.com/a/cloudera.org/forum/#!论坛/oryx用户