Google预测API总是返回1.0或0.0的分数



我正在使用googleapi ruby客户端的insert函数,并传递一个trainingInstances数组。

当我调用predict时,我曾经得到过0.653264和0.346736这样的分数(使用两个输出类别)。

在进行了一些重构之后,我现在总是得到1.0和0.0的分数,并且没有介于两者之间的概率。

预测精度(由我测量)仍然接近状态函数给出的精度,因此看起来训练的模型正在工作。我只是想知道为什么我的分数没有在1到0之间,因为我想在我的申请中使用这些分数。

任何见解都将不胜感激。

以下是我正在使用的训练数据示例:

"Completed Registration",32.54,2,0,1,12
"Completed Registration",27.05,2,0,1,7
"Completed Registration",27.29,1,0,3,7
"Completed Registration",24.15,1,0,1,6
"Completed Registration",26.36,2,0,1,6
"Completed Registration",27.0,3,1,3,5
"Completed Registration",22.15,3,1,3,5
"Completed Registration",27.9,2,1,1,1
"Completed Registration",21.21,2,0,3,0
"Completed Registration",24.36,3,0,3,0
"Completed Registration",53.52,2,1,3,0
"Completed Registration",24.15,8,0,3,-6
"Cancelled Registration",,2,0,3,76
"Cancelled Registration",,2,0,3,76
"Cancelled Registration",,3,1,3,69
"Cancelled Registration",38.27,5,0,1,63
"Cancelled Registration",37.25,2,0,3,50
"Cancelled Registration",35.59,5,1,3,49
"Cancelled Registration",19.52,2,0,3,30
"Cancelled Registration",26.7,2,0,3,28

我在Google API资源管理器上运行了测试,并将训练数据上传到CSV文件中。

我第一次上传的数据(几周前)得到了一系列的分数。但今天上传的完全相同的数据只得到1或0分。

这可能是字符编码问题吗?

如果其他人也有同样的问题,我会在这里发布答案。结果表明,API内部可以根据训练数据使用不同的分类器。看起来差异是由API的更改引起的,而不是由我的重构引起的。

以下是谷歌某个人的解释https://groups.google.com/forum/#!主题/预测api讨论/7QPhONKhZjc

最新更新