我正在使用sklearn进行机器学习。如果我发现正确,python 中的浮点类型以双精度工作。sklearn在内部是否以相同的精度工作?我将数据传递给充满浮点数的列表/numpy数组中的sklearn(这甚至相关吗?
我必须担心错误传播吗?我想我不会,如果使用双精度。
只是想确定一下。
sklearn 似乎没有指定它在数据类型方面的内部工作方式。但是,假设它至少保留输入数据类型的精度可能是有意义的。因此,为了安全起见,可以在数据中将dtype
指定为双精度。
在实践中,误差传播应该不是问题,因为大多数算法本质上都是近似的,其中一些算法更多地依赖于随机初始条件而不是准确性。最近,甚至有人建议我们应该限制准确性以节省资源,因为影响很小。参见示例https://arxiv.org/pdf/1502.02551.pdf