Tensorflow:量化的调整规则



有没有办法进行以下过程: https://www.tensorflow.org/performance/quantization

和电话:tf.contrib.quantize.create_eval_graph()

可以像下面的调用一样以这样的方式进行调整吗?

https://www.tensorflow.org/versions/master/api_docs/python/tf/quantize

我希望将权重缩放到对称范围的 8 位,精确 0 和最大/最小值是 2 的幂,就像SCALED模式一样。例如,我更喜欢 -31 到 31 而不是 -10 到 30。即使当-10到30在8位时也能提供更好的分辨率,但精确的0,对称性和范围作为2的幂对于DSP设备更为重要。

到目前为止,TOCO(tf.lite.TocoConverter(没有控制量化类型的选项,因为您实际上想要对称量化而不是非对称方法。但是,在量化过程中,实际值 0.0 可以保证准确。这意味着 0.0 映射到 uint8 q,没有任何舍入误差。

最新更新