TensorFlow:如何将图像转换为一维张量



我最近使用mnist数据集构建了一个预测手写整数的模型。我现在想使用我自己的图像。我的图像是28x28像素(像mnist集(,但当我尝试使用tf.image.decode_png将它们转换为张量时,我得到了一个3D张量[28,28,4]。通过阅读,我相信额外的4是RGB相关的。我如何转换为[28,28]忽略任何色标(如果这是实际问题,也许我完全错过了什么(。

谢谢!

正如你正确地说的,你得到了一个3D张量,因为你的图像有3个RGB通道。您可以使用类似tf.image.rgb_to_grayscale之类的工具来获得您想要的内容。

最新更新