注意:我已经阅读了如何重塑BatchDataset类张量?但解决方案不适用于此
正如在用Tensorflow/Keras和记忆问题训练一个输入为矩阵滑动窗口的神经网络中所提到的,我需要从形状矩阵(100002000(训练一个具有所有形状滑动窗口(162000(的神经网络。(在我的另一篇帖子中是10公里,但在这里10公里是可以的(。
import tensorflow
import numpy as np
X = np.array(range(20000000)).reshape(10000, 2000)
X = tensorflow.keras.preprocessing.timeseries_dataset_from_array(X, None, 16, sequence_stride=1, sampling_rate=1, batch_size=32)
for b in X:
print(b) # Tensor of shape (32, 16, 2000)
break
问题是,我需要将其输入到一个需要(…,162000,1(形状的模型中。
model = Sequential()
model.add(Conv2D(16, kernel_size=(9, 9), activation='relu', input_shape=(16, 2000, 1), padding='same'))
...
model.fit(X, Y, epochs=8)
我试过
X = tensorflow.reshape(X, (-1, 16, 2000, 1))
没有成功。
如何做到这一点,即具有形状为(..., 16, 2000, 1)
的timeseries_dataset_from_array
的输出?
要对tf.data.Dataset
的每个元素应用转换,应该使用tf.data.Dataset.map
函数。在您的情况下,可以使用tf.expand_dims
:用lambda
定义函数
ds = tensorflow.keras.preprocessing.timeseries_dataset_from_array(X, None, 16, sequence_stride=1, sampling_rate=1, batch_size=32)
ds_correct_shape = ds.map(lambda x: tf.expand_dims(x,axis=-1))
如果我们检查第一个元素的形状:
>>> for elem in ds_correct_shape.take(1):
print(f"{elem.shape=}")
elem.shape=TensorShape([32, 16, 2000, 1])