重塑使用时间序列_dataset_from_array预处理的Tensorflow数据集

注意：我已经阅读了如何重塑BatchDataset类张量？但解决方案不适用于此

正如在用Tensorflow/Keras和记忆问题训练一个输入为矩阵滑动窗口的神经网络中所提到的，我需要从形状矩阵(100002000(训练一个具有所有形状滑动窗口(162000(的神经网络。(在我的另一篇帖子中是10公里，但在这里10公里是可以的(。

import tensorflow
import numpy as np
X = np.array(range(20000000)).reshape(10000, 2000)  
X = tensorflow.keras.preprocessing.timeseries_dataset_from_array(X, None, 16, sequence_stride=1, sampling_rate=1, batch_size=32)
for b in X:
print(b)  # Tensor of shape (32, 16, 2000)
break

问题是，我需要将其输入到一个需要(…，162000，1(形状的模型中。

model = Sequential()
model.add(Conv2D(16, kernel_size=(9, 9), activation='relu', input_shape=(16, 2000, 1), padding='same'))
...
model.fit(X, Y, epochs=8)

我试过

X = tensorflow.reshape(X, (-1, 16, 2000, 1))

没有成功。

如何做到这一点，即具有形状为(..., 16, 2000, 1)的timeseries_dataset_from_array的输出？

要对tf.data.Dataset的每个元素应用转换，应该使用tf.data.Dataset.map函数。在您的情况下，可以使用tf.expand_dims:用lambda定义函数

ds = tensorflow.keras.preprocessing.timeseries_dataset_from_array(X, None, 16, sequence_stride=1, sampling_rate=1, batch_size=32)
ds_correct_shape = ds.map(lambda x: tf.expand_dims(x,axis=-1))

如果我们检查第一个元素的形状：

>>> for elem in ds_correct_shape.take(1):
print(f"{elem.shape=}")
elem.shape=TensorShape([32, 16, 2000, 1])

相关内容

最新更新

热门标签：