如果您希望图像的数量是一个序列(例如带有帧的电影),则需要将像素和通道作为特征:
input_shape = (225,3072) #a 3D input where the batch size 7338 wasn't informed
如果要在将3072个特征投入LSTM之前进行更多处理,则可以组合或交织2D卷积和LSTM以得到更精细的模型(尽管不一定更好,但是每个应用程序都有其特定的行为)。
您也可以尝试使用新的ConvLSTM2D,它将采用五维输入:
input_shape=(225,32,32,3) #a 5D input where the batch size 7338 wasn't informed
我可能会创建一个具有多个的卷积网络,
TimeDistributed(Conv2D(...))然后
TimeDistributed(MaxPooling2D(...))再添加
TimeDistributed(Flatten()),最后添加
LSTM()。这很可能会改善您对图像的理解和LSTM的性能。



