Ошибка: В операции градиент имеет `None` для categorical_crossentropy

Question 1

Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода. Я смог обучить сеть независимо, используя fit(). Однако теперь, когда я перешел на train_on_batch, она выдает ошибку, упомянутую выше.

Вот мой код дискриминатора:

def build_discriminator(time_steps, feature_size, input_spectrogram=None):
    spectrogram = Input(shape=(time_steps, feature_size))
    # spectrogram = tf.placeholder(tf.float32, shape=(None, time_steps, feature_size))
    layer0 = Reshape((time_steps, feature_size, 1))(spectrogram)
    layer1 = Conv2D(32, kernel_size=(3,3), padding='same')(layer0)
    #model.add(LeakyReLU(alpha=0.01))
    layer2 = MaxPooling2D(pool_size=(4,4))(layer1)

    layer3 = Conv2D(16, kernel_size=(3,3), padding='same')(layer2)
    #model.add(LeakyReLU(alpha=0.05))
    layer4 = MaxPooling2D(pool_size=(4,4))(layer3)

    layer5 = Conv2D(16, kernel_size=(3,3), padding='same')(layer4)
    #model.add(LeakyReLU(alpha=0.05))
    layer6 = MaxPooling2D(pool_size=(4,4))(layer5)

    layer7 = Flatten()(layer6)
    layer8 = Dense(16)(layer7)
    prediction = Dense(9, activation = 'softmax')(layer8)
    # prediction = Dropout(0.1)(layer9)

    model = Model(spectrogram, prediction)

    opt = optimizers.Adam(lr=0.002, beta_1=0.5)
    model.compile(loss="categorical_crossentropy", optimizer=opt, metrics=['accuracy'])

    return model

Вот код, который обучает дискриминатор:

    x_real = batch_x[:half_batch, :, :]
    labels_real = batch_labels[:half_batch]
    d_loss1, _ = discriminator.train_on_batch(x_real, to_categorical(labels_real, num_classes=9))
    # генерируем 'фальшивые' примеры
    x_fake, labels_fake = generate_fake_samples(batch_x[half_batch:, :, :], batch_labels[half_batch:], generator)
    # обновляем веса модели дискриминатора
    d_loss2, _ = discriminator.train_on_batch(x_fake, to_categorical(labels_fake, num_classes=9))
    # обновляем генератор через ошибку дискриминатора
    g_loss, acc = gan.train_on_batch([batch_x, batch_targets], to_categorical(batch_targets, num_classes=9))

Ошибка возникает на этой строке:

d_loss1, _ = discriminator.train_on_batch(x_real, to_categorical(labels_real, num_classes=9))

Трассировка ошибки:

  File "gan.py", line 126, in train
    d_loss1, _ = discriminator.train_on_batch(x_real, to_categorical(labels_real, num_classes=9))
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/engine/training.py", line 1513, in train_on_batch
    self._make_train_function()
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/engine/training.py", line 316, in _make_train_function
    loss=self.total_loss)
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/legacy/interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/backend/tensorflow_backend.py", line 75, in symbolic_fn_wrapper
    return func(*args, **kwargs)
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/optimizers.py", line 504, in get_updates
    grads = self.get_gradients(loss, params)
  File "/home/pallavi/anaconda3/lib/python3.7/site-packages/keras/optimizers.py", line 93, in get_gradients
    raise ValueError('An operation has `None` for gradient. '
ValueError: Операция имеет `None` для градиента. Пожалуйста, убедитесь, что все ваши операции имеют определенный градиент (т.е. являются дифференцируемыми). Обычные операции без градиента: K.argmax, K.round, K.eval.

Я использую TensorFlow-GPU 2.0.0 с Keras 2.3.1. Мог бы кто-нибудь помочь мне понять, где я ошибаюсь?

Question 2

Возможно, вы неправильно строите свою модель.

Вот альтернативный способ построения модели:

from tensorflow.keras.models import Sequential

layers =[
spectrogram = Input(shape=(time_steps, feature_size))
layer0 = Reshape((time_steps, feature_size, 1))
layer1 = Conv2D(32, kernel_size=(3,3), padding='same')
layer2 = MaxPooling2D(pool_size=(4,4))
layer3 = Conv2D(16, kernel_size=(3,3), padding='same')
layer4 = MaxPooling2D(pool_size=(4,4))
layer5 = Conv2D(16, kernel_size=(3,3), padding='same')
layer6 = MaxPooling2D(pool_size=(4,4))
layer7 = Flatten()
layer8 = Dense(16)
]
model = Sequential(layers)
model.summary()
model.compile(loss="categorical_crossentropy", optimizer=optimizers.Adam(lr=0.002, beta_1=0.5), metrics=['accuracy'])

Ошибка: В операции градиент имеет `None` для categorical_crossentropy

Вопрос или проблема

Ответ или решение

Причины возникновения ошибки

Проверка и решения

Заключение

Ошибка: В операции градиент имеет None для categorical_crossentropy

Вопрос или проблема

Ответ или решение

Причины возникновения ошибки

Проверка и решения

Заключение

Ошибка: В операции градиент имеет `None` для categorical_crossentropy