Проблема потерь и метрик при обучении модели cnn

Question

У меня проблема с моими пользовательскими функциями потерь и метрик. Моя цель – обучить модель CNN на изображениях с тангенсом угла ориентации объекта на моем изображении, и у меня есть столбец, который указывает, является ли тангенс положительным или отрицательным. В конце концов, у меня есть два выхода: один для тангенса (регрессия), а второй – для классификации. Теперь, когда я вызываю model.evaluate, я записываю регрессию как первую элемент, который должен появиться, но он не появляется первым. И я не уверен, что они как-то перепутаны, потому что не могу найти объяснение странным результатам, которые я получаю. Вот мой код:

  # Пользовательские функции потерь и метрик
@keras.utils.register_keras_serializable(package="Custom")

def angular_loss(y_true, y_pred):
    angles_true = tf.math.atan(y_true) * 180.0 / np.pi
    angles_pred = tf.math.atan(y_pred) * 180.0 / np.pi
    return tf.abs(angles_true - angles_pred)

@keras.utils.register_keras_serializable(package="Custom")
def rmse_degrees(y_true, y_pred):
    a = tf.constant(np.pi)
    angles_true = tf.math.atan(y_true) * 180.0 / a
    angles_pred = tf.math.atan(y_pred) * 180.0 / a
    b = tf.square(angles_true - angles_pred)
    return tf.reduce_mean(b)
# Определяем модель
input_image = Input(shape=X_train_images.shape[1:], name="input_image")
x = layers.Conv2D(32, (3, 3), activation='relu')(input_image)
x = layers.MaxPooling2D((2, 2))(x)
x = layers.Dropout(0.3)(x)
x = layers.Conv2D(64, (3, 3), activation='relu')(x)
x = layers.MaxPooling2D((2, 2))(x)
x = layers.Dropout(0.3)(x)
x = layers.Flatten()(x)
x = layers.Dense(128, activation='relu')(x)  # Промежуточный полносвязный слой
x = layers.Dropout(0.3)(x)

output_regression = layers.Dense(1, activation='linear', name="reg_output")(x)
output_classification = layers.Dense(1, activation='sigmoid', name="cls_output")(x)
model = keras.Model(inputs=input_image, outputs=[output_regression, output_classification])
model.summary()
model.save("modelfinal3.keras")
# Компилируем модель



model.compile(
    optimizer = RMSprop(learning_rate=0.0001),
    loss={
        'reg_output': angular_loss,
        'cls_output': 'binary_crossentropy'
    },
    metrics={
        'reg_output': [rmse_degrees],
        'cls_output': ['accuracy']
    }
)

# Определяем обратный вызов ModelCheckpoint для сохранения лучшей модели
callbacks = [
    keras.callbacks.ModelCheckpoint("modelfinal3.keras", monitor="reg_output_loss", save_best_only=True , mode="min"),
    keras.callbacks.EarlyStopping(monitor="reg_output_loss" , patience = 8 ,mode="min" )
]

# Обучаем модель без валидационных данных
history = model.fit(
    X_train_images,{'reg_output' : Y1_regression ,'cls_output' : Y2_classification} ,
    epochs= 10 ,
    batch_size= 64,
    callbacks=callbacks
)

test_model =keras.models.load_model("modelfinal3.keras", custom_objects ={'angular_loss': angular_loss, 'rmse_degrees': rmse_degrees })
results = test_model.evaluate(X_test_images, {'reg_output' : Y1_regression_test ,'cls_output' : Y2_classification_test },return_dict=True )


print(results)

‘введите код здесьрезультаты

30/30 ━━━━━━━━━━━━━━━━━━━━ 51s 2s/step - cls_output_accuracy: 0.6618 - cls_output_loss: 9.0815 - loss: 14.4716 - reg_output_loss: 5.3914 - reg_output_rmse_degrees: 2806.2744

Эпоха 7/10
30/30 ━━━━━━━━━━━━━━━━━━━━ 53s 2s/step – cls_output_accuracy: 0.6401 – cls_output_loss: 8.9781 – loss: 14.7173 – reg_output_loss: 5.7363 – reg_output_rmse_degrees: 2787.8420
Эпоха 8/10
30/30 ━━━━━━━━━━━━━━━━━━━━ 51s 2s/step – cls_output_accuracy: 0.6524 – cls_output_loss: 9.0007 – loss: 14.5403 – reg_output_loss: 5.5401 – reg_output_rmse_degrees: 2789.3442
Эпоха 9/10
30/30 ━━━━━━━━━━━━━━━━━━━━ 51s 2s/step – cls_output_accuracy: 0.6674 – cls_output_loss: 9.4412 – loss: 14.7438 – reg_output_loss: 5.3030 – reg_output_rmse_degrees: 2844.9971
Эпоха 10/10
30/30 ━━━━━━━━━━━━━━━━━━━━ 52s 2s/step – cls_output_accuracy: 0.6610 – cls_output_loss: 9.3189 – loss: 14.7248 – reg_output_loss: 5.4059 – reg_output_rmse_degrees: 2828.9368
11/11 ━━━━━━━━━━━━━━━━━━━━ 2s 142ms/step – cls_output_accuracy: 1.0000 – cls_output_loss: 9.4424 – loss: 9.4928 – reg_output_loss: 1.1921e-07 – reg_output_rmse_degrees: 2435.0107
{‘cls_output_accuracy’: 1.0, ‘cls_output_loss’: 8.932900428771973, ‘loss’: 9.235373497009277, ‘reg_output_loss’: 1.1920930376163597e-07, ‘reg_output_rmse_degrees’: 2396.7568359375}

Процесс завершился с кодом выхода 0 ‘

Проблема потерь и метрик при обучении модели cnn

Вопрос или проблема

Ответ или решение

Проблемы с метриками и функцией потерь при обучении модели CNN: Долгосрочные решения

1. Неправильный порядок метрик в выводе результата

2. Неправильные функции потерь и их возможное влияние на обучение

3. Визуализация и анализ истории обучения

Заключение