Keras, DNN с сигмоидой – model.predict выдает значения < 0.5. Это указывает на...?

Question 1

Я пытаюсь сделать простой проект на Keras с полносвязными слоями для бинарной классификации. Примерно 300000 строк данных, метки такие

training_set['TARGET'].value_counts()    
0    282686
1     24825

Моя модель выглядит следующим образом

def build_model():
    model = models.Sequential()
    model.add(layers.Dense(64, activation='relu', kernel_regularizer=regularizers.l2(0.001),
                           input_shape=(train_data.shape[1],)))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(32, kernel_regularizer=regularizers.l2(0.001), activation='relu'))
    model.add(layers.Dropout(0.5))
    model.add(layers.Dense(1, activation='sigmoid'))
    model.compile(optimizer="rmsprop",
              loss="binary_crossentropy",
              metrics=['accuracy'])

    return model

Это бинарная классификация, которая заканчивается сигмоидой. Я понимаю, что должен получать значения, близкие к 0 или близкие к 1? Я пробовал разные архитектуры модели, гиперпараметры, эпохи, размеры батчей и т. д., но когда я запускаю model.predict на своем валидационном наборе, мои значения никогда не превышают 0.5. Вот несколько примеров.

20 эпох, размер батча 16384
макс 0.458850622177124, мин 0.1022530049085617
макс 0.47131556272506714, мин 0.057787925004959106 

20 эпох, размер батча 8192
макс 0.42957592010498047, мин 0.060324762016534805
макс 0.3811708390712738, мин 0.022215187549591064

20 эпох, размер батча 4096
макс 0.3163970410823822, мин 0.0657803937792778 

20 эпох, размер батча 2048
макс 0.21799422800540924, мин 0.03832605481147766

Является ли это показателем того, что я делаю что-то неправильно?

Потери на обучении и валидации

Question 2

Я думаю, что дропаут немного высок, и если это бинарная классификация, то почему в конце один единственный узел?

Использовать сигмоиду для бинарной классификации абсолютно нормально. Так что ответ, предоставленный ниже, неуместен.

~~Убедитесь, что ваша целевая переменная имеет правильную форму в случае softmax…(one hot/ to_categorical())~~

def build_model():
    model = models.Sequential()
    model.add(layers.Dense(64, activation='relu', kernel_regularizer=regularizers.l2(0.001),
                           input_shape=(train_data.shape[1],)))
    model.add(layers.Dropout(0.3))
    model.add(layers.Dense(32, kernel_regularizer=regularizers.l2(0.001), activation='relu'))
    model.add(layers.Dropout(0.3))
    model.add(layers.Dense(**num_classes**, activation='softmax'))
    model.compile(optimizer="rmsprop",
              loss="binary_crossentropy",
              metrics=['accuracy'])

    return model

Чтобы улучшить это дальше, вам нужно использовать некоторые техники, такие как кросс-валидация, нормализация батчей и увеличение количества эпох (возможно).

Question 3

Напротив предыдущего ответа, я бы сказал, что ваша конфигурация выходного слоя правильная, хотя я согласен с предыдущим ответом относительно того, что ваш дропаут слишком высок. Дропаута в 0.5 означает, что 50% ваших нейронов будут отброшены, так что по сути вы отбрасываете половину своих нейронов в слое, что, в свою очередь, значит, что ваша модель не сможет многому научиться.

Другой момент, который я хотел бы упомянуть, заключается в том, что вам следует использовать adam в качестве оптимизатора, так как он чаще дает лучшие результаты.

В кратце, чтобы улучшить свою точность, проведите настройку гиперпараметров для таких вещей, как количество слоев, количество нейронов, оптимизатор, скорость обучения, активационная функция, размер батча, эпохи и т. д. Используйте RandomizedSearchCV для этой цели.

Keras, DNN с сигмоидой – model.predict выдает значения < 0.5. Это указывает на...?

Вопрос или проблема

Ответ или решение