Это хороший способ использовать отдельный валидационный набор с k-кратной перекрестной проверкой?

Содержание

Вопрос или проблема
Ответ или решение
Исходный Порядок Действий
Преимущества Предложенного Подхода
Замечания и Рекомендации
Заключение

Вопрос или проблема

Я обучаю CNN, и я разделил набор данных на 70% для обучения, 20% для валидации и 10% для тестирования. Я хочу использовать этот набор валидации для ранней остановки, чтобы избежать переобучения модели на каждой итерации обучения. Мой подход следующий:

1- Разделить набор данных на обучающий + валидационный + тестовый наборы.

2- Применить K-Fold кросс-валидацию только на обучающем наборе, где я буду обучать модель на K-1 фолдах, валидировать на оставшемся фолде, и использовать валидационный набор (отложенный для настройки) для ранней остановки и контроля модели на каждой итерации обучения.

3- После процесса кросс-валидации я буду обучать модель на всем обучающем наборе, а затем оценю модель на тестовом наборе (который не был затронут), используя валидационный набор для ранней остановки и контроля модели.

Это хороший подход? Или я мог бы использовать K-Fold CV на обучающем наборе, а затем использовать внешний валидационный набор только один раз для ранней остановки во время окончательного обучения на всем 70% обучающем наборе, а затем оценить финальную модель на тестовом наборе? Или есть другой подход, который лучше, чем эти?

Ответ или решение

Использование отдельного набора валидации в сочетании с k-складочным кросс-валидированием – это важный аспект, который может существенно повлиять на производительность вашей модели глубокого обучения. Давайте разберем предложенный вами подход и рассмотрим его достоинства и недостатки.

Исходный Порядок Действий

Разделение Данных: Вы делите набор данных на три части: 70% для обучения, 20% для валидации и 10% для тестирования. Это разумный подход, который позволяет сохранить независимый набор тестовых данных для окончательной оценки.
Применение K-Fold Кросс-Валидирования: Вы планируете использовать k-складочное кросс-валидирование только на тренировочном наборе, обучая модель на K-1 фолде и валидируя на оставшемся. Это предлагает нам возможность получить несколько оценок производительности модели и помогает лучше понять ее обобщающую способность.
Использование Валидационного Набора: Ваша идея использовать отдельный валидационный набор для ранней остановки и сохранения модели в каждом цикле кросс-валидирования действительно подходит. Это позволяет избежать переобучения и обеспечивает, что модель не запоминает специфические паттерны тренировочного набора.

Преимущества Предложенного Подхода

Независимость Тестирования: Сохранение тестового набора данных в недоступном состоянии во время обучения гарантирует, что он может служить надежным критерием для оценки производительности вашей модели.
Раннее Остановка: Используя валидационный набор для ранней остановки, вы можете контролировать процесс обучения, минимизируя риск переобучения. Это значительно увеличивает шансы на получение более обобщающей модели.

Замечания и Рекомендации

Тем не менее, ваша идея о том, чтобы использовать валидационный набор лишь один раз после завершения k-складочного кросс-валидирования, также имеет свои преимущества. Рассмотрим оба метода:

Ваш Метод: Процесс k-складочного кросс-валидирования с использованием валидационного набора повсеместно для ранней остановки может привести к переобучению на этом наборе. Каждый раз, когда вы используете валидационный набор, он вносит дополнительную ошибку в вашу модель, даже если она кажется менее заметной. Вам нужно быть осторожным с использованием валидационного набора слишком часто.
Альтернативный Метод: Применение k-складочного кросс-валидирования на обучающем наборе и использование валидационного набора только один раз для окончательной проверки модели также может быть предпочтительным, поскольку это обеспечит меньшее количество конфузий между обучением и валидацией. Вы сможете более точно оценить, как ваша модель будет работать на реальных, немодифицированных данных.

Заключение

Ваша изначальная структура чётко представляет целый ряд плюсов и минусов. Самым оптимальным путем будет сочетание подходов: примените k-складочное кросс-валидирование на тренировочном наборе, а валидационный набор используйте в качестве окончательной проверки после обучения. Таким образом, вы сможете обеспечить максимальную обобщающую способность вашей модели, минимизируя перекрытие между обучением и тестированием.

Выводя финальный вариант модели, не забудьте, что тестовая выборка должна оставаться полностью не тронутой на протяжении всего периода обучения и валидации, что обеспечит максимально объективные результаты.