Извлечение валидационной выборки из тестовой выборки

Question 1

Я строю 3 модели нейронных сетей на наборе данных, который уже разделен на обучающую и тестовую выборки. В ходе анализа я обнаружил, что этот набор данных содержит значения в тестовом наборе, которые не существуют в обучающем наборе. Это накладывает определенное ограничение или максимальную емкость на мою модель(-и) нейронной сети. Под этим я имею в виду, что не могу улучшить точность, даже если изменяю гиперпараметры или параметры моих моделей.

Я создал 3 модели нейронных сетей и варьировал почти всё:

Количество узлов/скрытых слоев,
Входные признаки (проводил отбор признаков и уменьшение пространства),
Функции активации и функции потерь,
Регуляризация, оптимизатор и другое,

Когда я пытаюсь усреднить предсказания этих 3 моделей, я не вижу никаких улучшений. Хотя я много читал, что если изменить такие параметры, можно получить некоррелированные модели. Но в моем случае это не так, потому что я всегда нахожу корреляцию между предсказаниями моделей, когда вычисляю Pearson Correlation.

После построения всех этих моделей я уверен, что обучающая и тестовая выборки не взяты из одного и того же распределения (то есть они не являются случайным разделением какого-то полного оригинального набора данных), что означает, что и другие признаки, вероятно, также имеют различное распределение.

Некоторые предложили, что я мог бы объединить обучающую и тестовую выборки, но я не хочу этого делать, так как этот набор данных был разработан таким образом. Но я хотел бы вытянуть мою валидационную выборку из тестовой выборки, возможно ли это? Могу ли я использовать валидационную выборку, случайно выбранную из тестовой выборки, для настройки моделей?

Question 2

Забудьте на мгновение, что вы работаете с нейронной сетью. Надеюсь, вы также учитываете время. Если бы вы выполняли обычную регрессию и время было одним из факторов, вам пришлось бы применить штраф за экстраполяцию к вашим доверительным интервалам, чтобы наказать вашу модель за отклонение от наблюдаемого диапазона.

Другая возможность состоит в том, что в вашем наборе данных есть интервенция. То есть возможно, что что-то произошло, и вам действительно нужно провести тест на дисперсию между обучающим и тестовым наборами данных.

Традиционная регрессия минимизирует дисперсию вокруг среднего, но существует также регрессия по медиане, которая разработана для этой конкретной проблемы, когда в модели возникают проблемы с дисперсией.

Question 3

Я не думаю, что оправдано обучаться на тестовой выборке. Более оправдано расширить обучающую выборку внешними данными, если они доступны (если это так, пожалуйста, укажите внешние данные при составлении отчета, особенно для академической отчетности).

Если ваши данные табличные, вы можете попробовать поработать над инженерией признаков или улучшить метод предобработки. Если ваши данные изображений, вы можете попробовать добавить внешние (любые, кроме тестовой выборки вашего собственного набора данных) и применить уникальные идеи аугментации данных.

Пока ваша сеть не переобучается и способна хорошо обобщать, это не должно быть проблемой. Предполагаю, что результаты будут сравниваться в рамках академического обсуждения. Если это так, не волнуйтесь слишком сильно, так как другие тоже могут столкнуться с этой проблемой. Если вы сможете ее решить, это замечательно, так как это означает, что вы смогли разработать сеть, которая способна очень хорошо обобщать. Но если нет, пока вы можете объяснить возникшую проблему, менее желательный результат вполне понятен.

Извлечение валидационной выборки из тестовой выборки

Вопрос или проблема

Ответ или решение

Исходные данные и распределение

Опции валидации

Альтернативы валидации

Заключение