Data Science
Существует ли взаимосвязь между скоростью обучения и размером обучающего набора?
00
Вопрос или проблема У меня есть большой набор данных для обучения модели нейронной сети. Однако у меня недостаточно ресурсов для надлежащей настройки гиперпараметров на всем наборе данных. Поэтому моя идея заключается в том, чтобы отрегулировать скорость
Вопросы и ответы
Темп обучения в PyTorch отказывается устанавливаться?
00
Вопрос или проблема Я работаю над настройкой BLIP-2 на наборе данных RSICD с использованием LORA. Я работаю в colab, используя A100. Странно, но когда я устанавливаю скорость обучения в приведенном ниже коде, это не влияет на результат.
Data Science
Как пространство оптимизации связано с проблемой исчезающего/взрывного градиента в глубоком обучении?
00
Вопрос или проблема Я пытаюсь полностью понять, почему проблемы исчезающего и взрывающегося градиентов так вредны для обучения глубоких нейронных сетей. Я понимаю, что эти проблемы приводят к тому, что некоторые веса имеют очень маленькие градиенты (исчезающий