Data Science
Как пространство оптимизации связано с проблемой исчезающего/взрывного градиента в глубоком обучении?
00
Вопрос или проблема Я пытаюсь полностью понять, почему проблемы исчезающего и взрывающегося градиентов так вредны для обучения глубоких нейронных сетей. Я понимаю, что эти проблемы приводят к тому, что некоторые веса имеют очень маленькие градиенты (исчезающий