Data Science
Градиенты CNN с разной величиной
00
Вопрос или проблема У меня есть архитектура CNN с двумя функциями кросс-энтропии потерь $\mathcal{L}_1$ и $\mathcal{L}_2$, которые суммируются в общую потерю $\mathcal{L} = \mathcal{L}_1 + \mathcal{L}_2$. Задача, которую я хочу решить, — это неконтролируемая адаптация домена.
Data Science
Метод проверки потерь продолжает колебаться относительно метода обучения потерь.
00
Вопрос или проблема Я обучаю модель Keras для многомерной регрессии, используя пользовательскую функцию потерь с целью получить прогнозы с точностью до ниже 0.01 в отношении этой функции потерь. Как видно из приведенного ниже графика функций потерь, как
Data Science
Функция потерь в алгоритме MedSAM
00
Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной
Data Science
Числовая точность в Flux.jl
00
Вопрос или проблема Я пытаюсь изучить обучение нейронных сетей в рамках динамических систем, рассматривая модель как систему, а обучение как динамику во временной эволюции. В качестве расширения я попытался сделать так, чтобы обучение проходило в “
Data Science
Есть ли преимущество в меньшем значении функции потерь?
00
Вопрос или проблема У меня есть две функции потерь $\mathcal{L}_1$ и $\mathcal{L}_2$ для обучения моей модели. Модель в основном является классификационной. И $\mathcal{L}_1$, и $\mathcal{L}_2$ являются двумя вариантами фокальных потерь.
Data Science
Есть ли какие-либо преимущества более низкого значения функции потерь?
00
Вопрос или проблема У меня есть две функции потерь $\mathcal{L}_1$ и $\mathcal{L}_2$ для обучения моей модели. Модель преимущественно является классификационной. Обе $\mathcal{L}_1$ и $\mathcal{L}_2$ представляют собой два варианта фокальной потери.
Data Science
Может ли у меня быть нулевая потеря на наборе валидации и все же плохая точность?
00
Вопрос или проблема Я начинаю изучать мир глубоких нейронных сетей и провожу серию тестов с сверточной моделью, и вот что я обнаружил: Точность на обучающем наборе данных значительно выше (около 0.85), чем на валидационном наборе (около 0.
Data Science
Расчет градиента выхода GAN
00
Вопрос или проблема Функция потерь для дискриминатора, которую необходимо максимизировать: -log(D(x)) + log(1-D(G(z))). Функция потерь для генератора, которую необходимо максимизировать: log(D(G(z))) Как будет выглядеть расчет градиента потерь по выходному значению дискриминатора?
Data Science
Функция потерь Keras с пользовательской весовой функцией
00
Вопрос или проблема Моя LSTM нейронная сеть предсказывает номинальные значения в диапазоне от -1 до 1. Я хотел бы установить пользовательскую функцию потерь в Keras, которая назначает весовую функцию в зависимости от знака предсказания.
Data Science
Обучение глубоких нейронных сетей с выходным слоем ReLU для верификации
00
Вопрос или проблема Большинство алгоритмов для проверки глубоких нейронных сетей требует функций активации ReLU в каждом слое (например, Reluplex). У меня есть задача бинарной классификации с классами 0 и 1. Основная проблема, которую я вижу, заключается
Data Science
Многоклассовая семантическая сегментация, при которой некоторые классы могут отсутствовать на некоторых изображениях.
00
Вопрос или проблема Предположим, у нас есть большой аннотированный набор данных с 4 классами. В этом наборе данных могут быть аннотированные изображения с менее чем 4 классами, где оставшиеся классы могут присутствовать или отсутствовать.
Data Science
Простановка обучения на основе среднего значения val_loss за последние десять эпох с некоторым количеством терпимости.
00
Вопрос или проблема Я обучаю DNN с помощью CNN в Keras. Хотя я могу написать критерий EarlyStopping, основанный на val_loss, из-за незначительных колебаний в val_loss я хочу отслеживать среднюю валидационную потерю за последние n эпох и с n терпением.
Data Science
Учитывая стоимость экземпляра в обучении?
00
Вопрос или проблема Я обычно стараюсь учитывать расходы в обучении. Настройка следующая: задача статистического обучения с обычными X и y, где y несбалансирован (примерно 1% единиц). Scikit learn обычно предлагает параметры весов, где вы можете установить
Data Science
Потеря по каналу или Потеря по образцу
00
Вопрос или проблема В настоящее время я решаю задачу семантической сегментации, в которой для каждого образца моя цель — сегментировать две маски, соответствующие двум объектам. Примечательно, что второй объект обычно расположен внутри первого, а его
Data Science
Можно ли использовать Евклидово расстояние в качестве функции потерь?
00
Вопрос или проблема При построении автоэнкодера, который сохраняет расстояния, я случайно использовал евклидовую норму в качестве функции потерь для разности между расстояниями x и z, которые я пытаюсь минимизировать. (Надеюсь, вы понимаете, почему я запутался).
Data Science
Keras – Реализация пользовательской функции потерь с несколькими выходами
00
Вопрос или проблема Я пытаюсь воссоздать (в гораздо меньшей версии) систему AlphaGo Zero. Однако у меня возникают проблемы с моделью сети. Функция потерь, которую я должен реализовать, следующая: $$l = (z – v)^2 – \pi^T log(p) + c ||\theta||^2$$
Data Science
Заканчивается память при вычислении потерь с использованием SigmoidFocalCrossEntropy
00
Вопрос или проблема Версии кода: python == 3.8 tensorflow == 2.2.0 tensorflow-addons == 0.11.2 Недавно я использовал функцию фокусировки потерь из дополнения tensorflow для одной из моих моделей. Чтобы лучше понять/демонстрировать, что происходит, я пытался
Data Science
Почему дивергенция KL вместо кросс-энтропии в VAE
00
Вопрос или проблема Я понимаю, как дивергенция KL предоставляет нам меру различия одной вероятностной распределения от второго, контрольного вероятностного распределения. Но почему они используются именно (вместо кросс-энтропии) в вариационных автокодировщиках
Data Science
Потеря NAN, точность 0 – Есть идеи, почему? Полный код представлен.
00
Вопрос или проблема Я работал над этим в последние несколько дней и не мог разобраться. Публиковал в различных группах, на StackOverflow и т. д., и получил предложения от многих пользователей. Я реализовал эти предложения в коде, представленном ниже
Data Science
Настройте функцию потерь для генерации музыки с помощью LSTM (?)
00
Вопрос или проблема Мне нужно выполнить проект по генерации музыки для курса глубокого обучения, который я прохожу в этом семестре, и я использую Pytorch. Датасет состоит из песен в формате midi, и я использую библиотеку python mido для извлечения данных из каждой песни.