loss-function
Data Science
Вопрос или проблема У меня есть архитектура CNN с двумя функциями кросс-энтропии потерь $\mathcal{L}_1$ и $\mathcal{L}_2$, которые суммируются в общую потерю $\mathcal{L} = \mathcal{L}_1 + \mathcal{L}_2$. Задача, которую я хочу решить, — это неконтролируемая адаптация домена.
Data Science
Вопрос или проблема Я обучаю модель Keras для многомерной регрессии, используя пользовательскую функцию потерь с целью получить прогнозы с точностью до ниже 0.01 в отношении этой функции потерь. Как видно из приведенного ниже графика функций потерь, как
Data Science
Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной
Data Science
Вопрос или проблема Я пытаюсь изучить обучение нейронных сетей в рамках динамических систем, рассматривая модель как систему, а обучение как динамику во временной эволюции. В качестве расширения я попытался сделать так, чтобы обучение проходило в “
Data Science
Вопрос или проблема У меня есть две функции потерь $\mathcal{L}_1$ и $\mathcal{L}_2$ для обучения моей модели. Модель в основном является классификационной. И $\mathcal{L}_1$, и $\mathcal{L}_2$ являются двумя вариантами фокальных потерь.
Data Science
Вопрос или проблема У меня есть две функции потерь $\mathcal{L}_1$ и $\mathcal{L}_2$ для обучения моей модели. Модель преимущественно является классификационной. Обе $\mathcal{L}_1$ и $\mathcal{L}_2$ представляют собой два варианта фокальной потери.
Data Science
Вопрос или проблема Я начинаю изучать мир глубоких нейронных сетей и провожу серию тестов с сверточной моделью, и вот что я обнаружил: Точность на обучающем наборе данных значительно выше (около 0.85), чем на валидационном наборе (около 0.
Data Science
Вопрос или проблема Функция потерь для дискриминатора, которую необходимо максимизировать: -log(D(x)) + log(1-D(G(z))). Функция потерь для генератора, которую необходимо максимизировать: log(D(G(z))) Как будет выглядеть расчет градиента потерь по выходному значению дискриминатора?
Data Science
Вопрос или проблема Моя LSTM нейронная сеть предсказывает номинальные значения в диапазоне от -1 до 1. Я хотел бы установить пользовательскую функцию потерь в Keras, которая назначает весовую функцию в зависимости от знака предсказания.
Data Science
Вопрос или проблема Большинство алгоритмов для проверки глубоких нейронных сетей требует функций активации ReLU в каждом слое (например, Reluplex). У меня есть задача бинарной классификации с классами 0 и 1. Основная проблема, которую я вижу, заключается
Data Science
Вопрос или проблема Предположим, у нас есть большой аннотированный набор данных с 4 классами. В этом наборе данных могут быть аннотированные изображения с менее чем 4 классами, где оставшиеся классы могут присутствовать или отсутствовать.
Data Science
Вопрос или проблема Я обучаю DNN с помощью CNN в Keras. Хотя я могу написать критерий EarlyStopping, основанный на val_loss, из-за незначительных колебаний в val_loss я хочу отслеживать среднюю валидационную потерю за последние n эпох и с n терпением.
Data Science
Вопрос или проблема Я обычно стараюсь учитывать расходы в обучении. Настройка следующая: задача статистического обучения с обычными X и y, где y несбалансирован (примерно 1% единиц). Scikit learn обычно предлагает параметры весов, где вы можете установить
Data Science
Вопрос или проблема В настоящее время я решаю задачу семантической сегментации, в которой для каждого образца моя цель — сегментировать две маски, соответствующие двум объектам. Примечательно, что второй объект обычно расположен внутри первого, а его
Data Science
Вопрос или проблема При построении автоэнкодера, который сохраняет расстояния, я случайно использовал евклидовую норму в качестве функции потерь для разности между расстояниями x и z, которые я пытаюсь минимизировать. (Надеюсь, вы понимаете, почему я запутался).
Data Science
Вопрос или проблема Я пытаюсь воссоздать (в гораздо меньшей версии) систему AlphaGo Zero. Однако у меня возникают проблемы с моделью сети. Функция потерь, которую я должен реализовать, следующая: $$l = (z – v)^2 – \pi^T log(p) + c ||\theta||^2$$
Data Science
Вопрос или проблема Версии кода: python == 3.8 tensorflow == 2.2.0 tensorflow-addons == 0.11.2 Недавно я использовал функцию фокусировки потерь из дополнения tensorflow для одной из моих моделей. Чтобы лучше понять/демонстрировать, что происходит, я пытался
Data Science
Вопрос или проблема Я понимаю, как дивергенция KL предоставляет нам меру различия одной вероятностной распределения от второго, контрольного вероятностного распределения. Но почему они используются именно (вместо кросс-энтропии) в вариационных автокодировщиках
Data Science
Вопрос или проблема Я работал над этим в последние несколько дней и не мог разобраться. Публиковал в различных группах, на StackOverflow и т. д., и получил предложения от многих пользователей. Я реализовал эти предложения в коде, представленном ниже
Data Science
Вопрос или проблема Мне нужно выполнить проект по генерации музыки для курса глубокого обучения, который я прохожу в этом семестре, и я использую Pytorch. Датасет состоит из песен в формате midi, и я использую библиотеку python mido для извлечения данных из каждой песни.