Data Science
Как вывести нашу функцию потерь из градиентного целевого показателя?
00
Вопрос или проблема Я изучал теорию и практику RL, и одна часть, которую мне трудно понять, — это связь между практической функцией loss и теоретической целью/градиентом цели. Как мы можем вывести одно из другого? Возможно, это будет легче понять на примерах
Data Science
Помогите! Обработка набора данных для ASR?
00
Вопрос или проблема Я работаю над тонкой настройкой модели Whisper от OpenAI для перевода речи на непальский текст в рамках моего проекта, но столкнулся с некоторыми трудностями и буду признателен за любые рекомендации или предложения от этого сообщества!
Data Science
Как обучить энкодер в BiGAN?
00
Вопрос или проблема У меня есть некоторые трудности с обучением BiGAN. В частности, кодировщик, похоже, не обучается отображать карты между изображениями x и латентным пространством z. У меня есть следующий кодировщик: def build_encoder(self): model =
Data Science
Генерация временных рядов – многомерные данные временных рядов
00
Вопрос или проблема Отказ от ответственности: Математики, пожалуйста, не сердитесь на меня за использование некоторых терминов в этом посте. Я инженер. 🙂 Предыстория: Итак, я в настоящее время работаю над задачей, где мне нужно сгенерировать последовательность
Data Science
Числовая точность в Flux.jl
00
Вопрос или проблема Я пытаюсь изучить обучение нейронных сетей в рамках динамических систем, рассматривая модель как систему, а обучение как динамику во временной эволюции. В качестве расширения я попытался сделать так, чтобы обучение проходило в “
Data Science
Модель кодировщик-декодировщик для извлечения параметров из текстового ввода
00
Вопрос или проблема У меня есть входные данные в виде текста, из которого я хочу извлечь параметры, как указано в примере ниже. Вход: "клиент должен оплатить штраф в размере 10% от суммы, если задержка проекта превышает 3 месяца" и выход: penalty = 10%
Data Science
Есть ли значение в весах первых / последних слоев?
00
Вопрос или проблема Я работаю над задачей классификации временных рядов (5 классов), где на входе содержится 4 признака с 90 образцами для каждого признака. class GRUModel(nn.Module): def __init__(self, feature_size, hidden_size, output_size): super(GRUModel, self).
Data Science
В чем разница между LSTM-слоем с временным шагом 1 и MLP-слоем?
00
Вопрос или проблема Я пытался понять основные различия между слоем LSTM с временной шкалой в 1 и стандартным полносвязным (Dense) слоем. Поскольку LSTM часто используются для последовательных данных, я задавался вопросом, что происходит, когда входной
Data Science
Как автоматизировать перезапуск обучения модели глубокого обучения в TensorFlow
00
Вопрос или проблема Я пытаюсь автоматизировать (рекурсивно) перезапуск завершенной сессии обучения глубокого обучения в TensorFlow. В настоящее время для перезапуска я вручную перезапускаю ядро и заново запускаю код обучения. Вопросы: Я понимаю, что “
Data Science
Как изменить размер изображения вместе с его маской?
00
Вопрос или проблема У меня есть оригинальные изображения размером 1935×1481. Я использую labelme для аннотирования изображений. Я создаю полигоны на оригинальном изображении. Существует ли способ изменить размер изображения вместе с их маской?
Data Science
Увеличение потерь при обучении с каждой эпохой в реализации PyTorch ResNet
00
Вопрос или проблема Я реализую сеть ResNet с нуля, используя PyTorch. Эта сеть уникальна для моих требований, так как мне нужно выполнять классификацию изображений спутниковой съемки с 14 различными каналами и размерами 8×
Data Science
Как подойти к отображению семейств векторов на решетке и прогнозированию результирующего значения
00
Вопрос или проблема Я описываю здесь модель, чтобы показать, как соседи влияют на узел. Я хочу реализовать её, чтобы попытаться прогнозировать значения, связанные с узлами; я публикую это здесь, чтобы попросить совета по математической модели и методам
Data Science
В чем разница между подходом на основе предложений и подходом без предложений?
00
Вопрос или проблема Здесь (источник) говорится, что Методы решения задачи сегментации экземпляров можно условно разделить на две категории: методы на основе предложений и методы без предложений. В методах на основе предложений сначала предсказывается
Data Science
Следую ли я правильному подходу?
00
Вопрос или проблема Я работаю над проблемой медицинской семантической сегментации, где входные данные имеют размер (1,256,256), и у меня есть два выхода, связанные с этими входными данными (две маски), каждая с формой (1,256,256).
Data Science
Есть ли преимущество в меньшем значении функции потерь?
00
Вопрос или проблема У меня есть две функции потерь $\mathcal{L}_1$ и $\mathcal{L}_2$ для обучения моей модели. Модель в основном является классификационной. И $\mathcal{L}_1$, и $\mathcal{L}_2$ являются двумя вариантами фокальных потерь.
Data Science
Обучение с подкреплением на данных в реальном времени через веб-сервер.
00
Вопрос или проблема Вопрос: возможно ли реализовать модель обучения с подкреплением на NodeJS сервере? Этот сервер будет получать бинарные формы данных (открыть/закрыть; да/нет) в режиме реального времени. Цель модели – учиться на входящих данных
Data Science
Изучение сходства представлений
00
Вопрос или проблема Меня интересует платформа для изучения сходства различных входных представлений на основе некоторого общего контекста. Я изучал word2vec, SVD и другие рекомендательные системы, которые более или менее делают то, что мне нужно.
Data Science
Потери на обучении застряли на начальных эпохах, но затем начинают уменьшаться. Какова могла бы быть причина этого?
00
Вопрос или проблема Я обучаю модель, в которой столкнулся с уникальной проблемой: в течение первых 4 эпох моя функция потерь не изменялась, но после этого начала изменяться. Может быть, это из-за высокой скорости обучения, локального минимума или чего-то
Data Science
Как повысить точность модели из модельного зоопарка TensorFlow?
00
Вопрос или проблема Ситуация: Мой набор данных состоит из 70 тыс. изображений людей в одежде. Изображения имеют метки: положение bbox и класс. Всего 10 классов. Я сделал разделение 80:20. Категории сбалансированы, за исключением одной категории, но я
Data Science
Обучение нейронной сети для локализации звука
00
Вопрос или проблема Я пытаюсь обучить нейронную сеть, чтобы оценить местоположение (в градусах от 0 до 180), откуда исходит звук. Я использую TensorFlow Keras в Python для обучения модели. Входные данные представляют собой два бинауральных признака, а