deep-learning
Data Science
Вопрос или проблема Как обучить модель нейронной сети, которая выполняет регрессию по реальным значениям, используя гауссовский выходной слой? То есть оценивать параметры среднего и стандартного отклонения предсказания. Поскольку во время тренировки будет
Data Science
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели
Data Science
Вопрос или проблема В настоящее время я пытаюсь классифицировать дискретные последовательные данные на пять классов с помощью машинного обучения. Настройка следующая: Фактический объект заполнен различными свойствами, но для разделения объектов и назначения
Data Science
Вопрос или проблема В настоящее время я провожу исследование методов, которые решают проблемы классификации намерений и заполнения слотов в NLP. Одним из подходов, с которым я решил начать эксперименты, предложен в следующей статье: https://arxiv.
Data Science
Вопрос или проблема Я уже какое-то время ломаю голову. У меня есть отсканированный PDF-документ с текстом и логотипом на заднем фоне, как на изображении ниже. Я хочу сделать оптическое распознавание текста (OCR), но это становится очень сложным из-за логотипа.
Data Science
Вопрос или проблема Кто-нибудь знает, как этот алгоритм выполняет процесс обучения для нейронных сетей? Я наткнулся на это решение. Оно работает, но я не знаю, как и почему. Это нейронно-локально и работает без ошибок или обратного распространения.
Data Science
Вопрос или проблема Я построил и обучил сверточную нейронную сеть, используя Keras в R с бэкендом TensorFlow. Я подаю сети многоспектральные изображения для простой классификации изображений. Существует ли способ рассчитать, какие из входных полос были
Data Science
Вопрос или проблема Имеет ли смысл сначала обучить модель на изображениях из нескольких доменов, а затем провести “тонкую настройку” на одном конкретном домене, чтобы улучшить ее производительность на этом домене? Например, можно обучить детектор
Data Science
Вопрос или проблема Я пытаюсь преобразовать категориальные значения (почтовые индексы) с помощью Cat2Vec в матрицу, которая может быть использована в качестве входной формы для категориального прогнозирования целевой переменной с бинарными значениями.
Data Science
Вопрос или проблема Я работаю над реализацией нейронной сети LSTM для прогнозирования потребления энергии. У меня есть набор данных с нагрузкой, рядами погодных параметров и индикатором выходного дня или нет. Сначала я создал сеть с входом в 24 лага (используя
Data Science
Вопрос или проблема Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется
Data Science
Вопрос или проблема Я обучаю CNN, и я разделил набор данных на 70% для обучения, 20% для валидации и 10% для тестирования. Я хочу использовать этот набор валидации для ранней остановки, чтобы избежать переобучения модели на каждой итерации обучения.
Data Science
Вопрос или проблема Сегодня мне пришло в голову, что было бы неплохим подходом динамически удалять данные из обучающего набора при обучении нейронной сети. Предполагая задачу классификации, подход мог бы быть таким: Обучить сеть на эпоху.
Data Science
Вопрос или проблема Я уже прочитал много статей на эту тему, и Градиентный спуск в свёрточных нейронных сетях от Jefkine кажется самым лучшим. Хотя, как сказал автор, Для простоты мы будем рассматривать случай, когда входное изображение является grayscale, т.
Data Science
Вопрос или проблема В самовнимании внимание для слова вычисляется следующим образом: $$ A(q, K, V) = \sum_{i} \frac{exp(q.k^{<i>})}{\sum_{j} exp(q.k^{<j>})}v^{<i>} $$ Мой вопрос: почему мы суммируем векторы множественночности * Значение.
Data Science
Вопрос или проблема Я пытаюсь переобучить нейронную сеть с использованием трансферного обучения, чтобы она могла классифицировать, есть ли на изображении определенный объект, скажем, автомобиль. Мой положительный набор данных довольно мал, всего 2500~ изображений.
Data Science
Вопрос или проблема Когда я конвертирую модель Efficient net v2 m из Pytorch в Onnx с входами разных размеров, я замечаю странное и необъяснимое поведение. Я надеялся найти объяснение своим наблюдениям в сообществе. На моем RTX 4090 модель ONNX на изображении
Data Science
Вопрос или проблема Я очень нов в (односторонних, стандартных) РНН и моделировании последовательностей в целом, и все, что я понял о мотивации соединения между двумя последовательными скрытыми слоями/активациями, это то, что: это соединение необходимо
Data Science
Вопрос или проблема Я создал две разные модели для прогноза нагрузки. Датасет имеет шесть признаков. Метрика оценки производительности – это средняя абсолютная процентная ошибка (MAPE). Обе модели основаны на LSTM. Вот первая модель и ее производительность.