Data Science
Способ инициализации векторного представления предложений для несп supervised кластеризации текста, лучше чем GloVe wordvec?
00
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Тонкая настройка с использованием предобученной модели всегда лучше, чем обучение с нуля?
00
Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели
Data Science
Классификация последовательных данных
00
Вопрос или проблема В настоящее время я пытаюсь классифицировать дискретные последовательные данные на пять классов с помощью машинного обучения. Настройка следующая: Фактический объект заполнен различными свойствами, но для разделения объектов и назначения
Data Science
Плохая работа архитектуры кодировщика-декодировщика на основе внимания для заполнения слотов
00
Вопрос или проблема В настоящее время я провожу исследование методов, которые решают проблемы классификации намерений и заполнения слотов в NLP. Одним из подходов, с которым я решил начать эксперименты, предложен в следующей статье: https://arxiv.
Data Science
Как удалить фоновый (водяной знак) логотип с изображения
00
Вопрос или проблема Я уже какое-то время ломаю голову. У меня есть отсканированный PDF-документ с текстом и логотипом на заднем фоне, как на изображении ниже. Я хочу сделать оптическое распознавание текста (OCR), но это становится очень сложным из-за логотипа.
Data Science
Новооткрытое правило обучения
00
Вопрос или проблема Кто-нибудь знает, как этот алгоритм выполняет процесс обучения для нейронных сетей? Я наткнулся на это решение. Оно работает, но я не знаю, как и почему. Это нейронно-локально и работает без ошибок или обратного распространения.
Data Science
Рассчитайте важность входных полос данных для классификации изображений с помощью CNN?
00
Вопрос или проблема Я построил и обучил сверточную нейронную сеть, используя Keras в R с бэкендом TensorFlow. Я подаю сети многоспектральные изображения для простой классификации изображений. Существует ли способ рассчитать, какие из входных полос были
Data Science
Тренируйтесь на нескольких доменах, затем донастройтесь на конкретном домене.
00
Вопрос или проблема Имеет ли смысл сначала обучить модель на изображениях из нескольких доменов, а затем провести “тонкую настройку” на одном конкретном домене, чтобы улучшить ее производительность на этом домене? Например, можно обучить детектор
Data Science
Реализация Cat2Vec X = категориальный, y = категориальный
00
Вопрос или проблема Я пытаюсь преобразовать категориальные значения (почтовые индексы) с помощью Cat2Vec в матрицу, которая может быть использована в качестве входной формы для категориального прогнозирования целевой переменной с бинарными значениями.
Data Science
LSTM с входом фактического временного шага
00
Вопрос или проблема Я работаю над реализацией нейронной сети LSTM для прогнозирования потребления энергии. У меня есть набор данных с нагрузкой, рядами погодных параметров и индикатором выходного дня или нет. Сначала я создал сеть с входом в 24 лага (используя
Data Science
Модель Tensorflow работает для классификации, но не для регрессии (все предсказания равны смещению выходного слоя).
00
Вопрос или проблема Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется
Data Science
Это хороший способ использовать отдельный валидационный набор с k-кратной перекрестной проверкой?
00
Вопрос или проблема Я обучаю CNN, и я разделил набор данных на 70% для обучения, 20% для валидации и 10% для тестирования. Я хочу использовать этот набор валидации для ранней остановки, чтобы избежать переобучения модели на каждой итерации обучения.
Data Science
Динамически удалять данные из обучающего набора данных
00
Вопрос или проблема Сегодня мне пришло в голову, что было бы неплохим подходом динамически удалять данные из обучающего набора при обучении нейронной сети. Предполагая задачу классификации, подход мог бы быть таким: Обучить сеть на эпоху.
Data Science
Обратное распространение ошибки сверточной нейронной сети – путаница
00
Вопрос или проблема Я уже прочитал много статей на эту тему, и Градиентный спуск в свёрточных нейронных сетях от Jefkine кажется самым лучшим. Хотя, как сказал автор, Для простоты мы будем рассматривать случай, когда входное изображение является grayscale, т.
Data Science
Суммирование самовнимания и потеря информации
00
Вопрос или проблема В самовнимании внимание для слова вычисляется следующим образом: $$ A(q, K, V) = \sum_{i} \frac{exp(q.k^{<i>})}{\sum_{j} exp(q.k^{<j>})}v^{<i>} $$ Мой вопрос: почему мы суммируем векторы множественночности * Значение.
Data Science
Отрицательные примеры для нейронной сети классификации изображений “Да/Нет”
00
Вопрос или проблема Я пытаюсь переобучить нейронную сеть с использованием трансферного обучения, чтобы она могла классифицировать, есть ли на изображении определенный объект, скажем, автомобиль. Мой положительный набор данных довольно мал, всего 2500~ изображений.
Data Science
Модель Efficient Net V2 M ONNX выводит значительно медленнее на небольшом входе.
00
Вопрос или проблема Когда я конвертирую модель Efficient net v2 m из Pytorch в Onnx с входами разных размеров, я замечаю странное и необъяснимое поведение. Я надеялся найти объяснение своим наблюдениям в сообществе. На моем RTX 4090 модель ONNX на изображении
Data Science
Почему бы нам не обновлять параметры активации в RNN постепенно от одной активации к следующей, по мере того как сеть учится больше?
00
Вопрос или проблема Я очень нов в (односторонних, стандартных) РНН и моделировании последовательностей в целом, и все, что я понял о мотивации соединения между двумя последовательными скрытыми слоями/активациями, это то, что: это соединение необходимо
Data Science
Как я могу объяснить причины различной производительности для двух различных моделей LSTM и улучшить производительность?
00
Вопрос или проблема Я создал две разные модели для прогноза нагрузки. Датасет имеет шесть признаков. Метрика оценки производительности – это средняя абсолютная процентная ошибка (MAPE). Обе модели основаны на LSTM. Вот первая модель и ее производительность.
Data Science
LeNet-5 – комбинирование карт признаков в слое C3
00
Вопрос или проблема Известная архитектура LeNet-5 выглядит так: Выход слоя S2 имеет размер: 10x10x6 – в основном это изображение с 6 сверточными операциями, примененными к нему для извлечения признаков. Если бы каждое измерение снова отправили на