rnn - ответы на вопросы - Page 2 of 3

Data Science

Правильно ли давать RNN более длинный контекст, чем у нее был во время обучения?

00

Вопрос или проблема РНН обеспечивают возможность генерировать бесконечное количество токенов. Но если я обучу его на длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрежу контекст до той длины, на

Data Science

Обучение макета страницы документа и классификация хороших/плохих макетов

00

Вопрос или проблема У меня есть случай использования, в котором мне нужно получить координаты каждого блочного элемента на странице (будь то параграф, изображение, таблица), где я обучаю модель, чтобы понять, как они располагаются на данной странице

Data Science

Функция потерь Seq2Seq

00

Вопрос или проблема Я читал статью neural_approach_conversational_ai.pdf. И в разделе Seq2Seq для генерации текста есть формула, которая, на мой взгляд, немного неправильная [1]: https://i.sstatic.net/sX0it.png Может кто-то помочь мне подтвердить эту формулу?

Data Science

Как я могу преобразовать свои предсказания в текст после предсказания с использованием RNN?

00

Вопрос или проблема Я создаю теггер частей речи для нашего языка. Я передаю токены слова и теги, используя Tokenizer(). Функции для слова и тега разные. # кодировать Y tag_tokenizer = Tokenizer() tag_tokenizer.fit_on_texts(tags) Y_encoded = tag_tokenizer.

Data Science

Почему моя нейронная языковая модель работает так плохо?

00

Вопрос или проблема Я пытаюсь создать генератор хайку на уровне слов с использованием нейронной сети LSTM. Я собираю хайку с Reddit в r/haiku и хотел начать с “простой” модели: мои тренировочные данные – это набор всех хайку, выровненный

Data Science

Контекстная коррекция орфографии

00

Вопрос или проблема Я хочу создать проверку правописания, которая исправляет орфографические ошибки с учетом контекста. Например, Ошибочное предложение: Я хочу подать заявку на кредит корзину Исправленное предложение: Я хочу подать заявку на кредит карту

Data Science

Как применить другую функцию потерь к одной конкретной метке?

00

Вопрос или проблема Я создал рекуррентную нейронную сеть в Keras, которая классифицирует по 14 меткам. Первая метка является самой важной и должна предсказываться с наибольшей точностью. Остальные метки не обязательно должны быть очень точными, они должны

Data Science

Бинарная классификация с использованием RNN не превышает 50% точности.

00

Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <

Data Science

Обучение нейронной сети для регрессии с гауссовым выходным слоем

00

Вопрос или проблема Как обучить модель нейронной сети, которая выполняет регрессию по реальным значениям, используя гауссовский выходной слой? То есть оценивать параметры среднего и стандартного отклонения предсказания. Поскольку во время тренировки будет

Data Science

Точность и потеря в МЛП

00

Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.

Data Science

Как объединить данные с похожим распределением?

00

Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.

Data Science

Моя модель LSTM RNN всегда выдает один и тот же результат для каждого предсказания, что я могу сделать?

00

Вопрос или проблема У меня есть набор данных с траекториями (несколько массивов с плавающей точкой), которые я хочу классифицировать (0 или 1, в зависимости от типа траектории). features = np.column_stack(( sat.inclinations, sat.

Data Science

Как представить количество нейронов в LSTM для схемы архитектуры?

00

Вопрос или проблема Я пытаюсь визуализировать схему нейронной сети и нашел отличный инструмент для создания схем здесь http://alexlenail.me/NN-SVG/index.html. Я отредактировал файл SVG, чтобы изменить один из плотных слоев на слой LSTM, а входные данные

Data Science

Почему бы нам не обновлять параметры активации в RNN постепенно от одной активации к следующей, по мере того как сеть учится больше?

00

Вопрос или проблема Я очень нов в (односторонних, стандартных) РНН и моделировании последовательностей в целом, и все, что я понял о мотивации соединения между двумя последовательными скрытыми слоями/активациями, это то, что: это соединение необходимо

Data Science

Почему фильтр необходимо применять к выходу входного затвора, прежде чем добавлять состояние ячейки?

00

Вопрос или проблема В нейронной сети есть 4 двери: входная, выходная, забывающая и дверь, выход которого выполняет поэлементное умножение с выходом входной двери, который добавляется к состоянию ячейки (я не знаю названия этой двери, но это та, что на

Data Science

Оптимальная настройка ввода для классификации текста на уровне символов с использованием RNN

00

Вопрос или проблема Я хочу классифицировать текстовые образцы длиной 500 символов на предмет того, похожи ли они на естественный язык, с помощью рекуррентной нейронной сети на уровне символов. Я не уверен, как лучше всего подавать входные данные в РНН.

Data Science

Количество двунаправленных LSTM в модели энкодер-декодер равно максимальной длине входного текста/символов?

00

Вопрос или проблема Я слегка запутался в этом аспекте RNN, пытаясь понять, как работает seq2seq кодер-декодер на https://machinelearningmastery.com/configure-encoder-decoder-model-neural-machine-translation/. Мне кажется, что количество LSTM в кодере

Data Science

Генерация текстов на уровне слов с использованием векторных представлений слов – вывод векторного слова вместо распределения вероятностей.

00

Вопрос или проблема Сейчас я изучаю тему генерации текста для своего университетского проекта. Я (конечно) решил использовать RNN, принимая последовательность токенов на входе с целью предсказать следующий токен, исходя из этой последовательности.

Data Science

Различие между слоями внимания и полностью связанными слоями в глубоком обучении

00

Вопрос или проблема За последние несколько лет было несколько публикаций по так называемому механизму “Внимания” в глубоком обучении (например, 1 2). Концепция заключается в том, что мы хотим, чтобы нейронная сеть сосредоточилась или обратила

Data Science

Предсказание следующего числа в последовательности – анализ данных

00

Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие