Data Science
Правильно ли давать RNN более длинный контекст, чем у нее был во время обучения?
00
Вопрос или проблема РНН обеспечивают возможность генерировать бесконечное количество токенов. Но если я обучу его на длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрежу контекст до той длины, на
Data Science
Обучение макета страницы документа и классификация хороших/плохих макетов
00
Вопрос или проблема У меня есть случай использования, в котором мне нужно получить координаты каждого блочного элемента на странице (будь то параграф, изображение, таблица), где я обучаю модель, чтобы понять, как они располагаются на данной странице
Data Science
Функция потерь Seq2Seq
00
Вопрос или проблема Я читал статью neural_approach_conversational_ai.pdf. И в разделе Seq2Seq для генерации текста есть формула, которая, на мой взгляд, немного неправильная [1]: https://i.sstatic.net/sX0it.png Может кто-то помочь мне подтвердить эту формулу?
Data Science
Как я могу преобразовать свои предсказания в текст после предсказания с использованием RNN?
00
Вопрос или проблема Я создаю теггер частей речи для нашего языка. Я передаю токены слова и теги, используя Tokenizer(). Функции для слова и тега разные. # кодировать Y tag_tokenizer = Tokenizer() tag_tokenizer.fit_on_texts(tags) Y_encoded = tag_tokenizer.
Data Science
Почему моя нейронная языковая модель работает так плохо?
00
Вопрос или проблема Я пытаюсь создать генератор хайку на уровне слов с использованием нейронной сети LSTM. Я собираю хайку с Reddit в r/haiku и хотел начать с “простой” модели: мои тренировочные данные – это набор всех хайку, выровненный
Data Science
Контекстная коррекция орфографии
00
Вопрос или проблема Я хочу создать проверку правописания, которая исправляет орфографические ошибки с учетом контекста. Например, Ошибочное предложение: Я хочу подать заявку на кредит корзину Исправленное предложение: Я хочу подать заявку на кредит карту
Data Science
Как применить другую функцию потерь к одной конкретной метке?
00
Вопрос или проблема Я создал рекуррентную нейронную сеть в Keras, которая классифицирует по 14 меткам. Первая метка является самой важной и должна предсказываться с наибольшей точностью. Остальные метки не обязательно должны быть очень точными, они должны
Data Science
Бинарная классификация с использованием RNN не превышает 50% точности.
00
Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <
Data Science
Обучение нейронной сети для регрессии с гауссовым выходным слоем
00
Вопрос или проблема Как обучить модель нейронной сети, которая выполняет регрессию по реальным значениям, используя гауссовский выходной слой? То есть оценивать параметры среднего и стандартного отклонения предсказания. Поскольку во время тренировки будет
Data Science
Точность и потеря в МЛП
00
Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.
Data Science
Как объединить данные с похожим распределением?
00
Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.
Data Science
Моя модель LSTM RNN всегда выдает один и тот же результат для каждого предсказания, что я могу сделать?
00
Вопрос или проблема У меня есть набор данных с траекториями (несколько массивов с плавающей точкой), которые я хочу классифицировать (0 или 1, в зависимости от типа траектории). features = np.column_stack(( sat.inclinations, sat.
Data Science
Как представить количество нейронов в LSTM для схемы архитектуры?
00
Вопрос или проблема Я пытаюсь визуализировать схему нейронной сети и нашел отличный инструмент для создания схем здесь http://alexlenail.me/NN-SVG/index.html. Я отредактировал файл SVG, чтобы изменить один из плотных слоев на слой LSTM, а входные данные
Data Science
Почему бы нам не обновлять параметры активации в RNN постепенно от одной активации к следующей, по мере того как сеть учится больше?
00
Вопрос или проблема Я очень нов в (односторонних, стандартных) РНН и моделировании последовательностей в целом, и все, что я понял о мотивации соединения между двумя последовательными скрытыми слоями/активациями, это то, что: это соединение необходимо
Data Science
Почему фильтр необходимо применять к выходу входного затвора, прежде чем добавлять состояние ячейки?
00
Вопрос или проблема В нейронной сети есть 4 двери: входная, выходная, забывающая и дверь, выход которого выполняет поэлементное умножение с выходом входной двери, который добавляется к состоянию ячейки (я не знаю названия этой двери, но это та, что на
Data Science
Оптимальная настройка ввода для классификации текста на уровне символов с использованием RNN
00
Вопрос или проблема Я хочу классифицировать текстовые образцы длиной 500 символов на предмет того, похожи ли они на естественный язык, с помощью рекуррентной нейронной сети на уровне символов. Я не уверен, как лучше всего подавать входные данные в РНН.
Data Science
Количество двунаправленных LSTM в модели энкодер-декодер равно максимальной длине входного текста/символов?
00
Вопрос или проблема Я слегка запутался в этом аспекте RNN, пытаясь понять, как работает seq2seq кодер-декодер на https://machinelearningmastery.com/configure-encoder-decoder-model-neural-machine-translation/. Мне кажется, что количество LSTM в кодере
Data Science
Генерация текстов на уровне слов с использованием векторных представлений слов – вывод векторного слова вместо распределения вероятностей.
00
Вопрос или проблема Сейчас я изучаю тему генерации текста для своего университетского проекта. Я (конечно) решил использовать RNN, принимая последовательность токенов на входе с целью предсказать следующий токен, исходя из этой последовательности.
Data Science
Различие между слоями внимания и полностью связанными слоями в глубоком обучении
00
Вопрос или проблема За последние несколько лет было несколько публикаций по так называемому механизму “Внимания” в глубоком обучении (например, 1 2). Концепция заключается в том, что мы хотим, чтобы нейронная сеть сосредоточилась или обратила
Data Science
Предсказание следующего числа в последовательности – анализ данных
00
Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие