Data Science
Функция потерь Seq2Seq
00
Вопрос или проблема Я читал статью neural_approach_conversational_ai.pdf. И в разделе Seq2Seq для генерации текста есть формула, которая, на мой взгляд, немного неправильная [1]: https://i.sstatic.net/sX0it.png Может кто-то помочь мне подтвердить эту формулу?
Data Science
Обучение модели Seq2Seq: Кодировщик против Декодировщика
00
Вопрос или проблема Может кто-нибудь указать мне на статью, в которой объясняется, как проходит обучение модели в Seq2Seq? Я знаю, что используется “Teacher Forcing”, но то, что я нашел до сих пор, недостаточно подробно.
Data Science
Керас: Вывод Softmax в слой вложений
00
Вопрос или проблема Я пытаюсь создать сеть кодировщик-декодировщик в Keras для генерации предложения определённого стиля. Так как моя задача является неконтролируемой, то есть у меня нет эталонных данных для сгенерированных предложений, я использую классификатор
Data Science
Предсказание следующего числа в последовательности – анализ данных
00
Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие
Data Science
Почему декодер генерирует все скрытые состояния во время вывода?
00
Вопрос или проблема Кажется, что в ванильных трансформерах (например, AIAYN) во время инференса скрытые состояния генерируются для всех токенов во входной последовательности, но только последнее используется для предсказания следующего токена.
Data Science
Предобработка многогрупповых временных рядов: кодировать каждую выборку отдельно или в агрегированном виде?
00
Вопрос или проблема Допустим, у меня есть 3 плотные последовательности одинаковой длины. Должен ли я подгонять масштабировщик по ним отдельно или вместе? import numpy as np from sklearn.preprocessing import StandardScaler arr = np.
Data Science
IndexError: индекс списка вне диапазона
00
Вопрос или проблема Я реализую модель последовательность-в-последовательность с архитектурой RNN-VAE и использую механизм внимания. У меня проблема в части декодирования. Я сталкиваюсь с этой ошибкой: IndexError: list index out of range Когда я запускаю