sequence-to-sequence
Data Science
Вопрос или проблема Я читал статью neural_approach_conversational_ai.pdf. И в разделе Seq2Seq для генерации текста есть формула, которая, на мой взгляд, немного неправильная [1]: https://i.sstatic.net/sX0it.png Может кто-то помочь мне подтвердить эту формулу?
Data Science
Вопрос или проблема Может кто-нибудь указать мне на статью, в которой объясняется, как проходит обучение модели в Seq2Seq? Я знаю, что используется “Teacher Forcing”, но то, что я нашел до сих пор, недостаточно подробно.
Data Science
Вопрос или проблема Я пытаюсь создать сеть кодировщик-декодировщик в Keras для генерации предложения определённого стиля. Так как моя задача является неконтролируемой, то есть у меня нет эталонных данных для сгенерированных предложений, я использую классификатор
Data Science
Вопрос или проблема Я новичок в машинном обучении и работаю над проектом, где мне дана последовательность целых чисел, все из которых находятся в диапазоне от 0 до 70. Моя цель — предсказать следующее целое число в последовательности, зная предыдущие
Data Science
Вопрос или проблема Кажется, что в ванильных трансформерах (например, AIAYN) во время инференса скрытые состояния генерируются для всех токенов во входной последовательности, но только последнее используется для предсказания следующего токена.
Data Science
Вопрос или проблема Допустим, у меня есть 3 плотные последовательности одинаковой длины. Должен ли я подгонять масштабировщик по ним отдельно или вместе? import numpy as np from sklearn.preprocessing import StandardScaler arr = np.
Data Science
Вопрос или проблема Я реализую модель последовательность-в-последовательность с архитектурой RNN-VAE и использую механизм внимания. У меня проблема в части декодирования. Я сталкиваюсь с этой ошибкой: IndexError: list index out of range Когда я запускаю