rnn - ответы на вопросы

Data Science

00

Вопрос или проблема Как выбрать архитектуру нейронной сети? Примеры: «Что если мне нужно переводить слова?» «Генерировать текст, изображения?» «Играть в обычную игру?» «Играть в игру, которая меняется в зависимости от действий игрока, то есть нейронная

Data Science

Существует ли математическая верификация для TBPTT (усечённого обратного распространения ошибки через время)?

00

Вопрос или проблема Мой вопрос в заголовке. В настоящее время я ищу публикацию или академическую ссылку на этот алгоритм, даже в новом контексте. Спасибо за все возможные ответы, Обрезанная обратная пропаганда во времени (truncated BPTT) является широко

Data Science

МЛ. Как заставить нейронную сеть запоминать контекст и данные?

00

Вопрос или проблема Я хочу, чтобы нейронная сеть могла запоминать, но перцептрон может запоминать что-то только во время обучения. Я хочу, чтобы нейронная сеть адаптировалась к новым условиям без повторного обучения, например, если я сказал, что меня

Data Science

Какие уравнения участвуют в расчете параметров слоя внедрения?

00

Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”

Data Science

Имя слоя Keras функционального API не зафиксировано с оберткой TimeDistributed

00

Вопрос или проблема class Net2: @staticmethod def build_cat_branch(inputs,category_size): x = TimeDistributed(Dense(category_size))(inputs) x = Activation('softmax', name="cat_output")(x) return x @staticmethod def build_t_branch(inputs): x = TimeDistributed(Dense(1

Data Science

RNN работает хуже, чем случайные угадывания на больших наборах данных.

00

Вопрос или проблема Я должен начать с того, что я здесь 100% новичок. Я обучал модель RNN на наборе данных из 30 классов с более чем 90000 образцов, и она достигла менее 2% точности. Обучив ту же модель на небольшом подмножестве тех же данных (только

Data Science

ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора, используя генератор.

00

Вопрос или проблема Я пытаюсь подогнать модель с использованием генератора и получаю следующую ошибку: ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора. Полученные входы: [<tf.Tensor 'IteratorGetNext:0' shape=(None, None) dtype=float32>

Data Science

Размер пакета против нейронов LSTM в скрытом слое

00

Вопрос или проблема Я нашел очень хорошее объяснение о итерациях и batch_size, опубликованное здесь много лет назад пользователем @Djib2011. Теперь у меня есть вопрос. Если batch_size (5) строк (1-5) были переданы пяти ячейкам LSTM (1-5) для пяти итераций

Data Science

Понимание размеров входных и выходных данных для Embeddings

00

Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный

Data Science

LSTM Долгосрочные зависимости Keras

00

Вопрос или проблема Я знаком с единицей LSTM (ячейка памяти, затвор забывания, выходной затвор и т.д.), однако мне трудно понять, как это связано с реализацией LSTM в Keras. В Keras структура входных данных для X имеет вид: (nb_samples, timesteps, input_dim).

Data Science

BPTT против проблемы исчезающего градиента

00

Вопрос или проблема Я знаю, что BPTT — это метод применения обратного распространения к RNN. Он хорошо работает с RNN, так как останавливается в определённый момент, когда изменения приближаются к нулю. Но разве это не та же самая проблема исчезающего градиента?

Data Science

Моя LSTM имеет действительно низкую точность, есть ли способ её улучшить?

00

Вопрос или проблема Я пытаюсь создать модель для классификации, могут ли эти пациенты быть диагностированы с деменцией по их 35 дням биометрических данных. Краткое резюме набора данных приведено ниже. В качестве входных данных X_train он имеет 51 признак

Data Science

ValueError: Должен быть передан 2-мерный ввод. форма=(15129, 10, 1)

00

Вопрос или проблема У меня проблема с преобразованием DataFrame, после того как я сделал это train_dane_rnn = np.reshape(train_dane, (train_dane.shape[0], train_dane.shape[1], 1)) test_dane_rnn = np.reshape(test_dane, (test_dane.

Data Science

Интуиция за скрытым состоянием RNN/LSTM?

00

Вопрос или проблема Какова интуиция, стоящая за скрытыми состояниями RNN/LSTM? Похожи ли они на скрытые состояния HMM (скрытая модель Маркова)? Лично я не думаю, что их можно сравнить со скрытым состоянием модели Маркова. Одно из ключевых отличий заключается

Data Science

Сгруппировка событий в последовательности

00

Вопрос или проблема У меня есть последовательность повторяющихся событий, которые я хотел бы сгруппировать для представления различных операционных активностей основного процесса. Эти события могут происходить в определенном порядке или нет.

Data Science

Как отключить предупреждение libtorch

00

Вопрос или проблема Недавно я развернул программу, используя libtorch (C++ API для PyTorch). Программа работала как ожидалось, но выдала предупреждение. Предупреждение: Веса модуля RNN не являются частью единого непрерывного блока памяти.

Data Science

Цель LSTM также является одним из его входов?

00

Вопрос или проблема У меня есть два входных массива, которые включают как исторические, так и прогнозируемые данные, и один входной массив, который имеет только исторические данные. Я пытаюсь предсказать (или “сделать прогноз”

Data Science

Однократное кодирование в качестве входа для рекуррентных нейронных сетей

00

Вопрос или проблема Я пытаюсь предсказать следующую метку в шаблоне на основе предыдущих меток, используя рекуррентную нейронную сеть. У меня в общей сложности 100 меток. Пример входного шаблона: 1) апельсин, яблоко, банан, лимон ->

Data Science

должен ли я изменить набор данных, чтобы использовать его для регрессии временных рядов с RNN/LSTM?

00

Вопрос или проблема Я вижу этот учебник, чтобы узнать, как использовать LSTM для прогнозирования временных рядов, и заметил, что он сдвинул целевую/метки вверх, чтобы все признаки были на момент времени t, а целевая величина –

Data Science

Правильно ли давать RNN более длинный контекст, чем у него был во время обучения?

00

Вопрос или проблема RNN предоставляют возможность генерировать бесконечное количество токенов. Но если я обучу его на временной длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрезаю контекст во