Data Science
Как выбрать архитектуру нейронной сети?
00
Вопрос или проблема Как выбрать архитектуру нейронной сети? Примеры: «Что если мне нужно переводить слова?» «Генерировать текст, изображения?» «Играть в обычную игру?» «Играть в игру, которая меняется в зависимости от действий игрока, то есть нейронная
Data Science
Существует ли математическая верификация для TBPTT (усечённого обратного распространения ошибки через время)?
00
Вопрос или проблема Мой вопрос в заголовке. В настоящее время я ищу публикацию или академическую ссылку на этот алгоритм, даже в новом контексте. Спасибо за все возможные ответы, Обрезанная обратная пропаганда во времени (truncated BPTT) является широко
Data Science
МЛ. Как заставить нейронную сеть запоминать контекст и данные?
00
Вопрос или проблема Я хочу, чтобы нейронная сеть могла запоминать, но перцептрон может запоминать что-то только во время обучения. Я хочу, чтобы нейронная сеть адаптировалась к новым условиям без повторного обучения, например, если я сказал, что меня
Data Science
Какие уравнения участвуют в расчете параметров слоя внедрения?
00
Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”
Data Science
Имя слоя Keras функционального API не зафиксировано с оберткой TimeDistributed
00
Вопрос или проблема class Net2: @staticmethod def build_cat_branch(inputs,category_size): x = TimeDistributed(Dense(category_size))(inputs) x = Activation('softmax', name="cat_output")(x) return x @staticmethod def build_t_branch(inputs): x = TimeDistributed(Dense(1
Data Science
RNN работает хуже, чем случайные угадывания на больших наборах данных.
00
Вопрос или проблема Я должен начать с того, что я здесь 100% новичок. Я обучал модель RNN на наборе данных из 30 классов с более чем 90000 образцов, и она достигла менее 2% точности. Обучив ту же модель на небольшом подмножестве тех же данных (только
Data Science
ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора, используя генератор.
00
Вопрос или проблема Я пытаюсь подогнать модель с использованием генератора и получаю следующую ошибку: ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора. Полученные входы: [<tf.Tensor 'IteratorGetNext:0' shape=(None, None) dtype=float32>
Data Science
Размер пакета против нейронов LSTM в скрытом слое
00
Вопрос или проблема Я нашел очень хорошее объяснение о итерациях и batch_size, опубликованное здесь много лет назад пользователем @Djib2011. Теперь у меня есть вопрос. Если batch_size (5) строк (1-5) были переданы пяти ячейкам LSTM (1-5) для пяти итераций
Data Science
Понимание размеров входных и выходных данных для Embeddings
00
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
LSTM Долгосрочные зависимости Keras
00
Вопрос или проблема Я знаком с единицей LSTM (ячейка памяти, затвор забывания, выходной затвор и т.д.), однако мне трудно понять, как это связано с реализацией LSTM в Keras. В Keras структура входных данных для X имеет вид: (nb_samples, timesteps, input_dim).
Data Science
BPTT против проблемы исчезающего градиента
00
Вопрос или проблема Я знаю, что BPTT — это метод применения обратного распространения к RNN. Он хорошо работает с RNN, так как останавливается в определённый момент, когда изменения приближаются к нулю. Но разве это не та же самая проблема исчезающего градиента?
Data Science
Моя LSTM имеет действительно низкую точность, есть ли способ её улучшить?
00
Вопрос или проблема Я пытаюсь создать модель для классификации, могут ли эти пациенты быть диагностированы с деменцией по их 35 дням биометрических данных. Краткое резюме набора данных приведено ниже. В качестве входных данных X_train он имеет 51 признак
Data Science
ValueError: Должен быть передан 2-мерный ввод. форма=(15129, 10, 1)
00
Вопрос или проблема У меня проблема с преобразованием DataFrame, после того как я сделал это train_dane_rnn = np.reshape(train_dane, (train_dane.shape[0], train_dane.shape[1], 1)) test_dane_rnn = np.reshape(test_dane, (test_dane.
Data Science
Интуиция за скрытым состоянием RNN/LSTM?
00
Вопрос или проблема Какова интуиция, стоящая за скрытыми состояниями RNN/LSTM? Похожи ли они на скрытые состояния HMM (скрытая модель Маркова)? Лично я не думаю, что их можно сравнить со скрытым состоянием модели Маркова. Одно из ключевых отличий заключается
Data Science
Сгруппировка событий в последовательности
00
Вопрос или проблема У меня есть последовательность повторяющихся событий, которые я хотел бы сгруппировать для представления различных операционных активностей основного процесса. Эти события могут происходить в определенном порядке или нет.
Data Science
Как отключить предупреждение libtorch
00
Вопрос или проблема Недавно я развернул программу, используя libtorch (C++ API для PyTorch). Программа работала как ожидалось, но выдала предупреждение. Предупреждение: Веса модуля RNN не являются частью единого непрерывного блока памяти.
Data Science
Цель LSTM также является одним из его входов?
00
Вопрос или проблема У меня есть два входных массива, которые включают как исторические, так и прогнозируемые данные, и один входной массив, который имеет только исторические данные. Я пытаюсь предсказать (или “сделать прогноз”
Data Science
Однократное кодирование в качестве входа для рекуррентных нейронных сетей
00
Вопрос или проблема Я пытаюсь предсказать следующую метку в шаблоне на основе предыдущих меток, используя рекуррентную нейронную сеть. У меня в общей сложности 100 меток. Пример входного шаблона: 1) апельсин, яблоко, банан, лимон ->
Data Science
должен ли я изменить набор данных, чтобы использовать его для регрессии временных рядов с RNN/LSTM?
00
Вопрос или проблема Я вижу этот учебник, чтобы узнать, как использовать LSTM для прогнозирования временных рядов, и заметил, что он сдвинул целевую/метки вверх, чтобы все признаки были на момент времени t, а целевая величина –
Data Science
Правильно ли давать RNN более длинный контекст, чем у него был во время обучения?
00
Вопрос или проблема RNN предоставляют возможность генерировать бесконечное количество токенов. Но если я обучу его на временной длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрезаю контекст во