Data Science
Производит ли нейронная сеть Word2Vec с методом skip-gram даже контекстные слова?
00
Вопрос или проблема Сначала позвольте мне установить, что такое CBoW и skip-gram. Вы можете пропустить этот раздел, если считаете его ненужным. Фон Мое понимание состоит в том, что Word2Vec представляет собой набор из двух алгоритмов: непрерывный мешок
Data Science
Как предсказать значение преимущества в глубоком обучении с подкреплением
00
Вопрос или проблема В данный момент я работаю над коллекцией алгоритмов обучения с подкреплением: https://github.com/lhk/rl_gym Для глубокого Q-обучения необходимо вычислить Q-значения, которые должны предсказываться вашей сетью.
Data Science
Извлечение иерархических признаков в моделях многослойного перцептрона
00
Вопрос или проблема Я говорю о простых нейронных сетях, МЛП. Я прочитал статью Глорот и Бенгио (2010), Понимание сложности обучения глубоких прямых нейронных сетей. В ней я прочитал интересное утверждение: «Методы глубокого обучения стремятся к обучению
Data Science
Классификатор Keras возвращает аналогичный вывод для всех предсказаний.
00
Вопрос или проблема Я завершил обучение модели с точностью 1.000 и валидационной точностью 0.9565. К сожалению, каждый раз, когда я ввожу изображение в свою модель, я получаю один и тот же результат независимо от изображения. Я делаю что-то не так при
Data Science
Подход нейронной сети к эффекту коктейльной вечеринки
00
Вопрос или проблема Представьте, что у вас есть 2 человека у 2 разных микрофонов, но в одной комнате. Каждый микрофон будет улавливать звук от другого человека. Существует ли хороший подход на основе нейронных сетей для изоляции сигналов, чтобы звук от
Data Science
Почему производные второго порядка функции потерь ненулевые, когда задействованы линейные комбинации?
00
Вопрос или проблема Я работаю над реализацией метода Ньютона для выполнения градиентного спуска второго порядка в нейронной сети и испытываю трудности с вычислением производных второго порядка. Я понимаю, что на практике вычисление Гессиана (и его обратной
Data Science
должен ли я изменить набор данных, чтобы использовать его для регрессии временных рядов с RNN/LSTM?
00
Вопрос или проблема Я вижу этот учебник, чтобы узнать, как использовать LSTM для прогнозирования временных рядов, и заметил, что он сдвинул целевую/метки вверх, чтобы все признаки были на момент времени t, а целевая величина –
Data Science
Запуск LSTM с музыкальными данными
00
Вопрос или проблема Я работаю над проектом для класса, в котором пытаюсь создать алгоритм, который изучает музыку и создает свою собственную музыку. У меня есть проблемы с тем, как организовать данные для ввода в LSTM. Один пример для обучения состоит
Data Science
Ошибка Keras “Не удалось найти адаптер данных, который может обработать входные данные” при попытке обучить модель
00
Вопрос или проблема Я следую за учебным пособием по обучению модели и столкнулся с ошибкой, решение которой мне не удалось найти. Код для обучения модели приведен ниже: import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.
Data Science
Отношение между сигмоидальной и гауссовой распределениями
00
Вопрос или проблема Я читал эту статью, где я наткнулся на следующее утверждение в контексте “Почему мы используем сигмоидную функцию активации в нейронных сетях?”: Предположение о том, что зависимая переменная следует сигмоидной функции
Data Science
Моделирование с помощью нейронных сетей
00
Вопрос или проблема Предположим, что существует коллекция физических параметров и коллекция выходных переменных, которые могут зависеть от физических параметров. Пример в обучающем наборе данных состоит из вектора с фактическими измерениями физических
Data Science
Применение активации на части слоя в Keras
00
Вопрос или проблема Контекст Я пытаюсь реализовать алгоритм YOLO в Keras. Вот что у меня есть на данный момент: i = Input(shape=(image_height,image_width, image_channels)) rescaled = Rescaling(1./255)(i) x = Conv2D(16, (1, 1))(rescaled) x = Conv2D(32
Data Science
Обратное распространение: Значение сигнала ошибки нейрона
00
Вопрос или проблема Во время моего стремления понять обратное распространение ошибки более строго я наткнулся на определение сигнала ошибки нейрона, которое определяется следующим образом для $j^{\text{th}}$ нейрона в $l^{\text{th}}$ слое: \begin{eqnarray}
Data Science
KLMS в машинном обучении
00
Вопрос или проблема Поскольку метод наименьших средних квадратов является очень популярным выбором для использования в комбинации с топологиями нейронных сетей, какие алгоритмы машинного обучения (и легко) можно комбинировать с Kernel Least Mean Square?
Data Science
Использование временных рядов для предсказания другой переменной.
00
Вопрос или проблема Я хотел бы проанализировать данные о вращении головы в пространстве. Для этого я измерял вращение вокруг углов X, Y и Z с частотой 15 Гц в течение чуть больше десяти минут. Я хотел бы использовать эти движения, чтобы проанализировать
Data Science
NN быстро сходится, но является ли это проблемой, если производительность хороша на тестовом наборе?
00
Вопрос или проблема У меня есть модель LSTM, которую я использую для прогнозирования временных рядов. В процессе обучения она сходится уже после 3 эпох. Модель показывает довольно хорошие результаты на тестовых данных, но стоит ли мне по-прежнему беспокоиться
Data Science
Почему онлайн-обучение «значительно быстрее» полных батчей? – Нейронные сети
00
Вопрос или проблема Я не совсем понимаю, потому что это одно и то же вычисление. Или, может быть, я не очень хорошо понимаю пакетную обработку. Это зависит от определения полной пакетной обработки и онлайн-обучения. Если полная пакетная обработка определяется
Data Science
В механизме внимания почему мы не нормализуем после умножения значений?
00
Вопрос или проблема Как говорит этот вопрос: В масштабированном внимании на основе скалярного произведения мы масштабируем наши выходные значения, деля скалярное произведение на квадратный корень из размерности матрицы: Причина, по которой это делается
Data Science
Кривая потерь теста глубокого обучения не снижается.
00
Вопрос или проблема Я работаю над проектами глубокого обучения для текущего проекта, над которым я сейчас работаю, и это в основном задача классификации временных рядов. Дано множество временных рядов данных, мне нужно классифицировать клиентов как честных или нечестных.
Data Science
Почему 100%-ная точность на тестовых данных не является хорошей?
00
Вопрос или проблема Мне задали этот вопрос на собеседовании, и я не смог дать удовлетворительный ответ не только по ожиданиям интервьюеров, но и по своим собственным. Вопрос был как выше, только он позже привел пример, почему, если моя модель предсказала