Data Science
ValueError: Тензор Tensor(“activation_5/Softmax:0”, размер=(?, 2), тип=float32) не является элементом этого графа.
00
Вопрос или проблема Похоже, что есть проблема с предсказанием с использованием моей модели keras. Я обучал её с помощью следующего кода keras: model = Sequential() model.add(Conv2D(32, (3, 3), input_shape=(150, 150,3),padding='same')) model.
Data Science
Какова связь между точностью и потерями в глубоком обучении?
00
Вопрос или проблема Я создал три разные модели с использованием глубокого обучения для многоклассовой классификации, и каждая модель дала мне разные значения точности и потерь. Результаты тестирования моделей следующие: Первая модель: Точность: 98.
Data Science
Интерпретация кривой обучения – нейронная сеть
00
Вопрос или проблема Когда я запускаю свои три разные нейронные сети, я получаю следующие кривые обучения, используя MSE. Я считаю, что моя базовая модель в порядке и не переобучается и не недообучается. Более того, я считаю, что моя маленькая модель недообучается
Data Science
Вопрос о тренировочных данных в word2vec – skip-gram
00
Вопрос или проблема У меня есть очень простой вопрос относительно обучающей выборки в word2vec. В реализации skip-gram, обучающая выборка (если я правильно понимаю) генерируется в виде пар слов, как показано на этом изображении: Это, по сути, просто пары векторов one-hot.
Data Science
Keras очень низкая точность, насыщается после нескольких эпох во время обучения.
00
Вопрос или проблема Я совсем новичок в области науки о данных и сразу же начал работать с моделями TensorFlow. Ранее я работал с примерами, представленными на сайте. Это моя первая попытка реализовать проект с его использованием.
Data Science
LTSM плохо предсказывает колонку закрытия акций Apple.
00
Вопрос или проблема Я использую LSTM (долгая краткосрочная память) для прогнозирования цен закрытия акций Apple, используя данные о трех предыдущих днях. Моя проблема заключается в том, что модель недооценивает цены закрытия. Фотография конечного результата
Data Science
Автокодировщик не обучается на трансформации изображений в режиме walk forward.
00
Вопрос или проблема У меня есть серия из 15 кадров (60 строк x 50 столбцов). На протяжении этих 15 кадров луна движется от верхнего левого угла к нижнему правому углу. Данные = https://github.com/aiqc/AIQC/tree/main/remote_datum/image/liberty_moon Я пытаюсь
Data Science
Классификация изображений с помощью CNN на Python
00
Вопрос или проблема Я работаю над классификацией изображений, используя CNN. Мой набор данных содержит более 50 классов (50 папок), представляющих типы автомобильных деталей, и в каждой папке у нас есть марки автомобилей. В каждой папке с автомобилем
Data Science
Низкая точность на тестовом наборе
00
Вопрос или проблема У меня есть набор данных с 16 признаками и 32 метками классов, который демонстрирует следующее поведение: Классификация нейронной сетью: высокая точность на обучающих данных 100%, но низкая точность на тестовом наборе 3% (почти как
Data Science
Кодирование целевой переменной для обнаружения точек изменений временных рядов
00
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Моя собственная нейронная сеть сходится, но модель Keras – нет.
02
Вопрос или проблема В большинстве случаев все вероятно наоборот, но… Я реализовал базовую структуру многослойного перцептрона с обратным распространением. Мои данные представляют собой просто смещенную квадратную функцию с 100 образцами.
Data Science
LeakyReLU против PReLU
00
Вопрос или проблема Я думал, что и PReLU, и Leaky ReLU это: $$f(x) = \max(x, \alpha x) \qquad \text{ где } \alpha \in (0, 1)$$ Keras, однако, имеет обе функции в документации. Leaky ReLU Исходный код LeakyReLU: return K.relu(inputs, alpha=self.
Data Science
Классификация коротких строк текста с дополнительным контекстом
00
Вопрос или проблема У меня есть список коротких строк, каждая из которых определяет город. Орфографические ошибки очень распространены. Пример ниже показывает некоторые из этих коротких строк и правильный город, которому они должны соответствовать.
Data Science
Какую программу использовать для визуализации диаграммы нейронной сети и математических функций.
00
Вопрос или проблема Я пишу статью о машинном обучении, и мне нужно создать несколько диаграмм нейронных сетей и базовые математические функции, которые я описываю. Мне нужна программа для создания визуально приемлемых технических изображений, не тратя
Data Science
Модели последовательностей word2vec
00
Вопрос или проблема Я работаю с набором данных, который содержит более 100 000 записей. Вот как выглядят данные: email_id cust_id campaign_name 123 4567 World of Zoro 123 4567 Boho XYz 123 4567 Guess ABC 234 5678 Anniversary X 234 5678 World of Zoro 234
Data Science
Почему мы движемся в отрицательном направлении градиента в градиентном спуске?
00
Вопрос или проблема Говорят, что обратное распространение ошибки с градиентным спуском стремится минимизировать функцию затрат, используя формулу: $$ W_{new} = W_{old} – learningRate \cdot \frac{\partial E}{\partial W} $$ Мой вопрос: если производная
Data Science
разный диапазон целевых значений в нейронной сети
00
Вопрос или проблема Я работаю над кодом регрессии с использованием нейронной сети. Набор данных включает 14 признаков в диапазоне значений от -1 до 1, в то время как целевая переменная изменяется от (0.000759) до (1100). Целевые значения масштабируются тремя методами.
Data Science
Предсказание слова из набора слов
00
Вопрос или проблема Моя задача заключается в том, чтобы предсказать релевантные слова на основе короткого описания идеи. Например, “SQL — это язык, специфичный для домена, используемый в программировании и предназначенный для управления данными
Data Science
Функция потерь для вероятностной регрессии
00
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
Почему не использовать линейную регрессию для дообучения последнего слоя нейронной сети?
00
Вопрос или проблема В трансферном обучении часто лишь последний слой сети перенастраивается с использованием градиентного спуска. Однако последний слой обычной нейронной сети выполняет только линейное преобразование, так почему мы используем градиентный