neural-network - ответы на вопросы - Page 3 of 12

Data Science

Нейронная сеть, достигающая локальных оптимумов

00

Вопрос или проблема Недавно я пытался обучить сверточную нейронную сеть для классификации людей как испаноязычных или белых (для учебных целей). Я не мог найти хорошую выборку данных только для этих двух рас, поэтому мне пришлось вручную собирать изображения из интернета.

Data Science

Какие уравнения участвуют в расчете параметров слоя внедрения?

00

Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”

Data Science

Создание модели классификации текста с нуля

00

Вопрос или проблема Я новичок в области науки о данных и методов машинного обучения. Мне нужно построить модель, которая позволит мне классифицировать тексты на основе анализа настроений. Прямо сейчас у меня есть только текст, и они не имеют ни класса

Data Science

Классификация шумных данных

00

Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные

Data Science

Как получить оптимальную модель с использованием Keras? Глубокое обучение

00

Вопрос или проблема Существует слишком много параметров при построении искусственной нейронной сети. Некоторые из них, которые приходят мне на ум, это: Количество слоев Типы слоев Количество узлов на каждом уровне слоя Активационные функции в каждом слое

Data Science

Показ стандартного отклонения для кривой обучения

00

Вопрос или проблема Я тренирую нейронную сеть и хотел построить график изменения различных метрик (MSE…) в процессе обучения. Чтобы получить представление о вариациях между разными обучениями, я использую несколько моделей и строю среднее значение и стандартное отклонение.

Data Science

Прогнозирование относительного распределения между доступными экземплярами

00

Вопрос или проблема Я работаю над моделью, которая должна предсказать, как объем заказов распределяется по доступным товарам в розничной торговле. Для простоты предположим, что я розничный продавец, который покупает яблоки у разных фермеров и поставщиков

Data Science

Обнаружение аномалий в данных временных рядов только с положительными образцами?

00

Вопрос или проблема У меня есть набор данных ЭКГ временных рядов. Я хочу заняться обнаружением аномалий (все, что отличается от нормальной ЭКГ, должно считаться аномальным). Дело в том, что у меня есть только положительные образцы и очень немного отрицательных образцов.

Data Science

Значения метрик равны при обучении и тестировании модели.

00

Вопрос или проблема Я работаю над моделью нейронной сети с использованием Python, Keras и TensorFlow в качестве бэкенда. Набор данных содержит две последовательности с результатом, который может быть 1 или 0, и соотношение положительных и отрицательных

Data Science

Как работает кросс-энтропия с функцией активации Softmax?

00

Вопрос или проблема Я нашел в интернете, что производная функции активации кросс-энтропии с активацией softmax равна (выход – ожидаемое), что очень меня запутало. Если, например, ожидаемое значение равно 1, и так как выход всегда меньше 1 (softmax)

Data Science

Понимание размеров входных и выходных данных для Embeddings

00

Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный

Data Science

Как использовать функцию потерь кросс-энтропии для каждой буквы/цифры в капче?

00

Вопрос или проблема Я пытаюсь разработать решатель капчи, используя простую полностью связанную нейронную сеть в TensorFlow. Все капчи содержат 5 цифр/букв, каждый символ может быть числом от 0 до 9 или буквой от A до Z. Они выглядят примерно так: Каждая

Data Science

Один хот и взаимодействие один хот на нескольких категориальных.

00

Вопрос или проблема Мне интересно, есть ли смысл создавать комбинированные признаки из нескольких категориальных переменных, когда отдельные категориальные переменные уже закодированы методом one-hot? Простой пример: есть переменная P с категориями {X

Data Science

Как выглядит граница принятия решения функции ReLU?

00

Вопрос или проблема Один неактивированный нейрон представляет собой просто линейную комбинацию его входов. Пороговая функция выхода этого нейрона относительно 0 создаст гиперплоскость бинарного разделителя, параметры которой можно обучить.

Data Science

Функция потерь Policy Gradient не работает

00

Вопрос или проблема Я экспериментировал со своим алгоритмом обучения с подкреплением на основе градиента политики и задавался вопросом, могу ли я использовать аналогичный метод контролируемой кросс-энтропии. Таким образом, вместо использования существующих

Data Science

Обновление среднего значения и дисперсии весов

00

Вопрос или проблема Я пытаюсь понять алгоритм Байес по обратному распространению из статьи Неопределенность весов в нейронных сетях, идея заключается в том, чтобы создать нейронную сеть, в которой каждый вес имеет собственное распределение вероятностей.

Data Science

Поэтапное обучение определенных слоев/подсетей в Keras Functional API

00

Вопрос или проблема Предположим, у нас есть архитектура глубокой нейронной сети с слоем, который должен быть общим между двумя “подсетями”. Пример: from keras.layers import Input, Dense from keras.models import Model main_input = Input(shape=(5

Data Science

Существует ли взаимосвязь между скоростью обучения и размером обучающего набора?

00

Вопрос или проблема У меня есть большой набор данных для обучения модели нейронной сети. Однако у меня недостаточно ресурсов для надлежащей настройки гиперпараметров на всем наборе данных. Поэтому моя идея заключается в том, чтобы отрегулировать скорость

Data Science

LSTM Долгосрочные зависимости Keras

00

Вопрос или проблема Я знаком с единицей LSTM (ячейка памяти, затвор забывания, выходной затвор и т.д.), однако мне трудно понять, как это связано с реализацией LSTM в Keras. В Keras структура входных данных для X имеет вид: (nb_samples, timesteps, input_dim).

Data Science

Обнаружение особенностей в XY графиках с использованием CNN.

00

Вопрос или проблема У меня простая задача классификации – если два признака, изображенные на простом графике XY, показывают «излом» или характерный поворот, то метка истинна, иначе ложна. Я пытался обнаружить «изломы» на этих графиках, используя