Data Science
Нейронная сеть, достигающая локальных оптимумов
00
Вопрос или проблема Недавно я пытался обучить сверточную нейронную сеть для классификации людей как испаноязычных или белых (для учебных целей). Я не мог найти хорошую выборку данных только для этих двух рас, поэтому мне пришлось вручную собирать изображения из интернета.
Data Science
Какие уравнения участвуют в расчете параметров слоя внедрения?
00
Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”
Data Science
Создание модели классификации текста с нуля
00
Вопрос или проблема Я новичок в области науки о данных и методов машинного обучения. Мне нужно построить модель, которая позволит мне классифицировать тексты на основе анализа настроений. Прямо сейчас у меня есть только текст, и они не имеют ни класса
Data Science
Классификация шумных данных
00
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
Как получить оптимальную модель с использованием Keras? Глубокое обучение
00
Вопрос или проблема Существует слишком много параметров при построении искусственной нейронной сети. Некоторые из них, которые приходят мне на ум, это: Количество слоев Типы слоев Количество узлов на каждом уровне слоя Активационные функции в каждом слое
Data Science
Показ стандартного отклонения для кривой обучения
00
Вопрос или проблема Я тренирую нейронную сеть и хотел построить график изменения различных метрик (MSE…) в процессе обучения. Чтобы получить представление о вариациях между разными обучениями, я использую несколько моделей и строю среднее значение и стандартное отклонение.
Data Science
Прогнозирование относительного распределения между доступными экземплярами
00
Вопрос или проблема Я работаю над моделью, которая должна предсказать, как объем заказов распределяется по доступным товарам в розничной торговле. Для простоты предположим, что я розничный продавец, который покупает яблоки у разных фермеров и поставщиков
Data Science
Обнаружение аномалий в данных временных рядов только с положительными образцами?
00
Вопрос или проблема У меня есть набор данных ЭКГ временных рядов. Я хочу заняться обнаружением аномалий (все, что отличается от нормальной ЭКГ, должно считаться аномальным). Дело в том, что у меня есть только положительные образцы и очень немного отрицательных образцов.
Data Science
Значения метрик равны при обучении и тестировании модели.
00
Вопрос или проблема Я работаю над моделью нейронной сети с использованием Python, Keras и TensorFlow в качестве бэкенда. Набор данных содержит две последовательности с результатом, который может быть 1 или 0, и соотношение положительных и отрицательных
Data Science
Как работает кросс-энтропия с функцией активации Softmax?
00
Вопрос или проблема Я нашел в интернете, что производная функции активации кросс-энтропии с активацией softmax равна (выход – ожидаемое), что очень меня запутало. Если, например, ожидаемое значение равно 1, и так как выход всегда меньше 1 (softmax)
Data Science
Понимание размеров входных и выходных данных для Embeddings
00
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
Как использовать функцию потерь кросс-энтропии для каждой буквы/цифры в капче?
00
Вопрос или проблема Я пытаюсь разработать решатель капчи, используя простую полностью связанную нейронную сеть в TensorFlow. Все капчи содержат 5 цифр/букв, каждый символ может быть числом от 0 до 9 или буквой от A до Z. Они выглядят примерно так: Каждая
Data Science
Один хот и взаимодействие один хот на нескольких категориальных.
00
Вопрос или проблема Мне интересно, есть ли смысл создавать комбинированные признаки из нескольких категориальных переменных, когда отдельные категориальные переменные уже закодированы методом one-hot? Простой пример: есть переменная P с категориями {X
Data Science
Как выглядит граница принятия решения функции ReLU?
00
Вопрос или проблема Один неактивированный нейрон представляет собой просто линейную комбинацию его входов. Пороговая функция выхода этого нейрона относительно 0 создаст гиперплоскость бинарного разделителя, параметры которой можно обучить.
Data Science
Функция потерь Policy Gradient не работает
00
Вопрос или проблема Я экспериментировал со своим алгоритмом обучения с подкреплением на основе градиента политики и задавался вопросом, могу ли я использовать аналогичный метод контролируемой кросс-энтропии. Таким образом, вместо использования существующих
Data Science
Обновление среднего значения и дисперсии весов
00
Вопрос или проблема Я пытаюсь понять алгоритм Байес по обратному распространению из статьи Неопределенность весов в нейронных сетях, идея заключается в том, чтобы создать нейронную сеть, в которой каждый вес имеет собственное распределение вероятностей.
Data Science
Поэтапное обучение определенных слоев/подсетей в Keras Functional API
00
Вопрос или проблема Предположим, у нас есть архитектура глубокой нейронной сети с слоем, который должен быть общим между двумя “подсетями”. Пример: from keras.layers import Input, Dense from keras.models import Model main_input = Input(shape=(5
Data Science
Существует ли взаимосвязь между скоростью обучения и размером обучающего набора?
00
Вопрос или проблема У меня есть большой набор данных для обучения модели нейронной сети. Однако у меня недостаточно ресурсов для надлежащей настройки гиперпараметров на всем наборе данных. Поэтому моя идея заключается в том, чтобы отрегулировать скорость
Data Science
LSTM Долгосрочные зависимости Keras
00
Вопрос или проблема Я знаком с единицей LSTM (ячейка памяти, затвор забывания, выходной затвор и т.д.), однако мне трудно понять, как это связано с реализацией LSTM в Keras. В Keras структура входных данных для X имеет вид: (nb_samples, timesteps, input_dim).
Data Science
Обнаружение особенностей в XY графиках с использованием CNN.
00
Вопрос или проблема У меня простая задача классификации – если два признака, изображенные на простом графике XY, показывают «излом» или характерный поворот, то метка истинна, иначе ложна. Я пытался обнаружить «изломы» на этих графиках, используя