Data Science
Какая функция активации для многоклассовой классификации дает истинную вероятность (softmax против сигмоиды)
00
Вопрос или проблема Мне интересно, какая активационная функция для многоклассовой классификации дает истинную вероятность. Согласно: https://ai.stackexchange.com/questions/37889/are-softmax-outputs-of-classifiers-true-probabilities похоже, что выходная
Data Science
Почему обучение с softmax более стабильное
00
Вопрос или проблема Мне интересно, какая активационная функция будет легче для обучения (даст лучшую точность / наименьшую потерю) – SoftMax или сигмоида (для задачи многоклассовой классификации) Согласно: https://www.quora.
Data Science
Как я могу понять несколько LSTM ячеек, развертывая их?
00
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Могу ли я использовать GCN для получения структурных вложений узлов без обучения?
00
Вопрос или проблема Теперь я хочу получить структурное представление узлов, используя DeepWalk или Node2Vec, но не удается получить одинаковые векторы, даже если у них одна и та же структура. Затем я использую GCN, который может получить одинаковые векторы без обучения.
Data Science
Как я могу загрузить пользовательские данные в загрузчик данных (pytorch)
00
Вопрос или проблема Примечание: Я извлек кадр для всех видео и сохранил его в папке с тем же именем, что и видео train_data, class, video —> Это папки img –> это jpg файлы, так что у каждого класса много видео, я извлек изображение для
Data Science
Почему моделям LSTM не требуются метки на каждом этапе?
00
Вопрос или проблема Для проблем, связанных со временем, например, для предсказания акций: Предположим, у нас есть 300 дней данных, 10 признаков и одна целевая переменная: цена. Почему для тренировки нам нужна только цена 300-го дня?
Data Science
Как справиться с сильным переобучением в сверточной нейронной сети UNet с кодировщиком/декодировщиком в задаче, очень похожей на перевод изображений?
00
Вопрос или проблема Я пытаюсь подогнать CNN UNet под задачу, очень похожую на перевод изображений. Входные данные сети – это бинарная матрица размером (64,256), а выход – размером (64,32). Колонки представляют собой статус канала связи, где
Программное обеспечение
Предустановленная настройка Ubuntu для глубокого обучения
00
Вопрос или проблема Я хочу работать над глубоким обучением и компьютерным зрением в Linux, скажем, в Ubuntu. Я знаю, что для этой цели существуют предустановленные образы в AWS, Azure. Но я хочу установить это на своем ПК в VirtualBox или на жесткий диск.
Data Science
Целевой и выходной формат/тип для бинарной классификации с использованием PyTorch
00
Вопрос или проблема У меня есть несколько аннотированных изображений, которые я хочу использовать для обучения бинарного классификатора изображений, но у меня возникли проблемы с созданием набора данных и фактическим обучением модели.
Data Science
О последнем декодирующем уровне в архитектуре трансформера
00
Вопрос или проблема Итак, в слое декодера трансформера, предположим, я предсказал 3 слова до сих пор, включая начальный токен, тогда последний слой декодера будет производить 3 вектора размера d-model, и только последний вектор пройдет через слой встраивания
Data Science
Как запустить две разные модели в одном кадре?
00
Вопрос или проблема У меня есть mask_detector.model и веса yolov3 для социальной дистанции. Я хочу запустить их одновременно с одним потоком веб-камеры. Как я могу запустить их оба, то есть детектировать маску и модель социальной дистанции вместе?
Data Science
Уменьшение вознаграждения при использовании DDPG
00
Вопрос или проблема Когда я пытаюсь использовать DDPG для решения задачи распределения ресурсов в коммуникационных сетях, я получаю странный результат, например, вознаграждение становится все меньше и меньше. В то же время, потери критика сходятся к минимальному
Data Science
Пункты, которые нужно помнить при переходе всей организации на решения на основе ИИ
00
Вопрос или проблема В нашей организации в настоящее время мы находимся на стадии формирования команды, навыков для автоматизации и внедрения решений на основе ИИ. Таким образом, мы на очень ранней стадии этого пути в область ИИ.
Data Science
[Keras][LSTM] ошибка из-за несоответствия формы
00
Вопрос или проблема У меня есть следующие данные. У меня есть 2 образца. Каждый образец имеет 3 временных шага, каждый с 2 признаками. Я намерен использовать 2 батча (чтобы обновлять веса после каждого образца) X=np.array([[[0.
Data Science
Интуиция за скрытым состоянием RNN/LSTM?
00
Вопрос или проблема Какова интуиция, стоящая за скрытыми состояниями RNN/LSTM? Похожи ли они на скрытые состояния HMM (скрытая модель Маркова)? Лично я не думаю, что их можно сравнить со скрытым состоянием модели Маркова. Одно из ключевых отличий заключается
Data Science
Можно ли использовать трансформерные модели для обучения чат-ботов?
00
Вопрос или проблема Могут ли модели-трансформеры использоваться для обучения чат-ботов? Примечание – Я говорю о модели трансформера, которую Google выпустил в статье “Внимание — это всё, что вам нужно” Трансформер — это просто нейронная сеть.
Data Science
Почему моя модель Keras не обучается сегментации изображений?
00
Вопрос или проблема Редактировать: как выясняется, даже первоначальному создателю модели не удалось успешно ее донастроить. Скорее всего, это проблема реализации или потенциально связана с неинтуитивным способом работы слоя пакетной нормализации Keras.
Вопросы и ответы
Проецируйте булеву маску из регионов максимального пула обратно на входной тензор.
00
Вопрос или проблема Я работаю над реализацией пользовательского слоя макс-пулинга в TensorFlow и нуждаюсь в помощи проекции булевой маски на входной тензор, чтобы указать позиции, которые способствовали максимальным значениям в каждом окне пулинга.
Data Science
Средние потери равны 0 при обучении модели на датасете с использованием darknet yolov4.
00
Вопрос или проблема В настоящее время я обучаю набор данных, используя yolov4 darknet от AlexeyAB на GitHub, который можно найти здесь: https://github.com/AlexeyAB/darknet Набор данных, который я обучаю, называется FishNet Open Images.
Data Science
Можно ли использовать одну и ту же архитектуру CNN для разных наборов данных?
00
Вопрос или проблема У меня есть архитектура CNN, которая хорошо работает с изображениями 32x32x3. Могу ли я использовать ту же архитектуру для набора данных, состоящего из изображений 28x28x1? (Оба набора данных имеют 10 классов).