Data Science
YOLO: почему изменение порога достоверности изменяет [email protected]?
00
Вопрос или проблема Я обучил модель YOLOv7 для задачи обнаружения. У меня только один класс, который является объектом, который я хочу обнаружить. Я запустил test.py с –conf-thresh равным 0.001 (по умолчанию) и второй раз с –
Data Science
Может ли производительность CNN зависеть от случайного семени разделения на обучение, тестирование и валидацию?
00
Вопрос или проблема Я занимаюсь многоклассовой классификацией и сравниваю влияние двух техник улучшения изображений (IET). IET 1 работает лучше, чем IET 2 при случайном начальном значении x (для разделения на тренировочный, тестовый и валидационный наборы).
Data Science
Анализ настроений на основе аспектов с использованием Bert и Pytorch
00
Вопрос или проблема У меня есть набор данных онлайн-отзывов (X) с соответствующими темами (тема1 до тема5), и каждая тема может иметь 5 значений (подробная оценка настроений от 1 до 5). Итак, у меня есть один X и 5 Y колонок. Я хотел бы узнать, как я
Data Science
Прогнозы для классов, на которых DNN еще не был обучен, – возможно ли это?
00
Вопрос или проблема Мои данные имеют мультиклассовый, многометочный тип, и я планирую иметь в общей сложности 100 выходных классов. Мои входные данные X для модели представляют собой аудиоданные, а y – это одномерный numpy массив с одной горячей
Data Science
Как запустить модель tensorflow дважды перед вычислением потерь
00
Вопрос или проблема Я хочу вычислить функцию потерь, которая использует выходные данные сети дважды на разных входах. Например, гипотетически, first_output = model(first_input) second_output = model(second_input) loss = mean_absolute_error(first_output
Data Science
Обучение модели U-Net для разделения источников
00
Вопрос или проблема Data Science Stack Exchange. Я новичок в глубоком обучении и сталкиваюсь с конкретной проблемой при решении, использовать ли L1 loss или loss на основе критерия взаимной информации для модели разделения источников.
Data Science
Комбинирование различных признаков в качестве входных данных для нейронной сети
00
Вопрос или проблема Я использую два разных источника информации как входные данные для своей нейронной модели. Модель принимает слово в качестве ввода и производит бинарный [1/0] выход. Я представляю каждое слово, используя его векторное представление
Data Science
Нормализация валюты для прогнозирования зарплаты
00
Вопрос или проблема У меня есть набор данных (350 тысяч данных) о сотрудниках из разных регионов за последние 10 лет. Набор данных состоит из их навыков, региона, в котором они находятся, отрасли, их текущей роли, их зарплаты в соответствующей валюте.
Data Science
Как возможно изменить размер входного сигнала архитектуры узкого места ResNet с 56x56x64 на 56x56x356?
00
Вопрос или проблема В статье ResNet описаны входные размеры первого остаточного блока 56x56x64, что вызвано фильтром 7x7x64 на первом слое. Однако в статье показан остаточный блок с размером входа 56x56x256. Как это возможно изменить с 56x56x64 на 56x56x256?
Data Science
Прогнозирование ежедневного баланса с использованием LSTM и ARIMA
00
Вопрос или проблема У меня есть история ежедневных транзакций человека с 1.01.2022 по 24.06.2024 в csv файле. Данные разделены на обучающую (с 1.01.2022 по 25.05.2024) и тестовую (оставшиеся). Данные представлены следующим образом: Дата Сумма дебета Сумма
Data Science
Существует ли взаимосвязь между скоростью обучения и размером обучающего набора?
00
Вопрос или проблема У меня есть большой набор данных для обучения модели нейронной сети. Однако у меня недостаточно ресурсов для надлежащей настройки гиперпараметров на всем наборе данных. Поэтому моя идея заключается в том, чтобы отрегулировать скорость
Data Science
BPTT против проблемы исчезающего градиента
00
Вопрос или проблема Я знаю, что BPTT — это метод применения обратного распространения к RNN. Он хорошо работает с RNN, так как останавливается в определённый момент, когда изменения приближаются к нулю. Но разве это не та же самая проблема исчезающего градиента?
Data Science
Какая функция активации для многоклассовой классификации дает истинную вероятность (softmax против сигмоиды)
00
Вопрос или проблема Мне интересно, какая активационная функция для многоклассовой классификации дает истинную вероятность. Согласно: https://ai.stackexchange.com/questions/37889/are-softmax-outputs-of-classifiers-true-probabilities похоже, что выходная
Data Science
Почему обучение с softmax более стабильное
00
Вопрос или проблема Мне интересно, какая активационная функция будет легче для обучения (даст лучшую точность / наименьшую потерю) – SoftMax или сигмоида (для задачи многоклассовой классификации) Согласно: https://www.quora.
Data Science
Как я могу понять несколько LSTM ячеек, развертывая их?
00
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Могу ли я использовать GCN для получения структурных вложений узлов без обучения?
00
Вопрос или проблема Теперь я хочу получить структурное представление узлов, используя DeepWalk или Node2Vec, но не удается получить одинаковые векторы, даже если у них одна и та же структура. Затем я использую GCN, который может получить одинаковые векторы без обучения.
Data Science
Как я могу загрузить пользовательские данные в загрузчик данных (pytorch)
00
Вопрос или проблема Примечание: Я извлек кадр для всех видео и сохранил его в папке с тем же именем, что и видео train_data, class, video —> Это папки img –> это jpg файлы, так что у каждого класса много видео, я извлек изображение для
Data Science
Почему моделям LSTM не требуются метки на каждом этапе?
00
Вопрос или проблема Для проблем, связанных со временем, например, для предсказания акций: Предположим, у нас есть 300 дней данных, 10 признаков и одна целевая переменная: цена. Почему для тренировки нам нужна только цена 300-го дня?
Data Science
Как справиться с сильным переобучением в сверточной нейронной сети UNet с кодировщиком/декодировщиком в задаче, очень похожей на перевод изображений?
00
Вопрос или проблема Я пытаюсь подогнать CNN UNet под задачу, очень похожую на перевод изображений. Входные данные сети – это бинарная матрица размером (64,256), а выход – размером (64,32). Колонки представляют собой статус канала связи, где
Программное обеспечение
Предустановленная настройка Ubuntu для глубокого обучения
00
Вопрос или проблема Я хочу работать над глубоким обучением и компьютерным зрением в Linux, скажем, в Ubuntu. Я знаю, что для этой цели существуют предустановленные образы в AWS, Azure. Но я хочу установить это на своем ПК в VirtualBox или на жесткий диск.