object-detection - ответы на вопросы

Data Science

00

Вопрос или проблема Почему нам нужно использовать инструмент Labelimg для обнаружения объектов? После маркировки множества тренировочных изображений с помощью инструмента labelimg, который даст файл CSV, как этот CSV файл работает с TensorFlow object detection API и Keras?

Data Science

Какова ожидаемая структура данных для pred и gt в model.loss(gt, pred) в модели YOLO?

00

Вопрос или проблема У меня есть pred_targets = self.model(images) pred_boxes = pred_container.data pred_scores = pred_container.conf pred_labels = pred_container.cls gt = (boxes.to(self.device), classes.to(self.device)) pred = (pred_boxes[:, :4], pred_scores

Data Science

Как изменить размер изображения вместе с его маской?

00

Вопрос или проблема У меня есть оригинальные изображения размером 1935×1481. Я использую labelme для аннотирования изображений. Я создаю полигоны на оригинальном изображении. Существует ли способ изменить размер изображения вместе с их маской?

Data Science

В чем разница между подходом на основе предложений и подходом без предложений?

00

Вопрос или проблема Здесь (источник) говорится, что Методы решения задачи сегментации экземпляров можно условно разделить на две категории: методы на основе предложений и методы без предложений. В методах на основе предложений сначала предсказывается

Data Science

Как повысить точность модели из модельного зоопарка TensorFlow?

00

Вопрос или проблема Ситуация: Мой набор данных состоит из 70 тыс. изображений людей в одежде. Изображения имеют метки: положение bbox и класс. Всего 10 классов. Я сделал разделение 80:20. Категории сбалансированы, за исключением одной категории, но я

Data Science

ShiftScaleRotate не работает с ограничивающими прямоугольниками.

00

Вопрос или проблема Albumentations корректно работает с изображением и маской сегментации. Но теряет все боксы, если применяется аугментация ShiftScaleRotate. Другие аугментации работают хорошо на боксах. Пример кода: import albumentations as albu import

Data Science

Разница между поиском изображений на основе текста и поиском объектов на естественном языке

00

Вопрос или проблема Я работаю над созданием модели, которая определяет местоположение объекта в сцене (2D изображение или 3D сцена) с использованием естественно-языкового запроса. Я наткнулся на статью о поиске объектов по естественному языку, в которой

Data Science

Можно ли использовать фотоколлажи в качестве набора данных вместо отдельных изображений для обучения модели обнаружения объектов SSD?

00

Вопрос или проблема Является ли нормальным/лучшим использование фото-коллажей (несколько фото в одном изображении) в качестве набора данных вместо одиночных изображений для обучения модели обнаружения объектов SSD? Я использую Tensorflow Object Detection

Data Science

Понимание выходных данных Yolo v5

00

Вопрос или проблема Выходной файл меток модели yolo v5 выглядит примерно так: 0 0.0917969 0.907639 0.172656 0.170833 0.475255 1 0.387109 0.15 0.127344 0.291667 0.822308 0 0.115625 0.539583 0.195312 0.354167 0.828012 0 0.906641 0.

Data Science

Настройка SSD Mobilenet для улучшения производительности

00

Вопрос или проблема Я использую код обнаружения объектов SSD Mobilenet V2 от Tensorflow и пока разочарован полученными результатами. Я надеюсь, что кто-то может взглянуть на то, что я сделал, и предложить, как я могу улучшить результаты: Набор данных

Data Science

Почему алгоритм YOLO предсказывает ограничивающие рамки для каждой ячейки сетки S?

00

Вопрос или проблема В YOLO каждая ячейка сетки предсказывает несколько ограничивающих рамок, скажем, в YOLOv1 она предсказывает B=2. В чем преимущество, если она предсказывает классовые вероятности только один раз для каждой ячейки сетки?

Data Science

Yolov8 – box_loss и dfl_loss остаются на 0. cls_loss сходится. Модель не дает мне предсказания ограничивающих рамок.

00

Вопрос или проблема У меня возникают проблемы с использованием Yolov8, чтобы он работал правильно. У меня есть собственный кастомный набор данных и онлайн-набор данных, которые я использую. Yolov8 тренируется на этих наборах данных.

Data Science

Где я могу найти бесплатные многократные однопометочные наборы данных для обнаружения объектов?

00

Вопрос или проблема Я пытаюсь найти бесплатные датасеты с несколькими экземплярами и одной меткой для распознавания объектов в Интернете. Под “несколько экземпляров и одной меткой” я имею в виду, что каждое изображение содержит только объекты

Data Science

Полная архитектура YOLO v3

00

Вопрос или проблема Я пытаюсь реализовать YOLO v3 в Tensorflow-Keras с нуля, с целью обучить свою модель на пользовательском наборе данных. Под этим я подразумеваю без использования предобученных весов. Я ознакомился со всеми тремя статьями по YOLOv1

Data Science

Какой формат разметки имеет отрицательные значения Bbox в метках?

00

Вопрос или проблема У меня есть помеченный набор данных для обнаружения объектов несколько тысяч изображений с аннотацией в csv файле csv содержит следующие столбцы image_path, class, xmax, xmin, ymax, ymin похоже на Pascal voc формат меток, но когда

Data Science

В чем разница между ограничивающим коробом и ROI (областью интереса)

00

Вопрос или проблема Я читал о Fast RCNN для обнаружения объектов. Насколько я понимаю, он использует заранее вычисленные ROI (используя селективный поиск) и использует их для предсказания смещений ограничивающих рамок, а также использует гладкую L1 потерю

Data Science

Проблемы, связанные с кодом для ROI pooling из карты признаков.

00

Вопрос или проблема Я пытаюсь реализовать ROI-пулинг на карте признаков, полученной из слоев VGG, но не знаю, как закодировать эти слои. Может, кто-то сможет мне помочь? Вот мои слои VGG: model=Sequential() model.add(ZeroPadding2D((1,1),input_shape=(3,112,112))) model.

Data Science

Обучение моделей обнаружения объектов с нуля без использования предобученных моделей и весов.

00

Вопрос или проблема У меня есть набор данных из 25 изображений. Я хочу запустить модели обнаружения объектов Faster RCNN или yolov3 на этих изображениях. Я хочу создать свою собственную обученную модель и получить веса после 10 эпох.

Data Science

Как обучить модель для обнаружения определенной области (D вверху) на изображении, независимо от изменяющегося содержимого в нижней части?

00

Вопрос или проблема Я хочу классифицировать изображения, поступающие из видеопотока с движущейся камеры, на несколько различных знаков, но проблема в том, что есть 2 типа знаков, которые очень похожи: end_curve (буква D сверху и внизу буква X) start_curve

Data Science

Предобработка для детекции мелких объектов

00

Вопрос или проблема В настоящее время я работаю над проектом по обнаружению объектов, в котором я пытаюсь обнаружить очень маленькие объекты 50×50 в 2k изображении. EfficientDet дает очень низкий результат, если я просто использую сырые аннотации и начинаю обучение.