Где я могу найти бесплатные многократные однопометочные наборы данных для обнаружения объектов?

Вопрос или проблема

Я пытаюсь найти бесплатные датасеты с несколькими экземплярами и одной меткой для распознавания объектов в Интернете.

Под “несколько экземпляров и одной меткой” я имею в виду, что каждое изображение содержит только объекты, принадлежащие одному классу, но может содержать более одного объекта определенного класса.

Я нашел много датасетов для множественной метки, но ни одного для одной метки.

Любые идеи будут очень полезны,

заранее спасибо.

Вы имеете в виду, что несколько объектов на изображении относятся к одной конкретной метке?

Например, если у вас есть изображение с астронавтом, зданиями, машиной и ракетой, ему присвоена метка “Космос”; а изображение со зданиями, машинами и трассой имеет метку “Гонки”?

В этом случае, вам придется добавить один шаг к многометочному процессу, объединяя несколько меток в одну с помощью логистической регрессии или чего-то подобного.

Кроме того, вот публикация, которая может помочь:
https://arxiv.org/abs/1811.08400

Николя

Ответ или решение

Для поиска бесплатных наборов данных с изображениями, содержащими несколько экземпляров объектов одного класса (multi-instance single-label), подходящих для задач обнаружения объектов, необходимо учитывать следующие источники и ресурсы, которые могут соответствовать вашим требованиям:

  1. COCO Dataset:

    • Описание: Несмотря на то что COCO обычно используется для многоклассовой классификации, в нем содержатся изображения, где множество объектов одного класса могут быть аннотированы. Вы можете применить фильтрацию по классам для выделения нужных образцов.
    • Доступ: COCO Dataset
  2. PASCAL VOC:

    • Описание: Этот датасет также содержит изображения с несколькими экземплярами одного класса объектов. Его простой формат аннотаций может быть полезен для начальной работы и таргетной фильтрации по классам.
    • Доступ: PASCAL VOC Dataset
  3. Open Images Dataset:

    • Описание: Содержит множество аннотированных изображений, в том числе с несколькими экземплярами одного класса. Для работы с ним потребуется значительная фильтрация изображений для ваших специфических нужд.
    • Доступ: Open Images Dataset
  4. KITTI Vision Benchmark Suite:

    • Описание: Предназначен в основном для задач автономных транспортных средств, но в нем также встречаются изображения с несколькими экземплярами одного класса, таких как автомобили или пешеходы.
    • Доступ: KITTI
  5. Custom Curation:

    • Описание: Воспользуйтесь существующими более крупными и многоэтикеточными наборами данных, такими как ImageNet, и создайте свой настраиваемый набор данных, извлекая только изображения, которые подходят под ваши требования multi-instance single-label.
    • Метод: Используйте такие инструменты, как Python и библиотеки для обработки изображений, например, OpenCV и Pillow, для обработки и аннотации.

Рекомендуемые действия:

  • Используйте инструменты для фильтрации и обработки данных. Например, можно писать скрипты на Python для сортировки данных с использованием таких библиотек, как Pandas и NumPy.
  • Анализируя структуру и метаинформацию (метаданные), можно систематически выбирать данные оптимальные для вашей модели.

Это сочетание даcт вам более широкий спектр источников и возможность максимально эффективно использовать существующие данные для достижения ваших целей в области обнаружения объектов.

Обязательно учитывайте лицензионные соглашения при работе с данными, чтобы соответствовать всем правовым требованиям.

Оцените материал
Добавить комментарий

Капча загружается...