Вопрос или проблема
Я пытаюсь найти бесплатные датасеты с несколькими экземплярами и одной меткой для распознавания объектов в Интернете.
Под “несколько экземпляров и одной меткой” я имею в виду, что каждое изображение содержит только объекты, принадлежащие одному классу, но может содержать более одного объекта определенного класса.
Я нашел много датасетов для множественной метки, но ни одного для одной метки.
Любые идеи будут очень полезны,
заранее спасибо.
Вы имеете в виду, что несколько объектов на изображении относятся к одной конкретной метке?
Например, если у вас есть изображение с астронавтом, зданиями, машиной и ракетой, ему присвоена метка “Космос”; а изображение со зданиями, машинами и трассой имеет метку “Гонки”?
В этом случае, вам придется добавить один шаг к многометочному процессу, объединяя несколько меток в одну с помощью логистической регрессии или чего-то подобного.
Кроме того, вот публикация, которая может помочь:
https://arxiv.org/abs/1811.08400
Николя
Ответ или решение
Для поиска бесплатных наборов данных с изображениями, содержащими несколько экземпляров объектов одного класса (multi-instance single-label), подходящих для задач обнаружения объектов, необходимо учитывать следующие источники и ресурсы, которые могут соответствовать вашим требованиям:
-
COCO Dataset:
- Описание: Несмотря на то что COCO обычно используется для многоклассовой классификации, в нем содержатся изображения, где множество объектов одного класса могут быть аннотированы. Вы можете применить фильтрацию по классам для выделения нужных образцов.
- Доступ: COCO Dataset
-
PASCAL VOC:
- Описание: Этот датасет также содержит изображения с несколькими экземплярами одного класса объектов. Его простой формат аннотаций может быть полезен для начальной работы и таргетной фильтрации по классам.
- Доступ: PASCAL VOC Dataset
-
Open Images Dataset:
- Описание: Содержит множество аннотированных изображений, в том числе с несколькими экземплярами одного класса. Для работы с ним потребуется значительная фильтрация изображений для ваших специфических нужд.
- Доступ: Open Images Dataset
-
KITTI Vision Benchmark Suite:
- Описание: Предназначен в основном для задач автономных транспортных средств, но в нем также встречаются изображения с несколькими экземплярами одного класса, таких как автомобили или пешеходы.
- Доступ: KITTI
-
Custom Curation:
- Описание: Воспользуйтесь существующими более крупными и многоэтикеточными наборами данных, такими как ImageNet, и создайте свой настраиваемый набор данных, извлекая только изображения, которые подходят под ваши требования multi-instance single-label.
- Метод: Используйте такие инструменты, как Python и библиотеки для обработки изображений, например, OpenCV и Pillow, для обработки и аннотации.
Рекомендуемые действия:
- Используйте инструменты для фильтрации и обработки данных. Например, можно писать скрипты на Python для сортировки данных с использованием таких библиотек, как Pandas и NumPy.
- Анализируя структуру и метаинформацию (метаданные), можно систематически выбирать данные оптимальные для вашей модели.
Это сочетание даcт вам более широкий спектр источников и возможность максимально эффективно использовать существующие данные для достижения ваших целей в области обнаружения объектов.
Обязательно учитывайте лицензионные соглашения при работе с данными, чтобы соответствовать всем правовым требованиям.