Низкий коэффициент Дайса (0.40) в сегментации спутниковых изображений с использованием UNET (здания).

Содержание

Вопрос или проблема
Ответ или решение
Теория (Theory)
Пример (Example)
Проблема разбиения на плитки
Нечеткие контуры
Применение (Application)

Вопрос или проблема

Я работаю над задачей сегментации крыш зданий, используя спутниковые снимки, но у меня возникают трудности с улучшением значения Dice loss с 0.40. Я попробовал несколько подходов, включая:

Различные варианты U-Net (стандартный U-Net, U-Net++ с различными
базовыми моделями)
YOLO (YOLOv7, YOLOv11) для сегментации
Mask R-CNN
Настройку гиперпараметров, таких как скорость обучения, размер пакета, аугментации,
выбор оптимизатора, функции потерь и т.д.

Данные набора:

Набор данных состоит из крупных аннотированных спутниковых снимков, которые были
разделены на меньшие тайлы на разных уровнях масштабирования.
Многие края зданий нечеткие, что затрудняет сегментацию.
Большинство зданий разделены на несколько тайлов, что может
влиять на производительность модели.

Проблемы, с которыми я столкнулся:

Низкий коэффициент Dice (~0.40) на всех моделях
Нечеткие края, затрудняющие сегментацию
Здания, разделенные на тайлы, что влияет на обучение модели

Как я могу эффективно бороться с разделением зданий на тайлы? Помогут ли перекрывающиеся тайлы?

Может ли другая архитектура модели показать лучшие результаты?
Как я могу улучшить способность моей модели сегментировать нечеткие края? Существуют
ли конкретные методы предобработки или аугментации, которые могут помочь?
Поможет ли постобработка (морфологические операции, CRF, или
оптимизация полигона) улучшить качество сегментации?

Буду признателен за любые предложения или идеи! Спасибо

Ответ или решение

Для успешного решения задачи сегментации крыш на спутниковых снимках с использованием UNet, стоит обратить внимание на несколько ключевых аспектов, которые могут значительно повлиять на повышение Dice коэффициента. Вы упомянули о применении различных моделей и гиперпараметров, однако, следует обратить внимание на специфические подходы к данным и улучшение алгоритмов.

Теория (Theory)

Во-первых, стоит исследовать, как разбиение спутниковых изображений на более мелкие плитки может повлиять на обучение модели. Распад зданий на нескольких плитках может затруднять обучению связи между различными частями одного объекта. Во-вторых, нечеткие края значительно усложняют задачу сегментации, так как модель может не различать контуры зданий. В-третьих, наличие ошибок в аннотациях или сильная вариативность в данных могут приводить к низкому значению Dice коэффициента.

Пример (Example)

Проблема разбиения на плитки

Обработка данных, где здания на снимках разбиты на несколько плиток, может значительно мешать модели выучивать контур зданий. В качестве примера, представим, что часть здания находится на одной плитке, а другая на соседней, и модель не может "видеть" полное здание в одном кадре, что может запутать её при обучении.

Нечеткие контуры

Размытость краев может быть вызвана низким разрешением изображения или условиями съёмки, такими как тень, облака или другое атмосферное влияние. Это может привести к тому, что модель неверно определяет границы объектов.

Применение (Application)

Перекрывающиеся плитки: Используйте перекрывающиеся плитки при подготовке данных (например, с перекрытием 50%), чтобы захватить границы строений в нескольких контекстах. Это может помочь модели лучше выучить переходы между плитками и повысить точность.
Использование большого контекста и архитектуры: Попробуйте архитектуры, которые способны учитывать более широкий контекст, такие как HRNet или Deeplab, которые часто используются для задач, требующих детальной сегментации и восстановления контуров объектов.
Предобработка и аугментации:
- Используйте техники повышения резкости изображений, нормализации и адаптивной гистограммы (CLAHE) для улучшения контуров зданий.
- Применяйте усиленные аугментации, такие как рандомизация освещения, цветовые сдвиги и адаптивные размытия для повышения обобщающей способности модели.
Оптимизация потерь: Используйте продвинутые функции потерь, такие как Focal Loss или Combo Loss, которые лучше справляются с дисбалансом классов и помогают улучшить обучение на нечетких границах.
Пост-обработка:
- Применяйте морфологические операции (например, эрозия и дилатация) для улучшения определения контуров после сегментации.
- Рассмотрите использование Кондративно-Случайного Полевого Расширения (CRF) для повышения пространственной согласованности.
- Геометрическое сглаживание и полигонизирование контуров также может улучшить точность сегментации.
Учет качеств данных: Проверьте наличие шумов в аннотациях и рассмотрите ручное устранение проблемных примеров или дополнительную сортифровку.
Дополнительные стратегии обучения:
- Пусть модель обучается на больших изображениях (или с большей долей изображения в кадре), чтобы лучше извлекать контексты и связи между элементами.
- Рассмотрите возможность предобученных сетей для извлечения показательных признаков.
Учитывайте специфику объектов: Если здания имеют схожие контуры или размеры, можно попробовать кластеризацию признаков для более узкого поиска.

Эти предложения, направленные на улучшение работы модели в вашей задаче, требуют тщательного тестирования и анализа данных, чтобы адаптировать подходы под конкретные особенности представленного набора данных и аппаратурной базы. Успехов в повышении качества модели!