Существует ли вращательный сверточный фильтр в нейронных сетях?

Вопрос или проблема

Традиционно свертка — это когда вы берете матрицу чисел, умножаете ее на подмножество данных и затем суммируете. Затем вы перемещаете фильтр слева направо и сверху вниз по области, чтобы создать более малую (или равную) сетку.

Но мне интересно, существуют ли фильтры, которые работают в режиме вращения, то есть рассмотрим фильтр 2×2, содержащий эти параметры.

a, b
d, c

И рассмотрим входные данные 4×4. Обычно в мире CNN, после применения фильтра к входу, я получаю выход 3×3, который является результатом описанного ранее перемещения.

Теперь предположим, что вместо перемещения я хотел бы повернуть веса перед применением, и не делаю перемещение, а поворачиваю матрицу для каждой из 4 углов в входных данных 4×4.

Это означает, что я бы применял к верхнему левому углу эти значения

a, b
d, c

затем к нижнему левому углу эти значения, которые являются повернутыми из вышеупомянутого

b, c
a, d

затем к нижнему правому

c, d
b, a

затем к верхнему правому

d, a
c, b

так я заканчиваю с другой матрицей 2×2 после применения вышеописанного фильтра к входным данным 4×4.

Уже существует название для такого фильтра?

Я думаю, что групповая CNN близка. У нее есть вращение и симметрия.

.

Ответ или решение

Ротационные свертки в нейронных сетях – существуют ли они?

В традиционной модели сверточной нейронной сети (CNN) фильтры применяются к данным путем перемножения матрицы фильтра с соответствующими областями данных и последующего суммирования. Эти фильтры буквально "скользят" по данным слева направо и сверху вниз, создавая выходной массив меньшего (или равного) размера. Однако возникает вопрос: существуют ли фильтры, которые работают на основе вращений, где веса фильтра применяются с различной ориентацией?

В предложенном примере рассматривается применение 2×2 фильтра ко всем четырем углам 4×4 матрицы с различными ротациями. Первый шаг начинается с фильтра:

a, b
d, c

Затем фильтр вращается и применяется в следующем порядке:

  1. В нижнем левом углу:
    b, c
    a, d
  2. В нижнем правом углу:
    c, d
    b, a
  3. В верхнем правом углу:
    d, a
    c, b

Это приводит к созданию нового 2×2 матрицы после применения фильтра ко всем участкам входных данных.

На данный момент, конкретное название для таких фильтров, применяемых в виде ротации без скольжения, не установлено в научной литературе. Однако концепция вращательных сверток близка к групповой сверточной нейронной сети (Group CNN), которая действительно включает в себя элементы вращения и симметрии. Group CNN использует групповые операции, которые могут включать различные симметрии для повышения инвариантности моделей к различным пространственным трансформациям, включая вращения.

Создание специфического термина для таких фильтров могло бы способствовать развитию более совершенных моделей, которые используют пространственные инвариантности более эффективно. Оптимизация таких подходов может значительно улучшить качество анализа изображений и других данных, которые зависят от ориентации.

В заключение, хотя в научной литературе еще не закрепился конкретный термин для "ротационных фильтров", исследования в области групповых сверточных сетей могут предоставить основу для их развития и внедрения. Это направление интересно для изучения перспектив повышения точности и устойчивости моделей нейронных сетей в широком спектре применений.

Оцените материал
Добавить комментарий

Капча загружается...