Вопрос или проблема
Какое количество капсул в основной капсульной слой сети капсул?
Во многих статьях написано, что количество капсул составляет 32, но в статье Хинтона – Динамическая маршрутизация между капсулами написано, что
“В общей сложности у PrimaryCapsules есть [32 × 6 × 6] выходов капсул (каждый выход – это 8D вектор), и каждая капсула в сетке [6 × 6] делит свои веса с другими.”
что подразумевает, что слой содержит 36 капсул.
Возможно, каждая капсула имеет 2D форму (то есть 6×6). Таким образом, каждая компонентная капсула генерирует 8D вектор. 8D вектор выводится путем анализа 8 карт признаков, распространяемых из сверточного слоя. Это похоже на размещение карт признаков группами по 8. Это означает, что каждая компонентная капсула представляет собой одну капсулу, поэтому в “динамической статье” на самом деле 32 капсулы формы 8D.
Примечание: Основной капсульный слой на самом деле состоит из сверточных слоев.
Так что вы можете рассматривать 6×6 как размер карт признаков после свертки в основном капсульном слое.
Посмотрите на этот сайт.
В любом случае, я все еще изучаю капсулы, потому что большая часть информации в статье обобщена. Я открыт для исправлений. Спасибо
Ответ или решение
Вопрос о количестве капсул в первичном капсульном слое нейросетей капсул (Capsule Networks) вызывает некоторое замешательство из-за различных интерпретаций, представленных в литературе.
В статье "Dynamic Routing Between Capsules" автора Джеффри Хинтона говорится, что первичный капсульный слой имеет [32 × 6 × 6] выходов капсул, где каждая капсула предоставляет вектор размерности 8D. Это важно понимать в контексте архитектуры капсульных сетей.
-
Количество капсул: На самом деле в первичном капсульном слое имеется 32 капсулы, каждая из которых расположена в 6×6 решетке. Таким образом, общее количество капсул выражается как 32 капсулы, каждая из которых перфомирует операции на 6×6 области, что в итоге приводит к распределению выходов в виде [32 × 6 × 6].
-
Размерность векторов: Каждая капсула выводит 8D вектор, и этот вектор формируется на основе анализа 8 признаков, полученных из преобразования свертки. Это значит, что каждая капсула отвечает за представление определённого аспекта входной информации, рассматривая её под разными углами.
-
Архитектура: Первичный капсульный слой фактически состоит из сверточных слоев, где 6×6 обозначает размерность выходных активов после свертки. Каждая капсула взаимодействует с разными частями входного изображения, извлекая ключевые особенности, что позволяет достичь более устойчивого представления данных.
Итак, можно резюмировать, что в первичном капсульном слое капсульных сетей содержится 32 основные капсулы, каждая из которых обрабатывает данные в формате 8D на заданной пространственной сетке 6×6. Это множество капсул работает совместно для анализа и обработки входной информации более эффективным образом, что является одной из ключевых особенностей капсульных сетей по сравнению с традиционными нейронными сетями.
Если у вас остаются дополнительные вопросы или потребность в уточнениях, пожалуйста, дайте знать.