Вопрос или проблема
У меня есть куча скриншотов, изображений людей и документов.
Я хочу их пометить, чтобы искать их, как это делает Google, распознавая текст из скриншотов.
Поэтому я пытался найти приложение для Android.
Оно должно соответствовать следующим требованиям:
требования
- оно должно распознавать фотографии по лицу
- оно должно делать это на устройстве и не загружать данные на сервер
- оно должно встраивать свою базу данных распознавания лиц в само изображение, предпочтительно через xmp-тегирование
- оно должно считывать текст со скриншотов и делать его доступным для поиска, желательно также через другие приложения для тегирования
Предпочтения
- было бы очень здорово, если бы это приложение могло распознавать природные сцены, объекты, животных, птиц и т.д., но распознавание лиц является моим приоритетом
Боюсь, что здесь высокие технологии пока не оправдывают ожиданий, хотя технологии развиваются и могут быть доступны совсем скоро. Есть несколько интересных стартапов, таких как imagga.com, которые стремятся развить технологии автоматического распознавания и сделать их доступными для общественности, однако реализовать всё это локально на вашем устройстве без связи с удалённым сервером едва ли возможно для бизнеса, который они пытаются создать (особенно если вы хотите распознавать фотографии по лицу, о котором ваше устройство не имеет предварительной информации). В настоящий момент самым вероятным решением для вас будет ручное тегирование собранных вами изображений, и для этого вы можете обратиться на форум сообщества exiftool. FastPhotoTagger — это приложение, которое я использую на своём планшете Android для тегирования и поиска.
Ответ или решение
К сожалению, на сегодняшний день найти идеальное приложение для Android, которое сочетает все вышеперечисленные функции, будет затруднительно, так как технологии распознавания лиц и текста, функционирующие исключительно локально на устройстве, пока еще находятся на стадии развития и не так широко доступны. Тем не менее, есть некоторые решения, которые могут помочь вам в работе с вашими изображениями.
-
Google Photos: Это приложение на Android поддерживает автоматическую организацию фотографий и может распознавать лица, однако оно требует интернет-соединения для загрузки и обработки данных. Если вы не против использования облачных сервисов, это одно из наиболее мощных решений.
-
FastPhotoTagger: Как упомянуто, это приложение может помочь в ручной разметке изображений и поддерживает сохранение тегов в EXIF или XMP форматах. Вы можете использовать его для организации ваших снимков с учетом своей системы тегов.
-
OpenCV + Tesseract: Если вы готовы попробовать что-то более техническое, вы можете использовать OpenCV для распознавания лиц и Tesseract для OCR (распознавание текста). Это потребует некоторого программирования, но даст вам возможность создать приложение, которое будет выполнять задачи локально. В этом случае вам нужно будет изучить основы работы с Python или Android SDK.
-
PhotoSweeper: Это еще одно приложение, поддерживающее локальную сортировку по лицам и объектам, но важно отметить, что такие функции могут также иметь свои ограничения в распознавании и организации данных.
-
Альтернативы для распознавания объектов: Некоторые приложения, такие как "Amazon Rekognition" и другие , предлагают часть функций распознавания объектов, но также требуют подключения к интернету и обработки на своем сервере.
К сожалению, как вы правильно заметили, идеальное решение с локальной обработкой и полным набором функций пока не существует. Наилучшим вариантом для вас сейчас будет комбинировать несколько приложений для достижения желаемого результата, используя технологии ручного добавления тегов и специализированные решения для распознавания.
Рекомендуется следить за последними разработками в области технологий AI, так как обновления выходят регулярно, и, возможно, в будущем появится более совершенное решение, соответствующее вашим требованиям.