Вопрос или проблема
У меня есть обрезанный скриншот сложного математического уравнения (цифровой), которое я не могу найти в pdf-файле, просто напечатав уравнение в строке поиска pdf-просмотрщика (поскольку это сложное математическое уравнение, которое должно быть написано на Latex, что нельзя ввести в строку поиска).
Существует ли какое-либо программное обеспечение, в которое я могу загрузить pdf-файл с математическим уравнением и обрезанный скриншот уравнения, и программа автоматически определит, на какой странице находится схожее изображение?
Обратите внимание, что это не касается только цифровизации изображения в pdf с помощью OCR. Может кто-нибудь помочь мне найти такой инструмент?
Ваш лучший вариант – извлечь изображения из pdf и использовать поиск по изображениям.
Извлеките изображения, например, с помощью https://tools.pdf24.org/en/extract-images
Рекомендации по такому программному обеспечению здесь
Ответ или решение
Поиск изображений, подобных вашему скриншоту сложного математического уравнения в PDF-документах, требует специфических инструментов и методов. Ваша задача не просто заключается в поиске текста, а в нахождении визуально схожего изображения, что делает этот процесс более сложным, но выполнимым с помощью специализированного программного обеспечения.
Во-первых, вам стоит обратить внимание на инструменты для извлечения изображений из PDF-файлов. Такие утилиты, как PDF24 Tools, позволяют извлекать изображения из документов в формате PDF, что является первоочередной задачей. После этого вы получите доступ к изображениям, содержащимся в документе, и сможете с их помощью использовать другие инструменты для визуального поиска.
Для поиска схожих изображений вы можете воспользоваться несколькими программными решениями:
-
Google Images – Если вы сохраните свой скриншот и загрузите его на Google Images, вы сможете найти визуально похожие изображения в интернете. Однако этот вариант может быть ограничен, так как он не проверяет PDF-файлы локально.
-
TinEye – Этот инструмент предназначен для поиска изображений и может помочь вам найти, где еще использовалось ваше изображение. Вы загружаете картинку, и система ищет совпадения, включая страницы, где данное изображение было использовано.
-
ImageMagick и другие библиотеки на Python – Используя языки программирования, такие как Python, и библиотеки для обработки изображений (например, OpenCV), вы можете создать собственный скрипт, который будет сравнивать ваши изображения из PDF с загруженным скриншотом. Этот метод требует знаний в программировании, но предоставляет гибкость в настройках поиска.
-
Adobe Acrobat Pro – Этот мощный инструмент не только позволяет извлекать изображения из PDF, но также имеет функции поиска и сравнения. Вам потребуется скопировать скриншот для поиска схожих изображений в документе, но эта функция может не быть прямой.
-
Similarity Image Search Software – На рынке существуют специализированные программы, такие как VisiPics и Exact Image, которые могут помочь в поиске схожих изображений на локальном диске. Некоторые из них могут анализировать изображения, а не полные документы, что поможет в вашем случае.
Суммируя, вы можете извлечь изображения из PDF и затем использовать один из предложенных инструментов для поиска. Ключевой момент заключается в том, чтобы найти решение, которое сочетает в себе извлечение и визуальный поиск, тем самым упростив вам задачу нахождения нужного математического уравнения.
Методология, описанная выше, поможет вам сэкономить время и средства, а также эффективно решить вашу задачу. Не забывайте регулярно обновлять используемое программное обеспечение, чтобы иметь доступ к последним функциям и улучшениям.