Вопрос или проблема
Я работаю стажером в компании, где необходимо точное сканирование счетов, которые поступают в формате PDF. Программа или библиотека Java должны быть способны извлекать определенные части счета, чтобы пользователю не приходилось вручную перепечатывать информацию.
Требования:
- Она не может работать как приложение для Windows
- Она должна работать на серверах Linux
- Она должна работать через веб-интерфейс и интегрироваться с решениями третьих сторон
Я пытался искать, но могу найти только приложения с интерактивным пользовательским интерфейсом.
Есть ли какие-либо рекомендации?
Пожалуйста, спрашивайте, если что-то в вопросе неясно.
LEADTOOLS Linux SDK имеет модуль OCR в своей Java-библиотеке. (Отказ от ответственности: я сотрудник продавца этого инструмента).
Если ваши счета имеют подходящую структуру, вы можете определить зоны OCR, которые соответствуют каждому полю, которое вы хотите распознать:
OcrZone ocrZone = new OcrZone();
ocrZone.setBounds(demoData.zoneBounds);
ocrPage.getZones().add(ocrZone);
Это можно сделать для каждой области на каждой странице, которую вы хотите распознать, перед вызовом ocrPage.recognize() для начала OCR.
Также, если вы хотите попробовать это самостоятельно, есть демо, реализованное в виде консольного приложения в оценочной версии инструмента для Linux здесь.
PDF.co Web API (по запросу) имеет встроенный OCR и также поддерживает извлечение на основе шаблонов для ваших документов.
Ниже приведен пример исходного кода с использованием извлечения на основе шаблонов (node.js):
Если вас заинтересовало, мы с радостью предоставим вам бесплатный тестовый аккаунт!
Отказ от ответственности: я работаю в ByteScout.
Ответ или решение
Для вашей компании, где требуется точное извлечение информации из PDF-форм для автоматизации обработки счетов, рекомендуется рассмотреть несколько программных решений и библиотек, которые соответствуют вашим требованиям.
1. LEADTOOLS Linux SDK
Описание: LEADTOOLS представляет собой мощный SDK, который включает модуль OCR и может работать на серверах Linux. Это решение позволяет программно определять зоны OCR для распознавания информации, предоставляя возможность настройки извлечения данных.
Преимущества:
- Настройка зон: Вы можете определить конкретные зоны для распознавания каждой части счета (например, номер счета, дата, сумма).
- Поддержка извлечения текста: Данная библиотека может эффективно извлекать текст из изображений и PDF, что значительно ускоряет процесс обработки документов.
Интеграция: LEADTOOLS SDK подходит для интеграции с веб-интерфейсами и может работать с различными сторонними решениями.
Пример кода:
OcrZone ocrZone = new OcrZone();
ocrZone.setBounds(demoData.zoneBounds);
ocrPage.getZones().add(ocrZone);
ocrPage.recognize();
2. PDF.co Web API
Описание: PDF.co предлагает облачный API, который включает встроенные функции для OCR и извлечения данных на основе шаблонов. Это решение позволяет вам обрабатывать документы, не устанавливая локальные приложения.
Преимущества:
- Облачный доступ: Работает в режиме on-demand и не требует установки на локальные серверы, что соответствует вашему требованию о работе на Linux.
- Шаблоны для извлечения данных: PDF.co позволяет легко настраивать шаблоны для распознавания и извлечения необходимых данных из ваших документов.
Интеграция: Этот сервис имеет API, что позволяет интегрировать его с другими веб-приложениями и системами учета.
Пример использования (Node.js):
const pdfParser = require('pdfco');
pdfParser.parseUploadedFile('path/to/your/file.pdf')
.then(data => {
console.log(data);
});
Рекомендации по выбору
- LEADTOOLS подойдет, если вам нужна высокая настройка и контроль за извлекаемыми данными. Это особенно полезно, если ваша компания часто работает с одинаковыми форматами документов.
- PDF.co идеально для быстрой интеграции и моментального доступа без необходимости управления серверными ресурсами. Это удобно для обеспечения быстрого реагирования на потребности бизнеса.
Заключение
Выбор правильного инструмента для извлечения данных из PDF-документов критически важен для повышения эффективности работы с инвойсами. Оба предложенных решения предлагают уникальные возможности, и ваше окончательное решение должно основываться на специфических требованиях вашего проекта и удобстве интеграции с существующими системами. Наша рекомендация — протестировать оба инструмента на небольшом объеме документов и определить, какое из них больше подходит для ваших нужд.