Библиотека PDF для извлечения текста и изображений в Xamarin (Android)

Вопрос или проблема

Я единственный разработчик, пытающийся разработать Android-приложение для конвертации PDF в ePub. У меня уже есть работающий прототип для Windows на C#, и для этого я использовал библиотеку iText.

Проблема в том, что версия iText 7 для C# не может быть использована в Xamarin, потому что в Mono нет реализации System.Drawing. Поэтому мне нужна библиотека, которая:

  1. Извлекает куски текста с их координатами из PDF (PDF не знает слов или предложений, поэтому я использовал “куски текста”);
  2. Извлекает имя шрифта для получения информации о курсиве или жирном начертании;
  3. Извлекает изображения с их координатами из PDF;
  4. Может работать с Xamarin;
  5. Бесплатна.

Я также связывался с Syncfusion, но они сообщили мне, что их продукт в настоящее время не поддерживает все мои требования.

Библиотека XFINIUM.PDF поддерживает требования 1, 2, 3 и 4.

Отказ от ответственности: Я работаю в компании, которая разрабатывает XFINIUM.PDF.

Ответ или решение

Для разработки вашего Android-приложения, которое будет конвертировать PDF в ePub, потребуется библиотека, удовлетворяющая определенным требованиям, связанным с извлечением текста и изображений. Как вы уже заметили, библиотека iText 7 не подходит для использования в Xamarin, так как отсутствует реализация System.Drawing в Mono. Ниже приведены рекомендации по выбору подходящего решения.

Выбор библиотеки

На сегодняшний день библиотека XFINIUM.PDF является одним из оптимальных вариантов для выполнения ваших задач, так как она соответствует всем вашим требованиям:

  1. Извлечение текстовых фрагментов с координатами: XFINIUM.PDF позволяет извлекать не только текст, но и информацию о его расположении на странице, что будет полезно для дальнейшей обработки текста. Вы сможете работать с "чанками" текста, получая информацию о координатах каждого фрагмента.

  2. Извлечение информации о шрифтах: Библиотека поддерживает извлечение названий шрифтов, что позволит вам получить информацию о стиле текста (например, курсив или жирный шрифт). Это крайне важно для сохранения форматирования при конвертации в ePub.

  3. Извлечение изображений с координатами: XFINIUM.PDF также предоставляет возможность извлечения изображений из PDF-документов. Вы будете получать не только сами изображения, но и их координаты на странице, что может быть полезным для дальнейшей компоновки содержимого ePub.

  4. Поддержка Xamarin: XFINIUM.PDF разработан с учетом кроссплатформенных решений, включая поддержку Xamarin. Это значит, что вы сможете интегрировать его в ваше Android-приложение без проблем, связанных с совместимостью.

  5. Бесплатная версия: Хотя XFINIUM.PDF является коммерческим продуктом, предлагаются различные варианты лицензирования, включая пробный период. Это позволит вам протестировать библиотеку и оценить ее функциональность, прежде чем принимать решение о покупке.

Заключение

Использование XFINIUM.PDF в вашем проекте может значительно сократить время разработки и повысить эффективность процесса конвертации PDF в ePub. Эта библиотека предоставляет все необходимые инструменты для успешного извлечения текста и изображений, а также обеспечивает поддержку платформы Xamarin. Рекомендуем ознакомиться с документацией XFINIUM.PDF и протестировать библиотеку, чтобы убедиться в ее функциональности и соответствию вашим требованиям.

Обратите внимание на другие альтернативы, однако XFINIUM.PDF выделяется своей функциональностью и поддержкой, что делает его удачным выбором для вашего проекта.

Оцените материал
Добавить комментарий

Капча загружается...