Как я могу разделить двусторонний отсканированный PDF на половинки за один проход?

Вопрос или проблема

У меня есть отсканированный курс, и он состоит из двух страниц, которые отображаются как одна страница. Как я могу автоматически разделить все страницы за один раз? Обычно это делается путем обрезки нечетных и четных страниц, а затем их объединения, но это может занять очень много времени?

Как можно разделить страницы в отсканированном PDF-файле за один раз?

Есть отличный, бесплатный и открытый инструмент под названием Briss. Он очень простой, удобный и эффективный. Работает на многих операционных системах через Java.

Загрузите ваш PDF в приложение. Приложение сгруппирует похожие страницы вместе и наложит их друг на друга. Нарисуйте прямоугольники поверх ваших страниц, чтобы они покрывали то, что вы хотите включить. Это будет выглядеть так:

введите описание изображения

Даже если ваш PDF имеет несколько категорий макета в одном документе, Briss справится с этим. Например, предположим, что некоторые части в портретной ориентации, а другие – в пейзажной. Briss сгруппирует их в разные категории и позволит вам рисовать разные прямоугольники на них, а затем обработать все это за один раз в один документ. Briss очень хорошо определяет, какие страницы следует группировать вместе. Обычно мне требуется менее минуты ручной работы, чтобы начать работу с Briss. Таким образом, документ, состоящий из сотен или даже тысяч страниц, можно сделать за пару минут благодаря этой блестящей программе.

Когда все будет готово, выберите Действие, затем Обрезка PDF.

Действительно, очень удобный инструмент.

Примечание: Я понимаю, что этот ответ звучит так, будто я разработчик Briss или что-то в этом роде, но это не так. Я просто люблю этот инструмент.

Вы можете использовать MuPDF и его mutool:

mutool poster -x 2 in.pdf out.pdf

После поиска в интернете ответов (это вопрос, который часто задают) я обнаружил, что это можно легко сделать, используя опцию Постер в меню Печать.

Шаги (для Adobe Acrobat XI):

  1. Выберите Печать из меню Файл или Ctrl+P
  2. Выберите Принтер как Adobe PDF
  3. Выберите вкладку Постер.
  4. Измените Перекрытие на 0 дюймов
  5. Настройте Масштаб плитки по своим потребностям, 100%(99%), если размер напечатанной страницы PDF совпадает с текущим размером страницы PDF, 75%, если размер напечатанной страницы PDF составляет половину текущего PDF. Настройте проценты “Масштаб плитки” по необходимости, чтобы получить желаемый результат. Для проверки печатного размера страницы PDF перейдите в правую часть комбобокса “Adobe PDF”, выберите Свойства и измените комбобокс Размер страницы Adobe PDF, если необходимо.
  6. Вы можете нажать кнопку Печать, когда страница отображается в виде, как вы хотите, проверьте пунктирную линию в окне предварительного просмотра:

введите описание изображения

Вот снимок экрана с описанными настройками:

введите описание изображения

Sejda.com может разделить отсканированные PDF-документы пополам, по середине. Работает на всех платформах для настольных компьютеров.

Вот краткое руководство:

Как разделить отсканированные PDF-документы пополам с помощью Sejda.com

Если это скан буклета и страницы больше не находятся в естественном порядке, он может переупорядочить их для вас.

Я разработчик этого проекта. Открытый код.

Существует две проблемы с автоматизацией разделения отсканированных книг за один раз:

  • Автоматизация не всегда точна
  • Сделать отсканированную книгу удобной для чтения – это не только разделение страниц

Для всего, что связано с отсканированными книгами, я настоятельно рекомендую использовать ScanTailor Advanced. Он имеет такие функции, как:

  • Поворот перевернутых страниц по вертикали,
  • Выбор содержания для уменьшения размера страницы,
  • Увеличение/уменьшение полей (возможно, для заметок),
  • Отбеливание результата для лучшего чтения.

Вы должны экспортировать PDF в изображения, чтобы использовать это, и заново объединить выходные изображения. Обработанные изображения могут быть очень маленькими по размеру файлы (вплоть до 6% от исходного размера), но отличного качества.

Из оригинального репозитория на GitHub:

Scan Tailor — это Свободное ПО (что больше, чем просто бесплатное ПО). Оно написано на C++ с Qt и распространяется по лицензии General Public License версии 3. Мы разрабатываем как версии для Windows, так и для GNU/Linux.

Другие советы

Чтобы завершить задачу удовлетворительно, я рекомендую использовать PDF-Xchange Viewer для извлечения изображений и добавления OCR, i2pdf для объединения выводов. По моему опыту, вы можете установить качество JPG на самый низкий уровень, и это не будет сильно заметно, но вы имеете возможность выбора между размерами конечного вывода и качеством изображения. Все программы бесплатные. Весь процесс занимает около 1 часа в фоновом режиме с периодическими проверками.

У меня также есть полное руководство по обработке отсканированных книг, вам, возможно, захочется его посмотреть: Полное руководство по обработке отсканированных книг.

ПС: Как создать иерархические закладки в отсканированных PDF-файлах?

Бесплатная (в смысле свободы) pdfarranger может это сделать.

Просто выберите страницы, которые вы хотите разделить, щелкните правой кнопкой мыши и выберите “Разделить страницы”:

введите описание изображения

введите описание изображения

.

Ответ или решение

Проблема разделения PDF-документа, содержащего сканы разворотов книг или учебных материалов, на отдельные страницы является достаточно распространенной задачей. Подходы к решению этой задачи варьируются от использования специализированного программного обеспечения до применения встроенных инструментов в PDF-редакторах, и все они имеют свои особенности и ограничения. В этом тексте мы рассмотрим несколько решений, которые помогут вам эффективно разделить сканированный PDF одним проходом.

Теория

Для начала стоит разобраться, какие задачи мы решаем, и какие требования предъявляются к процедуре разделения страниц. Проблема разделения заключается в том, что разворот, изначально объединенный в одну страницу, должен быть разбит на два отдельных изображения, так, чтобы каждое представляло собой свою страницу. Этому процессу мешает то, что автоматизация не всегда может учитывать все нюансы расположения текста и формата страниц. Любое программное решение должно быть способно распознавать границы страниц и с максимальной точностью выполнять их разрезку.

Примеры

  1. Briss — это превосходный бесплатный и открытый инструмент для обрезки страниц PDF. Программа на основе Java позволяет накладывать прямоугольники на страницы, которые необходимо вырезать, что делает процесс простым и интуитивно понятным. Briss автоматически группирует похожие страницы, позволяя пользователю задавать рамки обрезки для каждой группы.

  2. MuPDF (mutool poster) — это еще один мощный инструмент с командной строкой, который легко справляется с задачей разделения страниц. Его можно вызвать с параметром -x 2, что позволяет автоматически разделять каждую страницу на две отдельные.

  3. Adobe Acrobat (постерный режим печати) — данный метод использует встроенную функцию печати в Adobe Acrobat. Вы можете воспользоваться опцией "Poster" в меню печати, что позволит вам вручную задать параметры обрезки.

  4. Sejda — это веб-сервис, который специализируется на различных манипуляциях с PDF, в том числе на разделении страниц по середине. Это решение удобно для пользователей, которые предпочитают онлайн-сервисы без необходимости установки доп. ПО.

  5. ScanTailor Advanced — это инструмент для тех, кто хочет получить максимальный контроль над процессом. Хотя его использование требует дополнительных шагов, таких как экспорт PDF в изображения и повторная компоновка, он обеспечивает широкий спектр возможностей по улучшению качества сканов, включая корректировку перекоса и улучшение контраста.

Применение

Прежде чем выбрать метод, подумайте о том, что именно вам нужно: минимизация времени или наибольшая точность. Например, если вам важно сохранить исходное качество каждой страницы и у вас есть время и возможность для настройки, инструмент ScanTailor Advanced позволит достигнуть наилучшего результата. Для быстро и легкого решения MuPDF подойдет тем, кто уверенно работает с командной строкой, а Briss станет оптимальным выбором для пользователей, предпочитающих визуальные интерфейсы без лишнего функционала.

В общем, для эффективного разделения PDF важно определить свои приоритеты и выбрать инструмент в зависимости от задач. Если скорость является основным фактором, ориентируйтесь на автоматизированные подходы. Если же качество и детальная корректировка — используйте более сложные решения.

Заключение

На фоне цифровизации образовательных материалов и повышения объёмов сканирования печатных изданий, способность быстро и качественно разделять PDF на отдельные страницы становится все более востребованной. В таком контексте умение выбирать и эффективно использовать соответствующие программные инструменты является важным навыком для тех, кто работает с цифровыми документами. Выбор конкретного инструмента и подхода должен основываться на специфике задачи и ваших предпочтениях по рабочему процессу.

Оцените материал
Добавить комментарий

Капча загружается...