Вопрос или проблема
Существует ли бесплатное программное обеспечение на Ubuntu, которое может конвертировать pdf файл в .doc файл?
Скачайте Abiword
из Ubuntu Software Center
или установите его, выполнив следующую команду в терминале:
sudo apt-get install abiword
Затем выполните конвертацию:
abiword --to=doc example.pdf
openoffice
(или, альтернативно, форк libreoffice
) оба имеют плагины для импорта pdf и функциональность экспорта в .doc… хотя оба аспекта страдают от проблем с конвертацией, насколько я знаю.
Под этим я подразумеваю, что точность конвертации не всегда 100%.
Abiword также работает похожим образом, если OpenOffice не работает на вашей системе.
Я имел большой успех с PDF в Word онлайн. Это не настольное приложение, а сервис, который работает лучше, чем другие вещи, которые я использовал.
Установите AbiWord из Ubuntu Software Center
Открывайте PDF файлы с его помощью.
Используйте “Сохранить как…”, чтобы сохранить pdf в формате Word Doc.
Это так просто 🙂
Я предпочитаю сначала конвертировать PDF файлы в HTML с помощью pdftohtml, включенного в пакет poppler-utils, например, с помощью скрипта контекстного меню файлового менеджера, состоящего всего лишь из этой команды:
pdftohtml -noframes -q -p -c "$1" "${1%\.pdf}-img.html"
Затем я открываю полученный HTML файл в LibreOffice Writer и (после незначительного редактирования) использую “Сохранить как” в любой другой формат документа, который мне нравится.
Примечание: добавление параметра -i к командe выше создает HTML файл без изображений.
Метод LibreOffice
-
Сначала конвертируйте
.pdf
в.odt
, чтобы сохранить макет насколько это возможно:libreoffice --infilter="writer_pdf_import" --headless --convert-to odt "The file.pdf"
-
a) Откройте созданный файл The file.odt с помощью LibreOffice Writer и Сохраните как…
.doc
или.docx
b) или… конвертируйте из
.odt
в.doc
или в.docx
в командной строке:libreoffice --headless --convert-to doc "The file.odt"
Текст будет в многочисленных текстовых полях, однако.
Этот пост на форуме может помочь с текстовыми полями: https://forum.openoffice.org/en/forum/viewtopic.php?t=92422
Фильтры перечислены здесь: https://help.libreoffice.org/latest/en-US/text/shared/guide/convertfilters.html
NB! Если при открытии конвертированного файла в LibreOffice Writer вы получаете перекрывающийся текст, закройте файл без сохранения, откройте его снова и прокручивайте его очень медленно, примерно по одному единице прокрутки мыши в секунду.
PS: Возможно, это необходимо (он был установлен, когда вышеуказанное было сделано):
sudo apt install libreoffice-java-common
.
Ответ или решение
Программное обеспечение для конвертации PDF в Word на Ubuntu
Конвертация PDF-файлов в формат .doc может быть необходимой задачей для пользователей, работающих на операционной системе Ubuntu. К счастью, существует несколько бесплатных программ для выполнения этой задачи, каждая из которых имеет свои особенности и уровни качества конверсии. В этом ответе мы рассмотрим наиболее популярные и эффективные решения.
1. AbiWord
AbiWord — это легкий текстовый редактор, доступный в Ubuntu, который поддерживает конвертацию PDF в формат .doc. Чтобы установить AbiWord, выполните следующую команду в терминале:
sudo apt-get install abiword
После установки AbiWord вы можете выполнить конвертацию PDF следующим образом:
abiword --to=doc example.pdf
Это решение простое, но стоит отметить, что в зависимости от сложности PDF-файла, качество конвертации может варьироваться.
2. LibreOffice
LibreOffice предлагает более мощный набор инструментов для работы с документами, включая возможность импорта PDF-файлов и их последующей конвертации в .doc/.docx. Часто данный метод обеспечивает высокую точность конверсии.
Для конвертации PDF в ODT (формат LibreOffice), выполните команду:
libreoffice --infilter="writer_pdf_import" --headless --convert-to odt "The file.pdf"
После этого откройте созданный файл .odt в LibreOffice Writer и выберите «Сохранить как…», чтобы сохранить его в формате .doc или .docx. Можно также выполнить конвертацию в формате .doc через командную строку:
libreoffice --headless --convert-to doc "The file.odt"
3. OpenOffice
Вариантом LibreOffice является OpenOffice, который также поддерживает импорт PDF и экспорт в .doc. Однако, как отмечают пользователи, степень точности конверсии не всегда достигает 100%. Программа также требует корректной установки PDF-плагинов для полноценной работы.
4. Онлайн-сервисы
Если вы ищете более простое решение без установки дополнительного программного обеспечения, стоит обратить внимание на онлайн-сервисы, такие как PDF to Word online. Они могут обеспечить хорошую точность конверсии и не требуют скачивания дополнительных приложений.
5. Конвертация через HTML
Некоторые пользователи предпочитают конвертировать PDF сначала в HTML, используя утилиту pdftohtml
из пакета poppler-utils
. Для этого достаточно выполнить следующую команду (обычно без установки через менеджер пакетов):
pdftohtml -noframes -q -p -c "$1" "${1%\.pdf}-img.html"
Затем HTML-файл можно открыть в LibreOffice Writer и сохранить в необходимом формате.
Заключение
Существует множество способов конвертации PDF в формат .doc на Ubuntu, начиная от простых приложений, таких как AbiWord, до более мощных инструментов, как LibreOffice и OpenOffice. Выбор подходящего решения зависит от требований к качеству конверсии и удобству использования. Рассматривайте также онлайн-сервисы, которые могут предложить простоту и скорость. Однако в каждом из случаев важно помнить о возможных потерях в формате и макете документа после конвертации.
Выбор подходящего инструмента для конвертации PDF-файлов зависит от ваших личных предпочтений и конкретных задач. Не забудьте протестировать несколько из предложенных решений, чтобы найти наиболее подходящее для вас.