Chm2pdf linux как пользоваться

Обновлено: 07.07.2024

У меня есть два типа документа: CHM и PDF, но я бы предпочел, чтобы все они были в формате PDF.

Я ищу хороший способ изменить его. У кого-нибудь хорошие идеи? Я буду признателен.

Обновление: Спасибо за eveyone, который помог мне. :)

CHM - это в основном контейнер для файлов HTML. (CHM = C ompiled H T M L Help)

  1. Итак, сначала вам нужен декомпилятор CHM (вы можете использовать мастер справки HTML ). В итоге у вас будет множество .html, .css и других файлов.
  2. Затем используйте конвертер HTML-to-PDF по вашему выбору, чтобы преобразовать файлы HTML в PDF.

В Mac OSX ichm - бесплатный просмотрщик CHM, который имеет возможность сохранять в PDF.

Он работал для файла CHM, который онлайновый конвертер не поддерживал и был проще использовать, чем пытаться понять вывод extract_chmLib .

Для CHM2PDF и других форматов я использовал Calibre - приложение для управления и преобразования электронных книг, которое работает непосредственно со многими читателями электронных книг, включая Kindle, Sony Reader, Android и т. Д. Он может конвертировать из CHM в PDF, а также в / из EPUB, EBOOK, LIT, MOBI, RTF, FB2 и т. Д. Работает на многих платформах и является открытым исходным кодом.

В любом случае, имейте в виду, что CHM - это всего лишь куча сжатых файлов HTML с дополнительным TOC, индексом и поиском. Есть много инструментов для распаковки CHM, включая старый добрый 7zip:

В Windows CHM можно взломать с помощью встроенного средства просмотра справки Windows:

После распаковки файлов HTML вы можете открыть верхний индексный файл (обычно index.html ) в браузере и включить печать всех связанных страниц, если ваш браузер имеет эту опцию. Вы можете выбрать виртуальный принтер PDF вместо фактического принтера, который позволит вам получать PDF-выход.

На linux и OSX печать в формате PDF поддерживается готовым к использованию; для окон вам потребуется установить принтер PDF или использовать браузер, который может печатать в PDF ( Chrome имеет встроенную поддержку PDF , Firefox имеет расширение PDF ).

Кажется, что универсальный обложка для документов является хорошим выбором. Не пробовал, но он выглядит очень настраиваемым.

ps. Используя это решение, вам придется распечатать книгу или все, что она гласит по главе, если это не какой-либо корневой элемент, который содержит все главы.

С уважением, Fuzion

Я нашел Chm2Pdf Pilot весьма полезным. Он имеет некоторые параметры макета страницы и изображения изображений и ссылок внутри документа, что весьма полезно. Пробная версия просто добавляет небольшое уведомление в верхней части страницы, которое отлично подходит для личного использования.

У меня есть два типа документа: CHM и PDF, но я бы предпочел, чтобы все они были в формате PDF.

Я ищу хороший способ изменить его. У кого-нибудь хорошие идеи? Я буду признателен.

Update: Спасибо за eveyone, который помог мне.:)

ОТВЕТЫ

Ответ 1

CHM - это в основном контейнер для файлов HTML. (CHM = C ompiled H T M L Справка)

  • Итак, сначала вам нужен декомпилятор CHM (вы можете использовать HTML Help Workshop). В итоге у вас будет куча .html. css и другие файлы.
  • Затем используйте конвертер HTML-to-PDF по вашему выбору, чтобы преобразовать файлы HTML в PDF.

Ответ 2

В Mac OSX ichm - это бесплатный просмотрщик CHM, который имеет возможность сохранять в PDF.

Он работал для файла CHM, который онлайновый конвертер не поддерживал и был проще использовать, чем пытаться понять вывод extract_chmLib .

Ответ 3

Ответ 4

Ответ 5

Для CHM2PDF и других форматов я использовал Calibre - приложение для управления и преобразования электронных книг, которое работает непосредственно со многими читателями электронных книг, включая Kindle, Sony Reader, Android и т.д. Он может конвертировать из CHM в PDF, а также в/из EPUB, EBOOK, LIT, MOBI, RTF, FB2 и т.д. Работает на многих платформах и является открытым исходным кодом.

В любом случае имейте в виду, что CHM - это всего лишь куча сжатых файлов HTML с дополнительным TOC, индексом и поиском. Существует множество инструментов для распаковки CHM, включая старый добрый 7zip:

В Windows CHM можно взломать с помощью встроенного средства просмотра справки Windows:

Как только вы распакуете файлы HTML, вы можете открыть верхний индексный файл (обычно index.html ) в браузере и включить печать всех связанных страниц, если ваш браузер имеет эту опцию. Вы можете выбрать виртуальный принтер PDF вместо фактического принтера, который позволит вам получать PDF-выход.

В linux и OSX печать в формате PDF поддерживается из коробки; для окон вам необходимо установить PDF-принтер или использовать браузер, который может печатать в формате PDF (Chrome имеет встроенную поддержку PDF, Firefox имеет расширение PDF).

Ответ 6

Я нашел Chm2Pdf Pilot довольно полезный. Он имеет некоторые параметры макета страницы и изображения изображений и ссылок внутри документа, что весьма полезно. Пробная версия просто добавляет небольшое уведомление в верхней части страницы, которое отлично подходит для личного использования.

Ответ 7

p.s. Используя это решение, вам придется распечатать книгу или все, что она гласит по главе, если это не какой-либо корневой элемент, который содержит все главы.

С уважением, Fuzion

Ответ 8

Ответ 9

Универсальное обложка для документов кажется хорошим выбором. Не пробовал, но он выглядит очень настраиваемым.

Многие знают о формате Portable Document Format, благодаря которому мы видим на различных платформах документ так как его задумал автор. Чаще всего нам нужно просто прочесть какое-либо руководство в формате PDF и в Linux есть масса программ для просмотра. А что если нужно не только прочесть pdf файл?

что такое пдф?

Это прежде всего формат документа (Portable Document Format (PDF)), который был придуман фирмой Adobe Systems. Формат пдф был задуман как межплатформенный открытый формат электронных документов, что означает для пользователя избавление от массы проблем. Если вы видите документ в формате pdf на экране вашего устройства, то точно так же он будет выглядеть при печати. Вас не будут волновать размер полей, наличие шрифтов в системе и т.д. На практике, всё не так радужно, но, в целом, документы пдф вызывают меньше проблем, чем остальные. Не даром, формат пдф стал стандартом распространения различных справочных руководств. Считается хорошим тоном отправлять документы в формате pdf вашим адресатам, если не подразумевается дальнейшая правка. Формат пдф включает в себя механизм электронных подписей для защиты и проверки подлинности документов, что позволяет легко убедиться в авторстве документа.

pdfgrep. Поиск в pdf.

Если вы хоть раз использовали мощную утилиту grep, то вам сразу будет ясна работа pdfgrep. Отличие только одно. Grep оперирует строками, а PdfGrep страницами. PdfGrep умеет использовать мощь регулярных выражений, обходить рекурсивно каталоги при поиске, подсвечивать найденное.

comparepdf. Сравнение файлов pdf.

Вам стоит знать, что comparepdf не выводит вам в каком-либо виде различающиеся части. Утилита заточена под вызовы из программ для диагностирования самого факта различия или идентичности в pdf. Если вам необходим инструмент визуального сравнения документов, то переходите к Diffpdf.

Diffpdf.

DiffPDF используется для сравнения двух файлов формата PDF. По умолчанию в каждой паре страниц сравнивается текст, но можно сравнить и внешний вид. Например, изменение вставленной диаграммы или стиля абзаца. Кроме того, можно сравнить определённые страницы или страницы в определённых диапазонах. Например, если в первой версии файла формата PDF имеются страницы от 1 до 12, а во второй - от 1 до 13 (вставлена дополнительная страница 4), эти версии можно сравнить, страницы первой версии файла указав в диапазоне 1-12, а страницы второй — в диапазонах 1-3 и 5-13. Таким образом, DiffPDF выполнит сравнение страниц в следующих парах: (1,1), (2, 2), (3, 3), (4, 5), (5, 6) и далее до (12, 13).

Различия в PDF файлах

Картинки в pdf.

Если у вас есть серия изображений типа pic_*.jpg, то преобразовать в pdf можно командой ls -v | tr '\n' ' ' | sed 's/$/\ result.pdf/' | xargs convert Причём pic_10.jpg будет после pic_9.jpg, а не после pic_1.jpg, благодаря ключу -v.

PDF Toolkit (pdftk).

Если PDF документ - это "электронная бумага", то pdftk - это степлер, дырокол, сшиватель в одном флаконе. pdftk, словно швейцарский нож, умеет:

Из PDF в текст. Конвертер PDF.

Вызов pdftotext document.pdf document.txt позволит вам извлечь текст из pdf. Можно сразу вывести текст в простой html или xml. Если текст в pdf есть на фиксированных позициях, то есть возможность указать координаты и текст будет извлечён именно оттуда. Вызывая pdftotext document.pdf - | grep НужнаяСтрока , можно сымитировать работу pdfgrep.

Из PDF вытащить картинки.

Вызов pdfimages -j document.pdf images/ приведёт к тому, что в подкаталоге images/ будут находиться извлечённые файлы в формате PBM для монохромных изображений и PPM для цветных. Опции -png, -tiff, -j, -jp2 и -jbig2 сохранят соответственно в форматах PNG, TIFF, JPEG, JPEG2000 и JBIG2.

Из CHM в PDF.

Если хотите преобразовать свою коллекцию различных руководств в формате Microsoft Compiled HTML Help в Portable Document Format, то в этом поможет утилита командной строки chm2pdf. chm2pdf поддерживает пакетный режим, опции безопасности PDF, защиту паролем и режимы сжатия.

PDF Split and Merge (pdfsam).

Нельзя не отметить java программу PDF Split and Merge (pdfsam), которая в графическом режиме позволит сделать массу вышеописанного.

PDF Split and Merge

PDFSaM идёт в двух версиях, обе свободны. Базовая доступна в пакетах для Debian, Ubuntu и Arch Linux. Расширенная версия обладает всем функционалом, но доступна на официальном сайте лишь в виде исходного кода, хотя учитывая язык java, проблем с запуском программы быть не должно.

Если вы достаточно долго работали в Winows, то не могли не сталкиваться с файлами формата chm. Это ни что иное, как сжатая папка html с включенным индексным файлом для упрощенного просмотра содержимого. Проблема в том, что вы не сможете просматривать такие файлы в Linux без дополнительных утилит. Кроме того, иногда необходимо преобразовать такие файлы в другой формат. К счастью сообщество разработчиков Linux решило эту проблему, создав различные инструменты для работы с файлами chm.

В этом руководстве описывается как просматривать файлы chm и конвертировать их в html и pdf. Здесь описывается, как делать все это в Ubuntu, однако то же самое можно делать и в любом другом дистрибутиве.

Для просмотра существует отдельная простая в использовании утилита Xchm. Она умеет делать только одну вещь - показывать файлы chm. Эта программа позволяет просматривать оглавление (если оно существует) и перемещаться по документу, менять шрифт и производить поиск.

После установки программа будет доступна из подменю "Офис". Запустив ее вы убедитесь, насколько прост ее интерфейс.

Чтобы редактировать эти документы, необходимо конвертировать их в формат html. Для этого необходима утилита CHMLIB. Установите ее командой

После установки можно приступать к конвертированию:

Следующая задача - конвертировать полученный html в документ формата pdf. В этом вам поможет программа htmldoc. Во-первых, установите ее:

Это графическая утилита, которая позволяет добавить несколько файлов html, которые будут конвертированы в один файл pdf. Интерфейс пользователя очень прост.

Кроме того, вы можете сами попробовать задавать различные опции в других вкладках, но самый простой путь - прямая генерация обычного PDF.

Комментариев нет:

Подпишитесь на RSS


Перевод. Оригинал здесь. Если вы новичек в Linux и ранее использовали iTunes для управления своим iPod/iPhone/iPad, то скорее всего буд.

uTorrent - это легкий и эффективный торрент-клиент для Linux, Windows OS и Mac OS. Установка uTorrent в Linux отличается тем, что здесь uT.

Вы можете запускать скрипты на python в Linux непосредственно из терминала. Знать, как это делается, полезно как программистам, так и пол.

Как вы наверное знаете, Safari является браузером по умолчанию в Mac OS X и iPhone OS. Вышло уже несколько релизов и для Windows, но версии .

Способ сброса пароля root в CentOS 7 кардинально отличается от такового в Centos 6. 1. В загрузочном меню нажмите "е" - реда.

Читайте также: