Композитные файлы в формате pdf

Обновлено: 07.07.2024

Все чаще и чаще в современных издательских технологиях используется PDF. Многие задачи, ранее решавшиеся традиционными подходами, вовлекаются в технологические процессы, построенные на базе этого формата. Создание PDF разрешило немало проблем, но не заменило многих уже устоявшихся технологий. К тому же для работы с PDF часто требуются дополнительные инструменты. Для устранения нежелательных результатов на этапе вывода может потребоваться выполнение серии специальных операций. Мы рассмотрим проблемные ситуации, которые чаще всего возникают при работе с PDF, и обсудим методы их разрешения.

Обработка PDF

C технической точки зрения PDF-документ представляет собой «очищенный файл PostScript», отличающийся значительной компактностью и удобством работы. Естественно, возникает мысль о том, что обработка PDF должна занимать меньше времени. В общем случае, это действительно так. Тем не менее в определенных ситуациях процесс растрирования файлов PDF происходит медленнее.

При работе растрового процессора не существует какого-либо установленного правила, определяющего экономию времени при обработке PDF. Мы провели несколько тестов по растрированию файлов и отметили лишь небольшие расхождения по времени. Иногда файлы PDF выводились быстрее, а иногда и медленнее, чем PostScript. Все дело в методе организации данных о графических объектах внутри соответствующего файла.




Известно, что растровые процессоры предпочитают следующий вид организации CMYK-данных: CCCMMMYYYKKK. То есть сначала мы получаем всю информацию о голубом цвете, затем о пурпурном, желтом и черном. Для просмотра же документов на экране лучшей организацией CMYK-данных является следующая: CMYKCMYKCMYK. Здесь сначала происходит отображение 1 байта информации о голубом цвете, затем по 1 байту о пурпурном, желтом и черном цветах. После этого выводится второй байт информации о триадных цветах и т. д. В английской терминологии эти методы известны как «planar» (рис. 1) и «chunky» (рис. 2). Для Adobe Acrobat предпочтителен второй способ. QuarkXPress всегда растрирует файлы EPS CMYK первым методом.

Примечательно, что файлы TIFF первоначально организуются как файлы «chunky», но во время передачи данных на RIP QuarkXPress переводит их в модель «planar». Это, в свою очередь, увеличивает быстродействие самого RIP. Acrobat Distiller, к сожалению, конвертирует все CMYK-данные в файле PDF по второму способу. Этим иногда и объясняется, что PDF требует для обработки больше времени, чем исходный PostScript-файл. Для решения этой проблемы советую использовать системы с OPI (Open Prepress Interface). В этом случае в документе PDF будут храниться версии изображений с низким разрешением. Такая система, как, например, CANopi конвертирует все данные изображений с высоким разрешением в форматах TIFF и EPS в модель «planar», и только потом посылает их на RIP.

Система Helios EtherShare OPI 2.0 поддерживает следующий способ организации данных: метод «chunky» для TIFF-файлов и «planar» – для EPS. Для обеих систем не важен метод, по которому Distiller выстраивает данные в файлах с низким разрешением в PDF. Отмечу, что некоторые RIP перед выполнением своей работы также способны оптимизировать порядок следования графической информации.

Размер файлов

Создавая документ PDF при помощи Acrobat Distiller, вы можете заметить, что в некоторых случаях его размер превышает исходный файл PostScript. Это объясняется особенностью поведения программы при работе с графикой. Когда Distiller обрабатывает PostScript-файл, он распаковывает все сжатые изображения, а затем снова осуществляет их компрессию согласно заданным параметрам в Job Options. Таким образом, если вы дистиллируете файл, в котором уже имеются уплотненные изображения, и при этом в Distiller отключена опция компрессии или выбраны установки низкой степени сжатия, размер выходного PDF-файла может быть гораздо больше исходного. Решением проблемы является активация режима сжатия в Job Options. Но не забудьте, что если файл PostScript уже содержит изображения, подвергнутые jpeg-компрессии, и при этом вы выбираете тот же алгоритм сжатия в Distiller, вся графика будет сжата повторно с неизбежной потерей ее качества. Самой же компании Adobe уже давно следовало бы обратить внимание на отсутствие поддержки Distiller заданной заранее jpeg-компрессии изображений. Несложно заметить, что компрессия средствами данной программы оказывается менее эффективной, чем выполнение той же работы при помощи графического пакета.

Отсутствие Overprint

Другая проблема заключается в неспособности формата PDF воспроизводить заданные в других приложениях параметры наложения цветов. В результате, можно наблюдать некорректное отображение документа на экране и его неправильный вывод на ФНА. Как известно, обе версии PDF 1.2 (Acrobat 3.0) и 1.3 (Acrobat 4.0) поддерживают Overprint, но не способны его отображать.


В данной ситуации может помочь набор инструментов InProduction, а также использование дополнительного модуля PitStop компании Enfocus Software, позволяющего не только проверить наличие Overprint у любого объекта файла PDF, но и непосредственно задать его. В любом случае полезно проверить в Distiller активизацию режима «Preserve overprint settings» (рис. 3), иначе информация о наличии Оverprint просто отбросится. Если вы работаете с QuarkXPress 3.3х или более ранней версией, то уже, вероятно, заметили неспособность программы создать файл PostScript, объектам которого задано надпечатывание. В данном случае при печати в файл необходимо вместо PPD использовать PDF-драйвер. Другим надежным решением является использование возможностей некоторых RIP, таких как Agfa Taipan и Viper, в части назначения черным объектам режима Overprint.

Печать «под обрез»

Одна из известных трудностей при работе с PDF – невозможность распечатать изображения, сверстанные «под обрез». В спецификации формата PDF вплоть до версии 1.3 компания Adobe не указала способа задания подобных документов. Хотя эта ошибка и была исправлена в версии 1.3, однако еще не все программы способны правильно поддерживать новый процесс конвертации, и для проверки наличия Bleed в PDF-файле необходимо использовать дополнительные модули — Agfa BleedArea или тот же самый Enfocus PitStop.

Первый модуль поставляется только с системой Agfa Apogee. Однако, можно воспользоваться решением той же фирмы в виде программы Normaliser, выступающей в качестве альтернативы Acrobat Distiller. Normaliser работает с QuarkXPress и доступен только с Apogee Pilot или Apogee Create. Кроме того, для QuarkXPress существует специальное дополнение ExpertOption for Distiller 4.0 компании Lupin Software, позволяющее обойти данную проблему.

Если же оставить модули в покое, то можно выполнить печать, задав метки обреза в программе верстки, а затем применив кадрирование в Acrobat Exchange для возврата PDF-документа к исходному размеру. Кадрирование в этом случае не отбрасывает «обрезанную» информацию, так что изображения за границей листа не теряются. К сожалению, у этого метода выявлены два недостатка. Это довольно рутинная работа, требующая значительных затрат времени. И для ее выполнения необходимы сотрудники высокой квалификации. Вместо кадрирования PDF можно сохранить информацию о метках обреза, а все дальнейшие операции выполнить в программе спуска полос.

Шрифты

Генерируя PDF-документ, Acrobat Distiller должен определять все шрифты PostScript-файла и включать их в PDF. Если данные о шрифтах отсутствуют, программе приходится встраивать свои. Однако это случается не всегда. Существует 14 шрифтов, которые Acrobat Distiller 3.0 никогда не включает в файл PDF. К ним относятся Symbol, Zapf Dingbats, а также различные начертания гарнитур Courier, Times и Helvetica. Acrobat 4.0 встраивает все шрифты PostScript Type 1, но не обязан включать все файлы TrueType, поскольку разработчик шрифта имеет право внести некоторые, так называемые лицензионные, ограничения на использование конкретной гарнитуры.

В действительности, Acrobat 4.0 является первым приложением, которое учитывает лицензионную политику и наложенные ограничения производителя. Неудивительно, что Distiller просто игнорирует такие шрифтовые файлы. К числу «дискриминируемых» шрифтов относятся некоторые устаревшие системные шрифты фирмы Apple. Недавно Apple изменила свои принципы, и теперь все файлы TrueType, поставляемые вместе с MacOS, могут встраиваться в файлы PDF. К этой же категории относятся некоторые шрифты различных версий программы WordPerfect.

Может показаться, что наличие шрифтов, встроенных в документ PDF, гарантирует их использование при выводе файла. К сожалению, это не всегда так. Если PDF-файл содержит тот же шрифт, что и RIP, то RIP воспользуется своей версией. И это может привести к некорректному выводу файла на пленку.

Цвета


Если вы обнаружили, что всем объектам в PDF-файле задана модель RGB, хотя в исходном документе использовали CMYK, прежде всего проверьте установки Distiller и удостоверьтесь, что в окне Job Options отключена опция «Convert CMYK Images to RGB», а в группе Color Conversion активизирован режим «Unchanged» (рис. 4). Иногда может возникнуть необходимость отредактировать используемый для создания PDF файл PPD. Некоторые приложения, например, FrameMaker и PageMaker, учитывают цветовое пространство, заданное по умолчанию в PPD. Для Acrobat 4.0 должна быть определена модель CMYK, а для версии 3.0 – по умолчанию пространство RGB. PageMaker 6.52 считывает эти установки и заменяет все значения CMYK на соответствующие значения RGB. Для корректного отображения в PDF-файле цветового пространства необходимо проделать следующие шаги:

Открыть файл PPD;
Задать поиск строки: «*Default ColorSpace: RGB»;
Заменить RGB на CMYK;
Сохранить PPD и снова создать документ PDF.

В программе FrameMaker для Macintosh CMYK-изображения могут конвертироваться в модель RGB в случае некорректной установки Acrobat Distiller.

Очень часто сложные ситуации возникают с файлами офисных программ наподобие Microsoft Word. После конвертации таких файлов в PDF и выводе на ФНА тест оказывается цветоделенным. Дело в том, что офисные программы определяют все цвета в модели RGB. Чистый черный цвет выражен нулевыми значениями R, G и В. Когда же PostScript RIP преобразует цвета в модель CMYK, вместо одного канала черного цвета он использует четыре.

Существуют два различных подхода к решению проблемы. В некоторых растровых процессорах можно изменять алгоритм цветоделения. В таком случае полезно обратиться к поставщику, чтобы узнать о наличии данной функции у вашего RIP.

Можно воспользоваться дополнительными модулями к Acrobat, такими как Quite-a-box-of-tricks компании Quite Software и Enfocus PitStop 4.0. Они позволяют заменить все цвета, имеющие равные значения R, G и В, на эквивалентный цвет модели CMYK.

Кроме того, проблема может быть вызвана и применением в приложениях систем управления цветом (CMS). Эти системы призваны улучшить цветопередачу, но, с другой стороны, могут вызвать и беспорядок в работе. Решение же очевидно: отключите CMS.

Вывод файлов

В тех случаях, когда ваш PDF-документ содержит изображения с высоким разрешением, особое внимание следует уделить процессу их вывода, иначе вы рискуете получить не то, что ожидали. Этому может способствовать использование файлов DCS в программах верстки. Графика в формате DCS уже подвергнута цветоделению и состоит из одного файла низкого разрешения для просмотра (композитный файл) и четырех с высоким разрешением каждого цвета. Такие приложения, как QuarkXPress и Adobe PageMaker, используют именно данные композитного файла. Поэтому, если вы работаете с PageMaker, вам следует пересохранить все файлы DCS в формат EPS в Adobe Photoshop, обновить связи и снова создать документ PDF. То же решение работает и в QuarkXPress, однако вы можете воспользоваться множеством дополнений, автоматически устраняющих данную неприятность. Например, SmartXtension. Во время генерации QuarkXPress файла PostScript это расширение определяет все данные о файлах с высоким разрешением.

Существует несколько путей создания PDF. Один из них —использование программы PDF-Writer. Вследствие особенного механизма работы данной программы она не совсем правильно обрабатывает графику в формате EPS. PDF-Writer включает в PDF-документ только экранную версию EPS, поэтому при выводе получаются изображения с низким качеством. Совет: используйте Acrobat Distiller.

Другой проблемой, с которой вы можете столкнуться при выводе PDF на ФНА, является присвоение всем цветам одного и того же угла наклона растровых сеток. В этом случае вам прежде всего следует задать себе следующие вопросы:

Уверены ли вы, что задали в приложении рациональные значения линиатур и углов растра?

Активизировали ли вы в Distiller опцию «Preserve halftone information»?

Отключили ли вы режим «Use printer’s halftone screens»?

В том случае, если на все вопросы вы ответили положительно, советую подумать о следующем. Проблема с некорректно заданными углами часто возникает в уже цветоделенных файлах PDF, т. е. файлах, где каждая страница содержит только один триадный цвет (если вы печатаете документ и задаете «separations» в QuarkXPress) и отображается в оттенках серого. Причем RIP использует значения углов по умолчанию, обычно равные 45 градусам для черного цвета. Поэтому вы можете обойти эту неприятность, создавая композитные цветные файлы PDF, а цветоделение поручать RIP (in-rip separation). В этом случае RIP точно определит углы наклона растра для каждой фотоформы. Замечу, что некоторые растровые процессоры позволяют изменять значения углов, заданные по умолчанию, каждый раз, когда вы посылаете задание на вывод отдельной страницы PDF. Кроме того, существует облегченное решение в виде модуля Crackerjack, позволяющего осуществлять аналогичные операции.

В итоге хотелось бы отметить, что описанные выше методы не идеальны. Не спорю, что, вероятно, существуют другие, более эффективные подходы к решению тех или иных задач в области PDF. Все определяется практикой и опытом. Тем не менее надеюсь, что данная статья поможет вам разобраться в ваших ошибках.

Формат переносимых документов (PDF) представляет собой универсальный файловый формат, который позволяет сохранить шрифты, изображения и сам макет исходного документа независимо от того, на какой из множества платформ и в каком из множества приложений такой документ создавался. Формат Adobe PDF считается признанным общемировым стандартом в области тиражирования и обмена надежно защищенными электронными документами и бланками. Файлы Adobe PDF имеют небольшой размер, и они самодостаточны; они допускают совместную работу, просмотр и печать с помощью бесплатной программы Adobe Reader®.

Сохраняя документ в формате PDF, можно создать файл, соответствующий стандарту PDF/X. Формат PDF/X (формат обмена переносимыми документами) является разновидностью Adobe PDF, которая не допускает использования многих вариантов и сочетаний данных о цветности, шрифтов и треппинга, которые могут вызвать осложнения при печати. Документ PDF/X следует создавать в случае, когда PDF-файлы используются как цифровые оригиналы при допечатной подготовке изданий - как на этапе создания макета, так и для целей фотовывода (если программное обеспечение и выводящие устройства способны работать с форматом PDF/X).

Формат PDF может помочь при следующих затруднениях, обычно возникающих в работе с электронными документами.

Чем полезен Adobe PDF

Присланный файл невозможно открыть, поскольку у получателя отсутствует приложение, в котором он был создан.

Где бы пользователь ни находился, он всегда сможет открыть документ PDF. Для этого достаточно иметь бесплатную программу Adobe Reader.

В архиве, который содержит электронные и бумажные документы, сложно найти нужный документ, а сам архив занимает немало места и требует наличия приложения, в котором документ был создан.

Документы PDF компактны и удобны для поиска; для их чтения достаточно иметь приложение Reader. Наличие ссылок облегчает навигацию внутри документа PDF.

Документы отображаются в карманных устройствах с искажениями.

Расстановка тегов позволяет перекомпоновать текст документа PDF специально для возможности открывать такие файлы на мобильных платформах, таких, как Palm OS®, Symbian™ или Pocket PC®.

Документы со сложным форматированием недоступны людям с плохим зрением.

Документы PDF с гипертекстовой разметкой содержат сведения о информационном наполнении и структуре, благодаря чему они отлично обрабатываются программами и устройствами для чтения с экрана.

InCopy встраивает шрифт только в том случае, если он содержит заданный поставщиком параметр, разрешающий встраивание. Встраивание предотвращает подстановку шрифта при просмотре или печати файла, благодаря чему читатель видит текст, набранный исходной гарнитурой. Увеличение файла вследствие встраивания шрифтов незначительно, если в документе не используются CID-шрифты (с многобайтовыми идентификаторами символов), обычно применяемые для азиатских языков, в которых один глиф создается на основе нескольких символов.

Для каждого шрифта InCopy может встроить шрифт целиком или только его подмножество — конкретные символы, называемые глифами, которые использованы в этом файле. Сокращение знакового состава, при котором формируется уникальное имя шрифта, позволяет при печати использовать первоначальный шрифт и его метрику. Встраивание подмножества шрифта влияет на размер файла и на возможность последующего редактирования файла.

Если InCopy не может встроить шрифт, вместо него временно подставляется одна из гарнитур Multiple Master — AdobeSerMM для отсутствующего шрифта с засечками либо AdobeSanMM для шрифта без засечек.

Эти гарнитуры шрифта допускают растяжение или сжатие, что позволяет сохранить разбиение на строки и разрыв страницы исходного документа. При подстановке не всегда удается воспроизвести форму с исходными буквами, особенно если программа сталкивается с нестандартной, например рукописной, гарнитурой шрифта.


Если использована нестандартная гарнитура (слева), символы шрифта, использованного для подстановки, не всегда похожи (справа).

Почему PDF-файлы популярнее DOC, созданных в Microsoft Office, и именно PDF является самым распространенным типом документов в интернете и корпоративном сегменте? Начнем с того, что он универсален и позволяет сохранять текстовые данные и шрифты, таблицы, изображения и даже макеты исходных документов. При этом не важно, в какой из программ ранее файл был создан.

Отлично зарекомендовал себя в издательском и печатном деле благодаря возможности сохранять композитные макеты, состоящие из текста и графики, которые можно с легкостью редактировать, сортировать и просматривать, получая визуальное представление будущего материала.

Одна из разновидностей PDF – PDF/X. Этот стандарт не допускает изменения цветности, треппинга и шрифтов в документах, которые уже готовы для печати. Расширение создается в том случае, если макет применяют в качестве цифрового оригинала при подготовке издания журнала/газеты, или в целях фотовывода с помощью специализированного ПО.

Создание PDF файлов

В качестве примера разберем несколько способов:

  • Adobe Acrobat;
  • Microsoft Word;
  • Foxit Reader;
  • виртуальный принтер.

Adobe Acrobat

Вам потребуется официальное ПО от Adobe. Небольшое уточнение: именно Acrobat, а не Acrobat Reader. Последняя служит только для чтения готовой документации. Открываем программу и жмем на меню «Файл», после чего выбираем пункт «создать PDF» – из файла. Вариант пригоден в случае, если вам нужен одностраничный документ.

Если файлов много, выбирайте соответствующий пункт «из нескольких файлов». В открывшемся окне нажмите «добавить файлы» или «добавить папки». После того, как вы отыскали все необходимые документы, их требуется рассортировать по порядку. Для этого выделите один и двигайте его стрелками «вверх/вниз» внизу диалогового окна. Хотите преобразовать не все документы, а только отдельные страницы? Используйте кнопку «выбрать страницы». В конце процедуры нажмите «Следующий».

После создания остается только выбрать путь сохранения и дать название новому документу. К слову, Acrobat Reader может не только преобразовывать файлы в PDF, но и экспортировать их в Word, HTML и графические файлы.

Microsoft Word

В первом случае понадобится Office 2007, или более поздняя версия продукта. Для начала открываем файл, который в дальнейшем должен стать PDF, затем жмем в Word команду «Файл» и выбираем «Сохранить как». Остается только выбрать путь, куда перекочует будущий документ. Самое важное – выбрать «PDF» в поле «тип файла». После этого окончательно сохраняем и проверяем каким-либо ПО для чтения PDF-документа.

К слову, подобная процедура также возможна и в других программах линейки Office:

Если в строке «тип файла» отсутствует нужное расширение, нужно установить надстройку, которая качается с официального сайта Microsoft. Там же указана инструкция по инсталляции и требования к системе.

Foxit Reader

Данная программа хороша тем, что способна создавать PDF документацию несколькими способами:

  • из файлов другого формата;
  • из сканированных изображений;
  • из данных буфера обмена.

Откройте программу и кликните на «Файл», после чего перейдите в меню «Создать»:

  • пустой;
  • из файла;
  • из сканера;
  • из буфера.

С первым вариантом вопросов не возникает. Второй вызовет диалоговое окно, в котором нужно указать исходный документ для последующей конвертации его в PDF. Вариант «из сканера» позволяет запустить сканирующее устройство и на основе полученных с его помощью изображений создать готовый документ.

Наиболее интересный вариант – «из буфера обмена». Нужно предварительно скопировать содержание документа, а затем нажать кнопку. Огромный минус способа в том, что форматирование не сохраняется, а картинки (если вы их тоже скопировали) не вставляются. Приходится делать все вручную.

Виртуальный принтер

Довольно распространенный способ, который требует от пользователя заранее установленной программы для чтения PDF-документов (Adobe Reader, Foxit Reader и т.д.). Исходный файл может быть создан в Word/Excel/Power Point и не только. Требуется открыть меню «Файл» и выбрать пункт «Печать».

Здесь настраиваются все параметры, как для стандартной печати на физически существующем принтере: количество страниц, диапазон. Теперь остается выбрать в поле «Принтер» программу для чтения PDF, которую вы инсталлировали ранее. Таким образом Microsoft Office создаст требуемый тип документа.

В нашем блоге мы уже обсуждали специфику стандартов DjVu, FB2 и FB3. Сегодня рассказываем про формат PDF, который стал воплощением мечты о «безбумажном офисе».



/ Flickr / Kim Siever / PD

Краткая история формата

Создателем PDF, или Portable Document Format, выступил Джон Уорнок (John Warnock), один из основателей Adobe, который захотел облегчить процесс распечатки текста и изображений с компьютера. В 1984 году Уорнок представил язык описания страниц PostScript.

В «Википедии» в качестве примера приводится код на PostScript, который отрисовывает несколько слов «Wikipedia» по кругу.


Изначально PostScript разрабатывался как инструмент для распечатки документов на принтере, но позже Уорнок решил, что с помощью нового языка можно не только выводить документы на печать, но и полностью «оцифровать» систему документооборота.

В рамках этого видения в Adobe (основателем которой был Уорнок) создали формат IPS (расшифровывается аббревиатура как Interchange PostScript). Для работы с ним был создан Adobe Illustrator — кроссплатформенный графический редактор для Windows и Mac.

Впервые IPS показали на конференции Seybold в Сан-Хосе в 1991 году, но с таким названием формат просуществовал два года — в 1993 его переименовали в PDF. Тогда же появились Acrobat Distiller и Acrobat Reader (позднее переименованная в Adobe Reader).

Первое время PDF не пользовался популярностью. Всему виной была высокая цена на софт: Acrobat Distiller для личного пользования стоил 700 долларов, а для корпоративного — 2500 долларов. За Acrobat Reader просили еще 50 долларов. Со временем Adobe снизили цены, и популярность PDF стала набирать обороты.

К началу нулевых Acrobat Reader 4.0 скачали сто миллионов человек, а PDF-формат стали использовать крупные ИТ-компании, например Microsoft и Apple.

Как «работает» PDF

Базовый подход к представлению графики и текста в PDF очень похож на тот, что использовался PostScript. За отображение текста на странице отвечают так называемые текстовые элементы. Они обозначают, в каком месте должны быть отрисованы символы. На «Википедии» приводится код для написания Hello World:


Для отрисовки векторной графики в PDF используются контуры (paths): прямые линии или кубические кривые Безье. Фигуры, построенные с помощью контуров, можно залить цветом или заштриховать. Что касается растровых изображений, то их представляют в виде словарей и потоков. В словарях описаны свойства, а поток содержит двоичную информацию об изображении.

Размер PDF-файла зависит от разрешения картинок, параметров шрифтов, использования гиперссылок, видео и проч. До двухтысячных годов размер PDF-файлов измерялся мегабайтами, потому что большинство документов составляли из JPEG-картинок. Для решения этой проблемы в Adobe предложили технологию сжатия MRC (Mixed Raster Content).

MRC «делит» отсканированный файл на слои: фоновый слой, слой текста и цветовую маску. За сжатие информации, имеющейся на каждом слое, отвечает свой кодек. Например, для текста может использоваться JBIG2, который формирует группы из похожих букв и составляет из них словарь. Так, одинаковые символы кодируются по одному разу, а в остальных местах используются просто ссылки на них.

Для сжатия другого контента задействуют кодеки JPEG, JPEG2000 или ZIP. С помощью них сохраняются фон изображения, цветовыделение текста, картинки и фотографии. За счет такого подхода размер каждой страницы уменьшается в два раза и более. Наглядные примеры сжатия PDF приводит компания Abbyy в их блоге на Хабре.

Достоинства формата PDF

Одним из главных достоинств PDF-файлов является тот факт, что все страницы выглядят именно так, как их задумал автор документа. Формат сохраняет оригинальный фон, шрифты и картинки в первозданном виде, независимо от устройства или операционной системы. При этом PDF позволяет работать с интерактивными элементами: гиперссылками для навигации по сноскам. Также в документ добавляются медиафайлы: музыка, GIF и даже видеоролики.

При этом PDF-файл можно сделать доступным только для чтения, что помогает защитить содержимое документа от копирования и внесения изменений. Для дополнительной защиты есть возможность поставить пароль или электронную подпись.

Другое достоинство формата — его доступность. Программа для чтения PDF-документа Adobe Acrobat Reader сегодня лежит в сети в свободном доступе. Открывать PDF можно и на электронных книгах. Большая часть из них «умеет» работать с этим форматом по умолчанию. Его поддерживают многие приложения-читалки, например, FBreader или NEO Reader.

Минусы формата

На рынке есть электронные читалки с разрешением дисплея в 13,3 или 10,3 дюйма, что позволяет комфортно работать с листами PDF формата А4. Примерами таких гаджетов могут быть ONYX BOOX MAX 2 (обзор которого мы подготовили в нашем блоге), ONYX BOOX Note или ONYX BOOX Gulliver (на него тоже есть обзор). Они дают возможность рассмотреть все детали чертежей и иллюстраций в оригинальном размере и подойдут тем, кому часто приходится читать техническую литературу. Однако стоимость таких гаджетов довольно высока.

Возникает и другая проблема с отображением страниц документов. Она связана с форматом JBIG2. Хотя кодек позволяет сжать текст в несколько раз, он подвержен влиянию проблемы «инь» (о ней мы писали в материале про DjVu). При сжатии текста и составлении словаря некоторые символы заменяются на похожие (например, «и» превращается в «н»), что приводит к искажению сути текста.

С редактированием PDF-файлов также возникают проблемы, так как для этого приходится устанавливать специальные программы, которые часто платные (например, Acrobat DC). В сети найдутся и бесплатные сервисы для редактирования вроде PDF2GO, но они позволяют лишь добавить текст или картинки «поверх» оригинального файла.

Дальнейшее развитие

Несмотря на недостатки, сегодня PDF остается популярным форматом. Маркетинговая компания HubSpot спросила три тысячи посетителей своего сайта о том, что они делают с электронными книгами: читают онлайн или скачивают в PDF. Выяснилось, что 90% респондентов предпочитают скачивать PDF-файл.

Разработчики постоянно добавляют новые фичи, в том числе и для чтения на портативных гаджетах. К примеру, в начале 2018 команда Adobe снабдила приложение Acrobat DC улучшенными функциями отображения и редактирования файлов на мобильных устройствах.

Кроме того, в августе появились сведения о новом проекте — PDF audible. Он позволит совместить возможности PDF и функциональность голосовых помощников: Alexa, Google Home и Siri. Пока готов только прототип, но разработчики обещают выпустить рабочую версию в ближайшее время.

В Adobe следят за новыми направлениями и намерены сделать формат более интерактивным, например, добавить функции дополненной реальности. Как это будет выглядеть, пока не ясно, но разработчики обещают, что PDF-экосистема в ближайшие годы выйдет на новый уровень взаимодействия с пользователем.

Читайте также: