Как проверить pdf файл

Обновлено: 04.07.2024

Проверка файлов PDF- это процесс проверки наличия и достоверности всех цифровых данных, необходимых для печати задания. В настоящее время это обычно PDF-файлы, которые отправляются в типографию. Формат файла PDF является надежным стандартом для обмена страницами, начиная от отдельных объявлений и заканчивая публикациями. Использование PDF, однако, не гарантирует, что получатель файла сможет действительно вывести его, как и предполагалось. Чтобы убедиться, что файл соответствует требованиям для правильного воспроизведения, его нужно проверить или «предварительно проверить». На этой странице представлен обзор

  • причины для предварительной проверки файлов
  • инструменты, доступные для проверки содержимого страницы
  • кто должен делать проверку и когда это должно быть сделано
  • какие настройки лучше всего использовать

В случае, если вам интересно: термин предполетный полет был получен из длинного списка проверок, которые пилоты должны выполнить перед взлетом на самолете.

Проверка файлов PDF. Как выполнить ?

Зачем предварительно проверять файлы PDF?

Проверка файлов в основном делается для того, чтобы избежать проблем при обработке или печати содержимого.

Как выполнить предварительную проверку файлов PDF?

На рынке существует ряд предполетных решений.

Какой движок вы выберете, зависит от необходимого уровня автоматизации, различных типов файлов, которые должен обрабатывать движок, платформы, на которой должно работать приложение (Mac, PC,…) и доступного бюджета. Рекомендуется использовать решение, сертифицированное GWG и появившееся в списке приложений . Таким образом, вы уверены, что предполетная система может корректно справляться с общими требованиями рынка.

Кто должен , когда? Проверка файлов PDF

Чем раньше в процессе обнаруживаются проблемы, тем проще и дешевле их устранять. Это подразумевает, что дизайнеры должны предварительно проверить свои творения перед отправкой в ​​свое агентство или типографию.

Принтеры или сервисные бюро всегда должны предварительно проверять поступающие данные, просто чтобы убедиться, что качество доставляемого ими продукта соответствует требованиям клиента. Проверка файлов PDF

Стоит знать, что есть две технологии, которые обеспечивают предварительную проверку файлов только один раз. Это Enfocus «Сертифицированный PDF» и рабочая группа Ghent «Универсальное доказательство предпечатной проверки». По сути, обе системы позволяют приложению предварительной проверки встраивать метаданные в проверенный PDF-документ, чтобы документировать, как файл был проверен. Получатель такого файла должен только проверить, присутствует ли эта «печать».

Что нужно проверить во время предполетной проверки? Проверка файлов PDF

Вещи, которые необходимо проверить в файле, зависят от его предполагаемого использования. Это означает, что невозможно предоставить единый набор правил, применимых к каждому возможному типу работы или печати. Ниже приводится общее описание того, что следует проверять и почему оно проверяется, включая причину, по которой проводится каждая проверка. Обзор основан на спецификациях GWG v4 , насколько мне известно, единственного международного стандарта, который описывает требования к готовым к печати файлам PDF. Я упростил их рекомендации здесь и там, чтобы обзор не стал слишком длинным.

Содержимое документа PDF можно проверить на соответствие критериям PDF/X, PDF/A, PDF/VT или PDF/E. Копию файла PDF можно сохранить в формате PDF/X, PDF/A или PDF/E, при условии, что он соответствует указанным требованиям. Например, при определенных обстоятельствах ICC-профиль, который описывает устройство назначения, необходим для совместимости с форматами PDF/X-1a, PDF/X-3 и PDF/X-4. Если документ не располагает встроенным профилем вывода ICC, то можно встроить профиль перед сохранением документа.

Преобразование файла PDF в соответствующий стандарту файл PDF выполняется с помощью Мастера стандартов. В ходе выполнения операций в этом Мастере даются пояснения по отдельным форматам. Если вы знакомы с этими стандартами, то для преобразования файла PDF можно использовать встроенный профиль или профиль, созданный с помощью мастера.

Также можно создать файл, совместимый с PDF/X и PDF/A, с помощью программы Acrobat Distiller .

Преобразование в PDF/X, PDF/A или PDF/E с помощью профиля

Выберите Инструменты > Допечатная подготовка.

Набор инструментов допечатной подготовки отображается на панели справа.

Нажмите Выполнить предпечатную проверку.

Отобразится диалоговое окно «Предпечатная проверка».

В диалоговом окне «Предпечатная проверка» выберите Стандарты PDF из раскрывающегося списка Библиотеки.

Перейдите на вкладку Профили.

Разверните совместимый профиль и выберите необходимый профиль. Например, в пункте «Соответствие PDF/A» выберите пункт Преобразовать в PDF/A-1b.

Нажмите Сохранить для преобразования файла в соответствии с выбранным профилем.

Преобразование в формат PDF/X, PDF/A или PDF/E

Выберите Инструменты > Стандарты PDF.

Выберите на панели справа Сохранить как PDF/A, Сохранить как PDF/X или Сохранить как PDF/E.

Выберите местоположение для сохранения файла и нажмите Сохранить.

Файлы PDF/X, PDF/A, PDF/VT и PDF/E могут быть созданы различными способами, например с использованием приложения Acrobat Distiller или команды «Файл» > Сохранить как «Другое»Если Вы открываете файл PDF, который соответствует одному из этих стандартов, то информацию о стандартах можно увидеть на панели «Навигация» (выберите Просмотр > Показать/Скрыть > Панели навигации, а затем нажмите Стандарты ). Меню и панель «Стандарты» доступны только в том случае, если файл PDF соответствует стандарту. Панель «Стандарты» присутствует во всех версиях (Acrobat Professional, Standard и даже Reader). Однако функция проверки подтверждения доступна только в Acrobat.

В сведениях о подтверждении указывается стандарт, использованный для создания файла, наименование стандарта ISO, а также отметка о том, был ли файл проверен на соответствие требованиям стандартов PDF/X, PDF/A, PDF/VT, PDF/UA или PDF/E. В информации о способах вывода указываются цветовые настройки, ассоциированные с данным файлом. Чтобы проверить файл на соответствие стандартам, нажмите на кнопку Проверить соответствие .

Вы можете удалить всю информацию о соответствии стандартам PDF/X, PDF/A или PDF/E, например условие вывода или ключ версии GTS_PDFX. Это полезно, если файл был изменен, если нужно начать заново или если ICC-профиль слишком увеличивает размер файла.

Выберите Инструменты > Допечатная подготовка.

Набор инструментов допечатной подготовки отображается на панели справа.

Нажмите Выполнить предпечатную проверку.

Отобразится диалоговое окно «Предпечатная проверка».

В диалоговом окне «Предпечатная проверка» выберите Стандарты PDF из раскрывающегося списка Библиотеки.

Перейдите на вкладку Исправления .

Раскройте группу Информация о документе и метаданные и выберите Удалить данные <название_стандарта>. Например, выберите «Удалить данные PDF/A».

Выберите местоположение для сохранения файла и нажмите Сохранить.

Если действие выполнено успешно, в диалоговом окне «Предпечатная проверка», на вкладке «Результаты» отобразится зеленый флажок. Если действие завершится с ошибкой, в диалоговом окне «Предпечатная проверка», на вкладке «Результаты» отобразится красный крестик.

Я использую PdfBox в Java для извлечения текста из PDF-файлов. Некоторые входные файлы не допустимы и PDFTextStripper привалы на эти файлы. Есть ли чистый способ проверить, действительно ли предоставленный файл является действительным PDF?

Я использую aperture для извлечения текста из различных файлов, а не только pdf, но должен настроить думает для PDF-файлов, например (aperture использует pdfbox, но я добавил другую библиотеку, как резервное копирование при сбое pdfbox)

вот что я использую в своих тестах NUnit, которые должны проверять несколько версий PDF, созданных с помощью Crystal Reports:

здесь адаптированная Java-версия кода NinjaCross.

и некоторые простые модульные тесты:

Если вы придумаете какие-либо неудачные модульные тесты, пожалуйста, дайте мне знать.

поскольку вы используете PDFBox, вы можете просто сделать:

он потерпит неудачу с исключением, если PDF поврежден и т. д.

если это удастся, вы также можете проверить, зашифрован ли PDF с помощью .isEncrypted()

вы должны попробовать это.

Pdf-файлы начинаются с " %PDF "(откройте один в TextPad или аналогичный и посмотрите)

любая причина, по которой вы не можете просто прочитать файл с помощью StringReader и проверить это?

В конце концов, после возиться с различными методами в API, я попробовал это:

это не вызвало исключения, но оно вывело следующее:

затем я реализовал следующее:

Это вызвало исключение для моего поврежденного файла, как я и хотел. Надеюсь, это поможет кому-то!

может быть, я слишком поздно, чтобы ответить. Но ты должен взглянуть на Тику. Он использует Pdfbox Parser внутренне для разбора PDF-файлов

вам просто нужно импортировать TIKA-app-latest*.Джар

ответ Роджера Кея неверен! поскольку не все PDF-файлы в версии 1.3 и не все завершены EOL. Ответ ниже работает для всех не поврежденных файлов pdf:

В общем, нам может понравиться это, любая версия pdf будет завершена с %%EOF, поэтому мы можем проверить, как показано ниже.

Если вам интересно, как узнать, является ли PDF PDF/A, то вы находитесь в нужном месте. Стандарт PDF/Aв настоящее время востребовано большинством телематических служб итальянских государственных органов. При отправке документов в Торгово-промышленную палату или налоговую инспекцию в режиме онлайн этот тип PDF-файла необходим для долгосрочного архивирования. Однако большинство людей не знает, что существуют различные типы стандартов PDF/A, и что внутренние доходы, например, в настоящее время принимают только стандарт PDF/A-1a (ISO 19005-1). Возможно, по этой причине вы захотите посмотреть, является ли PDF PDF/A форматом.

Вам отказали в передаче дела в Налоговую инспекцию по причине наличия соответствующих документов? Ну, если так, то вполне вероятно, что в этом причина. Многие офисные многофункциональные устройства используют стандарт PDF/A-1b необъяснимо. Вывод, используя бесплатный Adobe Reader или другие бесплатные PDF-ридеры, которые не выполняют PDF совместимость, является то же самое. Поэтому вы можете не понять, почему PDF/A файлы не принимаются. Поэтому для устранения этой проблемы необходимо проверить, не является ли PDF-файл PDF/A ручным. Тогда давайте посмотрим, как это делается.

Как проверить, является ли формат PDF PDF/A

Чтобы узнать, является ли PDF PDF/A, можно использовать iPhone или смартфон на базе ОС Android. Тем не менее, я рекомендую использовать Windows, Linux или Mac PC. На самом деле, проще использовать компьютер для выполнения такого рода операций.

Прежде чем продолжить, было бы лучше знать разницу между PDF/A-1a и PDF/A-1b. Прежде всего, следует отметить, что это не только стандарты PDF/A. Есть много других, с которыми я не буду иметь дело в данном руководстве, просто потому, что они еще не получили широкого распространения (см. более подробную информацию ниже).

Проверьте PDF/A онлайн бесплатно

Нет необходимости регистрироваться для получения платных услуг, чтобы узнать, является ли PDF PDF/A. Это намного проще, чем ты думаешь. На момент написания настоящего документа, фактически, можно осуществить проверку соответствия PDF/A файла, воспользовавшись бесплатным сервисом PDF Tool Online. Он называется 3-х высотный инструмент PDF Validator Online Tool и доступен по этому адресу.

Для выполнения бесплатной онлайн-проверки PDF/A сначала создайте документ PDF/A или конвертируйте его в PDF/A, как это обычно делается. После этого подключитесь к сервису, который я предложил. На этом этапе достаточно перетащить PDF/A файл в браузер, в поле, указанном службой. В течение нескольких секунд вы получите результат соответствия стандарту PDF. Просто проверьте, соответствует ли стандарт PDF/A-1a, чтобы убедиться, что ваш документ соответствует требованиям государственных органов.

Читайте также: