Finereader не открывает pdf

Обновлено: 03.07.2024

Файлы PDF могут быть защищены несколькими способами: DRM (Digital Restrictions Management), пользовательским или авторским паролем. Кроме того, PDF может представлять собой набор изображений с текстом.

Лайфхакер надеется, что вы будете применять эти способы исключительно в благих целях и не станете получать доступ к информации, которая вам не принадлежит.

Как сбросить пользовательский пароль

Пользовательский пароль запрашивается при попытке открыть защищённый документ. Без него невозможны любые действия с файлом. Сбросить или обойти его трудно.

Вы можете попробовать подобрать пароль по словарю с помощью предложенных утилит, но этот метод не гарантирует результата. Особенно если речь об очень сложных паролях. Кроме того, вам потребуется много времени и довольно производительный компьютер с Windows или macOS.

На смартфонах с Android или iOS снять такую защиту не получится.

Passcovery Suite

Это приложение для Windows позволяет восстанавливать пароли для многих форматов документов и архивов, в том числе и PDF. Оно может задействовать ресурсы вашей дискретной видеокарты, так что подбор паролей осуществляется с приличной скоростью. Правда, в бесплатной демоверсии отображаются только два первых символа найденного пароля, а время подбора ограничено 30 минутами.

Passcovery Suite запросто щёлкнул PDF с паролем 1111, но спасовал перед вроде бы несложным lifehacker1. Так что перед покупкой убедитесь, что приложение может подобрать ваш пароль. Стоит оно 199 долларов.

Cisdem PDF Password Remover 3

Ещё одно приложение, способное взломать пользовательский пароль PDF простым перебором вариантов. Отличается от предыдущего тем, что работает с macOS. В остальном приложения схожи, поскольку метод используют одинаковый.

Перетащите PDF в окно приложения, щёлкните на значок замка и выберите вариант Forgot. Укажите количество символов и возможные спецзнаки в пароле, если знаете, и щёлкните Decrypt.

Cisdem может легко сладить с цифровыми паролями вроде 111 и 112121, но более сложные утилите, видимо, не по зубам: их она может взламывать по несколько дней, не гарантируя результата. Возможно, приложение и способно вам помочь, но учтите: перебор паролей занимает очень много времени. Поэтому лучше убедиться, что компьютер не уснёт без вас, и заняться чем-нибудь полезным.

Бесплатная пробная версия разблокирует только первые пять страниц файла. Лицензия обойдётся вам в 34,99 доллара.

Как сбросить авторский пароль

Этот пароль используется создателем документа для защиты авторских прав. Вы можете просматривать PDF, но у вас не получится редактировать, печатать или копировать его содержимое: каждый раз при попытке сделать что-то с PDF будет запрошен пароль. Впрочем, такую защиту снять намного проще, чем предыдущую.

Google Chrome + «Google Документы»

Это простейший способ скопировать или распечатать текст из защищённого PDF.

Запустите Google Chrome. Зайдите в «Google Документы» и откройте «Окно выбора файлов» (значок папки справа). Выберите вкладку «Загрузка» и залейте на «Google Диск» ваш PDF. Когда он откроется, распечатайте файл (нажмите на значок принтера) или сохраните содержимое в редактируемый PDF (нажмите кнопку «Изменить» и выберите опцию «Сохранить в PDF»).

Из нового документа можно без проблем копировать содержимое. Кроме того, его можно будет редактировать с помощью Adobe Acrobat или других редакторов PDF и распечатывать.

Онлайн-сервисы

Как скопировать текст из сканированного PDF

Некоторые PDF-файлы не защищены паролем, но в них всё равно невозможно копировать или редактировать текст, потому что страницы представляют собой изображения. Как правило, такие PDF создаются программами-сканерами или вручную из сфотографированных листов. Вынуть из них текст можно при помощи приложений или сервисов для распознавания текста.

FineReader и аналоги

Если у вас есть ABBYY FineReader, то с извлечением текста из PDF не возникнет проблем. Скормите приложению PDF и подождите, пока закончится распознавание. Затем текст можно будет скопировать или сохранить в формате TXT или DOCX.

Те, кому не хочется тратиться на лицензию FineReader, могут попробовать его онлайн-сканер. Правда, он потребует регистрации и в бесплатной версии позволит распознать только 10 страниц.

Как снять защиту DRM

Некоторые PDF-книги, купленные в электронных библиотеках, невозможно читать на ридерах или планшетах, потому что они обладают вшитой защитой Digital Restrictions Management. Предполагается, что вы будете открывать их в программе Adobe Digital Editions, используя правильный ID пользователя для подтверждения своих прав на чтение.

All DRM Removal

Это приложение для Windows, macOS и Linux помогает снять с PDF DRM-защиту, а значит, открывать, копировать и редактировать файл как угодно. Учтите, что это нарушает авторские права.

All DRM Removal можно бесплатно опробовать, но затем придётся заплатить 19,99 доллара.

Решения для устранения проблем Abbyy Finereader в Windows 10

1. Запустите проверку системных файлов.

Во-первых, убедитесь, что с системным файлом Windows ничего нет. Это можно сделать с помощью утилиты проверки системных файлов в Windows 10 и 8, нажав клавишу Windows + горячую клавишу X и выбрав Командная строка (администратор) .

  • Введите the DISM.exe/Online/Cleanup-image/Restorehealth ’в окне подсказки и нажмите клавишу возврата.
  • Затем введите «sfc/scannow» и нажмите Enter, чтобы запустить сканирование SFC, которое может занять около 20-30 минут.


  • После завершения сканирования перезагрузите компьютер или ноутбук, если в командной строке указано, что WRP восстановил системные файлы.

2. Запустите Abbyy Finereader от имени администратора.

  • Запуск программ от имени администратора может часто запускать программы. Чтобы запустить Abbyy Finereader от имени администратора, щелкните правой кнопкой мыши его исполняемый файл или ярлык на рабочем столе и выберите Свойства .
  • Выберите вкладку «Совместимость», показанную непосредственно ниже.


3. Запустите старые версии Abbyy Finereader в режиме совместимости.

Для этого откройте вкладку «Совместимость», как описано выше; и выберите параметр Запустить эту программу в режиме совместимости . Выберите более раннюю платформу Windows в раскрывающемся меню. Затем нажмите кнопки Применить и ОК .


4. Очистите загрузочные окна




5. Удалите антивирусное программное обеспечение из автозагрузки Windows

Если Abbyy Finereader работает нормально, когда вы чистите загрузочное окно, сторонние антивирусные утилиты являются наиболее вероятным конфликтующим программным обеспечением.Таким образом, после восстановления Windows до стандартного запуска попробуйте удалить только антивирусное программное обеспечение из автозагрузки системы. Вот как вы можете удалить антивирусные утилиты из автозагрузки.

  • Нажмите правой кнопкой мыши кнопку Пуск в Windows 10 и выберите Диспетчер задач . Кроме того, вы можете открыть эту утилиту, щелкнув правой кнопкой мыши панель задач и выбрав Диспетчер задач .
  • Выберите вкладку «Автозагрузка», показанную на снимке ниже.


  • Затем выберите антивирусное программное обеспечение и нажмите кнопку Отключить .
  • Вы можете снова включить антивирусную программу, если вам не нужно открывать Abbyy Finereader, нажав Включить .

6. Обновление драйверов устройств

« Abbyy Finereader.exe перестал работать » перестал работать ошибка также может быть из-за устаревших или несовместимых драйверов. Вы можете проверить, нужно ли обновлять драйверы с помощью Driver Booster 5. Нажмите Бесплатная загрузка на этой странице, чтобы добавить бесплатную БД 5 в Windows. Программное обеспечение автоматически сканирует драйверы при первом запуске. Затем вы можете нажать кнопку Обновить сейчас , чтобы обновить устаревшие или несовместимые драйверы.


7. Отключите DEP для Abbyy Finereader

Существует несколько причин появления ошибок при открытии файлов PDF в браузере или на компьютере с установленным ПО Acrobat Reader DC или Acrobat DC. Используйте предложенные ниже решения, чтобы устранить проблему.

Учтите, что вы не сможете самостоятельно восстановить поврежденный файл PDF. Однако при наличии исходного файла можно повторно создать документ PDF с помощью продуктов Adobe, например Acrobat или Photoshop Elements.

В большинстве современных веб-браузеров можно легко открыть файл PDF. Если вам не удается открыть определенный файл PDF на веб-странице, воспользуйтесь приведенным ниже решением.

Щелкните правой кнопкой мыши (Windows) или, удерживая нажатой клавишу Control (Mac OS), щелкните ссылку на файл PDF.

Выберите соответствующий параметр сохранения или загрузки для своего браузера:

  • (Google Chrome) Сохранить ссылку как
  • (Internet Explorer) Сохранить объект как
  • (Firefox) Сохранить ссылку как
  • (Safari) Загрузить файл по ссылке

Убедитесь в том, что в качестве типа файл выбран документ Adobe Acrobat, и сохраните файл.

Если диалоговое окно Сохранить как не появляется, возможно, в браузере открыто несколько окон загрузки и файл был загружен автоматически.

Найдите сохраненный файл PDF и дважды щелкните его, чтобы открыть. Если в браузере открылось окно загрузок, дважды щелкните файл PDF в списке загруженных файлов.

Если вам не удается открыть файл PDF на компьютере, воспользуйтесь следующими решениями в том порядке, в котором они приведены.

Если программа Acrobat Reader DC или Acrobat DC уже установлена, перейдите сразу к следующему шагу.

Acrobat Reader DC — это единственное бесплатное средство просмотра документов PDF, которое позволяет открывать и взаимодействовать с содержимым PDF всех типов, включая заполняемые формы и мультимедийные файлы.

Перейдите к странице Загрузка Adobe Acrobat Reader и нажмите кнопку Установить сейчас. Пошаговые инструкции приведены в разделе Загрузка и установка Adobe Acrobat Reader DC для систем Windows или Mac OS.

После завершения установки выполните действия, описанные в следующем разделе.

Ваша система может не открывать файлы PDF на рабочем столе автоматически с помощью Acrobat Reader DC или Acrobat DC. Ниже описан процесс выполнения такой настройки.

Пользователи Windows

Щелкните правой кнопкой мыши значок документа PDF и выберите Открыть с помощью > Выбрать программу по умолчанию (или Выбрать другое приложение в Windows 10).


Выберите Adobe Acrobat Reader DC или Adobe Acrobat DC в списке программ, а затем выполните одно из следующих действий:

  • Windows 7 и более ранние версии. Отметьте пункт Использовать выбранную программу для всех файлов такого типа.
  • Windows 8. Отметьте пункт Использовать данное приложение для всех файлов .pdf.
  • Windows 10. Выберите Всегда использовать это приложение для открытия файлов PDF.


Windows 10


Если на компьютере установлены обе программы — Adobe Acrobat DC и Adobe Acrobat Reader DC, выберите Adobe Acrobat DC.

Пользователи Mac OS

Нажмите на значок файла PDF в программе Finder, чтобы выделить его.

Выберите Файл > Свойства.


Нажмите на треугольник рядом с пунктом Открыть с помощью и выберите Adobe Acrobat Reader или Adobe Acrobat в раскрывающемся списке (если нужной программы нет в списке, выберите Другое, чтобы указать ее).


Компания Adobe регулярно выпускает обновления безопасности для Acrobat Reader DC и Acrobat DC. Установка последнего обновления может помочь устранить проблему.

Запустите Acrobat Reader DC или Acrobat DC.

Выберите Справка > Проверить наличие обновлений.


Если появится диалоговое окно Установка обновлений, нажмите Да. Обновления загрузятся автоматически.


Программы Acrobat Reader DC и Acrobat DC или ресурсы, которые они используют, могут быть повреждены. Для восстановления установки этих программ выполните указанное ниже действие.

Запустите исправление из Acrobat Reader DC или Acrobat DC: выберите пункты Справка > Восстановить установку.


Симптом или ошибка

Техническая заметка или решение

Не удается открыть документ PDF, защищенный паролем

Открытие подозрительных файлов PDF: программы Reader и Acrobat блокируют открытие файлов PDF, которые не соответствуют определенным отраслевым стандартам или могут быть потенциально вредоносными.

Соблюдайте осторожность. Такие документы PDF могут представлять угрозу безопасности для системы. Проверьте источник документа, например пользователя, отправившего его вам, или веб-сайт, с которого он был загружен, чтобы убедиться, что этот документ можно безопасно открыть.


После короткого рассказа о том, как устроен ABBYY FineReader (aka «теоретическая часть»), самое время перейти к применению полученных знаний. И да, котиков под катом нет: всё очень серьёзно.

Как пользователю поучаствовать в обработке документа

Чтобы не изобретать велосипед, начну с простой и понятной схемы из Справки (см. рисунок справа).

Теперь, зная список всех операций, посмотрим на примерах – что может пойти не по плану и как с этим бороться.

Хорошо распознаются только хорошие изображения

А что делать, когда изображения есть, но не очень хорошие? Улучшить прямо в FineReader всё что можно, а, если улучшить нельзя, — попытаться получить изображение заново, устранив проблему. Поскольку тема очень обширная, то при должном интересе будет отдельный пост про то, как подружиться с автоматическими и ручными инструментами обработки изображений прямо в FineReader. Пока же ограничусь замечанием, что изображение будет обработано лучше, если оно:

  • (после сканирования) не имеет выраженных геометрических искажений — перекоса или заметного изгиба страниц толстой книги у корешка двухстраничного разворота,
  • (после фотографирования, в дополнение к предыдущему) не имеет ещё и нелинейных геометрических искажений («подушка», «трапеция»), имеет равномерную фокусировку (а желательно и яркость) по всей площади, не имеет шумов от недостаточной освещённости, не имеет выраженной засветки от вспышки (особенно на глянцевой бумаге).

Этап настройки документа/проекта


Можно и нужно сразу указать язык текста, параметры предобработки изображений, некоторые параметры анализа и распознавания. Вот скриншот одной из вкладок диалога настроек.

Эти и прочие настройки подробно описаны в Справке

Этап анализа

Назначение областей разных типов

В пользовательском интерфейсе FineReader доступны области нескольких типов, для них есть разные варианты скрываемой панели свойств (внизу окна «Изображение») и контекстного меню (по щелчку правой кнопкой мыши):

    «Зона распознавания» (по умолчанию серая рамка) — такое название использовано в пользовательском интерфейсе, на мой взгляд правильнее было бы назвать «область для автоматического анализа». Назначение такой области – указать, где на странице вообще нужно искать что-то полезное. Поэтому в результате последующего анализа или анализа+распознавания в пределах каждой «зоны распознавания» может найтись ноль и более областей других типов. Особенно полезны зоны распознавания бывают в шаблонах блоков (подробнее о них в Справке).

Примеры правильно нарисованных зон распознавания


Реальный пример из проекта оцифровки Толстого — часть страниц имеет нумерацию строк (пронумерованы строки с номерами, кратными 10), не нужную в результате и затрудняющую вычитку/правку текста, если автоматический анализ включил эти номера в текстовую область колонки. Если страницы были почти одинаково выровнены на сканере или качественно обрезаны после сканирования, то перед анализом к нужной группе страниц можно применить шаблон блоков, где область (или области) распознавания просто не содержит не нужных нам частей страницы:

Помните, что в отличие от текстовой области область распознавания может превратиться в области разных типов, что бывало нужно и в этом проекте.

Эти параметры задаются на блок, так что выделять текст разного направления или разной инверсности в один блок – другая плохая идея.

В европейских языках в нормальной ориентации текста строки читаются сверху вниз (в блоке с повёрнутым текстом – от логического верха в сторону логического низа), но в случае иероглифических языков всё гораздо веселее – даже на одной странице одни области могут содержать текст в горизонтальной ориентации, а другие – в колоночной, причём иероглифы имеют одинаковую ориентацию во всех этих областях (если тема дальневосточных и ближневосточных языков интересна – просите отдельный пост про тамошние навороты).

Важные соображения

  • Распознавание и синтез видят только те фрагменты текста, которые оказались выделены в текстовые области или текстовые ячейки таблиц. Если кусок текста не выделен в блоки – распознаваться он не будет.
  • Аналогично и с картинками — если часть картинки оказалась вне области или одна целостная картинка оказалась разделена на несколько областей – скорее всего, в результате обработки будут проблемы.
  • Языки распознавания в FineReader задаются не для галочки – они влияют на очень многие механизмы, начиная уже с анализа: например, иероглифический (китайский, японский, корейский языки) или арабский текст имеют много особенностей, которые учитываются не всегда, а только при выборе соответствующих языков распознавания.

Особенности взаимодействия близкорасположенных или пересекающихся областей

    Пересечение текстовых и табличных блоков друг с другом, если есть символы или их части, оказавшиеся в более чем одном блоке – практически всегда ошибка, такие результаты анализа нужно исправлять, тем более что обычно это делается в несколько движений мыши.

Пересечение картиночных областей друг с другом – практически всегда ошибка, хотя и менее критичная для обработки именно текста. Такие случаи тоже желательно исправлять.



Примеры правильного использования картинок в таблице


Обратите внимание, что с помощью галочки в панели свойств области (внизу) ячейки из левой колонки таблицы сделаны картинками.

Текстовая область на фоне «картиночной» области — тоже важный инструмент: на фоне обычных картиночных областей могут находиться подписи к ним, на «фоновых» картиночных областях может располагаться и основной («колоночный») текст документа, а также таблицы.

Примеры правильного использования текстовых областей на фоне картинок



Маленькие хитрости для облегчения работы с блоками

Описанные соглашения отражены в поведении редактора блоков. Например, если вы рисуете новый или растягиваете имеющийся блок так, что он полностью или почти полностью перекрывает другие блоки — эти другие блоки автоматически удаляются.

Логичность/нелогичность выделения областей

Тут самое время подумать — для каких целей и какого формата документ хочется получить в результате обработки. Вот некоторые соображения, влияющие на количество и характер исправлений разметки блоков в сложных случаях:

Вариант 1: нам нужен только текст (возможно, мы этого не понимаем, но дело обстоит именно так)
  • нет «мусорных» областей, где в качестве текста или таблиц распознаются (мусором) элементы картинок или элементов оформления страницы.
  • области логично выделяют строки, не допуская попадания символов в более чем одну область и неоправданного дробления строк на более чем одну область.
  • то, что с точки зрения человека является таблицами в оригинале, должно быть выделено в табличные области. Это влияет как на качество распознавания (например, базовые линии строк в разных ячейках могут быть не выровнены по вертикали), так и на удобство поиска и копирования фрагментов текста в выходном документе.

Если отдельные картинки не должны копироваться из выходного PDF-документа – то такие области можно из документа исключить вовсе (не создавать новые и не оставлять найденные автоматикой, как минимум – удалять нелогично найденные картинки, а если не лень – то и все).

Я надеюсь шире и глубже раскрыть тему «разумности» картинок в статье про сохранение документов — если такая будет интересна читателям данного материала.

Вариант 2: нужно всё и сразу

Если документ, включающий не одно лишь текстовое содержимое (в одну или две колонки), предполагается сохранить сразу как электронную книгу в форматах FB2/e-pub или в любой промежуточный редактируемый формат (Вордовый или HTML) для дальнейшего редактирования и производства электронной книги, то осмысленное выделение таблиц и картинок становится особенно важно.
Среди прочего нужно определиться с тем, что делать с группами рядом расположенных картинок, и что делать с подписями к картинкам, как рядом стоящими, так и накладывающимися на картинки. Подробнее разберём эту тему в «Практикуме», на реальных примерах.

Читайте также: