Какие новые функции появились в abbyy finereader pdf 15 по сравнению с предыдущей версией

Обновлено: 03.07.2024

- ABBYY FineReader PDF 15 Standard предназначается для использования дома.

- ABBYY FineReader PDF 15 Business – решение для использования в небольших и средних компаниях.

- ABBYY FineReader PDF 15 Enterprise – самая полная редакция программы для средних и крупных компаний.

FineReader PDF 15 Standard
FineReader PDF 15 Business
FineReader PDF 15 Corporate
Просмотр, редактирование + + +
Защита и подпись PDF + + +
Совместная работа и согласование + + +
Создание PDF-документа + + +
Создание интерактивных PDF-форм + + +
Сравнение документов +
Оцифровка документов и сканов с помощью OCR + + +
Конвертирование документов + + +
Автоматизация задач по оцифровке и конвертации HotFolder
ABBYY Screenshot Reader + + +
Прогрессивная система скидок + + +
Несколько типов лицензий (Standalone, Per Seat, Concurrent, Remote) За исключением Concurrent + +
Сервер лицензий + + +

ABBYY FineReader 15 поддерживает несколько типов лицензирования для корпоративных клиентов. Решайте различные задачи сотрудников одной программой, которая объединяет все инструменты для работы с бумажными и PDF-документами. Это сократит затраты на закупку и поддержку ПО, а также обучение персонала.

Типы лицензий для организаций




Регулярная потребность у ограниченного числа сотрудников.

Подходит для компьютеров, отключенных от локальной сети, например, ноутбуков.

Периодическая потребность у большого числа сотрудников.

Для использования обязателен доступ к локальной сети или терминальному серверу.

Компания ABBYY объявила о выпуске FineReader 15 — новой версии своего флагманского продукта, объединяющего все необходимые инструменты для работы с PDF и бумажными документами.

ABBYY FineReader является универсальным программным решением. Помимо OCR-системы оптического распознавания текста, обеспечивающей конвертирование отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, в составе приложения представлены PDF-редактор, инструмент для сравнения документов различных форматов, включая бумажные и электронные, а также средства автоматизации задач по конвертации документов. Пользователи могут создавать новый PDF из нескольких документов в разных форматах, добавлять цифровую подпись или водяные знаки, вносить комментарии, защищать файл с помощью пароля, скрывать в тексте конфиденциальные данные, менять форматирование документов и решать прочие задачи.

ABBYY FineReader 15 предоставляет широкий спектр возможностей в одной программе

Отличительной особенностью обновлённого FineReader 15 является поддержка технологий машинного обучения и искусственного интеллекта на базе нейронных сетей. Благодаря этому к минимуму сведены ошибки распознавания PDF, созданных из других приложений, в том числе PDF-документов с битыми кодировками или некачественным текстовым слоем. Улучшено распознавание таблиц и колонтитулов. Благодаря новой версии технологии оптического распознавания символов FineReader 15 ещё точнее конвертирует тексты на японском и корейском языках, воспроизводит таблицы в Excel на языках, на которых текст пишется и читается справа налево, и расставляет автоматические теги при сохранении в PDF (в том числе в PDF/UA).

Значительным доработкам в FineReader 15 подверглись средства просмотра, редактирования и конвертирования PDF-документов. В частности, появились возможности многострочного редактирования PDF в пределах абзаца (теперь текст автоматически перераспределяется по строкам по мере добавления или удаления слов и фрагментов), изменения оформления любых страниц в PDF-документе, форматирования текста в пределах абзаца или какого-либо его фрагмента, а также редактирования отдельных ячеек в таблицах. По заверениям разработчиков, новая версия программы открывает любые файлы, даже объёмные PDF с изображениями, диаграммами и таблицами, на 40 % быстрее, чем раньше. Кроме того, появился специальный механизм извлечения текста из полей интерактивных PDF-форм и комментариев типа «Текстовый блок», а также добавлена функция интеллектуальной оценки качества текстового слоя в PDF-документах. В случае проблем с текстовым слоем (текст повреждён, имеет неверную кодировку и т.п.) программа применит технологию оптического распознавания символов вместо того, чтобы извлекать проблемный текст. Таким образом повышается качество конвертирования PDF-документов в редактируемые форматы.

Благодаря разработкам в области ИИ, FineReader 15 позволяет редактировать целые абзацы в PDF, это при том условии, что данный формат изначально не предназначен для внесения правок. Программа определяет, где находятся заголовки, подзаголовки, отдельные абзацы, ячейки таблиц, колонтитулы, обводит их в специальные рамки и позволяет редактировать. Вносить правки в абзацы можно даже в сканы без готового текстового слоя

Первая версия ABBYY FineReader увидела свет более четверти века тому назад, когда компания представила рыночную OCR-систему, которая работала с любыми видами шрифтов и могла одновременно распознавать символы на разных языках. С тех пор эта программа стала чуть ли не стандартом «де-факто» в сегменте соответствующих решений: приобретению сканера сопутствовала установка на ПК FineReader. Сейчас речь пойдет о возможностях, которые предоставляет пятнадцатая версия продукта — разумеется, никто не собирается сравнивать ее с первыми релизами, за 26 лет математическая модель не только прошла путь «от самоката до сверхзвукового истребителя», но и обзавелась элементами искусственного интеллекта и стала универсальной программой для работы с PDF-документами.

Предыдущим версиям программы уже было под силу многое: например, с помощью ABBYY FineReader уже удалось оцифровать все 90 томов из собрания сочинений Л. Н. Толстого. Решением ABBYY люди давно пользуются не только дома, но и на работе. Например, в «Ростелекоме» с программой работают более 700 сотрудников – юристов и специалистов отдела кадров. В последней версии продукт ABBYY превратился в мощный офисный пакет, поддерживающий работу с PDF-файлами, где OCR-модуль является лишь одной из частей. Ныне он позиционируется, как «многофункциональный редактор для решения любых задач с PDF и бумажными документами», причем слово — «любых» всячески акцентируется.

В описании продукта сказано, что он позволяет оператору «. редактировать любые PDF-документы - от исправления опечатки до изменения содержания целого абзаца и страницы, перемещать текстовые блоки, добавлять строки (или параграфы), изменять форматирование текста и структуру документа, автоматизировать повторяющиеся задачи и сравнивать документы в различных форматах». Действительно, если излагать максимально сжато — так и есть, но в если вникнуть, то все оказывается намного сложнее.


Сперва о создании первичного манускрипта. Для его формирования пользователю предлагается скомпоновать различные источники и документы разных типов, и не только электронные, но и бумажные. Выполнив компиляцию, к ней можно добавить водяные знаки и цифровые подписи, провести окончательное форматирование документов, внести комментарии, скрыть конфиденциальную информацию, установить парольную защиту и проделать множество других действий для того, чтобы получить на выходе полностью готовый документ.


И сделать это можно так быстро, как только позволит квалификация работника. Наивысшая продуктивность пятнадцатой версии достигнута во многом благодаря технологиям машинного обучения и искусственного интеллекта, построенных на базе нейросетей. Искаженные кодировки и испорченные места в исходных документах для таких механизмов перестали быть неразрешимой проблемой, также успешнее распознаются тексты на языках Востока — японском и корейском, например. В частности, при обнаружении искаженного (испорченного) участка в PDF-документе, будет задействован механизм оптического распознавания, что существенно повышает качество переноса информации. Также улучшена работа с электронными таблицами с текстом на языках с записью справа налево.


Тестовые исследования показывают, что ускорение работы в сопоставлении с предыдущей версией может достигать 40% даже при работе с объемными документами (в т.ч. PDF), изобилующих изображениями, диаграммами и таблицами. Ускорит работу и новая возможность извлечения текста из полей для заполнения и элементов типа «текстовый блок» в комментариях — теперь это не придется делать полностью вручную. Да и со структурой текста меньше проблем: при удалении, изменении или добавлении слов в абзацах (многострочное редактирование) текст автоматически равномерно перераспределяется по строкам.

Доработки коснулись и модуля сравнения документов: результаты сравнения можно сразу перемещать в документ Microsoft Word и отображать их в режиме отслеживания изменений: такая функция востребована при работе с бухгалтерскими, юридическими и проектными документами. Причем для разных форматов — важно, чтобы они входили в список поддерживаемых.

Внедрение искусственного интеллекта позволило реализовать даже такие возможности редактирования, которые до этого были невообразимыми: как PDF-документ (который вообще не предназначен для правки) можно подредактировать? Сейчас это не проблема: тот же искусственный интеллект способен определять практически любые элементы форматирования, в том числе заголовки и подзаголовки, отдельные абзацы и колонтитулы, ячейки таблиц и прочее, позволяя изменять их содержимое так, как будто бы в обыкновенном текстовом документе. Изменения можно вносить даже в отсканированные оригиналы, даже с отсутствующим текстовым слоем.

И, наконец, о приятном дополнении в предложениях для организаций: введено лицензирование для удаленных пользователей. Отныне, с идентификацией только по имени последнего, допускается использовать ABBYY FineReader 15 совместно с продуктами для виртуализации, в том числе, с Microsoft Remote Desktop Services, Citrix XenApp, Citrix Virtual Apps and Desktops. Также расширены возможности использования групповых политик (GPO), в частности, администраторы смогут управлять максимальным количеством ядер CPU, которые могут использоваться программой на каждом компьютере и задавать лимит времени простоя, по истечении которого Concurrent-лицензия будет освобождена и доступна другим рабочим станциям.

Ну и о приятном для всех пользователей: до самого нового года, 30 декабря, купить FineReader и другие продукты можно со скидкой 40%.


Сегодня мы обновили ABBYY FineReader 15 и выпустили его под брендом ABBYY FineReader PDF, потому что он объединяет все инструменты для работы с PDF. По этому поводу публикуем первый пост из серии материалов о фичах программы. В нем мы расскажем об одной интересной возможности, которая не первый месяц есть в программе, но, возможно, не все о ней знали.

Давно ли вы открывали PDF-файлы? Готовы поспорить, что совсем недавно. Скорее всего, на вашем компьютере точно найдется пара сканов, а может, еще и макет презентации, аналитическое исследование или техническая инструкция. Для каких задач обычно используют эти документы? По данным опроса ABBYY, 62% респондентов ищут информацию в PDF, 60% — копируют текст из документа, а 52% — редактируют: вносят в файл правки, исправляют ошибки и опечатки.

Даже сейчас не все знают, что можно редактировать текст в PDF. Да, изменение таких файлов устроено не так, как редактирование обычного текстового документа. ABBYY FineReader PDF с многофункциональным текстовым редактором для работы с PDF и сканами позволяет быстро внести изменения прямо в PDF, без утомительной конвертации файла в другие форматы. При редактировании текст в PDF плавно перетекает со строчки на строчку, как в MS Word. Можно добавить или удалить несколько слов, изменить целые абзацы или даже поменять их местами.

В этом посте мы раскроем технические подробности редактирования многострочных фрагментов текста в FineReader: как мы изменили движок программы, как редактирование устроено изнутри и как оно выглядит для пользователя. Поехали!

Форматом PDF пользуются по всему миру: его содержимое одинаково отображается на любых компьютерах, смартфонах и планшетах с разными операционными системами. Это удобно и помогает избежать неловких ситуаций. Например, когда вы написали текст в MS Word, отправили коллегам, а они открывают его LibreOffice'ом или Wordpad'ом, и все поехало и начинается веселье. PDF, конечно, в этом плане удобнее, но с текстом здесь все сложно. В 70% всех существующих PDF-документов текст есть, а в 30% — нет, так как это изображения.

Поговорим сначала о PDF, в которых текст есть. Чтобы редактировать PDF, надо понимать, как в нем записан текст. Открывали когда-нибудь PDF в блокноте? Если да, то вы видели такое:


Чтобы все это отображалось понятно для пользователя, нужно проделать большую работу.

Задача: понять PDF

Содержимое каждой страницы в PDF-файле хранится в виде потоков команд для отрисовки документа – это могут быть текст, изображения или векторная графика. Структуру файла определяют PDF-объекты, например, страница, картинка, комментарий (а абзацы, строчки текста и буквы – это всего лишь части объекта). Символ в PDF представляется глифом . То, как они записаны, определяется шрифтом . Каждый символ хранится отдельно: у него есть шрифт, код символа в шрифте и координаты его расположения на странице. То, где глифы расположены, определяется как раз потоком команд. Кроме того, буквы объединены в потоки текста (text run), но они не смысловые.

В PDF нет ни строк, ни абзацев, которые есть в документах текстовых форматов. Даже порядок текста не всегда определен. То есть вы видите текст, но на самом деле текста не существует. Это хаос из трудно понятных инструкций (как на изображении выше), которые нужно правильно отобразить в конкретных местах документа, с соответствующим форматированием.

«А как же текст?» – спросите вы.


Текст в PDF все же существует, и его даже получится редактировать. Для этого мы учим наши технологии понимать структуру текста, например, определять и выделять строки. Расскажем об этом подробнее.

Библиотеки PDF и как мы их поменяли

Чтобы сделать возможным редактирование целых абзацев, мы сильно поменяли нашу внутреннюю подсистему (библиотеку), которую мы называем PdfTools. Она занимается тем, что открывает PDF-файлы, парсит потоки команд (т.е. понимает, где расположен текст, где картинки, и воссоздает структуру документа) и помогает пользователям оперировать этими данными: прочитать, изменить, сохранить в PDF.

Подсистема PdfTools содержит все необходимые инструменты, чтобы прочитать содержимое и обернуть его в объекты (страница, картинка, комментарий), с которыми удобно работать программе. С этими объектами уже могут работать наши продукты, в частности ABBYY FineReader PDF и другие.

Как было раньше. В FineReader 14 мы умели редактировать текст только в рамках одной строчки. После редактирования необходимо было выполнить «рендеринг» — расставить глифы на свои новые места.

Вообще рендеринг — это визуализация. Но мы вкладываем в это слово иное понятие — расположение объектов в PDF на своих местах. Для PDF-специалистов это и есть визуализация, которую больше никто не видит. Когда мы говорим о визуализации в привычном понимании, то используем слово «растеризация».

Что решили изменить. Когда появилась задача многострочного редактирования, мы поняли, что в рамках одной библиотеки PdfTools это будет проблематично делать. Нам необходимо было научиться автоматически находить в тексте PDF более крупные фрагменты, например, «видеть» абзацы, понимать, где находятся их границы, какое форматирование должно быть у целого фрагмента текста и что происходит при переходе с одной строки на другую. Чтобы определить все эти параметры, мы решили привлечь для решения этой задачи и другие наши OCR-технологии — Document Analysis (DA) и Synthesis, которые умеют строить структуру документа.

Document Analysis и Synthesis

Чтобы определять в тексте блоки, ABBYY FineReader PDF использует технологию Document Analysis. Она позволяет найти абзацы, таблицы, картинки. Программа подсвечивает найденные блоки небольшими бледными рамками, чтобы пользователю удобнее было вносить правки:


Далее мы усовершенствовали другую подсистему нашей программы – Synthesis. Мы уже рассказывали на Хабре, зачем она нужна. Если вкратце, именно она определяет структуру и все характеристики распознанного текста: какие используются шрифты и размеры, какое начертание (bold, italic, underline), где заголовки, списки, отступы и многие другие параметры, которые можно настраивать в том же MS Word. Мы доработали Synthesis для того, чтобы при распознавании и воссоздании страницы очень точно восстанавливать исходные параметры текста.

Особенности подчеркнутого текста

В PDF нет такого атрибута текста как подчеркивание, привычного, например, пользователям MS Word. Подчеркивание в PDF – это векторная графика, никак не связанная с текстом. Без дополнительной доработки продукта при редактировании «подчеркнутого» текста символы бы перемещались привычным образом, а линии, обозначающие подчеркивания, оставались бы на месте. ABBYY FineReader PDF умеет определять и редактировать подчеркнутый текст привычным пользователю образом.

Редактирование таблиц в PDF

Как отредактировать скан?

Возможность многострочного редактирования доступна и для сканов. Кстати, пользователю даже не надо задумываться, скан перед ним или нет. ABBYY FineReader PDF сам определит это и запустит нужные механизмы. Например, в дате договора — опечатка, или ФИО контрагента поменялось: оно стало длиннее и должно «перетечь» на следующую строчку.

В программе скан сначала распознается, а потом происходит подготовка к редактированию. Когда скан распознали, то текст получается не в нашем исходном документе, а в его виртуальном «двойнике». И именно в нем происходят все операции по редактированию.

Когда пользователь закончил редактировать документ, программа автоматически собирает все изменения со страницы и заменяет эти фрагменты в исходном документе. Наша задача — встроить текст обратно в PDF-документ, не повредив все то остальное, что уже есть в нем.

Редактирование скана позволяет не тратить время на конвертацию документа в другие форматы и обратно. Это удобно, когда нужно быстро внести забытую правку в дату или другой фрагмент текста.

Пример многострочного редактирования. Текст автоматически перераспределяется по строкам по мере добавления слов и предложений внутри абзаца.

Вместо заключения

  • быстро,
  • без конвертации документа,
  • с помощью одной программы.

В следующем посте через неделю мы расскажем о том, как научили ABBYY FineReader PDF еще одной интересной фиче и для чего может пригодиться новая функциональность.

Пишите в комментариях, о каких еще технологических особенностях нашей программы вам было бы интересно узнать?

Читайте также: