Abbyy finereader сравнение документов

Обновлено: 08.07.2024

Новый FineReader 14 можно сравнить со швейцарским ножом — теперь под его личиной кроются сразу четыре продукта именитого разработчика, объединённых в одну программу с единым рабочим окружением. Помимо успевшей зарекомендовать себя с наилучшей стороны системы оптического распознавания текста Optical Character Recognition (OCR), которая обеспечивает конвертирование отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, в составе программы представлены редактор PDF, инструмент «Сравнение документов» для сравнения документов различных форматов, включая бумажные и электронные, а также средства автоматизации задач по конвертации документов Hot Folder. Вряд ли кто-то мог предполагать, что в почти четвертьвековой истории развития FineReader (первая версия продукта увидела свет в 1993 году) случится такой крутой поворот, однако в ABBYY убеждены в правильности выбранного курса и уверены, что подобного рода перемены сделают программу ещё более востребованной в пользовательской среде.

Новая концепция FineReader 14

Новая концепция FineReader 14

Своё стремление уйти от устоявшихся традиций в компании объясняют современными тенденциями развития рынка электронного документооборота. Согласно проведённым ABBYY исследованиям, сотрудники различных организаций регулярно сталкиваются со следующими сценариями работы с документами: преобразование изображений и PDF-файлов в редактируемые форматы и внесение в них правок; сравнение документов разных форматов; создание, просмотр и редактирование PDF-файлов, а также извлечение из них данных. При этом типичный пользователь имеет дело с четырьмя и более сценариями и для решения каждой задачи использует разные программные продукты. В результате получается так, что вместо того, чтобы выполнять свою задачу, сотрудник компании занимается тем, что изучает эти инструменты и переключается между ними в процессе работы. Это очень неудобно и, по сути, является бесполезной тратой ресурсов, правильно распорядиться которыми должен новый FineReader 14.

ABBYY FineReader 14 предоставляет широкий спектр возможностей в одной программе

ABBYY FineReader 14 предоставляет широкий спектр возможностей в одной программе

Не остались без изменений в обновлённом FineReader и фирменные технологии оптического распознавания текста ABBYY OCR и обработки структуры документа Adaptive Document Recognition Technology. Приложение определяет расположение текста, тип и размер шрифта, начертание и другие особенности форматирования, а также воссоздаёт структурные элементы — таблицы и диаграммы, колонки, заголовки, сноски, колонтитулы, номера страниц. В результате пользователь получает электронную копию документа, идентичную оригиналу. Распознанный текст можно сохранить как текстовый документ (DOCX, ODT, RTF), электронную таблицу (XLSX), презентацию (PPTX), файл HTML, электронную книгу (ePub и FB2), а также в форматах PDF и PDF/A.

Профессиональные инструменты для распознавания текста

Профессиональные инструменты для распознавания текста

Предобработка изображений

С помощью встроенного в программу редактора пользователь может сравнить в одном окне оригинальный документ и распознанную копию. Расширенные функции по редактированию позволяют корректировать форматирование документа, вносить правки в текст, редактировать изображения, искать информацию, управлять страницами документа. Кроме того, имеется возможность вручную задавать области для распознавания и даже научить программу распознаванию специфических шрифтов.

Редактирование документов

В четырнадцатую версию FineReader были добавлены новые языки распознавания: математические символы (для распознавания однострочных математических формул) и английская транскрипция. Таким образом, теперь программа умеет оперировать документами на 192 мировых языках и любых их комбинациях.

Также при подготовке FineReader 14 к выпуску специалисты ABBYY увеличили скорость обработки и точность распознавания документов, доработали средства конвертирования PDF-файлов с текстовым слоем, улучшили работу с таблицами, графиками, диаграммами и документами на арабском языке. Множеству доработок подверглись другие компоненты программного комплекса. В частности, теперь FineReader позволяет создавать PDF-документы из файлов различных редактируемых форматов (DOCX, XLSX, RTF и др.) и объединять их в один PDF-документ.

Самый важный компонент нового FineReader – PDF-редактор, построенный на базе программы ABBYY PDF Transformer+. Приложение позволяет выполнять рецензирование и согласование PDF-документов, а также предлагает полный набор функций для их защиты от несанкционированного доступа и изменений. Кроме того, приложение интегрировано с Adobe PDF Library , что обеспечивает гарантированное открытие любых PDF -файлов и возможность внесения в них изменений без преобразования в редактируемый формат. С прицелом на корпоративный сегмент рынка в программе предусмотрены инструменты удаления конфиденциальной информации, добавления цифровой подписи и разграничения прав на печать и редактирование документов.

Внесение изменений в текст PDF-документов

Внесение изменений в текст PDF-документов

FineReader 14 позволяет преобразовывать PDF в популярные форматы Microsoft Word, Excel, PowerPoint, HTML, OpenOffice (ODT) и другие. При этом исходная структура и форматирование документа сохраняются. Благодаря упомянутой выше поддержке ePub и FB2, пользователи могут создавать из PDF-документов любительские электронные книги для чтения на планшетах и других портативных устройствах. Отдельно стоит отметить возможность создания PDF из файлов изображений (JPEG, JPEG2000, JBIG2, PNG, BMP, GIF, TIFF) и поддержку потокового конвертирования документов.

Цифровая подпись

Пригодится новый FineReader и тем, кто по долгу службы часто сталкивается с процессом согласования договоров или работает с документами, для которых характерна версионность. Возможности инструмента «Сравнение документов» позволяют сверять документы в различных форматах, быстро находить даже самые мелкие несоответствия в тексте и предотвращать тем самым подписание или публикацию некорректной версии документа. Автоматическое сравнение документов поможет существенно сэкономить время юристам, менеджерам по продажам, финансистам, логистам, а также всем офисным сотрудникам, которые сталкиваются со сравнением документов — договоров, актов, прайс-листов или других материалов.

Параллельный просмотр различий

Параллельный просмотр различий

Проводить сравнение документов можно как в текстовых, так и в графических (отсканированные документы или их фотографии, PDF без текстового слоя и т. п.) форматах. Для удобства работы с полученными результатами все обнаруженные несоответствия отображаются на отдельной панели, а также подсвечиваются по тексту в обоих документах. Предусмотрена возможность создания подробного отчёта о различиях и последующего его сохранения в виде таблицы в формате Word или PDF-документа с комментариями в местах изменений. Полученную таблицу можно использовать для вставки в отчёт о согласовании документов или для ведения переговоров с контрагентом. Несущественные различия перед формированием отчёта можно удалить.

Сохранение результатов сравнения

Сохранение результатов сравнения

Для предприятий среднего и крупного бизнеса в составе FineReader 14 представлено приложение-планировщик ABBYY Hot Folder, с помощью которого можно автоматизировать однотипные или повторяющиеся задачи по обработке документов в сети организации. Возможности программы позволяют выполнять пакетное конвертирование файлов, преобразование документов по расписанию и обработку почтовых вложений. Для начала работы необходимо выбрать компьютер, который будет заниматься выполнением перечисленных операций, указать рабочую директорию на файловом сервере и настроить список задач.

Обработка документов по расписанию

Обработка документов по расписанию

Таковы основные отличительные особенности нового поколения FineReader, определённо заслуживающего внимания тех, кто часто занимается оцифровкой бумажных документов. Программа предназначена для запуска в среде Windows, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и поставляется разработчиком в трёх редакциях — Standard, Business и Enterprise. Они различаются набором включённых инструментов, формами поставки и условиями лицензирования.

Редакции и формы поставки ABBYY FineReader 14

Редакции и формы поставки ABBYY FineReader 14

И последний штрих. Как и в случае с предыдущими версиями FineReader, условия лицензионного договора допускают установку продукта на один стационарный и один мобильный компьютер при соблюдении двух требований: оба устройства должны принадлежать человеку, который приобрёл продукт, и одновременно может быть запущена только одна копия программы. Таким образом, приложение можно установить и на рабочий ноутбук, и на домашний ПК, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

Задача , описаная автором, может быть расширена до сравнения одного и того же документа, полученного например сканированием в планшетном сканере и изображения, полученного при помощи камеры,при съёмки из папки судебного дела.

В российском суде часто участники судебного заседания останавливаются для того, чтобы сличить документ с его фотографией. Но ещё чаще судья просто отказывается это делать.

Или например вывешивая судебное дело на сайте, размещаешь постраничные фотографии дела, при этом часто параллельно даёшь ссылку на скан того-же документа полученного на сканере ( или полученного тобой же из файла Word).

Было бы очень полезно, если бы была разработана и продавалась утилита (лучше программа) или в сети действовал on-line сервис, который бы подтверждал, своей электронной подписью степень идентичности фотографии и качественного скана.

Задача , описаненая автором, при этом несколько расширится, но польза вырастит неимоверно.

Можете к этому приделать GUI и коммерциализировать; а мне хватит скрипта на десять строк.

Если в документ будет добавлена, или удалена как у автора теста, строка, то различными будут признаны остаток текущей страницы и все последующие

Примерно так и делал на чертежах проектной документации.

Есть реальная задача сравнивать подписанный скан с изначальным оригиналом. При этом сам скан может быть весьма разного качества (не говоря уже об поворотах, сгибах и прочем, если он получен с помощью камеры смартфона)..

Задача сравнения 2-ух PDF в общем своём понимании не решаема в связи с форматом самих PDF файлов, Даже больше, нет уверенности в возможности правильного сравнения и, например, прошедших через FineReader распознование. И, даже больше, «нет» готовых инструментов для сравнения даже файлов в текстовом варианте по причинам и описанным в статье, как простая перенумерация строк рушит весь алгоритм сравнения, хотя как казалось бы какая «мелочь», но разработчики таких программ не мыслят «мелочами» и удобством пользователей создавая свои программы.

P.S. Для сравнения текстовых файлов пользуюсь программой Winmerge, и она, в целом соответствующая своему предназначению, тоже далека от совершенства от потребностей пользователей. Для сравнения текстовых файлов есть, среди разных программ, и программа Windiff…

А, у кого и какие предпочтения и почему при использовании каких программ сравнения текстовых файлов?

Допустим, вы создали проект договора в Word и отправили контрагенту. Он внёс правки и вернул документ. Чтобы понять, что именно изменилось в тексте, придётся сравнить старую версию договора с новой и потратить на это 20-30 минут. Но можно в разы быстрее.

Допустим, вы создали проект договора в Word и отправили контрагенту. Он внёс правки и вернул документ. Чтобы понять, что именно изменилось в тексте, придётся сравнить старую версию договора с новой и потратить на это 20-30 минут. Можно сделать быстрее – по кнопке в Word, но лучше воспользоваться специализированными решениями. Подробнее о них читайте в новом обзоре.


Онлайн-сервисы для сравнения: бесплатно и без SMS

С одной стороны, такие решения выглядят очень привлекательно. Платить за них не нужно, как только появилась необходимость – открываешь браузер, заливаешь два документа и видишь отличия в версиях договора. С другой стороны, есть и «подводные камни» – далеко не все бесплатные веб-сервисы гарантируют сохранность и конфиденциальность обрабатываемых данных. Вы точно готовы к тому, что ваш договор может появиться в открытом доступе?

Embedika Compire

С помощью этого онлайн-сервиса можно найти отличия в документах DOC/DOCX и PDF, сохранённых в как в одном формате, так и в разных. Чтобы сравнить версии, необходимо загрузить их на сайт:


Интерфейс удобный и на русском языке, чего не скажешь о большинстве аналогичных сервисов.

Dreaftable Online

Популярный зарубежный онлайн-сервис для сравнения документов. Видит различия в файлах DOC/DOCX и PDF. Чтобы выявить различия, нужно загрузить два файла на сайт.


У сервиса есть десктопная версия для Windows и открытые API.

Diff Checker

Ещё один популярный бесплатный онлайн-сервис – Diff Checker. Если нужно сравнить две версии документов в Word, достаточно перенести текст из них в соответствующие поля. Далее нужно нажать на кнопку «Find Difference»:


В сервисе также можно сравнить PDF-документы. Сверки файлов в разных форматах (Word/PDF) нет.

PDF Tools

Бесплатный онлайн-сервис для сравнения документов в одном или разных текстовых форматах. Принцип работы такой же, как у аналогов выше – загружаются две версии Word-Word, PDF-PDF и Word-PDF. Однако отличия отображаются не в двух полях, а в одном:


Интерфейс на русском языке. Удобный, но менее современный, по сравнению с другими сервисами (по мнению ECM-Journal). Есть десктопное решение.

Всё по закону. Сравнение документов от разработчиков корпоративного ПО

Если вы не готовы рисковать и использовать онлайн-сервисы, воспользуйтесь готовыми корпоративными решениями. Сравнивать документы в этом случае безопасно – ваш договор могут видеть только пользователи системы, у которых есть права доступа. Многие решения позволяют отслеживать, кто и когда вносил правки, а также формировать автоматический отчёт по последним изменениям.

ABBYY ScanDifFinder SDK

Решение от известного разработчика интеллектуальных решений. Встраивается в популярные информационные системы.

Основное преимущество ABBYY ScanDifFinder SDK – можно сравнивать документы как в разных текстовых форматах, так и в графических (сканы, фотографии документов, PDF без текстового слоя и т.д.).

Решение игнорирует незначительные изменения в тексте. Так, если изменилось форматирование или размер шрифта, вам не сообщат об этом. В специальном поле справа будут показываются только правки, которые влияют на смысл и содержание договора.

Результаты проверки можно выгрузить отдельным файлом с комментариями в форматах PDF или Word. Есть функция, которая позволяет создать отчёт о сравнении документов.


Сравнение документов в Directum

Решение автоматически сопоставляет две версии документа – Word-Word, Word-PDF, PDF-PDF. Также может сравнивать исходную версию договора со скан-копией, в которой нет текстового слоя. Это возможно благодаря интеллектуальным сервисам Directum Ario.

Для сравнения необязательно заносить изменённый документ в систему. Можно сверить договор, который находится в Directum, с сохранённой локально версией – например, находящейся на рабочем столе.


По итогам сверки в системе формируется отчёт с визуализацией отличий. Текст выделяется разным цветом в зависимости от типа правки (добавление, изменение, удаление). Более подробную информацию можно посмотреть в примечаниях к изменениям.

Решение предоставляется дополнительно при покупке Directum RX.

ТЕЗИС: сравнение и распознавание

Решение от разработчика системы электронного документооборота. Пользователи могут сравнивать электронные версии документов, а также сверять их со скан-копиями. Решение реализовано с использованием технологии ABBYY FineReader Engine.


За опцию придётся доплатить – 40% от стоимости основной лицензии.

Сравнение документов в 1С

Сервис ИТС «1C-ABBYY Comparator» разработан с использованием уже описанного решения от ABBYY. Функциональность та же: автоматически сравниваются как документы в привычном электронном формате – Word, PDF, так и в графическом – скан-копии и фотографии без текстового слоя.

Сервис оплачивается дополнительно, главное условие – нужно приобрести лицензию 1С.

Конечно, в этом обзоре собраны только популярные сервисы и решения для сравнения документов. Какое из них выбрать, решать вам.

Совет от ECM-Journal: если вы решили избавиться от мучительной ручной сверки документов, начните с малого – обратитесь к поставщику вашей системы. Возможно, у него уже есть готовое решение и он может вам помочь.

Сегодня мы сравним три программных продукта от компании ABBYY и разберемся какой продукт лучше подходит для ваших целей:

  • ABBYY PDF Transformer+;
  • ABBYY FineReader 15 Business;
  • ABBYY FineReader 15 Enterprise.

ABBYY PDF Transformer+

Если Вам требуется программа для работы с PDF-файлами, а именно для их редактирования, создания, объединения и сканирования, то вам отлично подойдет ABBYY PDF Transformer+.

Из ограничений: нет возможности отредактировать отсканированный документ (только распознавание в текстовый формат и копирование результата), добавить или удалить внешние гиперссылки и водяные знаки, а также отредактировать PDF-формы.

Итог: идеально подходит, если вам необходимо внести текстовые правки в PDF-документ, а также конвертировать из PDF в другой формат (Word, Excel итд).

ABBYY FineReader 15 Business

Данная редакция включает в себя все функции PDF Transformer+, а так же позволяет редактировать отсканированные документы, удалять и редактировать водяные знаки, PDF-формы, гиперссылки, а также включает в себя программу ABBYY Hot Folder, позволяющая автоматически распознавать и конвертировать документы. (5 000 стр/мес
макс. 2 ядра процессора.)

Итог: ABBYY FineReader 15 Business идеально подходит, если вам необходимо сканировать и редактировать отсканированные документы, а так же иметь в наличии все инструменты для редактирования PDF-файлов.

ABBYY FineReader 15 Enterprise

Максимальная редакция, включающая весь функционал ABBYY FineReader Business, дополнительно к этому добавляется возможность сравнения документов в различных форматах.

Данная функция ABBYY FineReader 15 Enterprise идеально подойдет для тех, кто работает с договорами, Вам не придется вручную сравнивать ранее согласованный вариант договора с присланным оригиналом от партнера. Вы просто сканируйте присланный оригинал, и программа покажет отличия.

Дополнительно к этому увеличивается количество страниц, которые возможно распознать автоматически с помощью ABBYY Hot Folder (10 000 стр/мес макс. 4 ядра процессора.)

Что нового в ABBYY FineReader 15?


Возможности FineReader 14 FineReader 15
Открытие и просмотр PDF-документов
Просмотр PDF-документов ✓ улучшено
(открытие до 40% быстрее)
Разные режимы просмотра PDF (одностраничный или двухстраничный, полноэкранный или в пользовательском масштабе и т.д.)
Навигация внутри PDF-документа с помощью пиктограмм и закладок
Редактирование PDF-документов
Редактирование текста PDF-документов ✓(только в пределах строки) ✓ улучшено
в пределах абзаца
Перемещение текстовых блоков и изображений на странице, изменение порядка текстовых блоков и изменение разметки страницы без конвертирования - (только с конвертацией) ✓ new
Добавление строк и текстовых блоков (абзацев) в PDF-документ ✓ (только в пределах одной строки) ✓ улучшено
Редактирование сканов в формате PDF на уровне абзаца ✓ (только в пределах одной строки) ✓ улучшено
Поиск в тексте, комментариях, закладках и метаданных, выделение результатов поиска
Добавление и редактирование комментариев с помощью инструментов разметки и рисования. Добавление статусов, печать PDF-документов со списками комментариев
Добавление и редактирование закладок и гиперссылок
Добавление и редактирование колонтитулов (в т.ч. нумерации страниц)
Добавление нумерации Бейтса
Просмотр, редактирование и удаление метаданных
Заполнение PDF-форм, валидация введенной информации, импорт и экспорт данных из полей форм
Защита PDF-документов
Удаление конфиденциальной информации ("черный" маркер)
Защита PDF-документа паролем от несанкционированного доступа, редактирования и/или печати
Добавление и валидация цифровой подписи*, создание подписи из изображения
Распознавание текста и конвертирование
Создание документов PDF, PDF/A, PDF/UA из файлов изображений, MS Office, PDF и файлов других форматов
Конвертация изображений и PDF-документов в различные редактирумые форматы, форматы изображений, электронных книг и др.
Сохранение форматирования и структуры документа при конвертировании
Проверка и редактирование результатов распознавания, форматирования и структуры документа ✓ улучшено
Распознавание мультиязычных документов 192 языка 192 языка
Определение и распознавание таблиц и диаграмм и графиков ✓ улучшено
Редактор для предварительной обработки изображений (обрезка, яркость и контраст, утранение трапецивидных искажений, осветление фона и др.
Извлечение текста, изображений, таблиц для дальнейшего использования
ABBYY Hot Folder**
Автоматизация задач по распознаванию и конвертации документов, в т.ч. по расписанию
Сравнение документов**
Сравнение документов на различных языках 38 38
Сравнение документов в различных форматах, включая бумажные и электронные
Обнаружение различий в тексте документа, заголовках, колонтитулах, нумерации
Обнаружение битой кодировки в сравниваемых документах для избежания выявления ложных различий ✓ улучшено
Сохранение результатов сравнения в формате PDF-документа с комментариями к найденным различиям или перечня различий в Microsoft Word
Сохранение результатов сравнения в формате Word в режиме Исправлений (Track changes) - ✓ new
Общее
Год выпуска 2017 2019
Редакции Standard, Business, Enterprise Standard, Business, Corporate
Скидка на обновление с предыдущих версий (Upgrade) При обновлении с ABBYY FineReader 11/12 или ABBYY PDF Transformer+ При обновлении с ABBYY FineReader 12/14
Типы лицензий для организаций Per Seat, Concurrent, Terminal Per Seat, Concurrent, Remote User

* Для использования функции необходимо иметь сертификат ключа электронной цифровой подписи.
** Доступно в редакции ABBYY FineReader 15 Corporate/ABBYY FineReader 14 Enterprise.

Читайте также: