Abbyy hot folder что это

Обновлено: 03.07.2024

ABBYY FineReader предназначен для преобразования отсканированных бумажных документов, например, писем, договоров, журнальных или газетных статей, книг, факсов в электронные форматы для последующего редактирования, архивирования или поиска. Также система позволяет распознавать и редактировать

ABBYY FineReader 8.0 распознает изображения, полученные с помощью цифровой камеры. Если под рукой нет сканера, можно сделать снимок документа с помощью фотоаппарата. Программа адаптируется к этим изображениям, учитывая такие их особенности, как неравномерная освещённость, нечёткая фокусировка и искажения строк.

Новая функция ABBYY FineReader 8.0 «Менеджер сценариев» позволяет автоматизировать повторяющиеся действия, которые возникают в процессе распознавания документов. Например, открыть несколько изображений, распознать их, а результаты сохранить в один Такой набор операций можно объединить в один сценарий, вызов которого доступен по команде из меню. В продукте есть предопределённые сценарии, но пользователь может создавать и собственные.

ABBYY Hot Folder & Scheduling, новое доступное в восьмой версии, ориентировано на Оно позволит распознавать документы в автоматическом режиме, без участия пользователя, например, ночью. Кроме того, данное приложение позволяет интегрировать ABBYY FineReader с сетевыми и персональными многофункциональными устройствами, настроив систему на автоматическую обработку изображений, получаемых при помощи таких устройств.

Изображения документов, которые были отсканированы с низким разрешением, например, цифровыми копировальными аппаратами, ABBYY FineReader 8.0 распознаёт на 15% лучше, чем предыдущая версия. Также на 30% повышено качество распознавания факсов.


В новой версии ABBYY FineReader количество поддерживаемых языков увеличено до 179, из них 36 со словарной поддержкой. Появился режим ускоренного распознавания, который будет полезен для сокращения времени на обработку документов высокого качества печати или при индексировании больших архивов документов. Кроме того, теперь продукт позволяет задавать для сохраняемых документов дополнительные свойства, такие как автор, тема, короткое описание, ключевые слова, которые в дальнейшем могут использоваться системами индексирования и поиска.

Восьмая версия FineReader поддерживает новый формат сохранения Microsoft Reader (LIT), умеет распознавать и сохранять гиперссылки и внутренние ссылки в

ABBYY FineReader 8.0 будет поставляться в двух версиях. ABBYY FineReader 8.0 Professional Edition — профессиональный продукт для распознавания документов, предназначенный для индивидуального использования дома или в небольшом офисе, где потребности в распознавании есть у 1–2 сотрудников; ABBYY FineReader 8.0 Corporate Edition — продукт, ориентированный на Он предоставляет возможности коллективной работы над задачами распознавания документов, обеспечивает интеграцию с многофункциональными устройствами и возможность планирования задач распознавания благодаря наличию ABBYY Hot Holder & Scheduling. FineReader Corporate Edition предлагает оптимизированные под использование в локальной сети режимы установки и лицензирования. Версия рекомендована для организаций, где распознавать документы требуется более чем сотрудникам.

Поставки ABBYY FineReader 8.0 в России начнутся в сентябре 2005 года. Рекомендованная цена на продукт составит: ABBYY FineReader 8.0 Professional Edition — $130; ABBYY FineReader 8.0 Corporate Edition — $260.

Возможно, окончательная победа цифровых технологий уже не за горами, но сегодня мы все еще находимся в переходном периоде и вынуждены приводить разнородные потоки и источники информации к «общему знаменателю». Оцифровка печатных материалов (OCR, Optical Character Recognition), одна из наиболее типичных задач, хорошо знакома отечественным пользователям и на просторах СНГ однозначно ассоциируется с ABBYY FineReader. Популярность этого продукта вполне заслуженна, а компания-разработчик не почивает на лаврах и неутомимо отслеживает современные тенденции и развивает свое детище. Так, в девятой версии FineReader стал работать не с отдельными блоками или даже страницами, а с целыми документами (ADRT, Adaptive Document Recognition Technology), что позволило ему гораздо правильнее воссоздавать их структуру, включая такие элементы как таблицы, колонтитулы и пр. В десятой приоритет сместился в сторону качественной обработки изображений, полученных не со сканеров, а с цифровых фотокамер. Популярность последних продолжает расти, так, согласно информации ABBYY, фотокамеры для оцифровки печатной продукции (учебников и научной литературы, юридических и деловых документов, газет и журналов, анкет и пр.) применяют более 30% пользователей. Представленный в конце августа FineReader 11 также имеет немало полезных нововведений, хотя выделить главное направление довольно сложно. Скорее, в нынешней версии разработчики сосредоточились на совершенствовании накопленных технологий и, конечно, на повышении удобства работы.

Общая информация

На текущий момент доступны две редакции FineReader 11 — Professional и Corporate. Home пока осталась в 10-й версии. На сайте ABBYY есть довольно объемная таблица с описанием возможностей всех трех редакций, хотя проводить такое сравнение не совсем корректно — наверняка со временем появится и FineReader 11 Home Edition, который сократит отставание от старших собратьев. Однако принципиально картину это не изменит — функциональность редакции Home сильно урезана. Так, отсутствуют возможности обработки документов PDF, DjVu, XPS; распознавание штрихкодов; встроенный редактор; вывод во многие форматы; поддержка многоядерных процессоров и пр. Конечно, кому-то базовой функциональности будет достаточно, особенно для эпизодического применения, но в общем случае сниженная стоимость не компенсирует потери.

  • возможность создавать пользовательские сценарии, аналогичные встроенным типовым задачам;
  • режим совместной работы с одним документом, когда несколько пользователей могут параллельно выполнять различные действия;
  • передачу документов на серверы SharePoint;
  • режим Цензура, позволяющий в буквальном смысле вымарать лишнюю информацию, причем, в документах, которые поддерживают графический и текстовый слои, она будет удалена из обоих;
  • программу ABBYY Hot Folder, обеспечивающую автоматическую обработку документов, поступающих в папку, почтовый ящик или на FTP-сервер;
  • программу ABBYY Business Card Reader для преобразования визиток в электронные контакты.

Системные требования и установка

  • операционная система Windows XP, Windows Server 2003 или более новая;
  • процессор с частотой от 1 ГГц;
  • объем оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро;
  • 700 МБ дискового пространства непосредственно для установки и столько же для рабочих файлов.

Программа более чувствительна к производительности процессора, ресурсы которого обычно задействуются на все 100%, чем к объему оперативной памяти.

Установка FineReader 11 довольно проста — настолько, что даже не описана в руководстве пользователя. Инсталляционная процедура запустится на языке, указанном в системных настройках, но на первом же экране можно выбрать нужную локализацию. Выборочная установка позволит отказаться от некоторых инструментов и функций, вроде ABBYY Screenshot Reader (для распознавания снимков экрана) и интеграции в сторонние приложения. Но все это относится к клиентской части, в основном, к редакции Professional. FineReader 11 Corporate в общем случае предполагает сетевое развертывание, описание которого приведено в руководстве администратора. С дистрибутивного диска вначале нужно установить сервер и менеджер лицензий. Последний представляет собой управляющую утилиту и также может размещаться на любой рабочей станции. Сервер лицензий на самом деле не требует серверной ОС, а учитывая минимальную вычислительную нагрузку, его вполне разумно установить в виртуальной машине. Принципиально только соединение с Интернетом, так как с помощью менеджера лицензий необходимо регистрировать и активировать имеющиеся лицензии.

Для установки FineReader 11 Corporate на рабочие станции есть несколько способов, самый простой (но не всегда самый эффективный) — формирование административного дистрибутива в папке общего доступа и запуск инсталляции на каждом рабочим месте. При этом все параметры сервера лицензий будут прописаны автоматически, так что никаких дополнительных действий не понадобится. При использовании per-seat лицензий FineReader 11 Corporate можно устанавливать и локально.

Работа с FineReader 11

Несмотря на то, что за ABBYY FineReader стоит целая отрасль искусственного интеллекта и весьма изощренные алгоритмы, сама по себе программа достаточно проста и интуитивна. По сути она решает одну единственную задачу — распознавание текста, соответственно, в ней нет изобилия инструментов и сложных меню, хотя все необходимые опции и средства появляются при работе с конкретными объектами, будь то изображение, выделенный блок или распознанный текст. За последнее время интерфейс программы практически не менялся (никаких «лент») и это хорошо, так как пользователи предыдущих версий найдут привычные инструменты на своих местах. Работать с FineReader можно двумя основными способами: либо воспользоваться одним из типовых сценариев, к примеру, со сканера сразу в EPUB, либо проделать основные операции вручную. В любом случае обработка документов состоит из четырех основных этапов: получение изображения, его распознавание, проверка, сохранение результата, — и на каждом доступно некоторое количество опций и дополнительных возможностей, способных существенно повлиять на качество результата. С опытом каждый пользователь отработает собственный стиль взаимодействия с FineReader, но для начала вполне разумно полагаться на автоматические настройки, тем более, что программа оповестит о всех проблемах, скажем, о необходимости отсканировать с большим разрешением оригиналы, на которых имеется мелкий шрифт. Кроме того, в рабочем документе отмечаются все неуверенно распознанные символы, так что их можно будет быстро проверить, в том числе, в специальном окне с укрупненным фрагментом оригинала. В большинстве случаев FineReader и сам примет правильные решения, особенно если сомнения возникают в известных словах, в противном случае имеет смысл добавить слово в словарь и повторить распознавание. При возникновении большого количества ошибок следует обратить внимание на качество оригинала и его изображения — это самый важный фактор, нивелировать который в дальнейшем практически невозможно.

Для сравнения доступных режимов обработки был проведен небольшой тест. В качестве оригинала был взят 10-страничный, отпечатанный на цветном принтере материал со сравнительно сложной версткой, но почти без иллюстраций. Такое задание можно считать достаточно типичным, так как главной задачей программ распознавания является именно извлечение текста. Затем в опциях FineReader 11 была отключена автоматическая обработка и сформированы три документа: один в черно-белом режиме и два в цветном, отсканированные в цвете и в оттенках серого. Сканирование выполнялось на МФУ с разрешением 300 dpi, что также является типичной ситуацией. Все прочие настройки FineReader 11 не менялись, в частности, использовался тщательный режим собственно распознавания. Серии операций по распознаванию проводились на компьютере с двухъядерным процессором, усредненные результаты можно видеть в следующей таблице:

Табл. Сравнение различных режимов обработки документа

Несмотря на достаточно высокое качество оригинала, в черно-белом режиме значительно большее число символов было распознано неуверенно. Однако, львиная доля их приходилась на фрагменты с изображениями. При этом на одной чисто текстовой странице лучшее качество распознавания оказалось именно в черно-белом режиме. Сканирование в оттенках серого считается ABBYY FineReader 11 оптимальным для OCR, с чем, пожалуй, можно согласиться, глядя на результаты теста. По физическим характеристикам, в том числе скорости, серый режим близок к черно-белому, а по качеству распознавания — к цветному. Справедливости ради, отметим, что результаты в черно-белом режиме было несложно значительно улучшить, предварительно разметив иллюстрации или добавив в словарь несколько часто встречающихся в документе аббревиатур (в них программа ошибалась наиболее часто). Тем не менее, цветной режим со сканированием в оттенках серого действительно выглядит не компромиссом, а оптимальным выбором.

Дополнительные возможности

Несмотря на прозрачность работы и наличие типовых сценариев, ABBYY FineReader 11 имеет в своем арсенале и достаточно тонкие инструменты, которые при умелом использовании существенно могут облегчить жизнь пользователям. К примеру, программу можно обучить для работы с декоративными шрифтами или специальными символами (вначале, конечно, следует убедиться, что она с ними не справляется). Хотя это довольно трудоемкий процесс, и применять его целесообразно только в исключительных случаях. Другим примером могут служить шаблоны областей для обработки однотипных документов. Достаточно проанализировать один образец, скорректировать его разметку, выделить нужные блоки и сохранить шаблон. В дальнейшем его можно будет применять к аналогичным документам, не повторяя рутинную работу. В полной мере возможности этой функции раскрываются при использовании вместе с Hot Folder для автоматической обработки документов.

ABBYY Hot Folder, в свою очередь, является одним из дополнительных компонентов FineReader 11 (только редакции Corporate). Это специализированный планировщик, управляющий заданиями для автоматической обработки документов. По указанному расписанию он может проверять один из типов источников (папки, ftp-серверы, почтовые ящики, документы ABBYY FineReader, которые сами по себе также являются папками) и инициировать их обработку с предварительно настроенными параметрами. Типичное применение Hot Folder — централизованное распознавание документов, которые вводятся сотрудниками через сетевые МФУ. Как правило такие устройства умеют сохранять отсканированные изображения в папках общего доступа, за которыми как раз и будет следить Hot Folder.

Наконец, еще одно дополнение — ABBYY Screenshot Reader — присутствует в редакциях и Corporate, и Professional. Как и следует из названия, данная программа распознает информацию на экране компьютера (можно выделять окно или прямоугольную область). Таким образом, к примеру, можно быстро извлечь информацию о программной ошибке для поиска в базе знаний. Результат можно сохранять в файлах распространенных форматов или копировать в буфер обмена.

Резюме

ABBYY FineReader 11 сделал еще несколько шагов к тому, чтобы освободить пользователей от рутины и приблизить нашу жизнь к цифровому будущему. В программе внешняя простота сочетается с мощными алгоритмами, что позволяет даже неподготовленным пользователям добиваться хороших результатов. Все нововведения нынешней версии наверняка будут оценены по достоинству, начиная с повышенной производительности и заканчивая поддержкой популярных форматов электронных книг. Преимущества редакции Corporate также очевидны, хотя, с учетом более высокой стоимости лицензии, ее внедрение требует предварительной оценки реальной потребностей в OCR всех сотрудников.

Abbyy hot folder что это

Первая версия программы FineReader увидела свет в далеком 1993 году, и умела она только распознавать и сохранять в редактируемых форматах сканированные тексты на русском и еще нескольких языках. А пятнадцатая версия, которая вышла на рынок в конце августа нынешнего года, позиционируется уже как универсальный инструмент для работы с бумажными и PDF-документами на цифровом рабочем месте, использующий технологии оптического распознавания символов и конвертации документов, основанные на возможностях искусственного интеллекта, и позволяет распознавать тексты на 192 языках.

ABBYY предлагает три варианта программы: Standard, Business и Corporate. Первый предназначается для домашних пользователей, второй – для небольших и средних компаний, а третий, включающий полный набор функций, – для крупных и средних компаний. В состав Corporate включена программа, которая по расписанию производит автоматическое распознавание документов, помещаемых в «горячую папку» – ABBYY Hot Folder. В этой версии есть также инструмент для сравнения документов, представленных в разных форматах, с формированием перечня выявленных различий и возможностью сохранения результатов сравнения в формате Word, где все изменения уже подсвечиваются в режиме Track Changes, в PDF с комментариями в местах изменений или в виде таблицы с перечнем правок в Word. Для каждой версии можно купить либо бессрочную, либо годовую лицензию.

Abbyy hot folder что это

Исходная страница книги в формате PDF

ABBYY FineReader 15 позволяет открывать, просматривать и редактировать PDF-документы, добавлять к ним комментарии, графические пометки и закладки, работать с вложенными файлами, осуществлять поиск по тексту. Если исходный PDF-документ не содержит текстового слоя, программа производит фоновое распознавание текста и таким образом обеспечивает возможность поиска по ключевым словам. Отсканированный документ с помощью OCR-редактора можно проанализировать, выделить блоки изображений и текстовые блоки и сохранить в формате PDF, который с помощью имеющегося набора инструментов превращается фактически в редактируемый: можно исправлять опечатки, добавлять и удалять тексты, перемещать и переформатировать текстовые блоки, редактировать таблицы, добавлять и удалять страницы, заполнять формы, совместно работать с документами, подписывать их электронной подписью и защищать с помощью пароля, а также объединять несколько документов в один PDF-файл, преобразовывать в другие редактируемые форматы и т. д. (Полный перечень возможностей программы и подробное «Руководство пользователя» представлены на сайте производителя.)

Abbyy hot folder что это

Она же после автоматического преобразования в формат Word

При тестировании программы она легко справилась с такими задачами, как сканирование и распознавание бумажных документов, создание и редактирование PDF-документов и преобразование их в документы Word. Например, преобразование книги формата А5 на 488 страницах из PDF в Word заняло около пяти минут, при этом в тексте объемом без малого 890 000 знаков программа сделала всего 16 мелких ошибок (лишние пробелы, длинное тире вместо короткого, неверно распознанные буквы) – это ничтожно мало. В исходном PDF-файле не было текстового слоя, но FineReader примерно за 45-50 секунд просматривал 488 книжных страниц и находил заданные слова и словосочетания. После сохранения книги в PDF с текстовым слоем поиск занимал около 30 секунд.

Abbyy hot folder что это

Автоматически «исправленное» при преобразовании изображение страницы

С преобразованием страниц с иллюстрациями дело обстояло похуже: в автоматическом режиме с настройками по умолчанию искусственный интеллект допускал ошибки. При преобразовании брошюры из PDF в Word программа 10 из 14 фотографий альбомного формата (в брошюре они располагались с поворотом на 90º) разрубила пополам, поместив каждую половинку на отдельную страницу (интересно, что неразделенными остались фотографии, подписи под которыми были длинными – это подсказка разработчикам). Еще одну картинку искусственный интеллект повернул примерно на 30º вместе с подписью.

Abbyy hot folder что это

Инструментарий «Редактора изображений»

Abbyy hot folder что это

Окно настроек приложения ABBYY Screenshot Reader

Часть картинок для этой статьи была сделана с помощью этого удобного инструмента. Распознавание текста в выделенной области экрана оказалось очень удобным, в частности, для копирования текстов из презентаций, в том числе и на иностранных языках. Если это приходится делать часто, значок ABBYY Screenshot Reader можно закрепить на панели задач Windows.

Достоинства:
Высокое качество распознавания текстов
Широкий набор инструментов для работы с PDF

Недостатки:
Высокая цена

Ориентировочная цена: 8690 (бессрочная Standard)

(только для версии ABBYY FineReader Corporate)

ABBYY FineReader включает в себя приложение ABBYY Hot Folder. Это приложение-планировщик, с помощью которого можно назначить время обработки документов из выбранной папки. Открытие файлов и распознавание изображений может быть выполнено в то время, когда компьютер наименее загружен, например, ночью.

Для автоматической обработки изображений необходимо настроить задачу для выбранной папки. Настройки задачи включают в себя все необходимые параметры открытия изображений, распознавания и сохранения распознанного текста, режим проверки папки (однократно или постоянно), время начала обработки папки.

Внимание! Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.

Установка и запуск приложения ABBYY Hot Folder

Приложение ABBYY Hot Folder устанавливается вместе с программой ABBYY FineReader 12. Если приложение ABBYY Hot Folder отсутствует на вашем компьютере, это значит, что при выборочной установке ABBYY FineReader 12 компонент ABBYY Hot Folder был отключен.

Как установить ABBYY Hot Folder позднее:

Замечание. В операционной системе Windows XP данная команда называется Установка и удаление программ.

  1. Из списка установленных программ выберите программу ABBYY FineReader 12 и нажмите кнопку Изменить.
  2. В диалоге Выборочная установка выберите компонент ABBYY Hot Folder.
  3. Далее следуйте инструкциям программы установки.

Запуск приложения ABBYY Hot Folder

Запустить приложение ABBYY Hot Folder можно одним из следующих способов:

  • В меню Старт>Программы>ABBYY FineReader 12 выберите пункт ABBYY Hot Folder, или
  • В меню Сервис программы ABBYY FineReader 12 выберите команду Hot Folder…, или
  • Щелкните по значку приложения, расположенному на панели задач Windows (данный значок появляется после того, как на компьютере была настроена хотя бы одна задача).

При запуске приложения ABBYY Hot Folder открывается главное окно.

На панели инструментов приложения расположены кнопки, позволяющие настраивать, копировать, удалять задачи для папок, а также запускать обработку папок и просматривать отчет об обработке папки.

Abbyy hot folder что это

В окне ABBYY Hot Folder располагается список настроенных задач. Для каждой задачи указывается полный путь к обрабатываемой папке, статус задачи и время следующего сеанса обработки папки.

В процессе выполнения задача может иметь следующие статусы:

СтатусОписание
Abbyy hot folder что это
Обрабатывается…Выполняется обработка изображений, находящихся в папке.
Abbyy hot folder что это
Однократная обработкаДля данной папки выбран режим разовой обработки, момент начала обработки указан в столбце Время следующего запуска.
Abbyy hot folder что это
ОстановленаОбработка папки приостановлена.
Abbyy hot folder что это
ОбработанаОбработка папки завершена.
Abbyy hot folder что это
Ошибка (см. отчет)В процессе обработки папки произошла ошибка, и обработка изображений не была завершена. Описание ошибок приводится в отчете об обработке папки. Для того чтобы установить причину ошибки, выберите папку и нажмите кнопку Просмотр отчета, расположенную на панели инструментов.

Вы можете сохранить любую задачу для последующего использования.

Чтобы загрузить ранее сохраненную задачу:

Как создать новую задачу для папки

Если для получения доступа к FTP папке необходимо указать имя пользователя и пароль, введите их в поля Имя пользователя и Пароль. Если же для доступа к FTP папке не требуются имя пользователя и пароль, отметьте опцию Анонимное подключение.

  • Файл из папки Outlook — позволяет обрабатывать изображения из папок, расположенных в почтовом ящике.
  • Документ FineReader — позволяет обрабатывать изображения из документа FineReader.

Abbyy hot folder что это

Подробнее о цветовом оформлении документа см. «Как учесть характеристики исходного документа».

В группе Исходные файлы укажите сохранять, удалять или переносить исходные файлы в указанную папку.

  1. На шаге Анализ и распознавание выберите настройки анализа и распознавания документа.
  2. В выпадающем списке Язык документа выберите язык, соответствующий тексту на изображениях, которые вы собираетесь распознать.

Замечание. Возможен выбор нескольких языков распознавания.

  • В группе Параметры обработки документа укажите, следует распознавать документ, анализировать или выполнять только предобработку изображений. При необходимости задайте дополнительные параметры распознавания и предобработки изображений, нажав кнопку Настройки распознавания… или Настройки предобработки… соответственно.
  • Если при распознавании нет необходимости сохранять цвета изображений, вы можете обрабатывать документы в черно-белом режиме. Для этого в группе Цветовой режим отметьте опцию Конвертировать изображения в черно-белые.
  • Выберите, следует анализировать расположение областей автоматически или использовать шаблон областей.
  1. Из выпадающего списка Сохранить и поделиться выберите, в каком виде вы хотите сохранять документы.
  2. Из выпадающего списка Сохранить как выберите формат файла.

Совет. Чтобы настроить дополнительные параметры сохранения, нажмите кнопку Опции….

  • В поле Папка укажите папку, в которую нужно сохранить обработанные документы.
  • Из выпадающего списка Результат выберите способ сохранения:
  • Создать отдельный документ для каждого файла (сохраняя иерархию папок) — позволяет сохранить каждый файл в отдельный документ;
  • Создать отдельный документ для каждой папки (сохраняя иерархию папок) — позволяет сохранить все файлы из одной папки в один документ;
  • Создать один документ для всех файлов — позволяет сохранить все файлы в один документ.

Совет. Вы можете включить в процесс обработки папки несколько шагов сохранения и создать копии документов в различных форматах.

Настроенная задача будет отображена в окне ABBYY Hot Folder.

Замечание. Файлы задач сохраняются в папку %Userprofile%AppDataLocalABBYYHotFolder12.00. (В операционной системе Microsoft Windows XP — в папку %Userprofile%Local SettingsApplication DataABBYYHotFolder12.00).

Внимание! Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.

Как изменить параметры задачи

Вы можете изменить параметры уже существующей задачи.

Отчет об обработке папки

Обработка изображений из папки, для которой была настроена задача, выполняется автоматически. В ходе обработки приложение ABBYY Hot Folder фиксирует все события процесса и регистрирует их в отчете.

  • Название и перечень настроек задачи
  • Список ошибок и предупреждений
  • Статистику выполнения задачи (количество обработанных страниц, количество ошибок и предупреждений, выявленных в ходе обработки, количество неуверенно распознанных символов)

Как включить сохранение отчета:

Отчет об обработке папки будет сохранен в файл формата TXT в той же папке, что и файлы с распознанным текстом.

Как открыть файл отчета:

  1. В списке задач главного окна ABBYY Hot Folder выберите задачу.
  2. На панели инструментов нажмите кнопку Отчет.

Замечание. Для того чтобы получить информацию о ходе выполнения задачи, наведите курсор мыши на ее статус.

ABBYY FineReader включает в себя приложение ABBYY Hot Folder. Это приложение-планировщик, с помощью которого можно назначить время обработки документов из выбранной папки. Открытие файлов и распознавание изображений может быть выполнено в то время, когда компьютер наименее загружен, например, ночью.

Для автоматической обработки изображений необходимо настроить задачу для выбранной папки. Настройки задачи включают в себя все необходимые параметры открытия изображений, распознавания и сохранения распознанного текста, режим проверки папки (однократно или постоянно), время начала обработки папки.

Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.

Установка ABBYY Hot Folder

Приложение ABBYY Hot Folder устанавливается вместе с программой ABBYY FineReader 14. Если приложение ABBYY Hot Folder отсутствует на вашем компьютере, это значит, что при выборочной установке ABBYY FineReader 14 компонент ABBYY Hot Folder был отключен.

Как установить ABBYY Hot Folder позднее:

При запуске приложения ABBYY Hot Folder открывается главное окно.

На панели инструментов приложения расположены кнопки, позволяющие настраивать, копировать, удалять задачи для папок, а также запускать обработку папок и просматривать отчет об обработке папки.

Abbyy hot folder что это

В окне ABBYY Hot Folder располагается список настроенных задач. Для каждой задачи указывается полный путь к обрабатываемой папке, статус задачи и время следующего сеанса обработки папки.

В процессе выполнения задача может иметь следующие статусы:

СтатусОписание
Abbyy hot folder что это
Обрабатывается.
Выполняется обработка изображений, находящихся в папке.
Abbyy hot folder что это
Однократная обработка
Для данной папки выбран режим разовой обработки, момент начала обработки указан в столбце Время следующего запуска.
Abbyy hot folder что это
Проверяемая.
Для данной папки выбран режим повторного запуска, момент начала повторной обработки указан в столбце Время следующего запуска.
Abbyy hot folder что это
Остановлена
Обработка папки приостановлена.
Abbyy hot folder что это
Обработана
Обработка папки завершена.
Abbyy hot folder что это
Ошибка (см. отчет)
В процессе обработки папки произошла ошибка, и обработка изображений не была завершена. Описание ошибок приводится в отчете об обработке папки. Для того чтобы установить причину ошибки, выберите папку и нажмите кнопку Просмотр отчета, расположенную на панели инструментов.

Вы можете сохранить любую задачу для последующего использования.

Чтобы загрузить ранее сохраненную задачу:

Как создать новую задачу для папки

Настроенная задача будет отображена в окне ABBYY Hot Folder.

Файлы задач сохраняются в папку %Userprofile%AppDataLocalABBYYFineReader14.00HotFolder.

Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.

Как изменить параметры задачи

Вы можете изменить параметры уже существующей задачи.

Отчет об обработке папки

Обработка изображений из папки, для которой была настроена задача, выполняется автоматически. В ходе обработки приложение ABBYY Hot Folder фиксирует все события процесса и регистрирует их в отчете.

  • Название и перечень настроек задачи
  • Список ошибок и предупреждений
  • Статистику выполнения задачи (количество обработанных страниц, количество ошибок и предупреждений, выявленных в ходе обработки, количество неуверенно распознанных символов)

Как включить сохранение отчета:

Отчет об обработке папки будет сохранен в файл формата TXT в той же папке, что и файлы с распознанным текстом.

Пожалуй, трудно в IT-сфере найти человека, ничего не слышавшего о программных решениях отечественной компании ABBYY, входящей в ТОП-100 самых упоминаемых брендов Рунета и являющейся законодателем мод в области распознавания документов и лингвистики. Более чем двадцатилетний опыт насыщенной и продуктивной работы определил успех российского разработчика во всем мире, о чем свидетельствует не только 30-миллионная аудитория пользователей более чем в 130 странах, но и признание со стороны бизнес-сообщества, обрабатывающего с помощью технологий и инструментов компании свыше 1,6 млрд страниц документов и форм ежегодно. Цифры впечатляющие, однако в ABBYY не почивают на лаврах и продолжают неустанно из года в год совершенствовать и расширять линейку своей продукции, не так давно пополнившуюся новой, одиннадцатой по счету версией OCR-пакета FineReader, представленного в редакциях Professional Edition и Corporate Edition и предназначенного для конвертирования отсканированных документов, изображений, фотографий и PDF-файлов в редактируемые форматы.


Говоря о нововведениях в систему оптического распознавания текстов, прежде всего следует отметить увеличенную скорость обработки документов. По результатам проведенных ABBYY тестов, FineReader 11 демонстрирует возросшую на 20% производительность по сравнению с предыдущей версией продукта. Особый акцент разработчики делают на оптимизации различных режимов работы приложения, позволяющих добиваться существенной экономии времени при обработке больших объемов информации. Так, практическое использование нового ­черно-белого режима ускоряет конвертирование данных до 30%, а активация режима быстрого распознавания, предназначенного для документов с простым оформлением и хорошим качеством печати, форсирует упомянутый процесс аж до 70%. Немалую роль в достижении программой столь значимых результатов играет эффективное использование вычислительных возможностей многоядерных процессоров.

Вторая ключевая особенность FineReader 11 — улучшенное качество распознавания и сохранения­ структуры многостраничных документов. Благодаря совершенствованию технологии адаптивного распознавания документов (ADRT — Adaptive Document Recognition Technology), специалистам ABBYY удалось на 40% повысить точность определения заголовков и колонтитулов, на 70% — текста на полях, на 25% улучшить распознавание таблиц и на 15% — определение картинок и диаграмм­. Также добавлена поддержка вертикальных колонтитулов, улучшено на 20% качество "понимания" текстов для группы языков CJK (китайский, японский, корейский) и в состав программы включен инструментарий для создания в PDF-документе оглавления в виде закладок. Использование последней опции восстанавливает структуру­ оглавления документа с возможностью перехода по ссылкам, что существенно упрощает навигацию и работу с многостраничными материалами.

Важный аспект — поддержка языков, также не оставшаяся без внимания программистов, инженеров и лингвистов ABBYY. Разработчики добавили в одиннадцатую сборку продукта арабский, вьетнамский, туркменский (латиница) языки и реализовали словарную поддержку для­ арабского, вьетнамского, латинского,­ японского, корейского языков. Таким образом, отныне в активе OCR-решения значится 189 языков распознавания, для 45 из которых предусмотрена проверка орфографии. Такой багаж знаний делает FineReader самой многоязычной системой распознавания в мире.

Вполне возможно, что рядовым пользователям FineReader, чья работа с приложением ограничивается конвертированием документов на двух-трех европейских языках, включение поддержки перечисленных в предыдущем абзаце языков покажется малозначительным, однако на деле умение программы понимать особенности той же арабской системы письма свидетельствует о том, что технологии оптического распознавания ABBYY развиваются, а значит, становятся еще совершеннее. Важно осознавать, что за реализацией поддержки любого дополнительного языка кроется кропотливый труд большого числа специалистов и экспертов компании.

Отдельное внимание при разработке программы было уделено переводу бумажных книг в цифровой вид. Электронные книги давно уже превратились из экзотики в обыденность, поэтому включение в состав FineReader 11 поддержки форматов FictionBook 2.0 (FB2), Electronic Publication (ePub) и возможности отправлять файлы непосредственно из окна приложения в учетную запись Amazon Kindle является оправданным шагом. В настройках модуля, отвечающего за формирование eBook-изданий, можно управлять функцией сохранения изображений и их качеством, выбирать оформление книги с использованием простого или форматированного текста, включать встраивание шрифтов и манипулировать прочими свойствами документа. Кроме того, программа умеет автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие главы книги. Данная возможность FineReader также может быть востребована владельцами eBook-ридеров и прочих портативных устройств.


Серьезно изменились средства обработки фотографий, пополнившиеся новыми инструментами для редактирования изображений, включая настройку яркости, контрастности и уровней интенсивности света и тени, которая позволяет значительно улучшить исходные снимки и получить более точные результаты распознавания. Подобного рода корректировки можно произвести в любом имеющемся под рукой графическом редакторе, однако одно дело — возиться со сторонним приложением и затем переносить файлы в FineReader, и совсем другое — вносить необходимые правки непосредственно в окне OCR-пакета.

Упомянуть следует и появившийся в 10-й версии программы и улучшенный в 11-й инструментарий для исправления трапециевидных искажений, часто возникающих при съемке документов цифровой камерой. Выбрав в редакторе изображений соответствующий пункт, пользователь может, перетаскивая мышью углы рамки и совмещая их с углами картинки, устранить искажение перспективы и в два счета привести снимок к «плоскому» виду. Подобный функционал может быть полезен как для улучшения читабельности сфотографированных документов, так и для приведения разнородных снимков к общему знаменателю.

. и после коррекции трапеции средствами FineReader 11

ABBYY FineReader предоставляет широкий спектр возможностей для работы с форматом PDF — принятым во всем мире стандартом обмена электронными документами и деловой переписки. В обновленной редакции продукта улучшена технология MRC-сжатия (Mixed Raster Content), благодаря чему можно уменьшить размеры PDF-файлов в пять раз, по сравнению с 10-й версией программы, без видимых изменений качества изображения — это позволяет экономить пространство на диске компьютера и пересылать объемные документы по электронной почте. Три новых режима сохранения PDF — «Высокое качество», «Небольшой размер», «Сбалансированный режим» — позволяют пользователю получать оптимальные результаты для разного типа задач.


Претерпели изменения в FineReader 11 также средства редактирования и проверки документов. Из наиболее значимых новшеств можно отметить механизм разделения пакета страниц на несколько документов. Данная функция может быть полезна при сканировании в едином потоке разнородных­ материалов (газетные вырезки, журнальные статьи, сканы книжных страниц и так далее), для каждого из которых необходимо использовать различные настройки OCR-движка. Сортировка осуществляется простым перетягиванием мышью миниатюр страниц в окне «Разделить документ на несколько» и последующим нажатием клавиши «Создать» (см. скриншот). В результате для каждого набора страниц запустятся отдельные копии FineReader с независимыми друг от друга параметрами распознавания текстов.

Брызги нововведений затронули также инструментарий для проверки неуверенно распознанных и отсутствующих в словарной базе слов, редактор стилей с функцией объединения стилей со схожими атрибутами и диалоговое окно «Задачи», обеспечивающее мгновенный доступ ко всем базовым и пользовательским сценариям работы. Кроме того, в FineReader 11 появилась возможность изменять нумерацию страниц­ в книгах с обратной нумерацией и восстанавливать оную при двустороннем сканировании документов.


Таковы основные изменения одиннадцатой линейки FineReader, обзор которой был бы неполным без упоминания особенностей корпоративной сборки продукта, включающей все возможности Professional-редакции и имеющей ряд дополнительных инструментов для удобства совместной работы в сети (например на одном компьютере можно сканировать документы, на другом — распознавать, а на третьем — проверять результаты). Кроме того, версия Corporate Edition предусматривает возможность автоматизированной установки программы на вычислительные машины в локальной сети и централизованное управление лицензиями.

Акцентируя внимание на новшествах FineReader 11 Corporate Edition, прежде всего следует отметить расширенное стартовое окно «Задачи» и возможность создания пользователем собственных сценариев работы программы. Если в профессиональной редакции OCR-пакета список «однокликовых» операций строго регламентирован, то в корпоративной версии его можно всячески варьировать, гибко настраивая и автоматизируя работу FineReader. Важной особенностью приложения является возможность использования сценариев, созданных другими пользователями, и наличие в составе продукта планировщика Hot Folder, также подвергшегося дальнейшим улучшениям и доработкам.

Настраиваемые сценарии FineReader 11 Corporate Edition


Менеджер задач с функциями экспорта/импорта сценариев

Следуя новым техническим и организационным веяниям в области информационной безопасности, разработчики ABBYY оснастили текстовый редактор программы средствами цензурирования документов. Основная функция новинки заключается в защите конфиденциальных данных от посторонних глаз: с помощью специального маркер, пользователь может замазать черными полосами секретный текст и сделать его недоступным для просмотра и копирования. Функция поддерживается при сохранении­ документа в PDF-файл, а также в других форматах.

Что касается предъявляемых одиннадцатой версией FineReader системных требований, то они практически не изменились. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта. Программа работает со всеми популярными моделями сканеров и многофункциональных устройств (МФУ), в том числе с цифровыми фотокамерами и камерами мобильных телефонов с разрешением свыше двух мегапикселей и функцией автофокуса.

ABBYY FineReader: уже пятнадцатый

Первая версия программы FineReader увидела свет в далеком 1993 году, и умела она только распознавать и сохранять в редактируемых форматах сканированные тексты на русском и еще нескольких языках. А пятнадцатая версия, которая вышла на рынок в конце августа нынешнего года, позиционируется уже как универсальный инструмент для работы с бумажными и PDF-документами на цифровом рабочем месте, использующий технологии оптического распознавания символов и конвертации документов, основанные на возможностях искусственного интеллекта, и позволяет распознавать тексты на 192 языках.

HP Spectre Folio13-ak0007ur: кожа, металл и стекло

Вам будет интересно: HP Spectre Folio13-ak0007ur: кожа, металл и стекло

ABBYY предлагает три варианта программы: Standard, Business и Corporate. Первый предназначается для домашних пользователей, второй – для небольших и средних компаний, а третий, включающий полный набор функций, – для крупных и средних компаний. В состав Corporate включена программа, которая по расписанию производит автоматическое распознавание документов, помещаемых в «горячую папку» – ABBYY Hot Folder. В этой версии есть также инструмент для сравнения документов, представленных в разных форматах, с формированием перечня выявленных различий и возможностью сохранения результатов сравнения в формате Word, где все изменения уже подсвечиваются в режиме Track Changes, в PDF с комментариями в местах изменений или в виде таблицы с перечнем правок в Word. Для каждой версии можно купить либо бессрочную, либо годовую лицензию.

Neoline X-COP 8700s: нужный замкадыш

Вам будет интересно: Neoline X-COP 8700s: нужный замкадыш

img

Исходная страница книги в формате PDF

ABBYY FineReader 15 позволяет открывать, просматривать и редактировать PDF-документы, добавлять к ним комментарии, графические пометки и закладки, работать с вложенными файлами, осуществлять поиск по тексту. Если исходный PDF-документ не содержит текстового слоя, программа производит фоновое распознавание текста и таким образом обеспечивает возможность поиска по ключевым словам. Отсканированный документ с помощью OCR-редактора можно проанализировать, выделить блоки изображений и текстовые блоки и сохранить в формате PDF, который с помощью имеющегося набора инструментов превращается фактически в редактируемый: можно исправлять опечатки, добавлять и удалять тексты, перемещать и переформатировать текстовые блоки, редактировать таблицы, добавлять и удалять страницы, заполнять формы, совместно работать с документами, подписывать их электронной подписью и защищать с помощью пароля, а также объединять несколько документов в один PDF-файл, преобразовывать в другие редактируемые форматы и т. д. (Полный перечень возможностей программы и подробное «Руководство пользователя» представлены на сайте производителя.)

img

Она же после автоматического преобразования в формат Word

При тестировании программы она легко справилась с такими задачами, как сканирование и распознавание бумажных документов, создание и редактирование PDF-документов и преобразование их в документы Word. Например, преобразование книги формата А5 на 488 страницах из PDF в Word заняло около пяти минут, при этом в тексте объемом без малого 890 000 знаков программа сделала всего 16 мелких ошибок (лишние пробелы, длинное тире вместо короткого, неверно распознанные буквы) – это ничтожно мало. В исходном PDF-файле не было текстового слоя, но FineReader примерно за 45-50 секунд просматривал 488 книжных страниц и находил заданные слова и словосочетания. После сохранения книги в PDF с текстовым слоем поиск занимал около 30 секунд.

img

Автоматически «исправленное» при преобразовании изображение страницы

С преобразованием страниц с иллюстрациями дело обстояло похуже: в автоматическом режиме с настройками по умолчанию искусственный интеллект допускал ошибки. При преобразовании брошюры из PDF в Word программа 10 из 14 фотографий альбомного формата (в брошюре они располагались с поворотом на 90º) разрубила пополам, поместив каждую половинку на отдельную страницу (интересно, что неразделенными остались фотографии, подписи под которыми были длинными – это подсказка разработчикам). Еще одну картинку искусственный интеллект повернул примерно на 30º вместе с подписью.

img

Инструментарий «Редактора изображений»

img

Окно настроек приложения ABBYY Screenshot Reader

Часть картинок для этой статьи была сделана с помощью этого удобного инструмента. Распознавание текста в выделенной области экрана оказалось очень удобным, в частности, для копирования текстов из презентаций, в том числе и на иностранных языках. Если это приходится делать часто, значок ABBYY Screenshot Reader можно закрепить на панели задач Windows.

Ключевые слова: тесты и обзоры

Достоинства: Высокое качество распознавания текстов Широкий набор инструментов для работы с PDF

Читайте также: