Устройство которое можно использовать для ввода текста в память компьютера с бумажных носителей

Обновлено: 05.07.2024

Сканер (Scanner) - устройство ввода в ЭВМ информации в виде текстов, рисунков, слайдов, фотографий на плоских носителях, а также изображения объемных объектов небольших размеров.

Сканирование представляет собой цифровое кодирование изображения, заключающееся в преобразовании аналогового сигнала яркости в цифровую форму. Такое получение цифрового изображения оригинала для ввода в компьютер называют оцифровкой (Digitizing) - В процессе оцифровки изображение разбивается на элементарные частицы - пиксели, каждому из которых соответствует определенный код яркости и цветового оттенка.

Типы сканеров

Планшетные сканеры

Планшетные сканеры используются для ввода графики и текста с носителей формата А4 или A3. В планшетных сканерах оригинал располагается на его рабочей поверхности неподвижно. Освещение оригинала производится стабилизированным по интенсивности источником, в качестве которого используют лампы с холодным катодом или флуоресцентные лампы. В качестве фотоприемника обычно используются ПЗС-линейки. Лампа, ПЗС (прибор с зарядовой связью, ССD) и оптическая система, направляющая на ПЗС световой поток, отраженный от оригинала, находятся на одной каретке и с помощью шагового механизма перемещаются вдоль оригинала.

К преимуществам планшетных сканеров следует отнести простоту использования, возможность сканирования, как плоских оригиналов, так и небольших трехмерных объектов.

Недостатками этого типа сканеров являются большая занимаемая площадь, сложность выравнивания оригинала с неровно размещенным на носителе изображением.

Роликовые сканеры

Роликовые сканеры осуществляют сканирование оригинала при его перемещении по специальным направляющим посредством роликового механизма подачи бумаги относительно неподвижных осветителя и ПЗС-линейки.

Большинство роликовых сканеров офисного применения предназначены для работы с оригиналами формата А4. Однако существуют широкоформатные роликовые сканеры, обеспечивающие сканирование оригиналов форматов А1 и А0.

Преимущества роликовых сканеров определяются их компактностью, удобством подключения и пользования, автоматической подачей листов оригинала, удовлетворительной скоростью сканирования и низкой стоимостью.

Недостатки, связанны, с невозможностью без специальных приспособлений осуществлять сканирование сброшюрованных документов, книг, а также с опасностью повреждения оригинала.

Барабанные сканеры

Барабанные сканеры позволяют получать изображения прозрачных или отражающих оригиналов с высокой степенью детализации. Оригинал в таких сканерах крепится на поверхность быстро вращающегося прозрачного барабана. Внутри него расположена оптическая система, фокусирующая проходящий через оригинал тонкий луч на призму, за которой находятся три датчика ФЭУ (фотоэлектронный умножитель), по одному на каждый базовый цвет. Барабанные сканеры не позволяют сканировать книги, переплетенные брошюры и т. п.

Программы распознавания текстов

После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.

Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера). Авторы программ задавали критерий «похожести», используемый при идентификации символов.

Подобные системы назывались OCR (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход. Естественно приходилось сталкиваться с произвольным и, тем более, сложным шрифтом, программы такого рода начинали давать серьезные сбои.

Алгоритмы распознавания могут давать разные результаты на разных документах. Например, упоминавшиеся выше системы OCR способны распознавать только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна, из более универсальных программ.

Современные алгоритмы распознавания текста не ориентируются ни на конкретный шрифт, ни на конкретный алфавит. Большинство программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы можно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов. Разумеется, программа должна знать, о каком алфавите идет речь.

Программа FineReader

Программа FineReader выпускается отечественной компанией ABBYY Software. Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов.

Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.

Процесс ввода документов с помощью программы ABBYY FineReader состоит из четырех этапов:

Для того чтобы начать работу, необходимо передать в программу изображение документа. Получить изображение можно следующими способами:

Переданные в программу ABBYY FineReader изображения необходимо распознать, то есть преобразовать в текст. Прежде чем приступить к распознаванию, программа анализирует структуру всего документа и выделяет на изображениях области с текстом, картинками, таблицами, штрих-кодами. Области разных типов имеют различные цвета рамок.

- выделить зону распознавания;

- выделить область Текст;

- выделить область Картинка;

- выделить область Таблица.

Последовательность обхода областей определяется их порядковыми номерами. По умолчанию порядковые номера областей не отображаются в окне Изображение, а отображаются только в том случае, если пользователь выбрал функцию перенумерации областей. Можно выделить новую область, выбрав нужный инструмент на панели окна Изображение (рисунок 6).

Рисунок 6

Результат распознавания отображается в окне Текст. В данном окне неуверенно распознанные символы выделяются цветом.

На главной панели инструментов в выпадающем списке необходимо выбрать режим сохранения оформления документа.

Режимы сохранения оформления документа:

Список возможных режимов зависит от выбранного формата.

Компьютеру, как и человеку, необходимы свои «глаза и уши», с помощью которых он мог бы воспринимать информацию извне. В настоящее время имеются разнообразные устройства, выполняющие эти функции в составе компьютера. Они называются устройствами ввода , так как обеспечивают ввод в компьютер данных в различных формах: чисел, текстов, изображений, звуков.

Устройства ввода преобразуют эту информацию из формы, понятной человеку, в цифровую форму, воспринимаемую компьютером.

Современные компьютеры могут обрабатывать числовую, текстовую, графическую, звуковую и видеоинформацию .

Клавиатура — компьютерное устройство, которое располагается перед экраном дисплея и служит для набора текстов и управления компьютером с помощью клавиш, находящихся на клавиатуре.

Клавиатура позволяет вводить в компьютер числовую и текстовую информацию , а также различные команды и данные.

Микрофон используется для ввода звуковой информации, подключается к входу звуковой карты.

Сканер — устройство для перевода графической информации в цифровую.

scanner-146465_640.jpg

Сканер используется для оптического ввода в компьютер и преобразования в компьютерную форму изображений (фотографий, рисунков, чертежей).

Сканеры используются и для бесклавиатурного ввода текста. Всякую информацию сканер воспринимает как графическую. Если это был текст, который в другом случае пришлось бы набирать вновь, то после работы сканера специальная программа распознавания текста, позволяющая выделить в считанном изображении отдельные символы и сопоставить с ними соответствующие коды символов, преобразовывает его в пригодный для обработки текст.

Веб-камера — малоразмерная цифровая видео- или фотокамера, способная в реальном времени фиксировать видеоизображения, предназначенные для дальнейшей передачи по компьютерной сети.

robot-2094539_640.jpg

Цифровые камеры позволяют получать видеоизображение и фотоснимки в цифровом (компьютерном) формате. Позволяют вводить в компьютер графическую информацию.

Ска́нер (англ. scanner) — устройство, которое, анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс получения этой копии называется сканированием; устройство ввода в ЭВМ информации непосредственно с бумажного носителя. Можно вводить тексты, рисунки, фото, графики и т.п. Сканер по сути дела, подключенный к ПЭВМ, копировальное устройство типа XEROX. Если XEROX копирует изображение с бумаги на бумагу, то сканер - с бумаги в память ЭВМ.

Сканер.jpg

Аналогично копировальному устройству, сканер освещает оригинал, а светочувствительный датчик сканера с определенной частотой производит замеры отраженного оригиналом света. В процессе сканирования устройство выполняет преобразование величины интенсивности отраженного света в двоичный код, который передается в ЭВМ для дальнейшей обработки. Изображение в ЭВМ представляет совокупность точек. Количество точек определяет качество. Разрешающая способность сканеров составляет от 65 до 1600 точек на дюйм.

Сканеры весьма разнообразны и их классифицируют по ряду признаков.

Сканеры могут быть

Существуют два принципиально разных способа устройства сканеров

  • CCD (Charge Couple Device), отличается наличием оптики, зеркал и катодной лампы подсветки, тогда как новомодный
    1. У технологии CCD есть один существенный плюс: можно сканировать довольно объемные предметы (например, очень толстую книгу, которую невозможно плотно прижать к окну сканера по всей площади).
  • CIS (Contact Image Sensor) обходится без сложной оптической части, датчики с подсветкой собраны в единую линейку и воспринимают изображение непосредственно от оригинала.
    1. Сканеры CIS легко отличить по внешнему виду: они гораздо тоньше, чем CCD, потребляют меньше электричества, что позволяет их запитать от шнура USB.

Типы сканеров

  • Планшетный сканер.
    1. Сканируемый объект кладется на стекло сканируемой поверхностью вниз.

Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на светочувствительную матрицу и передается в компьютер. Светочувствительная матрица состоит из фотодиодных элементов, чувствительных к свету. Перед каждым фотодиодом стоит светофильтр, пропускающий лучи только определенного цвета (красный, зеленый или синий ). Стоящие три рядом элемента формируют изображение в системе RGB

  • Вертикальный планшетный сканер.
  • Картографический планшетный сканер.
  • Паспортный сканер.
    1. Применяется для сканирования паспортов, водительских удостоверений, банковских чеков, карточек идентификации, лотерейных билетов и фотографий. Уникальность модели в том, что паспорт можно сканировать за один проход сканера.
  • Планетарные сканеры.
    1. Используются для бесконтактного сканирования. Применяются для сканирования книг, папок или сброшюрованных документов.
    2. Планетарные сканеры широко используются для оцифровки оригиналов, требующих деликатного обращения (ветхих, исторических документов). Часто используется название «книжный сканер».
    3. Разрешение таких сканеров обычно составляет 8000-11000 точек на дюйм и более.
  • Слайд сканеры.
    1. Слайд-сканеры используют для оцифровки изображений с пленочных оригиналов. В последнее время значительная часть "планшетников" оснащается встроенным модулями для сканирования слайдов, но по качеству изображений они существенно уступают специализированным «собратьям».
  • Листопротяжные сканеры
    1. В листопротяжном сканере, как в факсимильном аппарате, страницы документа при считывании пропускаются через специальную щель с помощью направляющих роликов (последние зачастую становятся причиной перекоса изображения при вводе).
  • Сканеры штрих-кода, ручные сканеры

Некоторые производители сканеров

Графический планшет или дигитайзер, используется для ввода в компьютер чертежей или рисунков. Условия создания изображения приближены к реальным, достаточно специальным пером или пальцем сделать рисунок на специальной поверхности. Результаты работы дигитайзера воспроизводятся на экране монитора и в случае необходимости могут быть распечатаны на бумаге. Дигитайзерами обычно пользуются архитекторы, дизайнеры.

Dth2700 elev left view 3lowres.jpg

При работе с дигитайзером в компьютер передаётся информация о положении указателя, перемещаемого рукой по линии вводимого изображения. Дигитайзеры состоят из 2-хчастей -активной области и указателя. Указатель может быть выполнен в виде пера или наводчика(устройство по форме напоминающее мышку, но вместо шарика иголочка).

При нажатии кнопки пера его положение на поверхности планшета фиксируется и коор­динаты переда­ются в компьютер.

Нажмите, чтобы узнать подробности

nНесмотря на все расширяющееся использование компьютеров практически во всех сферах человеческой деятельности, бумага остается одним из основных носителей, используемых для подготовки и хранения документов.

Просмотр содержимого документа
«Ввод информации с бумажных носителей»

Ввод информации с бумажных носителей

Ввод информации с бумажных носителей

Типовые этапы технологического процесса ввода данных в компьютер с бумажных форм

Типовые этапы технологического процесса ввода данных в компьютер с бумажных форм

Типовые этапы ввода данных Сортировка бумажных документов и разделение их на пачки. Выбор и подготовка пачки бумажных документов для ввода.

Типовые этапы ввода данных

  • Сортировка бумажных документов и разделение их на пачки.
  • Выбор и подготовка пачки бумажных документов для ввода.

Типовые этапы ввода данных Выбор из пачки очередного документа для ввода. Определение типа выбранного документа и подготовка программы к вводу данных этого типа.

Типовые этапы ввода данных

  • Выбор из пачки очередного документа для ввода.
  • Определение типа выбранного документа и подготовка программы к вводу данных этого типа.

Типовые этапы ввода данных Поиск очередного поля считывания данных. Считывание и запоминание текста, содержащегося в текущем поле считывания данных.

Типовые этапы ввода данных

  • Поиск очередного поля считывания данных.
  • Считывание и запоминание текста, содержащегося в текущем поле считывания данных.

Типовые этапы ввода данных Распознавание считанных данных и их ввод в текущее поле ввода данных. Сравнение введенного текста с исходным. Если есть несоответствия, то его редактирование.

Типовые этапы ввода данных

  • Распознавание считанных данных и их ввод в текущее поле ввода данных.
  • Сравнение введенного текста с исходным. Если есть несоответствия, то его редактирование.

Типовые этапы ввода данных Автоматическая проверка корректности введенных в поле ввода данных. Проверка окончания ввода данных с текущего документа.

Типовые этапы ввода данных

  • Автоматическая проверка корректности введенных в поле ввода данных.
  • Проверка окончания ввода данных с текущего документа.

Типовые этапы ввода данных Автоматическая проверка взаимной корректности данных между полями текущего документа. Если данные некорректны, то их редактирование. Автоматический экспорт введенных по текущему документу данных в файл или базу данных.

Типовые этапы ввода данных

  • Автоматическая проверка взаимной корректности данных между полями текущего документа. Если данные некорректны, то их редактирование.
  • Автоматический экспорт введенных по текущему документу данных в файл или базу данных.

Типовые этапы ввода данных Проверка окончания пачки документов. Проверка наличия рассортированных пачек документов.

Типовые этапы ввода данных

  • Проверка окончания пачки документов.
  • Проверка наличия рассортированных пачек документов.

Типовые этапы ввода данных Проверка наличия нерассортированных по пачкам документов. Передача пачек введенных документов в архив и окончание ввода данных.

Типовые этапы ввода данных

  • Проверка наличия нерассортированных по пачкам документов.
  • Передача пачек введенных документов в архив и окончание ввода данных.

Технология автоматизированного ввода Предполагает ввод оператором данных, записанных на бумажных формах, посредством клавиатуры компьютера и с помощью специально подготовленной программы ввода.

Технология автоматизированного ввода

  • Предполагает ввод оператором данных, записанных на бумажных формах, посредством клавиатуры компьютера и с помощью специально подготовленной программы ввода.

Недостатки Низкая скорость автоматизированного ввода данных; Значительные затраты времени на вспомогательные действия по обеспечения ввода с бумажных документов; Достаточно много ошибок в данных.

  • Низкая скорость автоматизированного ввода данных;
  • Значительные затраты времени на вспомогательные действия по обеспечения ввода с бумажных документов;
  • Достаточно много ошибок в данных.

Технология сканирования и автоматического распознавания ( OCR, ICR ) Предполагает предварительное сканирование бумажных форм с последующим автоматическим распознаванием графического образа текста всего документа либо отдельных его полей, выделенных в соответствии с заранее подготовленным шаблоном и запись распознанных данных в поля ввода в памяти компьютера.

Технология сканирования и автоматического распознавания ( OCR, ICR )

  • Предполагает предварительное сканирование бумажных форм с последующим автоматическим распознаванием графического образа текста всего документа либо отдельных его полей, выделенных в соответствии с заранее подготовленным шаблоном и запись распознанных данных в поля ввода в памяти компьютера.

OCR Обеспечивает распознавание большинства типов печатных документов, заполненных сплошным текстом. Однако, главной проблемой остается ввод данных с бумажных форм, содержащих поля, заполненные рукописными текстами.

  • Обеспечивает распознавание большинства типов печатных документов, заполненных сплошным текстом.
  • Однако, главной проблемой остается ввод данных с бумажных форм, содержащих поля, заполненные рукописными текстами.

ICR Обеспечивает работу с машиночитаемыми формами, печатаются в одной типографии на качественной бумаге и аккуратно заполняются. Для подготовки графических образов документов в основном используются сканеры с автоматической подачей бумаги с лотка.

  • Обеспечивает работу с машиночитаемыми формами, печатаются в одной типографии на качественной бумаге и аккуратно заполняются.
  • Для подготовки графических образов документов в основном используются сканеры с автоматической подачей бумаги с лотка.

Подготовительные работы разработка машиночитаемых форм, регулярная печать их в достаточном количестве в одной типографии и рассылка для заполнения юридическим или физическим лицам, которые должны готовить и сдавать отчеты по этим формам;

Подготовительные работы

  • разработка машиночитаемых форм, регулярная печать их в достаточном количестве в одной типографии и рассылка для заполнения юридическим или физическим лицам, которые должны готовить и сдавать отчеты по этим формам;

Подготовительные работы закупка оптического сканера, компьютеров, сетевого оборудования и программного обеспечения для создания комплекса сканирования и автоматического распознавания;

Подготовительные работы

  • закупка оптического сканера, компьютеров, сетевого оборудования и программного обеспечения для создания комплекса сканирования и автоматического распознавания;

Подготовительные работы разработка шаблонов машиночитаемых форм и настройка комплекса ICR на их распознавание;

Подготовительные работы

  • разработка шаблонов машиночитаемых форм и настройка комплекса ICR на их распознавание;

Подготовительные работы разработка программного обеспечения для интеграции результатов распознавания в конкретную информационную технологию;

Подготовительные работы

  • разработка программного обеспечения для интеграции результатов распознавания в конкретную информационную технологию;

Подготовительные работы обеспечение обучения операторов и вспомогательного персонала для поддержки комплекса в работоспособном состоянии;

Подготовительные работы

  • обеспечение обучения операторов и вспомогательного персонала для поддержки комплекса в работоспособном состоянии;

Подготовительные работы обеспечение регулярного финансирования работ по эксплуатации комплекса.

Подготовительные работы

  • обеспечение регулярного финансирования работ по эксплуатации комплекса.

Технология сканирования и автоматизированного распознавания ( Imagewriter )

Технология сканирования и автоматизированного распознавания ( Imagewriter )

Читайте также: