Какие возможности не предоставляют компьютерные словари

Обновлено: 06.07.2024

Гипермаркет знаний>>Информатика>>Информатика 10 класс>>Информатика: Компьютерные словари и системы компьютерного перевода текстов

Компьютерные словари и системы компьютерного перевода текстов

Компьютерные словари.

Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части. В одной части записывалось слово на шумерском языке, а в другой — аналогичное по значению слово на другом языке, иногда с краткими пояснениями. Современные словари построены по такому же принципу.

В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова — процесс достаточно трудоемкий. Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности:

• существуют многоязычные компьютерные словари, позволяющие пользователю выбрать языки и направление перевода (например, англо-русский, испано-русский и т. д.);

• компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей но областям знаний (техника, медицина, информатика и др.);

• компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.;

• компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка;

• онлайновые компьютерные словари в Интернете обеспечивают выбор тематического словаря и направления перевода.

Системы компьютерного перевода.

Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках. В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов.

Перевод многостраничной документации вручную требует длительного времени. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить «здесь и сейчас», и нет возможности и времени пригласить переводчика. Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в одну секунду), с другой стороны, переводить Web-стpaницы «на лету», в режиме реального времени. Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка: синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке. Онлайновые компьютерные переводчики в Интернете обеспечивают выбор тематического словаря и направления перевода. Они позволяют переводить любые тексты, набранные в окне перевода или скопированные из буфера обмена, WеЬ-страницы, включая гиперссылки, с сохранением исходного форматирования, а также электронные письма.

Современные системы компьютерного перевода позволяют с приемлемым качеством переводить техническую документацию, деловую переписку и другие специализированные тексты. Но на эти системы нельзя полностью полагаться. Они допускают смысловые и стилистические ошибки и неприменимы, например, для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека и т. д.


Информатика и ИКТ: Учебник для 10 кл. Н.Д. Угринович

Если у вас есть исправления или предложения к данному уроку, напишите нам.

Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - Образовательный форум.

3. В чем преимущество программ распознавания текста перед ручным вводом, помимо скорости выполнения:
а) программы автоматически исправляют орфографические и пунктуационные ошибки в тексте
б) программы всегда успешно распознают даже самый неразборчивый рукописный тек
в) при ручном вводе появляется возможность ошибок и опечаток при вводе данных, а также необходимо учитывать физическое состояние человека при работе +

4. Почему программе-переводчику сложно переводить художественные тексты:
а) программе-переводчику не передать в полной мере средства художественной выразительности +
б) программа-переводчик обладает меньшим словарным запасом, чем человек
в) сложность перевода художественных текстов программой-переводчика зависит от конкретного языка

5. Какие возможности не предоставляют компьютерные словари:
а) предоставления примеров употребления
б) прослушивания слов
в) качественного перевода текстов +

6. Из предложенных названий программных продуктов выберите программу-переводчик:
а) Abbyy FineReader
б) ABBYY Lingvo +
в) Adobe Photoshop

7. Что лежит в основе разработки компьютерных словарей и программ-переводчиков:
а) возможность компьютеров осуществлять мгновенный поиск и обрабатывать найденную информацию
б) возможность компьютеров осуществлять мгновенный поиск в интернете
в) возможность компьютеров хранить большие объемы данных и осуществлять в них мгновенный поиск +

8. В каком порядке работает программа распознавания текста:
а) создает графическое изображение, анализирует структуру документа, разбивает слова на отдельные буквы, сравнивает символы с шаблонными изображениями букв и цифр, хранящихся в ее памяти, выдаёт распознанный текст +
б) создает графическое изображение, разбивает слова на отдельные буквы, сравнивает символы с шаблонными изображениями букв и цифр, хранящихся в ее памяти, выдаёт распознанный текст
в) создает графическое изображение, разбивает строки на отдельные слова, а слова — на буквы, сравнивает символы с шаблонными изображениями букв и цифр, хранящихся в ее памяти, исправляет ошибки и опечатки, выдаёт распознанный текст

9. Системы распознавания текстов представляют собой:
а) программы, предназначенные для редактирования и форматирования текстов
б) программы, обязательные для работы сканера
в) программы, предназначенные для перевода изображений в редактируемый формат doc +

10. Что используется для ввода текста с бумажного носителя в память компьютера:
а) ручной набор текста
б) программы распознавания символов и сканеры +
в) сканеры

11. Чем отличаются программы-переводчики от компьютерных словарей:
а) программы-переводчики могут переводить большие текстовые документы +
б) программы-переводчики могут переводить словосочетания
в) программы-переводчики содержат больший объём иностранных слов

12. Системы перевода текстов предназначены для автоматизированного перевода:
а) текста в формат разметки гипертекста html
б) текста с одного естественного языка на другой +
в) текста с формата pdf в формат doc

13. Какой текст не стоит переводить с помощью программ-переводчиков:
а) художественный текст +
б) юридический текст
в) технический текст

14. Какая программа распознавания текста является наиболее известной:
а) Adobe Acrobat Reader
б) Foxit Reader
в) ABBYY FineReader +

15. На чём основаны программы-переводчики:
а) на знании правил словообразования и построения предложений (на формальном знании языка) +
б) на знании лексики иностранного языка
в) на знании правил орфографии, пунктуации, лексики, грамматики, словообразования, истории и особенностей иностранного языка

16. Установите соответствие между названием программы и её назначением:
Microsoft Word:
а) Создание текстовых документов
б) Создание текстовых документов +
в) Перевод текста с одного языка на другой

17. Установите соответствие между названием программы и её назначением:
ABBYY Fine Reader:
а) Перевод текста с одного языка на другой
б) Формирование навыков печати
в) Распознавание текста +

18. Установите соответствие между названием программы и её назначением:
PROMT:
а) Распознавание текста
б) Перевод текста с одного языка на другой +
в) Создание текстовых документов

20. Установите соответствие между названием программы и её назначением:
Руки солиста:
а) Распознавание текста
б) Формирование навыков печати +
в) Создание текстовых документов

21. Компьютерные словари обеспечивают мгновенный поиск словарных:
а) статей +
б) знаков
в) символов

22. Для перевода текстовых документов применяются:
а) программы-переводители
б) программы-переводчики +
в) переводческие программы

23. Для ввода текстов в память компьютера с бумажных носителей используют:
а) клавиатуру
б) принтеры
в) сканеры +

24. После обработки документа сканером получается такое изображение документа:
а) визуальное
б) графическое +
в) рисованное

25. Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках (на 179 языках), а также для распознавания смешанных двуязычных текстов:
а) Adobe Acrobat Reader
б) Foxit Reader
в) ABBY FineReader +

26. Одна из возможностей программы ABBY FineReader:
а) работает с одними моделями сканеров
б) работает с разными моделями сканеров +
в) работает без остановки

27. Одна из возможностей программы ABBY FineReader:
а) позволяет из бумажных документов, PDF-файлов и цифровых фото сделать редактируемый текст +
б) не позволяет из бумажных документов, PDF-файлов и цифровых фото сделать редактируемый текст
в) оба варианта не верны

28. Одна из возможностей программы ABBY FineReader:
а) не позволяет редактировать распознанный текст и проверять его орфографию
б) оба варианта не верны
в) позволяет редактировать распознанный текст и проверять его орфографию +

29. Процесс распознавания текста после сегментации начинается с щелчка на кнопке:
а) Распознать +
б) Начать
в) Указать

30. С точки зрения компьютера, документ после сканирования превращается в набор таких точек:
а) серых
б) разноцветных +
в) черно-белых

Словари необходимы для перевода текстов с одного языка на другой. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов.

В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, где поиск нужного слова является достаточно трудоемким процессом.


Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности.

1) Могут являться многоязычными, так как дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и так далее).

2) Могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

3) Обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

4) Могут являться мультимедийными, то есть предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Электронные словари можно устанавливать как самостоятельные программы, пользоваться on-line сервисами в сети Интернет.

Для перевода текстовых документов применяются программы-переводчики .

Компьютерные переводчики могут оказать огромную помощь в обработке информации на иностранных языках по различным отраслям знаний.

В настоящее время наиболее распространенными программами машинного перевода являются системы PROMT, Stylius, Сократ, Magic Gooddy и другие, которые обеспечивают перевод текстов со многих иностранных языков на русский и с русского языка на иностранные. Эти системы являются не простыми пословными программами перевода, а профессиональными электронными переводчиками, синтезирующими выходной текст на достаточно ясном, грамматически правильном языке с учетом морфологических, синтаксических и семантических связей.

Основные требования к компьютерным переводчикам являются оперативность, гибкость, скорость и точность.

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

§ 4.5. Инструменты распознавания текстов и компьютерного перевода

Информатика. 7 класса. Босова Л.Л. Оглавление

4.5.1. Программы оптического распознавания документов

Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией.

Очень часто возникает необходимость ввести в компьютер несколько страниц текста из книги, статью из журнала или газеты и т. д. Конечно, можно затратить определённое время и просто набрать этот текст с помощью клавиатуры. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.

Судите сами. Предположим, кто-то из ваших одноклассников, освоивших клавиатурный тренажёр, может вводить текстовую информацию со скоростью 150 символов в минуту. Выясним, сколько времени ему понадобится для того, чтобы ввести в память компьютера текст романа А. Дюма «Три мушкетёра». Одно из изданий этого романа выполнено на 590 страницах; каждая страница содержит 48 строк, в каждую строку входит в среднем 53 символа.

Вычислим общее количество символов в романе:

590 • 48 • 53 = 1 500 960 символов.

Вычислим время, необходимое для ввода этого массива символов в память компьютера: 1 500 960 : 150 ≈ 10 000 мин. А это приблизительно 167 часов.

При этом мы не обсуждаем вопрос о времени на исправление возможных ошибок при таком способе ввода текста, не принимаем в расчёт усталость человека.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является ABBYY FineReader. Упрощённо работу с подобными программами можно представить так:

1. Бумажный носитель помещается под крышку сканера.
2. В программе отдаётся команда Сканировать и распознать. Сначала создаётся цифровая копия исходного документа в формате графического изображения. Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
3. Распознанный текст переносится в окно текстового редактора (например, Microsoft Word).

Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Например, при работе с книгами в библиотеке вы можете сфотографировать интересующие вас страницы. Скопировав снимки на компьютер, вы можете запустить ABBYY FineReader, распознать тексты и продолжить работу с ними в текстовом процессоре (рис. 4.20).


4.5.2. Компьютерные словари и программы-переводчики

Возможности современных компьютеров по хранению больших массивов данных и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.

В обычном словаре, содержащем несколько сотен страниц, поиск нужного слова является длительным и трудоёмким процессом. Компьютерные словари обеспечивают мгновенный поиск словарных статей. Многие словари предоставляют пользователям возможность прослушивания слов в исполнении носителей языка.

Компьютерные словари (русско-английские и англо-русские, русско-французские, русско-немецкие и др.) могут быть установлены на компьютер как самостоятельные программы, бывают встроены в текстовые процессоры, существуют в on-line-режиме в сети Интернет.

Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики. Они основаны на формальном знании языка — правил словообразования и правил построения предложений. Программа-переводчик сначала анализирует текст на исходном языке, а затем конструирует этот текст на том языке, на который его требуется перевести.

С помощью программ-переводчиков можно успешно переводить техническую документацию, деловую переписку и другие текстовые материалы, написанные «сухим» языком. Перевод художественных текстов, эмоционально окрашенных, богатых гиперболами, метафорами и др., в полной мере может выполнить только человек.

САМОЕ ГЛАВНОЕ

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.

Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков. Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Вопросы и задания

1. Ознакомьтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Дополняет ли презентация информацию, содержащуюся в тексте параграфа?

2. В каких случаях программы распознавания текста экономят время и силы человека?

3. Сколько времени потребуется для ввода в память компьютера текста романа А. Дюма «Три мушкетёра» с помощью сканера и программы ABBYY FineReader, если известно, что на сканирование одной страницы уходит 3 секунды, на смену страницы в сканере — 5 секунд, на распознавание страницы — 2 секунды?

4. Найдите в Интернете информацию о технологии сканирующего листания. В чём её суть?

5. Какие, по вашему мнению, основные преимущества компьютерных словарей перед обычными словарями в форме печатных книг?

6. Почему программы-переводчики успешно переводят деловые документы, но не годятся для перевода текстов художественных произведений?

7. С помощью имеющейся в вашем распоряжении программы- переводчика переведите на знакомый вам иностранный язык фразу: «Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией». Полученный результат с помощью той же программы переведите на русский язык. Сравните текст исходной фразы и конечный результат. Дайте свои комментарии.

§ 4.5. Инструменты распознавания текстов и компьютерного перевода

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова является достаточно долгим и трудоемким процессом.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности. Во-первых, компьютерные словари могут являться многоязычными - давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: "быстрый набор", когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы компьютерного перевода. Процесс глобализации мира приводит к необходимости частого обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода "вручную" тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществлять срочно, и нет времени пригласить переводчика.

Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду), с другой стороны, переводить Web-страницы "на лету", в режиме реального времени.

Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном "знании": синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы компьютерного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они не применимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

  • 1. Какими преимуществами обладают компьютерные словари по сравнению с традиционными бумажными словарями?
    2. В каких случаях целесообразно использовать системы компьютерного перевода?

Системы оптического распознавания документов

Системы оптического распознавания символов. Системы оптического распознавания символов используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат.

Сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате. Далее для получения документа в текстовом формате необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов.

Системы оптического распознавания символов сначала определяют структуру размещения текста на странице и разбивают его на отдельные области: колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы разделяются на изображения отдельных символов.

Для отсканированных документов типографского качества (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений) распознавание символов проводится путем их сравнения с растровыми шаблонами.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого it наибольшей степени совпадает с изображением (рис. 3.16).

Рис. 3.16. Распознаваемый символ "Б" накладывается на растровые шаблоны символов (А, Б, В и т. д.)

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется векторный метод распознавания символов. В распознаваемом изображении символа выделяются геометрические примитивы (отрезки, окружности и др.) и сравниваются с векторными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех геометрических примитивов и их расположение больше всего соответствует распознаваемому символу (рис. 3.17).

Рис. 3.17. Распознаваемый символ "Б" накладывается на векторные шаблоны символов (А, Б, В и т. д.)

Системы оптического распознавания символов являются "самообучающимися" (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Системы оптического распознавания форм. При заполнении документов большим количеством людей (например, при сдаче выпускником школы единого государственного экзамена (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Сложность состоит в том, что необходимо распознавать символы, написанные от руки, которые довольно сильно различаются у разных людей. Кроме того, такие системы должны уметь определять, к какому полю относится распознаваемый текст.

  • 1. В чем состоят различия в технологии распознавания текста при использовании растрового и векторного методов?

Практические работы компьютерного практикума, рекомендуемые для выполнения в процессе изучения главы

№ 8. Кодирование текстовой информации.

№ 9. Создание визитных карточек на основе шаблона.

№ 10. Установка параметров страницы документа, вставка колонтитулов и номеров страниц.

№ 11. Вставка в документ формул.

№ 12. Форматирование символов и абзацев.

№ 13. Создание и форматирование списков.

№ 14. Вставка оглавления в документ, содержащий заголовки.

№ 15. Вставка в документ таблицы, ее форматирование и заполнение данными.

Читайте также: