Можно ли считать синонимами прикладную и компьютерную лингвистику

Обновлено: 06.07.2024

Недавно я задала вопрос: "Что лингвисты знают о дислексии?" и получила ответы, подчеркивающие, что дислексия не имеет никакого отношения к лингвистике.

Еще больше меня огорчило, что многие убеждены в обособленности лингвистики как науки.

Поэтому прежде чем говорить о роли лингвистов в исследовании дислексии, я хочу рассказать о предубеждении, которое существует в умах многих людей.

Первая научная лингвистика, которая возникла, была структурной лингвистикой. Она очень сильно повлияла на структурализм в гуманитарных науках в других областях, в изучении литературы, этнографии, практически везде. Есть Фердинанд де Соссюр, основатель современной лингвистики, есть европейские, американские школы структурализма, которые вслед за ним возникли. Структурализм в языкознании господствовал примерно до конца 50-х годов, когда стал медленно сходить со сцены, уступая место другим направлениям. В каком-то смысле и до сих пор существует идеология структурализма. Она не центральная, это уже критикуемая область, но она есть.
Структурализм сделал лингвистику наукой во многих отношениях:

точная,
с определенным предметом,
с какими-то исходными зафиксированными положениями,
с понятными задачами.

В общем, многое из того, что требуется науке, и чем лингвистика не располагала или располагала в очень малой степени, появилось благодаря структурализму. Это колоссальный прогресс, почти равный созданию науки «на пустом месте». Но это произошло ценой многих жертв и потерь.

Какую главную цену заплатил структурализм за то, что он создал науку о языке?

Структурализм понимал язык довольно упрощенно и, грубо говоря, структурализм велел лингвистам заниматься очень ограниченным кругом задач:

«Вот это вот ваше, а всем остальным интересоваться не надо».

Структурализм провел очень жесткие границы: это лингвистика, а это не лингвистика, это наука, а это не наука, этим заниматься надо, а этим заниматься не надо.
Первым это сделал Соссюр.
- Он поделил науку о языке на язык и речь,

на синхронию и диахронию,

на систему и норму.

И велел лингвистам заниматься языком, системой, нормой, синхронией, и больше ничем.

Однако лингвистика это намного больше. Говоря о современной лингвистике, неправильно обходить огромную область - прикладную лингвистику.

Термин «прикладная лингвистика» многозначен. В российской и западной лингвистике он имеет совершенно разные интерпретации.

В западной лингвистике он связывается, прежде всего, с преподаванием иностранных языков, включая

методику преподавания,
особенности описания грамматики для учебных целей,
преподавание языка как родного и иностранного.

В СССР термин прикладная лингвистика стал широко употребляться в 50-е гг. Поскольку именно в это время

велась разработка компьютерных технологий,
появлялись системы автоматической обработки информации (система информационного поиска, автоматизированных систем обработки текста).

Именно поэтому в русскоязычной литературе вместо термина прикладная лингвистика в том же значении часто используются термины:

компьютерная лингвистика,
вычислительная лингвистика,
автоматическая лингвистика,
инженерная лингвистика.

Однако это не одно и то же! Не стоит отождествлять эти дисциплины, потому что каждая из них имеет свой предмет и методы работы в рамках прикладной лингвистики как более широкого направления.

Прикладная лингвистика — наука о том, как использовать знания о естественном человеческом языке для решения практических задач.

Прикладная лингвистика (ПЛ) (в широком смысле) – деятельность по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности.

ПЛ занимается автоматической обработкой речевой информации (за рубежом активно используется термин NLP - Natural Language Processing), а именно в ее задачи входит следующее:

-информационный поиск,

классификация текстов (отнесение каждого документа к определенному классу с заранее известными параметрами),
кластеризация текстов (разбиение множества документов на кластеры, т. е. подмножества тематически близких документов),
рубрицирование текста — отнесение текста к одной из заранее известных тематических рубрик (обычно рубрики образуют иерархическое дерево тематик),
извлечение информации из текстов,
реферирование текста,
аннотирование текста,
автоматизация подготовки и редактирования текстов на естественном языке,
обучение ЕЯ

Компьютерная лингвистика – это широкая область использования компьютерных программ для моделирования и функционирования языка в тех или иных условиях и ситуациях, проблемных областях, а также в сферах применения компьютерной модели языка не только лингвистики, но и в смежных с ней дисциплинах.

В ПЛ изучаются и разрабатываются способы оптимизации функционирования языка.

Хотя прикладная лингвистика довольно молодая наука, проблемы, которые перед ней стоят нельзя считать совершенно новыми для языкознания. Перед языкознанием практически с самого начала его существования встала задача оптимизации функций языка.

Прикладная лингвистика тесно связана с другими науками:

Социология, Политология - > Социолингвистика, Политическая лингвистика;

Филология - > Лингвистика текста;

Психология - > Психолингвистика;

Логика - > Когнитивная лингвистика, Информационный поиск, Моделирование семантики и знаний;

Математика - > Математическая лингвистика, Лингвостатистика;

Физика - > Распознавание и синтез речи;

История, археология - > Этнолингвистика, Дешифровка, этнография Сравнительно-историческое языкознание;

Юридическая наука - > Юридическая лингвистика (лингвистические экспертизы текстов и высказываний) и др.

Именно функции языка задают точки отсчета для классификации огромной области приложения лингвистических знаний.

Оптимизацией коммуникативной функции занимаются такие дисциплины, как

- теория перевода,

машинный перевод,
теория и практика преподавания родного и неродного языка,
теория и практика информационно-поисковых систем,
создание информационных и, шире, искусственных языков,
теория кодирования.

Социальная функция языка – как часть коммуникативной — находит отражение

-в социолингвистике,

- в языковой политике,

Эпистемическая функция так или иначе проявляется

в лексикографии (в том числе компьютерной),
в терминологии и терминографии,
в корпусной лингвистике,
в полевой лингвистике.

Оптимизация когнитивной функции сосредоточена

в компьютерной лингвистике,
в «лингвистической криминологии»,
в психолингвистике и афазиологии,
в квантитативной лингвистике.

Теперь поговорим о дислексии. В своих рассуждениях буду ссылаться на статью С.В. Дорофеевой "ЛИНГВИСТИЧЕСКИЕ АСПЕКТЫ КОРРЕКЦИИ

Безусловно, дислексия исследуется психологами, логопедами, педагогами и нейроспециалистами, но это явление важно рассматривать и с лингвистической точки зрения.

В специальной литературе для обозначения специфических нарушений в процессах освоения чтения и письма используются, в основном, следующие термины:

«алексия» – для обозначения полного отсутствия чтения;

«дислексия» – для обозначения частичного расстройства чтения;

«дисграфия» – для обозначения частичного расстройства письма.
Современные исследования подтверждают, что у людей с дислексией отмечаются нарушения/особенности не в одном, а в нескольких участках мозга, в том числе в различных элементах так называемой «языковой сети» (совокупности зон мозга, обеспечивающих человеку возможность пользоваться языком/речью).
В отечественной практике длительный период основная часть методических рекомендаций по работе с детьми, страдающими дислексией и дисграфией, опиралась на педагогический опыт, изучение характера ошибок и наблюдения поведенческих особенностей, прогноз возможности или невозможности развития тех или иных навыков с помощью тех или иных упражнений.

Со второй половины ХХ века в России активно развивается, во многом благодаря школе Лурия А.Р., нейропсихологический подход к оценке нарушений обучения, создаются методики нейропсихологической диагностики детей.
Современные российские исследования в области нейролингвистики чаще связаны с такими нарушениями речи, как афазия. Но они также предоставляют ценную информацию о связи мозга и языка, в том числе помогают понять, как могут быть связаны те или иные трудности в процессе формирования навыков чтения или письма с особенностями мозга ребёнка, пытающегося язык освоить.

Участие лингвистов в создании методик коррекции нарушений чтения и письма не только обосновано, но и желательно.

Какова роль лингвистов?

Так, например, лингвисты могут помочь в определении нарушений с помощью анализа ошибок, которые допускают дислексики. В зависимости от совершенных ошибок, выделяют следующие виды дислексии:

Лингвисты проводят анализ ошибок с точки зрения теории языка:

от единиц низшего уровня (фонем и графем) до единиц макроуровня (текстов, дискурса).

При анализе с точки зрения уровневой модели языка (фонетический, морфологический, синтаксический, семантический уровни выделяют следующие группы ошибок:

– ошибки, свидетельствующие о трудностях с фонетико-фонематической обработкой (смешение сходных по звучанию звуков, пропуск или неразличение звуков в слабых, а иногда и в сильных позициях

– ошибки, свидетельствующие об отсутствии четкого понимания морфологического уровня (затруднения с разделением слов на морфемы, выделением корня, переносом слов);

– ошибки, свидетельствующие о недостаточности парадигматических представлений (многочисленные ошибки в окончаниях)

– ошибки, свидетельствующие о недостаточности синтагматических представлений (правила согласования)

Знания уровней языка и характера ошибок позволили составить эффективную методику. О процессе и результате можно прочитать в источнике.

Это лишь один пример, показывающий, что лингвистика - это не только теоретическая наука.

Под термином "компьютерная лингвистика" (computational linguistics) обычно понимается широкая область использования компьютерных инструментов - программ, компьютерных технологий организации и обработки данных - для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных областях, а также сфера применения компьютерных моделей языка не только в лингвистике, но и в смежных с ней дисциплинах. Собственно, только в последнем случае речь идет о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения теории программирования (computer science) в области лингвистики. Тем не менее общая практика такова, что сфера компьютерной лингвистики охватывает практически все, что связано с использованием компьютеров в языкознании: "Термин "компьютерная лингвистика" задает общую ориентацию на использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач".

Институциональный аспект компьютерной лингвистики. Как особое научное направление компьютерная лингвистика оформилась в 60-е гг. Поток публикаций в этой области очень велик. Кроме тематических сборников, в США ежеквартально выходит журнал "Компьютерная лингвистика". Большую организационную и научную работу проводит Ассоциация по компьютерной лингвистике, которая имеет региональные структуры по всему миру (в частности, европейское отделение). Каждые два года проходят международные конференции по компьютерной лингвистике - КОЛИНГ. Соответствующая проблематика широко представлена также на международных конференциях по искусственному интеллекту разных уровней.

Компьютерная лингвистика как особая прикладная дисциплина выделяется прежде всего по инструменту - то есть по использованию компьютерных средств обработки языковых данных. Поскольку компьютерные программы, моделирующие те или иные аспекты функционирования языка, могут использовать самые разные средства программирования, то об общем метаязыке говорить вроде бы не приходится. Однако это не так. Существуют общие принципы компьютерного моделирования мышления, которые так или иначе реализуются в любой компьютерной модели. В основе этого языка лежит теория знаний, разработанная в искусственном интеллекте и образующая важный раздел когнитивной науки.

Основной тезис теории знаний гласит, что мышление - это процесс обработки и порождения знаний. "Знания" или "знание" считается неопределяемой категорией. В качестве "процессора", обрабатывающего знания, выступает когнитивная система человека. В эпистемологии и когнитивной науке различают два основных вида знаний - декларативные ("знание что") и процедурные ("знание как"2)). Декларативные знания представляются обычно в виде совокупности пропозиций, утверждений о чем-либо. Типичным примером декларативных знаний можно считать толкования слов в обычных толковых словарях. Например, чашка] - 'небольшой сосуд для питья округлой формы, обычно с ручкой, из фарфора, фаянса и т.п. ' [MAC]. Декларативные знания поддаются процедуре верификации в терминах "истина-ложь". Процедурные знания представляются как последовательность (список) операций, действий, которые следует выполнить. Это некоторая общая инструкция о действиях в некоторой ситуации. Характерный пример процедурных знаний - инструкции по пользованию бытовыми приборами.

В отличие от декларативных знаний, процедурные знания невозможно верифицировать как истинные или ложные. Их можно оценивать только по успешности-неуспешности алгоритма.

Большинство понятий когнитивного инструментария компьютерной лингвистики омонимично: они одновременно обозначают некоторые реальные сущности когнитивной системы человека и способы представления этих сущностей на некоторых метаязыках. Иными словами, элементы метаязыка имеют онтологический и инструментальный аспект. Онтологически разделение декларативных и процедурных знаний соответствует различным типам знаний когнитивной системы человека. Так, знания о конкретных предметах, объектах действительности преимущественно декларативны, а функциональные способности человека к хождению, бегу, вождению машины реализуются в когнитивной системе как процедурные знания. Инструментально знание (как онтологически процедурное, так и декларативное) можно представить как совокупность дескрипций, описаний и как алгоритм, инструкцию. Иными словами, онтологически декларативное знание об объекте действительности "стол" можно представить процедурно как совокупность инструкций, алгоритмов по его созданию, сборке (= креативный аспект процедурного знания) или как алгоритм его типичного использования (= функциональный аспект процедурного знания). В первом случае это может быть руководство для начинающего столяра, а во втором - описание возможностей офисного стола. Верно и обратное: онтологически процедурное знание можно представить декларативно.

Требует отдельного обсуждения, всякое ли онтологически декларативное знание представимо как процедурное, а всякое онтологически процедурное - как декларативное. Исследователи сходятся в том, что всякое декларативное знание в принципе можно представить процедурно, хотя это может оказаться для когнитивной системы очень неэкономным. Обратное вряд ли справедливо. Дело в том, что декларативное знание существенно более эксплицитно, оно легче осознается человеком, чем процедурное. В противоположность декларативному знанию, процедурное знание преимущественно имплицитно. Так, языковая способность, будучи процедурным знанием, скрыта от человека, не осознается им. Попытка эксплицировать механизмы функционирования языка приводит к дисфункции. Специалистам в области лексической семантики известно, например, что длительная семантическая интроспекция, необходимая для изучения плана содержания слова, приводит к тому, что исследователь частично теряет способность к различению правильных и неправильных употреблений анализируемого слова. Можно привести и другие примеры. Известно, что с точки зрения механики тело человека является сложнейшей системой двух взаимодействующих маятников.

В теории знаний для изучения и представления знания используются различные структуры знаний - фреймы, сценарии, планы. Согласно М. Минскому, "фрейм - это структура данных, предназначенная для представления стереотипной ситуации" [Минский 1978, с.254]. Более развернуто можно сказать, что фрейм является концептуальной структурой для декларативного представления знаний о типизированной тематически единой ситуации, содержащей слоты, связанные между собой определенными семантическими отношениями. В целях наглядности фрейм часто представляют в виде таблицы, строки которой образуют слоты. Каждый слот имеет свое имя и содержание (см. табл.1).

Фрагмент фрейма "стол" в табличном представлении

четыре, возможно больше, минимум три

дерево, пластмасса, стекло

прямоугольник, овал, круг, квадрат

обеденный, журнальный, рабочий и пр.

В зависимости от конкретной задачи структуризация фрейма может быть существенно более сложной; фрейм может включать вложенные подфреймы и отсылки к другим фреймам.

Вместо таблицы часто используется предикатная форма представления. В этом случае фрейм имеет форму предиката или функции с аргументами. Существуют и другие способы представления фрейма. Например, он может представляться в виде кортежа следующего вида: < (имя фрейма) (имя слота)) (значение слота,). (имя слота_п) (значение слота_л) >.

Обычно такой вид имеют фреймы в языках представлениях знаний.

Как и другие когнитивные категории компьютерной лингвистики, понятие фрейма омонимично. Онтологически - это часть когнитивной системы человека, и в этом смысле фрейм можно сопоставить с такими понятиями как гештальт, прототип, стереотип, схема. В когнитивной психологии эти категории рассматриваются именно с онтологической точки зрения. Так, Д. Норман различает два основных способа бытования и организации знаний в когнитивной системе человека - семантические сети и схемы. "Схемы, - пишет он, - представляют собой организованные пакеты знания, собранные для репрезентации отдельных самостоятельных единиц знания. Моя схема для Сэма может содержать информацию, описывающую его физические особенности, его активность и индивидуальные черты. Эта схема соотносится с другими схемами, которые описывают иные его стороны" [Норман 1998, с.359]. Если же брать инструментальную сторону категории фрейма, то это структура для декларативного представления знаний. В имеющихся системах ИИ фреймы могут образовывать сложные структуры знаний; системы фреймов допускают иерархию - один фрейм может быть частью другого фрейма.

По содержанию понятие фрейма очень близко категории толкования. Действительно, слот - аналог валентности, заполнение слота - аналог актанта. Основное отличие между ними заключается в том, что толкование содержит только лингвистически релевантную информацию о плане содержания слова, а фрейм, во-первых, не обязательно привязан к слову, и, во-вторых, включает всю релевантную для данной проблемной ситуации информацию, в том числе и экстралингвистическую (знания о мире) 3).

Сценарий представляет собой концептуальную структуру для процедурного представления знаний о стереотипной ситуации или стереотипном поведении. Элементами сценария являются шаги алгоритма или инструкции. Обычно говорят о "сценарии посещения ресторана", "сценарии покупки" и т.п.

Изначально фрейм также использовался для процедурного представления (ср. термин "процедурный фрейм"), однако сейчас в этом смысле чаще употребляется термин "сценарий". Сценарий можно представить не только в виде алгоритма, но и в виде сети, вершинам которой соответствуют некоторые ситуации, а дугам - связи между ситуациями. Наряду с понятием сценария, некоторые исследователи привлекают для компьютерного моделирования интеллекта категорию скрипта. По Р. Шенку, скрипт - это некоторая общепринятая, общеизвестная последовательность причинных связей [Schank 1981]. Например, понимание диалога

На улице льет как из ведра.

Все равно придется выходить в магазин: в доме есть нечего - вчера гости все подмели.

основывается на неэксплицированных семантических связях типа 'если идет дождь, на улицу выходить нежелательно, поскольку можно заболеть'. Эти связи формируют скрипт, который и используется носителями языка для понимания речевого и неречевого поведения друг друга.

В результате применения сценария к конкретной проблемной ситуации формируется план). План используется для процедурного представления знаний о возможных действиях, ведущих к достижению определенной цели. План соотносит цель с последовательностью действий.

В общем случае план включает последовательность процедур, переводящих начальное состояние системы в конечное и ведущих к достижению определенной подцели и цели. В системах ИИ план возникает в результате планирования или планирующей деятельности соответствующего модуля - модуля планирования. В основе процесса планирования может лежать адаптация данных одного или нескольких сценариев, активизированных тестирующими процедурами, для разрешения проблемной ситуации. Выполнение плана производится экзекутивным модулем, управляющим когнитивными процедурами и физическими действиями системы. В элементарном случае план в интеллектуальной системе представляет собой простую последовательность операций; в более сложных версиях план связывается с конкретным субъектом, его ресурсами, возможностями, целями, с подробной информацией о проблемной ситуации и т.д. Возникновение плана происходит в процессе коммуникации между моделью мира, часть которой образуют сценарии, планирующим модулем и экзекутивным модулем.

В отличие от сценария, план связан с конкретной ситуацией, конкретным исполнителем и преследует достижение определенной цели. Выбор плана регулируется ресурсами исполнителя. Выполнимость плана - обязательное условие его порождения в когнитивной системе, а к сценарию характеристика выполнимости неприложима.

Еще одно важное понятие - модель мира. Под моделью мира обычно понимается совокупность определенным образом организованных знаний о мире, свойственных когнитивной системе или ее компьютерной модели. В несколько более общем виде о модели мира говорят как о части когнитивной системы, хранящей знания об устройстве мира, его закономерностях и пр. В другом понимании модель мира связывается с результатами понимания текста или - более широко - дискурса. В процессе понимания дискурса строится его ментальная модель, которая является результатом взаимодействия плана содержания текста и знаний о мире, свойственных данному субъекту [Джонсон-Лэрд 1988, с.237 и далее]. Первое и второе понимание часто объединяются. Это типично для исследователей-лингвистов, работающих в рамках когнитивной лингвистики и когнитивной науки.

Тесно связано с категорией фрейма понятие сцены. Категория сцены преимущественно используется в литературе как обозначение концептуальной структуры для декларативного представления актуализованных в речевом акте и выделенных языковыми средствами (лексемами, синтаксическими конструкциями, грамматическими категориями и пр) ситуаций и их частей5). Будучи связана с языковыми формами, сцена часто актуализуется определенным словом или выражением. В грамматиках сюжетов (см. ниже) сцена предстает как часть эпизода или повествования. Характерные примеры сцен - совокупность кубиков, с которыми работает система ИИ, место действия в рассказе и участники действия и т.д. В искусственном интеллекте сцены используются в системах распознавания образов, а также в программах, ориентированных на исследование (анализ, описание) проблемных ситуаций. Понятие сцены получило широкое распространение в теоретической лингвистике, а также логике, в частности в ситуационной семантике, в которой значение лексической единицы непосредственно связывается со сценой.

Что такое лингвистика? Назовите ее разделы. В каком разделе лингвистика имеет дело с информационными технологиями?

Можно ли считать синонимами прикладную и компьютерную лингвистику? Аргументируйте свой ответ.

Перечислите основные направления компьютерной лингвистики. Расскажите об одном из направлений.

Сравните разные определения языка. Выделите в них ключевые слова. Составьте на основе повторяющихся ключевых слов свое определение языка.

Подумайте, с естественным или искусственным языком имеет дело компьютерная лингвистика?

Какие виды естественных и искусственных языков вам известны? Приведите примеры естественных и искусственных языков разных видов.

Список литературы

1. Баранов А.Н. Введение в прикладную лингвистику: учеб. пособие. 3-е изд. М.: ЛКИ, 2007. С. 6–8, 20.

2. Беляева Л.Н. Лингвистические автоматы в современных гуманитарных технологиях: учеб. пособие. СПб.: Книжный Дом, 2007. С. 36–40.

3. Большой энциклопедический словарь. Языкознание. М.: Большая Российская энциклопедия, 1998. С. 201–202; 604–606, 618–622.

4. Всеволодова А.В. Компьютерная обработка лингвистических данных: учеб. пособие. 2-е изд., испр. М.: Флинта; М.: Наука, 2007. С. 63–64

5. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике: учеб. пособие. М.: Академия, 2004. С. 5–7.

6. Щипицина Л.Ю. Информационные технологии в лингвистике. М.: Флинта, 2013. С. 6-10.

2. ИТЛ в лингвистике: основные понятия (информация, информационные технологии)

Вопросы для теоретической подготовки

Сопоставьте разные определения информации. Какое из определений, на ваш взгляд, лучше всего подходит к лингвистике?

Сравните свойства информации, выделяемые в разных источниках.

Назовите основные этапы развития информационных технологий.

В чем ученые видят будущее информационных технологий? Что вы думаете по этому поводу?

Что такое задача и правило? Как эти понятия связаны с алгоритмом?

Каковы свойства алгоритмов?

Что такое модель? Приведите примеры лингвистических моделей.

Список литературы

1. Всеволодова А.В. Компьютерная обработка лингвистических данных: учеб. пособие. 2-е изд., испр. М.: Флинта; М.: Наука, 2007. С. 9–16.

2. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике: учеб. пособие. М.: Академия, 2004. С. 7–19.

3. Степанов А.Н. Информатика: учеб. пособие. СПб.: Питер, 2006. С. 35–42.

4. Щипицина Л.Ю. Информационные технологии в лингвистике. М.: Флинта, 2013. С. 12-19.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Читайте также: