Что такое тезаурус в word

Обновлено: 04.07.2024

Microsoft Word один из самых популярных текстовых редакторов. Он входит в базовый пакет программ Microsoft Office и предназначен для работы с текстом (ввод, редактура, форматирование). Опустим историю создания и технические моменты и поговорим о том, что может предложить эта программа и чем она особенно полезна писателю.

Начнём с самых очевидных достоинств Word

1. Формат файла

После работы в редакторе наш текст сохранится в одном из самых популярных форматов — doc/docx. Этот формат откроется почти на любом компьютере или мобильном устройстве. Кроме того, именно в этом формате чаще всего отправляются рукописи в издательства.

2. Шрифты/размер шрифта/поля/интервалы

У программы очень простой и понятный интерфейс, который предлагает все возможные внешние изменения текста.

Можно выбрать любой удобный вам шрифт — с засечками или без («засечки» — это выступающие чёрточки на концах букв, они влияют на удобство чтения текста). Вместе с этим можно подобрать и размер букв ( кегль ).

Самый стандартный вид текста (в какой требуют издательства) — это текст шрифтом Times New Roman с кеглем 12-14 .

Ещё Word позволяет настроить поля документа — расстояние от любого края листа до текста. Это делается так: вкладка «Разметка страницы» → «Поля» → открывается окно, где можно выбрать любой из предложенных вариантов или же нажать «Настраиваемые поля» и ввести свои значения.

Также в Word можно изменить интервалы в тексте. Под «интервалами» я имею в виду расстояние между строчками и расстояние между абзацами. И то и другое возможно настроить.

Кроме того, можно в настройках включить автоматическое расставление красных строк .

Красная строка — это небольшой отступ в начале абзаца. При включении этой функции красные строки будут ставиться сами. Другой вариант расстановки красных строк — это самому ставить несколько пробелов подряд (что нежелательно) или перед началом абзаца каждый раз нажимать на клавиатуре кнопку «Tab» (она отвечает за красные строки).

3. Исправление ошибок

Одна из самых полезных для писателя функций Word — подчёркивание орфографических и пунктуационных ошибок. Умный алгоритм программы сверяет напечатанные слова со словарём и при отсутствии слова в словаре подчёркивает его красной волнистой линией. Также он предлагает варианты исправления слова: нужно нажать на подчеркнутое слово правой кнопкой мыши, и вылезет окно с вариантами.

Также Word находит и пунктуационные ошибки. Они подчёркиваются зелёной волнистой линией (и содержат комментарий от Word — что не так).

Кроме того, программа находит и возможные опечатки. Например, когда в словосочетании одно из слов имеет неправильное окончание (выходит, что словосочетание несогласовано) или когда вы по ошибке написали два раза подряд одно и то же слово. Всё это подчеркнётся зелёной волнистой линией.

4. Вставка графических элементов

В пакете Microsoft Office много различных программ, в том числе и страшный Excel. Все программы пакета могут работать в связке. Так, в Word можно вставить диаграмму или таблицу из файла Excel.

Но кроме этого, внутри самого Word можно создать свою таблицу, диаграмму, фигуру. Вкладка «Вставка».

Также возможна вставка картинки на любую страницу документа и её минимальное редактирование: наложение фильтров, смена положения на странице, увеличение или уменьшение картинки, обрезка и добавление рамки.

А теперь поговорим о менее очевидных полезных функциях Word

1. Поиск по написанному

Случаются моменты, когда нужно что-то найти в тексте и перепроверить. Гипотетическая ситуация: мы почти дописали объёмный роман, где очень много событий и персонажей, и тут в новой главе появляется второстепенный персонаж, который когда-то упоминался, но где конкретно — уже и не вспомнить. И нам нужно найти этот момент, чтобы освежить память и, допустим, посмотреть — говорили ли мы, что у персонажа есть шикарные усы и нет одного глаза.

В этом нам может помочь функция поиска по написанному. В правом верхнем углу есть значок бинокля и надпись «Найти». При нажатии на неё откроется окошко со строкой, куда можно будет ввести любое слово или первую часть слова. После этого нам покажут все фрагменты текста, где было это слово. Так мы можем ввести имя персонажа и увидеть, на какой странице и в каком абзаце он появился.

SQL ServerВ полнотекстовые запросы могут выполнять поиск синонимов для заданных пользователем терминов с помощью тезауруса полнотекстового поиска. Каждый тезаурус определяет набор синонимов для указанного языка. Подготовив тезаурус, ориентированный на пользовательские полнотекстовые данные, можно эффективно расширить область полнотекстовых запросов к этим данным.

Сопоставление с тезаурусом выполняется для всех запросов FREETEXT и FREETEXTABLE и для любых запросов CONTAINS и CONTAINSTABLE, которые указывают предложение FORMSOF THESAURUS .

Тезаурус полнотекстового поиска представлен в виде текстового XML-файла.

Что содержит тезаурус?

Прежде чем запросы полнотекстового поиска смогут найти синонимы на данном языке, необходимо определить сопоставления тезауруса (т. е. синонимы) для этого языка. В каждом тезаурусе необходимо вручную определить следующее.

Расширяющий набор содержит группу синонимов, таких как «писатель», «автор» и «журналист», которые заменяют друг друга в полнотекстовом поиске. Запросы, содержащие слова, которые совпадают с одним из синонимов в расширяющем наборе, расширяются таким образом, чтобы включать в себя все другие синонимы в этом расширяющем наборе.

Дополнительные сведения см. в подразделе XML-структура расширяющего набора далее в этом разделе.

Заменяющий набор содержит текстовый шаблон, заменяемый подстановочным набором. Пример см. в подразделе XML-структура заменяющего набора далее в этом разделе.

Настройка диакритических знаков

Для заданного тезауруса все шаблоны поиска могут учитывать или не учитывать диакритические знаки, такие как тильда (

), акут ( ´ ) или умляут ( ¨ ). Такие шаблоны соответственно называются шаблонами с учетом диакритических знаков или без учета диакритических знаков. Например, предположим, что в запросе полнотекстового поиска необходимо заменить шаблон café другими шаблонами. Если тезаурус не учитывает диакритические знаки, то полнотекстовый поиск замещает шаблоны café и cafe. Если файл тезауруса учитывает диакритические знаки, то полнотекстовый поиск замещает только шаблон café. По умолчанию тезаурус не учитывает диакритические знаки.

Файлы тезауруса по умолчанию

SQL Server предоставляет набор XML-файлов тезауруса, по одному для каждого поддерживаемого языка. Эти файлы в основном пустые. Они содержат только XML-структуру верхнего уровня, общую для всех тезаурусов SQL Server , и заключенный в комментарии образец тезауруса.

Местоположение файлов тезауруса

Местоположение файлов тезауруса по умолчанию:

В местоположении по умолчанию содержатся следующие файлы.

Зависящие от языка файлы тезауруса.

При установке в указанном выше месте устанавливаются пустые файлы тезауруса. Для каждого поддерживаемого языка предоставляется отдельный файл. Системный администратор может настроить эти файлы.

Имена файлов по умолчанию для файлов тезауруса имеют следующий формат:

'ts' + <three-letter language-abbreviation> + '.xml'

Для данного языка имя файла тезауруса указывается в следующем параметре реестра:

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\<instance-name>\MSSearch\<language-abbrev>

Файл глобального тезауруса.

Пустой файл глобального тезауруса, tsGlobal.xml.

Изменение расположения файла тезауруса

Можно менять местонахождение и имена файлов тезауруса, изменяя соответствующий раздел реестра. Для каждого языка местонахождение файла тезауруса указывается в следующем параметре реестра:

HKLM\SOFTWARE\Microsoft\Microsoft SQL Server\<instance name>\MSSearch\Language\<language-abbreviation>\TsaurusFile

Файл глобального тезауруса соответствует языку «Нейтральный» с кодом языка (LCID) 0. Это значение может быть изменено только администратором.

Как полнотекстовые запросы используют тезаурус

В каждом запросе тезауруса используется как языковой тезаурус, так и глобальный.

  1. Вначале запрос ищет файл, относящийся к конкретному языку, и загружает его для обработки (если он не загружен). Запрос расширяется с целью включить в файл тезауруса синонимы конкретного языка, заданные правилами расширяющего и заменяющего наборов.
  2. Затем эти шаги повторяются для глобального тезауруса. Но если термин уже входит в состав соответствий в файле конкретного языка, он используется в глобальном тезаурусе.

Структура файла тезауруса

Каждый файл тезауруса определяет XML-контейнер, идентификатор которого — Microsoft Search Thesaurus , и комментарий, <!-- . --> , который содержит образец тезауруса. Тезаурус определен в элементе <thesaurus> , содержащем образцы дочерних элементов, которые определяют настройку диакритических знаков, расширяющие наборы и заменяющие наборы.

Типичный пустой файл тезауруса содержит следующий XML-текст:

XML-структура расширяющего набора

Каждый расширяющий набор заключен в элемент <expansion> . Внутри этого элемента можно указать одну или несколько подстановок в элементе <sub> . В расширяющем наборе можно указать группу подстановок, являющихся синонимами.

Например, можно изменить раздел расширения так, чтобы подстановки «писатель», «автор» и «журналист» считались синонимами. Полнотекстовые запросы, содержащие слова, совпадающие с одним из подстановочных слов, расширяются таким образом, чтобы включать в себя другие подстановочные слова в этом расширяющем наборе. Следовательно, в предыдущем примере при выполнении запроса FORMS OF THESAURUS или FREETEXT со словом «автор» после полнотекстового поиска будут также возвращены результаты, содержащие слова «писатель» и «журналист».

Для этого примера раздел расширяющего набора должен выглядеть следующим образом:

XML-структура заменяющего набора

Каждый заменяющий набор заключен в элемент <replacement> . Внутри этого элемента можно указать один или несколько шаблонов в элементе <pat> и ноль или более подстановок в элементах <sub> , по одному для синонима. Можно указать шаблон, заменяемый подстановочным набором. Шаблоны и подстановки могут содержать одно слово или последовательность слов. Если для шаблона не указано подстановки, то шаблон удаляется из запроса пользователя.

Например, допустим, что необходимо заменить слово-шаблон «Win8» словами «Windows Server 2012» или «Windows 8.0». При выполнении полнотекстового запроса со словом «Win8» полнотекстовый поиск возвращает только результаты, содержащие слова «Windows Server 2012» или «Windows 8.0». Результаты, содержащие слово «Win8», не возвращаются. Это происходит потому, что шаблон «Win8» был заменен шаблонами «Windows Server 2012» и «Windows 8.0».

Для этого примера раздел заменяющего набора должен выглядеть следующим образом:

Если имеются два заменяющих набора с одинаковыми сравниваемыми шаблонами, приоритет имеет самый длинный из них. Например, если определены следующие заменяющие наборы, при выполнении запроса FORMS OF THESAURUS по фразе «сообщество Internet Explorer в сети», набор «Internet Explorer» имеет приоритет перед набором «Internet». Следовательно, запрос будет обрабатываться так, как будто он сформирован по фразам «сообщество IE в сети» или «сообщество IE 9 в сети».

XML-структура настройки диакритических знаков

Настройка диакритических знаков определяется в отдельном элементе <diacritics_sensitive> . Этот элемент содержит целое значение, которое управляет поведением диакритических знаков, как показано ниже.

Настройка диакритических знаков Значение XML
без учета диакритических знаков 0 <diacritics_sensitive>0</diacritics_sensitive>
с учетом диакритических знаков 1 <diacritics_sensitive>1</diacritics_sensitive>

Эту настройку можно применить для файла только единожды, и она применяется для всех шаблонов поиска в файле. Этот параметр невозможно указать для отдельных шаблонов.

Изменение файла тезауруса

Тезаурус для данного языка можно настроить путем изменения соответствующего файла тезауруса (XML-файла). В процессе установки устанавливаются пустые файлы тезауруса, которые содержат только контейнер <xml> и заключенный в комментарии образец элемента <thesaurus >. Для правильной работы запросов полнотекстового поиска синонимов необходимо создать реальный элемент <thesaurus >, который определяет набор синонимов. Могут быть определены две формы синонимов — расширяющие наборы и заменяющие наборы.

Изменение файла тезауруса

Откройте этот файл в Блокноте или в другом текстовом редакторе.

При первом редактировании файла тезауруса удалите следующие строки комментариев, находящиеся, соответственно, в конце и в начале файла:

Добавьте, измените или удалите заменяющий или расширяющий набор.

Сохраните файл и закройте Блокнот.

Используйте хранимую процедуру sp_fulltext_load_thesaurus_file , чтобы загрузить содержимое файла тезауруса в базу данных tempdb, указав идентификатор языкового стандарта (LCID), соответствующий языку файла тезауруса. Например, файлу тезауруса английского языка, tsenu.xml, соответствует код языка 1033.

Рекомендации для изменения файлов тезауруса

Рекомендуется, чтобы элементы в файле тезауруса не содержали специальных символов. Это объясняется особенностями поведения средств разбиения по словам в отношении специальных символов. Если элемент тезауруса содержит какие-нибудь специальные символы, то средства разбиения по словам, использованные в сочетании с этим элементом, могут оказать малозаметное воздействие на поведение полнотекстового запроса.

Рекомендуется, чтобы элементы <sub> не содержали стоп-слов, так как стоп-слова удаляются из полнотекстового индекса. Запросы расширяются, чтобы охватить элементы <sub> из файла тезауруса, и если элемент <sub> содержит стоп-слова, то размер запроса излишне увеличивается.

Ограничения для изменения файлов тезауруса

На изменения файла тезауруса налагаются следующие ограничения.

Только системные администраторы имеют право обновлять, изменять и удалять файлы тезауруса.

При изменении файлов тезауруса с помощью текстовых редакторов эти файлы необходимо сохранять в Юникоде с указанием отметок порядка байтов.

Элементы тезауруса не могут быть пустыми или делиться на пустые строки.

Фразы в файле тезауруса не могут иметь длину более 512 символов.

Тезаурус не должен содержать повторяющихся элементов среди элементов <sub> расширяющих наборов и элементов <pat> заменяющих наборов.

Что такое тезаурус? В статье рассмотрим общий термин и поговорим о тезаурусе в Ворде. На практике воспользуемся тезаурусом в программе Word. Эта информация может вам пригодится при написании текстов или в процессе замены слов.

Что такое тезаурус, для чего он нужен

Что такое тезаурус

Здравствуйте, друзья! Что такое тезаурус? Это информационный вид словаря или по-другому словарь синонимов. Он хранит в себе различные слова, которые можно использовать для того или иного слова в тексте. То есть, подбирает для слов похожие синонимы или антонимы – противоположные слову.

Для чего нужен тезаурус? Как правило, он нужен для поиска похожих слов и замены старых словосочетаний. Рассмотрим простой пример необходимости использования тезауруса. К примеру, копирайтер написал текст, а он выглядит не уникальным. Чтобы повысить уникальность, можно подобрать слова синонимы для текста. В этом случае, как раз помогает тезаурус.

Вы просто используете набор слов готового словаря и заменяете в тексте слова на другие. Главное подобрать то слово, из-за которого не потеряется смысл текста.

Что такое тезаурус в программе Ворд

Тезаурус в программе Ворд – это словарь синонимов. Данный инструмент встроен в программу. В поздних версиях программы Ворд 2007, 2010, 2013 и так далее, эта функция работает без сбоев.

Так выглядит тезаурус в программе Word (скрин 1).

что такое тезаурус в word

При нажатии данного инструмента, вы увидите список слов, которые будут доступны в справочном материале.

Как пользоваться тезаурусом в Ворде

Рассмотрим инструкцию, с помощью которой вы научитесь пользоваться тезаурусом в Ворде:

  1. Запустите программу Word с текстом.
  2. Далее выделите слово левой кнопкой мыши, которое хотите заменить.
  3. Затем нажмите правой кнопкой мыши.
  4. Далее перейдите в меню «Синонимы» или в раздел «Тезаурус».
  5. Выбираете подходящее слово и нажимаете «Вставить» из поля, в котором находится слово.

Рассмотренную выше инструкцию мы разберем ниже на практике.

Как пользоваться тезаурусом из интерфейсного меню

Для начала у вас должен быть открыт документ Ворд. Далее выделите слово для замены, и нажмите в разделе «Рецензирование» «Тезаурус» (скрин 2).

как пользоваться тезаурусом

Справа в программе будет открыт справочник, откуда вы можете выбрать словосочетание (скрин 3).

тезаурус

Далее наводите курсор мыши на слово в тезаурусе и нажимаете на стрелку справа. Затем из меню выбираете «Вставить», после чего слово в тексте будет заменено. Если вы не нашли подходящего слова, то нажмите в этом окне кнопку «Все справочники». Данная функция поможет найти больше синонимов.

Как пользоваться тезаурусом из контекстного меню

Работать с тезаурусом из контекстного меню так же просто. Выделяете слово в тексте, например, «пользоваться» левой клавишей мыши (скрин 4).

Как пользоваться тезаурусом в Ворде

Далее нажимаете правой кнопкой и выбираете из меню «Синонимы». В этом небольшом списке находите подходящее по смыслу слово и нажимаете по нему, чтобы оно вставилось в текст. Если синонимов не хватает, нажмите в данном окне «Тезаурус», чтобы открыть больше информации по словам.

Заключение

В данной статье рассмотрели, что такое тезаурус и как им пользоваться. Применив готовый словарь к своему тексту, вы сможете его улучшить, разбавить новыми словами или повысить уникальность. Измененный текст можно публиковать на ресурсах в Интернете или отправлять работы заказчикам.

Тезаурус представляет собой словарь синонимов и родственных слов (рис. 3.14). В программе Microsoft Word эта функция доступна для нескольких языков. Нужное слово иногда бывает очень трудно подобрать, а тезаурус может значительно сэкономить время при редактировании текста документа.

Выбрать синоним для слова можно, щелкнув правой кнопкой мыши по слову и установив в открывшемся меню указатель мыши на команду Синонимы (Synonyms). В появившемся подменю будут представлены на выбор варианты замены слова синонимом. При выборе в подменю команды Тезаурус (Thesaurus) в окне программы открывается панель со справочными материалами, в которой присутствуют различные варианты слова.

Рис. 3.14. Пример работы тезауруса

Рис. 3.14. Пример работы тезауруса

Кроме того, тезаурус можно вызвать следующими способами:

  • первый способ доступен лишь в том случае, если у вас открыта панель Справочные материалы (Research). Просто введите в поле ввода нужное слово и выберите в раскрывающемся списке, расположенном в нижней части группы элементов управления Искать (Search for), значение Тезаурус: русский (Thesaurus:Russian) или любое другое, в зависимости от языка. После этого нажмите кнопку Начать поиск (Start searching) или клавишу Enter;
  • установить текстовый курсор на нужное слово или выделить фрагмент текста, а затем нажать сочетание клавиш Shift+F7;
  • установить текстовый курсор на нужное слово или выделить фрагмент текста, а затем нажать кнопку Тезаурус (Thesaurus), расположенную в группе элементов Правописание (Proofing) на вкладке Рецензирование (Review) ленты управления.

Поле вывода результатов панели Справочные материалы (Research) для поиска синонимов отличается от того же поля при работе со справочниками. При работе с тезаурусом оно содержит примеры, которыми можно заменить исходное слово. Выбрав подходящую замену, установите указатель мыши на слово. Справа от выбранного слова появится кнопка со стрелкой вниз. Нажмите ее и выберите подходящий вариант действия с синонимом. Команда Вставка (Insert) вставит слово в содержание документа, команда Копировать (Copy) скопирует синоним в буфер обмена, а команда Искать (Find) активирует функцию поиска синонимов и родственных слов для выбранного варианта.

Читайте также: