Как создать память переводов в smartcat

Обновлено: 07.07.2024

SmartCAT - уникальная система, объединяющая все технологии и средства профессионального перевода в единой облачной среде.

Привычные методы работы с памятью переводов, возможность эффективного использования машинного перевода, контроль корпоративной терминологии и другие необходимые ресурсы доступны прямо в браузере.

SmartCAT для фрилансеров

SmartCAT - это мощный CAT-инструмент, который содержит всё необходимое для быстрого, эффективного и качественного перевода.

Работать в SmartCAT легко и удобно (рис.3). Память переводов, управление терминологией, автоматическая проверка качества и многие другие возможности объединены в удобном, интуитивно понятном интерфейсе.

SmartCAT - это облачное решение, которое не требует установки. С ним можно работать на любом компьютере и оставаться уверенным, что все данные защищены и находятся под полным контролем.

SmartCAT упрощает работу с PDF-файлами и отсканированными документами. Достаточно просто загрузить файлы, система автоматически их распознает и преобразует в редактируемый формат.

Рис. 3 Интерфейс SmartCAT

1. Работа в облаке.

Перевод проектов возможен на любом компьютере без дополнительной установки и настройки программ. Все документы хранятся в защищенном облаке, а доступ к материалам находится под полным контролем.

2. Широкие возможности для работы с терминами.

Создание глоссариев самой разнообразной структуры для каждого конкретного проекта, их редактирование, добавление новых терминов, - все изменения будут моментально учтены и отображены.

3. Базы памяти переводов (Translation Memory, TM).

Ускорение работы над проектом благодаря интеллектуальному модулю SmartTM, который находит аналогичные ранее переведенные сегменты текста вне зависимости от форм слов в них.

4. Разные системы машинного перевода (Machine Translation, MT).

Широкий выбор "движков" машинного перевода, включая собственную систему ABBYY Machine Translation, повысит производительность работы на 30-50 %.

5. Автоматическая проверка качества.

Система проверит орфографию и пунктуацию, теги и "плейсхолдеры", а также осуществит поиск двойных пробелов и оповестит вас о наличии терминологических ошибок.

6. Работа по международным стандартам.

SmartCAT поддерживает международный формат ТМХ для обмена данными, поэтому можно с легкостью использовать накопленные ранее материалы, базы памяти переводов и глоссарии в работе над новыми проектами.

7. Распознавание файлов в не редактируемых форматах.

Простая загрузка отсканированных документов и PDF-файлов в SmartCAT позволяет быстро начать процесс перевода.

8. Удобный интерфейс.

Освоение SmartCAT пройдет быстро и легко, так как функции и возможности решения интуитивно понятны. Система позволяет работать в одном окне, что создает дополнительное удобство и экономит время.

Перевод текста — это довольно сложный и многогранный процесс, требующий от переводчика понимания переводимого материала, кропотливой работы с терминологией и, зачастую, тщательного поиска и исследований. На сегодняшний день переводческий процесс невозможно представить без cat-инструментов, призванных максимально облегчить процесс перевода и сделать его комфортнее. Благодаря современным переводческим платформам перевод с листа остался в прошлом, а такие функции как разбивка текста на сегменты, контекстный просмотр, возможность использования глоссариев и памяти переводов значительно ускоряют работу и повышают качество итогового текста.

На данный момент существует более 50 различных cat-инструментов, среди которых особой популярностью как среди фрилансеров, так и в бюро переводов пользуются такие платформы как SDL Trados Studio, Memsource, MemoQ и Smartcat.

ЧТО ТАКОЕ CAT-ИНСТРУМЕНТЫ?

CAT-инструменты или cat tools (от англ. 'computer-assisted translation' — автоматизированный перевод) представляют собой комплексное решение, главной задачей которого является автоматизация процесса перевода с помощью компьютерных технологий, и в результате — сокращение временных затрат и повышение качества перевода.

Это достигается с помощью таких функций как использование глоссариев и памяти переводов, подстановки повторяющихся сегментов, автоматической проверки качества перевода, фильтрации сегментов по необходимым признакам и многих других. Благодаря использованию cat-инструментов над одним проектом может работать, как один специалист, так и целая команда переводчиков.

Рассмотрим более подробно основные возможности cat-инструментов на примере Smartcat и Memsource.

ОБЩИЕ ФУНКЦИИ

При первом взгляде на рабочие окна Memsource и Smartcat бросается в глаза более широкий функционал первого cat-инструмента. В верхней панели расположено меню с открывающимися списками наподобие текстового редактора Microsoft Word. С одной стороны, может показаться, что изобилие функций положительно скажется на процессе выполнения перевода. Однако, с другой стороны, если интерфейс Smartcat интуитивно понятен и русифицирован, то такая многоуровневая система cat-инструмента Memsource на английском языке требует гораздо больше времени на её освоение и, возможно, даже прохождения обучения.

Стоит отметить, что Smartcat постоянно развивается и пополняет свою платформу новыми полезными функциями, не усложняя при этом интерфейс редактора.

Ниже рассмотрим основные сходные черты этих двух инструментов:

Память переводов

Память переводов (translation memory или TM) — это база данных, в которой содержатся ранее переведённые тексты. Она является ключевым компонентом любого cat-инструмента. Именно благодаря памяти переводов происходит ускорение переводческого процесса: ранее перевёденные сегменты отображаются в правой части рабочего окна, степень совпадения с переводимым сегментом указывается в процентах. Переводчику достаточно нажать на сегмент из памяти переводов и отредактировать его при необходимости.

Сравнение внешнего вида окон Smartcat и Memsource

Глоссарий

Глоссарий (term base или TB) представляет собой терминологическую базу данных в двуязычном или многоязычном формате, которая используется для хранения специфических терминов различной тематики, будь то технические инструкции, юридическая документация или тексты по медицине. Использование глоссариев в процессе перевода крайне необходимо для соблюдения единства терминологии, поскольку зачастую одно и то же слово может иметь несколько значений. Кроме того, глоссарии значительно сокращают временные затраты, исключая необходимость поиска того или иного термина в различных словарях. Термины из глоссария подсвечиваются жёлтым цветом в исходном тексте, а с переводом термина и возможными комментариями к нему можно ознакомиться в правой части рабочего окна, рядом с памятью переводов.

В отличие от Smartcat, термины в Memsource имеют разные цветовые обозначения: например, жёлтым цветом обозначаются рекомендуемые термины, а запрещённые термины отмечаются красным цветом.

Окно работы с базой терминов в Memsource

Предварительный просмотр в контексте

Функция предпросмотра в контексте (in-context preview) позволяет просматривать оригинальный текст в специальном окне, расположенном в нижней части редактора. При переходе от сегмента к сегменту курсор показывает на переводимое предложение в исходном документе. Данная функция появилась в Smartcat относительно недавно, и в сравнении с аналогичной функцией в Memsource, нуждается в доработке. Например, в отличие от Smartcat редактор Memsource позволяет просматривать как исходный, так и переведенный текст. При выполнении перевода можно наблюдать, как перевод «пишется» поверх оригинального текста.

Кроме того, Memsource позволяет не только отображать переводимую часть при переходе от сегмента к сегменту, но и наоборот, переходить к нужному сегменту при наведении курсора на определенную часть текста в окне предпросмотра, а также увеличивать или уменьшать просматриваемую страницу с помощью опции zoom.

Окно предпросмотра в редакторе Memsource

Статистика

Функция отображения прогресса перевода, а также подсчёт количества переведённых слов имеют важное значение для переводчика. В первую очередь это позволяет планировать время, необходимое для завершения проекта. Для этой цели Smartcat использует строку прогресса с указанием в процентах, а также в верхней панели рабочего окна отображается общее количество слов и количество переведённых слов. Для того чтобы узнать прогресс работы в процентах в Memsource, необходимо выйти из проекта на предыдущую страницу. При этом в самом рабочем окне статистика отображается в нижней панели. В отличие от Smartcat, кроме общего количества слов и количества отработанных слов здесь также указывается количество общих и переведённых сегментов и символов.

Шкала прогресса в Smartcat и Memsource

Фильтрация сегментов

Функция фильтрации позволяет сократить отображение переводимых сегментов до тех, что требуются для работы в данный момент. Обе платформы используют широкий функционал, позволяющий фильтровать сегменты по ряду признаков. Переводчик может выбрать отображение только подтверждённых или только неподтверждённых сегментов, отображение сегментов по дате/автору изменения, или по наличию комментариев, выбрать сегменты, содержащие критичные или некритичные ошибки, а также сегменты содержащие только цифры. Это далеко не полный список возможностей фильтров.

ПРЕИМУЩЕСТВА MEMSOURCE

Одним из главных преимуществ Memsource перед Smartcat и многими другими cat-инструментами является наличие отдельного редактора для рабочего стола (desktop editor), который позволяет продолжать работу даже в отсутствие интернета. При возобновлении соединения все переводы, выполненные в отдельном редакторе, автоматически загружаются в Memsource. Благодаря использованию такого редактора переводчик больше не привязан к определенному месту и может работать из любой точки. Стоит отметить, что функционал редактора для рабочего стола гораздо более ограничен в отличие от веб версии. Однако, в нём есть все основные функции, необходимые для работы.

Редактор для рабочего стола Memsource

Другой отличительной особенностью Memsource является наличие функции обеспечения качества (quality assurance или QA), которая на данный момент находится в состоянии разработки в Smartcat. Эта функция позволяет выявлять ошибки перевода путём сравнения исходного текста с переведённым, позволяя улучшать качество и согласованность перевода в целом.

Контроль качества в Memsource

Таким образом, рассмотрев два наиболее популярных cat-инструмента, мы видим, что принцип работы редакторов схож, а различия в наборе функций невелики. Поскольку каждая из рассматриваемых платформ продолжает развиваться и выпускать регулярные обновления, делающие работу переводчика ещё более комфортной и качественной, выбор cat-инструмента является скорее результатом личного предпочтения переводчика и делом вкуса.

Презентация на тему: " Системы памяти переводов. Trados, Memsource Cloud, SmartCat." — Транскрипт:

1 Системы памяти переводов. Trados, Memsource Cloud, SmartCat.

2 Что такое ТМ (Translation Memory)? Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») база данных, содержащая набор ранее переведённых сегментов текста.

3 Функционирование Одна запись в такой базе данных соответствует сегменту или «единице перевода», за которую обычно принимается одно предложение. Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе, она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе. Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.

4 Преимущества Сокращение времени и объёма работы переводчика. Сокращение времени и объёма работы переводчика. Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом. Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом. Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков. Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков. Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах. Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

5 Недостатки Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации. Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации. Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом. Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом. Оригинал должен быть в электронном виде. Оригинал должен быть в электронном виде. Одна незамеченная ошибка может распространиться на весь проект. Одна незамеченная ошибка может распространиться на весь проект. Необходимо обучение работе в самой программе, а при смене работы возможно, и не один раз. Необходимо обучение работе в самой программе, а при смене работы возможно, и не один раз. Подходит не ко всем видам текстов. Подходит не ко всем видам текстов. Высокая стоимость лицензионного ПО. Высокая стоимость лицензионного ПО.

6 memoQ XTM Cloud Memsource Deja Vu OmegaT SDLX Trados SmartCAT STAR Transit Wordfast memoQ XTM Cloud Memsource Deja Vu OmegaT SDLX Trados SmartCAT STAR Transit Wordfast Наиболее популярные системы TM

8 Trados система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем TM.

9 Система Trados состоит из модулей, предназначенных для перевода текстов различного формата, а также для ведения терминологических баз данных.

10 Основные модули Trados

11 Translators Workbench модуль работы с базами данных памяти переводов TM (создания, обслуживания, импорта, экспорта). Создание документов перевода и их редактирование производятся в отдельных модулях. Панель Trados в Microsoft Word модуль для перевода документов в Microsoft Word.

12 TagEditor модуль для перевода документов в формате PowerPoint, Excel, HTML, XML и т. п. WinAlign модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов. S-Tagger модуль для перевода документов в формате FrameMaker и InterLeaf.

13 T-Window модуль для перевода текста из буфера обмена. MultiTerm модуль для ведения глоссариев. ExtraTerm модуль для автоматического поиска терминологических кандидатов в тексте и создания глоссариев на их основе.

14 Memsource Cloud Memsource Cloud это полноценная переводческая среда, которая включает память переводов, а также встроенные функции машинного и ручного перевода, управления терминологией и переводческий редактор для работы в режиме онлайн и автономном режиме. Memsource была разработана для заказчиков переводов, бюро переводов и переводчиков.

15 Поддержка более 50 типов файлов. Поддержка более 50 типов файлов. Предусмотрены функции управление проектами, памяти переводов и организации работы с терминологией. Предусмотрены функции управление проектами, памяти переводов и организации работы с терминологией. Встроенные модули машинного и ручного перевода. Встроенные модули машинного и ручного перевода. Бесплатное рабочее место переводчика. Бесплатное рабочее место переводчика.

16 Memsource Web Editor Memsource Web Editor это полностью веб-интегрированное рабочее место переводчика, запускаемое непосредственно из Memsource Cloud. Оно разработано с использованием новейших веб- технологий, имеет широкие функциональные возможности и обеспечивает комфортную работу лингвиста. Оно поддерживает все функции, характерные для программ автоматизации переводов. Memsource Editor Memsource Editor это удобное рабочее место переводчика с широкими возможностями и высокой скоростью работы. Оно обеспечивает надежное подключение к базам данных памяти переводов и терминологии в среде Memsource Cloud, поддерживая при этом и работу в автономном режиме.

19 SmartCat Smartcat система автоматизированного перевода, включающая память переводов, машинный перевод, управление глоссариями, функцию совместной работы переводчиков над одним документом. Предназначена для компаний (в том числе переводческих) и отдельных переводчиков.

21 Smartcat поддерживает разнообразные входные форматы, включая текстовые документы, презентации, таблицы, отсканированные документы и изображения (предоставляя для последних платный сервис по распознаванию), HTML-страницы, файлы ресурсов, стандартизованные двуязычные форматы и другие. Smartcat поддерживает разнообразные входные форматы, включая текстовые документы, презентации, таблицы, отсканированные документы и изображения (предоставляя для последних платный сервис по распознаванию), HTML-страницы, файлы ресурсов, стандартизованные двуязычные форматы и другие. В Smarcat существует 3 основных типа учётных записей: фрилансер, переводческая компания и конечный заказчик. В Smarcat существует 3 основных типа учётных записей: фрилансер, переводческая компания и конечный заказчик. Smartcat уделяет большое внимание работе с переводчиками, организуя для пользователей различные мероприятия и площадки. Smartcat уделяет большое внимание работе с переводчиками, организуя для пользователей различные мероприятия и площадки. Пользовательский интерфейс доступен на русском, английском, японском, китайском и турецком языках, документация Smartcat на русском и английском. Пользовательский интерфейс доступен на русском, английском, японском, китайском и турецком языках, документация Smartcat на русском и английском.

ABBYY SmartCat

Работа с памятью переводов в SmartCAT построена таким образом, чтобы максимально эффективно использовать ранее переведенные материалы. Система способна определить, переводился ли данный сегмент ранее в таком же контексте или нет, а совпадения в каждом сегменте отображаются независимо от формы слов в нем. Тем самым увеличивается точность поиска и пропадает необходимость переводить похожие сегменты, сформулированные иначе.

Стандартное маркетинговое бла-бла-бла, надо проверить на практике, особенно «совпадения в каждом сегменте отображаются независимо от формы слов в нем».

Автоматический контроль качества позволяет осуществлять проверку орфографии и пунктуации, тегов и «плейсхолдеров», а также поиск двойных пробелов. Система оповестит вас о наличии терминологической ошибки вне зависимости от формы слова.

Ничего сверхъестественного.

В SmartCAT доступен широкий выбор «движков» машинного перевода. Наглядный отчет о производительности позволит подобрать систему, которая будет эффективна для вас и обеспечит максимальную скорость перевода.

Машинный перевод — зло. Я понимаю, следование моде и всё такое, но система-то позиционируется как решение для профессиональных переводчиков.

Встроенный модуль работы с терминологией позволяет полностью соблюдать требования заказчика. В SmartCAT вы можете создавать глоссарии самой разнообразной структуры и для каждого конкретного проекта.

Надо проверить на практике.

>SmartCAT — это полностью облачное решение.

А я бы предпочёл гибридное. Сервер может упасть, доступа к Интернету может не быть, а работать надо. Что мешало реализовать возможность автономной работы?

>Не беспокойтесь о конфиденциальности

Мы с моим куратором из ФСБ долго смеялись :-)

>Легко и быстро переводите PDF-файлы и отсканированные документы

Мы предусмотрели возможность работы с PDF-файлами и отсканированными документами прямо в SmartCAT. Вам больше не придется тратить время на то, чтобы получить файл в редактируемом формате. Достаточно просто загрузить отсканированный документ в систему и можно сразу начать процесс перевода.

Очень громкое заявление. Технологии распознавания текста у ABBYY, несомненно, одни из лучших в мире, но распознанный текст всё равно требует доработки напильником. Именно поэтому я с PDF-файлами не работаю; если заказчик не может предоставить файл в удобоваримом формате, пусть мучается с ним сам.

>Продуманный интерфейс: учиться и привыкать к системе больше не нужно

Переводчики, привычные к работе с двуязычными файлами, по достоинству оценят простой и удобный интерфейс SmartCAT. Впрочем, не вызовет он трудностей и у новичка — все нужные функции работы с «памятью», глоссариями и машинным переводом доступны по нажатию горячих клавиш.

Стандартное маркетинговое бла-бла-бла. Впрочем, поддержка горячих клавиш — это прекрасно, например, в XTM Cloud — одной из лучших на сегодняшний день кошек — для поиска в памяти переводов, приходится извращаться с мышью, что долго и неудобно.

>Использование словарей Lingvo во время перевода (скоро)

А вот это было бы здорово. А если бы ещё была возможность подключать собственные словари, ммм.

>Новый уровень совместной работы (скоро)

Ничего сказать не могу, так как принципиально работаю один.

>Расширенная поддержка файловых форматов (в третьем квартале 2014 г.)

Сразу надо было сделать. И не расширенную, а полную поддержку. Чтоб переводить всё ~~что движется~~ :-)

Если кто уже успел поработать с новой кошкой, отпишитесь в комментариях, пожалуйста.

В проектах ОмегаТ файлы памяти перевода, т. е. файлы с расширением «tmx», могут храниться в пяти разных местах.

Папка «omegat» содержит файл project_save.tmx и, возможно, некоторое количество его резервных копий. Файл project_save.tmx содержит все сегменты, которые были сохранены в памяти программы с момента начала проекта. Этот файл всегда присутствует во всех проектах. Его содержимое всегда отсортировано по исходным сегментам в алфавитном порядке.

main project folder

Главный каталог проекта содержит три TMX-файла: имя_проекта-omegat.tmx , имя_проекта-level1.tmx и имя_проекта-level2.tmx .

Файл «level1» содержит только текстовую информацию.

Файл «level2» инкапсулирует специфические теги ОмегаТ в стандартные теги TMX, чтобы этот файл можно было использовать (со всей информацией о форматировании) в любом переводческом ПО, которое поддерживает TMX 2 уровня, или в самой ОмегаТ .

Файл omegat включает специфические теги форматирования ОмегаТ , так что его можно использовать в других проектах ОмегаТ .

Эти файлы представляют собой копии project_save.tmx , т. е. главной памяти переводов проекта, за исключением ничейных сегментов. Им специально присвоены разные имена, чтобы всегда можно было понять, что находится в данном, конкретном файле. Это может быть полезно, например, когда TMX-файл находится в подкаталоге «tm» другого проекта.

Каталог «/tm/» может содержать любое количество справочных TMX-файлов. Эти файлы могут быть в любом из трёх описанных выше вариантах. Заметьте, что другие системы автоматизированного перевода могут также производить экспорт (и импорт) TMX-файлов во всех вариантах. Лучше всего, конечно, использовать TMX-файлы со специфичными для ОмегаТ тегами (см. выше), чтобы сохранить информацию о внутреннем форматировании сегментов.

Содержимое файлов памяти переводов из каталога «tm» используется при поиске нечётких совпадений в переводимом тексте. Любые хранящиеся в этих файлах сегменты, достаточно схожие с сегментами переводимого текста, будут показываться в области просмотра нечётких совпадений.

Если какой-либо из хранящихся в справочных TMX-файлах сегментов полностью совпадёт с текущим переводимым сегментом, поведение ОмегаТ будет зависеть от настроек, заданных в диалоговом окне «Параметры → Параметры редактирования. » . Например (если заданы настройки по умолчанию), перевод из справочной памяти переводов может быть принят, и вставлен как перевод сегмента с префиксом [нечёткое совпадение] , так что в дальнейшем переводчик сможет легко найти подобные сегменты и проверить их (см. раздел Параметры редактирования) .

Иногда файлы памяти переводов из папки tm содержат сегменты с одинаковым исходным текстом, но разными переводами. ОмегаТ считывает TMX-файлы в алфавитном порядке, строка за строкой. Соответственно, последний из сегментов с одинаковым исходным текстом будет иметь преимущество (примечание: хотя, конечно же, подобного рода ситуации следует избегать).

Заметьте, что TMX-файлы в каталоге «tm» могут быть сжаты утилитой gzip.

Если заранее известно, что хранящиеся в TMX-файле переводы корректны (полностью подходят для текущего проекта), можно поместить TMX-файл в подкаталог tm/auto , что позволит избежать необходимости удалять подстроку [нечёткое совпадение] из множества автоматически вставленных переводов. Это позволит легко создать предварительный перевод исходного текста: все исходные сегменты, для которых в файлах из папки «auto» найдутся точные совпадения, будут переведены без какого-либо участия со стороны пользователя.

Иногда требуется отделить высококачественные файлы памяти переводов от менее надёжных (например, относящихся к другой тематике или ещё не отредактированных). Для памяти переводов, хранящейся в подкаталогах «penalty-xxx» (где «xxx» это число от 0 до 100), будет автоматически занижаться процент совпадений, в соответствии с названием каталога, например, точные совпадения из памяти переводов, хранящейся в каталоге «penalty-30», будут помечаться как семидесятипроцентные. Это относится и к остальным совпадениям: сегменты с 75, 80 и 90 процентами совпадений будут отмечаться как имеющие 45, 50 и 60 %.

Также можно указать ОмегаТ создать дополнительный TMX-файл (в формате *-omegat-* ) со всеми сегментами проекта. См. ниже подраздел о памяти псевдо-переводов.

Помните, что файлы памяти переводов загружаются в память при открытии проекта. Резервное копирование памяти переводов проекта происходит регулярно (см. следующий раздел), также файл project_save.tmx сохраняется/обновляется при каждой загрузке и закрытии проекта. Это означает, например, что если вы добавите в проект новый справочный TMX-файл, то будет достаточно перезагрузить проект, все ваши переводы будут сохранены.

Расположение различных файлов памяти перевода для текущего проекта задаётся пользователем (см. окно Проект > Свойства…).

В зависимости от потребностей, можно применять различные стратегии перевода, например:

несколько проектов со схожей тематикой: используйте единый каталог для всех проектов, заменяйте только каталоги исходных и переведённых файлов (исходные файлы в «source/order1», переведённые файлы в «target/order1» и т. д.). Заметьте, что переводы сегментов из файлов в каталоге «order1», которые отсутствуют в «order2» или других работах, будут помечаться как «ничейные», что, однако, никак не помешает использовать их как источник нечётких совпадений.

несколько переводчиков, работающих над одним проектом: разделите каталог исходных файлов на «source/Mihail», «source/Viacheslav»… и назначьте их членам команды (Михаилу, Вячеславу и т. д.). Они могут создать собственные проекты и предоставить project_save.tmx по окончанию проекта, или после перевода определённого количества текстов. Затем, файлы project_save.tmx собираются вместе и анализируются, например, чтобы исключить несоответствия в терминологии. Создаётся новая версия главного TMX-файла, который либо помещается в каталог tm/auto каждого члена команды, либо служит заменой их файлов project_save.tmx . Команда может использовать общий каталог переведённых файлов. Это позволяет, например, в любой момент убедиться, что перевод всего проекта корректен.

Резервное копирование TMX-файлов

По мере перевода ваших фалов, ОмегаТ сохраняет память переводов в файле project_save.tmx , находящемся в подкаталоге omegat .

Кроме того, ОмегаТ сохраняет резервные копии памяти переводов в файлах project_save.tmx.ГГГММДДЧЧНН.bak в той же папке при каждом открытии или перезагрузке проекта. ГГГГ — это год (4 цифры), ММ — это месяц, ДД — это число, а ЧЧ и НН — это часы и минуты, прошедшие с момента сохранения предыдущей резервной копии.

Если вам кажется, что вы потеряли свой перевод, сделайте следующее:

Переименуйте файл project_save.tmx (например, в project_save.tmx.temporary )

Выберите резервную копию, которая скорее всего содержит нужные вам данные, например, самую последнюю, или последнюю копию за вчерашний день.

Переименуйте его в project_save.tmx

TMX-файлы и язык

Файлы TMX содержат единицы перевода, которые состоят из определённого количества эквивалентных сегментов на разных языках. Единица перевода состоит из, как минимум, двух вариантов единицы перевода (translation unit variant, TUV). Любой из них можно использовать и как оригинал, и как перевод.

Языки перевода и оригинала определяются из настроек проекта. Таким образом, ОмегаТ находит варианты единиц перевода соответствующие языковым кодам проекта и рассматривает их как сегменты оригинала и перевода. ОмегаТ распознаёт языковые коды в двух форматах:

двух-буквенные коды (например, JA для японского), или

двух- или трёх-буквенные коды, за которыми идёт двух-буквенный код страны (например, EN-US, см Приложение A, Языки - список кодов ISO 639 неполный список кодов языков).

Если языковые коды проекта и файла TMX полностью совпадают, сегменты загружаются в память. Если совпадает только язык, но не страна, сегменты всё равно загружаются в память. Если не совпадает ни один код, сегменты не загружаются.

В общем случае TMX-файлы могут содержать единицы перевода на разных языках. Если в памяти переводов для текущего сегмента нет совпадений на языке перевода, будут показаны все остальные совпадения, вне зависимости от языка. Например, если в проекте производится перевод с немецкого на французский, перевод текущего сегмента с немецкого на английский может всё равно оказаться полезным.

Ничейные сегменты

Файл project_save.tmx содержит все сегменты, которые были переведены с момента начала проекта. После изменения правил сегментации или удаления файлов из каталога «source» некоторые совпадения могут отображаться в области просмотра как «ничейные» : такие совпадения соответствуют сегментам, которых больше нет в исходных документах, эти сегменты были переведены и сохранены в памяти до своего удаления.

Повторное использование памяти переводов

Изначально, сразу после создания проекта, главный файл памяти переводов, project_save.tmx , пуст. По мере перевода этот TMX-файл будет наполняться. Для ускорения этого процесса можно использовать уже имеющиеся переводы. Если текущий сегмент уже был переведён ранее и переведён хорошо, переводить его заново нет никакой необходимости. Также, сегменты из памяти перевода могут использоваться как образцы специфического стиля, типичный пример — международные документы, публикуемые Европейским Союзом.

При создании переведённых документов память переводов проекта также сохраняется в виде трёх файлов в главной папке проекта (см. выше). Эти три TMX-файла ( «-omegat.tmx» , «-level1.tmx» и «-level2.tmx» ) можно рассматривать как «память переводов на экспорт», то есть, как экспортированную двуязычную сводку вашего проекта.

Если вы пожелаете повторно использовать память переводов из предыдущего проекта (например, потому что новый проект похож на предыдущий или использует терминологию, которая была задействована раньше), то вы можете подключить эту память переводов как «внешнюю» по отношению к вашему новому проекту. В этом случае поместите файлы памяти переводов, которые вы хотите использовать, в каталоги /tm или /tm /auto вашего нового проекта. Файлы из каталога «tm» будут использоваться для поиска нечётких совпадений, а файлы каталога «/tm/auto» — для создания предварительного перевода вашего проекта.

По умолчанию, каталог «/tm» находится в главном каталоге проекта (например, /MyProject/tm ), но, при желании, в диалоговом окне свойств проекта вы можете задать и другое расположение. Это полезно, если вы часто используете файлы памяти переводов, созданные раннее, например, потому что они относятся к одной теме или к одному клиенту. В таком случае, может быть полезно прибегнуть к такой процедуре:

Создайте каталог (репозиторий, хранилище) в удобном месте на вашем жёстком диске. Он будет использоваться для конкретного клиента или конкретной тематики.

После окончания работы над проектом, скопируйте один из трёх «экспортных» файлов памяти переводов из главного каталога проекта в каталог-репозиторий.

Когда вы начинаете работу над новым проектом для того же клиента или по той же тематике, выберите пункт меню «Проект > Свойства. » и в появившемся диалоговом окне в качестве папки памяти переводов укажите каталог-репозиторий.

Имейте в виду, что все TMX-файлы в репозитории «/tm» обрабатываются во время запуска программы, поэтому если вы поместите туда все имеющиеся у вас TMX-файлы, то можете несколько замедлить работу ОмегаТ. Возможно, часть этих файлов можно будет удалить, после того, как их содержимое перейдёт в project-save.tmx вашего текущего проекта.

Импорт и экспорт памяти переводов

ОмегаТ поддерживает импорт файлов TMX версий 1.1—1.4b (уровней 1 и 2). Это позволяет ОмегаТ использовать память переводов, созданную другими программами. Однако, импорт TMX-файлов 2 уровня (которые содержат не только перевод, но и форматирование) поддерживается не полностью. ОмегаТ может импортировать TMX-файлы второго уровня и использовать содержащуюся в них текстовую информацию, но качество нечётких совпадений будет несколько ниже.

ОмегаТ использует очень жёсткие правила обработки файлов памяти переводов (файлов TMX). Если в таком файле обнаружится ошибка, ОмегаТ укажет её расположение в некорректном файле.

ОмегаТ экспортирует TMX-файлы версии 1.4 (1 и 2 уровня). На самом деле, экспорт 2 уровня не совсем соответствует стандарту, но достаточен для того, чтобы эти файлы давали корректные совпадения в программах, поддерживающих TMX 2 уровня. Если вам нужна только текстовая информация (без форматирования), используйте созданный ОмегаТ файл 1 уровня.

Создание отдельной памяти переводов для некоторых документов

Если вы хотите поделиться памятью переводов, за исключением сегментов из некоторых документов, или содержащей сегменты только определённых документов, передача всего файла ИмяПроекта-omegat.tmx вам не подойдёт. Ниже описан один из способов решить эту проблему, не единственный, но достаточно простой и надёжный.

Создайте новый проект с нужной парой языков и подходящим именем, помните, что это имя унаследуют и создаваемые TMX-файлы.

Скопируйте документы, для которых хотите создать файл памяти переводов, в каталог «source» нового проекта.

Скопируйте память переводов этих документов из предыдущих проектов в каталог tm/auto .

Откройте созданный проект. Нажмите CTRL+T , чтобы проверить теги и CTRL+U , чтобы убедиться, что все сегменты имеют перевод. Если никаких проблем не обнаружено, нажмите CTRL+D , чтобы создать переведённые документы, и проверьте их содержимое.

Закройте проект. Теперь TMX-файлы в главном каталоге проекта содержат память перевода нужных вам файлов и только их. Сделайте резервную копию этих файлов.

Чтобы избежать путаницы, удалите новый проект или переместите его в архив.

Использование общей памяти переводов

Если над проектом работает команда переводчиков, вместо обмена локальными копиями памяти переводов удобнее использовать один общий файл памяти.

ОмегаТ умеет работать с SVN и Git, двумя наиболее популярными свободными системами управления версиями. Система управления версиями может синхронизировать общий каталог проекта между всей командой переводчиков, включая подкаталог «source» и файл с настройками проекта. Более подробная информация представлена в соответствующем разделе.

Использование TMX-файлов с другими языковыми парами

Предположим, вы перевели проект, например, с нидерландского на русский. Затем вам потребовалось перевести это проект на китайский, но переводчица, знающая китайский, совсем не понимает нидерландский, однако хорошо говорит по-русски. В этом случае память переводов NL-RU может быть использована как для создания перевода NL-ZH.

Для этого нужно скопировать созданную память NL-RU в подкаталог «tm» и переименовать файл в «ZN-CN.tmx», чтобы подчеркнуть язык перевода проекта. Переводчик будет видеть английские переводы сегментов на нидерландском языке и сможет использовать их для создания перевода на китайский.

Важно: вспомогательный TMX-файл должен быть переименован в «XX_YY.tmx», где «XX_YY» — это код целевого языка проекта, например, «ZH_CN.tmx» в примере выше. Конечно же, исходные языки проекта и TMX-файла должны быть одинаковыми (в нашем примере это NL). Заметьте, что для одной языковой пары можно подключить только один TMX-файл, так что если вам нужно использовать несколько файлов памяти переводов, их следует объединить в один файл «XX_YY.tmx».

Исходные документы с уже имеющимися переводами

Файлы некоторых форматов, например, PO и TTX, являются двуязычными, т. е. одновременно содержат и исходные сегменты, и память переводов. В этих случаях существующий перевод, хранящийся в исходном файле, автоматически копируется в project_save.tmx . Если не найдено других точных совпадений, он становится переводом по умолчанию, в противном случае он рассматривается как один из возможных вариантов перевода. Таким образом, полученный результат зависит от порядка загрузки исходных сегментов.

Все переводы из исходных документов показываются не только в области нечётких совпадений, но и в области комментариев. В случае с PO-файлами процент совпадения альтернативных вариантов перевода занижается на 20 %, т. е. для точных совпадений он будет составлять лишь 80 %. Рядом с исходным сегментом будет отображаться строка «[Нечёткое совпадение]».

При загрузке TTX-файлов сегменты, перевод которых совпадает с оригиналом, будут включены в проект, если в окне «Параметры → Параметры редактирования…» установлен соответствующий флажок. Так как это может вас запутать, возможно, флажок стоит снять.

Память псевдо-перевода

Примечание

Этот раздел предназначен для опытных пользователей!

Иногда перед собственно переводом, может понадобиться предварительная обработка сегментов, вне ОмегаТ. Например, вы можете захотеть создать псевдо-перевод, чтобы как-нибудь с ним поэкспериментировать. ОмегаТ позволяет создать дополнительный TMX-файл, который содержит все сегменты проекта. Переводы в этом файле либо:

будут копировать оригинал (поведение по умолчанию)

Вы можете указать для этого файла любое имя. Память псевдо-перевода создаётся следующей командой (в командной строке):

java -jar omegat.jar --pseudotranslatetmx=<имяфайла> [pseudotranslatetype=[equal|empty]]

Замените <имяфайла> на конкретное имя файла, который вы хотите создать. Имя может быть абсолютным или относительным к текущему каталогу (каталогу, из которого запускается ОмегаТ ). Второй аргумент ( --pseudotranslatetype ) не обязателен. Он может принимать значения equal (поведение по умолчанию, перевод копирует оригинал) или empty (сегмент перевода будет пустым). В дальнейшем вы можете обрабатывать созданный TMX-файл при помощи любой доступной вам программы. Чтобы повторно использовать его в ОмегаТ , переименуйте файл в project_save.tmx и поместите в папку omegat вашего проекта.

Обновление файлов памяти переводов

Ранние версии ОмегаТ умели производить сегментацию исходных файлов только по абзацам и непоследовательно нумеровали теги форматирования в файлах HTML и Open Document. ОмегаТ может определять и исправлять такие TMX-файлы «на лету», что позволяет улучшить качество нечётких совпадений и более эффективно использовать существующие переводы, тем самым освобождая переводчика от лишней работы.

Читайте также: