«Память переводчика», или Что такое Translation Memory. Как настроить систему Тranslation Memory Программы для распознавания текста

Описание

Одна запись в такой базе данных соответствует сегменту или «единице перевода » (англ. translation unit ), за которую обычно принимается одно предложение (реже - часть сложносочинённого предложения либо абзац). Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе (точное соответствие, англ. exact match ), она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе (нечёткое соответствие, англ. fuzzy match ). Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведённые тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведённого текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format ), который основан на XML и может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик, работающий с OmegaT , может использовать ПП, созданную в Trados , и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment ), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Стандарты и форматы памяти переводов

TMX (Translation Memory Exchange Format - Обмен памятью переводов). Этот стандарт обеспечивает взаимный обмен между разными поставщиками памяти переводов. TMX является общепринятым форматом в среде переводчиков и лучше всего подходит для импорта и экспорта памяти переводов. Последняя версия этого формата - 1.4b позволяет восстанавливать исходные документы и их перевод из файла TMX.
TBX (Termbase Exchange format - Обмен терминологическими базами). Это принятый LISA (Ассоциации индустрии локализации) формат сейчас пересматривается и переиздаётся согласно ISO 30042 . Этот стандарт позволяет проводить обмен терминологией, в том числе детальной лексической информацией. Основная база TBX определяется стандартами: ISO 12620 , ISO 12200 и ISO 16642 . ISO 12620 обеспечивает реестр четко определённых «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или предопределённые значения. ISO 12200 (известен также как MARTIF) предоставляет основу для каркасной структуры TBX. ISO 16642 (известен также как Terminological Markup Framework - Структура терминологической разметки) включает структурную метамодель для терминологических языков разметки (Terminology Markup Languages) в целом.
SRX создан для улучшения формата TMX и большей эффективности обмена памятью переводов между программами. Возможность указывать правила сегментации, которые использовались в предыдущем переводе, повышает эффективность отождествления сегментов в текущем тексте с содержимым ПП.
GMX GILT означает Globalization, Internationalization, Localization, and Translation (Глобализация, интернационализация , локализация , перевод). Стандарт GILT Metrics состоит из трёх частей: GMX-V для показателей объёма, GMX-C для показателей сложности, GMX-Q для показателей качества. Предложенный стандарт GILT Metrics направлен на квантификацию объёма работ и требований качества при реализации задач GILT.
OLIF - открытый стандарт, совместимый с XML , который используется для обмена терминологическими и лексическими данными. Хотя изначально он применялся в качестве способа обмена лексическими данными между частными лексиконами машинного перевода, постепенно этот формат превратился в более общий стандарт терминологического обмена.
XLIFF (XML Localisation Interchange File Format - XML формат для взаимного обмена при локализации), создан как единый формат файлов для взаимного обмена, который распознаётся всеми программными средствами локализации. XLIFF - это наилучший в современной индустрии переводов способ обмена информацией в формате XML. Некоторые инструменты используют проприетарные форматы XLIFF, не позволяющие открывать созданные в них файлы в других программах.
TransWS (Translation Web Services - переводческие веб-сервисы), определяет требуемые параметры вызова веб-сервисов при отправлении и получении файлов и сообщений, имеющих отношение к проектам локализации. Задумывался как развёрнутая система автоматизации процесса локализации с использованием сервисов в сети Интернет .
xml:tm , этот подход к памяти переводов основан на концепции текстовой памяти, которая позволяет совмещать авторскую память и память переводов. Формат xml:tm был передан Lisa OSCAR компанией XML-INTL .

Преимущества и недостатки

Преимущества

Сокращение времени и объёма работы переводчика.
Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом.
Увеличение прибыли за счёт увеличения производительности труда переводчика, группы переводчиков.
Повышение качества услуг за счёт увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки

Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации.
Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом.
Оригинал должен быть в электронном виде.
Одна незамеченная ошибка может распространиться на весь проект.
Необходимо обучение работе в самой программе, а при смене работы - возможно, и не один раз (если работодатели пользуются разными программами ТМ).
Подходит не ко всем видам текстов.
Высокая стоимость лицензионного ПО.

См. также

Литература

Грабовский В. Н. Технология Translation Memory // Мосты. Журнал переводчиков. 2004. № 2. - С. 57-62.

Ссылки

Использование профессиональных программ переводческими компаниями России // Константин Дранч, 8 апреля 2015.

Память переводов проекта (TM) - это хранилище исходных строк и их переводов на разные языки, которые можно использовать для ускорения перевода одинаковых или похожих строк в вашем проекте или других проектах.

Каждый перевод, сделанный в проекте, автоматически добавляется в память переводов проекта. Владелец или руководители проекта также могут при необходимости загрузить в проект Translation Memory.

Скачивание или загрузка памяти переводов

Перейдите на вкладку TM & MT пункта настройки проекта .
Нажмите кнопку скачать или загрузить .

You can upload and download TM in the following file formats .tmx, .csv, .xlsx.

Если вы загружаете TM в форматах файлов.csv или.xlsx, сопоставьте столбцы с соответствующими языками в диалоге конфигурации.

Привязка ТМ

Чтобы привязать какие-либо конкретные TM для вашего проекта, выполните следующие действия:

Перейдите на вкладку TM & MT пункта настройки проекта .
Нажмите **Привязать TM **.
Выберите необходимые ТМ в открывшемся диалоговом окне.
Кликните по кнопке Сохранить .

Вы можете установить приоритет выбранных ТМ в том же диалоге.

Совместное использование ТМ

Со всеми вашими TM используемыми совместно вы сможете предварительно перевести любой из ваших проектов, используя все общие TM. Кроме того, в редакторе будут показаны предложения по переводу ТМ из всех ТМ, назначенных для проектов, которыми вы владеете.

Применение памяти переводов через предварительный перевод

Предварительный перевод через ТМ позволяет использовать как минимум 100% и совершенные совпадения.

Ключевые слова

ПАМЯТЬ ПЕРЕВОДОВ / НАКОПИТЕЛЬ ПЕРЕВОДОВ / ПРОФЕССИОНАЛЬНОЕ ОБУЧЕНИЕ / ПЕРЕВОД / ОБУЧЕНИЕ ПЕРЕВОДУ / TM-ПРОГРАММА / TRANSLATION MEMORY / PROFESSIONAL EDUCATION / TRANSLATION / TEACHING TRANSLATION / TM SOFTWARE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы - Бабина Ольга Ивановна, Осминин Павел Григорьевич

Рассмотрена задача обучения студентов работе со специализированным программным обеспечением. Освещена история развития программ памяти переводов , приводятся примеры наиболее известных программ, включая российские разработки, и критерии их различия, описывается общий процесс работы с программами, указываются наиболее типичные сферы применения технологии памяти переводов . Указаны преимущества программ памяти переводов , которые заключаются в повышении производительности труда переводчика, упрощении соблюдения единства терминологии в тексте перевода . Приведены недостатки таких программ повышение эффективности труда возможно только при переводе текстов, содержащих большое количество повторений, обучение работе с программами требует, как правило, временных и финансовых затрат. Обосновывается применение в образовательном процессе технологии памяти переводов , а также приводятся различные типы заданий для студентов, направленные на формирование навыка использования памяти переводов . Задания отражают реальную специфику работы переводчика, что увеличивает конкурентоспособность будущего выпускника на рынке труда. Приводится методика оценки результатов обучения. Результаты статьи могут использоваться при составлении методических рекомендаций по курсу обучения переводу .

Текст научной работы на тему «Память переводов в обучении переводчиков»

УДК 378.16 ББК Ш11

ПАМЯТЬ ПЕРЕВОДОВ В ОБУЧЕНИИ ПЕРЕВОДЧИКОВ

О.И. Бабина, П.Г. Осминин Южно-Уральский государственный университет (г. Челябинск)

Рассмотрена задача обучения студентов работе со специализированным программным обеспечением. Освещена история развития программ памяти переводов, приводятся примеры наиболее известных программ, включая российские разработки, и критерии их различия, описывается общий процесс работы с программами, указываются наиболее типичные сферы применения технологии памяти переводов. Указаны преимущества программ памяти переводов, которые заключаются в повышении производительности труда переводчика, упрощении соблюдения единства терминологии в тексте перевода. Приведены недостатки таких программ - повышение эффективности труда возможно только при переводе текстов, содержащих большое количество повторений, обучение работе с программами требует, как правило, временных и финансовых затрат. Обосновывается применение в образовательном процессе технологии памяти переводов, а также приводятся различные типы заданий для студентов, направленные на формирование навыка использования памяти переводов. Задания отражают реальную специфику работы переводчика, что увеличивает конкурентоспособность будущего выпускника на рынке труда. Приводится методика оценки результатов обучения. Результаты статьи могут использоваться при составлении методических рекомендаций по курсу обучения переводу.

Ключевые слова: память переводов, накопитель переводов, профессиональное обучение, перевод, обучение переводу, ТМ-программа.

Введение

В современном мире увеличивается необходимость в переводческих услугах. Объем рынка переводов растет, увеличивается потребность в квалифицированных переводчиках, требуется повышение производительности труда переводчиков. Значительно возросла роль информационных технологий в переводе - широкое распространение получили как общие программы (текстовые редакторы), так и специализированные переводческие программы (электронные словари, корпусы текстов, программы памяти переводов, терминологические базы). Сам материал для перевода претерпел изменения - все чаще для перевода предлагается цифровой материал в виде презентаций, мультимедийных материалов . Ряд авторов отмечает, что при подготовке переводчиков требуется учитывать изменения в работе переводчиков, обучать современным навыкам и умениям, использовать в обучении современные информационные технологии.

Обзор TM-программ

Технология памяти переводов, или накопителя переводов (Translation Memory, TM), предназначена для повторного использования

в переводческой деятельности ранее переведенных текстов.

Одни из первых попыток использования компьютера для помощи в ручном переводе относятся к 1966 г. . В г. Мангейм Агентство переводов Вооруженных Сил Германии использовало компьютер для создания глоссариев для определенных типов текстов. Работа происходила следующим образом: переводчик читал английский текст и подчеркивал слова, для которых ему нужны немецкие эквиваленты. Затем оператор ЭВМ подавал эти сведения в компьютер, который мог составлять три или четыре глоссария к тексту за десять минут работы.

В Люксембурге в терминологическом бюро Европейского объединения угля и стали применялся поиск терминов в автоматическом словаре. По оценкам бюро переводчик тратил на поиск терминов не менее четверти времени. При работе с системой переводчик подчеркивал неизвестные ему слова. Затем предложение целиком вводилось в компьютер, осуществлялся автоматический поиск, и на печать выводились наиболее схожие предложения, а также слова с переводом в порядке появления в тексте. Чем больше поступало

запросов от переводчика, тем среди большего количества предложений выполнялся поиск, что увеличивало вероятность появления терминов в правильном контексте. Таким образом, бюро удалось не только облегчить работу переводчика, но и составлять специализированные глоссарии в короткие сроки.

В 1979 г. Питер Артен пришел к выводу, что тексты Европейской Комиссии, которые необходимо было переводить на несколько языков, содержат очень большое количество повторений и цитат из различных документов комиссии, поэтому переводчики вынуждены тратить время на перевод уже переведенных текстов. Артен предложил, что необходимо иметь общую центральную память большого объема с функцией поиска, куда будут сохраняться все документы организации и их переводы. При наборе текста будет возможность указать требуемые языки для перевода и сравнить документ с документами в общей памяти, откуда будут выведены на печать наиболее близкие варианты перевода предложений оригинального текста на требуемых языках.

Мартин Кэй в 1980 г. в своем отчете описал предполагаемое устройство для помощи переводчику, состоящее из текстового редактора и словаря. Текстовый редактор состоит из двух окон - верхнего, где содержится оригинальный текст, и нижнего, куда заносится перевод. Переводчик имеет возможность выделить слово или словосочетание в тексте и выполнить поиск в словаре; предполагалась возможность редактировать записи в словаре.

Первые коммерческие TM-программы появились в начале 1990-х годов. В 1984 г. в швейцарском городе Штайн-на-Рейне была основана компания STAR (акроним от Software Translation Artwork Recording). Компания занималась разработкой программного обеспечения, оказанием услуг по переводу. В 1991 г. компания выпустила программу Transit для операционной системы DOS, в состав программы входил модуль управления терминологией TermStar.

В 1984 г. в немецком городе Штутгарт была основана компания TRADOS (акроним от TRAnslation & Documentation Software) и в 1992 г. компания выпустила программу Translator"s Workbench для операционной системы DOS. Программа включала память переводов, текстовый редактор, модуль управления терминологией MultiTerm.

В 1992 г. в английском городе Мейденхед была основана компания SDL International -поставщик лингвистических услуг. Компания быстро развивалась, приобретала более мелкие компании и стала одним из лидеров рынка. В 1998 г. SDL выпустила собственную TM-программу SDLX. В 2005 г. компания SDL приобрела компанию TRADOS.

В 1993 г. в Мадриде была основана компания ATRIL, которая выпустила Deja Vu -первую TM-программу для операционной системы Windows 3.1. Программа встраивалась в Microsoft Word for Windows 2.0. В 1996-1997 гг. Deja Vu была переработана в программу с отдельным интерфейсом.

В нашей стране достаточно мало разработок, относящихся к TM-программам. TM-программа MT2007 разрабатывается примерно с 2007 г. силами одного разработчика, доступна в качестве отдельного приложения. Разработка программы приостанавливалась на некоторое время; возможно, программа будет доступна под названием CATnip. Компания ABBYY предлагает ABBYY Aligner - инструмент для создания памяти перевода из параллельных текстов. Российская компания PROMT предлагает объединение технологий машинного перевода (MT) и памяти переводов (TM).

В настоящее время доступно множество различных TM-программ. Самыми популярными являются Across, Deja Vu, MemoQ, OmegaT, SDL Trados Studio, STAR Transit, Wordfast.

Обычно на сайте компании - разработчика программы доступны как платные, так и бесплатные обучающие материалы. Для программ Deja Vu и SDL Trados доступны бесплатные обучающие материалы на русском языке от официальных дистрибьюторов программ в России и странах СНГ - бюро переводов «Окей» и компании Т-Сервис .

На современном этапе память переводов представляет собой базу данных, в которой хранятся текстовые сегменты на исходном языке и языке перевода. Сегмент оригинала и сопоставленный ему сегмент перевода представляют собой единицу перевода (Translation Unit, TU). В роли сегмента обычно выступают предложения текста.

TM-программы можно различать по нескольким критериям.

1) По технической реализации можно выделить локальные TM-программы и доступные в режиме онлайн. При использовании

онлайн-версий (например, Google Translator Toolkit и Wordfast Anywhere ) работа происходит в окне интернет-браузера. На рис. 1 показан пример работы с Wordfast Anywhere. При этом результаты работы (память переводов, глоссарии) в Google Translator Toolkit можно сделать доступными для других пользователей.

Локальные программы могут представлять собой отдельные приложения или встраиваемые приложения.

ются в текстовый редактор (например, Microsoft Word). Перевод происходит непосредственно в текстовом редакторе. Преимущество такого подхода в том, что пользователь работает с привычным интерфейсом редактора, ему доступны расширенные возможности редактирования текста. Недостаток заключается в ограниченности поддержки форматов файлов - обычно доступны лишь форматы текстового редактора.

При работе с отдельными приложениями весь процесс перевода происходит в среде приложения. При этом могут быть доступны дополнительные форматы. Недостатком может быть необходимость привыкать к интерфейсу программы.

2) По дополнительным функциональным возможностям. Часто в TM-программы встраиваются программы по управлению терминологией - они позволяют предоставлять общий доступ к терминологическим базам данных, хранить и обрабатывать терминологию. Это позволяет обеспечить единство терминологии в переводе, обеспечить соблюдение языковой

политики в рамках отдельного предприятия или предметной области.

Для построения памяти переводов необходимо уметь сопоставлять сегменты исходного текста и перевода, чтобы далее занести эти пары в базу данных программы. Поэтому зачастую ТМ-программы снабжены функцией выравнивания сегментов текстов (чаще предложений).

Кроме того, непосредственно в процессе перевода для разрешения неоднозначности

просмотреть употребление того или иного слова в контексте. ТМ-программы, как правило, предоставляют возможность построить конкорданс слова - найти список всех употреблений слова в контексте, одновременно предъявляя способы перевода лексической единицы в каждом случае. Фактически, эта функция представляет собой доступ к многоязычному корпусу текстов, и поиск лексических единиц осуществляется через интерфейсы, подобные тем, которые применяются при работе с корпусами текстов. Некоторые параллельные корпусы для отдельных пар языков с интерфейсом для составления конкорданса доступны в режиме онлайн (такие как Тгап88еагсЬ, WeBiText, Тга^оИ, 8упсЬгоТегш и другие). Так как поиск по информационному ресурсу уже достаточно мощный источник лингвистической информации для переводчика, параллельные корпусы текстов с инструментом поиска по нему иногда выделяют в отдельный тип памяти переводов и противопоставляется собственно программам памяти переводов, где поиск повторяющихся

» File Edit Display Tools ? & | ^ | о = | <^? | □ | ^ ■=£>] О @ , Q. Ei | lSi ♦«*

100% (TM ENsRU) Private TU

В коммерческих TM-программах, как правило, имеются встроенные системы извлечения терминологии и состав-

ления глоссария терминов (SDL MultiTerm Extract, SDL MultiTerm, PROMT TerM, Mono-Conc Pro, Simple Concordance Program и др.).

«Сырой» текст, включающий автоматически замененные термины и сегменты текста на их переводные аналоги, на конечной стадии подвергается пост-редактированию.

3. Проверка качества: включает формальную проверку выполненного перевода на полноту, грамматическую правильность, корректный перевод релевантной терминологии, которая может осуществляться самим переводчиком, (возможно) заказчиком, а также на промежуточном звене, обеспечивающем связь между переводчиком и заказчиком. При этом большое значение имеет процесс фиксации выполненных правок в памяти переводов, иначе ошибки могут повторяться при последующих переводах.

Таким образом, при работе c TM-программой выделяются содержательный (включающий использования ряда функций по автоматизации переводческой деятельности), формальный и экономический аспекты перевода. Обозначенные аспекты являются важной составляющей использования памяти перевода в профессиональной деятельности переводчиков. В связи с этим каждый из указанных аспектов должен найти отражение при практическом обучении будущих переводчиков применению TM-программ в переводческой деятельности. При этом представляется необходимым «провести» будущего переводчика последовательно через все стадии реального процесса перевода в моделированных условиях, что ставит задачу разработки содержательно преемственных заданий при обучении применению TM-программ.

Обучение применению TM-программ

При обучении студентов в вузе мы считаем целесообразным использовать онлайн-версии TM-программ, так как такой подход обладает рядом преимуществ:

Онлайн TM бесплатны, что упрощает их ввод в образовательный процесс.

Онлайн TM можно использовать на различных устройствах (десктопы, ноутбуки, планшеты) и операционных системах (Windows, Linux, Mac OS).

Онлайн TM можно использовать везде, где есть доступ в интернет, нет необходимости заранее устанавливать программу на определенное количество компьютеров. Такой подход позволяет значительно расширить количество обучаемых студентов. Например,

занятия можно проводить у студентов профильных специальностей (лингвистов, переводчиков), у студентов непрофильных специальностей (курсы дополнительного образования).

Работая с TM-программой, переводчик должен знать, как использовать и пополнять базу данных программы. Необходимо помнить, что любой инструмент работает лучше, если им правильно пользоваться.

Типы заданий, выполняемых студентами на занятиях, разнообразны и отражают специфику реальной работы переводчика. Перечислим некоторые задания.

Задание на составление корпуса текстов. Студентам задаются параметры текстов, которые необходимо включить в корпус (название предметной области, жанр, стиль текстов, даты создания и т. п.), и предлагается создать учебный корпус из нескольких текстов. Такое задание обусловлено мнением ряда авторов о том, что TM могут использоваться совместно с другими средствами обучения (например, корпусами текстов), что еще больше повышает эффективность проводимых занятий. При этом некоторые способы использования корпуса текстов при обучении иностранному языку могут повторно использоваться при подготовке переводчиков.

В «мягком» варианте в качестве источника текстов предлагается некий общий корпус текстов, доступный онлайн (например, Национальный корпус русского языка, British National Corpus, Michigan Corpus of Academic Spoken English и т. д.). Во многих онлайн-корпусах имеется метаразметка текстов, которая классифицирует тексты по ряду параметров. В связи с этим отбор текстов из такого корпуса задача достаточно простая, затруднение может вызывать лишь процесс использования инструментария поиска по корпусу текстов. Поэтому использование поисковых механизмов корпусов текстов, доступных онлайн, должно быть неотъемлемой частью обучения профессионального переводчика.

«Жесткий» вариант направлен на решение более сложной задачи - самостоятельный поиск текстов по параметрам в сети интернет. Это, в свою очередь, ставит задачу использования возможностей поисковых машин интернета, и, следовательно, информационный поиск и инструменты поиска - также необходимы переводчику в профессиональной деятельности.

Созданные при выполнении этого задания

корпусы текстов могут использоваться для выполнения последующих заданий при обучении переводчиков.

Задание на составление глоссария текста. Студенты получают текст определенной предметной области и составляют по нему глоссарий терминов с переводом, чтобы применять этот глоссарий для контроля единообразия терминологии в выполняемом им переводе. Как упоминалось ранее, для отбора терминологии, как правило, используются средства автоматического извлечения лексических единиц из текстов, которые могут быть встроены в коммерческие ТМ-програм-мы, однако зачастую отсутствуют в онлайн-системах. Мы в процессе обучения предлагаем использовать инструмент извлечения именных групп , который может использоваться как для обучения иностранным языкам , так и являться неотъемлемым компонентом подготовки переводчиков. Ознакомление со способами использования средства автоматического извлечения терминологии из текстов представляет собой необходимую составляющую процесса обучения использованию программ памяти переводов в профессиональной деятельности.

Расширением такого задания может служить задание представить полученный глоссарий терминов структурированно, в форме лексической онтологии . Наряду с памятью переводов терминологические онтологии разрабатываются как важный инструмент для соблюдения языковой политики предприятия . Кроме того, существуют исследования по применению, сопоставлению терминологических онтологий различных языков для создания ресурса , применимого как в технологии памяти переводов, так и при автоматическом переводе текстов.

Задание на выравнивание текста и его

перевода. Студенты получают текст и его перевод и выполняют выравнивание текста, чтобы получить заполненную память перевода. Вариантом этого задания является использование автоматизированной интерактивной процедуры выравнивания терминов .

Задание на предварительный анализ эффективности использования ТМ. Студенту дается два текста и сообщается, что первый текст используется для создания памяти переводов, второй текст будет переводиться с применением памяти переводов. Студенту предлагается проанализировать, насколько эффективно применение памяти переводов для данной пары текстов. Примеры таких текстов представлены на рис. 2. Для сохранения преемственности заданий текст для создания ТМ может представлять собой подкорпус корпуса текстов, используемого для создания глоссария терминов.

Данное задание сводится к выявлению повторяющихся блоков в обоих текстах и вычислению доли таких блоков в тексте, используемому для перевода. Для решения этой задачи в расширенной версии задания возможно использование вспомогательных средств автоматизации (составление частотных списков, использование программ извлечения терминологии из текстов, средства для сравнительного анализа используемых лексических единиц и т. п.).

Задание на перевод текста с помощью ТМ. Студенты получают текст и самостоятельно его переводят с помощью ТМ. Текст дается из предметной области, используемой ранее для формирования глоссария и памяти переводов, что дает возможность использовать результаты, полученные при выполнении предыдущих заданий. Первоначально предлагается выполнить перевод текста, выданного при выполнении предыдущего задания. Далее

Текст для создания ТМ Текст для перевода с использованием ТМ

Изучается начально-краевая задача для уравнения Буссинеска-Лява, определенного на графе. Проводится редукция к абстрактной задаче Коши для уравнения соболевского типа второго порядка. Получена теорема о фазовом пространстве исходного уравнения. В работе рассматривается оптимальное управление решениями начально-конечной задачи для линейного уравнения соболевского типа с (Ь,р)-секториаль-ным оператором Рассматривается начально-конечная задача для уравнения Буссинеска-Лява, моделирующего продольные колебания балки. Проводится редукция к абстрактной начально-конечной задаче для уравнения соболевского типа второго порядка. Получены теоремы об однозначной разрешимости исходной и абстрактной задач

Рис. 2. Пример текстов для анализа эффективности использования ТМ

возможен вариант самостоятельного поиска текста из той же предметной области и попытка его перевести, используя ту же память переводов.

Задание на сравнение переводов, выполненных с использованием ТМ. Задание аналогично предыдущему. Однако студенты получают несколько текстов из различных предметных областей. Задание может выполняться в нескольких вариантах.

Вариант 1: студентам предлагается воспользоваться созданной ранее памятью переводов и «опробовать» перевод текстов различной тематики с ее помощью.

Вариант 2: студентам предлагается составить самостоятельно корпусы текстов для предметных областей, которым посвящены выданные тексты для перевода, использовать их для создания памяти переводов. И далее переводить каждый текст, используя релевантную для него память переводов.

В итоге студентам предлагается сравнить полученные переводы текстов на предмет полезности памяти переводов для перевода каждого из них. В первом варианте, очевидно, использование памяти переводов для перевода текста из той же предметной области, для которой составлялась ТМ, будет более эффективным, чем при переводе текстов из других предметных областей. Во втором случае возможны варианты. В зависимости от близости текстов, используемых в качестве корпуса, тексту для перевода эффективность созданной ТМ может варьироваться. В каждом из вариантов студентам предлагается объяснить, с чем связана разница в эффективности применения ТМ.

Методика оценки

результатов обучения

Для проверки результатов обучения применению ТМ-программ мы разработали следующую методику, основанную на принципе накопления ошибки - оцениваются неверно выполненные задания по ряду критериев. Для итогового контроля при обучении в качестве критериев используются:

Умение работать с программным обеспечением;

Качество выполняемого перевода.

Проводить оценку по первому критерию

целесообразно с теоретической и практической стороны. Теоретическая сторона оценки осуществляется в форме мини-теста множественного выбора, который включает общие вопросы по технологии ТМ и конкретные во-

просы по изучаемым компьютерным программам. Неправильный ответ оценивается в один балл.

Практическая сторона состоит в оценке умения использовать функции изучаемой ТМ-программы при самостоятельном выполнении заданий различных типов, описанных ранее в данной статье. Результат оценивается по бинарной шкале (задание выполнено / не выполнено). В случае невыполнения задания -в накопительную оценку студента добавляется 2 балла.

Пороговым коэффициентом ошибки, при котором контрольное задание признается выполненным, является 40 % от максимально возможного количества баллов, начисленных за ошибки (что эквивалентно 60 % корректности результатов). Так, если проверка включает 4 вопроса теста и оценку выполнения 2 практических заданий, приемлемый коэффициент ошибки составляет 3 балла.

Для оценки по второму критерию существует множество подходов, такие как субъективный подход, сравнение с оригиналом по определенным параметрам и другие.

Мы предлагаем использовать подход на основе взвешивания ошибок , который применяется в различных переводческих компаниях как зарубежных, например Lionbridge, так и российских, например Logrus, Ра1ех. В основе этого подхода лежит классификация ошибок в зависимости от того, насколько каждая ошибка препятствует успешной коммуникации. Переводческим ошибкам присваиваются «веса» - числовые меры, характеризующие степень влияния ошибки на процесс восприятия текста сообщения. Более серьезные ошибки, искажающие смысл сообщения, оцениваются более высоко. На рис. 3 приведен классификатор ошибок для использования в обучении.

При проверке перевода подсчитывается количество ошибок каждого типа и рассчитывается индекс качества перевода TQI по следующей формуле:

TQI = (Е16 + Б2-2 + Е3 1) / W 1000, где Е1 - количество грубых ошибок, Е2 - количество средних ошибок, Е3 - количество незначительных ошибок, W - объем оригинального текста в словоупотреблениях.

Приемлемость перевода определяется пороговым значением коэффициента TQI, который может задаваться в зависимости от степени допустимости различных типов ошибок в переводе. Для учебных целей эмпирическим

Е1 (грубая ошибка) Е2 (средняя ошибка) E3 (незначительная ошибка)

Искажение смысла оригинала; неоправданный пропуск текста для перевода Неверный перевод термина; несогласованность терминологии в переводе; несоответствие глоссарию; несоответствие нормам языка цели Опечатки (например, отсутствие пробела)

Рис. 3. Классификатор ошибок

Рис. 4. Пример автоматизации при оценке качества перевода

путем мы установили допустимый коэффициент качества при итоговом контроле - менее 24 баллов, что эквивалентно 1 грубой ошибке или 3 средним ошибкам или 6 незначительным ошибкам на 250 словоупотреблений. Этот коэффициент может также использоваться для промежуточного контроля. Очевидно, что пороговое значение коэффициента можно ужесточать (уменьшать) с целью закрепления у студентов привычки стремиться к максимальной адекватности перевода или ослаблять (увеличивать) при оценке работы студентов на начальной стадии наработки навыков перевода с использованием ТМ.

Итоговый балл равен сумме баллов за умение работать с программным обеспечением и качество выполненного перевода. Чем меньше полученное число, тем результаты обучения успешнее. Мы рекомендуем составлять контрольно-измерительные материалы для итогового контроля таким образом, чтобы суммарный балл не менее чем на 80 % формировался на основе оценки критерия качества перевода. Так, при оценке умения работать с программным обеспечением с помощью 4 теоретических вопросов по использованию ТМ и 2 практических заданий по шкале «выполнил/не выполнил» и оценке качества одного текста перевода с помощью коэффициента TQI, допустимые коэффициенты ошибки распределяются в соотношении друг к другу 11 % (3 балла) и 89 % (24 балла).

Предложенная методика оценки результатов обучения имеет ряд преимуществ.

Работа каждого студента оценивается индивидуально. Студент может видеть типы своих ошибок и работать над их исправлением. Более того, оценку качества перевода можно использовать отдельно на занятиях по письменному переводу, предварительно настроив классификатор ошибок на предметную область или типы текстов.

Легко автоматизировать подсчет баллов по указанной методике. На рис. 4 приведен пример такой автоматизации при оценке качества перевода. Преподаватель заполняет электронную таблицу, указывая количество ошибок каждого типа. Общая оценка выводится автоматически.

Как уже отмечалось ранее, в крупных переводческих компаниях применяют схожие методики оценки работы переводчика. Таким образом, при использовании данной методики моделируются реальные условия труда переводчика, что позволять подготовить студентов к реальным требованиям рынка.

Заключение

В заключение отметим, что использование TM-программ, как и применение любых информационных технологий, может сталкиваться с трудностями, вызванными проблемой неприятия нового. Особенно остро такая проблема стоит в условиях ментальности современного российского общества . Вместе с тем, преодоление этого тормозящего фактора обусловлено веянием времени. По результатам исследования агентства переводов EnRus , одно из основных требований к перевод-

чику - наличие и умение пользоваться TM-программами. В связи с этим интеграция в учебный процесс методов и способов управления знаниями в программах памяти перевода на настоящий момент является вопросом конкурентоспособности будущего переводчика на рынке труда. Использование технологии памяти переводов в обучении, таким образом, является эффективным средством для выработки практических навыков у студентов и подготовки их к требованиям рынка.

Литература

1. Zhang, Y. Computer-aided translation teaching by means of modern information technology / Y. Zhang // 7th International Conference on Computer Science & Education (ICCSE). -Mudanjiang, 2012. - P. 1628-1632.

2. Поршнева, Е.Р. Подготовка профессиональных переводчиков в свете нового государственного стандарта / Е.Р. Поршнева, И.Ю. Зиновьева // Высшее образование в России. - 2011. - № 3. - С. 63-69.

3. Canovas, M. Open source software in translator training / M. Canovas, R. Samson // Tradumatica: traduccio i tecnologies de la in-formacio i la comunicacio. - 2011. - № 9. -P. 46-56.

4. Language and Machines - Computers in Translation and Linguistics: A LPA C report / National Academy of Sciences, National Research Council; John R. Pierce . - Washington, DC, 1966. - 138 p.

5. Arthern, P.J. Machine Translation and Computerized Terminology Systems: A Translator’s Viewpoint / P.J. Arthern // Translating and the Computer, Proceedings of a Seminar / ed.

B.M. Snell. - London; Amsterdam, 1978. -P. 77-108.

6. The Proper Place of Men and Machines in Language Translation: Research report CSL-80-11 / Xerox Palo Alto Research Center; Martin Kay. - Palo Alto, CA, 1980. - 21 p.

7. MT2007. - http://mt2007-cat.ru/.

8. ABBYY Aligner. - http://www.abbyy.ru/ aligner/.

9. Сайт компании PROMT. - http://www. promt.ru/.

10. Российский сайт Deja Vu X2. - http:// www.tmemory.ru/.

11. Сайт компании T-Сервис. - http:// www.tra-service.ru/.

12. Google Translator Toolkit. - http:// translate.google.com/toolkit.

13. Wordfast Anywhere. - http://www. freetm. com/.

14. Macklovitch, E. Two Types of Translation Memory / Elliott Macklovitch // Proceedings of the Twenty-Second International Conference Translating and the Computer 22 (16-17 November 2000). - London: Aslib, 2000. - 15 p.

15. Ильнер, А. О. Подготовка переводчиков в России и за рубежом: сравнительный анализ / А. О. Ильнер // Образование и наука. -2010. - № 8. - С. 65-70.

16. Li, Q. Application of CAT in Translation Teaching / Qingjun Li, Likun Zhang // 2010 Second International Workshop on Education Technology and Computer Science (ETCS). -Wuhan, 2010. - Vol. 2. - P. 559-562.

17. Зеевальд-Хег, Ю. Локализация программного обеспечения, информационнотехнологические требования к переводчику в эпоху глобализации /Ю. Зеевальд-Хег // Вестник Перм. нац. исследоват. политехн. ун-та. Социально-экономические науки. - 2012. -№ 16. - С. 85-96.

18. Frantzi, K. Automatic Recognition of Multi-Word Terms: the C-value/NC-value Method / K. Frantzi, S. Ananiadou, H. Mima // International Journal on Digital Libraries. - 2000. -№ 3. - P. 115-130.

19. Combining Linguistics with Statistics for Multiword Term Extraction: A Fruitful Association? / Gael Dias, Sylvie Guillore, Jean-Claude Bassano, Jose Gabriel Pereira Lopes // Proceedings of the 6th International Conference Computer-Assisted Information Retrieval (Recherche d"Informations Assistee par Ordinateur) (RIA0"2000) / ed. Joseph-Jean Mariani, Donna Harman. - France: College de France, 2000. -P. 1473-1491.

20. Chen, J. A Multi-word Term Extraction System / Jisong Chen, Chung-Hsing Yeh, Rowena Chau // Proceedings of 9th Pacific Rim International Conference on Artificial Intelligence 2006: Trends in Artificial Intelligence / ed. Q. Yang,

G. Webb. - Guilin, 2006. - Lecture Notes in Computer Science/ - Vol. 4099. - P. 1160-1165.

21. Sheremetyeva, S. On extracting multiword NP terminology for MT / S. Sheremetyeva // EAMT-2009: Proceedings of the 13th Annual Conference of the European Association for Machine Translation / ed. Lluis Marquez and Harold Somers (14-15 May 2009). - Barcelona, Spain: Universitat Politecnica de Catalunya, 2009. - P. 205-212.

22. Ruiz Yepes, G. Parallel corpora in

translator education / G. Ruiz Yepes // Redit. Revista Electronica de Didactica de la Traduccion y la Interpretacion. - 2011. - № 7. - P. 65-80.

23. Zheng, W. Design of a CAI System for Translation Teaching / Wang Zheng // Proceedings of International Conference CESM 2011, Part II / еd. S. Lin and X. Huang. - Wuhan, 2011. -P. 457-462.

24. Бабина, О.И. Использование корпуса текстов для обучения иностранному языку / О.И. Бабина // Современная высшая школа: Инновационный аспект. - Челябинск: Изд-во ЧГИ, 2008. - № 1. - С. 21-24.

25. Шереметьева, С.О. Об использовании программ обработки текста для обучения иностранным языкам / С. О. Шереметьева // Вестник ЮУрГУ. Сер. «Лингвистика». -2012. - Вып. 15. - № 25 (284). - С. 56-59.

26. Хомутова, Т.Н. Научный текст: лингвокогнитивный подход / Т.Н. Хомутова, О.И. Бабина // Вестник ЮУрГУ. Сер. «Лингвистика». - 2009. - Вып. 9. - № 25 (158). -

27. Madsen, B.N. Principles of a system for terminological concept modeling / B.N. Madsen,

H.E. Thomsen, C. Vikner // Proceedings of the 4th International Conference on Language Resources and Evaluation (Lisbon, Portugal). -Lisbon: ELRA, 2004. - P. 15-19.

28. Gluckstad, F.K. Terminological Ontology and Cognitive Processes in Translation / F.K. Gluckstad // Procedings of the 24th Pacific Asia Conference on Language, Information and Computation / ed. by Ryo Otoguro, Kiyoshi Ishi-kawa, Hiroshi Umemoto, Key Yoshimoto, Yasu-nari Harada (Sendai, Japan, 4-7 November 2010). - Sendai: Tohoku University, 2010. -P. 629-636.

29. Дюмин, Н.Ю. Автоматическое выравнивание слов как способ построение двуязычных лексиконов / Н.Ю. Дюмин // Лингвистика в контексте культуры: материалы V междунар. науч.-практ. конф. (Челябинск, 28-30 ноября 2012 г.) /под общ. ред. Е.В. Харченко. - Челябинск: Издат. центр ЮУрГУ, 2012. - С. 92-94.

30. Петросян, А.Э. Умственная «слепота» (корни невосприимчивости к новым идеям) / А.Э. Петросян // Социология науки и технологий. - 2012. - Т. 3, № 3. - С. 24-42.

31. Шахова, Н. Как найти хорошего переводчика / Н. Шахова // Российский форум переводчиков, СПб., 23-25 сент. 2011 г. -http://www.enrus.ru/ru/publications/TFRussia_ru s.pdf.

32. Тишин, Д. Оценка качества переводов от TQI к компетенциям / Д. Тишин. -http://www.slideshare.net/justm/tqi.

Бабина Ольга Ивановна, кандидат филологических наук, доцент, доцент кафедры лингвистики и межкультурной коммуникации, Южно-Уральский государственный университет, [email protected].

Осминин Павел Григорьевич, аспирант кафедры лингвистики и межкультурной коммуникации, Южно-Уральский государственный университет, [email protected].

Bulletin of the South Ural State University Series “Education. Pedagogy” ________________________________________2013, vol. 5, no. 3, pp. 98-108

TRANSLATION MEMORY IN TRANSLATORS’ EDUCATION

O.l. Babina, P.G. Osminin

unification in the text in target language) are shown. Some disadvantages of these computer programs (an ability to increase efficiency only within restricted domains in texts containing many repetitions, high price of the software, time for learning to use the software) are also mentioned. The use of translation memory software in education is grounded. Different types of tasks for students aimed at mastering their practical skills in using translation memory software are suggested. These tasks reflect a specific character of the translators’ work, which allows the alumni to gain competitive advantage at labor market. Procedure for evaluating training results is given. The results of the paper can be used for compiling academic guidelines for translators’ education.

Keywords: translation memory, professional education, translation, teaching translation, TM software.

Babina Olga, Candidate of Philology (PhD), Associate Professor, Associate Professor of the Chair of Linguistics and Intercultural Communication, South Ural State University (Chelyabinsk), babinaoi@ susu.ac.ru.

Osminin Pavel, postgraduate student of the Chair of Linguistics and Intercultural Communication, South Ural State University (Chelyabinsk), [email protected].

В.Н. Грабовский; Журнал практикующего переводчика "МОСТЫ" 2/2004

Статья рассказывает о новом инструменте переводчика – технологии Translation Memory (TM), благодаря которой осуществляется механизация переводческой деятельности.

Нейронные сети в работе переводчика

Теории машинного перевода, разрабатывавшиеся в вялотекущем режиме с незапамятных времен, с 1970-х годов получили серьезный импульс. Это было связано с существенными достижениями в области моделирования интеллектуальной деятельности. Помимо чисто научного интереса, это объяснялось возрастающей ролью межъязыковых коммуникаций в современном мире.

Кроме электронных словарей и словарей-разговорников, к середине 1990-х годов довольно большое распространение получили "электронные переводчики" (их стали называть технологией MT ). В принципе, "электронные переводчики" - это программы, которые могли обработать целый текст. Правда, на выходе получалось не совсем то, что надо, а если откровенно, то совсем не то. Для того, чтобы результат работы технологии MT стал действительно связным текстом, человеку приходилось немало поработать над ним.

Понятие “машинный перевод” стало общеизвестным. Довольно большое распространение у нас получили отечественные программы Stylus (сейчас она называется Promt и Сократ ). Впрочем, интерес к таких программам после периода первоначального любопытства постепенно снижался, и сейчас он невелик, даже несмотря на то, что их в значительной степени доработали. В настоящее время их используют в основном для знакомства с содержанием иноязычных сайтов в Интернете, а также для чтения и написания электронных писем на иностранном языке.

По большому счету, работа переводчика за столетия принципиально не изменилась. Да, появились компьютеры, этакие быстродействующие и удобные пишущие машинки. Да, появились "электронные переводчики". Однако при всем том, что технологии MT совершенствовались, они так и не стали инструментом, имеющим широкую сферу применения и позволяющим по-настоящему экономить время и силы.

Что такое технология Translation Memory

Новым инструментом переводчика стала технология Translation_Memory (TM). На Западе технология TM и созданный на ее базе инструментарий переводчика - Translation Memory Tools (TMT) - хорошо известны и широко применяются. Особенностью такой технологии является механизация переводческой деятельности, а не ее автоматизация в том виде, каком ее видели создатели технологии MT. Причем это более скромное, на первый взгляд, решение принесло практической пользы неизмеримо больше, чем глобальный замысел "электронных переводчиков".

Отличие от электронных словарей и других инструментов переводчика заключается в том, что типичная программа класса ТМ основана на нейронных сетях, которые способны в определенной степени моделировать работу человеческого мозга при обработке данных. Эти сети способны обучаться и анализировать сложные наборы данных, которые сложно обрабатывать с помощью линейных алгоритмов.

В этих программах используются размытый алгоритм, позволяющий отыскивать слова не только в их словарных формах, но и в других формах, например, в другом падеже. Кроме того, они могут находить словосочетания в другом порядке слов. Самоорганизующаяся искусственная нейронная сеть способна находить закономерности и определять взаимосвязи между ними. Программа сравнивает тот фрагмент, над которым вы сейчас работаете, с содержимым базы данных, и предоставляет эту информацию на дисплей. Она может установить, что данный фрагмент похож на аналогичный фрагмент, имеющийся в памяти системы, например, на 99%, на 74%, или даже на 20%.

Каждому переводчику знакомо ощущение, что фраза, над которой он сейчас бьется, уже где-то, когда-то встречалась, хотя бы в приблизительном виде. Причем попадалась либо в этом же материале, либо в каком-то другом, переводимом ранее. Прямо дежавю какое-то… Посмотреть бы ее, эту фразу, хотя бы для справки, чтобы толково сформулировать ту, над которой работаешь сейчас…

Начинаешь листать оригинал обратно, рыться на книжной полке. И часто бывало так, что искомая фраза действительно обнаруживалась. Чаще всего, когда уже поздно, уже после того, как работа над переводом закончена. Думается, в такую минуту все бы отдал за средство, которое помогло бы найти необходимый текст. Даже сейчас, когда печатаешь текст перевода с помощью компьютера, а не на пишущей машинке, всегда жаль переделывать то, что сочинялось с таким трудом. Давняя мечта переводчика - придумать какое-либо средство, которое бы освобождало от необходимости переводить одну и ту же фразу несколько раз.

Подобного рода идея лежит в основе создания технологии Translation Memory, или просто ТМ, на основе которой с конца 80-х - начала 90-х годов начали появляться более или менее работоспособные программы. По сути дела, такая программа представляет собой управляющую оболочку, которая работает с той или иной подключаемой базой данных (ТМ) и которую я бы назвал копилкой переводов. ТМ - это компьютеризированная версия большого картотечного шкафа, в котором хранится каждая фраза, которую вы когда-либо переводили, причем в паре - как на языке оригинала, так и перевода. Каждая такая пара называется билингва. Программа мгновенно напомнит вам, как эту фразу переводили в прошлый раз. Доступ к информации легкий и быстрый.

Обзор основных программ класса Translation Memory

В настоящее время на мировом рынке представлено несколько программных продуктов, использующих технологию ТМ. Они отличаются друг от друга, и порой существенно. Вместе с тем им всем присущи некоторые общие функциональные возможности.

Например, у них, как правило, предусмотрен текстовый редактор, имеющий два параллельных окна. Одно окно предназначено для текста оригинала, второе - для перевода. Когда в окно оригинала выводится исходный фрагмент текста (это может быть предложение, абзац, отдельное слово), начинается поиск аналогичного фрагмента в базе данных. Если в памяти оказался точно такой же фрагмент, он выводится в окно перевода автоматически. Если в точности такого же фрагмент не нашлось, но обнаружился какой-то похожий, то в окно программы выводится найденный фрагмент с указанием процента совпадения.

Переводчик редактирует предложенный программой текст перевода, приводя его в соответствие с оригиналом, посылает его в память базы данных и приступает к следующему. Если ничего не нашлось вообще, то переводчик переводит его с нуля, впечатывая текст в окошко перевода. Закончив работу над этим фрагментом, переводчик посылает его в память базы данных и приступает к следующему. Таким образом, пополнение ТМ происходит автоматически, по мере работы. Сразу после того, как билингва попала в ТМ, она становится доступной пользователю. Если ТМ-программа расположена на сетевом диске и с ней работают другие пользователи, то новая билингва сразу же становится доступной и для остальных переводчиков. После того, как фрагмент оригинала и фрагмент перевода отправлены в базу данных, в окно оригинала выводится следующий фрагмент.

Первую программу такого типа, получившую название Translation Manager, разработала фирма IBM. Вначале IBM использовала Translation Manager для собственных потребностей - для локализации (адаптации на иностранные языки) собственного программного обеспечения. Затем Translation Manager был предложен рынку в качестве коммерческого продукта, и некоторое время он был монополистом в этой области. Эта программа довольно проста в использовании, отличается быстродействием и обеспечивает хорошие возможности для индивидуальных настроек пользователя. Для каждой из трех основных функций предусмотрены отдельные окна - Translation, Translation Memory и Dictionary. В окне Translation Memory отображаются найденные в памяти соответствия, если они там есть, а в окно Dictionary выводится терминология из словарей, разработанных IBM. Есть в этой программе и некоторые неудобства, например, усложненная процедура поиска в копилке памяти (Translation Memory) отдельных слов.

Еще одна программа - SDLX - разработана для своих собственных потребностей английской компанией SDL , занимающейся локализацией программного обеспечения. Каждая программа, входящая в комплект, устанавливается отдельно. SDL Edit - это, собственно, сама программа, с помощью которой осуществляется перевод. В ней есть три окна, показывающие исходный текст, перевод и Translation Memory. Следует отметить, что документ для перевода нельзя импортировать непосредственно в SDL Edit. Сначала его необходимо преобразовывать при помощи SDL Convert, что является определенным неудобством.

Программа Déjà Vu пользуется у переводчиков в Европе популярностью благодаря своей гибкости и адаптивности. Помимо удобства, Déjà Vu отличается от других продуктов самым высоким соотношением цена/качество. По сравнению с двумя предыдущими программами рассматриваемый продукт имеет ряд удобных возможностей. Специалисты отмечают, что с самого начала эта программа разрабатывалась в контакте с ее будущими пользователями. Известно, что последняя версия Déjà Vu тестировалась, в частности, российскими переводчиками. Один из них, Андрей Герасимов, написал положительную рецензию на эту программу в журнале MultiLingual Computing & Technology

Известна в нашей стране и популярная в Европе программа STAR Transit . По своей идеологии она совершенно не похожа на другие продукты рассматриваемого класса. Вы уже получили определенное представление о них, и знаете, что все они имеют центральную базу данных большой емкости, копилку переводов, в которой нужные данные обнаруживаются мгновенно (если они там есть, конечно). Как сказал бы Билл Гейтс: "Information at your fingertips". Так вот, все программы Translation Memory имеют электронный каталожный шкаф, а Transit - не имеет. У него все по-другому. Исходные данные и перевод сохраняются в текстовом формате в виде файлов, которые переводчик размещает в директориях по своему усмотрению. Затем переводчик может просто указать программе, какие директории и даже какие файлы ему необходимы. Затем Transit формирует ассоциативную сеть ссылок, с которой и ведется работа. Несмотря на отдельные плюсы, в России Transit не получил широкого распространения. В конечном счете Promt, официальный дистрибьютор Transit, переключился на дистрибуцию Translator’s Workbench фирмы Trados.

А вот Translator’s Workbench, или просто Традос, быстро получил широкое распространение в России, сначала среди переводческих фирм, а затем и среди индивидуальных переводчиков. Наверное, это можно объяснить тем, что он дает возможность работать, не выходя из Word’a, что психологически комфортней. Кому приятно смотреть на текст, испещренный всевозможными кодами в квадратных скобках? Translator’s Workbench (Традос) по сравнению с другими программами более удобен для обычного переводчика, который не является специалистом по программированию, он более понятен по сравнению с остальными программами подобного типа. В частности, кнопки управления снабжены всплывающими подсказками. Находясь в знакомом и понятном Word’е, можно использовать все его инструменты (например, автотексты).

Данный продукт обладает полным набором полезных инструментов, которые в остальных программах присутствуют лишь в той или иной степени. Одним из таких инструментов является Analise, позволяющий заранее проанализировать текст оригинала и выяснить, есть ли там (и в каком количестве) полные и неполные совпадения. Стоит упомянуть и такую удобный инструмент, как Placeables, позволяющую, например, автоматически менять цифры в тексте, если все остальное в переводимом фрагменте совпадает с обнаруженным в копилке переводов (ТМ). Очень удобна автоматическая функция замены в цифрах десятичных точек и/или запятых, формата времени, аббревиатур и т.д. на соответствующие параметры, задаваемые переводчиком.

Подавляющее большинство российских переводчиков, использующих технологию TM, предпочитают Translator’s Workbench (Традос).

Что общего у программ Translation Memory

Резюмируя описание основных программных продуктов класса Translation Memory, следует отметить наличие у них, как правило, ряда общих функциональных возможностей.

Сведение - Alignment

Эта функция позволяет создавать копилки переводов (ТМ) из существующих файлов. Из двух файлов - один с текстом оригинала, а другой с текстом перевода - создается набор билингв. Напротив предложения исходного текста выстраивается его перевод. И так по всем файлам, которые переводчик свел в единую копилку. Степень удобства функции совмещения у разных программ различная.

Обслуживание – Maintenance

По мере накопления в базе данных билингв их количество может увеличиться настолько, что содержимое базы может выйти за все пределы. Могут обнаружиться какие-то неточности и даже ошибки, особенно если программа используется в сети многими пользователями. Возникнет необходимость что-то отредактировать или уточнить, а то и просто удалить. Справедливости ради надо сказать, что упомянутое средство обслуживания программ до конца эту проблему не решает - бороться на практике с засорением копилок переводов все равно затруднительно.

Терминологический словарь - Terminology Program

Все рассматриваемые программы имеют свои терминологические словари, являющиеся по сути известными всем электронными словарями. Терминологические словари могут импортировать файлы в формате словарей или глоссариев, их можно пополнять и вручную.

Текстовый редактор - Document Editor

Здесь, собственно, и осуществляется процесс перевода. Для этого у всех программ предусмотрены упоминавшиеся выше два окна - для исходного текста и для его перевода. У всех текстовых редакторов есть возможность устанавливать в процентах степень сходства между переводимым в данный момент исходным текстом и текстом в копилке переводов. Чем выше вы установите процент сходства, например, 90% или 95%, тем меньше вероятность обнаружения там подходящего текста. Однако можно установит процент поменьше, тогда может набраться немало материала, который был бы полезен хотя бы для справки.

Конкорданс (Связка словоупотребления с контекстом) - Concordance

Это очень полезная функция всех рассматриваемых программ. Нередко бывает, что какой-то термин (или сочетание терминов) может иметь несколько значений или оттенков значений. Выделив термин, можно просмотреть в окне все билингвы, имеющиеся в копилке, причем в самых разных контекстах. Это всегда облегчает выбор наиболее точного варианта перевода данного термина или сочетания.

Наталья Шахова, директор агентства EnRus, считает что большинство TM-продуктов избавляют пользователя от необходимости знакомиться с различными текстовыми процессорами. Достаточно изучить особенности текстового редактора самого продукта, и вам станет подвластно все разнообразие текстов, будь они представлены в QuarkXPress, FrameMaker или Adobe Illustrator. Здесь есть, конечно, некоторый подвох: для того чтобы освоить очередной текстовый процессор или издательскую систему, вам понадобится соответствующая программа-фильтр, которая - что? Правильно - продается за отдельные деньги! Вообще денежный вопрос самый серьезный, когда речь идет о TMT. Стоят они недешево (как правило, несколько сотен долларов), совместимости, понятное дело, нет. Поэтому если вы приобрели (и освоили!) какой-либо продукт для одного проекта, то для следующего может потребоваться приобрести другой продукт и снова тратить время на его изучение.

Далее Наталья Шахова отмечает, что на Западе уже вовсю обсуждают последствия повсеместного распространения таких программ. Одно из них заключается в том, что переводчик-новичок теряет возможность выйти на рынок. Точно так же, как в России уже очень трудно получить заказ переводчику, если у него нет компьютера и принтера, так и за границей возникают проблемы трудоустройства у переводчиков, не имеющих TM-программы. У этого явления есть и положительная сторона - нанимая на работу владельца TM-программы, заказчик получает некоторую гарантию его профессионализма. Но ведь и новички должны иметь возможность стартовать!

Отношение к технологии Translation Memory в нашей стране разное.

Когда в 1999 году бюро переводов "Фонетикс" начало работать с Trados Translator’s Workbench, то естественно, в ходе контактов с заказчиками мы рассказывали о переходе на новую технологию. Вопреки ожиданиям, реакция была настороженной, а порой и просто отрицательной. Оказалось, что идея машинного перевода была уже скомпрометирована бездумным применением в 90-х годах программ типа Stylus и Socrat. Причем их нередко использовали переводчики, скажем, не очень высокой квалификации, которые не утруждали себя редактированием того, что выдавали "электронные переводчики". Впрочем, пользователей этих программ тоже можно понять - редактирование этих текстов требовало много времени и сил.

Даже сейчас порой можно встретить со стороны заказчиков из числа российских организаций настороженное отношение к любым новациям в сфере программного обеспечения для переводов. Вместе с тем иностранные фирмы, наоборот, требуют применения программ класса Translation Memory. Зачастую у них есть сложившиеся предпочтения, в основном это Trados Translator’s Workbench, а также Star Transit. У них нередко имеются готовые ТМ (копилки переводов), которые они предлагают использовать.

Что касается переводчиков, то они испытывают к технологии Translation Memory вполне понятный интерес. Еще более понятный интерес испытывают к ним бюро переводов. Они имеют дело не столько с художественной литературой, публицистикой, поэзией и т.д., сколько с инструкциями по эксплуатации, руководствами по поиску и устранению неисправностей, а также с локализацией программного обеспечения, т.е. с теми материалами, где имеются повторяющиеся или схожие фрагменты текста.

В своем нынешнем виде программы Translation Memory, по-видимому, достигли потолка. Дальнейшая работа по их доработке идет по пути совершенствования их существующих функциональных возможностей. Это ведет к тому, что программы становятся все более громоздкими и сложными, и это при том, что каких-то принципиально новых идей там нет. Тот же Translator’s Workbench (Традос) в своей последней версии оброс таким набором инструментов, что простому пользователю разобраться в них очень сложно.

Эксплуатация этой программы предполагает наличие в штате бюро переводов отдельного сотрудника. Помимо руководства пользователя, в документации предусмотрено руководство для выделенного специалиста (TRADOS Specialist Guide). Кроме этого в пакет документации входит Project Management Guide, MultiTerm User Guide и WinAlign User Guide. Даже у подготовленного переводчика на ознакомление с сотнями страниц этих документов потребуется много сил и времени.

Поиском новых решений занимается группа исследователей в университете Мэрилэнд, округ Балтимор (США), под руководством профессора С.Ниренбурга, известного специалиста в области искусственного интеллекта и машинного перевода. Пока разработки находятся на стадии теоретических исследований, и скорее всего, доведение этих исследований до стадии коммерческого продукта потребует значительного времени.

Обращает на себя внимание то обстоятельство, что на рынке инструментов переводчика работают в основном зарубежные фирмы. Хотелось бы надеяться, что это не будет продолжаться вечно. Потенциал теоретических разработок российских специалистов в области семантического анализа очень большой. Наши исследования в этой области достигли весьма высокого уровня. Есть все основания рассчитывать, что эти разработки будут материализованы в виде принципиально новых лингвистических технологий, которые позволят в полной мере раскрыть творческий потенциал переводчика.

Журнал практикующего переводчика «Мосты», одно из немногих профессиональных периодических изданий для переводчиков. В журнале публикуются статьи переводчиков различных специальностей, как устных, так и письменных. На страницах журнала переводчики, специализирующиеся в различных областях знаний, имеют возможность обсуждать актуальные проблемы, полемизировать друг с другом, делиться секретами профессионального мастерства.

В наш век стремительного развития информационных технологий и невиданного до сих пор тесного взаимодействия самых, казалось бы, отдалённых культур потребность в предоставлении быстрых и качественных переводческих услуг становится особенно актуальной. И не удивительно, что сфера письменного перевода , считавшаяся до недавнего времени территорией приложения исключительно человеческого интеллекта, с появлением уже первых компьютеров начала медленно, но заметно видоизменяться. И не могло быть иначе, ведь облегчение труда и постоянный поиск новых решений заложен в самой сути человека.

Как это часто бывает, технический прогресс в сфере коммуникаций не только поставил перед человечеством новые задачи, но и принёс с собой средства для их решения. В сфере письменных переводов одним из таких решений стала технология под названием Translation Memory (ТМ) и использующие её средства автоматизированного перевода (CAT - computer assisted translation) .

Важно заметить, что средства автоматизированного перевода ни в коем случае нельзя путать с машинным переводом. Это два совершенно разных подхода к автоматизации перевода компьютерными средствами, две совершенно разные «философии» переводческого процесса. В случае машинного перевода весь перевод - от начала и до конца - делает машина, компьютер, используя для этого имеющиеся в её распоряжении словари и алгоритмы перевода. Как следствие, результат такой работы далёк от того, что можно назвать «качественным переводом» ровно по той причине, что искусственный интеллект до сих не изобретен человечеством. Во втором же случае речь идёт только об инструментах , облегчающих и ускоряющих традиционный процесс человеческого перевода , который выполняется и контролируется непосредственно переводчиком. Бюро переводов «ЛингваКонтакт» никогда не занималось и не занимается машинным переводом.

Translation Memory (TM) или «память переводов» (ПП) представляет собой базу данных, где хранятся все ранее выполненные переводы с её использованием. Для удобства переводчика программы, использующие технологию Translation Memory, разбивают переводимый текст на так называемые сегменты - фрагменты текста, оригинал и перевод которых и хранится в памяти. За единицу сегментирования (минимальную единицу перевода) такие программы обычно принимают предложение или часть сложноподчинённого предложения, но в зависимости от настроек ею также могут быть слово, фраза либо целый абзац.

Принцип работы большинства средств автоматизированного перевода прост. Во время перевода программа, во-первых, «запоминает» все переводы сегментов, подтверждённые переводчиком, а во-вторых, постоянно сверяет каждый новый непереведённый сегмент с уже имеющимися в памяти переводов и в случае обнаружения идентичного или похожего сегмента «напоминает» его перевод. Таким образом, переводчику остаётся только подтвердить предложенный программой перевод или исправить/дополнить его в соответствии с контекстом.

Кроме собственно создания и работы с памятью переводов, современные программы автоматизированного перевода позволяют:

Создавать и использовать глоссарии и словари пользователей;

Создавать памяти переводов из пар уже ранее переведенных текстов без использования средств автоматизированного перевода;

Проводить анализ текста и делать выборку из его ключевых слов, которые потом можно добавлять в глоссарии;

Осуществлять так называемый «предварительный перевод» (pretranslation) на основе уже имеющихся баз ПП.

Наиболее эффективно применение данной технологии для перевода:

Больших проектов, содержащих много однотипных фрагментов и терминов: разного рода научных и технических текстов, документаций , финансовых и юридических текстов ;

Одного проекта группой из нескольких переводчиков - в этом случае технология ПП (облачная) позволяет добиться единообразия терминологии и стиля;

Новых версий уже ранее переведённых текстов - это значительно сокращает время на поиск и перевод новых фрагментов;

В то же время эта технология оказывается практически бесполезной при переводе художественных , публицистических и рекламных текстов. Другими словами, всего того, что требует творческого подхода и незаурядных решений.

Вот так выглядит интерфейс SDL Trados, интегрированной в MS Word:

Краткий обзор основных средств автоматизированного перевода

Сегодня на рынке представлено несколько десятков программ, поддерживающих работу с технологией Translation Memory. Самыми известными из них являются SDL Trados , Déjà vu , Wordfast , MultiTrans , STAR Transit и Omega-T . Кроме самого очевидного - цены (например, программа Omega-T является полностью бесплатной) - эти программные среды отличаются:

Интерфейсом редактирования текста: некоторые программы интегрируются в MS Word (например, все версии SDL Trados до версии SDL Trados 2007 включительно), другие же имеют свой собственный интерфейс;

Алгоритмами разбиения текста на сегменты (сегменты состоят из предложений, фраз или слов);

Наличием дополнительных функций (например, в программе MemoQ, в отличии от других, существует возможность оценки в процентном отношении однородности текста, т.е. наличия в нём повторяющихся элементов на уровне слов и фраз);

Возможностью интеграции средств машинного перевода;

Количеством поддерживаемых форматов файлов;

Наличием возможности работать с памятью переводов в режиме он-лайн.

Выбор CAT-программы часто зависит больше от личных предпочтений переводчика или требований бюро переводов, с которым он сотрудничает (к примеру, многие западные бюро переводов работают с форматом TTX, а он полноценно поддерживается только средой SDL Trados).

Переводчики бюро переводов «ЛингваКонтакт» знают и владеют на высоком уровне самыми распространенными CAT-инструментами. Кроме того, в нашем арсенале «помощников переводчика» есть не только средства работы с памятью переводов, но также и множество других программ и утилит (инструменты Quality Assurance, создание терминологических баз, межформатная конвертация и пр.), без которых едва ли можно добиться высокого качества и скорости работы. На счету «ЛингваКонтакт» десятки тысяч переведённых страниц с использованием TM-средств!

Вы можете быть уверены, что Ваш текст будет переведён качественно и в срок, в каком бы формате и какой бы сложности он ни был!

«Память переводчика», или Что такое Translation Memory. Как настроить систему Тranslation Memory Программы для распознавания текста

Описание

Популярные программные системы ПП

Стандарты и форматы памяти переводов

Преимущества и недостатки

Преимущества

Недостатки

См. также

Литература

Ссылки

Скачивание или загрузка памяти переводов

Привязка ТМ

Совместное использование ТМ

Применение памяти переводов через предварительный перевод

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы - Бабина Ольга Ивановна, Осминин Павел Григорьевич

Похожие темы научных работ по компьютерным и информационным наукам, автор научной работы - Бабина Ольга Ивановна, Осминин Павел Григорьевич

Текст научной работы на тему «Память переводов в обучении переводчиков»

Краткий обзор основных средств автоматизированного перевода

«Память переводчика», или Что такое Translation Memory. Как настроить систему Тranslation Memory Программы для распознавания текста

Описание

Популярные программные системы ПП

Стандарты и форматы памяти переводов

Преимущества и недостатки

Преимущества

Недостатки

См. также

Литература

Ссылки

Скачивание или загрузка памяти переводов

Привязка ТМ

Совместное использование ТМ

Применение памяти переводов через предварительный перевод

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы - Бабина Ольга Ивановна, Осминин Павел Григорьевич

Похожие темы научных работ по компьютерным и информационным наукам, автор научной работы - Бабина Ольга Ивановна, Осминин Павел Григорьевич

Текст научной работы на тему «Память переводов в обучении переводчиков»

Краткий обзор основных средств автоматизированного перевода

Статьи по теме