OmegaT

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
OmegaT
Логотип программы OmegaT
Скриншот программы OmegaT
OmegaT 1.6.0 в Windows XP
Тип Автоматизированный перевод, Память переводов
Разработчик Алесь Булойчик (ведущий разработчик)
Написана на Java
Операционная система с поддержкой нужной Java
Первый выпуск 2002
Аппаратная платформа Java Virtual Machine
Последняя версия 4.3.2 (26 января 2020)
Бета-версия 5.2.0 (26 января 2020)
Репозиторий github.com/omegat-org/om…
Лицензия GPLv3+[1]
Сайт www.omegat.org
Логотип Викисклада Медиафайлы на Викискладе

OmegaT — система автоматизированного перевода, поддерживающая память переводов, написана на языке Java. Возможности продукта включают сегментацию исходного текста на основе регулярных выражений, использование точных (англ. exact) и неточных (англ. fuzzy) соответствий с уже переведёнными фрагментами, использование словарей, поиск контекстов в базах данных переводов и работу с ключевыми словами.

Начиная с версии 2.04 OmegaT также может переводить текущий абзац текста через Google Translate.

Для работы OmegaT требуется версия Java Runtime Environment (JRE) версии 1.8, которая доступна для ОС Linux, Mac OS X и Microsoft Windows, Windows NT. Может работать с OpenJDK.

История и разработка

[править | править код]

Разработка OmegaT была начата Китом Годфри (англ. Keith Godfrey). Оригинальный движок был написан в 2000 году на C++. Но релиз, опубликованный в феврале 2001, был написан уже на Java. Начиная с 2002 года разработку и поддержку программы осуществляет сообщество Omegat[2].

Первая Java-версия имела свой собственный формат памяти переводов и требовала для работы Java 1.3. Она поддерживала документы StarOffice, а также тексты в обычной и Unicode-кодировке и HTML. Текст сегментировался на блоки (на практике это обычно означало сегментацию на абзацы). Однако в версии 1.6 было добавлено настраиваемое сегментирование на предложения, что сделало работу с программой значительно удобнее. В качестве формата памяти переводов начиная с версии 1.4b level2 используется стандартный .TMX.

В 2005 году в версии 1.6 появилось сегментирование по предложениям.

В версии 1.8 (2008 год) добавилась проверка орфографии.

Возможность создания плагинов добавлена в 2009 году в версии 2.0[2].

В версиях с 1.4.4 по 1.6.0 главным разработчиком был Максим Михальчук. В версиях до 1.7.1 релиз-менеджером был Генри Пейфферс (англ. Henry Pijffers). В настоящее время ведущим разработчиком является Алесь Булойчик. Менеджер проекта OmegaT — Эрон Медлон-Кэй (англ. Aaron Madlon-Kay)[3].

Поддерживаемые форматы

[править | править код]

OmegaT поддерживает разнообразные форматы исходных документов.

Непосредственно поддерживаемые форматы

[править | править код]

С файлами старых проприетарных форматов Microsoft Office (Word, Excel и PowerPoint) OmegaT не может работать непосредственно, их необходимо перевести в формат OpenDocument (например, с помощью OpenOffice.org) или Microsoft Open XML с помощью Microsoft Office 2007/2010.

Поддержка XLIFF

[править | править код]

Программа Rainbow из фреймворка Okapi может конвертировать некоторые файловые форматы в формат XLIFF, который поддерживает OmegaT.

Также Rainbow может создать для таких документов все каталоги проекта OmegaT, чтобы облегчить их обработку в OmegaT[4].

Поддержка файлов .ttx для Trados®

[править | править код]

Используя фильтр Okapi TTX можно обрабатывать файлы .ttx Trados®.

Локализация OmegaT

[править | править код]

Пользовательский интерфейс и документация OmegaT переведены на 30 языков.

Переводчики-добровольцы могут перевести пользовательский интерфейс, краткое руководство «Быстрый старт» или всё руководство пользователя (либо все три компонента).

Все языковые файлы и переводы руководства пользователя включены в стандартную поставку OmegaT.

Программное обеспечение, созданное на основе OmegaT

[править | править код]

Набор программ для перевода Autshumato

[править | править код]

Autshumato состоит из инструмента автоматизированного перевода текста, выравнивателя, PDF-экстрактора, редактора TMX и открытой памяти переводов, основанной на собранных данных

В итоговую версию будут включены менеджер терминологии и машинный переводчик.

Элемент инструмента автоматизированного перевода текста построен на основе OmegaT, для запуска требуется также наличие OpenOffice.org.

Разработка финансируется правительственным Департаментом искусств и культуры Южно-Африканской Республики[5].

Benten — редактор XLIFF на основе Eclipse.

Использует код OmegaT для обработки процесса нахождения совпадений в памяти переводов.

Частично финансируется правительством Японии[6].

Boltran — это автономное веб-приложение для автоматизированного перевода текста, которое имитирует работу с проектом OmegaT.

Создано на основе исходного кода OmegaT, и потому способно переводить всё, что может переводить OmegaT.

Имеет практически идентичные OmegaT управление глоссарием и возможности по нечёткому совпадению.

В настоящее время доступен только сервер Boltran на веб-сайте разработчиков. Однако в теории любой желающий может настроить открытый или закрытый сервер Boltran[7].

OmegaT+ — система автоматизированного перевода, которая является ответвлением OmegaT версии 1.4.5 в 2005 году. Принцип работы такой же, что и в OmegaT. Имеются свои возможности, но проекты не совместимы с OmegaT[8].

OmegaT в Генеральном директорате по переводу Европейской комиссии

[править | править код]

Генеральный директорат по переводу Европейской комиссии (DGT) использует OmegaT в качестве альтернативного инструмента автоматизированного перевода наряду с основным коммерческим инструментом. DGT поддерживает форк OmegaT (DGT-OmegaT) с адаптациями, улучшениями и новыми функциями, которые отвечают требованиям DGT, а также ряд вспомогательных приложений для интеграции OmegaT в свой рабочий процесс: мастер по автоматизации создания, обновления, пересмотра и доставки проектов, утилиту Tagwipe для очистки лишних тегов в документах docx и утилиту TeamBase для совместного использования памяти в режиме реального времени. Эти приложения предоставляются DGT как бесплатное программное обеспечение с открытым исходным кодом.[9]

Примечания

[править | править код]
  1. http://omegat.sourceforge.net/manual-standard/en/appendix.legal.notices.html Архивная копия от 28 сентября 2016 на Wayback Machine - Приложение 1 к документации
  2. 1 2 Dublin Computational Linguistic Research Seminars Didier Briel (June 2012). Дата обращения: 21 января 2017. Архивировано 14 октября 2015 года.
  3. О проекте. Дата обращения: 2 октября 2016. Архивировано 11 октября 2016 года.
  4. Okapi Framework Архивная копия от 2 февраля 2012 на Wayback Machine – Утилита извлечения текста может создать дерево каталогов проекта OmegaT
  5. Autshumato. Дата обращения: 16 марта 2013. Архивировано 11 ноября 2009 года.
  6. Benten. Дата обращения: 16 марта 2013. Архивировано 12 января 2012 года.
  7. Boltran. Дата обращения: 22 ноября 2013. Архивировано 1 января 2022 года.
  8. OmegaT+. Дата обращения: 16 марта 2013. Архивировано 7 февраля 2010 года.
  9. DGT-OmegaT project, a fork of OmegaT, developed by the Directorate-General for Translation of the European Commission. Дата обращения: 14 апреля 2019. Архивировано 13 мая 2021 года.