OmegaT
OmegaT | |
---|---|
| |
Тип | Автоматизированный перевод, Память переводов |
Разработчик | Алесь Булойчик (ведущий разработчик) |
Написана на | Java |
Операционная система | с поддержкой нужной Java |
Первый выпуск | 2002 |
Аппаратная платформа | Java Virtual Machine |
Последняя версия | 4.3.2 (26 января 2020) |
Бета-версия | 5.2.0 (26 января 2020) |
Репозиторий | github.com/omegat-org/om… |
Лицензия | GPLv3+[1] |
Сайт | www.omegat.org |
Медиафайлы на Викискладе |
OmegaT — система автоматизированного перевода, поддерживающая память переводов, написана на языке Java. Возможности продукта включают сегментацию исходного текста на основе регулярных выражений, использование точных (англ. exact) и неточных (англ. fuzzy) соответствий с уже переведёнными фрагментами, использование словарей, поиск контекстов в базах данных переводов и работу с ключевыми словами.
Начиная с версии 2.04 OmegaT также может переводить текущий абзац текста через Google Translate.
Для работы OmegaT требуется версия Java Runtime Environment (JRE) версии 1.8, которая доступна для ОС Linux, Mac OS X и Microsoft Windows, Windows NT. Может работать с OpenJDK.
История и разработка
[править | править код]Разработка OmegaT была начата Китом Годфри (англ. Keith Godfrey). Оригинальный движок был написан в 2000 году на C++. Но релиз, опубликованный в феврале 2001, был написан уже на Java. Начиная с 2002 года разработку и поддержку программы осуществляет сообщество Omegat[2].
Первая Java-версия имела свой собственный формат памяти переводов и требовала для работы Java 1.3. Она поддерживала документы StarOffice, а также тексты в обычной и Unicode-кодировке и HTML. Текст сегментировался на блоки (на практике это обычно означало сегментацию на абзацы). Однако в версии 1.6 было добавлено настраиваемое сегментирование на предложения, что сделало работу с программой значительно удобнее. В качестве формата памяти переводов начиная с версии 1.4b level2 используется стандартный .TMX.
В 2005 году в версии 1.6 появилось сегментирование по предложениям.
В версии 1.8 (2008 год) добавилась проверка орфографии.
Возможность создания плагинов добавлена в 2009 году в версии 2.0[2].
В версиях с 1.4.4 по 1.6.0 главным разработчиком был Максим Михальчук. В версиях до 1.7.1 релиз-менеджером был Генри Пейфферс (англ. Henry Pijffers). В настоящее время ведущим разработчиком является Алесь Булойчик. Менеджер проекта OmegaT — Эрон Медлон-Кэй (англ. Aaron Madlon-Kay)[3].
Поддерживаемые форматы
[править | править код]OmegaT поддерживает разнообразные форматы исходных документов.
Непосредственно поддерживаемые форматы
[править | править код]Формат файлов | Расширение файлов |
---|---|
Обычные текстовые форматы | |
ASCII-текст, закодированный текст | .txt, *.utf8 и др. |
Пакеты ресурсов Java | *.properties |
PO-файлы для библиотеки интернационализации gettext | *.po |
INI-файлы («Ключ=Значение») | *.ini |
Файлы DTD | *.dtd |
Файлы DokuWiki, MediaWiki | *.txt, *.utf8 |
Файлы субтитров SubRip[англ.] | *.srt |
Magento CE Locale CSV | *.csv |
Текстовые форматы с разметкой | |
OpenDocument (OpenOffice.org / StarOffice / LibreOffice) | *.odt, *.ott, *.ods, *.ots, *.odp, *.otp |
Microsoft Open XML | *.docx, *.xlsx, *.pptx |
HTML/XHTML | *.html, *.xhtml,*.xht |
HTML Help Compiler | *.hhc, *.hhk |
DocBook | *.xml |
Одноязычные XLIFF-файлы Okapi | *.xlf, *.xliff, *.sdlxliff |
QuarkXPress CopyFlowGold | *.tag, *.xtg |
Файлы ResX | *.resx |
Ресурсы Android | *.xml |
LaTeX | *.tex, *.latex |
Файлы справки | *.xml, *.hmxp |
Typo3 LocManager | *.xml |
Файлы локализации WiX | *.wxl |
Iceni Infix | *.xml |
Экспорт Flash XML | *.xml |
Wordfast TXML | *.txml |
Camtasia for Windows | *.camproj |
Файлы изображений SVG | *.svg |
С файлами старых проприетарных форматов Microsoft Office (Word, Excel и PowerPoint) OmegaT не может работать непосредственно, их необходимо перевести в формат OpenDocument (например, с помощью OpenOffice.org) или Microsoft Open XML с помощью Microsoft Office 2007/2010.
Поддержка XLIFF
[править | править код]Программа Rainbow из фреймворка Okapi может конвертировать некоторые файловые форматы в формат XLIFF, который поддерживает OmegaT.
Также Rainbow может создать для таких документов все каталоги проекта OmegaT, чтобы облегчить их обработку в OmegaT[4].
Поддержка файлов .ttx для Trados®
[править | править код]Используя фильтр Okapi TTX можно обрабатывать файлы .ttx Trados®.
Локализация OmegaT
[править | править код]Пользовательский интерфейс и документация OmegaT переведены на 30 языков.
Переводчики-добровольцы могут перевести пользовательский интерфейс, краткое руководство «Быстрый старт» или всё руководство пользователя (либо все три компонента).
Все языковые файлы и переводы руководства пользователя включены в стандартную поставку OmegaT.
Программное обеспечение, созданное на основе OmegaT
[править | править код]Набор программ для перевода Autshumato
[править | править код]Autshumato состоит из инструмента автоматизированного перевода текста, выравнивателя, PDF-экстрактора, редактора TMX и открытой памяти переводов, основанной на собранных данных
В итоговую версию будут включены менеджер терминологии и машинный переводчик.
Элемент инструмента автоматизированного перевода текста построен на основе OmegaT, для запуска требуется также наличие OpenOffice.org.
Разработка финансируется правительственным Департаментом искусств и культуры Южно-Африканской Республики[5].
Benten
[править | править код]Benten — редактор XLIFF на основе Eclipse.
Использует код OmegaT для обработки процесса нахождения совпадений в памяти переводов.
Частично финансируется правительством Японии[6].
Boltran
[править | править код]Boltran — это автономное веб-приложение для автоматизированного перевода текста, которое имитирует работу с проектом OmegaT.
Создано на основе исходного кода OmegaT, и потому способно переводить всё, что может переводить OmegaT.
Имеет практически идентичные OmegaT управление глоссарием и возможности по нечёткому совпадению.
В настоящее время доступен только сервер Boltran на веб-сайте разработчиков. Однако в теории любой желающий может настроить открытый или закрытый сервер Boltran[7].
OmegaT+
[править | править код]OmegaT+ — система автоматизированного перевода, которая является ответвлением OmegaT версии 1.4.5 в 2005 году. Принцип работы такой же, что и в OmegaT. Имеются свои возможности, но проекты не совместимы с OmegaT[8].
OmegaT в Генеральном директорате по переводу Европейской комиссии
[править | править код]Генеральный директорат по переводу Европейской комиссии (DGT) использует OmegaT в качестве альтернативного инструмента автоматизированного перевода наряду с основным коммерческим инструментом. DGT поддерживает форк OmegaT (DGT-OmegaT) с адаптациями, улучшениями и новыми функциями, которые отвечают требованиям DGT, а также ряд вспомогательных приложений для интеграции OmegaT в свой рабочий процесс: мастер по автоматизации создания, обновления, пересмотра и доставки проектов, утилиту Tagwipe для очистки лишних тегов в документах docx и утилиту TeamBase для совместного использования памяти в режиме реального времени. Эти приложения предоставляются DGT как бесплатное программное обеспечение с открытым исходным кодом.[9]
См. также
[править | править код]Примечания
[править | править код]- ↑ http://omegat.sourceforge.net/manual-standard/en/appendix.legal.notices.html Архивная копия от 28 сентября 2016 на Wayback Machine - Приложение 1 к документации
- ↑ 1 2 Dublin Computational Linguistic Research Seminars Didier Briel (June 2012) . Дата обращения: 21 января 2017. Архивировано 14 октября 2015 года.
- ↑ О проекте . Дата обращения: 2 октября 2016. Архивировано 11 октября 2016 года.
- ↑ Okapi Framework Архивная копия от 2 февраля 2012 на Wayback Machine – Утилита извлечения текста может создать дерево каталогов проекта OmegaT
- ↑ Autshumato . Дата обращения: 16 марта 2013. Архивировано 11 ноября 2009 года.
- ↑ Benten . Дата обращения: 16 марта 2013. Архивировано 12 января 2012 года.
- ↑ Boltran . Дата обращения: 22 ноября 2013. Архивировано 1 января 2022 года.
- ↑ OmegaT+ . Дата обращения: 16 марта 2013. Архивировано 7 февраля 2010 года.
- ↑ DGT-OmegaT project, a fork of OmegaT, developed by the Directorate-General for Translation of the European Commission. Дата обращения: 14 апреля 2019. Архивировано 13 мая 2021 года.
Ссылки
[править | править код]- omegat.org — официальный сайт OmegaT
- Страница проекта на SourceForge — Свежие версии программы
- omegat@yahoogroups.com — Форум пользователей
- wtigga.com — Обзор и краткое руководство программы версии 4.1.1