JP2017510924A - 機械翻訳システムおよび機械翻訳方法 - Google Patents
機械翻訳システムおよび機械翻訳方法 Download PDFInfo
- Publication number
- JP2017510924A JP2017510924A JP2017501524A JP2017501524A JP2017510924A JP 2017510924 A JP2017510924 A JP 2017510924A JP 2017501524 A JP2017501524 A JP 2017501524A JP 2017501524 A JP2017501524 A JP 2017501524A JP 2017510924 A JP2017510924 A JP 2017510924A
- Authority
- JP
- Japan
- Prior art keywords
- grammar
- translation
- language
- word
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 172
- 238000000034 method Methods 0.000 title claims abstract description 121
- 230000008569 process Effects 0.000 claims abstract description 59
- 230000006870 function Effects 0.000 claims abstract description 9
- 230000014616 translation Effects 0.000 claims description 168
- 230000015572 biosynthetic process Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 8
- 230000001960 triggered effect Effects 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims description 2
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 230000002427 irreversible effect Effects 0.000 claims description 2
- 230000035772 mutation Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 6
- 230000007812 deficiency Effects 0.000 claims 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 abstract description 6
- 230000001052 transient effect Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 33
- 238000003786 synthesis reaction Methods 0.000 description 21
- 230000001343 mnemonic effect Effects 0.000 description 15
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 102100025957 Interleukin-1 receptor-associated kinase 1-binding protein 1 Human genes 0.000 description 6
- 108050002038 Interleukin-1 receptor-associated kinase 1-binding protein 1 Proteins 0.000 description 6
- 230000008520 organization Effects 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 210000001072 colon Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
本出願は非仮出願であり、その内容全体が参照により本明細書に組み入れられる、2014年3月28日付で出願された米国仮出願第61/971764号の優先権の恩典を主張するものである。
本発明は、概して、機械またはコンピュータベースの翻訳システムおよび機械またはコンピュータベースの翻訳方法の分野に関し、より詳細には、言語のモジュール編成を通過(transit)翻訳プロセスと共に用いて、書かれたテキストをある自然言語から別の自然言語へ翻訳する機械またはコンピュータ翻訳システムおよび機械またはコンピュータ翻訳方法に関する。本発明は、すべての統合された言語間で全方向に翻訳することのできる能力を有する多言語システムの創出を提供する。本明細書で用いる場合、「翻訳」とは、ある言語での表現または語の意味を別の言語での同じ意味へと変換することを意味するものである。
当分野では様々なタイプおよび構成のコンピュータベースの翻訳システムおよび翻訳方法が知られている。これら先行技術のシステムおよび方法は汎用性および速度を欠くものであった。従前のシステムおよび/または方法の中には文字認識プロセスに依拠するものもあり、それは解析を減速させるものであった。
システムの構造要素は以下を含む。
(i)字句単位(所与の語についての語形のセットに対応する)。
(ii)属性(品詞および品詞の可能な性質および特性を決定する)。
(iii)フォーマット(一連の属性を表し、語尾のポジションその他を記述するのに用いることができる)。
(iv)従属関係(文中の2語間の関係を決定する)。
(v)文法(言語情報を変形するように働き、規則のリストからなる)。
本発明のシステムの動作原理は図1(a)に示されており、サンプル文翻訳の例によって説明されている。様々なシステム構成要素のより詳細な説明を以下に示す。翻訳プロセスは以下のフェーズに分けることができる。
(i)入力テキストの解析12
(ii)直接的な逐語訳13
(iii)翻訳されたテキストの合成14
Art−冠詞
N−名詞
V−動詞
Adj−形容詞
翻訳段階−翻訳文法で記述される。
機械翻訳システム10がどのように動作するか理解するためには、その構造要素の各々が正しくどのように機能するかを十分に理解することが必要である。システム要素には、語彙素、属性、フォーマット、従属関係、および機能文法が含まれる。
システムの構造要素のうちの1つが図3に示すような「語彙素」であり、図3は語彙素の概略図である。語彙素のあらゆる形を登録する必要を回避するために、MTSは語彙素の形を不変の構成要素(「語根」)20と可変部分(「語尾」)21とに分ける。別々の類別された語尾を様々な語根と共に用いて語彙素を生成することができる(例えば、like=>likes、liked)。
・home−主格、単数;
・homes−主格、複数;
・home's−所有格、単数;
・homes'−所有格、複数
・*−主格、単数;
・s−主格、複数;
・'s−所有格、単数;
・s'−所有格、複数
SCase、PCase、Sg、PI
Sg&SCase PI&SCase Sg&PCase PI&Pcase
NOUN(N): Sg&SCase PI&SCase Sg&PCase PI&Pcase
home+NOUN * s 's s'
Ns: NOUN: * s 's s'
1.すべての可能な特性を記述する属性が決定される;
2.すべての必要な語尾のためのフォーマットが与えられる;
3.語尾のためのニーモニックのリストが作成される;
4.語が語根+語根の語尾の記述として正書法辞書に登録される。
・基本語彙素、および
・サブ語彙素。
属性は、品詞および品詞の可能な特性および指標を決定する。すべての属性はMTSシステムの属性のリストに記載されている。
グループ1の名前
属性1//注解
属性2//注解
属性3//注解
属性4//注解
属性5//注解
グループ2の名前
属性1//注解
属性2//注解
属性3//注解
属性4//注解
属性5//注解
PERSON
FPson//一人称(I write)
SPson//二人称(You write)
ThPson/三人称(He writes)
この属性のリストは言語ごとにシステムによって生成され、このグループの中からの複数の属性がトークンまたは語彙素に割り当てられることを可能にする。
「フォーマット」は、以下に用いることのできる一連の属性である。
・語尾ポジションの記述;
・様々な属性のグループのためのニーモニックの作成。
・直接、または
・ニーモニックによって
記載することができる。
(グループPARTS_OF_SPEECHにおいて)略語の属性(Abbr)を属性のリストに追加する。
PARTS_OF_SPEECH
Abbr//略語(IBM)
フォーマットのリストにおいて略語(ABBR)のフォーマットを作成する。
ABBR(Abbr): *; //IBM
ここでは、空の語尾を作成する必要があり、これは語尾のリストにおいてAbbrと命名される。
Abbr ABBR * ; //IBM+ Abbr
このすべてがなされた後で初めて、語尾Abbrを用いて正書法辞書にエントリを作成し、語IBMは略語であり、語尾を持たないと指定することができる:IBM+ Abbr。
「語尾」は語の可変部分であり、語根と組み合わさって、語彙素を形成する。語尾は、可能な語尾のリストにおいて直接与えられても、または対応する語尾の連鎖と共にフォーマットによって与えられてもよい。語尾の規則パターンに従う語形を記述するためにはフォーマットを用いる必要があり、フォーマットは様々な語形のための属性のリストである。
・属性のリスト;
・フォーマットのリスト;
・語尾のリスト;
・正書法辞書。
・play + * = play
・play + * = play
・play + s = plays
・play + ed = played
・play + ing = playing
・play + ed = played
辞書はシステムの重要な構成要素である。翻訳方向ごとに、以下の3つの辞書がある。
・入力言語の正書法辞書;
・出力言語の正書法辞書;
・入力言語から結果言語への翻訳辞書。
従属関係は2語間の接続または相関関係であり、普通はこれらの語間の文法関係を示す。英語の従属関係の一例が図4に示されている。
・名前/ニーモニック
・従属関係における(括弧内の)右側語彙素のパラメータ
・従属関係における(括弧内の)左側語彙素のパラメータ
従属関係の名前(左パラメータ 右パラメータ)
「文法」は、翻訳プロセスにおける言語情報の変換の順序を記述する規則セットである。
・基本
・作業
・特定の条件を検査する25。(「真」または「偽」を返す。)
・最新リストにおいてトークンをロードし、または削除する26。(結果として得られる一連のトークンを返す。)
・従属関係を設定し、または修正する27。(関数を実行する、従属関係を与えるなど。)
・元のテキストを修正する28。(テキストを簡略化し、かつ/または語順を変更する。)
MTSにおける「翻訳」という用語は以下の3つの別々のプロセスを意味する。
・翻訳辞書における作業;
・従属関係および属性の翻訳;
・句の処理。
[入力語]>[出力語]
[入力語]=[出力語]
または
[入力句]>[出力句]
[入力句]=[出力句]
・単純;
・文脈的;
・パラメータ句。
定義文法: 「文法」は、言語情報を処理するように設計された機能構成要素である。文法は規則のリストからなり、規則は、リストの先頭から末尾への順に実行される。文法は入力言語情報を用いて動作する。プログラミング言語との類推を用いた場合、文法は、そのアルゴリズムが規則の助けを借りて実行される関数であるということもできる。関数と同様に、文法は、入力情報がその適用を受ける入力パラメータのセットを有する。文法は1つまたは2つの入力パラメータを有しうる。
・解析文法;
・翻訳文法;
・合成文法。
・最初に、解析文法が文を十分に分解する(品詞および語間の従属関係が設定される)。
・次に、翻訳文法が実施され、語の意味、属性、および従属関係を出力言語に翻訳する。
・合成文法がプロセスを完了し、翻訳が完了する。
演算子を有する規則の例。Xは空演算子である。任意のトークンについて、空演算子は「真」を返す。この主機能は、無関係のトークンの場所を記すことである。例えば、入力文が「I go」である場合。4つのトークンが以下のように文法解析に入力される(開始点および終了点を記すために2つのピリオドが追加される)。
.I go.
/X X X X
は「真」を返す。しかし、次の規則、
/X X X X X
は「偽」を返す。というのは、本例には4つのトークンがあり、この規則には5つのトークンがあるからである。
これは、検査/修正のための演算子を有する規則の例である。SIMPLという文法を想定する。本発明の意図では、この文法は1つの規則、/X Vを含むにすぎない。
I go
図7に示すように、本発明の機能アルゴリズムは以下の基本工程を含む。
・基本文法;
o解析文法;
o翻訳文法;
o合成文法;
・作業文法;
oサービス文法;
o辞書文法;
o補助文法。
以下の段落においては、サンプル文「I go to the USA on Jan 1st, 2014.」を用いてMTSの動作のより詳細な説明を行う。
・文中の語形および語、ならびにそれらの属性の検査;
・語属性の割り当ておよび追加(追加される属性は普通、2次的、または一般的である;
・語および語形の設定および排除;
・語形についての不適切な属性の排除;
・文中の語形間の従属関係の設定、検査、および排除。
・入力言語からターゲット言語への属性および従属関係の移行;
・多種多様な典型的な状況(例えば、前置詞、動詞複合体など)で用いられる翻訳バージョン間の選択。
01 .
02 I UPPERFIRST
03 go
04 to
05 the
06 USA UPPERALL
07 on
08 Jan UPPERFIRST
09 1st NUMBERORD
10 ,
11 2014 NUMBER YEAR
12 .
・UPPERFIRST−語が大文字で始まる;
・UPPERALL−語が全部大文字で書かれている;
・NUMBERORD−序数;
・NUMBER_YEAR−年数。
I Anim FPson Sg PnP PnWOCase Scase
1) PREPROC (.)
2) PREPROC (I)
3) PREP ROC (go)
4) PREP ROC (to)
5) PREPROC (the)
6) PREPROC (USA)
7) PREP ROC (on)
8) PREPROC (Jan)
9) PREP ROC (1st)
10) PREP ROC (,)
11) PREPROC (2014)
12) PREPROC (.)
・(標準化された/屈折なしの)ターゲット言語の語彙素。
・各トークンに割り当てられたターゲット言語の属性のリスト。
・ターゲット言語のトークン間の従属関係のリスト。
・属性の過剰または不足(これは、ターゲット言語での語の語形変化を妨げる);
・従属関係の過剰または欠如;
・誤った語順。
間接翻訳は、入力言語とターゲット言語との間で1つまたは複数の中間言語を介した翻訳を用いる翻訳方法である。通過言語では、形態素合成が行われず、完全に解析された(マークが記された)文は次の翻訳のために取り次がれる。
1.言語Bのレンマおよびトークン
2.欠けている属性の割り当て
3.欠けている従属関係の割り当て
1.8-Cのレンマおよびトークンの翻訳。
2.属性の変換
3.従属関係の変換
Claims (53)
- 言語を編成するためのモジュール構造と、含まれる任意の言語間の任意の方向の翻訳を可能とする多言語システムの創出を可能にするための過渡的(transitory)翻訳システムと、規則ベースの機械またはコンピュータ翻訳のために設計されたアルゴリズムとを有するソフトウェアを含み、該モジュール構造が、語句の辞書の言語モジュールと、演算関数のリストの言語モジュールと、ある言語から別の言語への翻訳を行うのに必要な変換プロセスを誘導するパラメータとを含む、ソーステキストの意味をある自然言語から別の自然言語へ伝達するソーステキストの翻訳のための機械またはコンピュータ翻訳システム。
- グラフィカル・ユーザ・インターフェース(GUI)を表示するためのコンピュータ画面と、前記GUIと結合された中央処理装置(CPU)と、ソーステキストのすべての部分および前記ソーステキストの語間の従属関係を識別するための前記ソーステキストの解析を行い、前記ソーステキストのターゲット言語テキストへの翻訳を行い、前記GUI上で前記ターゲット言語テキストを表示するための、前記CPU上で維持されるソフトウェアと、をさらに含む、請求項1記載のシステム。
- 翻訳されたテキストの合成を行う手段をさらに含む、請求項1記載のシステム。
- アルゴリズムが文法および規則に基づく、請求項1記載のシステム。
- 文法が、言語情報を変形し、先頭から末尾まで連続して実行される規則のリストを含む機能ブロックである、請求項4記載のシステム。
- 文法規則が一連の演算子を含む、請求項5記載のシステム。
- ある言語から別の言語への語句の翻訳を含む翻訳辞書をさらに含む、請求項5記載のシステム。
- 翻訳辞書が、ある言語から別の言語への、一字句単位ずつの逐語訳を含む連続したエントリを含む、請求項7記載のシステム。
- 翻訳辞書が、ある言語から別の言語への句の翻訳を含む、請求項8記載のシステム。
- 翻訳辞書が特殊なパラメータ化句と共に動作し、類似したソーステキストについての翻訳パターンの形成を可能にする、請求項9記載のシステム。
- 各パラメータが、所与の句への語または語の組み合わせの配置の正確さを検査する専用文法に対応する、請求項10記載のシステム。
- リモートサーバ上で保持され、ワールド・ワイド・ウェブを介してブラウザによってアクセス可能な言語支援システム(Linguistic Support System)(「LSS」)をさらに含む、請求項5記載のシステム。
- LSSにより、言語学者および翻訳者が翻訳プロセスをモニタし、辞書を編集し、言語対の翻訳を追加し、システムの習得性を保証することが可能になる、請求項12記載のシステム。
- ソーステキストを解析する工程、該ソーステキストを翻訳されたテキストへ翻訳する工程、および該翻訳されたテキストを合成する工程、を含む、ソーステキストの意味をある自然言語から別の自然言語へ伝達して翻訳されたテキストにするソーステキストの翻訳のための方法。
- ソーステキストを解析する工程が、すべての品詞の曖昧でない識別をもたらす、請求項14記載の方法。
- ソーステキストを解析する工程が、従属関係として知られている前記ソーステキスト内の2語間の文法関係のセットをさらにもたらす、請求項15記載の方法。
- 翻訳する工程が、語の意味がターゲット言語へ翻訳され、語のポジションが前記ターゲット言語の文法に従って変化し、従属関係が変形されることを含む、請求項16記載の方法。
- 合成する工程が、サービス語の置換および挿入、ならびに語尾の調整を含む、請求項17記載の方法。
- ソーステキストを解析する工程、該ソーステキストを翻訳されたテキストへ翻訳する工程、および合成する工程の各工程についての文法へ整理統合されるテキスト変形の規則を適用する工程をさらに含む、請求項18記載の方法。
- 合成する工程が、解析なしでターゲット言語におけるテキストの完全にタグ付けされた構造をもたらす、請求項19記載の方法。
- 解析なしでターゲット言語におけるテキストの完全にタグ付けされた構造へ合成する工程が通過(transit)翻訳である、請求項20記載の方法。
- CPU上でソフトウェアに結合されたGUIのフィールドへ翻訳されるべきソーステキストを入力する工程、翻訳プロセスを開始する工程、前記ソーステキストを分離してトークンにする工程、前記トークン化工程からの語彙素を識別する工程、前記語彙素に属性を割り当てる工程、前記語彙素を解析する工程、前記語彙素の曖昧さを排除する工程、語間の従属関係を確立する工程、翻訳されたテキストに、語彙素、各トークンに割り当てられた属性、およびトークン間の従属関係があるかどうか判定するために、前記翻訳されたテキストに翻訳文法および合成文法を適用する工程、前記翻訳されたテキストにおける前記属性の過剰または不足および前記翻訳されたテキストにおける従属関係の過剰または欠如があれば訂正するために合成の規則を適用する工程、ならびに前記翻訳されたテキストにおける任意の語順を訂正する工程、を含む、ソーステキストの意味をある自然言語から別の自然言語へ伝達して翻訳されたテキストにするソーステキストの翻訳のための方法。
- トークンが、識別子、数、句読点、日付、語といった、事前定義の特性によってグループ化された一連の記号を表す要素であり、ソーステキスト内の各トークンがスペースによって分離されており、そのためスペース間に位置するすべて要素が別々のトークンとして識別される、請求項22記載の方法。
- 文法および規則に基づくアルゴリズムを適用する工程をさらに含む、請求項23記載の方法。
- 文法が、言語情報を変形し、先頭から末尾まで連続して実行される規則のリストを含む機能ブロックである、請求項24記載の方法。
- 文法規則が一連の演算子を含む、請求項25記載の方法。
- 文法が、正書法辞書から獲得される定義された初期属性を有するトークンに分割された、入ってくる言語情報を扱う、請求項26記載の方法。
- 文法が、情報を受け取るための入力パラメータを有する、請求項27記載の方法。
- パラメータの実数値が文法入力へ提供される、請求項28記載の方法。
- 前記値が、中間修正の結果を記憶するための内部バッファである最新リストに記憶される、請求項29記載の方法。
- 演算子が最新リストの変更を行い、該変更が、トークンの追加または除去、語変異の除去、属性および従属関係の追加または除去を含む、請求項30記載の方法。
- 最新リストの変更が文の画像に対して加えられ、主文法がトリガされた場合に限って前記文自体へ移行される、請求項31記載の方法。
- 前記文法がトリガされなかった場合、変更を有する文の画像は削除され、初期文は、前記主文法がトリガされないときに文法によって最後に処理された後の形のままである、請求項32記載の方法。
- 主文法がトリガされた後に、文中のすべての変更が不可逆になる、請求項33記載の方法。
- 3つの文法グループがある、請求項34記載の方法。
- 3つの文法グループが、解析の文法、翻訳の文法、および合成の文法である、請求項35記載の方法。
- サービスの文法、辞書の文法、および補助の文法を含む動作文法をさらに含む、請求項36記載の方法。
- すべての弁別的属性を有する語を含む専用の正書法辞書を用いる工程をさらに含む、請求項37記載の方法。
- 辞書が、翻訳なしの語の使用のすべての可能な変異の表示を有するファミリとして構築されている、請求項38記載の方法。
- 翻訳プロセスが、翻訳辞書に含まれる語句の翻訳を含む、請求項39記載の方法。
- 翻訳辞書が、ある言語から別の言語への、一字句単位ずつの逐語訳を含む連続したエントリを含む、請求項40記載の方法。
- 翻訳辞書に含まれる句の翻訳をさらに含む、請求項41記載の方法。
- 句の意味および語間の文法的従属関係をある言語から別の言語へ変形する工程をさらに含む、請求項42記載の方法。
- 翻訳辞書が特殊なパラメータ化句と共に動作し、それにより広範囲の類似したソーステキストについての翻訳パターンの形成が可能になる、請求項43記載の方法。
- 各パラメータが、所与の句への語または語の組み合わせの配置の正確さを検査する専用文法に対応する、請求項44記載の方法。
- 句中の配置パラメータが、属性によって設定される条件によってフィルタリングされる、請求項45記載の方法。
- 所与の語のすべての語形の正確な処理のために句に属性を追加することができる、請求項46記載の方法。
- 句を幅広い文脈に適応可能にすることが目標である場合に、パラメータが特定の値の使用の有無を検査する、請求項47記載の方法。
- 複雑な語ならびに接頭辞および接尾辞を有する語の語形成のプロセスにおいて正書法辞書に欠如している語を獲得する工程をさらに含む、請求項47記載の方法。
- ワールド・ワイド・ウェブを介してブラウザによってアクセス可能なリモートサーバ上で保持される言語支援システム(「LSS」)にアクセスする工程をさらに含む、請求項14記載の方法。
- LSSにアクセスする工程により、言語学者および翻訳者が翻訳プロセスをモニタし、辞書を編集し、言語対の翻訳を追加し、システムの習得性を保証することが可能になる、請求項50記載の方法。
- ワールド・ワイド・ウェブを介してブラウザによってアクセス可能なリモートサーバ上で保持される言語支援システム(「LSS」)にアクセスする工程をさらに含む、請求項22記載の方法。
- LSSにアクセスする工程により、言語学者および翻訳者が翻訳プロセスをモニタし、辞書を編集し、言語対の翻訳を追加し、システムの習得性を保証することが可能になる、請求項52記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461971764P | 2014-03-28 | 2014-03-28 | |
US61/971,764 | 2014-03-28 | ||
PCT/IB2015/000565 WO2015145259A1 (en) | 2014-03-28 | 2015-03-30 | Machine translation system and method |
US14/673,268 | 2015-03-30 | ||
US14/673,268 US20150356074A1 (en) | 2014-03-28 | 2015-03-30 | Machine Translation System and Method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017510924A true JP2017510924A (ja) | 2017-04-13 |
JP2017510924A5 JP2017510924A5 (ja) | 2018-06-28 |
Family
ID=54194036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017501524A Pending JP2017510924A (ja) | 2014-03-28 | 2015-03-30 | 機械翻訳システムおよび機械翻訳方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US20150356074A1 (ja) |
JP (1) | JP2017510924A (ja) |
KR (1) | KR20160138077A (ja) |
RU (1) | RU2016137833A (ja) |
SG (2) | SG11201607656SA (ja) |
WO (1) | WO2015145259A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9852131B2 (en) | 2015-05-18 | 2017-12-26 | Google Llc | Techniques for providing visual translation cards including contextually relevant definitions and examples |
DE112015006710T5 (de) * | 2015-07-15 | 2018-04-12 | Mitsubishi Electric Corporation | Anzeigesteuervorrichtung und Anzeigesteuerverfahren |
CN105740239A (zh) * | 2016-02-01 | 2016-07-06 | 中译语通科技(北京)有限公司 | 一种网页上文字的翻译方法及系统 |
US10475524B2 (en) * | 2016-09-15 | 2019-11-12 | Apple Inc. | Recovery of data read from memory with unknown polarity |
US11455476B2 (en) * | 2017-04-05 | 2022-09-27 | TSTREET Pty Ltd | Language translation aid |
KR102449842B1 (ko) * | 2017-11-30 | 2022-09-30 | 삼성전자주식회사 | 언어 모델 학습 방법 및 이를 사용하는 장치 |
KR102542914B1 (ko) * | 2018-04-30 | 2023-06-15 | 삼성전자주식회사 | 다중언어 번역 장치 및 다중언어 번역 방법 |
US11049204B1 (en) * | 2018-12-07 | 2021-06-29 | Bottomline Technologies, Inc. | Visual and text pattern matching |
US10732789B1 (en) | 2019-03-12 | 2020-08-04 | Bottomline Technologies, Inc. | Machine learning visualization |
WO2021107449A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치 |
US11783136B2 (en) * | 2021-04-30 | 2023-10-10 | Lilt, Inc. | End-to-end neural word alignment process of suggesting formatting in machine translations |
CN113438542B (zh) * | 2021-05-28 | 2022-11-08 | 北京智慧星光信息技术有限公司 | 字幕实时翻译方法、系统、电子设备及存储介质 |
KR102730242B1 (ko) * | 2024-03-08 | 2024-11-15 | 주식회사 아이에이오 | 인공지능 기반 다유형 문서 변환 방법 및 장치 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08265445A (ja) * | 1995-03-07 | 1996-10-11 | Siemens Ag | コミュニケーション装置 |
JPH0969106A (ja) * | 1995-06-23 | 1997-03-11 | Roehm Properties Bv | 機械翻訳装置及び翻訳処理方法 |
US5903858A (en) * | 1995-06-23 | 1999-05-11 | Saraki; Masashi | Translation machine for editing a original text by rewriting the same and translating the rewrote one |
JP2002007398A (ja) * | 2000-06-23 | 2002-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳制御方法及び装置及び翻訳制御プログラムを格納した記憶媒体 |
JP2002014959A (ja) * | 2000-06-30 | 2002-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳方法及び装置及び翻訳プログラムを格納した記憶媒体 |
JP2003271597A (ja) * | 2002-02-07 | 2003-09-26 | At & T Corp | 無線デバイス用の広く普及した言語翻訳のシステムおよび方法 |
JP2005250746A (ja) * | 2004-03-03 | 2005-09-15 | Nec Corp | 機械翻訳辞書登録装置、機械翻訳辞書登録方法、機械翻訳辞書登録プログラムおよび機械翻訳辞書登録システム |
JP2007018523A (ja) * | 1997-03-04 | 2007-01-25 | Hiroshi Ishikura | 言語解析システムおよび方法 |
US20080086300A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between languages |
US20090055160A1 (en) * | 2006-06-29 | 2009-02-26 | International Business Machines Corporation | Apparatus And Method For Integrated Phrase-Based And Free-Form Speech-To-Speech Translation |
JP2010515178A (ja) * | 2007-01-04 | 2010-05-06 | シンキング ソリューションズ ピーティーワイ リミテッド | 言語分析 |
US20100121630A1 (en) * | 2008-11-07 | 2010-05-13 | Lingupedia Investments S. A R. L. | Language processing systems and methods |
US20100174523A1 (en) * | 2009-01-06 | 2010-07-08 | Samsung Electronics Co., Ltd. | Multilingual dialogue system and controlling method thereof |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5870700A (en) * | 1996-04-01 | 1999-02-09 | Dts Software, Inc. | Brazilian Portuguese grammar checker |
US6393389B1 (en) * | 1999-09-23 | 2002-05-21 | Xerox Corporation | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions |
US20070219782A1 (en) * | 2006-03-14 | 2007-09-20 | Qing Li | User-supported multi-language online dictionary |
US20080059200A1 (en) * | 2006-08-22 | 2008-03-06 | Accenture Global Services Gmbh | Multi-Lingual Telephonic Service |
US8145473B2 (en) * | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
EP2702508A4 (en) * | 2011-04-27 | 2015-07-15 | Vadim Berman | GENERIC SYSTEM OF LANGUAGE ANALYSIS AND TRANSFORMATION |
US9569425B2 (en) * | 2013-03-01 | 2017-02-14 | The Software Shop, Inc. | Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding using traveling features |
-
2015
- 2015-03-30 KR KR1020167026966A patent/KR20160138077A/ko not_active Withdrawn
- 2015-03-30 SG SG11201607656SA patent/SG11201607656SA/en unknown
- 2015-03-30 WO PCT/IB2015/000565 patent/WO2015145259A1/en active Application Filing
- 2015-03-30 JP JP2017501524A patent/JP2017510924A/ja active Pending
- 2015-03-30 SG SG10201808556VA patent/SG10201808556VA/en unknown
- 2015-03-30 US US14/673,268 patent/US20150356074A1/en not_active Abandoned
- 2015-03-30 RU RU2016137833A patent/RU2016137833A/ru not_active Application Discontinuation
-
2016
- 2016-05-19 US US15/159,330 patent/US20160335254A1/en not_active Abandoned
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08265445A (ja) * | 1995-03-07 | 1996-10-11 | Siemens Ag | コミュニケーション装置 |
JPH0969106A (ja) * | 1995-06-23 | 1997-03-11 | Roehm Properties Bv | 機械翻訳装置及び翻訳処理方法 |
US5903858A (en) * | 1995-06-23 | 1999-05-11 | Saraki; Masashi | Translation machine for editing a original text by rewriting the same and translating the rewrote one |
JP2007018523A (ja) * | 1997-03-04 | 2007-01-25 | Hiroshi Ishikura | 言語解析システムおよび方法 |
JP2002007398A (ja) * | 2000-06-23 | 2002-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳制御方法及び装置及び翻訳制御プログラムを格納した記憶媒体 |
JP2002014959A (ja) * | 2000-06-30 | 2002-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 翻訳方法及び装置及び翻訳プログラムを格納した記憶媒体 |
JP2003271597A (ja) * | 2002-02-07 | 2003-09-26 | At & T Corp | 無線デバイス用の広く普及した言語翻訳のシステムおよび方法 |
JP2005250746A (ja) * | 2004-03-03 | 2005-09-15 | Nec Corp | 機械翻訳辞書登録装置、機械翻訳辞書登録方法、機械翻訳辞書登録プログラムおよび機械翻訳辞書登録システム |
US20090055160A1 (en) * | 2006-06-29 | 2009-02-26 | International Business Machines Corporation | Apparatus And Method For Integrated Phrase-Based And Free-Form Speech-To-Speech Translation |
US20080086300A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between languages |
JP2010515178A (ja) * | 2007-01-04 | 2010-05-06 | シンキング ソリューションズ ピーティーワイ リミテッド | 言語分析 |
US20100121630A1 (en) * | 2008-11-07 | 2010-05-13 | Lingupedia Investments S. A R. L. | Language processing systems and methods |
US20100174523A1 (en) * | 2009-01-06 | 2010-07-08 | Samsung Electronics Co., Ltd. | Multilingual dialogue system and controlling method thereof |
Also Published As
Publication number | Publication date |
---|---|
RU2016137833A3 (ja) | 2018-11-13 |
US20150356074A1 (en) | 2015-12-10 |
SG10201808556VA (en) | 2018-11-29 |
US20160335254A1 (en) | 2016-11-17 |
RU2016137833A (ru) | 2018-03-23 |
WO2015145259A1 (en) | 2015-10-01 |
SG11201607656SA (en) | 2016-10-28 |
KR20160138077A (ko) | 2016-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017510924A (ja) | 機械翻訳システムおよび機械翻訳方法 | |
JP4404211B2 (ja) | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム | |
US20070233460A1 (en) | Computer-Implemented Method for Use in a Translation System | |
Bejček et al. | Prague Dependency Treebank 2.5–a revisited version of PDT 2.0 | |
US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
JPH0351020B2 (ja) | ||
EP1525539A2 (en) | Machine translation | |
Schoorlemmer | Definiteness marking in Germanic: Morphological variations on the same syntactic theme | |
Chiarcos et al. | Analyzing middle high German syntax with RDF and SPARQL | |
Terčon et al. | CLASSLA-Stanza: The next step for linguistic processing of South Slavic languages | |
Dasgupta et al. | Morphological parsing of Bangla wods using PC-KIMMO | |
Rajendran | Parsing in tamil: Present state of art | |
EP3123354A1 (en) | Machine translation system and method | |
Delmonte | Treebanking in VIT: from phrase structure to dependency representation | |
JP2688020B2 (ja) | 派生語処理方式 | |
Dods | Automatically inferring grammar specifications for adnominal possession from interlinear glossed text | |
Cheng et al. | MAG-Tagalog: A rule-based Tagalog morphological analyzer and generator | |
Bosch et al. | Towards Zulu corpus clean-up, lexicon development and corpus annotation by means of computational morphological analysis | |
Prakapenka et al. | Creation of a Legal Domain Corpus for the Belarusian Module in NooJ: Texts, Dictionaries, Grammars | |
Kotsyba et al. | UGTag: morphological analyzer and tagger for the Ukrainian language | |
Giovannetti et al. | Constructing an Annotated Resource for Part-Of-Speech Tagging of Mishnaic Hebrew | |
de Almeida | Suffix identification in Portuguese using transducers | |
Fraj et al. | Parsing Arabic Texts Using Real Patterns of Syntactic Trees | |
Vadász et al. | NORMO: An Automatic Normalization Tool for Middle Hungarian |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190306 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190605 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191030 |