JP2009258887A - 機械翻訳装置及び機械翻訳プログラム - Google Patents
機械翻訳装置及び機械翻訳プログラム Download PDFInfo
- Publication number
- JP2009258887A JP2009258887A JP2008105609A JP2008105609A JP2009258887A JP 2009258887 A JP2009258887 A JP 2009258887A JP 2008105609 A JP2008105609 A JP 2008105609A JP 2008105609 A JP2008105609 A JP 2008105609A JP 2009258887 A JP2009258887 A JP 2009258887A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- language
- word
- candidate
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】第1言語の語句とそれに対応する第2言語の語句を対にして記録する翻訳辞書28と、翻訳に必要な知識・規則及び第1言語の語句の分野情報における第2言語の訳語候補の点数を蓄積した機械翻訳知識データベース29とを有し、翻訳辞書検索部27は翻訳辞書部28及び機械翻訳知識データベース29を参照して第2原語の訳文を作成し、訳語候補検証部30は翻訳辞書28から得た第2言語の訳文に含まれる各語について存在検索単語データベース31を参照して点数により各語の確からしさを調べ、その結果がある一定の基準に達しないときには、翻訳辞書検索部27を再起動して第1言語の原文を解析し直し、これに含まれる第2言語の語句についても確からしさを調べることを繰り返す。
【選択図】 図1
Description
(例2)
これらの訳文は原文の意味を表現しているとは言えず、翻訳結果としては不十分である。このように、一塊の言葉を含む文を翻訳するとき、表意文字だからといって、より細かく分割して辞書引きし、辞書引きをした訳語をつなぎ合わせて日本語の文字列を作っても、結果として、読み手に原文の意味を正しく伝えることができない場合がある。
書を参照して、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力することを特徴とする。
このとき、「画」、「本」、「館」、「画本」、「本館」、「画本館」をキーに存在検索単語データベース31を調べる。いま、「画本館」以外の「画」、「本」、「館」、「画本」、「本館」は存在検索単語データベース31に存在し、「画本館」は存在しないとすると、ルール(3−1)の場合には、最も多くの語が連結された「画本館」が存在しないため、結果的には不合格となる。また、ルール(3−1)の場合には、得点が0となり、図4のステップS5での合計点数が低く抑えられる。
このとき、「図書」、「館」、「図書館」をキーに存在検索単語データベース31を調べる。存在検索単語データベース31に、「図書」、「館」、「図書館」のすべてが存在しているとき、ルール(3−1)の場合には、最も多くの語が連結された「図書館」が存在するので合格となる。また、ルール(3−2)の場合には、「図書」、「館」、「図書館」のすべてが存在するので高得点となる。
を翻訳する場合を考える。韓日翻訳辞書を引いても登録語が見つからなかったとき、ハングル文字は表音文字であるため機械的に日本語の仮名に置き換えることができる。そうして得た訳語候補は韓国語の発音をそのまま表現したものであり、日本語に同じ発音をもつ言葉が存在するとは限らない。そこで、存在検索単語データベース31を調べる。そしてそれが見つかれば、かなり高い確率で日本語にも存在すると言うことができる。
Claims (4)
- 機械翻訳プログラム、第1言語の語句とそれに対応する第2言語の語句とを対にしてデータとして記録した翻訳辞書、翻訳に必要な知識・規則及び第1言語の語句の分野情報並びにその分野情報における第2言語の訳語候補の点数を蓄積した機械翻訳知識データベースを記憶した記憶装置と、翻訳対象の第1言語の原文をデータとして入力する入力装置と、翻訳後の第2言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置において、
前記記憶装置に予め記憶され第2言語の単語が記載された文書情報を集積した存在検索単語データベースと;
前記入力装置から入力された第1言語の原文を取り込む入力処理部と;
前記入力処理部で取り込んだ第1言語の原文の形態素解析を行い、原文を語句ごとに分割し、前記翻訳辞書を参照し、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とし、存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力する翻訳辞書検索部と;
前記翻訳辞書検索部で得られた訳文中の訳語候補に対して、前記機械翻訳知識データベースの第1言語の語句の分野情報を参照して前記訳語候補の点数を求め、前記存在検索単語データベースを参照して前記存在検索単語データベースに存在する訳語候補の個数に応じて予め定められた点数を求め、さらにこれら訳語候補の点数の合計を求め、求めた訳語候補の合計点数が予め定めた点数以上のときは合格と判定し、予め定めた点数未満のときは不合格と判定する訳語候補検証部と;
前記訳語候補検証部で不合格となった訳文について、原文の分割位置及び分割した語句の訳語を解析情報として第1言語の原文に付加し、既に付加した解析情報と異なる解析情報が更新される限りその解析情報を付加した第1言語の原文を前記翻訳辞書検索部に出力して前記翻訳辞書検索部に再解析を指示する再解析指示部と;
前記訳語候補検証部で合格と判断された訳文または前記再解析指示部による前記翻訳辞書検索部への再解析の指示がないときの訳文を前記出力装置に出力する出力処理部とを備え;
前記翻訳辞書検索部は、前記再解析指示部から解析情報が付加された第1言語の原文を取り込んだときは、第1言語の原文を形態素解析する際にその解析情報の分割位置と異なる位置で原文を語句ごとに分割し、前記翻訳辞書を参照して、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力することを特徴とする機械翻訳装置。 - 前記訳語候補検証部は、前記翻訳辞書検索部で得られた訳語候補に対して、同じ品詞が複数語連続しているときは連続する語を連結した連結語が前記存在検索単語データベースに存在するか否かを判定し、存在するときは合格とし、存在しないときは不合格とすることを特徴とする請求項1記載の機械翻訳装置。
- 前記訳語候補検証部は、訳語候補の品詞の配列を判定し、品詞の配列が構文上あり得ない訳文であるときは、前記再解析指示部は、その訳文について、訳語の品詞の配列を解析情報として第1言語の原文に付加し、その解析情報を付加した第1言語の原文を前記翻訳辞書検索部に出力して再解析を指示し、前記翻訳辞書検索部は、前記再解析指示部から解析情報が付加された第1言語の原文を取り込んだときは、第1言語の原文を形態素解析する際に原語を一つずつ前記翻訳辞書から辞書引きし、辞書引きした原語を連結して得られた連結語に対して前記翻訳辞書または前記機械翻訳知識データベースを参照して辞書引きとデータベース検索を行い、前記連結語が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とし、存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力することを特徴とする請求項1または2記載の機械翻訳装置。
- 入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置に用いられる機械翻訳プログラムにおいて、
機械翻訳プログラム、第1言語の語句とそれに対応する第2言語の語句とを対にしてデータとして記録した翻訳辞書、翻訳に必要な知識・規則及び第1言語の語句の分野情報並びにその分野情報における第2言語の訳語候補の点数を蓄積した機械翻訳知識データベースを記憶した記憶装置と、翻訳対象の第1言語の原文をデータとして入力する入力装置と、翻訳後の第2言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えたコンピュータに用いられ、前記記憶装置に予め記憶され第2言語の単語が記載された文書情報を集積した存在検索単語データベースを格納しておき、
前記コンピュータに、前記入力装置から入力された第1言語の原文を取り込む機能と;
取り込んだ第1言語の原文の形態素解析を行い、原文を語句ごとに分割し、前記翻訳辞書を参照し、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とし、存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力する機能と;
得られた訳文中の訳語候補に対して、前記機械翻訳知識データベースの第1言語の語句の分野情報を参照して前記訳語候補の点数を求め、前記存在検索単語データベースを参照して前記存在検索単語データベースに存在する訳語候補の個数に応じて予め定められた点数を求め、さらにこれら訳語候補の点数の合計を求め、求めた訳語候補の合計点数が予め定めた点数以上のときは合格と判定し、予め定めた点数未満のときは不合格と判定する機能と;
不合格となった訳文について、原文の分割位置及び分割した語句の訳語を解析情報として第1言語の原文に付加し、既に付加した解析情報と異なる解析情報が更新される限りその解析情報を付加した第1言語の原文をの再解析を指示する機能と;
再解析が指示された第1言語の原文を形態素解析する際に付加された解析情報の分割位置と異なる位置で原文を語句ごとに分割し、前記翻訳辞書を参照して、分割した語句が前記翻訳辞書に存在するときは第2言語の訳語に置き換え訳語候補とするとともに存在しないときは第1言語の原語表記の未知語を訳語候補とした訳文を出力する機能と;
合格と判断された訳文または再解析の指示がないときの訳文を前記出力装置に出力する機能と;を実現させるための機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105609A JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008105609A JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009258887A true JP2009258887A (ja) | 2009-11-05 |
JP4845921B2 JP4845921B2 (ja) | 2011-12-28 |
Family
ID=41386240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008105609A Expired - Fee Related JP4845921B2 (ja) | 2008-04-15 | 2008-04-15 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4845921B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170008357A (ko) * | 2015-07-13 | 2017-01-24 | 주식회사 에버트란 | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 |
KR101834436B1 (ko) * | 2016-07-13 | 2018-03-05 | 김태완 | 텍스트 생성 방법 및 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05135094A (ja) * | 1991-11-12 | 1993-06-01 | Ricoh Co Ltd | 言語解析装置 |
-
2008
- 2008-04-15 JP JP2008105609A patent/JP4845921B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05135094A (ja) * | 1991-11-12 | 1993-06-01 | Ricoh Co Ltd | 言語解析装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170008357A (ko) * | 2015-07-13 | 2017-01-24 | 주식회사 에버트란 | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 |
KR101709693B1 (ko) * | 2015-07-13 | 2017-02-27 | 주식회사 에버트란 | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 |
KR101834436B1 (ko) * | 2016-07-13 | 2018-03-05 | 김태완 | 텍스트 생성 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP4845921B2 (ja) | 2011-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102268875B1 (ko) | 전자 장치에 텍스트를 입력하는 시스템 및 방법 | |
US9262409B2 (en) | Translation of a selected text fragment of a screen | |
US9002695B2 (en) | Machine translation device, method of processing data, and program | |
US7529656B2 (en) | Translating method, translated sentence outputting method, recording medium, program, and computer device | |
US7630880B2 (en) | Japanese virtual dictionary | |
US20110137635A1 (en) | Transliterating semitic languages including diacritics | |
US20080133444A1 (en) | Web-based collocation error proofing | |
US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
KR101544690B1 (ko) | 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램 | |
US20060241934A1 (en) | Apparatus and method for translating Japanese into Chinese, and computer program product therefor | |
US20110046940A1 (en) | Machine translation device, machine translation method, and program | |
US10120843B2 (en) | Generation of parsable data for deep parsing | |
Kirov et al. | Context-aware transliteration of romanized south asian languages | |
JP6160438B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4845921B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
US7983899B2 (en) | Apparatus for and method of analyzing chinese | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
JP5185343B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5746921B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP2015130102A (ja) | 文書分析装置、文書分析システム、文書分析方法およびプログラム | |
JP2009009583A (ja) | 構文パースを用いてセグメント化されていないテキストをセグメント化する方法 | |
WO2012127805A1 (ja) | 訳語選択条件抽出システム、訳語選択条件抽出方法および訳語選択条件抽出プログラム | |
JPH1185751A (ja) | 翻訳装置及び翻訳装置制御プログラムを記憶した媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110317 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110711 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110916 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111011 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141021 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4845921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |