JP2015082204A - 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 - Google Patents
機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 Download PDFInfo
- Publication number
- JP2015082204A JP2015082204A JP2013219656A JP2013219656A JP2015082204A JP 2015082204 A JP2015082204 A JP 2015082204A JP 2013219656 A JP2013219656 A JP 2013219656A JP 2013219656 A JP2013219656 A JP 2013219656A JP 2015082204 A JP2015082204 A JP 2015082204A
- Authority
- JP
- Japan
- Prior art keywords
- language
- translation
- sentence
- unknown word
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
1つの案では、機械翻訳装置は、翻訳対象の第一言語の文章を入力する入力手段と、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書と、前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳する第一言語第二言語翻訳手段と、前記第一言語第二言語翻訳手段による翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識する未知語認識手段と、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書と、前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳する第一言語第三言語翻訳手段と、前記第一言語第三言語翻訳手段によって翻訳された前記第三言語の文章のうち、前記未知語認識手段によって認識された未知語に対応する第三言語を切り出す未知語第三言語切り出し手段と、前記未知語第三言語切り出し手段によって切り出された前記第三言語を複数の形態素に分割する第三言語形態素解析手段と、前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索する第三言語第一言語辞書引き手段と、前記第三言語第一言語辞書引き手段を用いて、前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記未知語認識手段によって認識した前記未知語の代替表記を生成する代替表記生成手段と、前記入力手段で入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した未知語を、前記代替表記生成手段によって生成された前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正する入力文修正手段とを備え、前記第一言語第二言語翻訳手段は、前記入力文修正手段によって修正された第一言語の文章を第二言語の文章に翻訳することを特徴とする。
図2乃至図13を用いて、第1の実施の形態を説明する。
図2は、機械翻訳処理の概要を説明するための図である。
が検索され、日本語「指向の」に対応する中国語「面向的」が検索される。なお、日本語「物体」「目的」に対応する中国語は、日中の対訳辞書に登録されておらず、検索されない。
未知語第三言語切り出し部18は、第一言語第三言語翻訳部15によって翻訳された第三言語(英)の文章のうち、未知語認識部14によって認識された未知語に対応する第三言語(英)を切り出す。そして、未知語第三言語切り出し部18は、第三言語形態素解析部17を用いて、切り出した第三言語(英)を複数の形態素に分割する。
となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」を取得する。
と、取得した原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」に基づいて、第一言語第二言語対訳辞書13に登録されていない第一言語(日)の表現、未知語704「オブジェクトオリエンテッド」を「未知語」として認識する。そして、認識した未知語を、図8に示すような未知語リスト800に作成する。
ステップS608において、未知語が第一言語形態素に包含されているか否かを判断し、包含されていないと判断された場合(ステップS608:No)、第一言語形態素リスト900中の次の第一言語形態素を処理対象としてステップS606に戻る。すなわち、同一でもなく(ステップS607:No)、包含されてもいない(ステップS608:)ということは、未知語と第一言語形態素が全く異なる場合である。他方、ステップS608で、包含されていると判断された場合(ステップS608:Yes)、図12を用いて後述するステップS610に進む。
ステップS607では、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト900の未知語形態素706「オブジェクトオリエンテッド」が同一であるので、ステップS609へ進む(ステップS607:Yes)。
第三言語表記リストに登録された第三言語表記を順にステップS1002以降の処理の対象とするため、ステップS1001において、未知語に対応する第三言語表記リストの終わりか否かを判断する。未知語に対応する第三言語表記リストは、図6のステップS609で作成されたものである。例えば、図6の説明に用いた上述の例では、第三言語表記リストには、1つの未知語対応英語707「object oriented」が格納されている。
で第二言語表記リストを作成する。
が格納されているので、空リストではない。そして、代替語バッファには、
に対応する第一言語表記「対象」を追加する。
図10のステップS1010で作成された表記置換えテーブルに登録された代替表記を順にステップS1102以降の処理の対象とするため、ステップS1101において、表記置換えテーブルの終わりか否かを判断する。
と翻訳される。
となる。また、翻訳の過程で実行される形態素解析の結果として、原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」を取得する。図7に示した原文形態素703「/彼/は/オブジェクトオリエンテッド/ランゲージ/を/勉強/し/て/いる/。/」とは、「オブジェクトオリエンテッドランゲージ」を1つの形態素と判断するか2つの形態素と判断するかの違いである。この違いは、第一言語第三言語翻訳部15の処理能力に起因する。
と、取得した原文形態素1201「/彼/は/オブジェクトオリエンテッドランゲージ/を/勉強/し/て/いる/。/」に基づいて、第一言語第二言語対訳辞書13に登録されていない第一言語(日)の表現、未知語704「オブジェクトオリエンテッド」を「未知語」として認識する。そして、認識した未知語を、図8に示すような未知語リスト800に作成する。
ステップS607において、未知語リスト800の未知語704「オブジェクトオリエンテッド」と、第一言語形態素リスト1300の未知語形態素1202「オブジェクトオリエンテッドランゲージ」は同一でないので、ステップS608へ進む(ステップS607:No)。
図14は、第2の実施の形態の機械翻訳装置2の構成を示す図である。
図15は、第3の実施の形態の機械翻訳装置3の構成を示す図である。
図16は、第4の実施の形態の構成を示す図である。
図17は、第5の実施の形態の構成を示す図である。
図18は、第6の実施の形態の機械翻訳装置4の構成を示す図である。
11 入力部
12 第一言語第二言語翻訳部
13 第一言語第二言語対訳辞書
14 未知語認識部
15、15A、15B、15C 第一言語第三言語翻訳部
16、16A、16B、16C 第一言語第三言語対訳辞書
17、17A、17B、17C 第三言語形態素解析部
18 未知語第三言語切り出し部
19、19A、19B、19C 第三言語第一言語辞書引き部
20 代替表記生成部
21 入力文修正部
22 出力部
141 候補ランキング部
701 原文
702 日中翻訳文
703、1201 原文形態素
704 未知語
705 日英翻訳文
706、1202 未知語形態素
707、1204 未知語対応英語
708 未知語対応英語形態素
709、710 英語形態素対応日本語
711 代替表記
712 修正後原文
713 修正後日中翻訳文
800 未知語リスト
900、1300 第一言語形態素リスト
901、902、903、904、905、906、907、908、909、1301、1302、1303、1304、1305、1306、1307、1308 第一言語形態素
1203 未知語形態素対応英語
1600 通信ネットワーク
1601A、1601B 端末装置
Claims (8)
- 翻訳対象の第一言語の文章を入力する入力手段と、
前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書と、
前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳する第一言語第二言語翻訳手段と、
前記第一言語第二言語翻訳手段による翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識する未知語認識手段と、
前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書と、
前記入力手段で入力された前記第一言語の文章を形態素解析し、前記第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳する第一言語第三言語翻訳手段と、
前記第一言語第三言語翻訳手段によって翻訳された前記第三言語の文章のうち、前記未知語認識手段によって認識された未知語に対応する第三言語を切り出す未知語第三言語切り出し手段と、
前記未知語第三言語切り出し手段によって切り出された前記第三言語を複数の形態素に分割する第三言語形態素解析手段と、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索する第三言語第一言語辞書引き手段と、
前記第三言語第一言語辞書引き手段を用いて、前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記未知語認識手段によって認識した前記未知語の代替表記を生成する代替表記生成手段と、
前記入力手段で入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した未知語を、前記代替表記生成手段によって生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正する入力文修正手段と、
を備え、
前記第一言語第二言語翻訳手段は、前記入力文修正手段によって修正された第一言語の文章を第二言語の文章に翻訳することを特徴とする機械翻訳装置。 - 前記代替表記生成手段が生成した前記未知語の代替表記を、所定の優先度にしたがってランク付けする候補ランキング手段、を備え、
前記入力文修正手段は、前記入力手段によって入力された前記第一言語の文章のうち、前記未知語認識手段によって認識した前記未知語を、前記候補ランキング手段によってランク付けされた代替表記のうち優先度の高い代替表記に置き換えることにより、前記入力手段によって入力された第一言語の文章を修正することを特徴とする請求項1に記載の機械翻訳装置。 - 前記第一言語第三言語対訳辞書は、複数の辞書で構成されていることを特徴とする請求項1又は2に記載の機械翻訳装置。
- 通信ネットワークを介した端末装置から、前記第一言語の文章を前記入力手段に入力し、
前記第一言語第二言語翻訳手段によって翻訳された前記第二言語の文章を、前記通信ネットワークを介して前記端末装置に出力する、
ことを特徴とする請求項1乃至3の何れか1項に記載の機械翻訳装置。 - 前記第一言語第二言語翻訳手段、前記第一言語第二言語対訳辞書、前記第一言語第三言語翻訳手段、前記第一言語第三言語対訳辞書、前記第三言語形態素解析手段、又は前記第三言語第一言語辞書引き手段は、通信ネットワークを介して外部から組み込まれることを特徴とする請求項1乃至4の何れか1項に記載の機械翻訳装置。
- 前記第一言語第二言語翻訳手段、前記第一言語第二言語対訳辞書、前記第一言語第三言語翻訳手段、前記第一言語第三言語対訳辞書、前記第三言語形態素解析手段、又は前記第三言語第一言語辞書引き手段は、通信ネットワークで接続された外部に設置されていることを特徴とする請求項1乃至4の何れか1項に記載の機械翻訳装置。
- 機械翻訳装置のコンピュータに、
翻訳対象の第一言語の文章を入力させ、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳させ、
前記第一言語から前記第二言語翻訳への翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識させ、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳させ、
前記第一言語から前記第三言語への翻訳によって翻訳された前記第三言語の文章のうち、前記認識された未知語に対応する第三言語を切り出させ、
前記切り出された前記第三言語を複数の形態素に分割させ、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索させ、
前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記認識した前記未知語の代替表記を生成させ、
前記入力された前記第一言語の文章のうち、前記認識した未知語を前記生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正させ、
前記修正された第一言語の文章を第二言語の文章に翻訳させる、
ことを特徴とする機械翻訳プログラム。 - 機械翻訳方法において、
機械翻訳装置が、
翻訳対象の第一言語の文章を入力し、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して少なくとも1つの第二言語の表現が対応付けて登録されている第一言語第二言語対訳辞書を参照して、前記第一言語とは異なる翻訳目的の第二言語の文章に翻訳し、
前記第一言語から前記第二言語翻訳への翻訳結果と形態素解析結果に基づいて、前記第一言語第二言語対訳辞書に前記第二言語の表現が登録されていない未知語を認識し、
前記入力された前記第一言語の文章を形態素解析し、前記第一言語の少なくとも1つの表現に対して前記第一言語及び前記第二言語とは異なる少なくとも1つの第三言語の表現が対応付けて登録されている第一言語第三言語対訳辞書を参照して、前記第三言語の文章に翻訳し、
前記第一言語から前記第三言語への翻訳によって翻訳された前記第三言語の文章のうち、前記認識された未知語に対応する第三言語を切り出し、
前記切り出された前記第三言語を複数の形態素に分割し、
前記第一言語第三言語対訳辞書を参照して、前記分割された形態素に対応する前記第一言語の単語を検索し、
前記分割された複数の形態素に対応する前記第一言語の複数の単語を組み合わせることにより、前記認識した前記未知語の代替表記を生成し、
前記入力された前記第一言語の文章のうち、前記認識した未知語を前記生成した前記代替表記に置き換えることにより、前記入力された前記第一言語の文章を修正し、
前記修正された第一言語の文章を第二言語の文章に翻訳する、
ことを特徴とする機械翻訳方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013219656A JP6160438B2 (ja) | 2013-10-22 | 2013-10-22 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013219656A JP6160438B2 (ja) | 2013-10-22 | 2013-10-22 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015082204A true JP2015082204A (ja) | 2015-04-27 |
JP6160438B2 JP6160438B2 (ja) | 2017-07-12 |
Family
ID=53012774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013219656A Expired - Fee Related JP6160438B2 (ja) | 2013-10-22 | 2013-10-22 | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6160438B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069000A (zh) * | 2015-08-24 | 2015-11-18 | 中译语通科技(北京)有限公司 | 一种交互式预测输入法 |
JP5981616B1 (ja) * | 2015-07-28 | 2016-08-31 | 株式会社富士通ビー・エス・シー | 料理内容提供方法、情報処理装置および料理内容提供プログラム |
JPWO2020255553A1 (ja) * | 2019-06-17 | 2020-12-24 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102516363B1 (ko) | 2018-01-26 | 2023-03-31 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005018350A (ja) * | 2003-06-25 | 2005-01-20 | Toshiba Corp | 翻訳処理システム、翻訳処理方法及びプログラム |
JP2007052700A (ja) * | 2005-08-19 | 2007-03-01 | Toshiba Corp | 機械翻訳装置および機械翻訳プログラム |
-
2013
- 2013-10-22 JP JP2013219656A patent/JP6160438B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005018350A (ja) * | 2003-06-25 | 2005-01-20 | Toshiba Corp | 翻訳処理システム、翻訳処理方法及びプログラム |
JP2007052700A (ja) * | 2005-08-19 | 2007-03-01 | Toshiba Corp | 機械翻訳装置および機械翻訳プログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5981616B1 (ja) * | 2015-07-28 | 2016-08-31 | 株式会社富士通ビー・エス・シー | 料理内容提供方法、情報処理装置および料理内容提供プログラム |
WO2017018410A1 (ja) * | 2015-07-28 | 2017-02-02 | 株式会社富士通ビー・エス・シー | 料理内容提供方法、情報処理装置および料理内容提供プログラム |
CN105069000A (zh) * | 2015-08-24 | 2015-11-18 | 中译语通科技(北京)有限公司 | 一种交互式预测输入法 |
JPWO2020255553A1 (ja) * | 2019-06-17 | 2020-12-24 | ||
WO2020255553A1 (ja) * | 2019-06-17 | 2020-12-24 | 株式会社Nttドコモ | 生成装置、及び正規化モデル |
JP7447114B2 (ja) | 2019-06-17 | 2024-03-11 | 株式会社Nttドコモ | 生成装置、及び正規化モデル |
US12248758B2 (en) | 2019-06-17 | 2025-03-11 | Ntt Docomo, Inc. | Generation device and normalization model |
Also Published As
Publication number | Publication date |
---|---|
JP6160438B2 (ja) | 2017-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100511215C (zh) | 多语种翻译存储器和翻译方法 | |
JP5011751B2 (ja) | 訳語情報出力処理プログラム,処理方法および処理装置 | |
JP5235344B2 (ja) | 機械翻訳を行う装置、方法およびプログラム | |
WO2005059771A1 (ja) | 対訳判断装置、方法及びプログラム | |
US20060241934A1 (en) | Apparatus and method for translating Japanese into Chinese, and computer program product therefor | |
JP6160438B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP2018055670A (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
JP2009193179A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JP2009205357A (ja) | 中国語の品詞を判定する装置、方法およびプログラム | |
CN100454294C (zh) | 用于将日文翻译成中文的设备 | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
JP3471253B2 (ja) | 文書分類方法、文書分類装置、および文書分類プログラムを記録した記録媒体 | |
JP2006338261A (ja) | 翻訳装置、翻訳方法及び翻訳プログラム | |
JP4643183B2 (ja) | 翻訳装置および翻訳プログラム | |
JP4845921B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP6221339B2 (ja) | 翻訳装置及び翻訳方法 | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
KR101589948B1 (ko) | 자동 번역 방법 및 장치 | |
JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
JP3982726B2 (ja) | 翻訳知識学習装置及び機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6160438 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |