JPS62267871A - 日本語生成装置 - Google Patents
日本語生成装置Info
- Publication number
- JPS62267871A JPS62267871A JP61109631A JP10963186A JPS62267871A JP S62267871 A JPS62267871 A JP S62267871A JP 61109631 A JP61109631 A JP 61109631A JP 10963186 A JP10963186 A JP 10963186A JP S62267871 A JPS62267871 A JP S62267871A
- Authority
- JP
- Japan
- Prior art keywords
- japanese
- noun
- character
- sentence
- nouns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は[1本語生成装置、とくに[1動翻訳装置に有
用な11本1塾生成装置に関する。
用な11本1塾生成装置に関する。
従」く十表林r
たとえば英1:hなどの外国1;hの文からそれに対応
するII木詰の文を作成する場合、人力された英文の形
iE1素を解析し、その構文を解析し、その文構造を変
換し、そののち日本語の訳文を生成する。
するII木詰の文を作成する場合、人力された英文の形
iE1素を解析し、その構文を解析し、その文構造を変
換し、そののち日本語の訳文を生成する。
岡知のように日本語文では一般に、複数個の名詞からな
る名詞句は、隣接する2つの名詞の間に助詞「の」を挿
入したり、中点「・」を挿入したり、何も挿入せず複数
の名詞の合成語としたり、はたまた英語などの外国語の
単語をそのまま表記する場合はスペースをはさんで列記
したりするなど、様々な形で表記される。
る名詞句は、隣接する2つの名詞の間に助詞「の」を挿
入したり、中点「・」を挿入したり、何も挿入せず複数
の名詞の合成語としたり、はたまた英語などの外国語の
単語をそのまま表記する場合はスペースをはさんで列記
したりするなど、様々な形で表記される。
従来方式による英日自動翻訳装置では、このような複数
個の名詞からなる名詞句が対応する日本語に翻訳される
と、単に、複数個の名詞の羅列か、あるいは各名詞間に
すべて助詞の「の」が挿入されるなど1日本語として不
自然な形で表記されることが多かった。
個の名詞からなる名詞句が対応する日本語に翻訳される
と、単に、複数個の名詞の羅列か、あるいは各名詞間に
すべて助詞の「の」が挿入されるなど1日本語として不
自然な形で表記されることが多かった。
しかし現実の日本語文はかなり複雑である。たとえば英
語の名詞句″a woman director”の場
合。
語の名詞句″a woman director”の場
合。
説明を簡単にするために、“woman“に対応する日
本語として一般に「女」と「女性」があり、”dire
ctor”に対応する日本語として一般に「ディレクタ
ー」と「編集者」があるとする。この場合−股に、’a
woman director’の訳語として「女性
ディレクター」 「女性編集者」 「女のディレクター
」 「女の編集者」などがあり、それぞれ文中における
用法ないしはニュアンスが微妙に異なることがある。し
たがって従来方式のように、−律に「nに、複数個の名
詞を羅列したり、あるいは各名詞間にすべて助詞の「の
」を挿入しただけでは、11本語として不自然なことが
多い。
本語として一般に「女」と「女性」があり、”dire
ctor”に対応する日本語として一般に「ディレクタ
ー」と「編集者」があるとする。この場合−股に、’a
woman director’の訳語として「女性
ディレクター」 「女性編集者」 「女のディレクター
」 「女の編集者」などがあり、それぞれ文中における
用法ないしはニュアンスが微妙に異なることがある。し
たがって従来方式のように、−律に「nに、複数個の名
詞を羅列したり、あるいは各名詞間にすべて助詞の「の
」を挿入しただけでは、11本語として不自然なことが
多い。
目的
末完IIはこのような従来技術の欠点を解消し。
名詞句の表記に関してより自然な日本語が生成される1
1木、1h生成装置を提供することを目的とする。
1木、1h生成装置を提供することを目的とする。
構 成
本発明は上記の目的を達成させるため、外国語の単語に
ついてそれに対応する日本語の訳語に関する辞どデータ
を格納した辞書手段と、形通素および構文が解析された
外国語の文について辞書手段を索引して対応する日本語
の文を生成する日本語生成手段とを有し、日本語生成手
段は、外国語の文に複数個の名詞を含む名詞句があると
、辞書手段より得られた名詞の訳語の字種を判別し、そ
の字種に応じて名詞相互間の連結表記を決定して日本語
の文を生成する日本語生成装置を特徴としたものである
。以下、本発明の実施例に基づいて具体的に説明する。
ついてそれに対応する日本語の訳語に関する辞どデータ
を格納した辞書手段と、形通素および構文が解析された
外国語の文について辞書手段を索引して対応する日本語
の文を生成する日本語生成手段とを有し、日本語生成手
段は、外国語の文に複数個の名詞を含む名詞句があると
、辞書手段より得られた名詞の訳語の字種を判別し、そ
の字種に応じて名詞相互間の連結表記を決定して日本語
の文を生成する日本語生成装置を特徴としたものである
。以下、本発明の実施例に基づいて具体的に説明する。
第1図を参照すると、本発明による自動翻訳装置の訳文
生成方式を英日自動翻訳装置に適用した実施例の全体構
成が示されている。なお本発明は、英語を[1本語に翻
訳する英日自動翻訳装置のみならず、他の外国語を日本
語に翻訳する自動翻訳装置にも効果的に適用されること
は、言うまでもない。
生成方式を英日自動翻訳装置に適用した実施例の全体構
成が示されている。なお本発明は、英語を[1本語に翻
訳する英日自動翻訳装置のみならず、他の外国語を日本
語に翻訳する自動翻訳装置にも効果的に適用されること
は、言うまでもない。
同実施例は入力部10を有し、日本語に翻訳すべき英文
テキスト12がこれにより入力される。人力部lOはた
とえば、英数字キーなどの文字キーや機濠キーなどを有
するキーボード、紙に記録された英文テキストを読み取
る光学的文字縁J111 ”37)(OCR) 、およ
び(または)磁気ディスクなどの記憶媒体に記録された
英文テキストを読み込むファイル記憶装置などを含んで
よい。
テキスト12がこれにより入力される。人力部lOはた
とえば、英数字キーなどの文字キーや機濠キーなどを有
するキーボード、紙に記録された英文テキストを読み取
る光学的文字縁J111 ”37)(OCR) 、およ
び(または)磁気ディスクなどの記憶媒体に記録された
英文テキストを読み込むファイル記憶装置などを含んで
よい。
人力filOにより人力された英文テキストは、1部1
編集部14に読み込まれ、翻訳の前処理が行なわれる。
編集部14に読み込まれ、翻訳の前処理が行なわれる。
ここでは、主として文の認定と未知語の処理を行なう、
これは形y5素解析の−・部として機廃する。
これは形y5素解析の−・部として機廃する。
市編集された英文データは、iif編集で得られた情報
とともに形1ム素解析1−i111Bに転送される。形
通素解析部16では、単語辞書18を索引して文に分;
1し、英文の形通素を解析し、未知語の処理、固有名詞
、時の表現、数の表現などの各種のまとめあげを行ない
、付加疑問、同格の認定などの文全体の処理を行なう。
とともに形1ム素解析1−i111Bに転送される。形
通素解析部16では、単語辞書18を索引して文に分;
1し、英文の形通素を解析し、未知語の処理、固有名詞
、時の表現、数の表現などの各種のまとめあげを行ない
、付加疑問、同格の認定などの文全体の処理を行なう。
その形j8素解析ルールは解析ルールファイル3Bに格
納されている。
納されている。
こうして形通素解析された英文データは、形通素解析で
得られた辞書情報とともに構文解析I部20に転送され
る。構文解析1部20は、本実施例ではcfg文法(c
ontext−free grammar:文脈口由文
法)ルールを英文データに適用して文についてbott
oll−up、 right−to−leftに表層構
造の解析を行ない、すべての構文的可能性を見つけ出す
機能部である。
得られた辞書情報とともに構文解析I部20に転送され
る。構文解析1部20は、本実施例ではcfg文法(c
ontext−free grammar:文脈口由文
法)ルールを英文データに適用して文についてbott
oll−up、 right−to−leftに表層構
造の解析を行ない、すべての構文的可能性を見つけ出す
機能部である。
構文解析1部20で構文解析(バーズ)された英文デー
タは、その解析情報とともに構文解析11部22に送ら
れる。ここでは、構文解析工による表層的なバーズ結果
から、構造記述を適用して解を選択する。これによって
英語文の確からしい解析木を作成し、その構造を作る。
タは、その解析情報とともに構文解析11部22に送ら
れる。ここでは、構文解析工による表層的なバーズ結果
から、構造記述を適用して解を選択する。これによって
英語文の確からしい解析木を作成し、その構造を作る。
これらの構文解析ルールはやはり、解析ルールファイル
3Bに格納されている。
3Bに格納されている。
構文解析された英文データは、解析木のデータとして構
造変換部24に転送される。構造変換部24では、英語
文の中間的構造である構文木から対応する日本語文の構
文木を作成し、日本語文を訳出しやすい日本語基底構造
に変換する。
造変換部24に転送される。構造変換部24では、英語
文の中間的構造である構文木から対応する日本語文の構
文木を作成し、日本語文を訳出しやすい日本語基底構造
に変換する。
こうして構造変換された日本語の構文木を示す構文木デ
ータは訳文生成部26に送出され、後者にて訳文の生成
が行なわれる。これは、日本語の構文木の木構造から1
1本111〜の文を生成する機能である。まず、1,1
す11「1を11本1:bのそれに一致させ、るため、
jセ1序の入換えを行なって木構造を変更する構文生成
を行ない1次に形通素生成を行なって構文木においてt
op−down、 left−to−rightに訳文
を生成する。
ータは訳文生成部26に送出され、後者にて訳文の生成
が行なわれる。これは、日本語の構文木の木構造から1
1本111〜の文を生成する機能である。まず、1,1
す11「1を11本1:bのそれに一致させ、るため、
jセ1序の入換えを行なって木構造を変更する構文生成
を行ない1次に形通素生成を行なって構文木においてt
op−down、 left−to−rightに訳文
を生成する。
1訳文生成された日本語文データ、すなわち訳文データ
は、後編集部30に送られる。後編集部30では、翻訳
処理に利用した情報を使用し、辞書1Bを索引して訳文
データを修正し、より自然な日本語文を完成する。この
日本語文データは出力部32に転送され、翻訳された「
j氷詰文34として出力部32かう出力される。出力部
32は、たとえばプリンタ、ディスプレイ、および(ま
たは)磁気ディスクなどのファイル記憶装置を含む。
は、後編集部30に送られる。後編集部30では、翻訳
処理に利用した情報を使用し、辞書1Bを索引して訳文
データを修正し、より自然な日本語文を完成する。この
日本語文データは出力部32に転送され、翻訳された「
j氷詰文34として出力部32かう出力される。出力部
32は、たとえばプリンタ、ディスプレイ、および(ま
たは)磁気ディスクなどのファイル記憶装置を含む。
これらの一連の翻訳処理の流れは、本装置全体の制御を
統括する制御部38によって制御される。
統括する制御部38によって制御される。
cn語辞;!j18には、本実施例では英語および日本
語の単語についての辞−;データが格納され、解析ルー
ルファイル36には、形通素解析および4+4文解析の
ルールデータが格納されている。
語の単語についての辞−;データが格納され、解析ルー
ルファイル36には、形通素解析および4+4文解析の
ルールデータが格納されている。
制御部38には、操作表示部40が接続されている。操
作表示部38は、操作者から本装置に様々な指示をケえ
る、たとえば翻訳指示キー、カーソルキーなどの操作キ
ーや、入力英語文テキスト、翻訳結果の日本語文、辞書
情報などの中間データ、操作者に対する様々な指示など
を可視表示するティスプレィやインジケータを有する。
作表示部38は、操作者から本装置に様々な指示をケえ
る、たとえば翻訳指示キー、カーソルキーなどの操作キ
ーや、入力英語文テキスト、翻訳結果の日本語文、辞書
情報などの中間データ、操作者に対する様々な指示など
を可視表示するティスプレィやインジケータを有する。
なお、それらの操作表示機能の多くは、入力部10にキ
ーボードを備えている場合はそのキーボードに、また出
力部32にディスプレイを備えている場合はそのディス
プレイに含まれるように構成してよい。
ーボードを備えている場合はそのキーボードに、また出
力部32にディスプレイを備えている場合はそのディス
プレイに含まれるように構成してよい。
ところで構文解析工部20では、形通素解析された英文
データについて、ファイル記憶装置36に格納されてい
るcfg文法ルールを英文にr ight−to−1e
ftに適用してその文について可能性のあるすべての構
文解を導出する。この解は一般に構造木の形で理解され
る。これは、1つの文ごとにそれに含まれる11語また
は句が修飽関係および格関係などの従属ないしは共起関
係によって相17二に関連づけられ、たとえば親、r−
1孫といった相ll:の従属関係を示すものである。各
単語または句は、構造木の笛点すなわちノードの位置を
占める。
データについて、ファイル記憶装置36に格納されてい
るcfg文法ルールを英文にr ight−to−1e
ftに適用してその文について可能性のあるすべての構
文解を導出する。この解は一般に構造木の形で理解され
る。これは、1つの文ごとにそれに含まれる11語また
は句が修飽関係および格関係などの従属ないしは共起関
係によって相17二に関連づけられ、たとえば親、r−
1孫といった相ll:の従属関係を示すものである。各
単語または句は、構造木の笛点すなわちノードの位置を
占める。
こうして構文−1−のまとまりと従属関係を規定するデ
ータが得られると、これは構文解析II部24に送られ
る。このデータは、1ti述した構文木の形で容易に理
解される。これは、さらに構造変換部24で11本、:
/1文の構造に変換され、訳文生成部26では、それに
含まれる各ノートごとに訳文を生成してゆく、構造木に
おけるノードの処理は、top−down、 left
−to−right テ行なう。
ータが得られると、これは構文解析II部24に送られ
る。このデータは、1ti述した構文木の形で容易に理
解される。これは、さらに構造変換部24で11本、:
/1文の構造に変換され、訳文生成部26では、それに
含まれる各ノートごとに訳文を生成してゆく、構造木に
おけるノードの処理は、top−down、 left
−to−right テ行なう。
本実施例における訳文生成部26では、[1本語文を生
成する過程で、複数個の名1;−を含む名詞句について
次のような処理を行なう。すなわち、名詞句を形成する
各基1i14について、それが−字の快語であるか、二
字以りの1菓1語であるか、カタカナ語であるか、和語
であるか、英語などの外国語そのままの表記であるかな
ど、名5:・4の表記の仕方に応じて、すなわち単語の
字種に応じて表層的に名詞相互間の連結表記を生成して
いる。
成する過程で、複数個の名1;−を含む名詞句について
次のような処理を行なう。すなわち、名詞句を形成する
各基1i14について、それが−字の快語であるか、二
字以りの1菓1語であるか、カタカナ語であるか、和語
であるか、英語などの外国語そのままの表記であるかな
ど、名5:・4の表記の仕方に応じて、すなわち単語の
字種に応じて表層的に名詞相互間の連結表記を生成して
いる。
本実施例では、たとえば解析ルールファイル3Bの一部
に連結表記テーブルが用意され、このような名詞句を生
成する場合、この連結表記テーブルを参照し、これに応
じた連結表記を選択するように構成されている。連結表
記テーブルの例を第2図に示す。
に連結表記テーブルが用意され、このような名詞句を生
成する場合、この連結表記テーブルを参照し、これに応
じた連結表記を選択するように構成されている。連結表
記テーブルの例を第2図に示す。
このテーブルでは、名詞句を形成する各名詞のうち隣接
する2つの名詞について、両者が一字の漢語(漢語l)
であるか、工学以上の漢語(漢語2)であるか、カタカ
ナ語であるか、和語であるか、英語などの外国語そのま
まの表記であるかなどの組合せに応じて、rlJないし
「4」のコードが割り当てられる。この連結状態を示す
コードは、「1」で助詞「の」の挿入を規定し、「2」
で中点「・」の挿入を規定し、「3」で1字分の一スペ
ースの挿入を規定し、「4」で助詞も中点もスペースも
挿入しないことを規定している。なお、この連結表記テ
ーブルで英語とあるが、一般にこれは、英+i5にかぎ
らず外国語の文字をそのまま11木、:h文中に使用し
て表記する11語の場合を包含している。
する2つの名詞について、両者が一字の漢語(漢語l)
であるか、工学以上の漢語(漢語2)であるか、カタカ
ナ語であるか、和語であるか、英語などの外国語そのま
まの表記であるかなどの組合せに応じて、rlJないし
「4」のコードが割り当てられる。この連結状態を示す
コードは、「1」で助詞「の」の挿入を規定し、「2」
で中点「・」の挿入を規定し、「3」で1字分の一スペ
ースの挿入を規定し、「4」で助詞も中点もスペースも
挿入しないことを規定している。なお、この連結表記テ
ーブルで英語とあるが、一般にこれは、英+i5にかぎ
らず外国語の文字をそのまま11木、:h文中に使用し
て表記する11語の場合を包含している。
本実施例における訳文生成部26は、生成した日本語文
をシフトJISコードで表わしている。そこで、11本
語中語の字種をこの文字コードにより判定し、その判定
結果に従って連結表記テーブルを参照して連結コードを
得る。その処理フローを第3図に−示す。
をシフトJISコードで表わしている。そこで、11本
語中語の字種をこの文字コードにより判定し、その判定
結果に従って連結表記テーブルを参照して連結コードを
得る。その処理フローを第3図に−示す。
この例では一1構文木の形に構文解析された英文におけ
る1つの名詞句を形成する連続した名詞X1(i=1.
2.、、、n)について訳出を行なうものである。
る1つの名詞句を形成する連続した名詞X1(i=1.
2.、、、n)について訳出を行なうものである。
先頭の英語名詞から順に処理を行なうが(5o)、まず
先頭の英語名詞とそれに続く英語名詞をそれぞれレジス
タN’AとNOに格納する (51,51)、そこでレ
ジスタNAおよびNBの英単語について辞書18を索引
しく53.55) 、その日本語訳語をそれぞれレジス
タJAおよびJBに格納する(54.58)。
先頭の英語名詞とそれに続く英語名詞をそれぞれレジス
タN’AとNOに格納する (51,51)、そこでレ
ジスタNAおよびNBの英単語について辞書18を索引
しく53.55) 、その日本語訳語をそれぞれレジス
タJAおよびJBに格納する(54.58)。
そこで訳文生成部2Bは、レジスタJAおよびJBの内
容に1いてFUNI(JA、JR)なる処理を行なう、
この処理FUNIA、JB)は、レジスタJAとJBの
内容の表記の関係から一義的に決まる連結表記を発生す
る処理である。たとえば、本実施例では、レジスタJ’
Aと」Bに格納されている単語の先頭文字の文字コード
によってその単語の字種を判定し、これに基づいて第2
図に示す連結表記テーブルを参照して対応する連結コー
ドを発生する。たとえばシフトJISコードでは、カタ
カナ文字は0!8340から018398に定められて
いる。なお1判定した字種が漢語であるときは、さらに
そのff′語全体の字数も判断し、1字の漢語であるか
、2字以上のb 66であるかを決定する。その処理結
果、すなわち連結コードはレジスタNOに格納される(
57)。
容に1いてFUNI(JA、JR)なる処理を行なう、
この処理FUNIA、JB)は、レジスタJAとJBの
内容の表記の関係から一義的に決まる連結表記を発生す
る処理である。たとえば、本実施例では、レジスタJ’
Aと」Bに格納されている単語の先頭文字の文字コード
によってその単語の字種を判定し、これに基づいて第2
図に示す連結表記テーブルを参照して対応する連結コー
ドを発生する。たとえばシフトJISコードでは、カタ
カナ文字は0!8340から018398に定められて
いる。なお1判定した字種が漢語であるときは、さらに
そのff′語全体の字数も判断し、1字の漢語であるか
、2字以上のb 66であるかを決定する。その処理結
果、すなわち連結コードはレジスタNOに格納される(
57)。
そこで、レジスタJAに格納されている日本語単語にレ
ジスタNOの内容に応じて、助詞「の」の付加、中点「
・」の付加、1字分のスペースの付加、何も付加しない
などの処理FUN2(JA、No)を行ない、その結果
をレジスタYAKUにセットする。レジスタYAKUは
、こうして生成された日本語訳が順次格納される記憶手
段である。
ジスタNOの内容に応じて、助詞「の」の付加、中点「
・」の付加、1字分のスペースの付加、何も付加しない
などの処理FUN2(JA、No)を行ない、その結果
をレジスタYAKUにセットする。レジスタYAKUは
、こうして生成された日本語訳が順次格納される記憶手
段である。
このような・連の処理を1つの英語名1書4句に含まれ
る仝名、i!N1−Nnについて先頭から順に実行する
(59,130)、これによって、ratなる名J4
の羅列でなく、助、7.4 rの」や中点「・」、スペ
ースなどが適νJに挿入された自然な11本LIT’S
名詞句が生成される。こうして生成された訳文は、後編
集部3oで後処理が行なわれ、操作表示部4oに?’+
7視表示されるとともに、出力部32にて日本文34と
してたとえば印字出力される。
る仝名、i!N1−Nnについて先頭から順に実行する
(59,130)、これによって、ratなる名J4
の羅列でなく、助、7.4 rの」や中点「・」、スペ
ースなどが適νJに挿入された自然な11本LIT’S
名詞句が生成される。こうして生成された訳文は、後編
集部3oで後処理が行なわれ、操作表示部4oに?’+
7視表示されるとともに、出力部32にて日本文34と
してたとえば印字出力される。
ところで、上述の処理FUNI(JA、JB)では日本
語名詞の表層構造すなわち字種を判定するのに文字コー
ドを利用するように構成されていた。しかし、このよう
にしないで、またはこれに加えて、辞、1:18に連結
表記に関する表記情報として字種のデータを領iえ、英
単語により辞書18を索引して日本語訳語を得るときに
この表記情報も入手し、これにノ、(づいて前述の助詞
「の」の付加、中点「φ」の付加、1字分のスペースの
付加、何も付加しないなどの処理を行なうように構成し
てもよい。その場合、辞、I;18は、第4図に示すよ
うに各エントリのレコードに訳1:5の表記情報が登録
されている。そこで、このような辞、Hsを使用する場
合は、ステ7プ57における処理FIINI(JA、J
B)では、レジスタJAおよびJBに格納されている辞
書エントリから表記情報を取り出し、これに従って第2
図の連結表記テーブルを索引して連結コードを得る処理
を行なう。
語名詞の表層構造すなわち字種を判定するのに文字コー
ドを利用するように構成されていた。しかし、このよう
にしないで、またはこれに加えて、辞、1:18に連結
表記に関する表記情報として字種のデータを領iえ、英
単語により辞書18を索引して日本語訳語を得るときに
この表記情報も入手し、これにノ、(づいて前述の助詞
「の」の付加、中点「φ」の付加、1字分のスペースの
付加、何も付加しないなどの処理を行なうように構成し
てもよい。その場合、辞、I;18は、第4図に示すよ
うに各エントリのレコードに訳1:5の表記情報が登録
されている。そこで、このような辞、Hsを使用する場
合は、ステ7プ57における処理FIINI(JA、J
B)では、レジスタJAおよびJBに格納されている辞
書エントリから表記情報を取り出し、これに従って第2
図の連結表記テーブルを索引して連結コードを得る処理
を行なう。
このような辞、!; i aの表記情報による連結表記
の処理は、文字コードによる処理に比べて単語の意味ま
で考慮したきめ細かい処理を行なうことができる。すべ
ての名詞について文字コードから字種を判定して連結テ
ーブルを索引するような方式をとらず、表記情報を全部
辞書情報から得るように構成してもよい。また文字コー
ドから′r1定する方式の補助的手法として辞書情報か
ら得る方式を併用してもよく、その場合は文字コードか
ら判定する方式の効率の良さと、これでは対処しきれな
い例外的ケースを辞書情報により適切に処理できるきめ
細かさの両方の利点が得られる。
の処理は、文字コードによる処理に比べて単語の意味ま
で考慮したきめ細かい処理を行なうことができる。すべ
ての名詞について文字コードから字種を判定して連結テ
ーブルを索引するような方式をとらず、表記情報を全部
辞書情報から得るように構成してもよい。また文字コー
ドから′r1定する方式の補助的手法として辞書情報か
ら得る方式を併用してもよく、その場合は文字コードか
ら判定する方式の効率の良さと、これでは対処しきれな
い例外的ケースを辞書情報により適切に処理できるきめ
細かさの両方の利点が得られる。
効 1東
未発191によれば、11本1;Δの生成において、名
詞句を形成する名1;I4の字種に応じて、各名、;1
1間の連結に助、i、4 rの」を付加するか否かなど
の処理が行なわれる。この方式によれば、比較内筒「n
な処理で11木語の[1然さを失うことなく名詞句を表
記することができる。したがって名詞句の表記に関して
より自然な11本語が生成される。
詞句を形成する名1;I4の字種に応じて、各名、;1
1間の連結に助、i、4 rの」を付加するか否かなど
の処理が行なわれる。この方式によれば、比較内筒「n
な処理で11木語の[1然さを失うことなく名詞句を表
記することができる。したがって名詞句の表記に関して
より自然な11本語が生成される。
第1図は、本発明によるし1本語生成装置を英■[Iリ
ノ翻訳装置に適用した実施例の全体構成を示すa脂ブロ
ック図、 第2図は、第1図に示す実施例における解析ルールファ
イルに格納されている名詞の連結表記テーブルの例を示
す説明図、 第3図は、同実施例の11木11.〜生成処理における
名詞句の処理の例を示すフロー図、 第4図は、同実施例における単語辞書に格納されている
英語の単語についての辞1与情報の例を示す説明図であ
る。 主要部分の符号の説明 10、、、入力部 161.形yム素解析部 18、、、弔1悟辞書 20.22. 、構文解析部 24、、、構造変換部 26、、、訳文生成部 32、、、出力部 36、、、解析ルール 38、、、制御部 401.操作表示部
ノ翻訳装置に適用した実施例の全体構成を示すa脂ブロ
ック図、 第2図は、第1図に示す実施例における解析ルールファ
イルに格納されている名詞の連結表記テーブルの例を示
す説明図、 第3図は、同実施例の11木11.〜生成処理における
名詞句の処理の例を示すフロー図、 第4図は、同実施例における単語辞書に格納されている
英語の単語についての辞1与情報の例を示す説明図であ
る。 主要部分の符号の説明 10、、、入力部 161.形yム素解析部 18、、、弔1悟辞書 20.22. 、構文解析部 24、、、構造変換部 26、、、訳文生成部 32、、、出力部 36、、、解析ルール 38、、、制御部 401.操作表示部
Claims (1)
- 【特許請求の範囲】 1、外国語の単語についてそれに対応する日本語の訳語
に関する辞書データを格納した辞書手段と、 形通素および構文が解析された外国語の文について該辞
書手段を索引して対応する日本語の文を生成する日本語
生成手段とを有し、 該日本語生成手段は、前記外国語の文に複数個の名詞を
含む名詞句があると、前記辞書手段より得られた該名詞
の訳語の字種を判別し、該字種に応じて該名詞相互間の
連結表記を決定して日本語の文を生成することを特徴と
する日本語生成装置。 2、特許請求の範囲第1項記載の装置において、前記訳
語は文字コードで表わされ、前記日本語生成手段は、前
記名詞の先頭の文字の文字コードによって名詞の字種を
判定することを特徴とする日本語生成装置。 3、特許請求の範囲第2項記載の装置において、前記日
本語生成手段はさらに、前記名詞を形成する文字の数に
よって名詞の字種を判定することを特徴とする日本語生
成装置。 4、特許請求の範囲第1項記載の装置において、前記辞
書手段は、名詞について日本語の訳語の字種に関する辞
書データが格納され、前記日本語生成手段は、該辞書手
段から得られた辞書データから名詞の字種を判定するこ
とを特徴とする日本語生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61109631A JP2626722B2 (ja) | 1986-05-15 | 1986-05-15 | 日本語生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61109631A JP2626722B2 (ja) | 1986-05-15 | 1986-05-15 | 日本語生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62267871A true JPS62267871A (ja) | 1987-11-20 |
JP2626722B2 JP2626722B2 (ja) | 1997-07-02 |
Family
ID=14515173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61109631A Expired - Fee Related JP2626722B2 (ja) | 1986-05-15 | 1986-05-15 | 日本語生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2626722B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0258162A (ja) * | 1988-08-24 | 1990-02-27 | Toshiba Corp | 機械翻訳装置および機械翻訳方法 |
JPH02281373A (ja) * | 1989-04-24 | 1990-11-19 | Sharp Corp | 機械翻訳装置におけるハイフン生成方法 |
JPH0344764A (ja) * | 1989-07-12 | 1991-02-26 | Sharp Corp | 機械翻訳装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61272873A (ja) * | 1985-05-29 | 1986-12-03 | Hitachi Ltd | テキストの補整表記方式 |
-
1986
- 1986-05-15 JP JP61109631A patent/JP2626722B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61272873A (ja) * | 1985-05-29 | 1986-12-03 | Hitachi Ltd | テキストの補整表記方式 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0258162A (ja) * | 1988-08-24 | 1990-02-27 | Toshiba Corp | 機械翻訳装置および機械翻訳方法 |
JPH02281373A (ja) * | 1989-04-24 | 1990-11-19 | Sharp Corp | 機械翻訳装置におけるハイフン生成方法 |
JPH0344764A (ja) * | 1989-07-12 | 1991-02-26 | Sharp Corp | 機械翻訳装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2626722B2 (ja) | 1997-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5903858A (en) | Translation machine for editing a original text by rewriting the same and translating the rewrote one | |
JPH02308370A (ja) | 機械翻訳システム | |
JPH02165378A (ja) | 機械翻訳システム | |
JPH0344764A (ja) | 機械翻訳装置 | |
JPS62267871A (ja) | 日本語生成装置 | |
JP3876014B2 (ja) | 機械翻訳装置 | |
Eickel | Logical and layout structures of documents | |
JP2521435B2 (ja) | 日本語生成装置 | |
Schneiker et al. | Declarative Parsing and Annotation of Electronic Dictionaries. | |
Osborne et al. | Learning unification-based grammars using the Spoken English Corpus | |
Sarveswaran | Morphology and Syntax of the Tamil Language | |
JP2688020B2 (ja) | 派生語処理方式 | |
JPS6174068A (ja) | 翻訳装置 | |
JPS62267872A (ja) | 言語解析装置 | |
Kuzgun et al. | From constituency to UD-style dependency: Building the first conversion tool of Turkish | |
Prakapenka et al. | Creation of a Legal Domain Corpus for the Belarusian Module in NooJ: Texts, Dictionaries, Grammars | |
JP3892227B2 (ja) | 機械翻訳システム | |
Smith et al. | Morphological analysis of Sahidic Coptic for automatic glossing | |
JP2004086919A (ja) | 機械翻訳システム | |
Bird et al. | Web‐based Dictionaries for Languages of the South‐west USA | |
JPS61221875A (ja) | 日本語文章の単文化処理方式 | |
JPH0650503B2 (ja) | 情報抽出装置 | |
JPH04282764A (ja) | 非文訳出装置 | |
JPH0258162A (ja) | 機械翻訳装置および機械翻訳方法 | |
JPS6389975A (ja) | 言語解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |