[go: up one dir, main page]

JPS60193073A - Japanese word analyzer - Google Patents

Japanese word analyzer

Info

Publication number
JPS60193073A
JPS60193073A JP59047127A JP4712784A JPS60193073A JP S60193073 A JPS60193073 A JP S60193073A JP 59047127 A JP59047127 A JP 59047127A JP 4712784 A JP4712784 A JP 4712784A JP S60193073 A JPS60193073 A JP S60193073A
Authority
JP
Japan
Prior art keywords
meaning
candidates
input
word
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59047127A
Other languages
Japanese (ja)
Other versions
JPH0576067B2 (en
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59047127A priority Critical patent/JPS60193073A/en
Publication of JPS60193073A publication Critical patent/JPS60193073A/en
Publication of JPH0576067B2 publication Critical patent/JPH0576067B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To decide well-definedly the grammatical structure of an input sentense by displaying the input sentences, related word candidates and meaning candidates succcessively to a display means and analyzing the input sentence in response to an indication given from an input means. CONSTITUTION:A sentence structure analyzer 30 retrieves the grammar of a file 42 and analyzes the sentence structure. A controller 20 extracts a word number 1 out of a memory 22 in response to the end of the sentence structure analysis. Then a related word candidate output device 26 transfers and stores the related word candidates to a related word buffer 44; while a meaning candidate output device 28 transfers and stores the meaning candidates to a meaning candidate buffer 46. The controller 20 give indications to both devices 26 and 28 to read the storage contents of both buffers 44 and 46. An operator checks his/her desired operation while looking at a display.

Description

【発明の詳細な説明】 皮血豆芳 本発明は日本語解析装置、より具体的には、翻訳機械、
ワードプロセッサ、オフコン、パソコンなどの処理シス
テムに適用され、使用基が介入する日本語解析装置に関
する。
[Detailed Description of the Invention] The present invention relates to a Japanese language analysis device, more specifically, a translation machine,
The present invention relates to a Japanese language analysis device that is applied to processing systems such as word processors, office computers, and personal computers, and in which the user base intervenes.

Lu」 従来、たとえば機械翻訳などにおける日本語解析では、
大きく分けて次の3つの入力方式がとられていた。その
1つは、入力文に修正を加えずそのまま入力する方式で
ある。これは、解析結果が複数IJられて一義的に確定
せず、しかも必ずしも止しい、すなわち操作者の意図し
た結果力(得られるとは限らなかった。
Traditionally, in Japanese analysis in machine translation, for example,
Broadly speaking, the following three input methods were used. One method is to input the input sentence as it is without making any modifications. This is because a plurality of analysis results are obtained, and it is not determined uniquely, and it is not always possible to obtain the results intended by the operator.

第2の入力方式として、入力文を修正してから入力する
方式がある。これも第1の方式と同じ欠点があるが、得
られる解析結果の数は第1の方式より少なく5 しかも
正しい結果が得られる確・(へは高い。
As a second input method, there is a method in which the input sentence is corrected and then input. This method also has the same drawbacks as the first method, but the number of analysis results obtained is smaller than the first method.5 Moreover, the probability of obtaining correct results is high.

また第3の方式として入力文が特定の形式に制限される
方式がある。これは、解析結果が一意に確定する特長が
あるが、操作者がその制限゛を守らないと、正解が得ら
れないことがある。
Further, as a third method, there is a method in which the input sentence is limited to a specific format. This has the advantage that the analysis result is uniquely determined, but if the operator does not adhere to the limitations, the correct answer may not be obtained.

とくに第2および第3の方式は、入力文を所定の形式に
修正するのに専門的な知識が要求されるので、装置の操
作性および有用性に難がある。
In particular, the second and third methods require specialized knowledge to modify the input sentence into a predetermined format, and therefore have difficulties in the operability and usability of the devices.

これらの問題を解決するような日本語解析装置を実現し
ようとすると、その日本語文法解析プログラムが非常に
複雑になり、作成に多大の労力を必要とすることになる
If an attempt is made to realize a Japanese language analysis device that solves these problems, the Japanese grammar analysis program will become extremely complex and require a great deal of effort to create.

几−一但 本発明はこのような従来技術の欠点を解消し、使用′者
の意図する入力文の文法的構造を一意に決定できる日本
語解析装置を提供することを目的とする。
However, it is an object of the present invention to overcome the drawbacks of the prior art and to provide a Japanese language analysis device that can uniquely determine the grammatical structure of an input sentence intended by the user.

棒−誠 本発明の構成について以下、実施例に〕1(づいて説明
する。
The structure of the present invention will be described below with reference to Example 1.

第1図を参照すると、本発明による日本語解析装置の実
施例は、印字出力装置としてのプリンタ10、文字を可
視表示するCRTなどのディスプレイ12、およびカナ
などにより日本語文を入力できるキーボード14を有し
、これらが制御装置20に接続されている。キーボード
14は、カナキーの他に、「次候補キー」「OK主キー
なとの機能キーも備えている。次候補キーは、後述のよ
うに修飾語の係り受け候補や単語の意味候補を次の順位
のものにシフトさせるための指示キーである。またOK
主キー、それらの候補か意図したものと合致していると
きに操作して次の操作ステ・ンブに移行させるための指
示キーである。
Referring to FIG. 1, the embodiment of the Japanese language analysis device according to the present invention includes a printer 10 as a print output device, a display 12 such as a CRT for visually displaying characters, and a keyboard 14 for inputting Japanese sentences using kana or the like. and these are connected to the control device 20. In addition to the kana key, the keyboard 14 also has function keys such as a "next candidate key" and "OK primary key.The next candidate key is used to select the next modification candidate for a modifier or the meaning candidate for a word, as described below. This is an instruction key to shift to the item with the rank of
The primary key is an instruction key that is operated when one of the candidates matches the intended one to move to the next operation step.

制御装置20は処理システムで実現され、ディスプレイ
12の表示画面制御を含む本日本語解析装置各部の制御
を行なう。制御装置20のシステムメモリとして記tα
装煮22が設けられている。これは、木し1禾語解析装
+y、+による処Jjl結果を一時蓄積したり、他のプ
ログラムやデータの記憶領域として使用される。
The control device 20 is implemented as a processing system, and controls various parts of the Japanese language analysis device including display screen control of the display 12. Recorded as the system memory of the control device 20 tα
A cooking tank 22 is provided. This is used to temporarily store the processing results of the language analysis device +y, +, and is used as a storage area for other programs and data.

制御装置20で制御され、木日本語゛解析装置本末の解
析動作を実行するのが、形態素解析装置24、構文解析
装置30、係り受け候補出力装置26および意味候補出
力装置28である。これらの装置24.30.26およ
び28は、制御装置20の処理システムに含まれてもよ
く、またはこれと別個の処理システムで実現してもよい
A morphological analyzer 24, a syntactic analyzer 30, a dependency candidate output device 26, and a semantic candidate output device 28 are controlled by the control device 20 and execute the analysis operations at the end of the Japanese language analyzer. These devices 24, 30, 26 and 28 may be included in the processing system of the control device 20 or may be realized in a separate processing system.

形態素解析装置24には、単語相互間の接続を規定する
接続表や単語辞書が記憶されている磁気ディスクなどの
ファイル記憶装置40が接続されている。単語辞書は、
語の表記、読み方、品詞、意味、属性などが単thごと
に記述されている。形態素解析装置24は、たとえばカ
ナ嘆字況在文の形で入力された日本語入力文を、ファイ
ル40を索引して単語単位に分解し、共晶の品詞を分析
する装置である。
Connected to the morphological analysis device 24 is a file storage device 40 such as a magnetic disk that stores a connection table and a word dictionary that define connections between words. The word dictionary is
The notation, pronunciation, part of speech, meaning, attributes, etc. of words are described for each unit. The morphological analysis device 24 is a device that indexes the file 40, decomposes a Japanese input sentence inputted in the form of, for example, a kana kanji situation sentence into word units, and analyzes the eutectic part of speech.

構文解析装置30には、解析文法を記述する文法辞書が
記憶されているファイル記七〇装置42が接続されてい
る。その蓄)J−データフォーマットは・第212に示
すように修飾5ムと被修飾語について品詞および属性・
育、味が対応してリストされている。
Connected to the parsing device 30 is a file writing device 42 in which a grammar dictionary describing parsing grammars is stored. The J-data format is as shown in Section 212.
The growth and taste are listed accordingly.

この文法辞書に蓄積されている解析文法の一例を部分的
にft52A図に示す。においてαはどのような伺14
5/iであってもよいことを示す。なお以下の説明およ
び図示では、説明の複雑化を避けるため語の属性につい
ては本発明の理解に直接関係ないので省略する。
An example of the parsing grammar stored in this grammar dictionary is partially shown in diagram ft52A. What kind of question is α in 14?
This indicates that it may be 5/i. In the following description and illustrations, in order to avoid complicating the description, the attributes of words will be omitted since they are not directly relevant to the understanding of the present invention.

構文解析装2)30は図示のように、制御部32、なら
びに1対のメモリスタック34Aおよび34Bからなる
。構文解析装置30は、形態素解析装置24で品詞に分
解された入力日本語文を、文法辞書42を索引して各語
の構文構造について解析する装置である。本実施例では
、その解析結果の文法構造は一意であり、 昧さは各単
語にリンクさせて出力される。なおそれらの優先度は、
各単語の条件によって近い方の係り受け関係が高くなる
As shown, the parser 2) 30 consists of a control section 32 and a pair of memory stacks 34A and 34B. The syntactic analysis device 30 is a device that indexes the grammar dictionary 42 and analyzes the input Japanese sentence, which has been decomposed into parts of speech by the morphological analysis device 24, for the syntactic structure of each word. In this embodiment, the grammatical structure of the analysis result is unique, and ambiguity is output linked to each word. Furthermore, their priority is
Depending on the conditions of each word, the dependency relationship of the closer one becomes higher.

係り受け候補出力装;ξ26には、係り受けバッファ4
4が接続され、これには、注目している語、すなわち被
処理中の語の係り得るすべての語(被修飾語)が番号で
蓄積される。その蓄積データフォーマットは、第3図に
示すよう・に被修飾語の番号が優先度の高い方から矢印
Aの順序に低い方に順番にリストされる。係り受け候補
出力’A置26は、係り受けバッファ4Bから係り受け
候補を選択する装置である。
Dependency candidate output device; ξ26 includes dependency buffer 4
4 is connected, and all words (modified words) that can be related to the word of interest, that is, the word being processed, are stored in this number. In the stored data format, as shown in FIG. 3, the modified word numbers are listed in order from the highest priority to the lowest in the order of arrow A. The modification candidate output 'A position 26 is a device that selects modification candidates from the modification buffer 4B.

意味候補出力装置28には意味バッファ46が接続され
、後者には注目している語の有するすべての意味が蓄積
される。その蓄積データフォーマットは、第4図に示す
ように、被修飾語の番号に対応して各単語の意味が優先
度の高い方から低い方に矢印Bの順にリストされる。こ
れにアクセスして意味候補出力′!A置28は、修飾語
の意味候補を選択する。
A meaning buffer 46 is connected to the meaning candidate output device 28, and the latter stores all meanings of the word of interest. As shown in FIG. 4, the accumulated data format is such that the meanings of each word are listed in the order of arrow B, from highest to lowest priority, corresponding to the number of the modified word. Access this and output semantic candidates! A position 28 selects meaning candidates for the modifier.

これらの装置により解析された結果のデータは、記憶装
置22に一時的に蓄積され、その構文解析結果のデータ
形式は第5図に示すフォーマットをとり、本装置〆Lに
よる最終結果は第6図に示すデータフォーマットをとる
。なお、各修飾語の番号を蓄積する記憶スロットには複
数の番号が含まれることもあり得る。
The data as a result of analysis by these devices is temporarily stored in the storage device 22, and the data format of the syntax analysis results is shown in FIG. 5, and the final result obtained by this device is shown in FIG. The data format is shown in . Note that a plurality of numbers may be included in the storage slot that stores the number of each modifier.

本装置の動作を説明する。キーボード14から、たとえ
ば「高い大理石の机」なる文を入力したとする。この意
図する意味は、材料が大理石からなる高価な机であり、
大理石の高さが高いのではないとする。
The operation of this device will be explained. For example, suppose that the sentence ``tall marble desk'' is input from the keyboard 14. The intended meaning is an expensive desk made of marble;
Assume that the height of the marble is not high.

この入力文は制御装置20により記七〇装置22に一時
蓄積され、またディスプレイ12に可視表示される。こ
れとともに形態素解析装置24は、この入力文を形態素
解析する。これは接続表・単語辞書40を使用し、従来
と同様の方法で行なってよい。その解析結果は第7図に
示すようになる。これは構文解析装置30に転送され、
第8A図および第8B図に示すような形でそれぞれスタ
ック34Aおよび34Bに蓄積される。すなわち、スタ
ック34Aには現在注目している語(修飾語)が、また
スタック34Bにはスタック34Aの語の被修飾語が蓄
積される。
This input sentence is temporarily stored in the recording device 22 by the control device 20 and is visually displayed on the display 12. At the same time, the morphological analysis device 24 morphologically analyzes this input sentence. This may be done using the connection table/word dictionary 40 in a conventional manner. The analysis results are shown in FIG. This is transferred to the parser 30,
They are accumulated in stacks 34A and 34B, respectively, as shown in FIGS. 8A and 8B. That is, the currently focused word (modifier) is stored in the stack 34A, and the modified word of the word in the stack 34A is stored in the stack 34B.

そこで構文解析装置30は、第2A図に示すファイル4
2の文法を索引して構文解析を行なう。まず、スタック
34Aの各状態に応じて、この例では文法辞書42の(
1)〜(8)がチェックされる。この例では、(1)お
よび(5)についてはスタック34Bに「名詞+α」で
あって1人物」に該当する候補がないので、リジェクI
・される。それ以外の(2)〜(4) (e)〜(8)
については、スタック34Bに該当する候補があるので
、第5A図に示す解析結果を得る。これは第5図に示す
データフォーマットで表現されている。
Therefore, the syntax analysis device 30 stores the file 4 shown in FIG. 2A.
2 is indexed and parsed. First, depending on each state of the stack 34A, in this example, the (
1) to (8) are checked. In this example, for (1) and (5), there is no candidate in the stack 34B that corresponds to "noun + α" and 1 person, so reject I
・To be done. Other (2) to (4) (e) to (8)
Since there is a corresponding candidate in the stack 34B, the analysis result shown in FIG. 5A is obtained. This is expressed in the data format shown in FIG.

次に構文解析装置30は、スタック34Aには11スタ
ツク34Bから語番号2の「大理石十のJをシフトして
、スタック34Bには語番号3の「机Jが残る。これに
ついて同様に文法チェックを行ない構文解析結果を得る
Next, the syntax analyzer 30 shifts word number 2 "Marble J" from stack 34B to stack 34A, and word number 3 "Desk J" remains in stack 34B. and obtain the syntax analysis result.

さらに同様にして1t/! M号3の「机」がスタック
34Aから348に移送されるが、この例ではこれが文
の末尾であるので、ここで解析を終了する。そこで第5
B図に示す構文解析結果が得られる。これは制御装置2
0から記憶装置22に転送され、蓄積される。なお、こ
の構文解析結果データは第5図に示すフォーマットで記
述されている。
Similarly, 1t/! The M number 3 "desk" is transferred from the stack 34A to the stack 348, but in this example, since this is the end of the sentence, the analysis ends here. Therefore, the fifth
The syntax analysis result shown in Figure B is obtained. This is control device 2
The data is transferred from 0 to the storage device 22 and stored. Note that this syntax analysis result data is written in the format shown in FIG.

制御装置20は構文解析の終了に応動して記憶装置22
から語番号lを抽出する。そこで、係り受け候補出力装
置26によりその係り受け候補を係り受けバッファ44
に、また意味候補出力装置46によりその意、味候補を
意味候補バッファ46に転送して蓄積させる。その状1
1;を第3A図に示す。
The control device 20 stores the storage device 22 in response to the completion of the parsing.
Extract the word number l from. Therefore, the modification candidate output device 26 outputs the modification candidate to the modification buffer 44.
Then, the meaning candidate output device 46 transfers the meaning and flavor candidates to the meaning candidate buffer 46 and stores them therein. Its condition 1
1; is shown in FIG. 3A.

ディスプレイ12にはこれまで入力文が表示されている
が、ここで、柱目語、すなわち語番号lの「高い」が本
実施例では反転表示される。これは、第9A図にディス
プレイ12の表示画面50においてハツチング領域52
で示す。
The input sentence has been displayed on the display 12 so far, but the column word, that is, the word number l "high" is displayed in reverse video in this embodiment. This is shown in the hatched area 52 on the display screen 50 of the display 12 in FIG. 9A.
Indicated by

そこで制御装置20は係り受け候補出力装置2Bに、係
り受け候補を要求する信号を送出する。係り受け候補出
力装置26はこれに応動して係り受けを索引し、その優
先度の最も高い語、すなわち第3A図左端の被修飾語番
号2を索出して制御装置20に転送する。制御装置20
は語番号2に該当する表示語「大理石」の表示をブリン
クさせる。これを、第9B図では矩形の点線54で示す
Therefore, the control device 20 sends a signal requesting a modification candidate to the modification candidate output device 2B. In response to this, the modification candidate output device 26 indexes the modifications, retrieves the word with the highest priority, that is, the modified word number 2 at the left end in FIG. 3A, and transfers it to the control device 20. Control device 20
blinks the display word "marble" corresponding to word number 2. This is indicated by a rectangular dotted line 54 in FIG. 9B.

そこで操作者は、ブリンク中の語が意図した係り受け語
であるか否かをチェックし、この例では意1図したもの
ではないので、キーボード14の次候補キーを操作する
。これに応動して制御装置20は、前述と同様にして係
り受け出力候補装置26に次に優先度の高い候゛補を要
求する。これによって係り受けバッファ44からは、次
の順位の被修飾語番号3が索出され、制御装置20に転
送される。そこで制御装置20は、表示の「大理石」の
ブリンクを停止し、「机」をプリンタさせる。
The operator then checks whether the word in the link is the intended dependency word or not, and since it is not the intended word in this example, he operates the next candidate key on the keyboard 14. In response to this, the control device 20 requests the dependency output candidate device 26 for the next highest priority candidate in the same manner as described above. As a result, the next ranked modified word number 3 is retrieved from the dependency buffer 44 and transferred to the control device 20. Then, the control device 20 stops the blinking of the displayed "marble" and causes the "desk" to be printed.

再び操作者は、ブリンク中の語が意図したものであるか
否かをチェックし、この例では意図した係り受け語であ
るので、キーボード14のOK主キー操作する。これに
応動して制御装置20は、「机jの表示ブリンクを停止
し、係り受け候補出力装置26に候補確定を示す信号を
送出し、同装置26は係り受けバッファ44から被修飾
語番号2を消去する。
The operator again checks whether the word in the link is the intended word or not, and since it is the intended dependent word in this example, he operates the OK primary key on the keyboard 14. In response to this, the control device 20 stops the display blinking of desk j, sends a signal indicating candidate confirmation to the modification candidate output device 26, and the device 26 outputs the modified word number 2 from the modification buffer 44. Erase.

次に制御装置20は、意味候補出力装置28に対して被
修飾語番号3について、修飾語番号1の意味候補を要求
する信号を送出する。意味候補出力装置28はこれに応
動して意味バッファ4Bを索引し、被修飾語番号3の優
先度の帰も高い候補、すなわち第3A図における最上部
の意味「評価」を索出する。これは制御装置20に転送
され、第8C図に示すディスプレイ12の表示領域56
に表示される。
Next, the control device 20 sends a signal to the meaning candidate output device 28 requesting the meaning candidate of the modifier number 1 for the modified word number 3. In response, the meaning candidate output device 28 indexes the meaning buffer 4B and retrieves a candidate with a high priority for the modified word number 3, that is, the meaning "evaluation" at the top in FIG. 3A. This is transferred to the control device 20 and is transmitted to the display area 56 of the display 12 as shown in FIG. 8C.
will be displayed.

操作者はこの表示5θにより、この意味が意図し−たも
のであるか否かをチェックし、この例では意図したもの
ではないので、キーボード14の次候補キーを操作する
。これに応動して制御装置20は、前述と同様にして意
味候補出力装置28に次に優先度の高い候補を要求する
。これによって意味バッファ46からは、次の順位の意
味「価値」が索出され、制御装置20に転送される。そ
こで制御装置20は、表示領域56に表示させる。この
状態を第8D図に示す。
The operator checks this display 5θ to see if this meaning is what he or she intended.In this example, since it is not what he intended, he operates the next candidate key on the keyboard 14. In response to this, the control device 20 requests the meaning candidate output device 28 for the candidate with the next highest priority in the same manner as described above. As a result, the meaning "value" of the next rank is retrieved from the meaning buffer 46 and transferred to the control device 20. Therefore, the control device 20 causes the display area 56 to display the information. This state is shown in FIG. 8D.

操作者は再度この表示5Gにより、この、α、味が意図
したものであるか否かをチェックし、この例では意図し
たものであるので、キーボード14のOK主キー操作す
る。これに応動して制御装置20は、表示画面50にお
ける注目語「高い」の反転表示52を中止し、意味表示
56を消去する。これとともに意味候補出力装置28に
候補確定を示す信号を送出し、同装置28は意味バッフ
ァ46から[価値J以外の意味を消去する。この状態を
第3B図に示す。
The operator checks the display 5G again to see if the taste, α, is the one he/she intended, and in this example, since it is the one he/she intended, he/she operates the OK primary key on the keyboard 14. In response to this, the control device 20 stops the inverted display 52 of the attention word "Kai" on the display screen 50 and erases the meaning display 56. At the same time, a signal indicating confirmation of the candidate is sent to the meaning candidate output device 28, and the device 28 deletes meanings other than the value J from the meaning buffer 46. This state is shown in FIG. 3B.

制御装置20は、係り受け候補出力装置26および意味
候補出力装置28に対し、それぞれ係り受けバッファ4
4および意味バッファ46の蓄積内容を読み出すように
指示する。また、記憶装置22に蓄積されている構文解
析結果から表記および品詞(属性)を読み出し、第6A
図に示すようにデータを編成する。
The control device 20 provides a dependency buffer 4 for the dependency candidate output device 26 and the meaning candidate output device 28, respectively.
4 and the contents stored in the meaning buffer 46 are read out. In addition, the notation and parts of speech (attributes) are read out from the syntax analysis results stored in the storage device 22, and
Organize the data as shown in the diagram.

同様にして、入力文の以降の各語についてもこのような
処理、解析を行ない、すべての語の処理を終了すると、
その解析結果は第6日図に示す状態となる。
In the same way, each subsequent word of the input sentence is processed and analyzed in this way, and when all words have been processed,
The analysis results are as shown in the 6th day diagram.

このように本実施例によれば、操作者と本装置との間に
おける対話処理の応答速度が速く、構文解析を2度以上
行なわなくてよい特徴がある。
As described above, according to this embodiment, the response speed of the interaction process between the operator and the present device is fast, and syntax analysis does not need to be performed more than once.

第10図を参照すると、本発明の他の実施例が示されて
いる。以降の図において第1図と同じ構成要素は同一の
参照符号で示され、説明の重複は避ける。
Referring to FIG. 10, another embodiment of the invention is shown. In the subsequent figures, the same components as in FIG. 1 are indicated by the same reference numerals to avoid duplication of explanation.

第1図に示す実施例と相違する点は、係り受け候補出力
装置126が文法を使用して入力文から係り受け候補を
抽出することである。したがって第1図実施例における
係り受けバッファ44が本実施例では設けられておらず
、係り受け候補出力装置12Bは意味バッファ148に
接続されている。
The difference from the embodiment shown in FIG. 1 is that the dependency candidate output device 126 uses grammar to extract dependency candidates from the input sentence. Therefore, the modification buffer 44 in the embodiment shown in FIG. 1 is not provided in this embodiment, and the modification candidate output device 12B is connected to the meaning buffer 148.

意味バッファ14Bは、第11図に示すように意味候補
が優先度の高い方から矢印Cの方向に低い方に蓄積され
ている。意味候補出力装置128は、意味バッファ14
6から意味候補を選択する装置である。
In the meaning buffer 14B, as shown in FIG. 11, meaning candidates are accumulated in the direction of arrow C from higher priority to lower priority. The meaning candidate output device 128 is the meaning buffer 14
This is a device that selects meaning candidates from 6.

構文解析装置130は、係り受け候補出力装置126と
も接続され、文法辞書42を索引して最も近い係り受け
を優先として解析を行なう。したがって、その解析結果
に 昧さがなく、単一の解析結果が出力されるのが特徴
である。文法辞書42には、第2B図に示す文法が蓄積
されている。なお、これは蓄積文法の一部を示し、/(
スラッシュ)は「または」を意味する。
The syntax analysis device 130 is also connected to the modification candidate output device 126, and indexes the grammar dictionary 42 and performs analysis with priority given to the closest modification. Therefore, the analysis results are unambiguous and a single analysis result is output. The grammar dictionary 42 stores the grammar shown in FIG. 2B. Note that this shows part of the storage grammar, /(
slash) means "or".

第1図の実施例の説明と同じ入力文例で第1O図の装置
の動作を説明する。入力文がスタック34Aおよび34
Bに蓄積されるまでは第1図の実施例と同様である。つ
まりその内容は第8A図および第8B図に示すようにな
る。
The operation of the apparatus shown in FIG. 1O will be described using the same input sentence example as in the description of the embodiment shown in FIG. Input sentences stack 34A and 34
The process until the data is stored in B is the same as the embodiment shown in FIG. In other words, the contents are as shown in FIGS. 8A and 8B.

スタック34Aの状態により文法(1)(第2B図)が
スタック34Bの被修飾語番号2に適用される。
Depending on the state of stack 34A, grammar (1) (FIG. 2B) is applied to modified word number 2 of stack 34B.

これは文法に合うので、語番号lについての解析を終了
し、スタック34Aに次の語をシフトさせる。その解析
結果は第80図に示すようになる0文法解析が1つでも
成功すれば、そこでその語の解析を終了し、次の語の解
析に移行する。
Since this matches the grammar, the analysis for word number l is ended and the next word is shifted onto the stack 34A. The analysis result is as shown in FIG. 80. If even one grammatical analysis is successful, the analysis of that word ends and the process moves on to the analysis of the next word.

同様にしてこの入力文の以降の語について解析が行なわ
れ、第6D図に示す解析結果を得る。これは“制御装置
20から記憶袋M22に転送され、蓄積される。
Subsequent words of this input sentence are analyzed in the same manner, and the analysis results shown in FIG. 6D are obtained. This is transferred from the control device 20 to the storage bag M22 and stored.

構文解析が終了すると制御装置20はまず、語番号lの
「高い」を記憶装置22から読み出し、画面50上で反
転表示52させる(第8A図)。
When the syntactic analysis is completed, the control device 20 first reads out the word number l, "high", from the storage device 22 and displays it in reverse video 52 on the screen 50 (FIG. 8A).

次に制御装置20は、語番号1の被修飾語の項をチェッ
クし、被修飾語番号2を取り出して表示画面50上でプ
リンク54させる(第8B図)。
Next, the control device 20 checks the modified word section of word number 1, takes out the modified word number 2, and links it 54 on the display screen 50 (FIG. 8B).

操作者は、これが意図した係り受けと異なるので、次候
補キーを操作する。これによって制御装置20は、係り
受け候補出力装置128を起動する。
Since this is different from the intended modification, the operator operates the next candidate key. As a result, the control device 20 activates the dependency candidate output device 128.

係り受け候補出力装置126はこれに応動し、語番号2
以外の語を候補とし、語番号lの文法解析を文法辞書4
2を索引して行なう。その結果、第6E図に示す解析結
果を得る。これらのうち、意味は意味バッファ14Bに
転送してこれに格納し、意味のztrを空にして前の構
文解析結果と置き換える。この結果は、「大理石」をブ
リンク表示させることで操作者に知らせる。
In response, the dependency candidate output device 126 outputs word number 2.
Using other words as candidates, perform grammatical analysis of word number l using Grammar Dictionary 4.
Do this by indexing 2. As a result, the analysis results shown in FIG. 6E are obtained. Among these, the meaning is transferred to the meaning buffer 14B and stored therein, and the meaning ztr is emptied and replaced with the previous syntax analysis result. This result is notified to the operator by displaying the "marble" in a blinking manner.

そこで操作者がOK主キー押すと、制御装置20はブリ
ンクを停止し、意味候補出力装置128に意味奴補を要
求する。意味候補出力装置12Bは意味バッファ148
の最上端から「評価」を取り出し。
When the operator presses the OK main key, the control device 20 stops blinking and requests the meaning candidate output device 128 to provide a meaning candidate. The meaning candidate output device 12B is a meaning buffer 148
Extract "Evaluation" from the top of the page.

制御装置20に転送する。これは第8C図に示す状態で
画面50に表示される。
Transfer to the control device 20. This is displayed on the screen 50 in the state shown in FIG. 8C.

そこで操作者は次候補キーを押すと、制御装置20は意
味候補出力装置128に次の候補をめる。
Then, when the operator presses the next candidate key, the control device 20 inputs the next candidate into the meaning candidate output device 128.

次の候補は第8D図に示すように表示される。The next candidate is displayed as shown in Figure 8D.

操作者がOK主キー押すと、制御装置はまず、「高いJ
の反転表示を中止し、意味の表示を消去する。次に解析
結果を記憶装置22から取り出し、意味の項を「価値」
にする。
When the operator presses the OK primary key, the controller will first
Stops highlighting and clears the meaning. Next, the analysis result is retrieved from the storage device 22 and the meaning term is "value".
Make it.

すべての語について同様の処理を行なった結果を第6B
図に示す。
The results of the same process for all words are shown in 6B.
As shown in the figure.

このように本実施例では、構文解析において昧さを扱う
こkがないので、無駄な処理を行なうことがなく、また
処理システムの記憶容量が第1図の実施例と比較して少
なくてよい特徴がある。
In this way, in this embodiment, since there is no need to deal with ambiguity in syntax analysis, no unnecessary processing is performed, and the storage capacity of the processing system can be smaller than in the embodiment shown in FIG. It has characteristics.

第12図を参照すると1本発明のさらに他の実施例では
、文法表250および意味バッファ246が第1θ図の
実施例と相違する0文法表250は、文法辞、+142
より簡単な、あるいは条件の弱い文法が蓄積されている
。そのデータフォーマットを第13図に示す。また意味
バッファ24Bは、意味候補を一時記憶するもので、そ
のデータフォーマットは第11図と同様である、 第12図の実施例の動作は、基本的には第10図のそれ
と同様である。相違する点はまず、第8A図の状態で構
文解析を行なう際、第1θ図の実施例では文法辞書42
を参照するが、第12図の実施例ではそうしないで文法
表250を参照することである。その結果、第BE図に
示す解析結果が得られる。これらの解析結果(第6E図
)のうち、意味は意味バッファ246に転送してこれに
格納し、意味の項を空にして前の構文解析結果と置き換
える。以降、意味バッファ24Bから意味候補が選択さ
れて表示、処理が行なわれるのは、第10図の実施例と
同様である。
Referring to FIG. 12, in yet another embodiment of the present invention, the grammar table 250 and semantic buffer 246 differ from the embodiment of FIG.
Grammars that are simpler or have weaker conditions have been accumulated. The data format is shown in FIG. The meaning buffer 24B temporarily stores meaning candidates, and its data format is the same as that shown in FIG. 11. The operation of the embodiment shown in FIG. 12 is basically the same as that shown in FIG. 10. The difference is that when parsing is performed in the state shown in FIG. 8A, the grammar dictionary 42 is used in the embodiment shown in FIG. 1θ.
However, in the embodiment of FIG. 12, the grammar table 250 is referred to instead. As a result, the analysis results shown in FIG. BE are obtained. Among these analysis results (FIG. 6E), the meaning is transferred to and stored in the meaning buffer 246, and the meaning term is emptied and replaced with the previous syntax analysis result. Thereafter, meaning candidates are selected from the meaning buffer 24B and displayed and processed in the same manner as in the embodiment shown in FIG.

このように第12図の実施例は、第1θ図の実施例の特
徴を備えている他、第1図の実施例と比較しても処理速
度が速い4.シ徴がある。
As described above, the embodiment shown in FIG. 12 not only has the features of the embodiment shown in FIG. 1θ, but also has faster processing speed than the embodiment shown in FIG. There are symptoms.

藤−] 本発明によれば、文を人力する際、これを修正する必要
がなく、簡単な文法を使用することができ、しかも操作
者は専門的な知識を要求されない。また、操作者が意図
した文の意味および構文構造を一意に得ることができ、
解析速度が速い特徴がある。本装置はとくに、制限文法
を使用し、ある種の制限を加えて文を入力する方式には
、より効果的である。
Fuji-] According to the present invention, when a sentence is manually written, there is no need to correct it, simple grammar can be used, and the operator is not required to have specialized knowledge. In addition, the meaning and syntactic structure of the sentence intended by the operator can be uniquely obtained.
It is characterized by fast analysis speed. The present device is particularly effective for a method that uses a restricted grammar and inputs sentences with certain restrictions.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による日本語解析装置の実施例を示すブ
ロック図、 第2図、第2A図、第2B図、第3図、第3A図、第3
B図、第4図、第5図、第5A図、第5B図、第6図、
第6A図〜第8E図、第7図、第8A図、第8B図、第
8A図〜第8D図は、第1図に示す実施例の動作を説明
するための説明図、 第1θ図は本発明の他の実施例を示すブロック図、 第11図は第10図に示す実施例の動作を説明するため
の説明図、 第12図は本発明のさらに他の実施例を示すブロック図
、 第13図は第12図に示す実施例の動作を説明するため
の説明図である。 一:す1iず/) 、’p 、H 3P・・・ディスプレイ 14、、、、キーボード 20、、、制御装置 22、、、記憶装置 24、、、形態素解析装置 28、、、係り受け候補出力装置 28、、、意味候補出力装置 30、、、構文解析装置 42、、、文法辞書 44、、、係り受けバッファ 4B、、、意味バッファ 特許出願人 株式会社リコー 図面の浄書(内容に変更なし) 第2図 42 第2A図 2 第2B図 第3図 4 第4図 6 第3A図 2: 第3B図 第5図 第6図 ノ′ 第5A図 第58図 第6A図 第68図 第6C図 第60図 第6E図 第7図 第8A図 第88図 第9A図 第98図 第90@ 第9D図 手続補正書 昭和58年4月11日 特許庁長官 若杉和夫 殿 1.4件の表示 昭和59年特許願第47127号 2、発明の名称 日本語解析装置 3、補止をする者 事件との関係 特許出願人 住 所 東京都大田区中馬込1丁目3番6号名 称 (
874) 株式会社 リ コ −4、代理人 住所〒105 東京都港区虎ノ門1−13−4 6、補正の内容 出願時提出した図面を別紙のとおり正式図面(浄書内容
に変更なし)と差し替える。 7、添イリ書類の目録 (1)正式図面 1通
FIG. 1 is a block diagram showing an embodiment of the Japanese language analysis device according to the present invention; FIG. 2, FIG. 2A, FIG. 2B, FIG. 3, FIG.
Figure B, Figure 4, Figure 5, Figure 5A, Figure 5B, Figure 6,
Figures 6A to 8E, Figure 7, Figure 8A, Figure 8B, and Figures 8A to 8D are explanatory diagrams for explaining the operation of the embodiment shown in Figure 1, and Figure 1θ is A block diagram showing another embodiment of the present invention, FIG. 11 is an explanatory diagram for explaining the operation of the embodiment shown in FIG. 10, FIG. 12 is a block diagram showing still another embodiment of the present invention, FIG. 13 is an explanatory diagram for explaining the operation of the embodiment shown in FIG. 12. 1:S1izu/) ,'p,H 3P... Display 14, Keyboard 20, Control device 22, Storage device 24, Morphological analysis device 28, Dependency candidate output Device 28, ... Meaning candidate output device 30, ... Syntactic analysis device 42, ... Grammar dictionary 44, ..., Dependency buffer 4B, ... Meaning buffer Patent applicant: Engraving of drawings by Ricoh Co., Ltd. (No change in content) Fig. 2 42 Fig. 2A 2 Fig. 2B Fig. 3 4 Fig. 4 6 Fig. 3A 2: Fig. 3B Fig. 5 Fig. 6 No' Fig. 5A Fig. 58 Fig. 6A Fig. 68 Fig. 6C Fig. 60 Fig. 6E Fig. 7 Fig. 8A Fig. 88 Fig. 9A Fig. 98 Fig. 90 @ Fig. 9D Procedural amendments April 11, 1981 Commissioner of the Japan Patent Office Kazuo Wakasugi 1. Display of 4 items 1959 Patent Application No. 47127 2, Name of Invention Japanese Language Analyzer 3, Relationship with Supplementary Person Case Patent Applicant Address 1-3-6 Nakamagome, Ota-ku, Tokyo Name (
874) Riko Co., Ltd. -4, Agent address: 1-13-4 Toranomon, Minato-ku, Tokyo 105 6. Contents of amendment The drawings submitted at the time of filing are replaced with official drawings (no changes to the engraving contents) as shown in the attached sheet. 7. List of attached documents (1) One official drawing

Claims (1)

【特許請求の範囲】 口木話の入力文および指示を入力する入力手段と、 前記入力文に含まれる形態素を解析する形態素解析手段
と、 日本語の構文を解析する構文解析文法を有し、前記形態
素に解析された入力文の構文を該文法によって解析する
構文解析手段と、 前記形態素に解析された入力文に含まれるa/iの係り
受け語の候補を選択する係り受け候補選択手段と、 該入力文に含まれる語の意味の候補を選択する意味候補
選択手段と、 該入力文、前記選択された係り受け候補および意味候補
、ならびに解析結果を保持する蓄積手段と、 日本語を表示する表示手段と、 前記入力手段、形態素解析手段、構文解析手段、係り受
け候補選択手段、意味候補選択手段、蓄積手段および表
示手段を制御する制御手段とを含み、 該制御手段は、前記入力文、ならびに前記選択された係
り受け候補および意味候補を順次前記表示手段に表示さ
せ、前記入力手段から人力された指示に応動して該入力
文の解析を行なうことを特徴とする日本語解析装置。
[Scope of Claims] An input means for inputting an input sentence and an instruction in Japanese language, a morphological analysis means for analyzing morphemes included in the input sentence, and a parsing grammar for analyzing Japanese syntax, a syntactic analysis means for analyzing the syntax of the input sentence parsed into the morphemes using the grammar; and a dependency candidate selection means for selecting a dependency word candidate for a/i included in the input sentence parsed into the morphemes. , meaning candidate selection means for selecting meaning candidates for words included in the input sentence; storage means for holding the input sentence, the selected dependency candidates and meaning candidates, and the analysis results; and displaying Japanese. and a control means for controlling the input means, morphological analysis means, syntactic analysis means, dependency candidate selection means, meaning candidate selection means, storage means, and display means, and the control means controls the input sentence. , and the selected modification candidates and meaning candidates are sequentially displayed on the display means, and the input sentence is analyzed in response to an instruction manually inputted from the input means.
JP59047127A 1984-03-14 1984-03-14 Japanese word analyzer Granted JPS60193073A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59047127A JPS60193073A (en) 1984-03-14 1984-03-14 Japanese word analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59047127A JPS60193073A (en) 1984-03-14 1984-03-14 Japanese word analyzer

Publications (2)

Publication Number Publication Date
JPS60193073A true JPS60193073A (en) 1985-10-01
JPH0576067B2 JPH0576067B2 (en) 1993-10-21

Family

ID=12766474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59047127A Granted JPS60193073A (en) 1984-03-14 1984-03-14 Japanese word analyzer

Country Status (1)

Country Link
JP (1) JPS60193073A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62209659A (en) * 1986-03-10 1987-09-14 Sharp Corp Correcting device for japanese sentence
JPS62154558U (en) * 1986-03-25 1987-10-01
JPS6335161U (en) * 1986-08-20 1988-03-07
JPS63113758A (en) * 1986-10-31 1988-05-18 Toshiba Corp Machine translation system
JPS63175253U (en) * 1986-11-10 1988-11-14
JPH01189763A (en) * 1988-01-25 1989-07-28 Sharp Corp Character processor
JPH01138162U (en) * 1988-03-15 1989-09-21
JPH0340172A (en) * 1989-07-07 1991-02-20 Matsushita Electric Ind Co Ltd Natural language analyzing device
JPH03188564A (en) * 1989-12-18 1991-08-16 Fujitsu Ltd Display system for analyzing result of modification
US5132901A (en) * 1989-03-29 1992-07-21 Ricoh Company, Ltd. System and method for input of target language equivalents and determination of attribute data associated therewith

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62209659A (en) * 1986-03-10 1987-09-14 Sharp Corp Correcting device for japanese sentence
JPH061468B2 (en) * 1986-03-10 1994-01-05 シャープ株式会社 Japanese sentence proofreading device
JPS62154558U (en) * 1986-03-25 1987-10-01
JPS6335161U (en) * 1986-08-20 1988-03-07
JPS63113758A (en) * 1986-10-31 1988-05-18 Toshiba Corp Machine translation system
JPS63175253U (en) * 1986-11-10 1988-11-14
JPH01189763A (en) * 1988-01-25 1989-07-28 Sharp Corp Character processor
JPH01138162U (en) * 1988-03-15 1989-09-21
US5132901A (en) * 1989-03-29 1992-07-21 Ricoh Company, Ltd. System and method for input of target language equivalents and determination of attribute data associated therewith
JPH0340172A (en) * 1989-07-07 1991-02-20 Matsushita Electric Ind Co Ltd Natural language analyzing device
JPH03188564A (en) * 1989-12-18 1991-08-16 Fujitsu Ltd Display system for analyzing result of modification

Also Published As

Publication number Publication date
JPH0576067B2 (en) 1993-10-21

Similar Documents

Publication Publication Date Title
US5349368A (en) Machine translation method and apparatus
US6442523B1 (en) Method for the auditory navigation of text
US5450537A (en) Method and apparatus for completing a partially completed document in accordance with a blank form from data automatically retrieved from a database
US20090246744A1 (en) Method of reading instruction
JPS6140673A (en) Translation methods and machines for foreign language compositions
US5617314A (en) Kanji conversation result amending system
JPH07114568A (en) Data retrieval device
JPS60193073A (en) Japanese word analyzer
EP0265280B1 (en) Machine translation system and method
JP3793878B2 (en) Information display control device and program
JPH04502223A (en) symbol forming device
JPH11161650A (en) Electronic dictionary
JPH11149486A (en) Electronic dictionary, retrieving device and information retrieving method
JP2928515B2 (en) Translated word output device
JPH06175811A (en) Scientific paper data display device
Adar et al. On-the-fly Hyperlink Creation for Page Images.
JPH06176069A (en) Display device for retrieving result of character string
JP2001265780A (en) Electronic device and recording medium
JP2001043217A (en) Terminal, device and method for processing document
JP2002183134A (en) Translating device
JP4114695B2 (en) Information display control device and program
JPH0762840B2 (en) Document creation device
JPH0385670A (en) Two-step display system document processor
JP2601139B2 (en) String search device
JPS63261467A (en) Translation method and device