[go: up one dir, main page]

JPH0728815A - 構文解析装置 - Google Patents

構文解析装置

Info

Publication number
JPH0728815A
JPH0728815A JP5029361A JP2936193A JPH0728815A JP H0728815 A JPH0728815 A JP H0728815A JP 5029361 A JP5029361 A JP 5029361A JP 2936193 A JP2936193 A JP 2936193A JP H0728815 A JPH0728815 A JP H0728815A
Authority
JP
Japan
Prior art keywords
sentence
analysis
syntax
rule
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5029361A
Other languages
English (en)
Inventor
Masanori Takahashi
橋 雅 則 高
Tadashi Nagano
野 正 永
Hideko Mori
秀 子 森
Masaki Kiyono
野 正 樹 清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5029361A priority Critical patent/JPH0728815A/ja
Priority to US08/197,995 priority patent/US5487000A/en
Publication of JPH0728815A publication Critical patent/JPH0728815A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 構文的誤りを含まない入力文に対しては従来
通りの構文解析処理を行ない、構文的誤りを含む文に対
しては、誤りの箇所と種類を判別して誤りを修正した入
力文を得、これを基に正しい構文木を得る。 【構成】 入力文に対して構文解析処理を行ない、入力
文の解析に失敗した場合にはその時点までの構文木部分
構造を出力する構文解析部11、構文解析部11で用い
る構文解析規則12、構文解析部11が解析に失敗した
場合に入力文の構文木部分構造を受けとって非文分析規
則14を適用して構文的誤りの箇所と種類を特定する非
文分析部13、構文解析規則12から非文分析規則14
を生成する非文分析規則生成部15、非文分析部13の
分析結果に基づいて入力文を修正し構文解析部11に再
入力する入力文修正部16を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力文の構文解析を行
なって構文木を出力する構文解析装置に関し、特に入力
文が構文的誤りを含む場合に有用な構文解析装置に関す
るものである。
【0002】
【従来の技術】従来の構文解析装置においては、入力文
に構文的誤りが含まれる場合には、構文解析規則の適用
に失敗することで構文解析に失敗するか、またはそれま
でに生成された構文木部分構造を出力したり、入力文を
構文解析可能な単位に分割して再解析するなどの方法を
用いていたが、これらは入力文の構文木を得るという構
文解析装置の最終目的を達成するものではない。
【0003】また、単純な構文的属性の誤りなどに対し
ては、構文解析規則から属性のチェック機能を取り除く
ことにより誤りを容認して構文解析するという方法も用
いられていた。
【0004】
【発明が解決しようとする課題】一般的に構文解析で
は、適用可能な規則を品詞または文法範疇の組合せとそ
れらの間の属性に対する制約条件とにより、その文法規
則に対応する構文木を生成して入力文全体の構文木を生
成する。このとき、適用可能な構文解析規則の組合せが
複数種類ある場合には、一つの入力文に対する構文木が
複数個生成されることになる。
【0005】したがって、上記従来例のように、構文解
析規則の属性に対する制約を緩めると、本来適用される
べきではない規則が適用されることになり、その結果入
力文に対する構文木として間違った構文木を含む多くの
種類の構文木が生成されてしまうという問題を有してい
た。
【0006】本発明は、このような従来の問題を解決す
るものであり、構文的誤りを含む入力文に対しては、誤
りの箇所と種類を判断して入力文を修正するようにした
構文解析装置を提供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、入力文が構文的誤りを含む場合に、構文
解析が失敗した時点までに生成された構文木部分構造を
出力する構文解析部と、非文分析規則に従って入力文に
含まれる構文的誤りを検出する非文分析部とを備えたも
のである。
【0008】本発明はまた、検出した構文的誤りに基づ
いて入力文を修正する入力修正部およびまたは構文解析
に用いる構文解析規則を反転することにより非文分析規
則を生成する非文規則生成部を備えたものである。
【0009】
【作用】本発明は、上記構成により、入力文を構文解析
した結果、入力文全体の構文木が得られなかった場合
に、構文解析により得られた構文木部分構造を非文分析
部への入力として部分構造に対して非文分析規則を適用
し、入力文中の構文的誤りの箇所と種類とを判別し、そ
の情報に基づいて入力文を修正し、修正された入力文に
対して再度構文解析部で解析を行なうことにより、正し
い文の構文木を得ることができる。
【0010】
【実施例】以下、本発明の構文解析装置の一実施例につ
いて、図面を参照しながら説明する。図1は本発明の一
実施例における構文解析装置の構成を示すものである。
図1において、11は入力文に対して構文解析処理を行
ない、入力文の構文木または解析に失敗した場合には構
文木部分構造を出力する構文解析部、12は構文解析部
11で用いる構文解析規則、13は構文解析部11が解
析に失敗した場合に入力文の構文木部分構造を受けとっ
て非文分析規則を適用しすることにより文的誤りの箇所
と種類を特定する非文分析部、14は非文分析部13で
用いる非文分析規則、15は構文解析規則12から非文
分析規則14を生成する非文分析規則生成部、16は非
文分析部13の分析結果に基づいて入力文を修正し、構
文解析部11に再入力する入力文修正部である。
【0011】以上のように構成された構文解析装置につ
いて、以下その動作を図2の概略フローを用いて説明す
る。まず入力文に対して、構文解析部11では構文解析
規則12を用いて構文解析を行なう(ステップ21)。
この時解析に成功すれば、その時点で入力文に対応する
構文木を出力して処理を終了し、構文解析に失敗した場
合には、構文解析部11は解析が最終的に失敗するまで
に生成することのできた構文木部分構造を非文分析部1
3に対して出力する(ステップ22)。非文分析部13
では、受けとった構文木部分構造の順番と組合せと各部
分構造の持つ構文的属性により、非文分析規則14を適
用して構文的誤りの存在する箇所とその種類とを特定す
る(ステップ23)。ここで適用可能な非文分析規則が
発見できなかった場合には、装置は構文解析部11が生
成した構文木部分構造を出力して処理を終了し、構文的
誤りが発見された場合には、非文分析部14は、その誤
りの種類と入力文中での箇所とを入力文修正部16に対
して出力する(ステップ24)。入力文修正部16で
は、非文分析部14の分析結果に基づいて入力文を修正
し、再び構文解析部11に送る(ステップ25)。な
お、入力文修正部16の処理手法については特に限定し
ない。構文解析部11では、再び修正入力文に対して構
文解析を行ない、解析に成功すれば構文木を出力して処
理を終了し、解析に失敗すれば、再び非文分析部13に
構文木部分構造を送り前述の処理を繰り返す。
【0012】図3は非文分析規則14に含まれている構
文的誤りを特定するための規則の例である。この規則
は、「部分構造の並びが、<NP> <VP> <.>であり、か
つ、 Condition-1, Condition-2, Condition-3, ...... を満たす時、 ApplyFunc-1, ApplyFunc-2, ApplyFunc-3, ...... を実行する。」ということを示す。Condtion-* は部分
構造の属性をチェックするための関数であり、その内容
は、例えば、 「Condition-1 : <NP> と<VP> の各々の属性 "NUMBE
R" (数)の値が異なる」である。
【0013】またApplyFunc-* は、この規則の条件部が
満たされた時に入力文修正部に対して出される修正指示
が記述されており、この場合は、例えば、 「ApplyFunc-1 : <VP> の主要素の<v> の"NUMBER"
(数)が反転するように語尾変化させる。」である。
【0014】また、Condition-1 はApplyFunc-1 と、Co
ndition-2 はApplyFunc-2 というように、制約条件部の
関数と実行部の関数とは各々対応している。
【0015】次に図4を用いて非文分析部13の動作の
概略を説明する。図4( 1) は入力文であり、文頭の主
語"He"に対して動詞が"drink" であり、”NUMBER”(
数)の不一致が生じている例である。まず、この文を構
文解析部11で解析すると、構文的誤りを含むために解
析は失敗し、図4( 2) に示すような構文木部分構造が
出力される。ここに示した部分構造以外にもいくつかの
部分構造が生成されるが、ここでは最終的に非文分析規
則の適用に係る部分構造のみを示している。この解析結
果から読みとれるのは、「"He" が一語で文法範疇<NP>
を構成し、"drink water" が<VP> を構成、そこで文
が完結するため、解析文法規則「<S> --> <NP><VP>」を
適用しようとするが、<NP><VP> 間の属性値制約チェッ
クで上記文法規則が適用できず、解析に失敗した。」で
ある。
【0016】非文分析部13では、この部分構造が入力
されると、部分構造の種類を表わす文法範疇名をキーと
して非文分析規則の適用を試みる。本実施例の場合に
は、最終的に図3の例に示した非文分析規則が適用さ
れ、制約条件部のCondition-1 が適用された結果、入力
文修正部でApplyFunc-1 の指示に従って入力文は図5(
1) のように修正され、再構文解析を経て図5( 2) の
構文木が出力される。
【0017】次に、上記例以外の構文的誤りと正しい文
の対応例を示す。 (1)不可算名詞に不定冠詞 ex1. He drank a water. → He drank water. (2)複数名詞に不定冠詞 ex2. He has a teeth. → He has teeth. (3)名詞の前に冠詞なし ex3. He has dog. → He has a dog. (4)音の不一致 ex4. He slept a hour. → He slept an hour. (5)不可算名詞に複数を表す修飾語 ex5. He drank many water. → He drank a lot of water. (6)単数名詞に複数を表す修飾語 ex6. Many boy had a book. → Many boys had a book. (7)代名詞の格間違い ex7. Him is running. → He is running. (8)have,be 以外の助動詞の後の動詞が原型でない ex8. He can ran. → He can run. (9)助動詞haveの後の動詞が完了形でない ex9. He has go to Europe. → He has gone to Europe. (10)助動詞beの後の動詞が分詞でない ex10. The birds are sing. → The birds are singing. (11)前置詞の目的語が不適 ex11. I gave it to he. → I gave it to him. (12)-er,-est型の語にmore,most ex12. It is more nice. → It is nice.
【0018】次に、非文分析規則生成部15の動作につ
いて図6の概略フローを参照しながら説明する。まず非
文分析規則生成部15では、構文解析規則12から先頭
の解析規則を読み込む( ステップ61) 。次に読み込ん
だ解析規則中の句構造規則部分を認識し( ステップ6
2) 、その右辺より非文分析規則の句構造条件部の条件
を生成する( ステップ63) 。この時、解析規則句構造
部分の左辺に記述された範疇が<S>であれば、句構造
条件部の条件の末尾に<.> を追加する。例えば構文解析
規則<S>−−><NP><VP>からは、非文分析規
則の句構造条件部として「<NP> <VP> <.> 」が生成され
る。
【0019】続いて構文解析規則中の属性制約条件のう
ちで先頭のものをを認識し( ステップ64) 、その条件
を基にして非文分析規則の制約条件部の条件および実行
部を生成する( ステップ65,66) 。ここで、構文解
析中での制約条件は、非文分析規則の制約条件として生
成される際には論理的に条件が反転される。例えば、構
文解析規則での制約条件が「NPとVPの間でNUMBERとPERS
ONが一致する」であれば、非文分析規則での制約条件は
「NPとVPの間でNUMBERとPERSONが異なる」になる。同様
に、「存在する」であれば「存在しな い」になり、
「である」であれば「でない」になる。続いて、このよ
うな制約条件から、非文分析規則の実行部は、句構造に
おける後者の属性を前者に一致させるファンクションを
記述する。上記例の場合は「VPのNUMBERとPERSONをNPに
一致させる」になる。
【0020】次に構文解析規則から次の属性制約条件を
読み込んで、同様に非文分析規則の制約条件部と実行部
とを生成する。属性制約条件の認識がすべて終了した時
点で( ステップ67) 、最初の構文解析規則に対応する
非文分析規則の生成処理を終了し(ステップ68) 。次
の構文解析規則からの生成処理に移る( ステップ69)
【0021】以上のようにして、すべての構文解析規則
に対応する非文分析規則を生成して、非文分析規則生成
部15での処理を終了する。
【0022】なお、図3のCondition(制約条件部) とAp
plyFunction(実行部) の対応について言えば、構文解析
規則での制約条件には、AND で結合された条件とORで結
合された条件とが存在し、このうち、AND で結合された
条件はそれらをまとめて一つのCondition に変換し、Ap
plyFunctinを生成する。例えば次のようになる。 また、非文分析規則が複数のCondition-ApplyFunction
ペアを持つ場合は、以下のように、Condition1,Conditi
on2 ・・・・・はAND で結合して評価し、ApplyFunctio
n1,ApplyFunction2 ・・・・・はCondition を満たさな
くなるまで順次実行する。 if (C1 & C2 & ・・・・・) then (AF1 | AF2|・・・・・)
【0023】
【発明の効果】以上のように、本発明の構文解析装置
は、非文分析部を設けることにより、入力文が構文的誤
りを含む場合にでも、構文的誤りの種類と箇所を認識す
ることにより正しい文の構文木を得ることができる。
【0024】また、入力修正部を設けることにより、非
文分析部で検出した構文的誤りに基づいて正しい入力文
を自動的に得ることができる。
【0025】さらに、非文分析規則の生成を構文解析規
則から自動的に行なうことにより、構文解析規則および
非文分析規則の保守性を高めることができる。
【図面の簡単な説明】
【図1】本発明の一実施例における構文解析装置の構成
を示す概略ブロック図
【図2】本発明の一実施例における動作を示す概略フロ
ー図
【図3】本発明の一実施例における非文分析規則の例を
示す規則構造図
【図4】( 1) 本発明の一実施例における入力文の例を
示す文構造図 ( 2) 構文解析結果の例を示す構文構析図
【図5】( 1) 本発明の一実施例における修正された入
力文の例を示す文構造図 ( 2) 修正された入力文の構文木の例を示す構文構析図
【図6】本発明の一実施例における非文分析規則生成部
の動作を示すの概略フロー図
【符号の説明】
11 構文解析部 12 構文解析規則 13 非文分析部 14 非文分析規則 15 非文分析規則生成部 16 入力文修正部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 清 野 正 樹 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力文を構文解析規則に従って構文解析
    して構文木を出力する構文解析装置において、入力文が
    構文的誤りを含む場合に、構文解析が失敗した時点まで
    に生成された構文木部分構造を出力する構文解析部と、
    非文分析規則に従って入力文に含まれる構文的誤りを検
    出する非文分析部とを備えた構文解析装置。
  2. 【請求項2】 検出した構文的誤りを基に入力文を修正
    する入力文修正部を備えた請求項1記載の構文解析装
    置。
  3. 【請求項3】 構文解析に用いる構文解析規則を反転さ
    せることにより非文分析規則を生成する非文分析規則生
    成部を備えた請求項1または2記載の構文解析装置。
JP5029361A 1993-02-18 1993-02-18 構文解析装置 Pending JPH0728815A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5029361A JPH0728815A (ja) 1993-02-18 1993-02-18 構文解析装置
US08/197,995 US5487000A (en) 1993-02-18 1994-02-17 Syntactic analysis apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5029361A JPH0728815A (ja) 1993-02-18 1993-02-18 構文解析装置

Publications (1)

Publication Number Publication Date
JPH0728815A true JPH0728815A (ja) 1995-01-31

Family

ID=12274048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5029361A Pending JPH0728815A (ja) 1993-02-18 1993-02-18 構文解析装置

Country Status (2)

Country Link
US (1) US5487000A (ja)
JP (1) JPH0728815A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019152712A (ja) * 2018-03-01 2019-09-12 Kddi株式会社 解析装置及びプログラム

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0702294A3 (en) * 1994-09-13 1997-05-02 Sun Microsystems Inc Method and device for diagnosing lexical errors
US5873660A (en) * 1995-06-19 1999-02-23 Microsoft Corporation Morphological search and replace
RU2115158C1 (ru) * 1995-10-24 1998-07-10 Владимир Олегович Сафонов Способ и устройство для достоверной оценки семантических признаков в синтаксическом анализе при проходе вперед слева направо
US7672829B2 (en) * 1997-03-04 2010-03-02 Hiroshi Ishikura Pivot translation method and system
US5926784A (en) * 1997-07-17 1999-07-20 Microsoft Corporation Method and system for natural language parsing using podding
US6353925B1 (en) * 1999-09-22 2002-03-05 Compaq Computer Corporation System and method for lexing and parsing program annotations
US7386834B2 (en) * 2002-06-28 2008-06-10 Sun Microsystems, Inc. Undo/redo technique for token-oriented representation of program code
US20040003374A1 (en) * 2002-06-28 2004-01-01 Van De Vanter Michael L. Efficient computation of character offsets for token-oriented representation of program code
US20040006763A1 (en) * 2002-06-28 2004-01-08 Van De Vanter Michael L. Undo/redo technique with insertion point state handling for token-oriented representation of program code
US20040107189A1 (en) * 2002-12-03 2004-06-03 Lockheed Martin Corporation System for identifying similarities in record fields
ZA200700562B (en) * 2004-06-21 2008-08-27 Equestron Llc Method and apparatus for evaluating animals' health and performance
EP2570974B1 (en) * 2011-09-13 2018-11-28 ExB Asset Management GmbH Automatic crowd sourcing for machine learning in information extraction

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4617643A (en) * 1982-10-29 1986-10-14 Mattel, Inc. Syntax error correction method and apparatus
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
JPH0281230A (ja) * 1988-09-19 1990-03-22 Hitachi Ltd 構文解析および言語処理システム
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
JPH04235672A (ja) * 1991-01-10 1992-08-24 Sharp Corp 翻訳装置
US5259766A (en) * 1991-12-13 1993-11-09 Educational Testing Service Method and system for interactive computer science testing, anaylsis and feedback

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019152712A (ja) * 2018-03-01 2019-09-12 Kddi株式会社 解析装置及びプログラム

Also Published As

Publication number Publication date
US5487000A (en) 1996-01-23

Similar Documents

Publication Publication Date Title
JPH0728815A (ja) 構文解析装置
JP3385141B2 (ja) 機械翻訳システム
US5099425A (en) Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
US5477448A (en) System for correcting improper determiners
JP2002312357A (ja) 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
JP2007172657A (ja) 一般に混同するワードを自然言語パーザにおいて識別及び分析する方法及びシステム
WO2004066594A3 (en) Word recognition consistency check and error correction system and method
KR20170071325A (ko) 언어 분석 오류 보정 장치 및 방법
JPS638864A (ja) 翻訳装置
JPH04235672A (ja) 翻訳装置
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
CN115630635B (zh) 一种基于检索和多阶段的中文文本校对方法、系统及设备
Worm et al. Towards robust understanding of speech by combination of partial analyses
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2001013862A (ja) 最適テンプレートパターン決定方法,決定装置,最適テンプレートパターンを用いた評価方法,評価装置および記録媒体
JP2887660B2 (ja) 翻訳文添削支援装置
JPS5922140A (ja) 対話型コンパイル方式
JP4103313B2 (ja) 自然言語処理装置及び方法
Hein A chart-based framework for grammar checking. initial studies
Bouillon et al. Developing Non-European Translation Pairs in a Medium-Vocabulary Medical Speech Translation System.
JP2794919B2 (ja) 機械翻訳装置
KR100957824B1 (ko) 문법오류 검사방법
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPS62209659A (ja) 日本語文章校正装置