[go: up one dir, main page]

JP3358100B2 - 日本語質問メッセージ解析方法及び装置 - Google Patents

日本語質問メッセージ解析方法及び装置

Info

Publication number
JP3358100B2
JP3358100B2 JP09104195A JP9104195A JP3358100B2 JP 3358100 B2 JP3358100 B2 JP 3358100B2 JP 09104195 A JP09104195 A JP 09104195A JP 9104195 A JP9104195 A JP 9104195A JP 3358100 B2 JP3358100 B2 JP 3358100B2
Authority
JP
Japan
Prior art keywords
sentence
information request
japanese
question message
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09104195A
Other languages
English (en)
Other versions
JPH08287092A (ja
Inventor
林  良彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP09104195A priority Critical patent/JP3358100B2/ja
Publication of JPH08287092A publication Critical patent/JPH08287092A/ja
Application granted granted Critical
Publication of JP3358100B2 publication Critical patent/JP3358100B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語質問メッセージ
解析方法及び装置に係り、特に、情報検索システムにお
いて用いられるテキスト形式で入力された日本語メッセ
ージを解析し、当該メッセージにおける情報要求を効率
的に構造化する日本語メッセージ構造化装置における日
本語質問メッセージ解析方法及び装置に関する。
【0002】
【従来の技術】情報検索システムにおいて、利用者が希
望する情報要求をどのような形式で表現するかが大きな
ポイントとなる。一般には、利用者が複数のキーワード
を自ら選択して、選択されたキーワードを論理的に結合
して情報要求を表現する形式がある。例えば、氏名(店
名)が不明である場合に、電話番号を検索する場合に、
探索する電話番号の職業(または職種)、住所を『職業
AND 住所』の形態で、“飲食業AND港区”とい
うキーワードを入力する。この場合かなりの数の検索対
象データが出現したために絞り込む場合には、“寿司屋
AND港区麻布”というキーワードを入力する。さらに
検索データを絞り込む場合には、“寿司屋AND港区麻
布3丁目”というキーワードを入力する。この例は、キ
ーワードを論理式(AND)で結合した場合を示した
が、反対に、論理式(OR)を用いてキーワードを変更
し、検索条件を緩和してデータベースを検索する方法等
がある。
【0003】他には、検索対象分野のトピックに基づい
てブラウジングを繰り返すことにより必要な情報に到達
する方法や、情報要求を疑似自然言語文で表現する方法
等がある。また、利用者が記述する質問メッセージを言
語解析し、情報要求を抽出し、構造化する方法もある。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の選択されたキーワードを論理的に結合する方法は、
利用者の多様化かつ複雑な情報要求をキーワードの論理
結合形式で表現することは困難である。
【0005】また、対象分野のトピックに基づいたブラ
ウジングを繰り返す方法や疑似自然言語文で表現する方
法は、いずれも利用者が多様化した場合、かつ複雑な要
求には対応できないという問題がある。また、利用者が
記述する質問メッセージを言語解析して、情報要求を導
出する方法は、質問メッセージには通常、情報要求を表
現する文以外の文も多く含まれるため、それらの文のう
ち、情報要求を表現するためには、どの文を重点的に解
析すべきであるかを規定する方略を明らかにするのは困
難であるため、質問メッセージ全体に渡って一様な言語
解析処理を行う必要がある。
【0006】本発明は、上記の点に鑑みなされたもの
で、利用者が情報検索システムを利用するにあたって、
キーワードの論理結合形式によって情報要求を表現しな
ければならない困難さに対して、利用者が自然な質問メ
ッセージによって情報検索システムに対して情報要求を
与えることが可能な日本語質問メッセージ解析方法及び
装置を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、テキスト形式で入
力された日本語質問メッセージを解析する日本語質問メ
ッセージ解析方法であって、日本語質問メッセージが入
力され(ステップ1)、入力された処理対象の日本語質
問メッセージについて、特定の表現文字列に注目して、
情報要求の核となる部分を述べている情報要求文を抽出
し(ステップ2)、抽出された情報要求文に含まれる参
照表現を情報要求文の特性に基づいて解消し(ステップ
3)、抽出された複数の情報要求文が同一の対象物に対
する情報要求を述べている場合に、該複数の情報要求文
の構造を統合して、日本語質問メッセージにおける主た
る情報要求を構造化し(ステップ4)、構造化された情
報要求文を出力する(ステップ5)。
【0008】また、本発明は、情報要求文を抽出する際
に(ステップ2)、日本語質問メッセージを構成する日
本語文が果たす機能的役割である情報要求やユーザの目
的であるゴール言明の文タイプと、該情報要求及び該ゴ
ール言明を判定するための表現文字列パターンの組合せ
が予め格納されている文タイプ判定辞書を参照し、日本
語質問メッセージが指定された文タイプに対応するかを
文字列の照合により判定し、日本語質問メッセージから
情報要求の機能を有する文を抽出する。
【0009】また、本発明は、情報要求文が抽出される
と、抽出された情報要求文に対して形態素・構文解析を
行い、日本語質問メッセージについて、固有な意味構造
パターンをエントリ毎に予め格納した意味構造パターン
辞書を参照して、エントリと形態素・構文解析された情
報要求文の解析結果とを照合し、情報要求文の意味構造
を求める。
【0010】また、本発明は、参照表現を解消する際に
(ステップ3)、日本語質問メッセージにおける情報要
求文に含まれ得る参照表現のパターンと、参照表現の参
照先を探索する探索方向と、探索対象となる日本語文の
文タイプ、参照表現の言語表現単位を予め格納した参照
表現解消制御テーブルを参照して、探索対象となる日本
語文の文タイプが指定された文タイプに対応するかを判
定し、対応する場合に、参照表現の解消処理を制御す
る。
【0011】図2は、本発明の原理構成図である。本発
明は、テキスト形式で入力された日本語質問メッセージ
を解析する日本語質問メッセージ解析装置であって、日
本語質問メッセージを入力する入力手段1と、入力され
た処理対象の日本語質問メッセージについて、特定の表
現文字列に注目して、情報要求の核となる部分を述べて
いる情報要求文を抽出する情報要求文抽出手段4と、情
報要求文抽出手段4により抽出された情報要求文に参照
表現が含まれる場合に、参照表現を情報要求文の特性に
基づいて解消する参照表現解消手段10と、抽出された
複数の情報要求文が同一の対象物に対する情報要求を述
べている場合に、複数の情報要求文の構造を統合して、
日本語質問メッセージにおける主たる情報要求を構造化
する情報要求構造化手段11と、情報要求構造化手段1
1により統合された情報要求文を出力する出力手段12
とを有する。
【0012】また、上記の情報要求文抽出手段4は、日
本語質問メッセージを構成する日本語文が果たす機能的
役割である情報要求やユーザの目的であるゴール言明の
文タイプと、該情報要求及び該ゴール言明を判定するた
めの表現文字列パターンの組合せが予め格納されている
文タイプ判定辞書2と、文タイプ判定辞書2を参照し
て、日本語質問メッセージが指定された文タイプに対応
するかを文字列の照合により判定する文タイプ判定手段
3と、文タイプ判定手段3を起動させ、日本語質問メッ
セージから情報要求の機能を有する文を抽出する文タイ
プ判定起動手段41とを含む。
【0013】また、本発明の日本語質問メッセージ解析
装置は、情報要求文抽出手段4により抽出された情報要
求文に対して形態素・構文解析を行う日本語基本解析手
段5と、日本語質問メッセージについて、固有な意味構
造パターンをエントリ毎に予め格納した意味構造パター
ン辞書6と、意味構造パターン辞書6を参照して、エン
トリと日本語基本解析手段5により解析された情報要求
文の解析結果とを照合して、情報要求文の意味構造を求
める意味構造解析手段7を更に有する。
【0014】また、上記の参照表現解消手段10は、日
本語質問メッセージにおける情報要求文に含まれ得る参
照表現のパターンと、参照表現の参照先を探索する探索
方向と、探索対象となる日本語文の文タイプ、該参照表
現の言語表現単位を予め格納した参照表現解消制御テー
ブル8と、参照表現解消制御テーブル8と、文タイプ判
定手段3を用いて、参照表現の解消処理を制御する参照
表現解消制御手段9とを含む。
【0015】
【作用】本発明は、入力された日本語質問メッセージか
ら特定の表現文字列に基づいて情報要求の核となる部分
を述べている文を抽出する。このとき、抽出された文が
所定の文タイプに合致していない場合には、情報要求文
とはしないように制御することにより、情報要求とは直
接関係がない文を抽出することがないため、後段の処理
において、無駄な処理が回避される。
【0016】また、本発明は、情報要求文としての特性
を用いて解析及び参照情報の解消を行う。これにより、
抽出された情報要求文中に主体となるものを指し示すた
めの参照要件が含まれている場合には、参照表現の参照
先を求め、参照して、同定し、参照表現の解消を行う。
【0017】また、本発明は、複数の情報要求の対象物
の同一性を判定し、同一性が確認できる場合には、複数
の情報要求文の意味構造を統合して単一の意味構造とし
て、処理対象の日本語メッセージにおける情報要求を構
造化して、出力することが可能である。
【0018】これにより、情報検索システムの利用者
は、データベースを検索する際に、複雑かつ多様な情報
要求の指示を自然な日本語質問メッセージを入力するこ
とにより行うことができる。
【0019】
【実施例】以下、図面と共に本発明の一実施例を説明す
る。図3は、本発明の一実施例の日本語質問メッセージ
解析装置の構成を示す。同図に示す日本語質問メッセー
ジ解析装置は、入力部1、文タイプ判定辞書2、文タイ
プ判定部3、情報要求文抽出部4、日本語基本解析部
5、意味構造パターン辞書6、意味構造解析部7、参照
表現解消制御テーブル8、参照表現解消制御部9、参照
表現解消部10、情報要求構造化部11、出力部12及
び処理テーブル13より構成される。
【0020】入力部1は、テキスト形式の日本語質問メ
ッセージが入力されると、当該メッセージを文毎に分
け、図6に後述する処理テーブル13に格納しておく。
なお、入力部1は、特定のコンピュータシステムのファ
イルシステムやターミナルに接続されてもよいし、近年
飛躍的な発展・普及をとげているコンピュータネットワ
ークへ接続されてもよい。
【0021】文タイプ判定辞書2は、予め文タイプ(情
報要求タイプ・ゴール言明タイプ)とそれを判定するた
めの表現文字列パターンの組合せが格納され、文タイプ
判定部3により参照される辞書である。文タイプ判定部
3は、文タイプ判定辞書2を参照して、処理対象の入力
された日本語質問メッセージより抽出された文が指定さ
れた文タイプに対応するかを文字列の照合により判定す
る。
【0022】情報要求文抽出部4は、処理テーブル13
内の日本語質問メッセージを読出し、文タイプ判定部3
を起動して日本語質問メッセージから情報要求の機能を
有する文を抽出する。詳しくは、情報要求文抽出部4
は、抽出すべき文タイプを“情報要求”と指定して文タ
イプ判定部3を起動し、入力された日本語質問メッセー
ジ中に含まれる情報要求を直接記述した文を抽出する。
このとき、文タイプ判定部3は、文タイプ判定辞書2を
参照して、エントリと、処理対象である日本語文との文
字列照合を行う。
【0023】日本語基本解析部5は、日本語文に対し
て、形態素・構文解析を行う。解析方法は、既存のシス
テムを用いるものとし、本発明ではその詳細を規定しな
い。意味構造パターン辞書6は、予め、日本語質問メッ
セージにおいて固有な意味構造パターンが格納されてお
り、意味構造解析部7により参照される。
【0024】意味構造解析部7は、意味構造パターン辞
書6の内容と、エントリと情報要求文抽出部4により抽
出された情報要求文に対する日本語基本解析部5の解析
結果(形態素、構文解析結果)とを照合して、情報要求
文の意味構造を求める。参照表現解消制御テーブル8
は、日本語質問メッセージにおける情報要求文に含まれ
得る参照表現と意味構造における意味属性をキーとし
て、予め参照表現の参照先を探索する探索方向、探索対
象となる日本語文の文タイプ、参照先の表現の言語表現
単位が格納されたテーブルであり、参照表現解消制御部
9により参照される。
【0025】参照表現解消制御部9は、参照表現解消制
御テーブル8と文タイプ判定部3を用いて、参照表現の
解消処理を制御する。詳しくは、意味構造解析部7より
入力された情報要求文の意味構造に基づいて、参照表現
解消制御テーブル8から得た探索方向に関する情報に基
づいて参照先を含む可能性がある候補文を選択する。こ
のとき、参照表現解消制御部9は、参照表現解消制御テ
ーブル8から得た文タイプの情報を用いて、文タイプ判
定部3を起動して、候補文の適格性を判定する。
【0026】参照表現解消部10は、参照表現の参照先
を求める。詳しくは、参照表現解消制御部9により候補
文が得られれば、実際に参照表現の参照先を求める参照
表現解消部10を起動して、入力された情報要求文に含
まれる必要な参照表現の解消を行う。ここで、参照表現
の解消とは、例えば、情報要求の対象物が「そのために
必要なケーブル」という記述により、指し示される場合
「その」が何を指しているかを判定することができなけ
れば、「ケーブル」の特性を規定することができないた
め、参照表現「その」について探索して、指し示されて
いる内容を取得し、当該参照表現を解消するものであ
る。
【0027】情報要求構造化部11は、入力された日本
語メッセージから複数の情報要求文が抽出された場合、
情報要求の対象物の同一性を判定することにより、処理
対象の日本語メッセージにおける情報要求を構造化す
る。詳しくは、上記の各処理により、情報要求の対象物
の同一性を判定し、同一性が確認できる場合には、複数
の情報要求文の意味構造を統合して、単一の意味構造と
して処理対象の日本語メッセージにおける情報要求を構
造化する。
【0028】出力部12は、対象の日本語質問メッセー
ジから抽出し、構造化した情報要求を後段に接続される
装置へ出力する。上記の日本語質問メッセージ解析装置
を実現するハードウェアとしては、例えば、CPUとメ
モリを含む装置であればよく、コンピュータシステム等
の装置によって実現することが可能である。
【0029】図4は、本発明の一実施例の日本語質問メ
ッセージ解析装置の動作の概要を示すフローチャートで
ある。 ステップ101) 入力部1により利用者が情報要求を
テキスト形式で記載した図5に示すような日本語質問メ
ッセージが入力されると、図6に示すように、当該メッ
セージは処理テーブル13に転送される。
【0030】ステップ102) 情報要求抽出部4は、
処理テーブル13から取得した日本語質問メッセージに
ついて、抽出すべき文タイプを“情報要求”として文タ
イプ判定部3を起動する。 ステップ103) 文タイプ判定部3は、文タイプとそ
れを判定するための表現文字列パターンの組合せを格納
した文タイプ判定辞書2のエントリと、処理対象である
日本語文との文字照合を行い、日本語質問メッセージ中
に含まれる情報要求を直接記述した文(情報要求文)を
抽出し、情報要求文抽出部4に転送する。例えば、図5
の例では、第3文の『そのために必要な接続用のケーブ
ルを探していますが、』及び第4文の『どこのお店に売
っているかご存じの方はいらっしゃいませんか。』が該
当する。
【0031】ステップ104) 情報要求文抽出部4
は、情報要求文を文タイプ判定部3より取得して、日本
語基本解析部5に転送する。なお、情報要求文抽出部4
の動作は図7を用いて詳述する。 ステップ105) 日本語基本解析部5は、情報要求文
抽出部4より転送された情報要求文の形態素・構文解析
を行い、その解析結果を意味構造解析部7に転送する。
【0032】ステップ106) 意味構造解析部7は、
日本語質問メッセージにおいて固有な意味構造パターン
を格納した意味構造パターン辞書6におけるエントリと
日本語基本解析部5の解析結果とを照合することにより
情報要求文の意味構造を求める。求められた意味構造
は、参照表現解消制御部9に転送される。
【0033】ステップ107) 参照表現解消制御部9
は、日本語質問メッセージにおける情報要求文に含まれ
得る参照表現のパターンと、参照表現の参照先を探索す
る探索方向と探索対象となる日本語文の文タイプ、参照
表現の言語表現単位が格納されている参照表現解消制御
テーブル8を、入力された情報要求文の意味構造に基づ
いて検索し、参照先を含む可能性のある候補文を選択す
る。
【0034】ステップ108) 参照表現解消制御部9
は、文タイプ判定部3を起動して、選択した候補文の適
格性を判定する。 ステップ109) 参照表現解消制御部9により候補文
が得られると、実際に参照表現の参照先を求める参照表
現解消部10を起動して、入力された情報要求文に含ま
れる必要な参照表現の解消を行う。
【0035】ステップ110) 情報要求構造化部11
は、上記の処理によって入力された日本語メッセージか
ら複数の情報要求文が抽出された場合には、情報要求の
対象文の同一性を判定する。 ステップ111) 情報要求構造化部11は、同一性が
確認できる場合は、複数の情報要求部の意味構造を統合
して単一の意味構造として処理対象の日本語メッセージ
における情報要求を構造化する。
【0036】ステップ112) 出力部12は、上記の
手順により、対象の日本語質問メッセージから抽出し、
構造化した情報要求を後段に接続される装置に出力す
る。次に、図5に示す日本語質問メッセージを例として
日本語質問メッセージ解析装置を利用した日本語質問メ
ッセージ解析システムを詳細に説明する。
【0037】i) 入力処理 まず、図5に示す日本語質問メッセージが入力部1に入
力される。入力部1は、入力された日本語質問メッセー
ジを文の集合として図6に示すようにテーブル構造に分
解して格納する。図6に示す処理テーブル13のエント
リは、5つのフィールドからなり、第1のフィールドに
は、文番号、第2のフィールドには、文の文字列、第3
のフィールドには文タイプ、第4のフィールドには、文
サブタイプ、第5のフィールドには、文の構造に関する
情報を保持するメモリ領域へのポインタが格納される。
この処理テーブル13における各エントリの第3から第
5のフィールドは、初期値として情報が存在しないこと
を示す記号である“NIL”が格納される。入力部1
は、図6に示される処理テーブル13の内容を情報要求
文抽出部4へ転送する。
【0038】ii) 情報要求文抽出処理 次に、情報要求文抽出部4の動作論理の概要を説明す
る。図7は、本発明の一実施例の情報要求文抽出部の詳
細な動作を示すフローチャートである。 ステップ201) まず、初期値として、入力されるメ
ッセージの文のカウントiを1とし、入力メッセージの
文の総数をNとする。
【0039】ステップ202) 入力部1より、図6に
示す形態の処理テーブル13に日本語質問メッセージが
入力される。 ステップ203) 情報要求文抽出部4は、抽出すべき
文タイプを“情報要求”と指定して文タイプ判定部3を
起動する。
【0040】ステップ204) 情報要求文抽出部4
は、入力された日本語質問メッセージ中に含まれる情報
要求を直接記述した文タイプを取得できた場合には、ス
テップ205に移行し、取得できない場合には、ステッ
プ206に移行する。 ステップ205) 情報要求の文タイプを取得できた場
合には、抽出された文タイプ(即ち、情報要求)と副作
用として得られる文サブタイプを該当する処理テーブル
13のエントリに記入する。ここで、文サブタイプと
は、文タイプ「情報要求」に対して取得される当該文の
要旨を示し、図6の第3文『そのために必要な接続用の
ケーブルを探していますが、』の文サブタイプは“物品
の入手”となる。情報要求は処理テーブル13上(図
6)のエントリの第3フィールドに、文サブタイプは第
4フィールドにそれぞれ記入する。
【0041】ステップ206) メッセージのカウント
iをインクリメントする。 ステップ207) メッセージのカウントiがNより大
きい場合には処理を終了し、まだ、処理すべきメッセー
ジがある場合には、ステップ202に移行する。
【0042】次に、文タイプ判定辞書2について説明す
る。図8は、本発明の一実施例の文タイプ判定辞書の例
を示す。同図に示すように、文タイプ判定辞書2は、同
図(A)に示すように表現文字列テーブルと、同図
(B)に示すように文タイプ判定テーブルの2つの部分
から構成される。
【0043】同図(A)の表現文字列テーブルは、各エ
ントリが3つのフィールドを有するテーブル構造であ
り、第1のフィールドにはエントリID、第2のフィー
ルドには当該表現文字列のもつ機能を表現する機能I
D、第3のフィールドには表現文字列が格納される。
【0044】同図(B)に示す文タイプ判定テーブル
は、3つのフィールドを持つテーブル構造であり、第1
のフィールドには文タイプ、第2のフィールドには文サ
ブタイプが格納され、第3のフィールドには各々が文タ
イプ、文サブタイプを判定するための表現文字列パター
ンの組合せを表現する機能IDリストと呼ぶ構造の先頭
要素へのポインタのリストが格納される。
【0045】第1のフィールドの文タイプには同図に示
すように「情報要求」と「ゴール言明」等が設定されて
いる。「ゴール言明」とは、ユーザ自身の目標(ゴー
ル)を表現するものである。第3フィールドの機能ID
リストにおける各セル要素は、2つのフィールドを持っ
ている。機能IDリストのフィールド内の第1のフィー
ルドには、機能ID、第2のフィールドには後続し得る
セルへのポインタのリストが格納される。
【0046】文タイプ判定部3は、図8(B)に示す文
タイプ判定辞書2の文タイプ判定テーブルのエントリ
と、処理対象である日本語文との文字列照合を行うこと
により、処理対象文が指定された文タイプを持つかを判
定する。以下に文タイプ判定部3の動作論理の概要を説
明する。
【0047】図9は、本発明の一実施例の文タイプ判定
部の動作の概要を示すフローチャートである。同図に示
す処理は4つのブロック(ステップ300、400、5
00、600)に分けられる。それらの詳細は、図1
0、図11、図12、図13に詳細に説明する。以下に
示す各フローチャートにおいて、以下のような記号及び
関数を示す。 ・i,j,k,L,M,N … 整数 ・R1,R2,R3,R4 … 集合 ・{}… 空集合 ・{A,B,C} … A,B,Cの3つの要素を持つ
集合 ・+ … 集合に対する和集合を作る演算 ・S: 対象日本語文の文字列 ・L(i):エントリID=iである表現文字列リスト
のエントリ ・L(i).fid, L(i).string:同エントリにお
ける機能ID,表現文字列 ・T(i):文タイプ判定テーブルにおけるi番目のエ
ントリ ・T(i).type:該エントリにおける文タイプ ・T(i).pointer(k):該エントリにおける機能ID
リストにおけるk番目のポインタ ・search(X,Y) :文字列Yが文字列Xの部分文字列であ
る場合、文字列Xの文字列Yにおける先頭位置を返す関
数。部分文字列でない場合は0を返す。 ・comb(i,X):集合Xからi子の要素を選択することに
より生成可能な集合を要素とする集合を生成する関数。
Xの要素数をNとすれば、comb(N,X)={X}であ
る。 ・check-overlap (X):Xは集合R2の要素であり、
{…,{pos-i, length-i, fid-i}, …}という構造を
持つ。check-overlap(X)は、Xの要素を全て調べ、部
分文字列の先頭位置(pos)、長さ(len )の情報から、
Xに格納されている各部分文字列において、オーバーラ
ップが生じるかをチェックし、yes/noを返却する関数で
ある。 ・check-list(pointer, X):pointer は、文タイプ判
定テーブルのあるエントリにおける機能IDリストに格
納されたポインタである。Xは、集合R3の要素であ
り、{…,{pos-i, length-i,fid-i …}という構造を
持つ。check-list(pointer, X)は、Xの各要素におけ
る機能ID(fid-i)とpointer からポイントされる機能
IDリストにおける各要素セルに格納された機能IDが
全て一致するかをチェックし、yes/noを返却する関数で
ある。 ・compute-length(X):Xは集合R4の要素であり、
{{…,{pos, length-i,fid-i }, …}, i,k}と
いう構造を持つ。compute-length(X)は、Xの第1要
素である集合{…,{pos, length-i,fid-i }, …}の
各要素を走査し、文字列長(len-i )の合計を求める。 ・compute-items (X):Xは集合R4の要素であり、
{{…,{pos, length-i,fid-i }, …}, i,k}と
いう構造を持つ。compute-items (X)は、Xの第1要
素である集合{…,{pos, length-i,fid-i }, …}の
要素数を求める。
【0048】ステップ300) まず、文タイプ判定部
3は、図8(A)の表現文字列テーブルを参照して、対
象日本語文の部分文字列となっている表現文字列を求め
る。処理の詳細を図10に示す。 ステップ400) ステップ300により抽出された表
現文字列の対象文における可能な組合せパターンを求め
る。処理の詳細を図11に示す。
【0049】ステップ500) 組合せパターンと文タ
イプ判定テーブル(図8(B))の照合を行い、文タイ
プを判定する。処理の詳細を図12に示す。 ステップ600) 文タイプ判定テーブルにおける複数
のエントリとの照合が成功する場合、ひとつのエントリ
を選択する。処理の詳細を図13に示す。
【0050】図10は、本発明の一実施例の文タイプ判
定部の第1の動作を説明するフローチャートである。同
図は、上記のステップ300の詳細な動作を示す。第1
の動作は、対象日本語文の部分文字列となっている表現
文字列を求める。 ステップ301) iを1とし、Nに表現文字列リスト
のエントリ数を設定し、R1は空集合{}とする。
【0051】ステップ302) 部分文字列の先頭位置
(pos)がpos =serach( S,L(i).string)≠
0であれば、ステップ303に移行し、pos =serach(
S,L(i).string)=0であればステップ304に
移行する。 ステップ303) R1=R1+{pos, length (L
(i).string),L(i).fid }; とする。
【0052】ステップ304) iをインクリメントす
る(i=i+1)。 ステップ305) i>Nであれば、ステップ306に
移行し、i≦Nであればステップ302に移行する。 ステップ306) Rが空集合({})であれば、対象
日本語文を指定された文タイプを持たないとして処理を
終了する。Rが空集合でなければステップ302に移行
する。
【0053】図11は、本発明の一実施例の文タイプ判
定部の第2の動作を説明するためのフローチャートであ
る。第2の動作は、抽出された表現文字列の対象文にお
ける可能な組合せパターンを求めるものである。 ステップ401) N=R1の要素数とし、R2=comb
(1,R1)+…+comb(N−1,R1)+R1とす
る。
【0054】ステップ402) i−1とし、M=R2
の要素数とし、R3={}とする。 ステップ403) R2(i)に格納されている各部分
文字列においてオーバーラップが生じるかをチェック
し、生じない場合(no)には、R3=R3+R2
(i)とする。
【0055】ステップ404) iをインクリメントす
る(i=i+1)。 ステップ405) i>Lであればステップ406に移
行し、i≦Lであればステップ402に移行する。 ステップ406) R3={}であれば、対象日本語文
は指定された文タイプを持たないとして処理を終了す
る。R3が空集合でなければステップ403に移行す
る。
【0056】図12は、本発明の一実施例の文タイプ判
定部の第3の動作を説明するためのフローチャートであ
る。第3の動作は、組合せパターンと文タイプ判定テー
ブルの照合を行い、文タイプを判断するものである。 ステップ501) i=1とし、Lに文タイプ判定テー
ブルのエントリ数を設定し、R4を空集合({})とす
る。
【0057】ステップ502) エントリにおける文タ
イプT(i).type が指定された文タイプと一致しなけ
れば、処理を終了する。 ステップ503) j=1とし、Mに文タイプ判定テー
ブル(図8(B))のi番目のエントリT(i)の機能
IDリストのエントリ数を設定する。
【0058】ステップ504) k=1とし、NにR3
の要素数を設定する。 ステップ505) 文タイプ判定テーブルのあるエント
リにおける機能IDリストにおける機能IDリストに格
納されたポインタcheck-list(T(i).pointer(j),
R3(k))において、要素セルに格納された機能ID
が全て一致する場合には、R4=R4+{R3(k),
i,j}とする。
【0059】ステップ506) kをインクリメントす
る(k=k+1)。 ステップ507) k>Nであれば、ステップ508に
移行し、k≦Nであればステップ505に移行する。 ステップ508) jをインクリメントする(j=j+
1)。
【0060】ステップ509) j>Mであれば、ステ
ップ510に移行し、j≦Mであればステップ505に
移行する。 ステップ510) iをインクリメントする(i=i+
1)。 ステップ511) i>Lであればステップ512に移
行し、i≦Lであれば、ステップ505に移行する。
【0061】ステップ512) R4が空集合({})
であれば、対象日本語文は指定された文タイプを持たな
いとして処理を終了する。 ステップ513) R4の要素数が1なら、当該要素の
文タイプと文サブタイプの組を返却して処理を終了す
る。R4の要素数が1より大きい場合には、ステップ5
04に移行する。
【0062】図13は、本発明の一実施例の文タイプ判
定部の第4の動作を説明するためのフローチャートであ
る。第4の動作は、文タイプ判定テーブルにおける複数
のエントリとの照合が成功する場合、一つのエントリを
選択する。 ステップ601) select=1とし、length=compute-
length(R4(1))とし、items =compute-items
(R4(1))とする。
【0063】ステップ602) i=2とし、NにR4
のエントリ数を設定する。 ステップ603) length<compute-items (R4
(i))であれば、ステップ604に移行し、length≧
compute-items (R4(i))であれば、ステップ60
6に移行する。
【0064】ステップ604) items >compute-item
s (R4(i))であれば、ステップ605に移行し、
items ≦compute-items (R4(i))であれば、ステ
ップ606に移行する。 ステップ605) select=i、length=compute-leng
th(R4(i))、items =compute-items (R4
(i))とする。 ステップ606) iをインリメントする(i=i+
1)。
【0065】ステップ607) i>Nであれば、ステ
ップ608に移行し、i≦Nであれば、ステップ603
に移行する。 ステップ608) Nの当該要素の文タイプと文サブタ
イプの組を返却して処理を終了する。
【0066】図5に示す日本語質問メッセージに対する
文タイプ判定部3の動作の概要を上記の図9〜13のフ
ローチャートに基づいて説明する。 (1) まず、第1文『初めて質問します。』は、ステ
ップ300により図8(B)の表現文字列テーブルに格
納されている文字列のいずれとも照合しないことが分か
る。従って、情報要求文とは判断されない。
【0067】(2) 次に、第2文『17インチモニタ
ーをVA066に接続したいと考えています。』は、ス
テップ300により図8(B)の表現文字列テーブルに
格納されているエントリID=13の表現のみと照合一
致する。このエントリ機能IDは800であり、ステッ
プ500により、これは、“情報要求”の文タイプを規
定する表現文字列パターンの組合せとは判断されない。
従って、情報要求文とは判定されない。
【0068】(3) 次に、第3文『そのために必要な
接続用ケーブルを探していますが、』は、ステップ30
0により図8(B)の表現文字列テーブルに格納されて
いるエントリID=3の表現文字列のみと照合する。こ
のエントリは機能IDが100であり、ステップ500
により、これは、“情報要求”の文タイプを規定する表
現文字列パターンの組合せと判定される。同時に、文サ
ブタイプが“対象物品提示”であることが副作用として
得られる。
【0069】(4) 第4文『どのお店に売っているか
ご存じの方はいらっしゃいませんか。』は、ステップ3
00により図8(B)の表現文字列テーブルに格納され
ている3つのエントリ、即ち、エントリID=5,エン
トリID=7,エントリID=11の表現文字列と照合
し、これらの機能IDは、それぞれ、200、300、
400である。ステップ300の結果である集合R1
は、 R1={{1,11,200}},{{12,7,30
0}},{{19,10,400}} となる。また、ステップ400の処理結果である集合R
3は、 R3={{{1,11,200}},{{12,7,3
00}},{{19,10,400}},{{1,1
1,200},{12,7,300}},{{1,1
1,200},{19,10,400}},{{12,
7,300},{19,10,400}},{{1,1
1,200},{12,7,300},{19,10,
400}}} となる。さらに、このR3に対してステップ500によ
る文タイプ判定テーブルとの照合を行うと、その結果と
して、集合R4が、 R4={{{{12,7,300},{19,10,4
00}},1,2},{{{1,11,200},{1
2,7,300}},{19,10,400}},1,
1}} と得られる。これは、“情報要求”の文タイプを与える
部分文字列の組合せが2通りあることを示す。よって処
理は、ステップ600に移行する。ステップ600で
は、照合した表現文字列によってカバーされる文字列の
長さがカウントされ比較される。ここでは、R4の第2
要素で与えられる組合せがカバーする文字列長(=2
8)の方が第1要素で与えられる組合せがカバーする文
字列長(=17)より長いので、第2要素で与えられる
組合せが選択される。よって、文タイプ=“情報要求”
が確認され、さらに、文サブタイプ=“物品の入手”が
副作用として得られる。
【0070】(5) 最後に、第5文『よろしくお願い
致します。』は、図8(B)の表現文字列リストに格納
されている文字列のいずれとも照合しないため、第1文
の場合と同様に(ステップ300)情報要求文とは判定
されない。以上の処理により、第3文『そのために必要
な接続用ケーブルを探していますが、』に対して、文タ
イプ(“情報要求”)及び文サブタイプ(“物品の入
手”)が求められ、該当する処理テーブル13のエント
リの第3、第4フィールドに格納される。この状況を図
14に示す。
【0071】文タイプ判定部3によって、文タイプが
“情報要求”であると判定された日本語質問メッセージ
の文は、入力された日本語文に対して形態素・構文解析
を行う日本語基本解析部5に転送される。 iii) 日本語基本解析処理 図5に示す日本語質問メッセージにおける第3文に対す
る日本語基本解析の結果の概要を図15に示す。同図に
示すように、基本解析の結果は、文節を節点、文節間の
係り受け関係を枝、係り受け関係の属性の枝へのラベ
ル、最終文節を根とする構文木構造として表現され、処
理テーブル13の第5フィールドへの根節点のアドレス
(根節点へのポインタ)が格納される。ここで、各節点
には、各文節に対する形態素解析の結果が保持されるも
のとする。なお、形態素解析や構文解析の処理は通常の
日本語処理システムに具備されているものであるので、
その実現方法については本発明では限定するものではな
い。
【0072】文タイプ判定部3によって、文タイプが
“情報要求”であると判定され、日本語基本解析部5に
よる解析処理が行われた日本語質問メッセージの文は、
意味構造解析部7へ転送される。意味構造解析部7は、
日本語質問メッセージにおいて、固有な意味構造パター
ンを格納した、予め用意された意味構造パターン辞書6
におけるエントリと日本語基本解析部5の解析結果とを
照合することにより、情報要求文の意味構造を求める。
【0073】図16は、本発明の一実施例の意味構造パ
ターン辞書6のエントリ例を示す。矢印の左側は、統合
すべき構文木構造であり、矢印の右側は照合が成功した
場合に変換すべき構文木構造を示している。同図に示さ
れるように、辞書のエントリは、部分的な構文木構造と
して表現されている。また、同図において、“$HEA
D”、“$X”等はマッチする部分木構造を保持するた
めの変数であり、{}内に列挙される“TYPE==
“情報要求”等の表現は、各節点自体への制約を示す。
例えば、当該表現は、該当する文タイプが“情報要求”
でなければならないという制約を表現している。同様
に、“SubType==“対象物品の提示”は、文サ
ブタイプに関する制約を表現している。
【0074】意味構造解析部7は、入力された構文木構
造のなるべく多くの部分が意味構造パターン辞書6にエ
ントリされている部分構文木構造で覆われるように照合
処理を行い、照合が成功した場合、構文木構造と属性と
属性値のペアの集合により、表現される指定された意味
構造へと変換する。図15に示された日本語基本解析部
5の処理結果は、意味構造解析部7により図16
(A),(B)にエントリ例を示す意味構造パターン辞
書6のエントリとの照合処理によって、図17に示すよ
うな意味構造へと変換される。図17において、“:n
eeded−for”や“:item−for”等の意
味属性名を表す標識は、意味構造パターン辞書6におけ
る対応するエントリにより与えられる。
【0075】意味構造解析部7の処理結果である意味構
造は、その記憶領域へのポインタが処理テーブル13の
第5フィールドへ格納されることにより、保持される。
この結果は、さらに、参照表現解消制御テーブル8と文
タイプ判定部3を用いて参照表現の解消処理を制御する
参照表現解消制御部9へ転送される。
【0076】iv) 参照表現解消処理 参照表現解消制御部9は、入力された情報要求文の意味
構造に基づいて、上記の参照表現解消制御テーブル8か
ら得た探索方向に関する情報に基づいて参照先を含む可
能性のある候補文を選択する。この際、上記の参照表現
解消制御テーブル8から得た文タイプの情報を用いて文
タイプ判定部3を起動して、候補文の適格性を判定す
る。
【0077】図18は、本発明の一実施例の参照表現解
消制御部の動作を示すフローチャートである。 ステップ701) 参照表現解消制御部9は、処理対象
の情報9応急文の意味構造を走査し、属性値として表さ
れる言語表現解析部分に含まれる参照表現を抽出する。
例えば、「その」、「あの」等の文脈指示御等による参
照表現を抽出する。
【0078】ステップ702) 初期設定として、カウ
ントi=1とし、Nを抽出した参照表現の数、Lを処理
対象文のメッセージ先頭からの位置とする。 ステップ703) 次に、これらの参照表現と意味構造
における意味属性キーとして、参照表現の参照先を探索
する探索方向、探索対象となる日本語文の文タイプ、参
照先の用言の言語表現単位を格納した、予め用意された
参照表現解消テーブル8を検索し、これらの制御情報を
取得する。
【0079】ステップ704) 以下、ステップ703
の結果に基づいて処理対象の参照表現を含む文に近い文
から順に指定された探索方向に沿って一文ずつ参照先が
求められるまで以下の処理を行う。まず、探索方向Dが
同一文である場合に、ステップ705に移行し、異なる
場合には、ステップ708に移行する。
【0080】ステップ705) 参照表現解消制御部9
は、文タイプ判定部3を起動して、探索方向Dが同一文
である場合には、参照表現解消部10を起動して、実際
に参照表現の参照先を求める。 ステップ706) 処理が成功した場合にはステップ7
07に移行し、失敗の場合には、ステップ719に移行
する。
【0081】ステップ707) 意味構造における処理
対象の参照表現の部分を参照先に対する意味構造で置換
し、ステップ719に移行する。 ステップ708) カウントjに1を設定する。 ステップ709) 参照表現解消制御部9は、探索方向
Dが前方である場合には、ステップ710に移行し、そ
れ以外である場合には、ステップ711に移行する。
【0082】ステップ710) 第(L−j)文を候補
文とし、ステップ712に移行する。 ステップ711) 参照表現解消制御部9は、探索方向
Dが“前方”以外の場合には、第(L+j)文を候補文
とする。
【0083】ステップ712) 文タイプ判定部3を起
動する。 ステップ713) 文タイプ判定部3は、候補の文が指
定された文タイプを有するかを判定し、有している場合
には、ステップ714に移行し、有していない場合に
は、ステップ717に移行する。
【0084】ステップ714) 上記の判定が合格であ
れば、参照表現解消制御部9は、参照表現解消部10を
起動して、実際に参照表現の参照先を求める。なお、こ
の処理自体は、表現表記の同一性や、シソーラスを用い
た意味的な同一性のチェック等の既存の技術で実現され
るものとし、その詳細は、本発明の要旨には直接関連が
ないので、説明は省略する。
【0085】ステップ715) 参照表現の参照先が得
られた場合には、ステップ716に移行し、取得できな
った場合には、ステップ717に移行する。 ステップ716) 参照表現の部分を参照先に対する意
味構造で置換し、ステップ720に移行する。
【0086】ステップ717) カウントjをインリメ
ントする(j=j+1)。 ステップ718) 探索方向Dが“前方”であるとき
に、j<1または、探索方向Dが“後方”時にj<質問
メッセージにおける文数であれば、ステップ719に移
行し、それ以外であれば、ステップ708に移行する。
【0087】ステップ719) カウントiをインクリ
メントする(i=i+1)。 ステップ720) カウントiが抽出した参照表現の数
Nより大きい場合には、処理を終了し、参照表現の数に
満たない場合には、ステップ703に移行する。
【0088】なお、上記のフローチャートの動作におい
て、参照表現解消にあたっては、参照先を含む候補文の
基本解析が一般には必要である。本発明では、参照表現
解消部10は、必要に応じて日本語基本解析部を起動す
るものと仮定する。以下では、図18、図19の動作論
理による図17の例に対する参照表現解消制御部9の動
作を説明する。
【0089】ここで、図17の例を説明するに足りる参
照表現解消制御テーブル8の構成例を説明する。図20
は、本発明の一実施例の参照表現解消制御テーブルの例
を示す。当該参照表現解消制御テーブル8は、各エント
リが5つのフィールドを持つテーブル構造である。第1
フィールドには、参照表現、第2フィールドには、対応
する意味属性、第3フィールドには、候補文の探索方
向、第4フィールドには、候補文の文タイプ、第5フィ
ールドには、参照先表現の言語表現単位が格納される。
まず、上記のステップ701により、意味属性 “:needed-for ” に対する属性値である 〈その〉の部分が唯一の参照表現として抽出される。こ
の判定は、“その”に対する形態素解析の結果から、品
詞が指示詞と同定されることにより行われる。
【0090】次に、ステップ703により参照表現解消
制御テーブル8を検索し、探索方向D=“前方”、文タ
イプT=“ゴール言明”、ゴール言明S=“ゴール言明
文の命題部分”が得られる。次にステップ709により
第2(=3−1)文が候補文となり、当該文が“ゴール
の言明”の文タイプを持つかが、文タイプ判定部3によ
り判定される。ここでは、文タイプ判定部3の動作の説
明は省略するが、図8に示す文タイプ判定辞書2を用い
て、図9〜図13に示す動作論理を実施すると、文タイ
プは“ゴール言明”と判定される。よって、処理はステ
ップ705に移行し、参照先は、メッセージの第2文 “17インチモニタをVA066に接続したいと考えて
います。”であり、ゴール言明文の命題部分として、 〈17インチモニターをVA066に接続する〉と解消
される。以上により、本例に対する参照表現解消制御部
9は、処理を終了する。以上により、図5の日本語質問
メッセージにおける第3文の意味構造は、図21(A)
に示すようになり、当該構造の格納領域の先頭アドレス
が処理テーブル13の第5フィールドに格納される。
【0091】また、図5の日本語質問メッセージにおけ
る第4文では、「どこのお店に売っている」かをユーザ
が尋ねているところの対象文「接続用のケーブル」が省
略されている。このような言語現象は、ゼロ代名詞と呼
ばれ、日本語の談話構造において頻繁に表れる一種の参
照表現である。この参照先の解消も、参照表現制御部9
により行われる。ゼロ代名詞に対する同定処理も既存の
技術で実現されることを前提とするため、ここでは、ゼ
ロ代名詞の参照先解消に関する参照表現解消部10の動
作の詳細について規定しないが、結果としては、前文に
おける〈ケーブル〉が参照先として、同定されることを
想定する。第4文に対するここまでの処理による意味構
造は図21(B)に示すようになる。
【0092】以上の処理によって入力された日本語質問
メッセージから唯一の情報要求文が抽出され、その意味
構造が得られた場合、それを当該メッセージにおける情
報要求として、出力部12から出力する。 v) 情報要求統合処理 一方、複数の情報要求文が抽出され、それぞれの意味構
造が得られた場合、情報要求構造化部11は、それぞれ
の情報要求文における情報要求対象物の同一性を判定
し、同一性が確認できる場合は、複数の情報要求文の意
味構造を統合して、単一の意味構造として処理対象の日
本語メッセージにおける情報要求を構造化する。この統
合の処理は、自然言語処理や人口知能の研究開発分野で
広く知られている素性構成のユニフィケーション処理に
より行う。以上の処理手順によって、対象の日本語質問
メッセージから抽出され、構造化された情報要求は、出
力部12を介して後段に接続される装置へと出力され
る。
【0093】情報要求構造化部11の動作論理の概要を
図22に示す。図5に示す日本語質問メッセージから図
21(A),(B)に示す2つの情報要求文の意味構造
が得られている状況における情報要求構造化部11の動
作を説明する。 ステップ801) 情報要求構造化部11は、意味属性
“:head ”に対する属性値ある項の同一性をチェックす
る。同一性が成立しなければステップ802に移行し、
成立する場合には、ステップ803に移行する。
【0094】ステップ802) 同一性が成立しない場
合には、統合不可として処理を終了する。 ステップ803) 各意味構造における意味属性文サブ
タイプの属性値を比較し、各意味構造における意味属性
文サブタイプの属性値を最も詳細な情報を持つ属性値に
置換する。
【0095】ステップ804) 各情報要求文に対する
意味構造間でのユニフィケーション処理を行う(同一の
意味属性を持つ場合は、それぞれの属性値の同一性をチ
ェックする。これらについての全ての同一性が確認でき
れば、各意味構造の和を取る)。
【0096】ステップ805) ユニフィケーションが
成功すれば、ステップ806に移行し、失敗すれば、ス
テップ807に移行する。 ステップ806) ユニフィケーションが成功した場合
には、その結果を情報要求構造とし、処理を終了する。
【0097】ステップ807) ユニフィケーションが
失敗した場合には、各意味構造をそれぞれ独立した情報
要求構造とし、処理を終了する。次に上記の図22のフ
ローチャートに従って、詳細に説明する。まず、ステッ
プ801によって、標識“:head ”を持つ部分構造の同
一性をチェックする。図16、図17の入力例において
は、双方とも、標識“:head ”を持つものは、名詞「ケ
ーブル」で一致するため、これは、成功する。このよう
な同一の単語ではなくとも、「フロッピー」と「FD」
のように同じ意味であるが異表記の単語が用いられる場
合は「二次記憶」と「ハードディスク」のように文脈状
況においては同一の単語とみなせる場合がある。本発明
においては、このような意味の同一性のチェックは、既
存の表記ゆらぎの吸収技術やシソーラスを用いた意味チ
ェック等により達成されるものと仮定し、その詳細につ
いては規定しない。
【0098】次に、ステップ803において、統合され
て得られる意味構造の文サブタイプ属性に与える属性値
を決定する。この属性値は、統合対象となっている各意
味構造における“文サブタイプ”属性の中で最も詳細な
情報を表現しているものとする。この属性は、図21
(A)では、“SEEK−OBJECT”であり、図2
1(B)では、“HOW−TO−GET”である。よっ
て、後者がより詳細な情報を表現するものとして選択さ
れる。実際の処理では、図21(A)の構造の“文サブ
タイプ”属性の属性値が“SEEK−OBJECT”か
ら“HOW−TO−GET”へ書換えられる。
【0099】次に処理の制御は、ステップ804に移行
する。ステップ804では、人口知能や自然言語処理の
分野では広く知られている素性構造のユニフィケーショ
ンと呼ばれる構造統合の処理が行われる。この処理は、
対象の各構造に含まれる属性と属性値のペアの整合性を
チェックし、各構造の情報を包合する最小の情報を持つ
統合された構造を求める処理である。説明中の例に対し
ては、図23に示す構造が最終的な情報要求構造として
生成され、出力部12へ転送される。この例では、図2
1(B)に示す構造に“:head”標識以外の情報が
存在しなかったため、図21(A)の構造における“文
サブタイプ”属性のみが書換えられた構造がそのまま最
終的な統合された情報要求構造となる。この結果は、出
力部12を介して後段に接続される装置へと転送され
る。
【0100】このような例に対して、統合される構造に
おいて、統合元の2つの構造双方における情報の和が取
られる場合の例を図24(A)に示し、同じ標識を持つ
部分構造が同一性を持たないために、統合ができない場
合の例を図24(B)に示す。この例では、双方の構造
が“needed-for”の標識を持つが、それらの項が違う事
態を記述しているため、両者の構造を統合することはで
きない。このような場合、2つの情報要求構造が出力部
12を介して出力される。
【0101】なお、本発明の日本語質問メッセージ解析
装置を以下のように適用することも可能である。例え
ば、コンピュータネットワークにおける電子掲示板に投
稿される質問メッセージを本発明の日本語質問メッセー
ジ解析装置を用いて一定のタイミングで解析し、それら
における情報要求を抽出することによって、抽出された
情報要求に適合する情報をコンピュータネットワーク上
に蓄積された質問・回答メッセージのデータベースから
検索することが可能となる。
【0102】さらに、本発明の日本語質問メッセージ解
析装置を電話によるサービス提供に適用する場合には、
入力部1に入力されるデータは、テキストデータである
ので、音声入力された音声データを音声認識処理により
認識された結果をテキストデータに変換する機能を入力
部1の前段に設けることで音声入力による情報検索も可
能となる。このとき、センタ側のオペレータが検索結果
を表示手段上で視認して利用者に電話音声で返答するこ
とも可能である。また、出力部12から出力される情報
要求によりデータベースを検索した結果を、音声に変換
して利用者に返すことも可能である。
【0103】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0104】
【発明の効果】上述のように、本発明によれば、情報検
索システムに対する複雑かつ多様な情報要求の指示を記
述した自然な日本語メッセージに記述される情報要求を
構造化することができる。そのため、本発明による日本
語メッセージ構造化機能は、情報検索システムに組み込
まれることにより、従来のキーワードの論理結合形式で
情報要求を表現するものより柔軟な情報検索システムを
実現するためのコンポーネントとなり得る。
【0105】また、本発明による日本語質問メッセージ
構造化装置においては、形態素解析や構文解析といった
文法規則を必要とする基本的な言語解析処理や、参照表
現の参照先を同定する参照表現解消処理が、処理対象の
メッセージ全体から質問メッセージの特定に基づいて選
択される必要な部分のみに適用されるため、 (1)処理が高速である; (2)メッセージ全体を処理対象とする通常のメッセー
ジ解析手法に比べ高い解析精度が達成されるという利点
がある。また、質問メッセージの特性に基づいて解析さ
れる意味構造に基づいて参照表現解消処理を制御するた
め、参照表現解消についても高い精度を見込むことがで
きる。
【0106】また、本発明を種々のメッセージ処理シス
テム等に多様に適用することが可能である。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の日本語質問メッセージ解析
装置の構成図である。
【図4】本発明の一実施例の日本語質問メッセージ解析
装置の動作の概要を示すフローチャートである。
【図5】本発明の一実施例の入力される日本語質問メッ
セージの例を示す図である。
【図6】本発明の一実施例の図5のメッセージを分解し
た例を示す図である。
【図7】本発明の一実施例の情報要求文抽出部の詳細な
動作を示すフローチャートである。
【図8】本発明の一実施例の文タイプ判定辞書の例を示
す図である。
【図9】本発明の一実施例の文タイプ判定部の動作の概
要を示すフローチャートである。
【図10】本発明の一実施例の文タイプ判定部の第1の
動作を説明するためのフローチャートである。
【図11】本発明の一実施例の文タイプ判定部の第2の
動作を説明するためのフローチャートである。
【図12】本発明の一実施例の文タイプ判定部の第3の
動作を説明するためのフローチャートである。
【図13】本発明の一実施例の文タイプ判定部の第4の
動作を説明するためのフローチャートである。
【図14】本発明の一実施例の図5のメッセージ判定後
の処理テーブルの例を示す図である。
【図15】本発明の一実施例の日本語質問メッセージに
おける日本語基本解析の結果の概要を示す図である。
【図16】本発明の一実施例の意味構造パターン辞書の
エントリの例を示す図である。
【図17】本発明の一実施例の意味構造への変換の例を
示す図である。
【図18】本発明の一実施例の参照表現解消制御部の動
作を示すフローチャートである。
【図19】本発明の一実施例の参照表現解消制御部の動
作を示すフローチャートである。
【図20】本発明の一実施例の参照表現解消制御テーブ
ルを示す図である。
【図21】本発明の一実施例の意味構造を示す図であ
る。
【図22】本発明の一実施例の情報要求構造化部の動作
を示すフローチャートである。
【図23】本発明の一実施例の統合処理の例を示す図で
ある。
【図24】本発明の一実施例の統合できる例/統合不可
の例を示す図である。
【符号の説明】
1 入力部,入力手段 2 文タイプ判定辞書 3 文タイプ判定部,文タイプ判定手段 4 情報要求文抽出部,情報要求文抽出手段 5 日本語基本解析部,日本語基本解析手段 6 意味構造パターン辞書 7 意味構造解析部,意味構造解析手段 8 参照表現解消制御テーブル 9 参照表現解消制御部,参照表現解消制御手段 10 参照表現解消部,参照表現解消手段 11 情報要求構造化部,情報要求構造化手段 12 出力部,出力手段 13 処理テーブル 41 文タイプ起動手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−106042(JP,A) 特開 平2−297157(JP,A) 特開 平5−233730(JP,A) 太田竜男,質問応答システムの構築, FUJITSU,日本,富士通株式会 社,1994年9月10日,第45巻 第5号, 第436頁乃至第442頁 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 テキスト形式で入力された日本語質問メ
    ッセージを解析する日本語質問メッセージ解析方法であ
    って、 前記日本語質問メッセージが入力され、 入力された処理対象の前記日本語質問メッセージについ
    て、特定の表現文字列に注目して、情報要求の核となる
    部分を述べている情報要求文を抽出し、 抽出された前記情報要求文に参照表現が含まれる場合
    に、前記情報要求文の該参照表現を前記情報要求文の特
    性に基づいて解消し、 抽出された複数の情報要求文が同一の対象物に対する情
    報要求を述べている場合に、該複数の情報要求文の構造
    を統合して、前記日本語質問メッセージにおける主たる
    情報要求を構造化し、 構造化された情報要求文を出力することを特徴とする日
    本語質問メッセージ解析方法。
  2. 【請求項2】 前記情報要求文を抽出する際に、 前記日本語質問メッセージを構成する日本語文が果たす
    機能的役割である情報要求や、ユーザの目的であるゴー
    ル言明の文タイプと、該情報要求及び該ゴール言明を判
    定するための表現文字列パターンの組合せが予め格納さ
    れている文タイプ判定辞書を参照し、前記日本語質問メ
    ッセージが指定された文タイプに対応するかを文字列の
    照合により判定し、 前記日本語質問メッセージから情報要求の機能を有する
    文を抽出する請求項1記載の日本語質問メッセージ解析
    方法。
  3. 【請求項3】 前記情報要求文が抽出されると、 抽出された前記情報要求文に対して形態素・構文解析を
    行い、 前記日本語質問メッセージについて、固有な意味構造パ
    ターンをエントリ毎に予め格納した意味構造パターン辞
    書を参照して、該エントリと形態素・構文解析された前
    記情報要求文の解析結果とを照合し、 前記情報要求文の意味構造を求める請求項1記載の日本
    語質問メッセージ解析方法。
  4. 【請求項4】 前記参照表現を解消する際に、 前記日本語質問メッセージにおける前記情報要求文に含
    まれ得る参照表現のパターンと、該参照表現の参照先を
    探索する探索方向と、探索対象となる日本語文の文タイ
    プ、該参照表現の言語表現単位を予め格納した参照表現
    解消制御テーブルを参照して、 探索対象となる日本語文の文タイプが指定された文タイ
    プに対応するかを判定し、対応する場合に、参照表現の
    解消処理を制御する請求項1記載の日本語質問メッセー
    ジ解析方法。
  5. 【請求項5】 テキスト形式で入力された日本語質問メ
    ッセージを解析する日本語質問メッセージ解析装置であ
    って、 前記日本語質問メッセージを入力する入力手段と、 入力された処理対象の前記日本語質問メッセージについ
    て、特定の表現文字列に注目して、情報要求の核となる
    部分を述べている情報要求文を抽出する情報要求文抽出
    手段と、 前記情報要求文抽出手段により抽出された前記情報要求
    文に参照表現が含まれる場合に、該参照表現を前記情報
    要求文の特性に基づいて解消する参照表現解消手段と、 抽出された複数の情報要求文が同一の対象物に対する情
    報要求を述べている場合に、該複数の情報要求文の構造
    を統合して、前記日本語質問メッセージにおける主たる
    情報要求を構造化する情報要求構造化手段と、 前記情報要求構造化手段により統合された情報要求文を
    出力する出力手段とを有することを特徴とする日本語質
    問メッセージ解析装置。
  6. 【請求項6】 前記情報要求文抽出手段は、 前記日本語質問メッセージを構成する日本語文が果たす
    機能的役割である情報要求やユーザの目的であるゴール
    言明の文タイプと、該情報要求及び該ゴール言明を判定
    するための表現文字列パターンの組合せが予め格納され
    ている文タイプ判定辞書と、 前記文タイプ判定辞書を参照して、前記日本語質問メッ
    セージが指定された文タイプに対応するかを文字列の照
    合により判定する文タイプ判定手段と、 前記文タイプ判定手段を起動させ、前記日本語質問メッ
    セージから情報要求の機能を有する情報要求文のみを抽
    出する文タイプ判定起動手段とを含む請求項5記載の日
    本語質問メッセージ解析装置。
  7. 【請求項7】 前記情報要求文抽出手段により抽出され
    た前記情報要求文に対して形態素・構文解析を行う日本
    語基本解析手段と、 前記日本語質問メッセージについて、固有な意味構造パ
    ターンをエントリ毎に予め格納した意味構造パターン辞
    書と、 前記意味構造パターン辞書を参照して、前記エントリと
    前記日本語基本解析手段により解析された前記情報要求
    文の解析結果とを照合して、前記情報要求文の意味構造
    を求める意味構造解析手段を更に有する請求項5記載の
    日本語質問メッセージ解析装置。
  8. 【請求項8】 前記参照表現解消手段は、 前記日本語質問メッセージにおける前記情報要求文に含
    まれ得る参照表現のパターンと、該参照表現の参照先を
    探索する探索方向と、探索対象となる日本語文の文タイ
    プ、該参照表現の言語表現単位を予め格納した参照表現
    解消制御テーブルと、 前記参照表現解消制御テーブルと、前記文タイプ判定手
    段を用いて、情報要求の対象物の特性を同定するための
    参照表現の解消処理を制御する参照表現解消制御手段と
    を有する請求項4記載の日本語質問メッセージ解析装
    置。
JP09104195A 1995-04-17 1995-04-17 日本語質問メッセージ解析方法及び装置 Expired - Fee Related JP3358100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09104195A JP3358100B2 (ja) 1995-04-17 1995-04-17 日本語質問メッセージ解析方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09104195A JP3358100B2 (ja) 1995-04-17 1995-04-17 日本語質問メッセージ解析方法及び装置

Publications (2)

Publication Number Publication Date
JPH08287092A JPH08287092A (ja) 1996-11-01
JP3358100B2 true JP3358100B2 (ja) 2002-12-16

Family

ID=14015427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09104195A Expired - Fee Related JP3358100B2 (ja) 1995-04-17 1995-04-17 日本語質問メッセージ解析方法及び装置

Country Status (1)

Country Link
JP (1) JP3358100B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583435B2 (en) 2006-03-10 2013-11-12 Nec Corporation Request content identification system, request content identification method using natural language, and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106042A (ja) * 1986-10-23 1988-05-11 Nippon Telegr & Teleph Corp <Ntt> 会話文意図理解方法
JP2638187B2 (ja) * 1989-03-09 1997-08-06 松下電器産業株式会社 文章要約装置
JPH05233730A (ja) * 1992-02-18 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 関係情報抽出・表示装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
太田竜男,質問応答システムの構築,FUJITSU,日本,富士通株式会社,1994年9月10日,第45巻 第5号,第436頁乃至第442頁

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583435B2 (en) 2006-03-10 2013-11-12 Nec Corporation Request content identification system, request content identification method using natural language, and program

Also Published As

Publication number Publication date
JPH08287092A (ja) 1996-11-01

Similar Documents

Publication Publication Date Title
US7567902B2 (en) Generating speech recognition grammars from a large corpus of data
US6023697A (en) Systems and methods for providing user assistance in retrieving data from a relational database
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
US6473729B1 (en) Word phrase translation using a phrase index
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP2742115B2 (ja) 類似文書検索装置
US20020077806A1 (en) Method and computer system for part-of-speech tagging of incomplete sentences
JP2000315216A (ja) 自然言語検索方法および装置
US5608623A (en) Special cooccurrence processing method and apparatus
JPH08292955A (ja) 言語処理方法及びそれを適用するデータ処理装置
JP2609173B2 (ja) 用例主導型機械翻訳方法
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JPH09190453A (ja) データベース装置
US20040054677A1 (en) Method for processing text in a computer and a computer
Daelemans et al. Part-of-speech tagging for Dutch with MBT, a memory-based tagger generator
JPH01180046A (ja) 知識ベースシステムおよび自然言語理解方式
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0561902A (ja) 機械翻訳システム
WO2001024053A2 (en) System and method for automatic context creation for electronic documents
JP3161660B2 (ja) キーワード検索方法
JP2765618B2 (ja) 言語解析装置
JPH0320866A (ja) テキストベース検索方式
Mráková et al. From Czech morphology through partial parsing to disambiguation

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071011

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081011

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091011

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101011

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101011

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111011

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees