JPH09198396A - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JPH09198396A JPH09198396A JP8004859A JP485996A JPH09198396A JP H09198396 A JPH09198396 A JP H09198396A JP 8004859 A JP8004859 A JP 8004859A JP 485996 A JP485996 A JP 485996A JP H09198396 A JPH09198396 A JP H09198396A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- expansion
- related word
- dictionary
- word group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006866 deterioration Effects 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 22
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 4
- 241000973887 Takayama Species 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 入力キーワードのシソーラス展開時、展開対
象範囲の拡大に伴う所望文書と検索文書との適合率の低
下を防止し、文書検索処理を効率化する。 【解決手段】 シソーラス辞書管理部120が管理する
シソーラス辞書には登録キーワードの関連語グループ単
位に階層値(Layer ID)が付与されている。検索時、キ
ーワード入力部100からキーワードを入力し、展開条
件設定部110から同階層展開等に関する展開条件を設
定する。キーワード展開処理部130は、展開範囲1が
設定された場合、入力キーワードに対してシソーラス辞
書内の登録キーワード中の当該入力キーワードの関連語
グループの範囲内での展開を行い、展開範囲2以上が設
定された場合、上記関連語グループの階層値(Layer I
D)を参照し、同じ階層値を持つ関連語グループの語の
範囲内を対象とする同階層展開を行う。
象範囲の拡大に伴う所望文書と検索文書との適合率の低
下を防止し、文書検索処理を効率化する。 【解決手段】 シソーラス辞書管理部120が管理する
シソーラス辞書には登録キーワードの関連語グループ単
位に階層値(Layer ID)が付与されている。検索時、キ
ーワード入力部100からキーワードを入力し、展開条
件設定部110から同階層展開等に関する展開条件を設
定する。キーワード展開処理部130は、展開範囲1が
設定された場合、入力キーワードに対してシソーラス辞
書内の登録キーワード中の当該入力キーワードの関連語
グループの範囲内での展開を行い、展開範囲2以上が設
定された場合、上記関連語グループの階層値(Layer I
D)を参照し、同じ階層値を持つ関連語グループの語の
範囲内を対象とする同階層展開を行う。
Description
【0001】
【発明の属する技術分野】本発明は、キーワードを用い
て文書データベース内から所望の文書を検索する文書検
索装置に関する。
て文書データベース内から所望の文書を検索する文書検
索装置に関する。
【0002】
【従来の技術】大量の文書データベース内から所望の文
書を検索するために有用な検索方式として、キーワード
を指定し、この指定したキーワードを含む文書を文書デ
ータベース内から検索する方式が知られている。この検
索方式を採用した文書検索装置では、上記キーワードの
与え方として、文書データベースに文書を登録する際に
与える方法もあるが、検索をより柔軟に行うために、予
めキーワードを与えず、検索時にユーザが自由にキーワ
ードを指定するような運用を行う全文検索という方法も
知られている。こうした全文検索においては、ユーザが
自由にキーワードを指定できることから、検索の柔軟性
が増す反面、検索漏れが発生し易いという不都合もあっ
た。
書を検索するために有用な検索方式として、キーワード
を指定し、この指定したキーワードを含む文書を文書デ
ータベース内から検索する方式が知られている。この検
索方式を採用した文書検索装置では、上記キーワードの
与え方として、文書データベースに文書を登録する際に
与える方法もあるが、検索をより柔軟に行うために、予
めキーワードを与えず、検索時にユーザが自由にキーワ
ードを指定するような運用を行う全文検索という方法も
知られている。こうした全文検索においては、ユーザが
自由にキーワードを指定できることから、検索の柔軟性
が増す反面、検索漏れが発生し易いという不都合もあっ
た。
【0003】このための対策として、今日では、語彙と
語彙との関係を体系化したシソーラスを用いて、キーワ
ードの類似語や同義語などのキーワードに関連する語す
なわちキーワードの上位あるいは下位概念の語も検索語
として検索することにより、検索漏れを減らすという方
法が知られている。
語彙との関係を体系化したシソーラスを用いて、キーワ
ードの類似語や同義語などのキーワードに関連する語す
なわちキーワードの上位あるいは下位概念の語も検索語
として検索することにより、検索漏れを減らすという方
法が知られている。
【0004】この種の従来公知の文書検索方法の一例と
して、特開平4-10062 号公報があげられる。同公報にお
ける語彙拡張機能を有する文書検索方法では、語彙と語
彙の上位及び下位関係を記憶した辞書データを持ち、入
力文字列からその文字列の下位あるいは上位の語彙を表
す文字列を検索語として検索するようにしている。
して、特開平4-10062 号公報があげられる。同公報にお
ける語彙拡張機能を有する文書検索方法では、語彙と語
彙の上位及び下位関係を記憶した辞書データを持ち、入
力文字列からその文字列の下位あるいは上位の語彙を表
す文字列を検索語として検索するようにしている。
【0005】
【発明が解決しようとする課題】上記特開平4-10062 号
公報に代表されるような従来の文書検索方法では、キー
ワードを検索語に展開する際、このキーワードの上位ま
たは下位概念の語も検索語として検索することで、キー
ワードに意味的な広がりを持たせることができ、検索漏
れの低減が図れた。
公報に代表されるような従来の文書検索方法では、キー
ワードを検索語に展開する際、このキーワードの上位ま
たは下位概念の語も検索語として検索することで、キー
ワードに意味的な広がりを持たせることができ、検索漏
れの低減が図れた。
【0006】反面、この方法では、キーワードの意味的
に広がりに応じて検索範囲の拡大を免れず、特に、再帰
的に下位概念の語に展開した場合など、検索語が膨大な
数になり、検索漏れが少なくなる一方で、ユーザの検索
意図と異なる思わぬ語まで検索語として検索されてしま
い、所望の文書と検索された文書との連合率が低くなる
という問題点があった。
に広がりに応じて検索範囲の拡大を免れず、特に、再帰
的に下位概念の語に展開した場合など、検索語が膨大な
数になり、検索漏れが少なくなる一方で、ユーザの検索
意図と異なる思わぬ語まで検索語として検索されてしま
い、所望の文書と検索された文書との連合率が低くなる
という問題点があった。
【0007】本発明は、シソーラス辞書を用いてキーワ
ードに意味的な広がりを持たせ、該キーワードに関連す
る語も検索語として文書データを検索する際、キーワー
ドのシソーラス展開時の検索範囲の拡大に起因する検索
指定文書と検索文書との適合率の低下を防止し、より効
率的な文書検索を可能とする文書検索装置を提供するこ
とを目的とする。
ードに意味的な広がりを持たせ、該キーワードに関連す
る語も検索語として文書データを検索する際、キーワー
ドのシソーラス展開時の検索範囲の拡大に起因する検索
指定文書と検索文書との適合率の低下を防止し、より効
率的な文書検索を可能とする文書検索装置を提供するこ
とを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、キーワードをシソーラス辞書を用いて検
索語として展開し、該検索語を用いて文書データの検索
を行う文書検索装置において、意味的に同一の階層で展
開されるべき関連語グループ単位に同一の階層値を付与
して成るシソーラス辞書を管理する辞書管理手段と、検
索に用いるキーワードを入力するキーワード入力手段
と、該キーワード入力手段により入力されたキーワード
のシソーラス展開に係る展開条件を設定する展開条件設
定手段と、該展開条件設定手段により設定された展開条
件に応じ、前記シソーラス辞書内の前記キーワードが属
する関連語グループと同じ階層値を持つ関連語グループ
の中の前記展開条件に合致する範囲内の関連語グループ
の語を抽出して前記検索語に同階層展開するキーワード
展開処理手段とを具備することを特徴とする。
に、本発明は、キーワードをシソーラス辞書を用いて検
索語として展開し、該検索語を用いて文書データの検索
を行う文書検索装置において、意味的に同一の階層で展
開されるべき関連語グループ単位に同一の階層値を付与
して成るシソーラス辞書を管理する辞書管理手段と、検
索に用いるキーワードを入力するキーワード入力手段
と、該キーワード入力手段により入力されたキーワード
のシソーラス展開に係る展開条件を設定する展開条件設
定手段と、該展開条件設定手段により設定された展開条
件に応じ、前記シソーラス辞書内の前記キーワードが属
する関連語グループと同じ階層値を持つ関連語グループ
の中の前記展開条件に合致する範囲内の関連語グループ
の語を抽出して前記検索語に同階層展開するキーワード
展開処理手段とを具備することを特徴とする。
【0009】望ましくは、本発明において、前記展開条
件設定手段は、前記展開条件として、前記キーワードの
シソーラス展開に係る展開階層範囲n(n=1,2,
3,……)を設定し、前記キーワード展開処理手段は、
前記展開階層範囲nに対し、前記シソーラス辞書内の前
記キーワードが属する関連語グループに対する(n−
1)階層上位の関連語グループの下位の関連語グループ
の中の当該キーワードが属する関連語グループと同一の
階層値を持つ関連語グループの語を前記検索語に同階層
展開することを特徴とする。
件設定手段は、前記展開条件として、前記キーワードの
シソーラス展開に係る展開階層範囲n(n=1,2,
3,……)を設定し、前記キーワード展開処理手段は、
前記展開階層範囲nに対し、前記シソーラス辞書内の前
記キーワードが属する関連語グループに対する(n−
1)階層上位の関連語グループの下位の関連語グループ
の中の当該キーワードが属する関連語グループと同一の
階層値を持つ関連語グループの語を前記検索語に同階層
展開することを特徴とする。
【0010】また、本発明においては、前記関連語グル
ープ単位の階層値は、当該関連語グループの物理的な階
層に依存しない値を有し、物理的階層と意味的階層が異
なっている関連語グループ間でも、同一の階層値を持つ
ことにより、前記同階層展開が行えるようにしたことを
特徴とする。
ープ単位の階層値は、当該関連語グループの物理的な階
層に依存しない値を有し、物理的階層と意味的階層が異
なっている関連語グループ間でも、同一の階層値を持つ
ことにより、前記同階層展開が行えるようにしたことを
特徴とする。
【0011】また、本発明においては、前記シソーラス
辞書の辞書種別情報を管理する辞書管理テーブルを具備
し、該辞書管理テーブルの辞書種別情報を参照して前記
キーワードが属するシソーラス辞書の辞書種別を特定
し、該辞書種別に応じて前記同階層展開の実行または禁
止を制御することを特徴とする。
辞書の辞書種別情報を管理する辞書管理テーブルを具備
し、該辞書管理テーブルの辞書種別情報を参照して前記
キーワードが属するシソーラス辞書の辞書種別を特定
し、該辞書種別に応じて前記同階層展開の実行または禁
止を制御することを特徴とする。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照して詳細に説明する。図1は本発明の
第1の実施の形態に係わる文書検索装置の概略構成図で
ある。この文書検索装置は、検索に用いるキーワードを
入力するキーワード入力部100、上記入力キーワード
を検索語に展開する際の展開条件を設定する展開条件設
定部110、上記入力キーワードを展開する際の検索対
象語(登録キーワード)を概念上の上位下位関係を有す
る関連語あるいは同義語と関係付けてシソーラス体系化
したシソーラス辞書を管理するシソーラス辞書管理部1
20、上記入力キーワードを設定された展開条件でシソ
ーラス辞書を用いて検索語に展開するキーワード展開処
理部130、検索対象の文書を登録した文書データベー
ス140、上記キーワード展開処理部130によりシソ
ーラス展開された検索語に基づき、文書データベース1
40を検索し、該検索語を含む文書を検索する検索処理
部150、該検索処理部150による文書検索結果を保
持する検索結果保持部160を具備して構成される。
て添付図面を参照して詳細に説明する。図1は本発明の
第1の実施の形態に係わる文書検索装置の概略構成図で
ある。この文書検索装置は、検索に用いるキーワードを
入力するキーワード入力部100、上記入力キーワード
を検索語に展開する際の展開条件を設定する展開条件設
定部110、上記入力キーワードを展開する際の検索対
象語(登録キーワード)を概念上の上位下位関係を有す
る関連語あるいは同義語と関係付けてシソーラス体系化
したシソーラス辞書を管理するシソーラス辞書管理部1
20、上記入力キーワードを設定された展開条件でシソ
ーラス辞書を用いて検索語に展開するキーワード展開処
理部130、検索対象の文書を登録した文書データベー
ス140、上記キーワード展開処理部130によりシソ
ーラス展開された検索語に基づき、文書データベース1
40を検索し、該検索語を含む文書を検索する検索処理
部150、該検索処理部150による文書検索結果を保
持する検索結果保持部160を具備して構成される。
【0013】この装置において、シソーラス辞書管理部
120が管理するシソーラス辞書には、登録キーワード
の関連語グループ単位に階層値(Layer ID)が付与され
ている。展開条件設定部110は、上記展開条件とし
て、例えば入力キーワードのシソーラス展開に係る展開
階層範囲n(n=1,2,3,……)を設定する。
120が管理するシソーラス辞書には、登録キーワード
の関連語グループ単位に階層値(Layer ID)が付与され
ている。展開条件設定部110は、上記展開条件とし
て、例えば入力キーワードのシソーラス展開に係る展開
階層範囲n(n=1,2,3,……)を設定する。
【0014】キーワード展開処理部130は、展開範囲
1が設定された場合には、この時の入力キーワードに対
してシソーラス辞書内の登録キーワード中における当該
入力キーワードの関連語グループの範囲内での展開を行
い、展開範囲2以上が設定された場合には、登録キーワ
ード中における当該入力キーワードの関連語グループに
付された階層値(Layer ID)を参照し、これと同じ階層
値を持つ関連語グループの語の範囲内を対象とした同階
層展開を、上記設定された展開条件に応じて段階的に実
施する。具体的には、上記展開階層範囲nに対し、シソ
ーラス辞書内の登録キーワード中における上記入力キー
ワードが属する関連語グループに対する(n−1)階層
上位の関連語グループの下位の関連語グループの中の当
該入力キーワードが属する関連語グループと同一の階層
値を持つ関連語グループの語を上記検索語として同階層
展開する。
1が設定された場合には、この時の入力キーワードに対
してシソーラス辞書内の登録キーワード中における当該
入力キーワードの関連語グループの範囲内での展開を行
い、展開範囲2以上が設定された場合には、登録キーワ
ード中における当該入力キーワードの関連語グループに
付された階層値(Layer ID)を参照し、これと同じ階層
値を持つ関連語グループの語の範囲内を対象とした同階
層展開を、上記設定された展開条件に応じて段階的に実
施する。具体的には、上記展開階層範囲nに対し、シソ
ーラス辞書内の登録キーワード中における上記入力キー
ワードが属する関連語グループに対する(n−1)階層
上位の関連語グループの下位の関連語グループの中の当
該入力キーワードが属する関連語グループと同一の階層
値を持つ関連語グループの語を上記検索語として同階層
展開する。
【0015】次に、この第1の実施の形態に係わる装置
の検索動作の概略を、図2に示すフローチャートを参照
して説明する。まず、検索に際し、ユーザは、キーワー
ド入力部100からキーワードを入力する(ステップ2
00)。次いで、ユーザは、上記展開条件設定部110
から、上記同階層展開を行うかどうかを意識しながら、
上記入力キーワードをシソーラス展開して検索語とする
場合の展開条件を設定する(ステップ210)。
の検索動作の概略を、図2に示すフローチャートを参照
して説明する。まず、検索に際し、ユーザは、キーワー
ド入力部100からキーワードを入力する(ステップ2
00)。次いで、ユーザは、上記展開条件設定部110
から、上記同階層展開を行うかどうかを意識しながら、
上記入力キーワードをシソーラス展開して検索語とする
場合の展開条件を設定する(ステップ210)。
【0016】キーワード展開処理部130では、まず、
キーワード入力部100からの入力キーワードがシソー
ラス辞書管理部120のシソーラス辞書内に登録キーワ
ードとして存在するかどうかを判断する(ステップ22
0)。ここで、上記入力キーワードがシソーラス辞書内
に存在しない場合(ステップ220NO)には、直ちに
検索動作を終了し、存在する場合(ステップ220YE
S)には、展開条件設定部110により設定された展開
条件から、展開範囲が関連語グループの範囲内に留まる
かどうか、すなわち(展開範囲=1)であるかどうかを
判断する(ステップ230)。
キーワード入力部100からの入力キーワードがシソー
ラス辞書管理部120のシソーラス辞書内に登録キーワ
ードとして存在するかどうかを判断する(ステップ22
0)。ここで、上記入力キーワードがシソーラス辞書内
に存在しない場合(ステップ220NO)には、直ちに
検索動作を終了し、存在する場合(ステップ220YE
S)には、展開条件設定部110により設定された展開
条件から、展開範囲が関連語グループの範囲内に留まる
かどうか、すなわち(展開範囲=1)であるかどうかを
判断する(ステップ230)。
【0017】ここで、設定された展開範囲が関連語のみ
に留まるものであれば(ステップ230YES)、キー
ワード展開処理部130は、上記入力キーワードに対し
て関連語展開処理を行い、該入力キーワードと同じ登録
キーワードを含む関連語グループに属する語を検索語と
して抽出する(ステップ240)。
に留まるものであれば(ステップ230YES)、キー
ワード展開処理部130は、上記入力キーワードに対し
て関連語展開処理を行い、該入力キーワードと同じ登録
キーワードを含む関連語グループに属する語を検索語と
して抽出する(ステップ240)。
【0018】これに対し、設定された展開範囲が関連語
のみに留まらない場合、すなわち設定された展開範囲>
1の場合(ステップ230NO)には、キーワード展開
処理部130は、まず、上記ステップ210で設定され
た展開条件から展開範囲を確定する(ステップ25
0)。
のみに留まらない場合、すなわち設定された展開範囲>
1の場合(ステップ230NO)には、キーワード展開
処理部130は、まず、上記ステップ210で設定され
た展開条件から展開範囲を確定する(ステップ25
0)。
【0019】次いで、キーワード展開処理部130は、
その確定した展開範囲に応じて上記入力キーワードに対
する同階層展開処理を行い、上記確定した展開範囲内の
登録キーワード中の上記入力キーワードが属する関連語
グループと同じ階層値を持つ関連語グループに含まれる
語を検索語として抽出する。
その確定した展開範囲に応じて上記入力キーワードに対
する同階層展開処理を行い、上記確定した展開範囲内の
登録キーワード中の上記入力キーワードが属する関連語
グループと同じ階層値を持つ関連語グループに含まれる
語を検索語として抽出する。
【0020】この同階層展開の一例として、本実施の形
態では、特に、シソーラス辞書内の登録キーワード中に
おける上記入力キーワードの関連語グループに対する
(設定展開範囲−1)階層上位の関連語グループの下位
の関連語グループの中の当該入力キーワードの関連語グ
ループと同じ階層値を持つ関連語グループを抽出し(ス
テップ260)、次いで、この抽出した関連語グループ
に属する語を検索語として抽出する(ステップ27
0)。
態では、特に、シソーラス辞書内の登録キーワード中に
おける上記入力キーワードの関連語グループに対する
(設定展開範囲−1)階層上位の関連語グループの下位
の関連語グループの中の当該入力キーワードの関連語グ
ループと同じ階層値を持つ関連語グループを抽出し(ス
テップ260)、次いで、この抽出した関連語グループ
に属する語を検索語として抽出する(ステップ27
0)。
【0021】次に、検索処理部150は、ステップ24
0またはステップ270でキーワード展開処理部130
により抽出された検索語が含まれる文書を文書データベ
ース140から検索し(ステップ280)、この検索結
果を検索結果保持部160に転送する。検索結果保持部
160は、該検索結果を保持し(ステップ290)、一
連の検索動作を終了する。
0またはステップ270でキーワード展開処理部130
により抽出された検索語が含まれる文書を文書データベ
ース140から検索し(ステップ280)、この検索結
果を検索結果保持部160に転送する。検索結果保持部
160は、該検索結果を保持し(ステップ290)、一
連の検索動作を終了する。
【0022】このように、第1の実施の形態では、登録
キーワード中から入力キーワードの同義語を検索語とす
るだけでなく、入力キーワードが含まれる同義語グルー
プと同じ階層の同義語グループに含まれる語も検索語と
して文書検索を行なうようにしている。
キーワード中から入力キーワードの同義語を検索語とす
るだけでなく、入力キーワードが含まれる同義語グルー
プと同じ階層の同義語グループに含まれる語も検索語と
して文書検索を行なうようにしている。
【0023】次に、具体例をあげて実際の検索処理内容
を説明する。図3は、本実施の形態に係わるシソーラス
辞書管理130で管理されるシソーラス辞書の概念図で
ある。このシソーラス辞書は、社員の所属部門を階層化
により整理した社員名簿辞書の一例であり、部門名→開
発生産部門→計画部→第1開発部といった階層の下位方
向へ向かって、登録キーワードの関連語グループ単位
に、Layer 1 ,Layer 2,Layer 3 ,Layer 4 等の階層
値が付与されている。特に、この例は、「部門名」を頂
点として、この「部門名」の中の「開発生産部門」に
『「開発生産部門」,「販売部門」』が存在し、このう
ちの「開発生産部門」には『「計画部」,「開発部」,
「品質管理部」が存在し、更に「開発部」内の『「第1
開発部」,「第2開発部」,「第3開発部」』には、そ
れぞれ「安藤」,「宮脇」,「高山」等の社員が所属し
ている様子を示している。
を説明する。図3は、本実施の形態に係わるシソーラス
辞書管理130で管理されるシソーラス辞書の概念図で
ある。このシソーラス辞書は、社員の所属部門を階層化
により整理した社員名簿辞書の一例であり、部門名→開
発生産部門→計画部→第1開発部といった階層の下位方
向へ向かって、登録キーワードの関連語グループ単位
に、Layer 1 ,Layer 2,Layer 3 ,Layer 4 等の階層
値が付与されている。特に、この例は、「部門名」を頂
点として、この「部門名」の中の「開発生産部門」に
『「開発生産部門」,「販売部門」』が存在し、このう
ちの「開発生産部門」には『「計画部」,「開発部」,
「品質管理部」が存在し、更に「開発部」内の『「第1
開発部」,「第2開発部」,「第3開発部」』には、そ
れぞれ「安藤」,「宮脇」,「高山」等の社員が所属し
ている様子を示している。
【0024】ここで、例えば、社内文書のデータベース
からある報告書を検索しようという要望に対し、報告書
の作成者の記憶があいまいで、第一開発部の山下さんの
作成した報告書ではなかったかと思い、『山下』という
文字列の入力キーワードを用いて検索したが、見つから
なかった場合、社員名簿をもとに作成した図3に示すよ
うな関連語グループ単位に階層値を付与して成る階層デ
ータ構造の「社員名簿辞書」を利用して関連語展開する
場合を考える。
からある報告書を検索しようという要望に対し、報告書
の作成者の記憶があいまいで、第一開発部の山下さんの
作成した報告書ではなかったかと思い、『山下』という
文字列の入力キーワードを用いて検索したが、見つから
なかった場合、社員名簿をもとに作成した図3に示すよ
うな関連語グループ単位に階層値を付与して成る階層デ
ータ構造の「社員名簿辞書」を利用して関連語展開する
場合を考える。
【0025】この場合、ユーザは、まず、キーワード入
力部100からキーワード『山下』を入力し、次いで展
開条件設定部110から展開条件として(展開範囲=
1)を設定する。なお、ここで言う展開範囲とは、登録
キーワード中における入力キーワードが含まれる関連語
グループより(展開範囲の値−1)階層だけ上位の関連
語グループの下位の関連語グループのうち、上記入力キ
ーワードが含まれる関連語グループと同じ階層の関連語
グループの範囲のことを表している。
力部100からキーワード『山下』を入力し、次いで展
開条件設定部110から展開条件として(展開範囲=
1)を設定する。なお、ここで言う展開範囲とは、登録
キーワード中における入力キーワードが含まれる関連語
グループより(展開範囲の値−1)階層だけ上位の関連
語グループの下位の関連語グループのうち、上記入力キ
ーワードが含まれる関連語グループと同じ階層の関連語
グループの範囲のことを表している。
【0026】上記設定がなされることにより、キーワー
ド展開処理部130では、入力キーワード『山下』を、
社員名簿辞書(図3参照)内の情報を基に上記設定展開
範囲1で展開する。この場合、図3に示すの範囲を対
象とし、シソーラス辞書内の登録キーワード中における
入力キーワード『山下』が含まれる関連語グループであ
る「第一開発部」に属する語『安藤』,『小山』,『川
本』等が抽出され、検索処理部150では、これらの語
も上記入力キーワード『山下』とともに検索語として文
書データベース140から文書を検索する。
ド展開処理部130では、入力キーワード『山下』を、
社員名簿辞書(図3参照)内の情報を基に上記設定展開
範囲1で展開する。この場合、図3に示すの範囲を対
象とし、シソーラス辞書内の登録キーワード中における
入力キーワード『山下』が含まれる関連語グループであ
る「第一開発部」に属する語『安藤』,『小山』,『川
本』等が抽出され、検索処理部150では、これらの語
も上記入力キーワード『山下』とともに検索語として文
書データベース140から文書を検索する。
【0027】ユーザは、上記検索結果を確認し、検索文
書内に所望の文書のない場合、今度は、同じ入力キーワ
ード『山下』に対し、展開条件設定部110より、展開
範囲を2に広げて同階層展開処理を行うような設定を指
示する。展開範囲2の場合、キーワード展開処理部13
0は、登録キーワード中における入力キーワード『山
下』が含まれる関連語グループと同じ階層の関連語グル
ープの中で、(展開範囲の値−1)つまり、1階層上位
の関連語グループの下位の関連語グループのうち、入力
キーワード『山下』が含まれる関連語グループと同じ階
層の関連語グループに含まれる語に展開する。
書内に所望の文書のない場合、今度は、同じ入力キーワ
ード『山下』に対し、展開条件設定部110より、展開
範囲を2に広げて同階層展開処理を行うような設定を指
示する。展開範囲2の場合、キーワード展開処理部13
0は、登録キーワード中における入力キーワード『山
下』が含まれる関連語グループと同じ階層の関連語グル
ープの中で、(展開範囲の値−1)つまり、1階層上位
の関連語グループの下位の関連語グループのうち、入力
キーワード『山下』が含まれる関連語グループと同じ階
層の関連語グループに含まれる語に展開する。
【0028】この例では、入力キーワード『山下』が含
まれる関連語グループの階層値は(Layer ID=4 )であ
り、その1階層上位の関連語グループは「開発部」であ
り、更にこの「開発部」の下位の関連語グループのうち
階層値が(Layer ID=4 )の関連語グループは「第二開
発部」及び「第三開発部」である。
まれる関連語グループの階層値は(Layer ID=4 )であ
り、その1階層上位の関連語グループは「開発部」であ
り、更にこの「開発部」の下位の関連語グループのうち
階層値が(Layer ID=4 )の関連語グループは「第二開
発部」及び「第三開発部」である。
【0029】従って、入力キーワード『山下』を展開範
囲2で展開する場合の具体的動作として、キーワード展
開処理部130は、シソーラス辞書における図3に示す
の範囲を対象とし、入力キーワード『山下』が含まれ
る関連語グループの1階層上位の関連語グループ「開発
部」の下位の関連語グループのうち階層値(Layer ID=
4 )を有する関連語グループ「第二開発部」及び「第三
開発部」に属する『宮脇』,『畑中』,『西野』,『高
山』,『本間』,『小野』などの語への展開を行い、検
索処理部150は、これらの語を検索語として文書デー
タベース140内の文書を検索する。つまり、この例で
は、入力キーワード『山下』を展開範囲2で展開する場
合、『山下』が属する「開発部」に属する全ての人の名
前で文書検索が行われる。
囲2で展開する場合の具体的動作として、キーワード展
開処理部130は、シソーラス辞書における図3に示す
の範囲を対象とし、入力キーワード『山下』が含まれ
る関連語グループの1階層上位の関連語グループ「開発
部」の下位の関連語グループのうち階層値(Layer ID=
4 )を有する関連語グループ「第二開発部」及び「第三
開発部」に属する『宮脇』,『畑中』,『西野』,『高
山』,『本間』,『小野』などの語への展開を行い、検
索処理部150は、これらの語を検索語として文書デー
タベース140内の文書を検索する。つまり、この例で
は、入力キーワード『山下』を展開範囲2で展開する場
合、『山下』が属する「開発部」に属する全ての人の名
前で文書検索が行われる。
【0030】この検索結果においても、所望の文書が得
られなかった場合、以後、同様に、所望の文書が得られ
るまで、展開条件設定部110からの展開条件の設定に
応じて段階的に展開範囲を広げながら上記同階層展開を
行うことができる。
られなかった場合、以後、同様に、所望の文書が得られ
るまで、展開条件設定部110からの展開条件の設定に
応じて段階的に展開範囲を広げながら上記同階層展開を
行うことができる。
【0031】例えば、上記展開範囲=2での展開完了
後、更に、展開条件設定部110より(展開範囲=3)
が設定された場合、キーワード展開処理部130は、登
録キーワード中の入力キーワード『山下』が含まれる関
連語グループと同じ階層の関連語グループの中で、(展
開範囲の値−1)つまり2階層上位の関連語グループ
「開発生産部門」の下位の関連語グループ「計画部」,
「品質管理部」の配下の、入力キーワード『山下』が含
まれる関連語グループと同じ階層値(Layer ID=4)を
持つ関連語グループに含まれる語、すなわち「開発生産
部門」に属する人の名前の範囲(図3に示すの範囲)
内での展開が行われる。
後、更に、展開条件設定部110より(展開範囲=3)
が設定された場合、キーワード展開処理部130は、登
録キーワード中の入力キーワード『山下』が含まれる関
連語グループと同じ階層の関連語グループの中で、(展
開範囲の値−1)つまり2階層上位の関連語グループ
「開発生産部門」の下位の関連語グループ「計画部」,
「品質管理部」の配下の、入力キーワード『山下』が含
まれる関連語グループと同じ階層値(Layer ID=4)を
持つ関連語グループに含まれる語、すなわち「開発生産
部門」に属する人の名前の範囲(図3に示すの範囲)
内での展開が行われる。
【0032】このように、第1の実施の形態では、シソ
ーラス辞書の登録キーワードについて、単語間の意味的
関係に基づいて同義語、類義後語を関連語グループとし
てまとめ、関連語グループ同士の上位下位関係を定義し
た意味的シソーラス辞書の他に、上記「社員名簿辞書
(図3参照)」に代表されるように、意味的な上位下位
関係ではなく、単なる階層的なデータをまとめたものも
シソーラス辞書として扱えようにしている。
ーラス辞書の登録キーワードについて、単語間の意味的
関係に基づいて同義語、類義後語を関連語グループとし
てまとめ、関連語グループ同士の上位下位関係を定義し
た意味的シソーラス辞書の他に、上記「社員名簿辞書
(図3参照)」に代表されるように、意味的な上位下位
関係ではなく、単なる階層的なデータをまとめたものも
シソーラス辞書として扱えようにしている。
【0033】そのうえで、上記シソーラス辞書内の登録
キーワードの関連語グループ単位に階層値を付与し、入
力キーワードをシソーラス展開して検索語とする場合、
入力キーワードと同じ登録キーワードだけでなく入力キ
ーワードの関連語あるいは入力キーワードが含まれる関
連語グループと同じ階層の関連語グループに含まれる語
に展開する同階層展開を段階的に拡張しながら検索語を
広げていく。
キーワードの関連語グループ単位に階層値を付与し、入
力キーワードをシソーラス展開して検索語とする場合、
入力キーワードと同じ登録キーワードだけでなく入力キ
ーワードの関連語あるいは入力キーワードが含まれる関
連語グループと同じ階層の関連語グループに含まれる語
に展開する同階層展開を段階的に拡張しながら検索語を
広げていく。
【0034】シソーラスを用いて入力キーワードの関連
語を抽出する場合、特開平4-10062号公報等の公知例で
は、特に再帰的に下位概念に展開した場合など、検索語
が膨大な数になり、意味的に関連性の強い語も弱い語も
全て同様に検索対象語として検索してしまうため、関係
ない多くの文書が候補として検出されてしまい、所望の
文書かどうかの判定作業に多くの工数がかかっていた
が、本発明では、上記同階層展開によって、関係ない文
書が候補として検出されることが格段に少なくなり、検
索作業の効率が向上する。
語を抽出する場合、特開平4-10062号公報等の公知例で
は、特に再帰的に下位概念に展開した場合など、検索語
が膨大な数になり、意味的に関連性の強い語も弱い語も
全て同様に検索対象語として検索してしまうため、関係
ない多くの文書が候補として検出されてしまい、所望の
文書かどうかの判定作業に多くの工数がかかっていた
が、本発明では、上記同階層展開によって、関係ない文
書が候補として検出されることが格段に少なくなり、検
索作業の効率が向上する。
【0035】次に、本発明の第2の実施の形態について
述べる。上記第1の実施の形態ではシソーラス辞書内の
登録キーワードの関連語グループ単位に階層値を付与
し、指定展開範囲内で、入力キーワードが含まれる関連
語グループと同じ階層値を持つ関連語グループに含まれ
る語に展開する同階層展開を段階的に行う際に、シソー
ラス辞書内の関連語グループの物理的な階層に従って階
層値が選定されていた。この際に、シソーラス辞書内の
関連語グループの物理的な階層と意味階層が一致してい
る場合は良いが、シソーラス辞書内の関連語グループの
物理的な階層と意味階層が異なる場合には、適切な検索
語の展開が行えないことになった。
述べる。上記第1の実施の形態ではシソーラス辞書内の
登録キーワードの関連語グループ単位に階層値を付与
し、指定展開範囲内で、入力キーワードが含まれる関連
語グループと同じ階層値を持つ関連語グループに含まれ
る語に展開する同階層展開を段階的に行う際に、シソー
ラス辞書内の関連語グループの物理的な階層に従って階
層値が選定されていた。この際に、シソーラス辞書内の
関連語グループの物理的な階層と意味階層が一致してい
る場合は良いが、シソーラス辞書内の関連語グループの
物理的な階層と意味階層が異なる場合には、適切な検索
語の展開が行えないことになった。
【0036】第2の実施の形態では、係る状況下でも適
切な検索語の展開を行える環境を構築しようというもの
である。この第2の実施の形態に係わる装置の構成は第
1の実施の形態のものと同じであるが、シソーラス辞書
内における階層値の付与方法が異なる。
切な検索語の展開を行える環境を構築しようというもの
である。この第2の実施の形態に係わる装置の構成は第
1の実施の形態のものと同じであるが、シソーラス辞書
内における階層値の付与方法が異なる。
【0037】すなわち、本実施の形態では、同階層展開
を行う際の階層は関連語グループ単位に定義された階層
値によって定められ、同じ階層値を持つ関連語グループ
が同階層として扱われる。これにより、実際の階層デー
タの階層が実際のデータ間の階層と異なっている場合で
も、階層値を同じにすることにより、同階層展開を行う
ことが可能となる。
を行う際の階層は関連語グループ単位に定義された階層
値によって定められ、同じ階層値を持つ関連語グループ
が同階層として扱われる。これにより、実際の階層デー
タの階層が実際のデータ間の階層と異なっている場合で
も、階層値を同じにすることにより、同階層展開を行う
ことが可能となる。
【0038】図4は、第2の実施の形態に係わる装置の
シソーラス辞書管理部120に登録されたシソーラス辞
書の概念図である。同図からも分かるように、本実施の
形態では、上記同階層展開を行う際の指標である階層値
は、シソーラス辞書上の関連語グループの物理的な階層
には必ずしも依存せず、関連語グループ単位に付与され
ている。
シソーラス辞書管理部120に登録されたシソーラス辞
書の概念図である。同図からも分かるように、本実施の
形態では、上記同階層展開を行う際の指標である階層値
は、シソーラス辞書上の関連語グループの物理的な階層
には必ずしも依存せず、関連語グループ単位に付与され
ている。
【0039】例えば、シソーラス辞書上、「渋谷区の町
名」は「川崎の区名」と同階層であるが、本実施の形態
では、意味階層上の観点から、「渋谷区の町名」は「川
崎の区名」の下位の層におかれ、この「渋谷区の町名」
の上位の関連語グループである「東京の区名」が、物理
階層上、上記「川崎の区名」の上位にあたるにも拘ら
ず、当該「川崎の区名」と同じ階層におかれている。
名」は「川崎の区名」と同階層であるが、本実施の形態
では、意味階層上の観点から、「渋谷区の町名」は「川
崎の区名」の下位の層におかれ、この「渋谷区の町名」
の上位の関連語グループである「東京の区名」が、物理
階層上、上記「川崎の区名」の上位にあたるにも拘ら
ず、当該「川崎の区名」と同じ階層におかれている。
【0040】かかる内容のシソーラス辞書を用いた検索
動作の一例として、『高津区』という語を同階層展開す
る場合を考える。まず、展開範囲1の場合は図4に示す
の範囲で展開される。すなわち、『高津区』という入
力キーワードが属する関連語グループ「川崎の区名」に
属する『川崎区』,『中原区』,『宮前区』などの語に
展開される。
動作の一例として、『高津区』という語を同階層展開す
る場合を考える。まず、展開範囲1の場合は図4に示す
の範囲で展開される。すなわち、『高津区』という入
力キーワードが属する関連語グループ「川崎の区名」に
属する『川崎区』,『中原区』,『宮前区』などの語に
展開される。
【0041】次に、展開範囲2の場合は、1つ上位の関
連語グループ「神奈川の市名」を共通に持つ関連語グル
ープで、入力キーワード『高津区』が属する「川崎の区
名」と同じ階層値(Layer ID=4 )を持つもの、つまり
同図に示すの範囲内で展開がなされ、「横浜の区
名」,「川崎の区名」に属する語に展開される。
連語グループ「神奈川の市名」を共通に持つ関連語グル
ープで、入力キーワード『高津区』が属する「川崎の区
名」と同じ階層値(Layer ID=4 )を持つもの、つまり
同図に示すの範囲内で展開がなされ、「横浜の区
名」,「川崎の区名」に属する語に展開される。
【0042】次に、展開範囲3の場合を考える。この場
合、シソーラス辞書上の物理階層的には、「渋谷区の町
名」は「川崎の区名」と同階層であるが、両者は階層値
が異なるために同階層として扱われない。この場合、
「川崎の区名」に対する階層値(Layer ID=4 )に対し
て、これと同じ階層値(Layer ID=4 )を持つ「東京の
区名」が同階層として扱われ、同図に示すの範囲内で
展開される。
合、シソーラス辞書上の物理階層的には、「渋谷区の町
名」は「川崎の区名」と同階層であるが、両者は階層値
が異なるために同階層として扱われない。この場合、
「川崎の区名」に対する階層値(Layer ID=4 )に対し
て、これと同じ階層値(Layer ID=4 )を持つ「東京の
区名」が同階層として扱われ、同図に示すの範囲内で
展開される。
【0043】上記の如く、第2の実施の形態では、シソ
ーラス辞書上の関連語グループの物理的な階層でなく、
各関連値グループ単位に定義された階層値を用いて、同
じ階層値を持つものを同階層として扱うことによって、
シソーラス辞書データの物理的な階層と実際に展開すべ
き階層とか異なっている場合でも不具合を起こすことな
く同階層展開が行える。
ーラス辞書上の関連語グループの物理的な階層でなく、
各関連値グループ単位に定義された階層値を用いて、同
じ階層値を持つものを同階層として扱うことによって、
シソーラス辞書データの物理的な階層と実際に展開すべ
き階層とか異なっている場合でも不具合を起こすことな
く同階層展開が行える。
【0044】次に、本発明の第3の実施の形態について
述べる。シソーラス展開において参照するシソーラス情
報の種別としては、上記第1及び第2の実施の形態で例
示した社員名簿辞書や地名辞書で扱うような、単語自体
の意味的な関係ではなく単なる階層的なデータをまとめ
た階層シソーラス情報の他に、単語間の意味的関係に基
づいて同義語、類義語を関連語グループとしてまとめ、
関連語グループ同士の上位下位関係を定義した意味シソ
ーラス情報がある。
述べる。シソーラス展開において参照するシソーラス情
報の種別としては、上記第1及び第2の実施の形態で例
示した社員名簿辞書や地名辞書で扱うような、単語自体
の意味的な関係ではなく単なる階層的なデータをまとめ
た階層シソーラス情報の他に、単語間の意味的関係に基
づいて同義語、類義語を関連語グループとしてまとめ、
関連語グループ同士の上位下位関係を定義した意味シソ
ーラス情報がある。
【0045】第3の実施の形態では、こうした階層シソ
ーラス情報または意味シソーラス情報を扱うシソーラス
辞書が混在する場合の文書検索の好適な環境を構築しよ
うというものである。
ーラス情報または意味シソーラス情報を扱うシソーラス
辞書が混在する場合の文書検索の好適な環境を構築しよ
うというものである。
【0046】図5は、第3の実施の形態に係わる文書検
索装置の概略構成図であり、シソーラス辞書管理部12
0内にシソーラス辞書管理情報保持部121が設けられ
る。このシソーラス辞書管理情報保持部121は、図7
に示すような辞書管理テーブルを有し、本装置で扱うシ
ソーラス辞書の辞書名と、その辞書の辞書種別を示す種
別データが登録されている。この例では、意味データと
して種別分類される体言辞書や用言辞書などの辞書の
他、階層データとして種別分類される上述した地名辞書
や社員名簿辞書等の辞書を扱い得る環境となっている。
索装置の概略構成図であり、シソーラス辞書管理部12
0内にシソーラス辞書管理情報保持部121が設けられ
る。このシソーラス辞書管理情報保持部121は、図7
に示すような辞書管理テーブルを有し、本装置で扱うシ
ソーラス辞書の辞書名と、その辞書の辞書種別を示す種
別データが登録されている。この例では、意味データと
して種別分類される体言辞書や用言辞書などの辞書の
他、階層データとして種別分類される上述した地名辞書
や社員名簿辞書等の辞書を扱い得る環境となっている。
【0047】次に、この第3の実施の形態に係わる装置
の検索動作の概略を、図7に示すフローチャートを参照
して説明する。この装置では、ステップ230までの処
理は第1の実施の形態に係わる装置と同じである。ステ
ップ230において、設定された展開範囲が関連語のみ
に留まるものであれば(ステップ230YES)、キー
ワード展開処理部130は、上記入力キーワードに対し
て関連語展開処理を行い、登録キーワード中における該
入力キーワードと同じ関連語グループに属する語を検索
語として抽出する(ステップ240)。
の検索動作の概略を、図7に示すフローチャートを参照
して説明する。この装置では、ステップ230までの処
理は第1の実施の形態に係わる装置と同じである。ステ
ップ230において、設定された展開範囲が関連語のみ
に留まるものであれば(ステップ230YES)、キー
ワード展開処理部130は、上記入力キーワードに対し
て関連語展開処理を行い、登録キーワード中における該
入力キーワードと同じ関連語グループに属する語を検索
語として抽出する(ステップ240)。
【0048】一方、設定された展開範囲が関連語のみに
留まらない場合、すなわち設定された展開範囲>1の場
合(ステップ230NO)には、キーワード展開処理部
130は、上記入力キーワードを展開する際に参照する
辞書を特定するとともに、シソーラス辞書管理情報保持
部121に保持されてい辞書種別データを参照してこの
辞書の種別を判別する(ステップ300)。
留まらない場合、すなわち設定された展開範囲>1の場
合(ステップ230NO)には、キーワード展開処理部
130は、上記入力キーワードを展開する際に参照する
辞書を特定するとともに、シソーラス辞書管理情報保持
部121に保持されてい辞書種別データを参照してこの
辞書の種別を判別する(ステップ300)。
【0049】ここで、入力キーワードが存在する辞書タ
イプが階層データであれば(ステップ300YES)、
以後、キーワード展開処理部130は、第1の実施の形
態で述べた処理と同じ処理を経て上記入力キーワードに
対する検索語の抽出を行い、かつこの検索語を用いて文
書検索を行う。
イプが階層データであれば(ステップ300YES)、
以後、キーワード展開処理部130は、第1の実施の形
態で述べた処理と同じ処理を経て上記入力キーワードに
対する検索語の抽出を行い、かつこの検索語を用いて文
書検索を行う。
【0050】すなわち、ステップ300で入力キーワー
ドが階層データで成る辞書内に存在することが判別され
た後、キーワード展開処理部130は、まず、上記ステ
ップ210で設定された展開条件から展開範囲を確定す
る(ステップ250)。
ドが階層データで成る辞書内に存在することが判別され
た後、キーワード展開処理部130は、まず、上記ステ
ップ210で設定された展開条件から展開範囲を確定す
る(ステップ250)。
【0051】次いで、キーワード展開処理部130は、
その確定した展開範囲に応じて上記入力キーワードに対
する同階層展開処理を行い、上記確定展開範囲内の登録
キーワード中の上記入力キーワードが属する関連語グル
ープと同じ階層値を持つ関連語グループに含まれる語を
検索語として抽出する。この同階層展開の具体的な例と
しては、上記入力キーワードに対する(設定展開範囲−
1)階層上位の関連語グループの下位の関連語グループ
の中の当該キーワードの関連語グループと同階層の関連
語グループを抽出し(ステップ260)、次いで、この
抽出した関連語グループに属する語を検索語として抽出
する(ステップ270)。
その確定した展開範囲に応じて上記入力キーワードに対
する同階層展開処理を行い、上記確定展開範囲内の登録
キーワード中の上記入力キーワードが属する関連語グル
ープと同じ階層値を持つ関連語グループに含まれる語を
検索語として抽出する。この同階層展開の具体的な例と
しては、上記入力キーワードに対する(設定展開範囲−
1)階層上位の関連語グループの下位の関連語グループ
の中の当該キーワードの関連語グループと同階層の関連
語グループを抽出し(ステップ260)、次いで、この
抽出した関連語グループに属する語を検索語として抽出
する(ステップ270)。
【0052】次に、検索処理部150は、ステップ24
0またはステップ270でキーワード展開処理部130
により抽出された検索語が含まれる文書を文書データベ
ース140から検索し(ステップ280)、この検索結
果を検索結果保持部160に転送する。検索結果保持部
160は、該検索結果を保持し(ステップ290)、一
連の検索動作を終了する。
0またはステップ270でキーワード展開処理部130
により抽出された検索語が含まれる文書を文書データベ
ース140から検索し(ステップ280)、この検索結
果を検索結果保持部160に転送する。検索結果保持部
160は、該検索結果を保持し(ステップ290)、一
連の検索動作を終了する。
【0053】一方、ステップ300において、入力キー
ワードが存在する辞書タイプが階層データではない(す
なわち、意味データである)と判断された場合(ステッ
プ300NO)、キーワード展開処理部130は、直ち
に検索動作を終了する。
ワードが存在する辞書タイプが階層データではない(す
なわち、意味データである)と判断された場合(ステッ
プ300NO)、キーワード展開処理部130は、直ち
に検索動作を終了する。
【0054】このように、第3の実施の形態では、入力
キーワードが属する辞書タイプが意味データの場合、展
開範囲2以上の同階層展開を禁止すべく制御する。
キーワードが属する辞書タイプが意味データの場合、展
開範囲2以上の同階層展開を禁止すべく制御する。
【0055】次に、具体例をあげて実際の検索処理内容
を説明する。図8は、本実施の形態で用いる種々のシソ
ーラス辞書のうちの体言辞書の一部を示す概念図であ
る。
を説明する。図8は、本実施の形態で用いる種々のシソ
ーラス辞書のうちの体言辞書の一部を示す概念図であ
る。
【0056】今、この体言辞書を用い、例えば『コンピ
ュータ』という語を入力キーワードとして、この入力キ
ーワードを展開したものを検索語とする際の処理につい
て考える。その際、展開範囲1の場合は、入力キーワー
ド『コンピュータ』と同じ関連語グループに属する語の
範囲(図8に示すの範囲)で『電子計算機』,『電算
機』といった語への展開がなされる。この場合、入力キ
ーワード『コンピュータ』と、展開された検索語『電子
計算機』,『電算機』とは意味的に離れていないため、
何等問題を生じない。
ュータ』という語を入力キーワードとして、この入力キ
ーワードを展開したものを検索語とする際の処理につい
て考える。その際、展開範囲1の場合は、入力キーワー
ド『コンピュータ』と同じ関連語グループに属する語の
範囲(図8に示すの範囲)で『電子計算機』,『電算
機』といった語への展開がなされる。この場合、入力キ
ーワード『コンピュータ』と、展開された検索語『電子
計算機』,『電算機』とは意味的に離れていないため、
何等問題を生じない。
【0057】これに対し、展開範囲2の場合は、入力キ
ーワード『コンピュータ』に対する1階層上位の関連語
グループ『OA機器』の下位の関連語グループの中の当
該入力キーワードの関連語グループと同階層の関連語グ
ループに属する語の範囲(図8に示すの範囲)で『フ
ァックス』,『電話機』,『ワードプロセッサ』などの
語への展開がなされてしまい、入力キーワード『コンピ
ュータ』とは意味的に大きく離れた文書が検索されてし
まうことになる。
ーワード『コンピュータ』に対する1階層上位の関連語
グループ『OA機器』の下位の関連語グループの中の当
該入力キーワードの関連語グループと同階層の関連語グ
ループに属する語の範囲(図8に示すの範囲)で『フ
ァックス』,『電話機』,『ワードプロセッサ』などの
語への展開がなされてしまい、入力キーワード『コンピ
ュータ』とは意味的に大きく離れた文書が検索されてし
まうことになる。
【0058】このように、意味データの場合には、展開
範囲2以上の同階層展開に際し、入力キーワードと意味
的に大きく離れた検索語が抽出される危険がある。これ
に対処すべく、本実施の形態では、上述の如くシソーラ
ス辞書管理情報保持部121の辞書管理テーブルに本装
置で扱う辞書データの種別を保持しておき、この辞書種
別に基づき、例えば、辞書種別が「意味データ」の辞書
ならば、同階層展開の展開範囲を1に制限する等の措置
を講じるようにしたものである。
範囲2以上の同階層展開に際し、入力キーワードと意味
的に大きく離れた検索語が抽出される危険がある。これ
に対処すべく、本実施の形態では、上述の如くシソーラ
ス辞書管理情報保持部121の辞書管理テーブルに本装
置で扱う辞書データの種別を保持しておき、この辞書種
別に基づき、例えば、辞書種別が「意味データ」の辞書
ならば、同階層展開の展開範囲を1に制限する等の措置
を講じるようにしたものである。
【0059】具体的に、例えば、上記の例において、展
開範囲2が設定された状況下で入力キーワード『コンピ
ュータ』を同階層展開する際、キーワード展開処理部1
30は、まず、入力キーワード『コンピュータ』が上記
体言辞書に存在すること確認したうえで、該体言辞書の
辞書種別について辞書管理テーブルを検索にいく。
開範囲2が設定された状況下で入力キーワード『コンピ
ュータ』を同階層展開する際、キーワード展開処理部1
30は、まず、入力キーワード『コンピュータ』が上記
体言辞書に存在すること確認したうえで、該体言辞書の
辞書種別について辞書管理テーブルを検索にいく。
【0060】図6からも分かるように、この時の辞書管
理テーブルには上記体言辞書に関して「意味データ」と
いう辞書種別データが登録されている。従って、キーワ
ード展開処理部130は、上記辞書管理テーブルの検索
後、“入力キーワード『コンピュータ』が存在する辞書
タイプが意味データである(ステップ300NO)”と
いう検索結果を得て、この入力キーワード『コンピュー
タ』に関しての検索語の同層展開を行うことなく検索動
作を直ちに終了する。
理テーブルには上記体言辞書に関して「意味データ」と
いう辞書種別データが登録されている。従って、キーワ
ード展開処理部130は、上記辞書管理テーブルの検索
後、“入力キーワード『コンピュータ』が存在する辞書
タイプが意味データである(ステップ300NO)”と
いう検索結果を得て、この入力キーワード『コンピュー
タ』に関しての検索語の同層展開を行うことなく検索動
作を直ちに終了する。
【0061】上記制御により、入力キーワード『コンピ
ュータ』に対し、『電子計算機』,『電算機』という語
への展開はなされるが、展開範囲2の時に本来は同層展
開されるべき『ファックス』,『電話機』,『ワープ
ロ』などの語への展開はされないように規制される。
ュータ』に対し、『電子計算機』,『電算機』という語
への展開はなされるが、展開範囲2の時に本来は同層展
開されるべき『ファックス』,『電話機』,『ワープ
ロ』などの語への展開はされないように規制される。
【0062】
【発明の効果】以上詳細に説明したように、本発明によ
れば、シソーラス辞書内の登録キーワードの関連語グル
ープ単位に階層値(Layer ID)を持ち、入力キーワード
をシソーラス展開して検索語とする際、登録キーワード
中の上記入力キーワードが含まれる関連語グループと同
じ階層値を持つ関連語グループに含まれる語に展開する
同階層展開を指定された展開条件に応じて段階的に行う
ようにしたため、単純にシソーラスの上位下位関係だけ
に基づいてキーワード展開を行う従来の場合に比べて、
関係ない文書が候補として検出されることを低減でき、
検索作業の効率を大幅な向上できる。
れば、シソーラス辞書内の登録キーワードの関連語グル
ープ単位に階層値(Layer ID)を持ち、入力キーワード
をシソーラス展開して検索語とする際、登録キーワード
中の上記入力キーワードが含まれる関連語グループと同
じ階層値を持つ関連語グループに含まれる語に展開する
同階層展開を指定された展開条件に応じて段階的に行う
ようにしたため、単純にシソーラスの上位下位関係だけ
に基づいてキーワード展開を行う従来の場合に比べて、
関係ない文書が候補として検出されることを低減でき、
検索作業の効率を大幅な向上できる。
【0063】望ましくは、本発明においては、シソーラ
ス辞書内の登録キーワードの各関連語グループの物理的
な階層ではなく、関連語グループ単位に独自に定義され
た階層値を用いて、同じ階層値を持つものを同階層とし
て扱うようにしたため、シソーラス辞書データの物理的
な階層と実際に展開すべき階層とが異なっている場合に
おいても不具合を起こすことなく同階層展開が行える。
ス辞書内の登録キーワードの各関連語グループの物理的
な階層ではなく、関連語グループ単位に独自に定義され
た階層値を用いて、同じ階層値を持つものを同階層とし
て扱うようにしたため、シソーラス辞書データの物理的
な階層と実際に展開すべき階層とが異なっている場合に
おいても不具合を起こすことなく同階層展開が行える。
【0064】また、本発明においては、シソーラス辞書
情報を辞書内容によって物理的あるいは論理的に分割し
各辞書情報を保持する辞書管理テーブルを設け、同階層
展開時に上記辞書管理テーブル内の辞書情報を参照し、
入力キーワードが含まれる辞書の辞書種別によって同階
層展開の範囲を制限するようにしたため、ユーザの意図
に合わない無駄な語を検索語として検索することが少な
くなり、検索精度の大幅な向上を実現できる。
情報を辞書内容によって物理的あるいは論理的に分割し
各辞書情報を保持する辞書管理テーブルを設け、同階層
展開時に上記辞書管理テーブル内の辞書情報を参照し、
入力キーワードが含まれる辞書の辞書種別によって同階
層展開の範囲を制限するようにしたため、ユーザの意図
に合わない無駄な語を検索語として検索することが少な
くなり、検索精度の大幅な向上を実現できる。
【図1】第1の実施の形態に係わる文書検索装置の概略
構成図。
構成図。
【図2】図1における装置の検索処理の一例を示すフロ
ーチャート。
ーチャート。
【図3】図1における装置で用いるシソーラス辞書の概
念図。
念図。
【図4】第2の実施の形態に係わる文書検索装置で用い
るシソーラス辞書の概念図。
るシソーラス辞書の概念図。
【図5】第3の実施の形態に係わる文書検索装置の概略
構成図。
構成図。
【図6】図5における装置で用いる辞書管理テーブルの
登録データを示す図。
登録データを示す図。
【図7】図5における装置の検索処理の一例を示すフロ
ーチャート。
ーチャート。
【図8】図5における装置で用いるシソーラス辞書の一
部を示す概念図。
部を示す概念図。
100…キーワード入力部、110…展開条件設定部、
120…シソーラス辞書管理部、121…シソーラス辞
書管理情報保持部、130…キーワード展開処理部、1
40…文書データベース、150…検索処理部、160
…検索結果保持部
120…シソーラス辞書管理部、121…シソーラス辞
書管理情報保持部、130…キーワード展開処理部、1
40…文書データベース、150…検索処理部、160
…検索結果保持部
Claims (4)
- 【請求項1】 キーワードをシソーラス辞書を用いて検
索語として展開し、該検索語を用いて文書データの検索
を行う文書検索装置において、 意味的に同一の階層で展開されるべき関連語グループ単
位に同一の階層値を付与して成るシソーラス辞書を管理
する辞書管理手段と、 検索に用いるキーワードを入力するキーワード入力手段
と、 該キーワード入力手段により入力されたキーワードのシ
ソーラス展開に係る展開条件を設定する展開条件設定手
段と、 該展開条件設定手段により設定された展開条件に応じ、
前記シソーラス辞書内の前記キーワードが属する関連語
グループと同じ階層値を持つ関連語グループの中の前記
展開条件に合致する範囲内の関連語グループの語を抽出
して前記検索語に同階層展開するキーワード展開処理手
段とを具備することを特徴とする文書検索装置。 - 【請求項2】 前記展開条件設定手段は、前記展開条件
として、前記キーワードのシソーラス展開に係る展開階
層範囲n(n=1,2,3,……)を設定し、前記キー
ワード展開処理手段は、前記展開階層範囲nに対し、前
記シソーラス辞書内の前記キーワードが属する関連語グ
ループに対する(n−1)階層上位の関連語グループの
下位の関連語グループの中の当該キーワードが属する関
連語グループと同一の階層値を持つ関連語グループの語
を前記検索語に同階層展開することを特徴とする請求項
1記載の文書検索装置。 - 【請求項3】 前記関連語グループ単位の階層値は、当
該関連語グループの物理的な階層に依存しない値を有
し、物理的階層と意味的階層が異なっている関連語グル
ープ間でも、同一の階層値を持つことにより、前記同階
層展開が行えるようにしたことを特徴とする請求項1ま
たは2記載の文書検索装置。 - 【請求項4】 前記シソーラス辞書の辞書種別情報を管
理する辞書管理テーブルを具備し、該辞書管理テーブル
の辞書種別情報を参照して前記キーワードが属するシソ
ーラス辞書の辞書種別を特定し、該辞書種別に応じて前
記同階層展開の実行または禁止を制御することを特徴と
する請求項1乃至3のいずれか記載の文書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8004859A JPH09198396A (ja) | 1996-01-16 | 1996-01-16 | 文書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8004859A JPH09198396A (ja) | 1996-01-16 | 1996-01-16 | 文書検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09198396A true JPH09198396A (ja) | 1997-07-31 |
Family
ID=11595412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8004859A Pending JPH09198396A (ja) | 1996-01-16 | 1996-01-16 | 文書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09198396A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11306182A (ja) * | 1998-04-24 | 1999-11-05 | Fujitsu Ltd | 関連語の処理方法及び記録媒体 |
JP2001202408A (ja) * | 2000-01-19 | 2001-07-27 | Fuji Xerox Co Ltd | 要素編成支援装置、要素編成支援方法及び記録媒体 |
GB2360611A (en) * | 1999-09-24 | 2001-09-26 | Wordmap Ltd | Apparatus for and method of searching |
WO2007058268A1 (ja) * | 2005-11-16 | 2007-05-24 | Matsushita Electric Industrial Co., Ltd. | 対応付け装置 |
JP2008282322A (ja) * | 2007-05-14 | 2008-11-20 | Sony Ericsson Mobilecommunications Japan Inc | 情報処理装置及び情報処理方法 |
WO2013140636A1 (ja) * | 2012-03-21 | 2013-09-26 | 株式会社東芝 | 検索装置、検索方法およびプログラム |
WO2013157637A1 (ja) * | 2012-04-19 | 2013-10-24 | 株式会社 東芝 | 医療情報検索支援装置及び医療情報検索支援システム |
US10078672B2 (en) | 2012-03-21 | 2018-09-18 | Toshiba Solutions Corporation | Search device, search method, and computer program product |
-
1996
- 1996-01-16 JP JP8004859A patent/JPH09198396A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11306182A (ja) * | 1998-04-24 | 1999-11-05 | Fujitsu Ltd | 関連語の処理方法及び記録媒体 |
GB2360611A (en) * | 1999-09-24 | 2001-09-26 | Wordmap Ltd | Apparatus for and method of searching |
JP4529213B2 (ja) * | 2000-01-19 | 2010-08-25 | 富士ゼロックス株式会社 | 要素編成支援装置及び要素編成支援プログラムが記録された記憶媒体 |
JP2001202408A (ja) * | 2000-01-19 | 2001-07-27 | Fuji Xerox Co Ltd | 要素編成支援装置、要素編成支援方法及び記録媒体 |
WO2007058268A1 (ja) * | 2005-11-16 | 2007-05-24 | Matsushita Electric Industrial Co., Ltd. | 対応付け装置 |
JP2007142644A (ja) * | 2005-11-16 | 2007-06-07 | Matsushita Electric Ind Co Ltd | 対応付け装置 |
US8134592B2 (en) | 2005-11-16 | 2012-03-13 | Panasonic Corporation | Associating device |
JP2008282322A (ja) * | 2007-05-14 | 2008-11-20 | Sony Ericsson Mobilecommunications Japan Inc | 情報処理装置及び情報処理方法 |
WO2013140636A1 (ja) * | 2012-03-21 | 2013-09-26 | 株式会社東芝 | 検索装置、検索方法およびプログラム |
US10078672B2 (en) | 2012-03-21 | 2018-09-18 | Toshiba Solutions Corporation | Search device, search method, and computer program product |
WO2013157637A1 (ja) * | 2012-04-19 | 2013-10-24 | 株式会社 東芝 | 医療情報検索支援装置及び医療情報検索支援システム |
JP2013239158A (ja) * | 2012-04-19 | 2013-11-28 | Toshiba Corp | 医療情報検索支援装置及び医療情報検索支援システム |
CN104011765A (zh) * | 2012-04-19 | 2014-08-27 | 株式会社东芝 | 医疗信息检索支援装置以及医疗信息检索支援系统 |
US10636515B2 (en) | 2012-04-19 | 2020-04-28 | Canon Medical Systems Corporation | Medical or health information search support apparatus and medical or health information search support system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7249127B2 (en) | Method and apparatus for deriving logical relations from linguistic relations with multiple relevance ranking strategies for information retrieval | |
WO2005083597A1 (en) | Intelligent search and retrieval system and method | |
US7548933B2 (en) | System and method for exploiting semantic annotations in executing keyword queries over a collection of text documents | |
CN114547253A (zh) | 一种基于知识库应用的语义搜索方法 | |
US9063957B2 (en) | Query systems | |
CN115544225A (zh) | 基于语义的数字档案信息关联检索方法 | |
JPH09198396A (ja) | 文書検索装置 | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
JPH09212517A (ja) | 情報代行検索方法及び装置 | |
JP2894301B2 (ja) | 文脈情報を用いた文書検索方法および装置 | |
JP3565117B2 (ja) | 複数異種情報源アクセス方法及びクライアント装置及び複数異種情報源アクセスプログラムを格納した記憶媒体 | |
JPH0944506A (ja) | 文書検索装置 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
JP2000003366A (ja) | 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体 | |
JPH1166078A (ja) | 検索要求具体化方法及び装置及び検索要求具体化プログラムを格納した記憶媒体 | |
JP2004318381A (ja) | 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3747542B2 (ja) | 統合化検索装置 | |
KR100493399B1 (ko) | 정보검색 관리시스템 및 그 방법 | |
JPH0916624A (ja) | 階層型データ検索方法 | |
US20030028370A1 (en) | System and method for providing a fixed grammar to allow a user to create a relational database without programming | |
US20240354318A1 (en) | System and method for searching tree based organizational hierarchies, including topic hierarchies, and generating and presenting search interfaces for same | |
JPH08115340A (ja) | 文書検索装置およびそれに用いるインデックスファイルの作成装置 | |
JP2988304B2 (ja) | 文字列管理装置 | |
KR100741283B1 (ko) | 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법 | |
JPH09198393A (ja) | 文書検索装置 |