[go: up one dir, main page]

JP2007257369A - 情報検索装置 - Google Patents

情報検索装置 Download PDF

Info

Publication number
JP2007257369A
JP2007257369A JP2006081659A JP2006081659A JP2007257369A JP 2007257369 A JP2007257369 A JP 2007257369A JP 2006081659 A JP2006081659 A JP 2006081659A JP 2006081659 A JP2006081659 A JP 2006081659A JP 2007257369 A JP2007257369 A JP 2007257369A
Authority
JP
Japan
Prior art keywords
search
character string
information
result
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006081659A
Other languages
English (en)
Inventor
Daisuke Morita
大助 森田
Shigeru Hidesawa
茂 秀澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006081659A priority Critical patent/JP2007257369A/ja
Priority to US11/422,372 priority patent/US20070226208A1/en
Publication of JP2007257369A publication Critical patent/JP2007257369A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索に慣れていない利用者であっても簡単かつ迅速に所望の情報を得ることができる情報検索装置を提供する。
【解決手段】上記課題を解決するために、情報検索装置10に第1の検索文字列を用いて検索を行なう第1の検索手段11と、検索結果とともに第2の検索文字列の候補を識別可能に表示する表示データを出力する検索結果表示手段12と、第2の検索文字列を選択可能にする第2の検索文字列選択手段13と、第1の検索文字列に第2の検索文字列を加えて第1の検索手段11を実行する第2の検索手段14と、を備えている。
【選択図】図1

Description

本発明は、キーワードを用いて所望の情報を検索する情報検索装置に関する。
インターネット上に分散して存在する大量のデータやデータベース上のデータなどから所望のデータを検索する手段としてキーワード検索が広く利用されている。
キーワード検索を行なう場合、利用者は所望の情報に関連すると思われるキーワードをいくつか用意して検索を実行するが、使用するキーワードの選択によって検索結果が大きく異なる場合も多い。キーワードにヒットした件数が多すぎて見切れない場合もあれば、1件もキーワードにヒットしない場合もある。
キーワードにヒットした件数が多すぎる場合には、更にキーワードを追加して検索結果の絞り込みを試みることになるが、この際に使用するキーワードによっても検索結果が大きく異なり、所望の情報を得られない場合がある。例えば、キーワードを1つ追加しただけ1件もヒットしなくなってしまうといった場合もある。
以上のように、キーワード検索に慣れていない利用者にとって、所望の情報を得ることは簡単ではないという問題があった。
特許文献1は、検索を行った結果得られる対象物がもっているキーワードそれぞれについての存在頻度を画面に表示することによって、キーワード検索による絞り込み作業を容易にするデータベース検索処理方法について開示されている。
特許文献2は、一次検索結果の各データに含まれる異なり文字列の出現情報を表示し、この出現情報をもとに次の妥当な検索文字列を決定できるようにすることにより、容易かつ効率的に一次検索結果を絞り込むことができる情報検索装置について開示されている。
特開平05−143647号公報 特開平05−165892号公報
本発明は、上述した問題に鑑みてなされたものであり、その解決しようとする課題は、検索に慣れていない利用者であっても簡単かつ迅速に所望の情報を得ることができる情報検索装置を提供することである。
上記課題を解決するために、本発明に係る情報検索装置は、入力された1または2以上の文字列からなる第1の検索文字列と一致する文字列を含む情報を検索する第1の検索手段と、該第1の検索手段による検索の結果得た情報に含まれる文字列から、該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示手段と、該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択手段と、該第2の検索文字列選択手段によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索手段による検索を実行する第2の検索手段と、を備える。
本発明によると、検索結果表示手段は、第1の検索手段による検索結果から第2の検索文字列の候補を抽出し、第1の検索手段による検索結果とともに第2の検索文字列の候補を識別可能に表示する表示データを表示手段に出力するので、検索に慣れていない利用者であっても検索結果を更に絞り込むための第2の検索文字列を簡単に選択することが可能となる。
また、第2の検索手段は、利用者が第2の検索文字列選択手段を用いて選択した検索文字列を前記第1の検索文字列に追加して第1の検索手段による検索を実行するので、利用者は、第2の検索文字列選択手段によって第2の検索文字列の候補から任意の検索文字列を選択するだけで検索結果を更に絞り込むことが可能となる。
以上に説明したように、本発明によると、検索に慣れていない利用者であっても簡単かつ迅速に所望の情報を得ることができる情報検索装置を提供することが可能となる。
以下、本発明の実施形態について図1〜図10に基づいて説明する。
図1は、本発明の実施例に係る情報検索装置10の概要を説明する図である。
図1に示す情報検索装置10は、第1の検索文字列を用いて検索を行なう第1の検索手段11と、第1の検索手段11による検索結果を表示するとともに第2の検索文字列の候補を識別可能に表示する表示データを図示しない表示手段に出力する検索結果表示手段12と、表示手段に表示された第2の検索文字列の候補から第2の検索文字列を選択可能にする第2の検索文字列選択手段13と、第1の検索文字列に第2の検索文字列を加えて第1の検索手段11を実行する第2の検索手段14と、を備えている。
第1の検索手段11は、利用者が入力した1又は2以上の文字列(英数字や記号等を含む)からなる第1の検索文字列と一致する文字列を含む情報を検索する。そして、検索の結果を出力する。
なお、情報検索装置10は、情報検索装置10と直接又はネットワーク等を介して間接的に接続された記憶装置に記憶されている情報群(又はデータベース)から第1の検索文字列と一致する文字列を含む情報を検索してもよいし、インターネット等のネットワークを介して接続された情報処理装置に記憶されている情報群から第1の検索文字列と一致する文字列を含む情報を検索してもよい。
また、検索の結果とは、例えば、第1の検索文字列と一致する文字列を含む情報(以下、単に「ヒットした情報」という)の情報名やヒットした情報の格納場所を少なくとも含むヒット情報の一覧情報である。
検索結果表示手段12は、検索の結果をさらに絞り込むために使用する第2の検索文字列の候補を、第1の検索手段11によりヒットした情報に含まれる文字列から抽出する。
例えば、ヒットした情報に含まれる文字列のうち出現頻度の高い順に第2の検索文字列の候補を選んでもよし、ヒットした情報に含まれる文字列のうち第1の検索文字列に関連性や類似性の高い順に第2の検索文字列の候補を選んでもよい。
さらに、検索結果表示手段12は、検索結果とともに第2の検索文字列の候補を識別可能に表示する表示データを生成し、ディスプレイ等の表示手段に出力する。
表示データには、例えば、ヒットした情報のそれぞれの情報名(件名)とその情報の一部又は全部を一覧表示する表示データであって、その情報の一部又は全部に含まれる第2の検索文字列の候補を識別可能となるように表示する表示データでもよいし、ヒットした情報のぞれぞれの情報名とその情報に含まれる第2の検索文字列の候補を一覧表示する表示データであってもよい。
また、表示データには例えば、HTML(HyperText Markup Language)形式やXML(eXtensible Markup Language)形式、XHTML(eXtensible HyperText Markup Language)形式等のデータを必要に応じて使用する。
第2の検索文字列選択手段13は、表示手段に表示された第2の検索文字列の候補から第2の検索文字列を選択可能にする。例えば、利用者が表示手段に表示されている第2の検索文字列の候補をマウス等の入力手段で指定すると、第2の検索文字列選択手段13は指定された検索文字列を第2の検索文字列として取得する。
第2の検索手段14は、第2の検索文字列選択手段13が取得した第2の検索文字列を第1の検索文字列に追加して第1の検索手段11を実行する。
図2は、本発明の実施例に係る情報検索装置10を実施するために必要な構成例を示す図である。
図2に示す情報検索装置10は、入力装置24からの指示に応じて検索実行用のコマンドを生成して検索実行の指示を行なうコマンド解析部21と、コマンド解析部21の指示に応じて検索を実行する検索部22と、検索部22が生成した表示データを出力装置25に出力する画面表示処理部23と、を少なくとも備える。
また、検索部22は、コマンド解析部21が生成したコマンドを実行して(コマンドによって検索エンジンを起動して)検索を行なう検索処理部22aと、検索結果から後述するファイル一覧情報70や出現回数一覧情報100を生成する頻出文字列解析処理部22bと、ファイル一覧情報70や出現回数一覧情報100から検索結果と第2の検索文字列の候補とを識別可能に表示する表示データを生成する検索結果情報処理部22cと、を備えている。
また、情報検索装置10には、第1の検索文字列の入力や第2の検索文字列の選択、検索実行の指示等を行なうための入力装置24と、表示データを表示や印刷するための出力装置25と、検索対象となる検索用データベース26と、が接続されている。
入力装置24(例えば、マウスやキーボード)によって第1の検索文字列が入力されて検索実行が指示されると、コマンド解析部21は、検索実行用のコマンドを生成して検索実行の指示を行なう。
検索部22は、コマンド解析部21の指示に応じてコマンドを実行して検索を行なう。そして、検索結果と第2の検索文字列とを識別可能に表示する表示データを生成する。
画面表示処理部23は、出力装置25(例えば、ディスプレイ)に出力して表示データを表示する。
ディスプレイの表示に応じて、利用者が入力装置24を使用して第2の検索文字列を選択すると、コマンド解析部21は、第1の検索文字列に第2の検索文字列を追加するとともに、検索実行用のコマンドを生成して検索実行の指示を行なう。
以上に説明した構成では情報検索装置10に検索用データベース26を接続した場合について示しているが、これに限定する趣旨ではなく、例えば、検索対象をインターネット上のデータとした場合には、インターネットと接続すればよい。
以上に説明した構成要素(コマンド解析部21、検索部22及び画面表示処理部23)を備える情報検索装置10は、一般的な情報処理装置によって実現できる。すなわち、情報処理装置に備わるメモリに記憶したプログラムの命令をCPUに実行させることによって、コマンド解析部21、検索部22及び画面表示処理部23を実現できる。
図3は、本発明の実施例に係る情報検索装置10の処理の概要を示すフローチャートである。なお、図3に示すステップS300A〜S309Aは、ユーザインターフェースの処理を示し、ステップS300B〜S307Bは、ユーザインターフェースからの指示を受けて動作する情報検索処理を示している。
利用者が情報検索装置10を起動すると、情報検索装置10は、ディスプレイに第1の検索文字列の入力欄や以下に示す変数n1〜n3の入力欄をディスプレイに表示する(ステップS300A)。
ステップS301Aにおいて、情報検索装置10は、利用者が入力欄に入力した文字列を第1の検索文字列として取得する。同様に、ステップS302A〜S304において、情報検索装置10は、利用者が入力欄に入力した値をそれぞれ検索結果の上限件数n1、抽出処理するファイル数n2及び第2の検索文字列の候補数n3として取得する。
なお、検索結果の上限件数n1は、検索によってヒットした情報のうち検索結果として表示する上限の件数を示し、抽出処理するファイル数n2は、第2の検索文字列の候補を抽出するために使用するファイルの数を示す。また、第2の検索文字列の候補数n3は、検索結果とともに識別可能に表示する第2の検索文字列の候補の数を示す。
第1の検索文字列及び変数n1〜n3の入力が完了すると、利用者は、マウス等によって検索ボタンを押下して検索実行を指示することとなる。
ステップS305Aにおいて、情報検索装置10は、検索ボタンの押下を検出すると、検索エンジンを起動して検索処理を開始する。
ステップS306Aにおいて、情報検索装置10は、ディスプレイに待受け画面を表示する。例えば、「検索実行中」である旨の表示やキャンセル実行のためのキャンセルボタン等を表示する。
ステップS307Aにおいて、情報検索装置10は、検索処理によって生成した表示データをディスプレイに表示する。そして、ステップS308Aに処理を移行する。
ステップS308Aにおいて、情報検索装置10は、ステップS307Aで表示された第2の検索文字列の候補から第2の検索文字列が選択されたか否かをチェックする。そして、第2の検索文字列が選択された場合には、ステップS301Aで取得した第1の検索文字列に第2の検索文字列を追加する。そして、処理をステップS305Aに移行して検索を実行する。
また、ステップS308Aにおいて、第2の検索文字列が選択されない場合には処理をステップS309Aに移行して検索処理を終了する(または、入力待ち状態となる)。
一方、ステップS305Aにおいて、検索ボタンの押下を検出すると、情報検索装置10は、ステップS300Bに移行して検索エンジンを起動する。そして、処理をステップS301Bに移行する。
ステップS301Bにおいて、情報検索装置10は、ステップS301Aで取得した第1の検索文字列を用いてキーワード検索を実行する。キーワード検索によって第1の検索文字列と一致する文字列を含むファイルを検索用データベース26から抽出する。なお、本実施例に係る情報検索装置10は、検索用データベース26を検索対象としているが、検索対象はインターネット全体であってもよいのは当然である。
ステップS302Bにおいて、情報検索装置10は、キーワード検索の結果をチェックする。そして、第1の検索文字列にヒットした件数が0件である場合には、処理をステップS301Aに移行する。
また、ステップS302Bにおいて、第1の検索文字列にヒットした件数が1件以上ある場合、情報検索装置10は、処理をステップS303Bに移行する。
ステップS303Bにおいて、情報検索装置10は、ステップS301Bの検索でヒットしたファイルから任意のn1個のファイルを取得してファイル一覧情報70を作成する。なお、ステップS301Bの検索でヒットしたファイルから任意のn1個のファイルを取得する場合、例えば、検索エンジンが検出した(ヒットした)順にn1個までのファイルを取得してファイル一覧情報70を作成すればよい。
ステップS304Bにおいて、情報検索装置10は、ステップS303Bで生成したファイル一覧情報70から任意のn2個のファイルを選択する。そして、選択した各ファイルに含まれるテキストデータを取得し、例えば、形態素解析といった手法を用いて品詞分解した後に、例えば、名詞だけを抽出する。
ステップS305Bにおいて、情報検索装置10は、ステップS304Bで抽出した名詞(文字列)の出現回数をカウントして出現回数一覧情報100を生成する。そして、最も出現回数が多いものからn3番目までの文字列を抽出する。この抽出した文字列を第2の検索文字列の候補とする。
ステップS306Bにおいて、情報検索装置10は、ステップS303Bで生成したファイル一覧情報70を参照し、ファイル名とファイルの内容の一部を表示する表示データを生成する。この時、ファイルの内容にステップS305Bで抽出した第2の検索文字列の候補と一致する文字列がある場合には、例えば、出現回数が多い順に色分けや添え字等によって第2の検索文字列の候補であることを識別できるように表示するための表示データを生成する。
表示データを生成すると、情報検索装置10は、処理をステップS307Bに移行して検索エンジンを終了させる。
以上の説明において、ステップS302A〜S304Aで利用者が設定するn1、n2及びn3は、あらかじめ情報検索装置10に備わる記憶部に記憶しておいてもよい。
図4は、本発明の実施例に係る表示データを説明する図である。
図4に示す表示データによる表示は、第1の検索文字列の入力欄41と、検索を開始する検索ボタン42と、ステップS303Bで生成したファイル一覧情報70のファイル名(例えば、図に示す「ファイルaaa」、「ファイルbbb」、「ファイルccc」、・・・)と各ファイルの内容の一部(例えば、図に示す「このハードディスクは、大容量200GBあり、TV録画データを保存したり、大規模なデータベースを構築したりすることが・・・」)の一覧表示と、で構成されている。
また、文字囲いされた文字列「ハードディスク」は第1の検索文字列であることを示し、アンダーラインのある文字列(例えば、データベース、アクセス、メモリ、・・・)は第2の検索文字列の候補を示している。
また、第2の検索文字列の候補には、出現回数が多い順に(1)、(2)、・・・が付されている。すなわち、「データベース」、「アクセス」、「メモリ」、「大容量」、・・・の順に出現回数が多いことを示している。
ここで、本実施例に係る情報検索装置10の検索対象は、検索用データベース26を対象としている。この検索用データベース26は、ニュース情報を記憶するNEWS用データベース26aと、一問一答形式のデータを記憶するFAQ用データベース26bと、ショッピング情報を記憶するショッピング用データベース26cと、で構成されている。
そこで、本実施例に係る表示データは、検索対象毎にステップS303Bで生成したファイル一覧情報70のファイル名と各ファイルの内容の一部の一覧表示を行なっている。例えば、「ハードディスク」に関するNEWSは、NEWS用データベース26aを検索した結果を示し、「ハードディスク」に関するFAQは、FAQ用データベース26b上のデータを検索した結果を示している。また、「ハードディスク」に関するショッピングは、ショッピング用データベース26c上のデータを検索した結果を示している。
以下、本発明の実施例に係る情報検索装置10による表示データの生成処理の具体例について説明する。
図5は、本発明の実施例に係る情報検索装置10による表示データの生成処理(特に図3に示したステップS303B〜S306Bの処理の詳細)を示すフローチャートである。
ステップS501において、情報検索装置10は、図3に示したステップS301Bの検索処理でヒットしたファイルから任意のn1個のファイルを取得してファイル一覧情報70を作成する。
例えば、検索用データベース26に図6に示すテキストファイルa.htm、b.htm、c.htm及びd.htmが記憶されていた場合に、第1の検索文字列「ハードディスク」を用いてキーワード検索を行なうと、情報検索装置10は、図7に示すファイル一覧情報70を生成する。
ここで、図7に示すファイル一覧情報70は、第1の検索文字列にヒットしたファイルの格納場所と、当該ファイルのタイトル(又はファイル名)と、当該ファイルの更新日時と、当該ファイルに格納されている先頭から40文字の情報と、で構成される。
ステップS502において、情報検索装置10は、ステップS501で作成したファイル一覧情報70を参照し、各ファイルのテキストデータを読み出す。そして、図8に示す解析用一時ファイル80を作成する。
ここで、解析用一時ファイル80は、図8に示すようにファイル一覧情報70にあるファイル名と、当該ファイルに格納されているテキストデータと、で構成される。
解析用一時ファイル80を生成すると、情報検索装置10は、処理をステップS503に移行する。
ステップS503において、情報検索装置10は、ステップS502で作成した解析用一時ファイル80における各ファイルのテキストデータに対して形態素解析を実行し、品詞分解を行なう。
図9は、解析用一時ファイル80に対して形態素解析を実施した場合の解析結果のイメージを示したものである。”/”は、品詞の区切りを示している。なお、形態素解析は一般的な技術なので詳細な説明は省略する。
解析用一時ファイル80に対する形態素解析が完了すると、情報検索装置10は、処理をステップS504に移行する。
ステップS504において、情報検索装置10は、ステップS503の形態素解析によって品詞分解された各ファイルのテキストデータから名詞のみを抽出する。そして、抽出した名詞の出現回数をそれぞれカウントして、図10に示す出現回数一覧情報100を作成する。
ここで、出現回数一覧情報100は、図10に示すように解析用一時ファイル80から取得したファイルのファイル名と、各ファイルのテキストデータに対して実施した形態素解析の結果得られた名詞の文字列(「データベース」、「アクセス」、「メモリ」、「大容量」、「TV」、・・・)と、各文字列の出現回数の合計(出現合計回数)と、で構成されている。
情報検索装置10は、出現回数一覧情報100を生成すると、出現合計回数の大きいものからn3個の文字列を選択する。この選択した文字列を第2の検索文字列の候補とする。
第2の検索文字列の候補が決まると、情報検索装置10は、処理をステップS505に移行する。そして、図4に示した表示形式の表示データをHTML形式等で生成する。
表示データを生成すると、情報検索装置10は、処理をステップS506に移行する。そして、表示データをディスプレイに出力して表示することとなる。
以上に説明したように、本実施例に係る情報検索装置10は、利用者が入力した第1の検索文字列を用いたキーワード検索の結果から、検索結果を更に絞り込むために使用する第2の検索文字列の候補を抽出する。そして、検索結果とともに第2の検索文字列の候補を識別可能に表示させる。
さらに、表示された第2の検索文字列の候補のいずれかを利用者が選択すると、情報検索装置10は、第1の検索文字列に第2の検索文字列を追加してキーワード検索を実施する。
その結果、検索になれていない利用者であっても、ディスプレイ等に表示された第2の検索文字列の候補を選択するだけで、簡単かつ迅速に検索結果を絞り込んで所望の情報を得ることが可能となる。
(付記1) 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索する第1の検索手段と、
該第1の検索手段による検索の結果得た情報に含まれる文字列から、該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示手段と、
該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択手段と、
該第2の検索文字列選択手段によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索手段による検索を実行する第2の検索手段と、
を備える情報検索装置。
(付記2) 前記検索結果表示手段は、
前記第1の検索手段による検索の結果得た情報から特定の文字列を抽出する文字列抽出手段と、
該抽出した文字列から出現頻度の高い文字列を抽出して前記第2の検索文字列の候補とする頻出文字列抽出手段と、
前記第1の検索手段による検索の結果とともに、該頻出文字列抽出手段が抽出した第2の検索文字列の候補を識別可能に表示する表示データを生成して表示手段に出力する検索結果出力手段と、
を備えることを特徴とする請求項1に記載の情報検索装置。
(付記3) 前記表示データは、
前記第1の検索手段による検索の結果得た情報の名称と該情報の一部又は全部を少なくとも表示する表示データであって、該表示に含まれる前記第2の検索文字列の候補を識別可能に表示する表示データである、
ことを特徴とする請求項1に記載の情報検索装置。
(付記4) 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索して検索結果を記憶手段に記憶する第1の検索処理と、
該記憶手段から前記検索結果を読み出して、検索の結果得た情報に含まれる文字列から該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示処理と、
該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択処理と、
該第2の検索文字列選択処理によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索処理による検索を実行する第2の検索処理と、
を情報検索装置に実行させる情報検索方法。
(付記5) 前記検索結果表示処理は、
前記第1の検索処理による検索の結果得た情報から特定の文字列を抽出する文字列抽出処理と、
該抽出した文字列から出現頻度の高い文字列を抽出して前記第2の検索文字列の候補とする頻出文字列抽出処理と、
前記第1の検索処理による検索の結果とともに、該頻出文字列抽出処理が抽出した第2の検索文字列の候補を識別可能に表示する表示データを生成して表示手段に出力する検索結果出力処理と、
を情報検索装置に実行させることを特徴とする請求項4に記載の情報検索方法。
(付記6) 前記表示データは、
前記第1の検索処理による検索の結果得た情報の名称と該情報の一部又は全部を少なくとも表示する表示データであって、該表示に含まれる前記第2の検索文字列の候補を識別可能に表示する表示データである、
ことを特徴とする請求項4に記載の情報検索方法。
(付記7) 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索して検索結果を記憶手段に記憶する第1の検索処理と、
該記憶手段から前記検索結果を読み出して、検索の結果得た情報に含まれる文字列から該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示処理と、
該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択処理と、
該第2の検索文字列選択処理によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索処理による検索を実行する第2の検索処理と、
を情報検索装置に実行させる情報検索のためのプログラム。
(付記8) 前記検索結果表示処理は、
前記第1の検索処理による検索の結果得た情報から特定の文字列を抽出する文字列抽出処理と、
該抽出した文字列から出現頻度の高い文字列を抽出して前記第2の検索文字列の候補とする頻出文字列抽出処理と、
前記第1の検索処理による検索の結果とともに、該頻出文字列抽出処理が抽出した第2の検索文字列の候補を識別可能に表示する表示データを生成して表示手段に出力する検索結果出力処理と、
を情報検索装置に実行させることを特徴とする請求項7に記載の情報検索のためのプログラム。
(付記9) 前記表示データは、
前記第1の検索処理による検索の結果得た情報の名称と該情報の一部又は全部を少なくとも表示する表示データであって、該表示に含まれる前記第2の検索文字列の候補を識別可能に表示する表示データである、
ことを特徴とする請求項7に記載の情報検索のためのプログラム。
本発明の実施例に係る情報検索装置の概要を説明する図である。 本発明の実施例に係る情報検索装置を実施するために必要な構成例を示す図である。 本発明の実施例に係る情報検索装置の処理の概要を示すフローチャートである。 本発明の実施例に係る表示データを説明する図である。 本発明の実施例に係る情報検索装置による表示データの生成処理を示すフローチャートである。 本発明の実施例に係る検索用データベースに格納されるテキストファイルの例を示す図である。 本発明の実施例に係るファイル一覧情報の例を示す図である。 本発明の実施例に係る解析用一時ファイルの例を示す図である。 解析用一時ファイルに対して形態素解析を実施した場合の解析結果のイメージを示す図である。 本発明の実施例に係る出現回数一覧情報の例を示す図である。
符号の説明
10 情報検索装置
11 第1の検索手段
12 検索結果表示手段
13 第2の検索文字列選択手段
14 第2の検索手段
21 コマンド解析部
22 検索部
22a 検索処理部
22b 頻出文字列解析処理部
22c 検索結果情報処理部
23 画面表示処理部
24 入力装置
25 出力装置
26 検索用データベース

Claims (5)

  1. 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索する第1の検索手段と、
    該第1の検索手段による検索の結果得た情報に含まれる文字列から、該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示手段と、
    該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択手段と、
    該第2の検索文字列選択手段によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索手段による検索を実行する第2の検索手段と、
    を備える情報検索装置。
  2. 前記検索結果表示手段は、
    前記第1の検索手段による検索の結果得た情報から特定の文字列を抽出する文字列抽出手段と、
    該抽出した文字列から出現頻度の高い文字列を抽出して前記第2の検索文字列の候補とする頻出文字列抽出手段と、
    前記第1の検索手段による検索の結果とともに、該頻出文字列抽出手段が抽出した第2の検索文字列の候補を識別可能に表示する表示データを生成して表示手段に出力する検索結果出力手段と、
    を備えることを特徴とする請求項1に記載の情報検索装置。
  3. 前記表示データは、
    前記第1の検索手段による検索の結果得た情報の名称と該情報の一部又は全部を少なくとも表示する表示データであって、該表示に含まれる前記第2の検索文字列の候補を識別可能に表示する表示データである、
    ことを特徴とする請求項1に記載の情報検索装置。
  4. 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索して検索結果を記憶手段に記憶する第1の検索処理と、
    該記憶手段から前記検索結果を読み出して、検索の結果得た情報に含まれる文字列から該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示処理と、
    該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択処理と、
    該第2の検索文字列選択処理によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索処理による検索を実行する第2の検索処理と、
    を情報検索装置に実行させる情報検索方法。
  5. 少なくとも一つの第1の検索文字列と一致する文字列を含む情報を検索して検索結果を記憶手段に記憶する第1の検索処理と、
    該記憶手段から前記検索結果を読み出して、検索の結果得た情報に含まれる文字列から該検索の結果を更に絞り込むために使用する第2の検索文字列の候補を抽出し、該検索の結果とともに識別可能に表示する表示データを表示手段に出力する検索結果表示処理と、
    該識別可能に表示された第2の検索文字列の候補から所望の第2の検索文字列を選択可能にする第2の検索文字列選択処理と、
    該第2の検索文字列選択処理によって選択された検索文字列を前記第1の検索文字列に追加して前記第1の検索処理による検索を実行する第2の検索処理と、
    を情報検索装置に実行させる情報検索のためのプログラム。
JP2006081659A 2006-03-23 2006-03-23 情報検索装置 Withdrawn JP2007257369A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006081659A JP2007257369A (ja) 2006-03-23 2006-03-23 情報検索装置
US11/422,372 US20070226208A1 (en) 2006-03-23 2006-06-06 Information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006081659A JP2007257369A (ja) 2006-03-23 2006-03-23 情報検索装置

Publications (1)

Publication Number Publication Date
JP2007257369A true JP2007257369A (ja) 2007-10-04

Family

ID=38534806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006081659A Withdrawn JP2007257369A (ja) 2006-03-23 2006-03-23 情報検索装置

Country Status (2)

Country Link
US (1) US20070226208A1 (ja)
JP (1) JP2007257369A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093653A (ja) * 2007-10-05 2009-04-30 Fujitsu Ltd ユーザ入力に応じた検索空間の絞り込み
JP2014160431A (ja) * 2013-02-20 2014-09-04 Nippon Shokuhin Seizo Kk 検索装置
JP2017033387A (ja) * 2015-08-04 2017-02-09 Kddi株式会社 入力支援装置、プログラムおよび入力支援方法
JP2020177549A (ja) * 2019-04-22 2020-10-29 株式会社プレシジョン 情報処理装置、情報処理方法及び情報処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11281625B1 (en) * 2017-06-05 2022-03-22 Amazon Technologies, Inc. Resource management service
MX2022002429A (es) * 2019-10-01 2022-03-22 Jfe Steel Corp Sistema de busqueda de informacion.

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS641030A (en) * 1987-06-24 1989-01-05 Canon Inc File retrieval system
JPH05143647A (ja) * 1991-11-22 1993-06-11 Nippon Telegr & Teleph Corp <Ntt> データベース検索処理方法
JPH09204439A (ja) * 1996-01-29 1997-08-05 Matsushita Electric Ind Co Ltd 情報表示装置
JP2001075981A (ja) * 1999-09-02 2001-03-23 Ntt Data Corp 検索システム、検索条件受付方法及び記録媒体

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3701310A (en) * 1970-02-24 1972-10-31 Prontor Werk Gauthier Gmbh Photographic shutter with electronic time setting device
US5206949A (en) * 1986-09-19 1993-04-27 Nancy P. Cochran Database search and record retrieval system which continuously displays category names during scrolling and selection of individually displayed search terms
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
JP3282937B2 (ja) * 1995-01-12 2002-05-20 日本アイ・ビー・エム株式会社 情報検索方法及びシステム
EP0744702B1 (en) * 1995-05-22 2002-11-13 Matsushita Electric Industrial Co., Ltd. Information searching apparatus for searching text to retrieve character streams agreeing with a key word
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
JP3305191B2 (ja) * 1996-03-19 2002-07-22 富士通株式会社 文書管理装置及びデータ圧縮方法及びデータ復元方法
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
US5768581A (en) * 1996-05-07 1998-06-16 Cochran; Nancy Pauline Apparatus and method for selecting records from a computer database by repeatedly displaying search terms from multiple list identifiers before either a list identifier or a search term is selected
US6581056B1 (en) * 1996-06-27 2003-06-17 Xerox Corporation Information retrieval system providing secondary content analysis on collections of information objects
JP3177593B2 (ja) * 1997-09-18 2001-06-18 株式会社ジャストシステム 語句の絞込検索方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US5987457A (en) * 1997-11-25 1999-11-16 Acceleration Software International Corporation Query refinement method for searching documents
US6032145A (en) * 1998-04-10 2000-02-29 Requisite Technology, Inc. Method and system for database manipulation
JP3457184B2 (ja) * 1998-06-25 2003-10-14 シャープ株式会社 検索装置及びその制御プログラムを記憶した媒体
US6564213B1 (en) * 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
JP2001306598A (ja) * 2000-04-20 2001-11-02 Fuji Xerox Co Ltd データ入力フォーム検索システム、データ入力フォーム検索方法、及び、コンピュータ読み取り可能な記録媒体
JP3573688B2 (ja) * 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
JP2002108910A (ja) * 2000-09-27 2002-04-12 Nec Soft Ltd 暗号化ファイルシステム及び暗号化ファイル検索方法並びにコンピュータ可読記録媒体
JP2002197104A (ja) * 2000-12-27 2002-07-12 Communication Research Laboratory 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
US6847964B2 (en) * 2001-09-24 2005-01-25 Edward A. Hayduk, Jr. Method of using a computer to facilitate decision making
JP3781005B2 (ja) * 2002-12-12 2006-05-31 セイコーエプソン株式会社 文書抽出装置及び文書抽出プログラム並びに文書抽出方法
JP2005327221A (ja) * 2003-08-29 2005-11-24 Seiko Epson Corp 検索システム及び検索プログラム並びにパーソナルコンピュータ
JP4247108B2 (ja) * 2003-12-25 2009-04-02 株式会社東芝 構造化文書検索方法、構造化文書検索装置、及びプログラム
JP2005251115A (ja) * 2004-03-08 2005-09-15 Shogakukan Inc 連想検索システムおよび連想検索方法
US7664734B2 (en) * 2004-03-31 2010-02-16 Google Inc. Systems and methods for generating multiple implicit search queries
US20050234881A1 (en) * 2004-04-16 2005-10-20 Anna Burago Search wizard
US7783476B2 (en) * 2004-05-05 2010-08-24 Microsoft Corporation Word extraction method and system for use in word-breaking using statistical information
WO2006011819A1 (en) * 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine
JP2006099740A (ja) * 2004-09-02 2006-04-13 Olympus Corp 情報提供装置、端末装置、情報提供システム及び情報提供方法
JP4538284B2 (ja) * 2004-09-09 2010-09-08 株式会社リコー 情報検索システム、情報検索端末、並びに、プログラムおよび記録媒体
US7853606B1 (en) * 2004-09-14 2010-12-14 Google, Inc. Alternate methods of displaying search results
US20060129531A1 (en) * 2004-12-09 2006-06-15 International Business Machines Corporation Method and system for suggesting search engine keywords
US7760372B2 (en) * 2005-01-11 2010-07-20 Xerox Corporation Method for automated document selection
US20060248078A1 (en) * 2005-04-15 2006-11-02 William Gross Search engine with suggestion tool and method of using same
US20060282416A1 (en) * 2005-04-29 2006-12-14 William Gross Search apparatus and method for providing a collapsed search
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7747600B2 (en) * 2007-06-13 2010-06-29 Microsoft Corporation Multi-level search

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS641030A (en) * 1987-06-24 1989-01-05 Canon Inc File retrieval system
JPH05143647A (ja) * 1991-11-22 1993-06-11 Nippon Telegr & Teleph Corp <Ntt> データベース検索処理方法
JPH09204439A (ja) * 1996-01-29 1997-08-05 Matsushita Electric Ind Co Ltd 情報表示装置
JP2001075981A (ja) * 1999-09-02 2001-03-23 Ntt Data Corp 検索システム、検索条件受付方法及び記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093653A (ja) * 2007-10-05 2009-04-30 Fujitsu Ltd ユーザ入力に応じた検索空間の絞り込み
JP2014160431A (ja) * 2013-02-20 2014-09-04 Nippon Shokuhin Seizo Kk 検索装置
JP2017033387A (ja) * 2015-08-04 2017-02-09 Kddi株式会社 入力支援装置、プログラムおよび入力支援方法
JP2020177549A (ja) * 2019-04-22 2020-10-29 株式会社プレシジョン 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
US20070226208A1 (en) 2007-09-27

Similar Documents

Publication Publication Date Title
JP5234730B2 (ja) 電子機器、その制御方法およびコンピュータプログラム
JP2011100403A (ja) 情報処理装置、情報抽出方法、プログラム及び情報処理システム
JP2007257369A (ja) 情報検索装置
JP4502114B2 (ja) データベース検索装置
JP5056133B2 (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
JP4959603B2 (ja) ドキュメントを解析するためのプログラム,装置および方法
JP2009086944A (ja) 情報処理装置および情報処理プログラム
JPH1097541A (ja) 文書ブラウズ支援システムおよび文書処理システム
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP2005107931A (ja) 画像検索装置
JP5326781B2 (ja) 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2005122665A (ja) 電子機器装置、関連語データベースの更新方法、プログラム
US20120154436A1 (en) Information display apparatus and information display method
JP5428622B2 (ja) 電子機器及びプログラム
JP2004280756A (ja) 特許明細書分析システム及び特許明細書分析方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム
JPH07334512A (ja) 文書データ検索装置
JP2008059169A (ja) 中国語例文検索装置および中国語例文検索処理プログラム
JP2004070376A (ja) 文書表示装置および方法
JP5843235B2 (ja) Web情報処理装置、web情報処理方法、およびプログラム
JP2004133510A (ja) 技術文献検索システム
JP4980604B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP4617015B2 (ja) 文書表示装置、文書表示方法ならびに、プログラム
JP7243196B2 (ja) 情報処理装置及びプログラム
JP2005141296A (ja) 文書検索装置、文書検索方法、および文書検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110112

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110524