[go: up one dir, main page]

JP2005173999A - 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体 - Google Patents

電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2005173999A
JP2005173999A JP2003413562A JP2003413562A JP2005173999A JP 2005173999 A JP2005173999 A JP 2005173999A JP 2003413562 A JP2003413562 A JP 2003413562A JP 2003413562 A JP2003413562 A JP 2003413562A JP 2005173999 A JP2005173999 A JP 2005173999A
Authority
JP
Japan
Prior art keywords
search
document
input
unit
electronic file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003413562A
Other languages
English (en)
Inventor
Toshio Miyazawa
利夫 宮澤
Toshifumi Yamaai
敏文 山合
Hideaki Yamagata
秀明 山形
Fumihiro Hasegawa
史裕 長谷川
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003413562A priority Critical patent/JP2005173999A/ja
Publication of JP2005173999A publication Critical patent/JP2005173999A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが予め設定して条件になったときに、検索語を自動的に抽出して検索実行を行うことで、ユーザの文書作成を支援することができる電子ファイル検索装置を提供する。
【解決手段】文書の作成または編集のための文字列や編集操作を入力し、入力された文字が予め指定された条件を満たすか否かを逐次的に判定し、条件を満たすと判定された場合には入力された文字列から検索語を抽出した後、最初の検索の場合には抽出された検索語を用いて文書データベースを対象にして検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、新たに文字が入力されなくなるまで、検索と検索結果の表示を繰り返すようにした。
【選択図】図1

Description

本発明は、電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体に関し、文書を新規に作成または既存の文書を編集するときに関連のある文書を検索して提示する技術に関する。
従来、文書を作成する場合、過去に作成した関連のある文書を参照したいときには、関連のある文書を検索するためのキーワードを選択して検索式を作成する。文書を集積してある文書データベースにこの検索式を適用して、関連ある文書の候補を抽出して、その抽出された候補から概要や内容を読むことによって所望の文書を特定している。さらに、検索結果が思わしくないときには、検索式の修正を行って再検索している。
このようにして検索された関連ある文書から所望の文書を選択して、その内容を見ることにより、新たな文書や既存文書の編集を行っていた。
また、検索式の自然言語での入力、検索結果に対する対話、対話による絞込み検索等を支援する次のような検索システムがある。
特許文献1は、ユーザの自然語による入力文をその対話の状況(その入力文がシステムの発した質問に対する回答なのかどうかといった発話の状況)を判断し、その状況判断に従って入力を理解するため入力モードを切り替えて解析することができ、さらにはその入力文の文意を判定し、適切な作業を実行し、その実行に応じた適切な応答文をユーザに返すことができる人間の対話に、より近い対話を可能としている。
特許文献2は、自然言語を用いて検索条件を入力し、入力された検索条件を分解・解析して、検索に用いるキーワードとして抽出する。この抽出されたキーワードを用いて全文を対象に検索して検索結果を出力するようにした自然言語型検索支援方法であって、キーワードのカテゴリに関する相関関係を登録しているカテゴリ構造データベースを参照して、キーワードに基づいて検索対象のカテゴリを特定し、利用者との対話形式によって、検索対象のカテゴリが特定できるまで検索条件を変更するよう誘導する質問文を生成するようにした。これにより、利用者自身の真の検索ニーズを具現化することができ、かつ、計算機資源の無駄遣いを抑制することもできる自然言語型検索支援装置を提供することができる。
特許文献3は、ユーザの行った検索作業の履歴を、自然言語による入出力の履歴と検索対象集合の作成履歴をネットワーク化したものとして管理し、以前の検索結果に対する言及があれば、自然言語による入出力の履歴をサーチして以前の検索対象集合を利用することで、同様の検索処理の繰り返しを避け、また、検索履歴の取り出しを容易にして、効率的な検索作業を実現している。
特許文献4は、入力された自然言語から可能な限り多くの論理検索式を作成可能とすることによって、検索者は作成された複数の論理検索式から自己の意図する論理検索式を簡単に指定でき、たとえ複雑な論理検索式を必要とする複雑な条件の検索を実施する場合に、普段用いている自然言語を入力したとしても、正確に検索者の意図した情報検索を実施でき、高い操作性と高い検索精度を実現できる。
特許文献5は、形態素解析部で入力文を解析して要素に分解し、意味解析部により入力文を内部表現形式に変換して該入力文の概念および概念関係を明確にし、文関係抽出部により入力文における文と文の間の関係を抽出し、データベース検索部により内部表現形式に基づきデータベースをアクセスして情報検索および情報登録を行う。回答情報検査部により情報検索の結果である回答情報の重複部分を抽出し、回答情報整合部により回答情報の重複部分を調整し提示順序の整合をとり、自然言語文生成部により調整および整合後の回答情報を自然言語形式に変換する。
これにより、ユーザの複数の意図や複雑な条件に対して情報の整理・分類を行って、検索要求に即した情報をユーザにわかりやすく提示することができる。
特開2001−022763号公報 特開2001−034614号公報 特開平7−078171号公報 特開平11−175541号公報 特開平11−272710号公報
上述したように、関連のある文書を検索する際に、従来ではユーザがキーワード等の検索語を入力して、そのたびに検索実行ボタン等を押すことによって初めて検索が開始された。
しかし、文書を作成するときには、入力のたびに関連のある文書が変化していくことがある。このような場合には、この変化のたびに検索式を作成して、文書検索をし直さなければならなくなり、文書作成作業が煩雑となってしまう。
本発明は、上述の実情を考慮してなされたものであって、ユーザが予め設定して条件になったときに、検索語を自動的に抽出して検索実行し、検索された関連文書を表示することで、ユーザの文書作成を支援することができる電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体を提供することを目的としている。
上記の課題を解決するために、請求項1の発明は、文書の作成または編集のための文字列や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて文書データベースを検索する検索部と、前記検索部で検索された検索結果を表示する結果表示部とを有し、条件に合致した文字が入力されると、前回の検索以降に入力された文字列に対して検索語を抽出し、この検索語を用いて検索して検索結果を表示することを、新たに文字が入力されなくなるまで繰り返すようにしたことを特徴とする。
請求項2の発明は、請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で入力された文書内容の文字列から抽出された検索語を用いて文書データベースを検索し、文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする。
請求項3の発明は、請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする。
請求項4の発明は、請求項1、2または3に記載の電子ファイル検索装置において、前記検索部は、2回目以降の検索実行の場合には、前回の検索結果を対象にして絞り込み検索を行うことを特徴とする。
請求項5の発明は、請求項1乃至4のいずれかに記載の電子ファイル検索装置において、前記結果表示部は、検索結果の文書を縮小画像形式で表示することを特徴とする。
請求項6の発明は、任意台数の端末と電子ファイル検索サーバとを通信ネットワークで接続した電子ファイル検索システムにおいて、前記端末は、文書の作成または編集のための文字列や編集操作を入力して、前記電子ファイル検索サーバへ送信する文書編集部と、前記電子ファイル検索サーバから検索結果を受信して表示する結果表示部とを有し、前記電子ファイル検索サーバは、前記端末から受信した文字や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて、最初の検索の場合には文書データベースを検索対象として検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、検索結果を前記端末へ返信する検索部とを有することを特徴とする。
請求項7の発明は、文書の作成または編集のための文字列や編集操作を入力し、入力された文字が予め指定された条件を満たすか否かを逐次的に判定し、条件を満たすと判定された場合には入力された文字列から検索語を抽出した後、最初の検索の場合には抽出された検索語を用いて文書データベースを対象にして検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、新たに文字が入力されなくなるまで、検索と検索結果の表示を繰り返すようにしたことを特徴とする。
請求項8の発明は、コンピュータに、請求項1乃至5のいずれかに記載の電子ファイル検索装置の機能、または、請求項6に記載の電子ファイル検索システムの機能を実行させるためのプログラムである。
請求項9の発明は、請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、ユーザが予め設定して条件になったときに、入力中の文章から検索語を自動的に抽出して検索実行することで、既存の文書の中から入力中の文章に関連した文書を自動的に表示してくれるため、わざわざ検索式を考えて検索実行を行う手間が省けるので、文書作成や文書編集の作業向上につながる。
以下、図面を参照して本発明に係る好適な実施形態について説明する。
図1は、本発明の実施形態に係る電子ファイル検索装置の機能構成を示すブロック図である。同図において、電子ファイル検索装置は、文字入力部110、判定部120、判定条件125、検索語抽出部130、検索語テーブル135、検索部140、文書データベース(DB)142、検索集合144、結果表示部150、条件設定部160、文書入力部170、内容表示指定部210、内容抽出部180、内容表示部220とから構成される。
この電子ファイル検索装置は、ワープロソフトなどで文書を作成する時に、過去に作成した関連文書を自動的に抽出して表示し、必要に応じて抽出された文書の内容を表示させ、内容を参考にしてユーザの文書の作成を支援するようにしている。
以下、各構成要素について説明する。
文字入力部110は、ワープロソフトの入力部に相当するものであり、ユーザがキーボードやマウス等の入力装置を利用して文章を入力し、入力された文章は液晶ディスプレイ等の表示装置上の入力窓(図5参照)に表示するとともに、文書の編集操作(例えば、挿入、置換、削除、移動や複写等)に応じて、入力した文章を保持する文章編集領域を編集し、さらに入力された文字や文字列を判定部120へ渡して、自動検索を行うか否かを判定させる。編集操作(例えば削除等)については検索語テーブルのところで後述する。
図2は、文章編集領域で文章を校正する文字の入力位置および編集位置を管理するための各種ポインタを示している。文書開始位置は、入力編集対象の文書の先頭の文字を示すポインタであり、文書終了位置は入力編集対象の文書の最後の文字を示すポインタである。文書には、判定部120で検索実行と判断される1つ以上の検索実行単位が存在している。この1つの検索実行単位は、文章編集領域中の開始位置と終了位置のポインタで示される。
判定部120は、文字入力部110から渡された文字や文字列が判定条件125のいずれに該当するかを判断して、該当していた場合に検索語抽出部130の動作を開始する。
判定条件125は、例えば、句読点、改行、改ページの文字が入力された時、漢字から平仮名に変わった時、所定の時間を過ぎた時等の条件である。
条件設定部160は、上記の各条件のうち1つ以上をユーザに予め選択させ、判定条件125に保持しておく。
検索語抽出部130は、判定部120から起動され、検索実行単位の開始位置と終了位置間の文字列に対して、既存の技術、例えば、特開平05−298352号公報のような形態素解析の手法を用いて単語に分解し、この単語を検索語として検索実行単位ごとに出現回数を累積するようにして検索語テーブル135へ記録するとともに、検索部140を起動する。また、文字列に、例えば、強調や網がけや下線等の修飾がなされていたり、また、文字列がタイトルに用いられている検索語は他の単語より重みを大きく設定する。
この検索語テーブル135は、例えば、図3のようなデータ構造を持っている。図3において、検索実行単位ごとに、検索実行単位情報と、この中に含まれる1つ以上の検索語情報が記録される。
検索実行単位情報には、検索集合ID(後述)、文章編集領域中の検索実行単位の開始位置と終了位置とが記録される。
検索語情報は、この検索実行単位の文字列に含まれる1つ以上の検索語(検索語抽出部130で抽出された単語)、この文字列中に出現した検索語の回数および検索語の重みとが少なくとも含まれる。
例えば、「本日は晴天なり。明日は本日よりも暑くなるでしょう。」という文字列が入力されていると、1つの検索実行単位(「本日は晴天なり。」)に対しては「本日」という単語はその出現回数が「1」、「晴天」の出現回数が「1」であり、次の検索実行単位(「明日は本日よりも暑くなるでしょう。」)に対しては、「本日」、「明日」と「暑く」の出現回数はそれぞれ「1」として検索語テーブルへ記録される。
文字入力部110で編集操作が入力されると、検索語抽出部130を起動して、編集操作された文字列に含まれる単語を抽出して検索語テーブル135を更新する。
例えば、単語が削除された場合には、削除された単語のあった検索実行単位の検索語テーブル135の該当する検索語の回数を1つ減らし、ゼロになった場合にはその検索語を検索語テーブル135から削除する。
例えば、上記例文において「本日は晴天なり」から「本日は」が削除されると、単語「本日」とが削除されるため、該当する検索実行単位に対して「本日」の回数が「0」、「晴天」の回数が「1」となるので、「本日」という検索語は削除される。
同様に、単語の挿入の場合には、単語が挿入された検索実行単位に検索語として追加する。このとき新規検索語であれば、回数を1とし、同じ単語の時には回数を1つ増加させて検索語テーブル135を更新する。他の置換、移動、複写等の編集操作に対しても、検索語テーブル135を同様に更新する。
この更新された検索実行単位の一つ前の検索実行単位の検索集合に対して、更新された検索実行単位以降の検索語により検索部140を起動して絞込み検索を実行させる。
検索部140は、検索語テーブル135を参照して、指定された検索実行単位に含まれる検索単語から検索式を生成して、最初の検索の時には文書データベース(DB)142を検索し、検索結果の文書IDのリストを検索集合144へ出力する。
また、検索部140は、2回目以降の検索の場合には、検索集合144を対象にして絞込み検索を行って、検索結果を検索集合144へ出力する。
この検索集合144には、検索実行単位ごとに識別可能なファイルへ書き出し、そのファイルのID(検索集合ID)を検索語テーブル135の該当領域へ記録しておく。
文書DB142は、例えば、図4に示すようなデータ構造をしている。同図において、1つの文書に対して、文書ID(識別子)、文書のタイトル、文書の登録日、文書の内容(または、文書の内容を格納するファイル名等でもよい)、文書の概要(文書の概要を格納するファイル名等でもよい)、この文書をアクセスしたユーザごとにユーザIDと最新アクセス日とアクセス回数とを記録している。
検索式は、指定された検索実行単位に属する検索語を「AND」で結合することによって生成する。
例えば、最初に「本日は晴天なり」が入力されると、検索語テーブル135には検索語として「本日」と「晴天」とが記録される。これにより検索式は「”本日”&”晴天”」が生成される。
文書DB142を検索対象として、この検索式に該当する文書を検索して、検索実行単位に割り当てられた検索集合IDの検索集合144へ検索結果を出力する。
次に、「明日は本日よりも暑くなるでしょう。」が入力されると、検索語テーブル135には検索語として「明日」、「本日」、「暑く」とが記録される。
この場合には、先に検索された検索集合144を対象として、検索式「”明日”&”本日”&”暑く”」で検索し、この検索実行単位に割り当てられた検索集合IDの検索集合144へ検索結果を出力する。
従って、このときの検索集合144には、検索式「”本日”&”晴天”&”明日”&”本日”&”暑く”」を文書DB142に適用したときの検索結果が記録された状態になっている。
また、ある検索実行単位で検索語が削除されたときには、この検索実行単位の1つ前の検索実行単位の検索集合に対して、今検索語が削除されたあとの残りの検索語で生成された検索式を適用して検索し直す。以降、最後(最新)の検索実行単位となるまで、検索をやり直す。
例えば、検索実行単位が4つあって、3番目の検索実行単位の検索語が削除された場合、3番目の検索実行単位の検索式を生成し直して、この検索式で2番目の検索実行単位の検索集合に適用して検索を実行する。この後、4番目の検索実行単位の検索式に対して、やり直した3番目の検索実行単位の検索集合を適用して検索をし直す。
上記の例文によって、検索語が削除された場合の検索の仕方を説明する。
上述したように、「明日は本日よりも暑くなるでしょう。」から「明日」が削除された場合は、検索式は「”本日”&”暑く”」となる。
従って、文書DB142を検索式「”本日”&”晴天”」で検索した結果の検索集合144に対して、検索式「”本日”&”暑く”」を適用して、文章「本日よりも暑くなるでしょう。」の検索結果を検索し直す。
検索部140は、一旦、検索集合144に記憶された検索結果を文書ごとに計算した得点の高い順に並び替えて検索集合144を更新する。1文書の得点は、例えば、各検索語について、文書に出現した検索語の回数に、検索語テーブル135の検索語(i)の出現回数(i)と重み(i)とを掛けた値を計算した総和の値とする。
得点=Σ「検索語iの数」×出現回数(i)×重み(i) …(式1)
ここでiは、検索実行単位内に含まれる検索語の語数である。
また、この検索の直前に入力した単語については、重みを更に増すようにしてもよい。
さらに、最近アクセスしたものを優先的に表示したり、アクセス頻度の高いものを優先して表示するために、登録日やユーザごとの最新アクセス日やアクセス頻度によって定まるアクセス頻度係数を加味するようにしてもよい。
得点=Σ「検索語iの数」×出現回数(i)×重み(i)+アクセス頻度係数 …(式2)
ここでiは、検索実行単位内に含まれる検索語の語数である。
結果表示部150は、検索集合144に記憶された検索結果を表示装置の結果表示窓に表示する。
図5は、表示装置に表示された入力窓と結果表示窓の概念図である。入力窓は、文章の入力および編集を行う領域であり文字入力部110で使用される。
結果表示窓は、得点の高い順に文書を縮小画像(サムネイル画像)として表示し、表示するサムネイル画像の個数が多すぎるときにはスクロールバーを移動させることで全体を表示することができる。
このサムネイル画像は、文書中の検索語が含まれているページが特定できるときには、そのページをビットマップ変換して縮小した画像として得る。そのようなページが特定できないときには、先頭のページを用いてサムネイル画像を得る。
また、ユーザが入力窓に入力を始めた当初は検索語が少ないので、検索結果が多数となり表示時間がかかり、また、検索結果を表示してもあまり意味がないので、検索結果の件数が所定の件数(これはユーザが予め指定してもよいし、結果を表示する窓サイズに応じて変更しても構わない)に達するまでは、図6(A)に示すように検索結果の件数のみを表示させるようにしてもよい。
所定件数以上になった場合に、個々の文書のファイル名やタイトルのリストを表示し、さらに所定の数より少なくなった場合に、サムネイル画像のみ(図6(C))、またはサムネイル画像と文書の概要(図6(D))などを表示するように、検索結果の件数に応じて自動的に表示方法を切り替えるようにしてもよい。
また、上述のようなサムネイル画像ではなく、類似している画像の場合には代表のみを表示して、限られた結果表示領域を有効に使うようにしてもよい。代表のみを表示する場合には、代表を表示していることをユーザが識別可能なように、アイコンの形式を変更して表示してもよい。
類似の判断は、検索結果のページをビットマップ画像として変換を行い、1ページの画像データを重ね合わせ、画像の各画素の差分の絶対値の和をとり、この差分が所定の値よりも小さい場合に「類似している」と判断する。
さらに、上述のようにして検索された検索結果を表示した場合に、文書の内容を表示したい場合がある。このような場合には、図7に示すように、検索結果を表示する結果表示窓1と文書の内容を表示する結果表示窓2を設けるようにする。
結果表示窓1に表示されたサムネイル画像やタイトル等のリストから所望のものを選択して、選択された文書の内容の表示を要求すると、内容表示指定部210では選択されたサムネイル画像に対応する文書の文書IDを内容抽出部180へ送る。
内容抽出部180は、受信した文書IDの文書の内容を文書DB142から取り出して、内容表示部220へ渡す。
内容表示部220は、受け取った文書の内容を結果表示窓2へ表示する。
文書入力部170は、ユーザから指定された文書(例えば、文書DBや他の記録媒体に記憶された作成済みの文書や作成途中の文書)の内容を読み込んで文章編集領域へ書き込む。この書き込んだ文章編集領域の文章の取り扱いについて、次の2つの方式があり、ユーザが予め指定しておく。
(1)全部読み込んだ後に、文章編集領域の文字列に対して、判定部120で判定しながら検索語抽出と検索を実行し、すべての検索が終了後に、その最後の検索集合の検索結果を表示した後、文字入力部110から文字列の入力を許す方式。
(2)新しく入力または編集された文字列に対してのみ本装置を適用し、本装置の終了時に編集領域を保存するときに、指定された文書へ文章編集領域の内容を追加して書き出すようにした方式。
次に、図8のフローチャートを用いて、本発明の実施形態に係る電子ファイル検索装置の処理手順を説明する。
ユーザは、キーボードやマウス等の入力装置を利用して液晶ディスプレイ等の表示装置上の入力窓(図5参照)に文章を入力し、文書の編集操作(例えば、挿入、置換、削除、移動や複写等)を実行する。このとき、入力された文字列は文章編集領域に記録され、この領域で編集がなされる(ステップS10)。
また、文書DBや他の記録媒体に記録された作成済みの文書や作成途中の文書を利用する場合には、指定された文書の内容を読み込んで文章編集領域へ書き込んでおく。
この際、全部読み込んだ文字列に対して、検索語を抽出して検索する方式と、新しく入力または編集された文字列に対してのみ本装置を適用する方式とがある。
入力された文字が、例えば、句読点、改行、改ページであるか、また、漢字から平仮名に変わったか、あるいは、前回の検索から所定の時間を過ぎているかを判定する、これらに該当しなければ(ステップS11のNO)、次の文字の入力を行わせる。また、いずれかの条件に合致した場合には(ステップS11のYES)、入力された文字列に対して形態素解析を行って検索語を抽出し、この検索語の出現回数や重みを検索語テーブル135へ記録する(ステップS12)。
また、編集操作が入力されたときには、編集操作された文字列に含まれる単語を抽出して検索語テーブル135を更新する。
最初の検索かまたは2回目以降の検索かを調べ、最初の検索の場合には(ステップS13のNO)、現在の検索実行単位に属する検索語を「AND」で接続することによって生成する検索式で文書DB142を検索し、検索結果の文書IDのリストを検索集合144へ出力する(ステップS14)。このとき、検索集合144には、検索実行単位ごとに識別可能なID(検索集合ID)を振り、検索語テーブル135の該当領域へ記録しておく。
または、2回目以降の検索の場合には(ステップS13のYES)、検索集合144を対象にして絞込み検索を行って、検索結果を検索集合144へ出力する(ステップS15)。
検索結果の文書ごとに計算した得点の高い順に並び替える(ステップS16)。
この文書の得点は、例えば、文書に出現した検索語の回数や検索語テーブル135に記憶された出現回数と重み、また、登録日やユーザごとの最新アクセス日やアクセス頻度等によって重み付けして計算される。
検索結果を表示装置の結果表示窓に表示する(ステップS17)。
結果表示窓には、検索結果が多数の場合には検索結果の件数のみを表示させ、所定件数以下の場合には得点の高い順に、文書のファイル名やタイトルのリスト、文書のサムネイル画像、サムネイル画像と文書の概要、類似しているサムネイル画像の場合には代表のみを検索結果の件数に応じて自動的に表示方法を切り替えて表示する。
さらに、上述のようにして検索された検索結果から所望の文書を指定して、文書の内容を表示する。
ユーザが文書の入力や編集を終了した場合には(ステップS18のYES)、本装置の処理を終了し、終了していない場合にはステップS10へ戻って文字列の入力や編集操作を行う。
上述した実施形態の電子ファイル検索装置では、単一の装置で実現するものとして説明したが、文字列の入力・編集を端末で行って、入力された文字列に対する関連文書の検索を電子ファイル検索サーバで行い、検索結果を端末で表示させるようにして、電子ファイル検索システムとして構成することもできる。この場合、電子ファイル検索サーバに対して任意台数の端末を通信ネットワークで接続するようにしてもよい。
図9は、本発明の実施形態に係る電子ファイル検索システムの機能構成を示すブロック図であり、図1と同じ機能の部分については同じ符号を付し、相違点のみ説明する。
同図において、電子ファイル検索サーバ10は、文字入力部110、判定部120、判定条件125、検索語抽出部130、検索語テーブル135、検索部140、文書データベース(DB)142、検索集合144、条件設定部160、文書入力部170、内容抽出部180からなる。
また、端末20は、文書指定部230、条件入力部240、文書編集部250、結果表示部150、内容表示指定部210、内容表示部220からなっている。
端末20の文書指定部230では、文書DB142または既存の文書の一覧等を表示させて、編集したい文書の文書IDを指定して、指定された文書IDを電子ファイル検索サーバ10の文書入力部170へ送信し、文書入力部170では受信した文書IDの文書の内容を文書編集領域へ読み込む。
また、文書の文字列の入力や編集操作を端末20の文書編集部250で入力して、入力した文字列や編集操作を電子ファイル検索サーバ10の文字入力部110へ送信し、文字入力部110は受信した文字列や編集操作に従って文書編集領域へ記憶させる。
検索を実行する条件を端末20の条件入力部240で入力し、この入力された条件を電子ファイル検索サーバ10の条件設定部160へ送信し、条件設定部160では受信した条件を判定条件125へ記憶させる。
電子ファイル検索サーバ10の検索部140で検索された結果を端末20の結果表示部150へ送信し、結果表示部150では受信した検索結果を結果表示窓へ表示させる。
通信ネットワーク30は、電子ファイル検索サーバ10および端末20間を結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけではなく、それらの間の通信プロトコルが一致するものであれば有線または無線のいずれでもよく、例えば、公衆回線や専用回線等によるLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどを用いることができる。
実施形態を以上のように構成することによって、ユーザが予め設定して条件になったときに、入力中の文章から検索語を自動的に抽出して検索実行することで、既存の文書の中から入力中の文章に関連した文書を自動的に表示してくれるため、わざわざ検索式を考えて検索実行を行う手間が省けるので、文書作成や文書編集の作業向上につながる。
さらに、上述した実施形態の端末の各機能、電子ファイル検索サーバの各機能および電子ファイル検索装置の各機能をそれぞれプログラム化し、予めCD−ROM等の記録媒体に書き込んでおき、端末、電子ファイル検索サーバおよび電子ファイル検索装置の記録媒体読取装置にこの記録媒体を装着して、これらのプログラムをCPUで実行することによって、本発明の目的が達成される。
この場合、記録媒体から読出されたプログラム自体が上述した実施形態を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
あるいは、インターネット等の通信ネットワークを介して記憶装置に格納されたプログラムをサーバコンピュータから直接供給を受けるようにしてもよい。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することによって上述した実施形態の機能が実現される場合も含まれる。
このように上述した実施形態の機能をプログラム化して流通させることによって、コスト、可搬性、汎用性を向上させることができる。
さらに、上述した電子ファイル検索サーバの各機能をプログラム化して、サーバコンピュータの磁気ディスク等の記憶装置に格納しておき、インターネット等の通信ネットワークで接続されたユーザのコンピュータから実行指示を受信して、当該プログラムを実行し、その結果をユーザのコンピュータへ返信するようなASP(application service provider)による利用を提供する場合、このサーバコンピュータの記憶装置およびそのプログラムも本発明に含まれる。
本発明の実施形態に係る電子ファイル検索装置の機能構成を示すブロック図である。 文章編集領域とポインタの関係の説明図である。 検索語テーブルのデータ構造例である。 文書データベースのデータ構造例である。 表示装置に表示された入力窓と結果表示窓の概念図である。 検索結果の表示例である。 検索結果の他の表示例である。 本発明の実施形態に係る電子ファイル検索装置の処理手順を示すフローチャートである。 本発明の実施形態に係る電子ファイル検索システムの機能構成を示すブロック図である。
符号の説明
10…電子ファイル検索サーバ、20…端末、30…通信ネットワーク、110…文字入力部、120…判定部、125…判定条件、130…検索語抽出部、135…検索語テーブル、140…検索部、142…文書DB、144…検索集合、150…結果表示部、160…条件設定部、170…文書入力部、180…内容抽出部、210…内容表示指定部、220…内容表示部、230…文書指定部、240…条件入力部、250…文書編集部。

Claims (9)

  1. 文書の作成または編集のための文字列や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて文書データベースを検索する検索部と、前記検索部で検索された検索結果を表示する結果表示部とを有し、条件に合致した文字が入力されると、前回の検索以降に入力された文字列に対して検索語を抽出し、この検索語を用いて検索して検索結果を表示することを、新たに文字が入力されなくなるまで繰り返すようにしたことを特徴とする電子ファイル検索装置。
  2. 請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で入力された文書内容の文字列から抽出された検索語を用いて文書データベースを検索し、文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする電子ファイル検索装置。
  3. 請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする電子ファイル検索装置。
  4. 請求項1、2または3に記載の電子ファイル検索装置において、前記検索部は、2回目以降の検索実行の場合には、前回の検索結果を対象にして絞り込み検索を行うことを特徴とする電子ファイル検索装置。
  5. 請求項1乃至4のいずれかに記載の電子ファイル検索装置において、前記結果表示部は、検索結果の文書を縮小画像形式で表示することを特徴とする電子ファイル検索装置。
  6. 任意台数の端末と電子ファイル検索サーバとを通信ネットワークで接続した電子ファイル検索システムにおいて、
    前記端末は、文書の作成または編集のための文字列や編集操作を入力して、前記電子ファイル検索サーバへ送信する文書編集部と、前記電子ファイル検索サーバから検索結果を受信して表示する結果表示部とを有し、
    前記電子ファイル検索サーバは、前記端末から受信した文字や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて、最初の検索の場合には文書データベースを検索対象として検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、検索結果を前記端末へ返信する検索部とを有することを特徴とする電子ファイル検索システム。
  7. 文書の作成または編集のための文字列や編集操作を入力し、入力された文字が予め指定された条件を満たすか否かを逐次的に判定し、条件を満たすと判定された場合には入力された文字列から検索語を抽出した後、最初の検索の場合には抽出された検索語を用いて文書データベースを対象にして検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、新たに文字が入力されなくなるまで、検索と検索結果の表示を繰り返すようにしたことを特徴とする電子ファイル検索方法。
  8. コンピュータに、請求項1乃至5のいずれかに記載の電子ファイル検索装置の機能、または、請求項6に記載の電子ファイル検索システムの機能を実行させるためのプログラム。
  9. 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003413562A 2003-12-11 2003-12-11 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体 Pending JP2005173999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003413562A JP2005173999A (ja) 2003-12-11 2003-12-11 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003413562A JP2005173999A (ja) 2003-12-11 2003-12-11 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2005173999A true JP2005173999A (ja) 2005-06-30

Family

ID=34733670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003413562A Pending JP2005173999A (ja) 2003-12-11 2003-12-11 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2005173999A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174593A (ja) * 2005-12-26 2007-07-05 Fuji Xerox Co Ltd 画像表示装置
JP2009267526A (ja) * 2008-04-22 2009-11-12 Sharp Corp 大量のコンテンツの一覧表示方法及び一覧表示装置
WO2012132278A1 (ja) * 2011-03-29 2012-10-04 パナソニック株式会社 情報端末装置、情報検索方法、情報検索プログラム
JP2014182416A (ja) * 2013-03-18 2014-09-29 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2017041133A (ja) * 2015-08-20 2017-02-23 キヤノン株式会社 情報処理装置、コンピュータプログラム、および情報処理方法
JP2017138998A (ja) * 2017-03-15 2017-08-10 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2019053747A (ja) * 2018-10-30 2019-04-04 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2019121392A (ja) * 2018-01-05 2019-07-22 Jfeスチール株式会社 情報検索システム
JP2020154858A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131974A (ja) * 1989-10-18 1991-06-05 Hitachi Ltd データ検索方式
JPH0528190A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 情報検索用端末装置
JPH05290089A (ja) * 1992-04-14 1993-11-05 Hitachi Ltd 文書画像表示方式
JPH06314297A (ja) * 1993-04-30 1994-11-08 Omron Corp 文書処理装置および方法,ならびにデータ・ベース検索装置および方法
JPH07134720A (ja) * 1993-09-17 1995-05-23 Nec Corp 文章作成システムにおける関連情報提示方法及び装置
JPH09153031A (ja) * 1995-11-29 1997-06-10 Toshiba Corp 文章作成支援装置及び文章作成支援方法
JPH1145255A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11504450A (ja) * 1995-04-27 1999-04-20 マイケル アメン アンド カンパニー インコーポレイテッド 薬剤文書作成システム
JP2001325299A (ja) * 2000-05-16 2001-11-22 Komakkusu:Kk データ検索装置およびデータ検索方法ならびに情報記録媒体
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131974A (ja) * 1989-10-18 1991-06-05 Hitachi Ltd データ検索方式
JPH0528190A (ja) * 1991-07-19 1993-02-05 Hitachi Ltd 情報検索用端末装置
JPH05290089A (ja) * 1992-04-14 1993-11-05 Hitachi Ltd 文書画像表示方式
JPH06314297A (ja) * 1993-04-30 1994-11-08 Omron Corp 文書処理装置および方法,ならびにデータ・ベース検索装置および方法
JPH07134720A (ja) * 1993-09-17 1995-05-23 Nec Corp 文章作成システムにおける関連情報提示方法及び装置
JPH11504450A (ja) * 1995-04-27 1999-04-20 マイケル アメン アンド カンパニー インコーポレイテッド 薬剤文書作成システム
JPH09153031A (ja) * 1995-11-29 1997-06-10 Toshiba Corp 文章作成支援装置及び文章作成支援方法
JPH1145255A (ja) * 1997-07-25 1999-02-16 Just Syst Corp 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001325299A (ja) * 2000-05-16 2001-11-22 Komakkusu:Kk データ検索装置およびデータ検索方法ならびに情報記録媒体
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174593A (ja) * 2005-12-26 2007-07-05 Fuji Xerox Co Ltd 画像表示装置
JP4631699B2 (ja) * 2005-12-26 2011-02-16 富士ゼロックス株式会社 画像表示装置
JP2009267526A (ja) * 2008-04-22 2009-11-12 Sharp Corp 大量のコンテンツの一覧表示方法及び一覧表示装置
WO2012132278A1 (ja) * 2011-03-29 2012-10-04 パナソニック株式会社 情報端末装置、情報検索方法、情報検索プログラム
JP2014182416A (ja) * 2013-03-18 2014-09-29 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2017041133A (ja) * 2015-08-20 2017-02-23 キヤノン株式会社 情報処理装置、コンピュータプログラム、および情報処理方法
JP2017138998A (ja) * 2017-03-15 2017-08-10 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2019121392A (ja) * 2018-01-05 2019-07-22 Jfeスチール株式会社 情報検索システム
JP2019053747A (ja) * 2018-10-30 2019-04-04 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム
JP2020154858A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ

Similar Documents

Publication Publication Date Title
US9411788B2 (en) Methods and apparatus for improved navigation among controlled terms in one or more user documents
US5140522A (en) Method and apparatus for machine translation utilizing previously translated documents
US20110252062A1 (en) Electronic device for searching for entry word in dictionary data, control method thereof and program product
JP2007299422A (ja) 情報処理装置および文書の探索方法
JP2001344276A (ja) 文書検索方法および装置並びにその処理プログラムを記録した記録媒体
JPH04229364A (ja) 強調特性変更方法及びシステム
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH06259420A (ja) 文章編集支援装置
JP2005107931A (ja) 画像検索装置
JPH0877196A (ja) 文書情報抽出装置
JP4301879B2 (ja) 抄録作成支援システム及び特許文献検索システム
JP5152857B2 (ja) 電子機器、表示制御方法、およびプログラム
JP5016333B2 (ja) 文書作成支援装置及び文書作成支援プログラム
JP2009123067A (ja) 用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体
JPH07325826A (ja) 日本語処理システム
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP3734101B2 (ja) ハイパーメディア構築支援装置
JP3712320B2 (ja) 可変文書作成システム、可変文書出力装置及び可変原稿作成装置
Adar et al. On-the-fly Hyperlink Creation for Page Images.
JP2001265780A (ja) 電子装置及び記録媒体
JP3537260B2 (ja) リンク付文書検索表示システム
JP2005327023A (ja) ヒット数予想を利用した全文検索の検索方式
JPH1011424A (ja) 文章作成支援装置
JP2002140345A (ja) 部品説明書の作成支援方法
JPH10312387A (ja) 情報処理装置及び方法並びに情報処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060919

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100622