JP5505207B2 - 情報検索装置、情報検索方法及び情報検索プログラム - Google Patents
情報検索装置、情報検索方法及び情報検索プログラム Download PDFInfo
- Publication number
- JP5505207B2 JP5505207B2 JP2010194819A JP2010194819A JP5505207B2 JP 5505207 B2 JP5505207 B2 JP 5505207B2 JP 2010194819 A JP2010194819 A JP 2010194819A JP 2010194819 A JP2010194819 A JP 2010194819A JP 5505207 B2 JP5505207 B2 JP 5505207B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- index
- documents
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本実施の形態に係る情報検索システム例を示す図である。図1に示すように、本実施形態に係る情報検索システムは、情報検索装置1、クライアント装置2及び検索対象情報データベース(DB)150を含む。クライアント装置2は、PC(Personal Computer)等の一般的な情報処理装置によって構成される。情報検索装置1は、ネットワークを介してクライアント装置2と接続されており、クライアント装置2からの検索要求を受けて検索対象情報DB200に格納されている文書情報を検索するサーバとして運用される。
さてここで、まず従来の全文索引の構成及び動作について説明してから、その後本実施形態に係る全文及び非全文の複合索引の構成及び動作を説明する。なおシステム構成については、従来例においても上述と概ね同等の構成でよい。但し索引DB140の索引情報(索引データ)及び検索部120による索引情報を利用した検索動作の点では差異がある。
さて次に、実施形態1に係る全文及び非全文の複合索引の構成及び動作を説明する。
続いて、実施形態2に係る全文及び非全文の複合索引の構成及び動作を説明する。
以上本実施形態に係る情報検索装置1は、索引語毎に各文書との適合度を算出するに際し、単語頻度(tf)、文書頻度(df)、文書格納数(N)、文書長(len)、平均文書長(aveLen)などの値が必要であるが、このうち文書頻度、平均文書長及び文書格納数の値には、非全文条件である分類コードによって限定された文書の母集団に基づく絞り込み文書頻度、絞り込み平均文書長及び絞り込み文書格納数を複合索引から取得して用いるため、適合度を高いものとすることができる。そしてここで本実施形態に係る複合索引は、上述のような索引構造を有するため、絞り込み文書頻度(df)や絞り込み平均文書長(aveLen)、絞り込み文書格納数(N)は予め複合索引に登録しておくことが可能であり、情報検索装置1が検索を行なうとき、単にこれら値は取得されればよいので(特段の計算等は不要)、検索速度の向上を図ることができる。
2 クライアント装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 バス
110 条件入力部
120 検索部
130 検索結果出力部
140 索引DB
200 検索対象情報DB
Claims (5)
- 複数の検索対象の文書を表示する順序を指定された検索条件に対する適合度に基づいて決定する情報検索装置であって、
1以上の検索語と、前記複数の検索対象の文書のうち前記順序の決定を行う対象となる検索対象文書の母集団を限定する分類キーとを含む検索条件を入力する検索条件入力手段と、
前記分類キー毎に前記検索対象の文書の母集団が対応付けられるとともに、前記母集団内の文書格納数値と、前記母集団内の文書の平均文書長値と、前記複数の検索対象の文書内のワード毎に当該ワードを含む前記母集団内の文書数である文書頻度値とが少なくとも算出され格納された索引情報を記憶した記憶手段と、
前記検索条件が入力されたとき、入力分類キーに対応付けされた前記母集団内の文書の文書格納数値及び平均文書長値と、入力分類キーに対応付けられた前記母集団内の文書のうち、入力検索語と一致するワードを含む当該母集団内の文書数である文書頻度値とを前記記憶手段の検索情報から取得し、取得された文書格納数値、平均文書長値、及び文書頻度値を含む適合度を算出するためのパラメータ値に基づいて当該母集団内の文書毎の適合度を算出することにより、文書を検索する検索手段と、
検索された文書に適合度を付して検索結果として出力する検索結果出力手段と、
を有することを特徴とする情報検索装置。 - 前記記憶手段の索引情報は、前記分類キー毎に前記ワードが対応付けされて索引が作成され、
前記検索手段は、入力分類キー、入力検索語の順で前記索引を辿ることにより前記文書頻度値が取得されること、
を特徴とする請求項1記載の情報検索装置。 - 前記記憶手段の索引情報は、前記ワード毎に前記分類キーが対応付けされて索引が作成され、
前記検索手段は、入力検索語、入力分類キーの順で前記索引を辿ることにより前記文書頻度値が取得されること、
を特徴とする請求項1記載の情報検索装置。 - 複数の検索対象の文書を表示する順序を指定された検索条件に対する適合度に基づいて決定する情報検索装置における情報検索方法であって、
前記複数の検索対象の文書のうち前記順序の決定を行う対象となる検索対象文書の母集団を限定する分類キー毎に前記検索対象の文書の母集団が対応付けられるとともに、前記母集団内の文書格納数値と、前記母集団内の文書の平均文書長値と、前記複数の検索対象の文書内のワード毎に当該ワードを含む前記母集団内の文書数である文書頻度値とが少なくとも算出され格納された索引情報を記憶する記憶手順と、
1以上の検索語と、前記分類キーとを含む検索条件を入力する検索条件入力手順と、
前記検索条件が入力されたとき、入力分類キーに対応付けされた前記母集団内の文書の文書格納数値及び平均文書長値と、入力分類キーに対応付けられた前記母集団内の文書のうち、入力検索語と一致するワードを含む当該母集団内の文書数である文書頻度値とを前記記憶手段の検索情報から取得し、取得された文書格納数値、平均文書長値、及び文書頻度値を含む適合度を算出するためのパラメータ値に基づいて当該母集団内の文書毎の適合度を算出することにより、文書を検索する検索手順と、
検索された文書に適合度を付して検索結果として出力する検索結果出力手順と、
を有することを特徴とする情報検索方法。 - 請求項4記載の情報検索方法をコンピュータに実行させるための情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010194819A JP5505207B2 (ja) | 2010-08-31 | 2010-08-31 | 情報検索装置、情報検索方法及び情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010194819A JP5505207B2 (ja) | 2010-08-31 | 2010-08-31 | 情報検索装置、情報検索方法及び情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012053605A JP2012053605A (ja) | 2012-03-15 |
JP5505207B2 true JP5505207B2 (ja) | 2014-05-28 |
Family
ID=45906865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010194819A Expired - Fee Related JP5505207B2 (ja) | 2010-08-31 | 2010-08-31 | 情報検索装置、情報検索方法及び情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5505207B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6034584B2 (ja) * | 2012-03-30 | 2016-11-30 | 株式会社アイ・アール・ディー | 特許調査支援装置、特許調査支援方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10320403A (ja) * | 1997-05-14 | 1998-12-04 | N T T Data:Kk | 検索式作成方法、検索式作成装置、及び記録媒体 |
JP4008551B2 (ja) * | 1997-11-07 | 2007-11-14 | 富士通株式会社 | キーワード重み生成装置、キーワード重み生成方法及びコンピュータ読み取り可能な記録媒体 |
JP4510483B2 (ja) * | 2004-02-23 | 2010-07-21 | 株式会社エヌ・ティ・ティ・データ | 情報検索装置 |
JP3889010B2 (ja) * | 2004-03-19 | 2007-03-07 | 沖電気工業株式会社 | 語句分類システム、語句分類方法、および語句分類プログラム |
JP2007164583A (ja) * | 2005-12-15 | 2007-06-28 | Oki Electric Ind Co Ltd | 判定装置,判定方法および判定プログラム |
JP2009271659A (ja) * | 2008-05-02 | 2009-11-19 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体 |
-
2010
- 2010-08-31 JP JP2010194819A patent/JP5505207B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012053605A (ja) | 2012-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5550669B2 (ja) | 検索装置、検索方法およびプログラム | |
US20080021891A1 (en) | Searching a document using relevance feedback | |
JP2009525520A (ja) | 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン | |
JP2009003541A (ja) | データベースのインデックス作成システム、方法及びプログラム | |
JP2004213675A (ja) | 構造化ドキュメントの検索 | |
CN111400323A (zh) | 数据检索方法、系统、设备及存储介质 | |
JP4237813B2 (ja) | 構造化文書管理システム | |
JP5324677B2 (ja) | 類似文書検索支援装置及び類似文書検索支援プログラム | |
JP2008083769A (ja) | 文書検索装置および文書検索方法 | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
JP2011100208A (ja) | 行動推定装置、行動推定方法および行動推定プログラム | |
JP5505207B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
WO2017134760A1 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
US20170075989A1 (en) | Search method | |
KR100906809B1 (ko) | 키워드 검색 방법 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2012027841A (ja) | 検索プログラム、検索装置、検索システム、検索方法及び記録媒体 | |
JPH1011469A (ja) | 多段表処理方式 | |
JP2008234204A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP7639730B2 (ja) | 検索方法 | |
JP2002117043A (ja) | 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体 | |
KR100645711B1 (ko) | 다수의 정보 블록으로 구분된 웹 페이지를 이용한 정보검색 서비스 제공 서버, 방법 및 시스템 | |
JP2010501927A (ja) | コンテンツ検索システムを搭載した情報端末機 | |
JP2007026116A (ja) | 概念検索システム及び概念検索方法 | |
KR20240100971A (ko) | 줌인/줌아웃 검색 기능을 가지는 고차원 데이터 색인 구조의 생성 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140303 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5505207 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |