JP5371656B2 - ファイル検索システム - Google Patents
ファイル検索システム Download PDFInfo
- Publication number
- JP5371656B2 JP5371656B2 JP2009218572A JP2009218572A JP5371656B2 JP 5371656 B2 JP5371656 B2 JP 5371656B2 JP 2009218572 A JP2009218572 A JP 2009218572A JP 2009218572 A JP2009218572 A JP 2009218572A JP 5371656 B2 JP5371656 B2 JP 5371656B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- file
- index data
- server
- servers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000009193 crawling Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施の形態に係るファイル検索システムの概念構成例を示す。図1に示すファイル検索システムは、ファイルシステム群11、ホストシステム12、検索サーバ13a、13b、13n、検索要求装置14で構成されている。
以下、ファイル検索システムで実行される処理動作の内容を説明する。
図3に、インデックスデータ133a、133b、133nを作成されるまでの処理動作を示す。まず、ホストシステム12のファイル収集部121が、ファイルシステム群11をクローリングし、入力ファイルの情報を収集する(ステップ31)。ファイル収集部121は、入力ファイルの文書名、容量、コンテンツ、更新日等のファイル情報のうち更新日属性を取得し、ディスパッチテーブル122に登録されている更新日21と照合する。
図4に、更新日と検索サーバの割り当て関係を事後的に変更することにより、検索サーバ間でインデックスデータの使用領域の均一化を実現する処理動作を説明する。なお、図4に示す処理動作は、図3に示す処理動作の実行前に定期的に実施される。
図6に、ファイル検索システムに新たな検索サーバを追加する際の処理動作を示す。この場合、ホストシステム12に、新しい検索サーバの検索サーバ名22と接続情報が登録される(ステップ51)。この登録により、ファイルシステム群11の次回クローリング時(図3の場合だけでなく、図4に示す場合も含む。)、新たに追加された検索サーバが更新日に対する割り当て候補に追加される(ステップ52)。追加直後は、この新たに追加された検索サーバにおけるインデックスデータの使用領域が一般に最小となる。従って、図3に示す処理動作の実行時にも図4に示す処理動作の実行時にも、新たな更新日に対する割り当て先も検索サーバ間における更新日の割り当て変更時にも、優先的に新たに追加された検索サーバにシステム内のインデックスデータが割り当てられる。
前述したように、実施の形態に係るファイル検索システムは、複数の検索サーバ13a、13b、13nを使用して、ファイルシステム群11に格納された全ファイルのインデックスデータを分散的に管理する。このインデックデータの分散を実現する仕組みとして、ホストシステム12内に、更新日と検索サーバとの対応関係を一意に特定するデータベース(ディスパッチテーブル122)を用意する。
Claims (3)
- 複数の検索サーバを使用してファイルのインデックスデータを管理するファイル検索システムにおいて、
ファイルに付属する期間情報とインデックスデータを作成する検索サーバとの対応関係を一意に特定するテーブルと、
データベースに新たな対応関係を登録する場合、前記複数の検索サーバのそれぞれからインデックスデータの使用領域を取得する処理と、取得された使用領域が最も小さい検索サーバを検出する処理と、検出された検索サーバを新たに登録する期間情報に割り付ける処理とを実行するテーブル管理部と
を有することを特徴とするファイル検索システム。 - 請求項1に記載のファイル検索システムにおいて、
前記テーブル管理部は、
前記複数の検索サーバのそれぞれから取得したインデックスデータの使用領域について最大値と最小値を検出する処理と、検出された最大値と最小値の差が閾値を越えるか否かを判定する処理と、前記差が閾値を越える場合、前記最大値に対応する検索サーバに割り付けられた期間情報の一部を、前記最小値に対応する検索サーバへの割付に変更する処理と
を更に有することを特徴とするファイル検索システム。 - 請求項2に記載のファイル検索システムにおいて、
割り付けを変更する一部の前記期間情報は、期間情報に対応するインデックスデータの
使用領域が大きいものが優先的に選択される
ことを特徴とするファイル検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218572A JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009218572A JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011070257A JP2011070257A (ja) | 2011-04-07 |
JP5371656B2 true JP5371656B2 (ja) | 2013-12-18 |
Family
ID=44015511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009218572A Expired - Fee Related JP5371656B2 (ja) | 2009-09-24 | 2009-09-24 | ファイル検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5371656B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5798503B2 (ja) * | 2012-01-31 | 2015-10-21 | 株式会社日立ソリューションズ | ファイルリスト生成方法及びシステム、ファイルリスト生成装置並びにプログラム |
JP5759915B2 (ja) * | 2012-02-15 | 2015-08-05 | 株式会社日立ソリューションズ | ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置 |
US8949244B2 (en) * | 2012-05-30 | 2015-02-03 | SkyChron Inc. | Using chronology as the primary system interface for files, their related meta-data, and their related files |
KR101744892B1 (ko) * | 2016-03-17 | 2017-06-09 | 주식회사 젠시스템즈 | 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법 |
KR102089348B1 (ko) * | 2019-01-28 | 2020-03-16 | 주식회사 와이즈넛 | 분산 데이터 저장 장치 기반 검색 엔진 시스템 및 검색 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266351B2 (ja) * | 1993-01-20 | 2002-03-18 | 株式会社日立製作所 | データベース管理システムおよび問合せの処理方法 |
JP2003006007A (ja) * | 2001-06-20 | 2003-01-10 | Nec Soft Ltd | 時系列データ自動管理方式 |
JP2003091515A (ja) * | 2001-09-19 | 2003-03-28 | Hitachi Software Eng Co Ltd | 帳票データの負荷分散型処理システム |
JP5105894B2 (ja) * | 2006-03-14 | 2012-12-26 | キヤノン株式会社 | 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体 |
JP5046873B2 (ja) * | 2007-11-14 | 2012-10-10 | エヌ・ティ・ティ レゾナント株式会社 | 情報検索装置およびその方法 |
JP2009211403A (ja) * | 2008-03-04 | 2009-09-17 | Hitachi Software Eng Co Ltd | ファイル検索プログラム |
-
2009
- 2009-09-24 JP JP2009218572A patent/JP5371656B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011070257A (ja) | 2011-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6962971B2 (ja) | データ記憶サービスを実装するシステム及び方法 | |
US10581957B2 (en) | Multi-level data staging for low latency data access | |
AU2014346369B2 (en) | Managed service for acquisition, storage and consumption of large-scale data streams | |
AU2014212780B2 (en) | Data stream splitting for low-latency data access | |
US8543596B1 (en) | Assigning blocks of a file of a distributed file system to processing units of a parallel database management system | |
US10394782B2 (en) | Chord distributed hash table-based map-reduce system and method | |
US9519687B2 (en) | Minimizing index maintenance costs for database storage regions using hybrid zone maps and indices | |
CN103902386B (zh) | 一种基于连接代理优化管理的多线程网络爬虫处理方法 | |
AU2018202230A1 (en) | Client-configurable security options for data streams | |
US8918372B1 (en) | Content-aware distributed deduplicating storage system based on consistent hashing | |
US8965941B2 (en) | File list generation method, system, and program, and file list generation device | |
JP6534402B2 (ja) | データ品質例外を処理するための方法、コンピュータ・プログラム、および例外エンジン | |
US8738625B2 (en) | Log management system and program | |
JP6281225B2 (ja) | 情報処理装置 | |
AU2014346366A1 (en) | Partition-based data stream processing framework | |
KR20080014800A (ko) | 시간 제한적 메시지들의 효율적인 처리 방법 | |
JP5371656B2 (ja) | ファイル検索システム | |
CN102104617A (zh) | 一种网站运营系统存储海量图片数据的方法 | |
JP2017220112A (ja) | データ管理システム、制御方法、およびプログラム | |
US11308066B1 (en) | Optimized database partitioning | |
US20130046798A1 (en) | Method and apparatus for visualization of infrastructure using a non-relational graph data store | |
US11531642B2 (en) | Synchronous object placement for information lifecycle management | |
KR101744892B1 (ko) | 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법 | |
US20180260463A1 (en) | Computer system and method of assigning processing | |
US20220342888A1 (en) | Object tagging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5371656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |