[go: up one dir, main page]

JP2008181213A - 情報管理システム、情報管理装置およびプログラム - Google Patents

情報管理システム、情報管理装置およびプログラム Download PDF

Info

Publication number
JP2008181213A
JP2008181213A JP2007012766A JP2007012766A JP2008181213A JP 2008181213 A JP2008181213 A JP 2008181213A JP 2007012766 A JP2007012766 A JP 2007012766A JP 2007012766 A JP2007012766 A JP 2007012766A JP 2008181213 A JP2008181213 A JP 2008181213A
Authority
JP
Japan
Prior art keywords
electronic information
information
divided
calculation
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007012766A
Other languages
English (en)
Inventor
Yoshihiro Masuda
佳弘 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2007012766A priority Critical patent/JP2008181213A/ja
Publication of JP2008181213A publication Critical patent/JP2008181213A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
情報の高い安全性を確保するとともに情報参照における機能性を考慮した保存を可能にした情報管理システム、情報管理装置およびプログラムを提供する。
【解決手段】
ディジタルコンテンツを設定した重要度に応じて分割し、分割後のコンテンツ断片にハッシュ関数を適用することで算出したハッシュ値であるコンテンツ断片IDを、クライアントPCの識別情報に前記ハッシュ関数を適用して算出したピアIDによって構成されるハッシュ空間上に写像することでそのコンテンツ断片を分散管理するクライアントPCを決定する。
【選択図】図1

Description

本発明は、情報管理システム、情報管理装置およびプログラムに関する。
会計監査の透明化と企業コンプライアンスの強化を目的とする日本版企業改革法(通称:J−SOX法)や、法律文書や帳票類を電子化して保存することを許可した電子文書法(通称:e-文書法)などの施行に伴い、各種の文書を長期的に保存することが要求されている。さらに、これらの文書はそのときどきの必要性に応じて参照する必要があるため、簡単に参照できるようにするとともにその文書の信頼性をも確保する必要がある。
文書の長期保存に際し、通常、電子文書管理システムやファイルサーバなどを用いて保存する方法があるが、技術革新とともにシステムの更新やサーバ機器のリプレース作業が必要となる。リプレース作業以外にも、耐障害性を確保するためにRAID(Redundant Arrays of Inexpensive Disks)技術を用いて冗長化して管理する必要がある。
これらの作業は、管理者にとって大変な作業となっている。
特許文献1に開示された技術では、オブジェクトをネットワークストレージなどで分散して管理する環境で、アクセス対象のオブジェクトの論理識別子からそのアクセス対象を格納するネットワークストレージを一意に決定できる複数ネットワークストレージの仮想一元化方法を提供している。
この技術では、複数のネットワークストレージを仮想的に一元化する方法で、アクセスする対象のオブジェクトの論理的な識別子から生成されるハッシュ値に基づきオブジェクトを格納するネットワークストレージを決定することにより、オブジェクトのアクセス時にオブジェクトの論理的な識別子としてハッシュ値を計算することで、アクセス要求を処理すべきネットワークストレージを決定してアクセスを可能としている。
特開2003−216474
本発明は、情報管理における保守性および当該情報の信頼性を確保することを可能にした情報管理システム、情報管理装置およびプログラムを提供することを目的とする。
上記目的を達成するため、請求項1の発明は、電子情報を複数の断片に分割する分割手段と、前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段とを具備することを特徴とする。
また、請求項2の発明は、請求項1の発明において、前記格納手段は、前記第2の演算値に基づいて前記第1の演算値により識別される分割電子情報を格納する格納先を決定する決定手段を具備し、前記決定手段によって決定した格納先に前記第1の演算値に対応する分割電子情報を格納することを特徴とする。
また、請求項3の発明は、請求項1の発明において、前記電子情報を複製する複製手段を更に具備し、前記分割手段は、前記複製手段によって複製された電子情報を複製元の電子情報とを異なる分割形式で複数の分割電子情報に分割し、前記格納手段は、前記複製元の電子情報と異なる分割形式で分割された複数の分割電子情報を前記複製元の電子情報から分割された複数の分割電子情報と同様の手法で複数の格納先に離散して格納することを特徴とする。
また、請求項4の発明は、請求項1から3のいずれかの発明において、前記分割手段は、前記電子情報の重要度に応じた分割数で分割することを特徴とする。
また、請求項5の発明は、請求項1から3のいずれかの発明において、前記複製手段は、前記電子情報の重要度に応じた複製数で複製することを特徴とする。
また、請求項6の発明は、請求項1から5のいずれかの発明において、前記所定の演算式は、ハッシュ関数であることを特徴とする。
また、請求項7の発明は、請求項6の発明において、前記第2の演算値により識別される格納先に格納した前記第1の演算値を保持する保持手段と、前記保持手段によって保持した前記第1の演算値に基づき分割前の電子情報を再現する再現手段とを具備することを特徴とする。
また、請求項8の発明は、請求項7の発明において、前記保持手段は、前記第1の演算値をタグ要素とするXML形式のファイルを生成するファイル生成手段を具備し、前記再現手段は、前記ファイル生成手段によって生成したXML形式のファイルを用いて分割前の電子情報を再現することを特徴とする。
また、請求項9の発明は、請求項7または8の発明において、前記再現手段は、前記電子情報の重要度に基づく所定の時間間隔で分割前の電子情報を再現することを特徴とする。
また、請求項10の発明は、請求項1から9のいずれかの発明において、前記分割手段は、前記再現手段によって再現された前記電子情報を再現前の分割形式とは異なる形式で分割することを特徴とする。
また、請求項11の発明は、前記格納手段は、前記第1の演算値に対応する分割電子情報を電子メールを用いて、格納先に転送することを特徴とする。
また、請求項12の発明は、請求項1から11のいずれかの発明において、前記電子情報に有効期間を設定する期間設定手段と、前記期間設定手段によって設定された有効期間を経過後、当該電子情報を格納先から削除する削除手段を具備することを特徴とする。
また、請求項13の発明は、電子情報を複数の断片に分割する分割手段と、前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段とを具備することを特徴とする。
また、請求項14の発明は、コンピュータを、電子情報を複数の断片に分割する分割手段と、前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段として機能させることを特徴とする。
本発明の請求項1によれば、管理対象となる情報の耐障害性が向上するとともに、情報セキュリティ上の脅威に対する安全性を確保することが可能になるという効果を奏する。
また、請求項2によれば、管理性能が向上するほか、管理効率が向上するという効果を奏する。
また、請求項3によれば、電子情報に対して、より高い安全性を確保することが可能になるという効果を奏する。
また、請求項4によれば、より高い耐障害性を実現することが可能になるという効果を奏する。
また、請求項5によれば、より高い耐障害性を実現することが可能になるという効果を奏する。
また、請求項6によれば、より効率的な分散管理が可能となるという効果を奏する。
また、請求項7によれば、第1の演算値および第2の演算値に基づいて管理した分割電子情報から分割前の電子情報が再現できるようになるという効果を奏する。
また、請求項8によれば、本システムを簡単に構築できるとともに、汎用性に優れるという効果を奏する。
また、請求項9によれば、重要度に応じて分割前の電子情報の再現性を確認できるという効果を奏する。
また、請求項10によれば、電子情報の安全性が向上するという効果を奏する。
また、本発明の請求項11によれば、さまざまな装置で管理することが可能となるという効果を奏する。
また、本発明の請求項12によれば、不要な情報が蓄積することなく、管理性能が向上するという効果を奏する。
また、本発明の請求項13によれば、管理対象となる情報の耐障害性が向上するとともに、脅威に対する安全性を確保することが可能になるという効果を奏する。
また、本発明の請求項14によれば、管理対象となる情報の耐障害性が向上するとともに、脅威に対する安全性を確保することが可能になるという効果を奏する。
以下、本発明に係わる情報管理システム、情報管理装置およびプログラムの一実施例を添付図面を参照して詳細に説明する。
図1は、本発明に係わる情報管理システム、情報管理装置およびプログラムを適用して構成したシステム構成図の一例である。
図1において、この情報管理システムは、複数のネットワーク(ネットワーク1、ネットワーク2、ネットワーク3)が通信回線網を介して接続されており、各ネットワークにはクライアントPC100、ルータ101を具備する。
この情報管理システムは、クライアントPC100で電子情報(以下、「ディジタルコンテンツ」ともいう)を分割し、分割後の分割電子情報(以下、「コンテンツ断片」)を他のクライアントPC上に分散して管理するシステムである。
ルータ101は、各ネットワーク間のデータ通信をルーティングするとともに、ファイアウォール機能を備え、外部ネットワーク上のクライアントPCとのデータ通信時にファイアウォール機能によって意図しないデータ通信の発生を防止する。
クライアントPC100は、同一ネットワークに接続されたクライアントPC100に加え、異なるネットワークに接続されたクライアントPC100によって構成可能な論理グループを形成し、同一の論理グループに属するクライアントPCの識別情報(以下に示す「ピアID」)を管理する。管理した識別情報を用いて他のクライアントPCとP2P(Peer to Peer)通信(通称:ピアリング)を行い、ディジタルコンテンツのコンテンツ断片を通信相手である他のクライアントPCに登録する処理を行う。
図1では、ネットワーク1のクライアントPC1_3、ネットワーク2のクライアントPC2_1、ネットワーク3のクライアントPC3_1が同一の論理グループに属していることを示す。
コンテンツ断片の登録先となるクライアントPCは、クライアントPCを識別するMAC(Media Access Control)アドレスやIP(Internet Protocol)アドレスなどのクライアントPC識別情報と、登録するコンテンツ断片を識別するコンテンツ断片識別情報との関係から最適な登録先のクライアントPCを決定する。このときの決定方法の一例として、ハッシュ関数を各識別情報(クライアントPC識別情報、コンテンツ断片識別情報)に適用して算出したハッシュ値同士の関係からコンテンツ断片の登録先となるクライアントPCを決定する方法がある。
この方法では、クライアントPC識別情報にハッシュ関数を適用して算出したハッシュ値のピアIDにより構成されるハッシュ空間上に、登録するコンテンツ断片に、ピアIDの算出に用いたハッシュ関数を適用することで算出したハッシュ値のコンテンツ断片IDを写像する。そして、写像されたハッシュ領域を管理対象とするクライアントPCをそのコンテンツ断片IDが示すコンテンツ断片の登録先とする。
このクライアントPC100の詳細な機能構成を図2に示し、この図2に示す機能構成に基づいてクライアントPCにより行われるディジタルコンテンツの分散管理の処理を説明する。
図2において、クライアントPC100は、通信インターフェース201、制御部202、表示部203、重要度設定部204、操作部205、複製処理部206、分割処理部207、コンテンツ断片ID算出部208、写像部209、コンテンツ再現ファイル作成部210、再現処理部211、記憶部212、ピアID算出部213を具備して構成され、管理対象のディジタルコンテンツをP2P通信の通信相手であるクライアントPCに分散して管理する処理を行う。
各クライアントPC100は、P2P通信を実現することからも明確なように、ディジタルコンテンツの登録要求元であるとともにそのディジタルコンテンツを分割したコンテンツ断片を管理するストレージでもあって各クライアントPC同士は対等な関係にある。
通信インターフェース201は、ネットワーク上の他のノードとの相互通信を実現するインターフェースである。通信インターフェース201を介して受信したデータは制御部202へと転送される。
制御部202は、クライアントPCにおける主制御であって、ディジタルコンテンツを分散管理するための制御処理を行う。また、新たなクライアントPC100を論理グループに接続する際に制御部202は、ピアID算出部213にピアIDの算出要求を行い、要求を受信したピアID算出部213がハッシュ関数を適用して自クライアントPCを識別するハッシュ値であるピアIDを算出する。さらに制御部202では、算出したピアIDは記憶部212の分散ハッシュテーブルに登録するとともに、通信インターフェース201を介して接続された同一論理グループに属する他のクライアントPCに同報送信する。
この記憶部212は、ROM(Read Only Memory)やRAM(Random Access Memory)などにより構成され、分割処理における各種の設定情報を記憶するとともに分散ハッシュテーブルを記憶する。
制御部202が通信インターフェース201を介してコンテンツ断片を受信した場合には、そのコンテンツ断片を記憶部212のコンテンツ断片記憶領域に記憶する。また、操作部205を操作することにより作成したディジタルコンテンツの分散管理が指示されると、制御部202は、複製処理部206、分割処理部207、コンテンツ断片ID算出部208、写像部209へと処理の指示を行う。
この操作部205や表示部203はユーザインターフェースであって、操作部205はキーボードやポインティングデバイスなどにより構成され、表示部203は表示ディスプレイから構成される。操作部205による分散管理の指示方法として、表示部203に表示された図3(a)に示すような画面を用いて行う方法がある。
図3(a)に示す画面は、ディジタルコンテンツの分散管理を実行する[StorageGrid]アイコン301に管理対象の[ディジタルコンテンツ]アイコン302をドラックアンドドロップすることで分散管理を指示する画面である。なお、ドラックアンドドロップすると図3(b)に示すような管理重要度を設定するダイアログボックスが表示され、このダイアログボックスを用いて重要度設定部204で重要度の設定を行う。設定された重要度は、管理対象のディジタルコンテンツの重要度であって、重要度が高いほど信頼性の高い管理を実現する処理が行われる。
この信頼性の高い管理を実現する処理として、たとえば、重要度が高いほど分割数を増加させてより多くの分散先に分散したり、また重要度が高いほどディジタルコンテンツの複製数を増加させて再現可能なディジタルコンテンツの組合せを増やしたりする方法がある。さらには、重要度が高いほど再現頻度を増加させる(再現処理を行う時間間隔を短くする)ことでディジタルコンテンツを再現できることを確認する方法がある。
図3(a)のような画面を用いて分散管理が指示されると、制御部202は記憶部212に記憶された各種の設定情報を読み込みその設定情報に基づいた処理指示を行う。この設定情報には、重要度に対する複製数や重要度に対する分割数、さらには再現処理を行う時間間隔を必要に応じて設定することが可能である。
まず、制御部202から、読み込んだ設定情報に含まれる「重要度に対する複製数」の情報とともに複製制御部206へと分割管理対象のディジタルコンテンツの複製を要求する。複製要求を受け付けた複製処理部206では設定された複製数だけディジタルコンテンツを複製する。
次に、複製元のディジタルコンテンツおよび複製処理部206で複製された各ディジタルコンテンツそれぞれに対して、分割処理部207がコンテンツ断片に分割する処理を行う。分割処理部207では制御部202が記憶部212より読み込んだ設定情報に含まれる「重要度に対する分割数」の情報が示す分割数で分割する。この分割処理部207により行われる分割処理は指定された分割数で均等に分割する処理を行うほか、ランダムの大きさで分割する方法がある。
もちろん、記憶部212より読み込んだ設定情報に含まれる分割数で分割するのではなく、ランダムに生成した分割数で分割するように構成してもよい。
このときの分割処理を図4を用いて説明する。
図4は、読み込んだ設定情報に含まれる「重要度に対する分割数」が「3」である場合の例であって、分割前のディジタルコンテンツ401をランダムの大きさの3つに分割することでコンテンツ断片1(402)、コンテンツ断片2(403)、コンテンツ断片3(404)を作成した状態を示す。
このように分割処理部207でディジタルコンテンツをコンテンツ断片に分割すると、続いて、制御部202は、ディジタルコンテンツを分割したコンテンツ断片それぞれのコンテンツ断片IDを算出する算出要求をコンテンツ断片ID算出部208へと行う。
コンテンツ断片ID算出部208では、分割処理部207により算出されたコンテンツ断片に「SHA−1」や「SHA−256」などのハッシュ関数を適用してハッシュ演算を行い、そのコンテンツ断片を識別するハッシュ値であるコンテンツ断片IDを算出する。コンテンツ断片ID算出部208におけるコンテンツ断片IDの算出に用いるハッシュ関数は、ピアIDを算出するために用いたハッシュ関数を用いる。
このコンテンツ断片ID算出部208の処理を図4に示しており、分割処理部207が分割して作成したコンテンツ断片にハッシュ関数を適用してハッシュ値であるコンテンツ断片IDを算出する。分割されたコンテンツ断片1に対するコンテンツ断片IDが「コンテンツ断片ID_1」であって、コンテンツ断片2に対するコンテンツ断片IDが「コンテンツ断片_2」であって、コンテンツ断片3に対するコンテンツ断片IDが「コンテンツ断片_3」であることが示されている。
次に、写像部209が、コンテンツ断片ID算出部208により算出した各コンテンツ断片のコンテンツ断片IDを、同一論理グループに属するクライアントPCのピアIDにより構成されるハッシュ空間上に写像する。このときのハッシュ空間の状態の一例を図5に示す。
図5では、ハッシュ空間を円形で示しており、上記の同一論理グループに属する3つのクライアントPC(クライアントPC1_3、クライアントPC2_1、クライアントPC3_1)から算出したピアIDを写像した状態を、白抜きの丸印で示している。各ピアIDに対するクライアントPCは、図6に示す分散ハッシュテーブルで指定された[ハッシュ値の管理範囲]604で示されるハッシュ値の範囲に写像されたコンテンツ断片を管理する。この管理範囲を図5の点線で示している。
なお、図6に示す分散ハッシュテーブルは、[クライアントPC名称]項目601、[クライアントPCアドレス]項目602、[ピアID]項目603、[ハッシュ値の管理範囲]項目604から構成されるテーブルであって、クライアントPCごとにそのクライアントPCが管理するコンテンツ断片IDが設定されている。この分散ハッシュテーブルは同一論理グループに属するすべてのクライアントPCが保持している。既存のクライアントPCが削除されたり、新規にクライアントPCが接続された場合にはこの分散ハッシュテーブルが更新される。
また、図5では図6の分散ハッシュテーブルで指定された[ハッシュ値の管理範囲]604の情報を元に、ディジタルコンテンツを分割したコンテンツ断片のコンテンツ断片IDをハッシュ空間上に写像した状態を白抜きの三角印で示している。図5では、コンテンツ断片1に対するハッシュ値のコンテンツ断片ID_1はクライアントPC1_3の管理範囲に写像され、コンテンツ断片2に対するハッシュ値のコンテンツ断片ID_2はクライアントPC2_1の管理範囲に写像され、コンテンツ断片3に対するハッシュ値のコンテンツ断片ID_3はクライアントPC3_1の管理範囲に写像された状態を示している。
これにより、制御部202は、写像部209により写像されたハッシュ空間の状態から各コンテンツ断片の登録先となるクライアントPC100を決定する。
続いて、制御部202では、各コンテンツ断片から分割前のディジタルコンテンツを再現するために、コンテンツ再現ファイル作成部210にコンテンツ再現ファイルの作成要求を行う。コンテンツ再現ファイル作成部210では、登録先となるクライアントPCが決定したコンテンツ断片のコンテンツ断片IDの集合からなるXML(Extensible Markup Language)形式のコンテンツ再現ファイルを作成する。
このXML形式からなるコンテンツ再現ファイルの一例を以下に示す。なお、各行の左側に示す数値は説明のために用いる行番号である。
01 <?xml version="1.0" encoding="Shift-JIS" ?>
02 <Contents>
03 <ContentsID>13f59d87a9c9bf95...293f95a959c9b</ContentsID>
04 <FileName>alpha.doc</FileName>
05 <MimeType>application/$$$$$</MimeType>
06 <Created>Jan-23-2006 13:34:56</Created>
07 <FragmentSets>
08 <FragmentSet>
09 <Fragment>156c2a352c89a...53b7a53b8a9ca776b6</Fragment>
10 <Fragment>350135c943a02...48b920145c849329a9</Fragment>
11 <Fragment>968ab848ad935...95a593a29056b99c9d</Fragment>
12 </FragmentSet>
13 <FragmentSet>
14 <Fragment>39519a29471b9...401a95013b37c949b1</Fragment>
15 <Fragment>350135c943a02...90575a4c7647a64232</Fragment>
16 <Fragment>89236e5c43a21...001ac5342d47a67893</Fragment>
17 <Fragment>581c5b245a589...d64739518bc0305211</Fragment>
18 </FragmentSet>
19 </FragmentSets>
20 </Contents>
01行目にはXML形式で記載されたコンテンツ再現ファイルであることを示し、02行目から20行目に示される<Contents>タグ内でそのコンテンツ再現ファイルの内容が示される。
03行目に示される<ContentsID>タグはコンテンツ再現ファイルを識別する情報を記述するタグであってその要素としてハッシュ値の識別情報が示されている。04行目に示される<FileName>タグはディジタルコンテンツのファイル名称を示すタグであって、05行目に示される<MimeType>タグはコンテンツ再現ファイルの再現間隔の情報を示すタグである。また、06行目に示される<Created>タグはコンテンツ再現ファイルが作成された日付、時間を示す情報である。
次に、07行目から20行目までの<FragmentSets>タグ内には、1つまたは複数の分割パターンにより分割したコンテンツ再現情報が示されており、上記する例では2つのコンテンツ再現情報を示している。1つ目のコンテンツ再現情報は、08行目から12行目までの<FragmentSet>タグ内で示し、2つ目のコンテンツ再現情報は、13行目から18行目までの<FragmentSet>タグ内で示す。
すなわち、この例では、分割されたディジタルコンテンツの再現方法が2通りあることを示している。
各コンテンツ再現情報は、分割されたコンテンツ断片の断片数だけ<Fragment>タグによってコンテンツ断片IDが示されており、08行目から12行目までに示された1つ目のコンテンツ再現情報は3つのコンテンツ断片に分割された例であって、13行目から18行目までに示された2つ目のコンテンツ再現情報は4つのコンテンツ断片に分割された例を示している。
このようにコンテンツ再現ファイル作成部210によってコンテンツ再現ファイルが作成されると、作成したコンテンツ再現ファイルを記憶部212のコンテンツ再現ファイル記憶領域に記憶する。
再現処理部211では、記憶部212のコンテンツ再現ファイル記憶領域に記憶されたコンテンツ再現ファイル内で示される再現間隔の情報に基づいてコンテンツ再現ファイルから定期的にディジタルコンテンツを再現する処理を行う。このディジタルコンテンツの再現処理は、コンテンツ再現ファイル内で指定されたコンテンツ再現情報の数だけ行われ、上記に示すコンテンツ再現ファイルの例では2つのコンテンツ再現情報によってディジタルコンテンツが再現される。
このディジタルコンテンツの再現に失敗したコンテンツ再現情報が存在する場合には、成功したコンテンツ再現情報を用いてディジタルコンテンツを再現し、そのディジタルコンテンツを別の分割パターンによって再分割してコンテンツ再現情報を作成してコンテンツ再現ファイルを構成する。このことから、重要度の高いディジタルコンテンツに対しては多くのコンテンツ再現情報を作成しておく。
さらに、制御部202ではディジタルコンテンツの分割時に、ディジタルコンテンツの管理有効期限となる生存時間の情報を指定することができ、指定された生存時間情報を超えた場合にはコンテンツ再現ファイルによってディジタルコンテンツを再現してそのディジタルコンテンツを削除することもできる。
この生存時間情報の指定方法として、XML形式のコンテンツ再現ファイルに<LifeTime>タグを追加(たとえば06行目と07行目の間に追加)してその要素に生存時間を設定する方法がある。
次に、ディジタルコンテンツの登録処理およびディジタルコンテンツの検索処理の流れを図7、図8を用いて説明する。
図7は、ディジタルコンテンツの登録処理の流れを示すイベントフロー図の一例である。
図7には、分割したコンテンツ断片を3つのクライアントPCに登録する場合のイベントフローを示し、登録要求元のクライアントPCがディジタルコンテンツを複数のコンテンツ断片に分割して各コンテンツ断片にハッシュ関数を適用することでコンテンツ断片IDを算出すると、算出したコンテンツ断片IDを管理範囲とするクライアントPCを図6に示すような分散ハッシュテーブルから検索する。そして、管理範囲に該当するクライアントPCに登録要求を行う(701)。
コンテンツ断片の登録要求を受信したクライアントPCでは、そのコンテンツ断片に対するコンテンツ断片IDが管理対象範囲にあるかを判定し、管理対象範囲にある場合にそのコンテンツ断片を登録して管理する(702)。
図8は、ディジタルコンテンツの検索処理の流れを示すイベントフロー図の一例である。
図8には、4つのクライアントPCに分割して登録されたディジタルコンテンツを再現する際の各コンテンツ断片を検索する処理を示す。検索要求元のコンテンツ再現ファイルを実行するクライアントPCでは、そのコンテンツ再現ファイルで指定されたコンテンツ断片IDを管理範囲とするクライアントPCにそのコンテンツ断片IDに対するコンテンツ断片の検索要求を行う(801)。
検索要求を受信した各クライアントPCは、管理したコンテンツ断片から指定されたコンテンツ断片IDを検索(802)し、合致するコンテンツ断片を要求元のクライアントPCに送信する(803)。それに対して、コンテンツ断片を検索できない場合には、要求を受信したクライアントPCの分散ハッシュテーブルを参照し、自機以外のクライアントPCが管理範囲に指定されているかを判定する。
他のクライアントPCが管理用に指定されている場合には、そのクライアントPCに検索要求を再度行う(804)。そして、そのクライアントPCが指定されたコンテンツ断片IDに対するコンテンツ断片を検索して(805)合致したコンテンツ断片を元の検索要求元へと送信する。コンテンツ断片を受信した検索要求元のクライアントPCは、受信したコンテンツ断片からディジタルコンテンツを再現する(806)。
次に、処理の詳細な流れをフローチャートを用いて説明する。
まず、図9には、情報の管理要求の流れを示すフローチャートの一例を示す。
図9において、情報の分散管理が指示されると処理が開始され、分散管理対象となるディジタルコンテンツを設定された重要度に応じた数だけ複製する(901)。各ディジタルコンテンツに対して、分割処理を行い(902)、分割処理によって分割されたコンテンツ断片にハッシュ関数を適用することによりコンテンツ断片IDを算出する(903)。
続いて、全てのディジタルコンテンツに対してこれらの処理が行われたかを判断し(904)、全てのディジタルコンテンツに対して処理が行われていない場合(904でNO)には、未処理のディジタルコンテンツに対して処理を行う。また、全てのディジタルコンテンツに対して処理が終了すると(904でYES)、算出したコンテンツ断片IDを元にコンテンツ断片を管理するクライアントPCを決定する(905)。この決定方法として、図10に示すような方法がある。
そして、決定したクライアントPCに管理要求を行う(906)。
図10は、図9のフローチャートで示したコンテンツ断片の管理先となるクライアントPCを決定する詳細な処理の流れを示すフローチャートの一例である。
図10において、ディジタルコンテンツの分割に用いるハッシュ関数をクライアントPCの識別情報に適用することでハッシュ値であるピアIDを算出する(1001)。算出したピアIDを元にハッシュ空間を形成し(1002)、形成したハッシュ空間より管理範囲となるハッシュ空間領域を決定する(1003)。
これにより、図6に示すような分散ハッシュテーブルの管理範囲が決定する。
続いて、形成したハッシュ空間上に算出したコンテンツ断片IDを写像して(1004)、その写像位置を管理範囲とするクライアントPCをコンテンツ断片の管理クライアントPCと決定する(1005)。
図11は、分割されたコンテンツ断片を管理する処理の流れを示すフローチャートの一例である。
図11において、管理要求を受信したかを判断し(1101)、管理要求を受信すると(1101でYES)、管理要求されたコンテンツ断片のコンテンツ断片IDが管理範囲内であるかを判断する(1102)。管理範囲内のコンテンツ断片IDである場合(1102でYES)には、そのコンテンツ断片を所定の記憶領域に格納して管理する(1103)。
それに対して、管理範囲外のコンテンツ断片IDである場合(1102でNO)には、分散ハッシュテーブルを参照してそのコンテンツ断片IDを管理範囲とするクライアントPCを特定し(1104)、そのクライアントPCに転送する(1105)。
図12は、コンテンツ再現ファイルを用いてディジタルコンテンツを再現するとともに、そのコンテンツ再現ファイルの確認を行う処理の流れを示すフローチャートの一例である。
図12において、コンテンツ再現ファイルを用いて再現依頼が行われると処理が開始され、コンテンツ再現ファイルを参照し(1201)、コンテンツ再現ファイル内で指定されたコンテンツ再現情報ごとの各コンテンツ断片IDを管理するクライアントPCに取得要求を行う(1202)。この再現依頼は、ディジタルコンテンツに設定された設定情報に含まれる「重要度に対する再現頻度」に応じて依頼される。
取得要求に対して、コンテンツ再現情報が示す全てのコンテンツ断片を受信したかを判断する(1203)。全てのコンテンツ断片を受信していない場合(1203でNO)には再度、取得依頼を行うとともに一定時間待機する。
全てのコンテンツ断片を受信した場合(1203YES)には、受信したコンテンツ断片からディジタルコンテンツを再現する(1204)。
そして、これらの処理を全てのコンテンツ再現情報に対して行ったかを判断し(1205)、全てのコンテンツ再現情報に対して処理が行われると(1205)、続いて、再現不可能なコンテンツ再現情報が存在したかを判断する(1206)。全てのコンテンツ再現情報からディジタルコンテンツが再現できた場合(1206でNO)には処理を終了する。
それに対して、1つでもディジタルコンテンツを再現できないコンテンツ再現情報がある場合(1206でYES)には、続いて、他のコンテンツ再現情報のうち再現可能なコンテンツ再現情報があるかを判断する(1207)。1つも再現できない場合にはエラー表示するなどのエラー処理を行って(1208)終了する。
再現可能なコンテンツ再現情報がある場合(1207でYES)には、そのコンテンツ再現情報により再現されたディジタルコンテンツを新たに分割して(1209)、分割したコンテンツ断片にハッシュ関数を適用することでコンテンツ断片IDを算出する(1210)。
算出したコンテンツ断片IDを元に、コンテンツ再現ファイルを再生成する(1211)。
上記の実施例1に示す図1では、クライアントPC100により構成されるネットワークを用いて本願発明の情報管理システムを説明したが、本実施例2では、図13に示すようにストレージを内蔵する複合機などの電子機器700で構成する。
この図13は、図1に示す構成と類似し、3つのネットワーク(ネットワーク1、ネットワーク2、ネットワーク3)に接続されたノードである複合機すべてが同一の論理グループに属している状態を示している。これらの各複合機の識別情報にハッシュ関数を適用して算出したハッシュ値であるピアIDを写像したハッシュ空間の例を図14に示す。
図14は、図5と同様に、複合機のピアIDをハッシュ空間上に写像した状態を白抜きの丸印で示しており、また、分散管理対象であるディジタルコンテンツを分割したコンテンツ断片に対するハッシュ値のコンテンツ断片IDを白抜きの三角印で示している。丸印で示したピアIDの各複合機にはハッシュ値の管理範囲が設定されており、図14ではその管理範囲を点線の囲い矢印で示している。
この状態で、実施例1ではコンテンツ断片IDが写像された位置を管理範囲とした複合機でそのコンテンツ断片IDに対するコンテンツ断片を管理するように構成しているが、本実施例2では、コンテンツ断片IDが写像された位置に対して、ハッシュ空間上の対極を管理範囲とする複合機にコンテンツ断片を登録する構成である。
また、コンテンツ断片は登録先と指定された複合機以外にも登録することができる。たとえば、登録先と指定された複合機とハッシュ空間上で近傍する複合機にもそのコンテンツ断片を登録する。この場合、登録先と指定された複合機で、コンテンツ断片の登録要求を受信すると、そのコンテンツ断片を複製して複製したコンテンツ断片を近傍する複合機に送信して登録するというものである。
すなわち、分割されたコンテンツ断片は複数の複合機に登録されることとなる。
このような実施例2に示す構成でディジタルコンテンツを分散管理する以外にも図15に示すように、各ネットワークに設けられたメールサーバ同士が相互間で情報通信を行い、上記に示すような処理を行うことでディジタルコンテンツの分散管理を行うように構成してもよい。
本発明は、上記し、且つ図面に示す実施例に限定することなく、その要旨を変更しない範囲内で適宜変形して実施できるものである。
なお、本発明は、通信機能を備えた情報管理システムで上述の動作を実行させ、あるいは上述の手段を構成させるためのプログラムを格納した記録媒体(CD−ROM、DVD−ROM等)から該プログラムをコンピュータにインストールし、これを実行させることにより、上述の処理を実行する情報管理システムを構成することも可能である。情報管理システムを構成するコンピュータは、システムバスを介してCPU(Central Processor Unit)、ROM、RAM、ハードディスクが接続されている。CPUは、ROMまたはハードディスクに記憶されているプログラムに従い、RAMを作業領域にして処理を行う。
また、プログラムを供給するための媒体は、通信媒体(通信回線、通信システムのように一時的または流動的にプログラムを保持する媒体)でもよい。例えば、通信ネットワークの電子掲示板(BBS:Bulletin Board Service)に該プログラムを掲示し、これを通信回線を介して配信するようにしてもよい。
本発明は、長期間の保存を要する情報の信頼性を確保するとともに簡単に参照可能としたものに適用可能である。
本発明に係わる情報管理システム、情報管理装置およびプログラムを適用して構成したシステム構成図の一例。 クライアントPCの詳細な構成を示す図。 表示画面の一例を示す図。 分割処理の詳細を示す図の一例。 円形の曲線上でハッシュ空間を表した図の一例。 分散ハッシュテーブルの例を示す図。 ディジタルコンテンツの登録処理の流れを示すイベントフロー図の一例。 ディジタルコンテンツの検索処理の流れを示すイベントフロー図の一例。 情報の管理要求の流れを示すフローチャートの一例。 図9のフローチャートで示したコンテンツ断片の管理先となるクライアントPCを決定する詳細な処理の流れを示すフローチャートの一例。 分割されたコンテンツ断片を管理する処理の流れを示すフローチャートの一例。 コンテンツ再現ファイルを用いてディジタルコンテンツを再現するとともに、そのコンテンツ再現ファイルの確認を行う処理の流れを示すフローチャートの一例。 本発明に係わる情報管理システム、情報管理装置およびプログラムを適用して構成したシステム構成図の一例。 円形の曲線上でハッシュ空間を表した図の一例。 本発明に係わる情報管理システム、情報管理装置およびプログラムを適用して構成したシステム構成図の一例。
符号の説明
100 クライアントPC
101 ルータ
201 通信インターフェース
202 制御部
203 表示部
204 重要度設定部
205 操作部
206 複製処理部
207 分割処理部
208 コンテンツ断片ID算出部
209 写像部
210 コンテンツ再現ファイル作成部
211 再現処理部
212 記憶部
213 ピアID算出部

Claims (14)

  1. 電子情報を複数の断片に分割する分割手段と、
    前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、
    前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、
    前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段と
    を具備する情報管理システム。
  2. 前記格納手段は、
    前記第2の演算値に基づいて前記第1の演算値により識別される分割電子情報を格納する格納先を決定する決定手段
    を具備し、
    前記決定手段によって決定した格納先に前記第1の演算値に対応する分割電子情報を格納する請求項1記載の情報管理システム。
  3. 前記電子情報を複製する複製手段
    を更に具備し、
    前記分割手段は、
    前記複製手段によって複製された電子情報を複製元の電子情報とを異なる分割形式で複数の分割電子情報に分割し、
    前記格納手段は、
    前記複製元の電子情報と異なる分割形式で分割された複数の分割電子情報を前記複製元の電子情報から分割された複数の分割電子情報と同様の手法で複数の格納先に離散して格納する請求項1記載の情報管理システム。
  4. 前記分割手段は、
    前記電子情報の重要度に応じた分割数で分割する請求項1から3記載の情報管理システム。
  5. 前記複製手段は、
    前記電子情報の重要度に応じた複製数で複製する請求項1から3記載の情報管理システム。
  6. 前記所定の演算式は、
    ハッシュ関数である請求項1乃至5のいずれかに記載の情報管理システム。
  7. 前記第2の演算値により識別される格納先に格納した前記第1の演算値を保持する保持手段と、
    前記保持手段によって保持した前記第1の演算値に基づき分割前の電子情報を再現する再現手段と
    を具備する請求項1乃至6のいずれかに記載の情報管理システム。
  8. 前記保持手段は、
    前記第1の演算値をタグ要素とするXML形式のファイルを生成するファイル生成手段
    を具備し、
    前記再現手段は、
    前記ファイル生成手段によって生成したXML形式のファイルを用いて分割前の電子情報を再現する請求項7記載の情報管理システム。
  9. 前記再現手段は、
    前記電子情報の重要度に基づく所定の時間間隔で分割前の電子情報を再現する請求項7または8記載の情報管理システム。
  10. 前記分割手段は、
    前記再現手段によって再現された前記電子情報を再現前の分割形式とは異なる形式で分割する請求項1乃至9のいずれかに記載の情報管理システム。
  11. 前記格納手段は、
    前記第1の演算値に対応する分割電子情報を電子メールを用いて、格納先に転送する請求項1乃至10のいずれかに記載の情報管理システム。
  12. 前記電子情報に有効期間を設定する期間設定手段と、
    前記期間設定手段によって設定された有効期間を経過後、当該電子情報を格納先から削除する削除手段
    を具備する請求項1乃至11のいずれかに記載の情報管理システム。
  13. 電子情報を複数の断片に分割する分割手段と、
    前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、
    前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、
    前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段と
    を具備する情報管理装置。
  14. コンピュータを、
    電子情報を複数の断片に分割する分割手段と、
    前記分割手段によって分割された断片からなる複数の分割電子情報にそれぞれ所定の演算式を適用して該分割電子情報を識別する複数の第1の演算値を算出する第1の算出手段と、
    前記分割電子情報を格納する複数の格納先の識別情報に前記演算式を適用して該格納先を識別する複数の第2の演算値を算出する第2の算出手段と、
    前記第1の演算値および前記第2の演算値に基づきに前記第1の演算値により識別される複数の分割電子情報を前記第2の演算値により識別される複数の格納先に離散して格納する格納手段
    として機能させる情報管理プログラム。
JP2007012766A 2007-01-23 2007-01-23 情報管理システム、情報管理装置およびプログラム Pending JP2008181213A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007012766A JP2008181213A (ja) 2007-01-23 2007-01-23 情報管理システム、情報管理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007012766A JP2008181213A (ja) 2007-01-23 2007-01-23 情報管理システム、情報管理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2008181213A true JP2008181213A (ja) 2008-08-07

Family

ID=39725090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007012766A Pending JP2008181213A (ja) 2007-01-23 2007-01-23 情報管理システム、情報管理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP2008181213A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059398A (ja) * 2006-08-31 2008-03-13 Brother Ind Ltd 識別情報割当装置及びその情報処理方法並びにそのプログラム
JP2010079886A (ja) * 2008-09-11 2010-04-08 Nec Lab America Inc 拡張可能な2次ストレージシステムと方法
JP2012027587A (ja) * 2010-07-21 2012-02-09 Tokyo Denki Univ データ分散保管装置及び方法及びプログラム及び記録媒体
JP2012168713A (ja) * 2011-02-14 2012-09-06 Hitachi Ltd メール保存バックアップシステムおよびバックアップ方法
JP2012524947A (ja) * 2009-04-24 2012-10-18 マイクロソフト コーポレーション 複製データの動的配置
JP5644937B2 (ja) * 2011-03-14 2014-12-24 株式会社ニコン 電子機器およびプログラム
JP2016177724A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 ノード、情報処理システム、方法、および、プログラム
JP2016189105A (ja) * 2015-03-30 2016-11-04 日本電気株式会社 ストレージシステム
WO2021010317A1 (ja) * 2019-07-17 2021-01-21 ソニー株式会社 情報システム、情報端末、情報処理方法および情報提供方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059398A (ja) * 2006-08-31 2008-03-13 Brother Ind Ltd 識別情報割当装置及びその情報処理方法並びにそのプログラム
JP2010079886A (ja) * 2008-09-11 2010-04-08 Nec Lab America Inc 拡張可能な2次ストレージシステムと方法
JP2012524947A (ja) * 2009-04-24 2012-10-18 マイクロソフト コーポレーション 複製データの動的配置
JP2012027587A (ja) * 2010-07-21 2012-02-09 Tokyo Denki Univ データ分散保管装置及び方法及びプログラム及び記録媒体
JP2012168713A (ja) * 2011-02-14 2012-09-06 Hitachi Ltd メール保存バックアップシステムおよびバックアップ方法
JP5644937B2 (ja) * 2011-03-14 2014-12-24 株式会社ニコン 電子機器およびプログラム
JP2016177724A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 ノード、情報処理システム、方法、および、プログラム
JP2016189105A (ja) * 2015-03-30 2016-11-04 日本電気株式会社 ストレージシステム
WO2021010317A1 (ja) * 2019-07-17 2021-01-21 ソニー株式会社 情報システム、情報端末、情報処理方法および情報提供方法
JP7559756B2 (ja) 2019-07-17 2024-10-02 ソニーグループ株式会社 情報システム、情報端末、情報処理方法および情報提供方法

Similar Documents

Publication Publication Date Title
CN111566633B (zh) 用于使内容项同步的提交协议
JP2008181213A (ja) 情報管理システム、情報管理装置およびプログラム
US8086570B2 (en) Secure document management using distributed hashing
JP5775177B2 (ja) クローンファイル作成方法と、それを用いたファイルシステム
US8200788B2 (en) Slice server method and apparatus of dispersed digital storage vaults
CN104813321B (zh) 在分布式对象存储生态系统中的去耦合的内容以及元数据
CN104618482B (zh) 访问云数据的方法、服务器、传统存储设备、系统
CN101093497B (zh) 文档管理服务器、文档管理方法及管理文档使用的系统
US8307019B2 (en) File management method and storage system
JP5433074B2 (ja) ストレージクラスタを指定可能な複製されたコンテンツのための非同期的分散オブジェクトアップロード
US7921189B2 (en) Single virtual client for multiple client access and equivalency
CN111290826B (zh) 分布式文件系统、计算机系统和介质
JP4714778B2 (ja) アーカイブ装置、変換装置および変換プログラム
US9031906B2 (en) Method of managing data in asymmetric cluster file system
CN111488198B (zh) 一种超融合环境下的虚拟机调度方法、系统及介质
CN105027069A (zh) 卷区域的重复数据删除
CN102708165A (zh) 分布式文件系统中的文件处理方法及装置
JP2020197873A (ja) 情報処理システム、及び情報処理システムの制御方法
CN107566195A (zh) 镜像仓库处理方法及系统
JP4247975B2 (ja) データ管理方法、データ管理システム、およびそのためのプログラムならびに記録媒体
US20070233670A1 (en) Document Management System, Program, and Computer Data Signal
US10324652B2 (en) Methods for copy-free data migration across filesystems and devices thereof
Nelson et al. Syndicate: Virtual cloud storage through provider composition
KR101470857B1 (ko) iSCSI 스토리지 시스템을 이용한 네트워크 분산 파일 시스템 및 방법
US11755538B2 (en) Distributed management of file modification-time field