[go: up one dir, main page]

JP2005510806A - フィンガープリントのデータベースの維持方法及びシステム - Google Patents

フィンガープリントのデータベースの維持方法及びシステム Download PDF

Info

Publication number
JP2005510806A
JP2005510806A JP2003548122A JP2003548122A JP2005510806A JP 2005510806 A JP2005510806 A JP 2005510806A JP 2003548122 A JP2003548122 A JP 2003548122A JP 2003548122 A JP2003548122 A JP 2003548122A JP 2005510806 A JP2005510806 A JP 2005510806A
Authority
JP
Japan
Prior art keywords
file sharing
client
fingerprint
metadata
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003548122A
Other languages
English (en)
Other versions
JP2005510806A5 (ja
Inventor
アー セー エム カルケル,アントニウス
アー ハイツマ,ヤープ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005510806A publication Critical patent/JP2005510806A/ja
Publication of JP2005510806A5 publication Critical patent/JP2005510806A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

複数のマルチメディアオブジェクトのそれぞれのフィンガープリント及び関連する一式のメタデータを有するデータベースを維持する方法である。データベースのそれぞれの部分(201,202,203,204,205)が、前記複数のマルチメディアオブジェクトを共有するように構成されたファイル共有ネットワーク(100)に接続されたそれぞれのファイル共有クライアント(101-105)上に分散される。ファイル共有クライアント(101-105)は、データベースのそのそれぞれの部分(201-205)を維持し、他のファイル共有クライアントにフィンガープリントとメタデータを送信し得る。後者の場合、他のファイル共有クライアントは、好ましくはファイル共有ネットワーク(100)のスーパーノード(super node)である。

Description

発明の詳細な説明
本発明は、複数のマルチメディアオブジェクトのそれぞれのフィンガープリント及び関連する一式のメタデータを有するデータベースを維持する方法に関するものである。本発明は、ファイル共有クライアントと、コンピュータプログラム製品と、ファイル共有ネットワークとに更に関するものである。
人間の指紋は、百年以上の間、人を識別するために既に用いられている。概念的に、指紋はそれぞれの単一の人間に固有の要約として見られ得る。最近、マルチメディアオブジェクトのフィンガープリントを計算するマルチメディア処理の分野において、高まる関心が見られる。2つのマルチメディアオブジェクトが同じものとしてみなされるために、マルチメディアオブジェクト自体を比較する代わりに、フィンガープリントのみが比較される。マルチメディアオブジェクトのフィンガープリントは、当該オブジェクトの最も適切な知覚的特徴の表示である。前記フィンガープリントは、“(頑強な)ハッシュ”としても知られることがある。
フィンガープリント技術を用いるほとんどのシステムにおいて、大量のマルチメディアオブジェクトのフィンガープリントは、関連するそれぞれのメタデータと共にデータベースに保存される。“メタデータ”という用語は、マルチメディアの題名やアーティストや分野等の情報を参照する。マルチメディアオブジェクトのメタデータは、そのフィンガープリントを計算し、参照キー又はクエリのパラメータとして計算されたフィンガープリントを用いてデータベースで参照又はクエリを実行することにより、検索される。参照はフィンガープリントに関連するメタデータに戻る。
マルチメディアコンテンツ自体の代わりに、マルチメディアオブジェクトのフィンガープリントをデータベースに保存するいくつかの利点が存在する。いくつかの例を挙げると:
1.データベースのメモリ/ストレージ要件が減少する。
2.フィンガープリントがオブジェクトより実質的に小さいため、フィンガープリントの比較はマルチメディアオブジェクト自体の比較より効率的である。
3.データベースにおけるフィンガープリントの照合の検索は、より短い項目を照合することを含むため、完全なマルチメディアオブジェクトの検索より効率的である。
4.マルチメディアオブジェクトへの少しの変更(異なるフォーマットへのエンコードやビットレートの変更等)がフィンガープリントに影響を与えないため、フィンガープリントの照合の検索は成功する可能性が高い。
マルチメディアオブジェクトのフィンガープリントを生成する方法の例は、国際特許出願WO02/065782(代理人管理番号PHNL010110)と、Jaap HaitsmaとTon KalkerとJob Oostveenによる2001年9月のBresciaのInternational Workshop on Content-Based Multimedia Indexingの“コンテンツの識別のための頑強な音声ハッシュ(Robust Audio Hashing For Content Identification)”とに説明されている。
大規模なシステムにおいて、フィンガープリントのデータベースは、全ての検索要求を処理し、全てのフィンガープリントを保存可能なように、相当の数のフィンガープリントのサーバに分散されなければならない。更に、前記データベースは最新に保たれなければならない。例えば音声のフィンガープリントの場合、新しくリリースされた曲のフィンガープリントが加えられなければならない。必要なサーバと、データベースを最新に保つことの双方が、システムを非常に高価にする。
既知の方法より安価な前文による方法を提供することが本発明の目的である。
この目的は、前記複数のマルチメディアオブジェクトを共有するように構成されたファイル共有ネットワークに接続されたそれぞれのファイル共有クライアント上に、データベースのそれぞれの部分を分散することからなる方法で、本発明に従って達成される。
この方法を用いて、例えばCDのコンテンツを積極的に買いに出かけ、又は自分自身でコンテンツのメタデータを見つける必要がなくなる。ネットワークのファイル共有クライアントから利用可能なオブジェクトとメタデータを利用することにより、フィンガープリントとメタデータが非常に安価で効果的な方法で集められ得る。前記クライアントは、ダウンロードする何らかの人にオブジェクトを既に利用可能にしており、前記オブジェクトの購入が不要になる。更に、一般的にオブジェクトはメタデータと共に利用可能になるため、このメタデータも同様に使用され得る。
ファイル共有ネットワーク上にデータベースを分散することは、専用のデータベースサーバ又は管理システムが不要になるという更なる利点を有する。ファイル共有ネットワークは、潜在的に多数の相互接続されたコンピュータを既に有しており、それが前記データベースを維持する適切な基盤を提供する。
また、本発明による方法は、先行技術の方法より拡張性がある。更なるユーザがファイル共有ネットワークに参加すると、メタデータの要求の数が増加し、満足できる応答時間が望まれる場合にはデータベースサーバ(群)の要件が増加しなければならない。しかし、データベースがファイル共有ネットワークのクライアント上に分散されると、新しいユーザがネットワークに参加する際に、更なるコンピュータがネットワークで利用可能になる。前記新しいコンピュータによって提供される追加の計算能力とストレージと接続性が、データベースの部分を維持するために用いられ得る。このように、分散されたデータベースの能力が要求と共に大きくなる。
1つ以上のマルチメディアオブジェクトを保存するストレージと、ファイル共有ネットワークの他のファイル共有クライアントとストレージのマルチメディアオブジェクトを共有する共有手段と、フィンガープリントを計算し、共有手段により共有されるマルチメディアオブジェクトの一式のメタデータを取得し、計算されたフィンガープリントと取得された一式のメタデータとをファイル共有ネットワークに接続されたファイル共有クライアント上に分散されたデータベースに追加するフィンガープリント手段とを有するファイル共有クライアントを提供することが、本発明の更なる目的である。
前記ファイル共有クライアントは、前記に概要を説明したデータベースを維持する方法に参加することが可能である。フィンガープリント手段とデータ収集手段とがファイル共有クライアントに統合されるため、ファイル共有クライアントをインストールしたユーザはまた、分散データベースを維持するのに役立つ必要な手段を自動的にインストールする。従って、ユーザがその後ファイル共有ネットワークに参加すると、その計算能力と接続性とストレージがネットワークに利用可能になり、分散データベースの能力を拡張する。
実施例において、ファイル共有クライアントは、分散されたデータベースの部分を維持するDBMS手段を更に有する。ファイル共有クライアントに前記データベース管理システムをインストールすることにより、(通常はコンピュータシステムで)クライアントをインストールした何らかの人はまた、DBMS手段をインストールし、分散データベースの維持に貢献することが可能である。
更なる実施例において、DBMS手段により維持される分散されたデータベースの部分の大きさが、クライアントが動作するコンピュータシステムの性能に依存する。例えば、帯域制限、CPU速度及び/又は利用可能なワーキングメモリ(RAM)が、考慮に入れられ得る。このように、遅いコンピュータは、大きいフィンガープリントのデータベースサーバの負担を負わない。
更なる実施例において、DBMS手段は、計算されたフィンガープリントと取得された一式のメタデータをそれぞれの部分に追加するように構成される。このように、分散データベースは、ファイル共有クライアントに存在するマルチメディアオブジェクトからの新しいフィンガープリントと一式のメタデータで更新される。それぞれのクライアントは、その自己のストレージに存在するオブジェクトを少なくとも含む分散データベースの部分を維持する。
更なる実施例において、フィンガープリント手段は、計算されたフィンガープリントと取得された一式のメタデータとを、ファイル共有ネットワークの他のファイル共有クライアントに送信するように構成される。このように、データベースに保存されたデータは、その部分を維持するように構成された任意のクライアントによって管理された部分に保存され得るように、ファイル共有ネットワークを介して分散され得る。
前述の実施例の改良において、他のファイル共有クライアントは、ファイル共有ネットワークのスーパーノード(super node)である。スーパーノード(super node)は、十分な帯域と処理能力とメモリを有するクライアントである。通常のクライアントは、スーパーノード(super node)に接続することによってネットワークに接続し、共有されるべきファイルのリストをスーパーノード(super node)に送信する。スーパーノード(super node)は複数のクライアントへの接続を有し、更に、複数の他のスーパーノード(super node)にも接続される。メモリと処理能力と帯域の点でより大きい能力を有するため、それは分散データベースの部分を管理するのにより適している。
更なる実施例において、他のファイル共有クライアントにマルチメディアオブジェクトを送信することと同時に前記送信が行われる。前記フィンガープリントは相対的に小さく(一般的なマルチメディアオブジェクトが数メガバイトであるのに対して10キロバイト程度)、クライアントの性能に影響を及ぼさない。このことは、ネットワークのクライアント上に任意の方法でフィンガープリントとメタデータを備えたデータベースを分散する方法を提供する。
更なる実施例において、フィンガープリント手段は、マルチメディアオブジェクトがストレージに保存されている時に、フィンガープリントを計算し、マルチメディアオブジェクトの一式のメタデータを取得するように構成される。この時にフィンガープリントを計算することにより、何らかの新しく取得されたマルチメディアオブジェクトのメタデータが自動的に分散データベースに追加されることが達成される。
多目的コンピュータを本発明によるファイル共有クライアントとして機能させるように構成されたコンピュータプログラム製品を提供することが、本発明の更なる目的である。
本発明による少なくとも1つのファイル共有クライアントを有するファイル共有ネットワークを提供することが、本発明の更なる目的である。
本発明の前記の及び他の形態が、図面に示される実施例から明らかになり、それを参照して説明される。
図面を通じて、同じ参照数字は、類似の又は対応する機能を示す。図面に示される機能のいくつかは、一般的にソフトウェアで実施され、従ってソフトウェアモジュール又はオブジェクトのようなソフトウェアの要素を表す。
図1は複数のファイル共有クライアント101、102、103、104及び105を有するファイル共有ネットワーク100を概略的に示したものである。ここではクライアント101-105の間の直接接続で物理ネットワークとして示されているが、ネットワーク100は概念上又は仮想のネットワークとしても考えられる。すなわち、全てのクライアント101-105が常に相互に物理的又はネットワーク的に直接接続される必要はない。必要なのは、“ネットワーク上”の1つのクライアントがファイル又はオブジェクトを他のクライアントから取得できることだけである。直接のクライアント間の接続が使用される時でも、全てのクライアントが他の全てのクライアントに接続される必要はない。
ネットワーク100は、クライアント101-105のためのディレクトリサービスを実行するサーバ110を有する場合がある。ファイル共有ネットワーク100に接続するため、クライアント101は、共有したいファイル(又はオブジェクト)のリストをサーバ110に送信する。サーバ110は、ネットワーク100に接続された全てのクライアントから受信するリストを結合する。他のクライアント102-105はサーバ110に接続し、結合されたリストを見る、又はリストの特定のオブジェクトを検索することができる。その後、探しているオブジェクトを有するクライアントにコンタクトし、それをそのクライアントから直接取得(又はダウンロード)することができる。このように、サーバ110はクライアント101-105の間のファイル又はオブジェクトの共有に直接関与しない。この方法は、世界的なNapsterのファイル共有ネットワークで周知である。
サーバ110なしでネットワーク100を実現することも可能である。その場合、クライアント101は、既にネットワーク100上にある1つ以上の他のクライアント102-105に接続することにより、ネットワーク100に接続する。クライアントは、それが接続されるクライアントに検索要求を送信することにより、ネットワークを検索する。前記クライアントは共有するオブジェクトのリストを調査し、要求されたオブジェクトがそのリストにある場合に結果を戻す。更に、要求は前記クライアントが接続された他のクライアントに転送される。このように、要求は、それが実行されるクライアントにより受信されるまで、又は全てのクライアントがそれを受信し、全てがそれを実行できないときまで、全ネットワーク100を通じて分散される。
そのような実施例は、例えばGnutellaのファイル共有ネットワークから知られている。この実施例の不利点は、ネットワーク100が拡張性のないことである。Gnutellaのようなネットワークは、現在は例えば100万のクライアントに対応できない。更に、多数の“遅い”コンピュータ、すなわちネットワーク100への限定された帯域、処理能力及び/又はメモリを備えたコンピュータが存在する場合に、ネットワークが遅くなる。
その他、クライアント101は、1つ以上の他のクライアント102-105に接続した後に、共有したいファイル又はオブジェクトのリストを前記他のクライアント102-105に送信し得る。前記リストは、ネットワーク100の全てのクライアントに渡される。このように、全てのクライアントが、どのクライアントがどの利用可能なファイル又はオブジェクトを有しているかを知り、そのクライアントに直接コンタクトし得る。
既知のKaZaaのファイル共有ネットワークもまた、サーバ110なしで動作するが、前述の問題を克服するために、2つの形式のクライアント:スーパーノード(super node)と“通常の”クライアントを用いる。スーパーノード(super node)は、十分な帯域と処理能力とメモリを有するクライアントである。通常のクライアントは、スーパーノード(super node)に接続することによりネットワークに接続し、共有するべきファイルのリストをスーパーノード(super node)に送信する。スーパーノード(super node)は複数のクライアントとの接続を有し、更に複数の他のスーパーノード(super node)に接続される。
スーパーノード(super node)は同時に通常のクライアントでもある。すなわち、ユーザにとって、そのコンピュータがスーパーノード(super node)であるという事実はユーザに気付かれない。ユーザがファイルを検索したいと思う場合に、そのクライアントは、現在接続しているスーパーノード(super node)(群)に要求を送信する。スーパーノード(super node)は、そのクライアントにより送信されたリストに存在する照合するファイルを戻す。更に、スーパーノード(super node)は、必要に応じて、Gnutellaの実施例で説明されたものと同様の方法で接続された全てのスーパーノード(super node)に要求を転送する。しかし、スーパーノード(super node)の間の接続は大きい帯域を有するため、この方法はGnutellaのネットワークより更に早い。更に、それは何百万ものクライアントにまで拡大し得る。
そのようなファイル共有ネットワークは、一般的にピアツーピア又はP2Pのファイル共有ネットワークと称され、非常に大きい人気を有する。前記ネットワークの周知の例は:Napster、Musiccity、Gnutella、Kazaa、Imesh及びBearshareがある。ユーザがそのパーソナルコンピュータに適切なクライアントソフトウェアをインストールすると、ファイルを共有することができ、他のユーザにより共有されたファイルをダウンロードすることができる。クライアント101-105は、インターネットのようなネットワークに接続される場合があり、それはファイル共有ネットワーク100の確立を促進する。クライアントは、ファイル又はオブジェクトを取得するために、例えば他のクライアントに直接のTCP/IP接続を使用し得る。
最も人気のあるネットワークでは、通常は500,000以上の人が同時に接続されている。これを書いている時点では、ほとんど音楽ファイル(多くの場合MP3形式)を共有しているが、映画の共有も人気を得ている。“マルチメディアオブジェクト”という用語は、音楽、曲、映画、TV番組、画像、及び他の形式のバイナリデータを含むファイルを示すために用いられるが、この方法でテキストデータも共有され得る。マルチメディアオブジェクトがいくつかの異なるファイルで構成され得ることも注意すべきである。
ネットワーク100はまた、分散データベースを有する。分散データベースは、いくつかのそれぞれの部分201-205で構成され、そのそれぞれがクライアント101-105のうちのそれぞれの1つにより維持される。このことは図2を参照して以下に説明される。
図2は、ファイル共有クライアントを更に詳細に示したものである。ファイル共有クライアント101は、その技術において周知の通り、好ましくはファイル共有ソフトウェア301が動作しているパーソナルコンピュータとして実現される。ファイル共有ソフトウェア301は、一般的に現代のオペレーティングシステムで利用可能なTCP/IPスタックのようなネットワークモジュール302を利用する。ストレージ303は、ファイル共有ソフトウェア301により共有される1つ以上のマルチメディアオブジェクトを有する。前記ストレージ303は、一般的にハードディスクのディレクトリである。いくつかの場合において、ストレージ303は、ダウンロードされたマルチメディアオブジェクトが保存される別の部分を有する場合がある。この部分は、一般的にディレクトリでもあるが、共有されるマルチメディアオブジェクトが保存されるディレクトリと必ずしも同じではない。
ファイル共有クライアント101はまた、マルチメディアオブジェクトからフィンガープリントを計算可能なフィンガープリントモジュール304を有する。前述の通り、フィンガープリントを計算する1つの方法は、国際特許出願WO02/065782(代理人管理番号PHNL010110)に開示されるが、当然ながら、フィンガープリントを計算する他の方法が用いられ得る。フィンガープリントモジュール304はまた、マルチメディアオブジェクトの一式のメタデータを取得する。マルチメディアオブジェクトを取得している際に一式のメタデータの取得が自動的に行われるように、多くの場合、この一式のメタデータは、マルチメディアオブジェクトに含まれ、又はそれに備えられる。
フィンガープリントモジュール304は、好ましくは1つ以上のハードウェア又はソフトウェアモジュールとして、例えばクライアント101で動作するファイル共有ソフトウェア301のプラグインモジュールとして実現される。
フィンガープリントモジュール304は、ストレージ303のマルチメディアオブジェクトからフィンガープリントを計算し得る。マルチメディアオブジェクトの一式のメタデータは、同様に、単にストレージ303でそれをマルチメディアオブジェクトから読み取ることにより取得され得る。例えば、普及しているMP3形式の音楽を備えたマルチメディアオブジェクトは、多くの場合にオブジェクトの終わりにID3の‘タグ’としてメタデータを有する。
マルチメディアオブジェクトのフィンガープリントの計算はCPUに負担をかけるが、過度のCPU能力を費やすことを回避するために配慮が行われなければならない。ユーザがシステムの通常の使用に干渉することがわかると、そうすることがファイル共有ソフトウェアのユーザを混乱させ得る。
フィンガープリントは、ユーザの要求により、又はその他バックグラウンドで計算され得る。後者の場合、共有ドライブ、又はまだ計算されていないフィンガープリントの新しいマルチメディアオブジェクトのディレクトリを定期的に読み取ることが望ましい。何らかのそのようなオブジェクトが見つかると、自動的にフィンガープリントが計算される。そのようなオブジェクトにメタデータが利用可能でない場合、ユーザが一式のメタデータを入力するように促され得る。
いずれにしても、フィンガープリントモジュール304がマルチメディアオブジェクトのフィンガープリントを計算し、マルチメディアオブジェクトの一式のメタデータを取得すると、フィンガープリントと一式のメタデータを分散データベース201-205に含める。好ましくは、フィンガープリントと一式のメタデータは、DBMSモジュール305により維持される部分201に含まれる。
フィンガープリントのデータベース維持(DBMS)モジュール305は、分散されたフィンガープリントのデータベースの部分201を維持する。データベース201はフィンガープリント及び関連する一式のメタデータを有する。当然ながらストレージ303が1つの特定のマルチメディアオブジェクトの複数のコピーを有さない場合に、データベース201は、一般的に共有マルチメディアオブジェクト毎にフィンガープリント及び1つの関連する一式のメタデータを有する。
更に、データベース201は、ネットワーク100の他のファイル共有クライアント102-105からファイル共有クライアント101によりダウンロードされたマルチメディアオブジェクトのフィンガープリントとメタデータで拡張され得る。マルチメディアオブジェクトのフィンガープリントは、そのオブジェクトがダウンロードされている間に計算され得る。フィンガープリントを計算するいくつかの方法は、マルチメディアオブジェクトの小さい部分で同時に動作する。例えば前述の欧州特許出願は、マルチメディアオブジェクトの音声データの3秒毎に“サブフィンガープリント(sub-fingerprint)”を計算し、全てのサブフィンガープリント(sub-fingerprint)から実際のフィンガープリントを構成する。3秒相当のデータが受信されると、サブフィンガープリント(sub-fingerprint)の計算が開始し得る。
そのオブジェクトのメタデータが同様に利用可能である場合、オブジェクトが完全にダウンロードされる前に、フィンガープリントとメタデータがデータベース201に含まれ得る。この処理の間にフィンガープリントが既にデータベース201に存在することが判断されると、ユーザが前記特定のマルチメディアオブジェクトのコピーを所有している可能性が高い。ユーザは、ダウンロードを中断できるように、警告され得る。
ファイル共有クライアント101が他のクライアント102からマルチメディアオブジェクトをダウンロードしている場合に、クライアント101はまた、クライアント102から関連する一式のメタデータと共に1つ以上のフィンガープリントをダウンロードし得る。前記フィンガープリントは相対的に小さく(一般的なマルチメディアオブジェクトでは数メガバイトであるのに対して10キロバイト程度)、クライアント101の性能に影響を及ぼさない。このことは、ネットワーク100のクライアント101-105上に任意の方法でフィンガープリントとメタデータを備えたデータベースを分散する方法を提供する。
KaZaaのファイル共有ネットワークにおいて、スーパーノード(super node)は、好ましくはネットワーク100上にフィンガープリントとメタデータを分散するために用いられる。Napsterのファイル個湯夕ネットワークのようなネットワークにおいては、フィンガープリントを分散する中央サーバが存在し得る。
正しいメタデータを取得することも、スーパーノード(super node)又は中央サーバにより支援され得る。クライアントは、特定のフィンガープリントの検索要求を、それが接続されるスーパーノード(super node)に送信する。スーパーノード(super node)は他のスーパーノード(super node)に要求を渡す。データベースで一式のメタデータをフィルタリングし、的確な一式を判断する中央サーバがない場合は、スーパーノード(super node)は、好ましくは場合によってクエリに対する複数の回答を受け取る。スーパーノード(super node)は、多数決又は他の技術を適用し、要求を送信したクライアントに戻される的確な一式のメタデータを判断し得る。
例えば、特定のフィンガープリントの検索要求に応じて受信された一式のメタデータが以下の場合を仮定する。
1.(アーティスト=“Jewwel”,題名=“Hands”)
2.(アーティスト=“Jewel”,題名=“Hands”)
3.(アーティスト=“Jewel”,題名=“Hnds”)
4.(アーティスト=“Jewel”,題名=“Hands”)
5.(アーティスト=“Jewel”,題名=“Hands”)
この例において、5つの一式のうちの4つが“Jewel”としてアーティストの名前を供給し、1つのみが“Jewwel”としてその名前を供給することが容易にわかる。過半数で決めるという簡単な方法を用いて、的確な一式のメタデータは、“Jewel”としてアーティストの名前を供給する。同様に、5つの一式のうちの4つが“Hands”として曲の題名を供給し、的確な一式のメタデータはまた、“Hands”として曲の題名を供給する。当然ながら、同様の方法が、アルバムの題名や発行年度や分野やアーティストのウェブサイトのURL等のような、一式に含まれるメタデータの他の形式に用いられ得る。
その他、複数の候補の値から的確な値を自動的に判断する更に進んだ技術もまた、当然ながら用いられ得る。そのような技術は一般的にインテリジェント・エージェントの分野にあり、エージェントにより受信された情報からノイズを除去するために用いられる。それには決定樹の枝刈りと相互検証が含まれる。“十分な数”を正確に構成するものは、使用される技術に依存する。
全ての一式のメタデータが必ずしも完全である必要がないことが述べられた。例えば、1つの一式のメタデータは特定の曲の題名とアーティストの名前のみを有する場合があり、他のものは曲が取得されたアルバムの題名とそのアルバムの発行年度を有する場合がある。前述の処理は、個々の形式のメタデータで実行され、例えば全ての利用可能な題名に基づいて題名について1度実行され、全ての利用可能なアーティストの名前に基づいてアーティストの名前について1度実行され、発行年度について1度実行され、以下同様である。このように、できるだけ広範囲の的確な一式のメタデータが取得され、すなわち題名とアーティストのみならず発行年度も有する。そのような広範囲の的確な一式のメタデータは最も有用である。
その後、スーパーノード(super node)は、クライアントの1つがクエリを再度送信する毎に、全ての他のスーパーノード(super node)に再度クエリを渡さなければならないことを回避するために、的確な一式で自分のデータベースを更新し得る。しかし、このことはその情報がいつか時代遅れになるという危険を冒す。
DBMSモジュール305によって維持される分散データベース201の部分の大きさは、それが動作するパーソナルコンピュータの性能に依存し得る。例えば、帯域制限、CPU速度及び/又は利用可能なワーキングメモリ(RAM)が考慮に入れられ得る。このように、遅いコンピュータは、大きいフィンガープリントのデータベースサーバの負担を負わない。
ファイル共有クライアント101-105は、データベース201-205の少なくとも一部を他のものに利用可能にし得る。このことは、例えばクライアントがフィンガープリントを送信し、返信として一式のメタデータを受信する検索インタフェースを提供することによって行われ得る。送信されたフィンガープリントに関連する一式のメタデータをデータベースから検索する多様な方法は、前述の国際特許出願WO02/065782(代理人管理番号PHNL010110)と、国際特許出願WO02/058246(代理人管理番号PHNL010532)から知られる。他の方法もまた、当然ながら使用され得る。
特定のクライアント101が、分散データベースのその部分201に送信されたフィンガープリントに関連する一式のメタデータを見つけることができない場合、それは、送信されたフィンガープリントを、ファイル共有ネットワーク100に接続された他のクライアント102に転送し得る。ネットワーク100がスーパーノード(super node)を有する場合、他のクライアント102は、好ましくはファイル共有ネットワーク100のスーパーノード(super node)である。他のクライアント102が前記一式をその部分202に見つけることができない場合、送信されたフィンガープリントを同様に転送し、クライアント101-105のうちの1つがその部分201-205に前記一式のメタデータを見つけるまで、又はファイル共有ネットワーク100の全てのクライアント101-105が前記一式を見つけることができない時まで続く。
分散データベース201-205のコンテンツは、無料で又は支払いを行う加入者にのみ利用可能にできる。その他、データベースで実行されるクエリ毎に料金が請求され得る。フィンガープリントの送信に応じてクライアントに戻されるメタデータの量もまた変化し得る:例えば、無料のサービスはアーティストと題名のみを戻し、加入者に基づくサービスはデータベースで利用可能な全てのメタデータを戻す。
前述の実施例は本発明を限定するのではなく、それを説明するものであり、当業者は特許請求の範囲から逸脱することなく多くの他の実施例を設計することができることに注意すべきである。
特許請求の範囲において、括弧の間にある何らかの参照記号は、特許請求の範囲を限定するものとして解釈されるべきではない。“有する”という用語は、特許請求の範囲に挙げられたもの以外の要素又はステップの存在を除外するものではない。要素の前の“1つ”という用語は複数の前記要素の存在を除外するものではない。
本発明は、いくつかの別個の要素を有するハードウェアを用いて、及び適切にプログラムされたコンピュータを用いて実施され得る。請求項がいくつかの手段を列挙している装置において、前記手段のいくつかは全く同一のハードウェアのアイテムに具体化され得る。特定の方法が相互に異なる従属請求項に記載されているという単なる事実は、この方法の組み合わせが有利になるように使用できないことを意味するものではない。
複数のクライアントを有するファイル共有ネットワークを概略的に示したものである。 ファイル共有クライアントを更に詳細に概略的に示したものである。

Claims (11)

  1. 複数のマルチメディアオブジェクトのそれぞれのフィンガープリント及び関連する一式のメタデータを有するデータベースを維持する方法であって、
    前記複数のマルチメディアオブジェクトを共有するように構成されたファイル共有ネットワークに接続されたそれぞれのファイル共有クライアント上に、前記データベースのそれぞれの部分を分散することを有する方法。
  2. 1つ以上のマルチメディアオブジェクトを保存するストレージと、
    ファイル共有ネットワークの他のファイル共有クライアントと前記ストレージのマルチメディアオブジェクトを共有する共有手段と、
    フィンガープリントを計算し、前記共有手段により共有される前記マルチメディアオブジェクトの一式のメタデータを取得し、前記計算されたフィンガープリントと取得された一式のメタデータとを前記ファイル共有ネットワークに接続された前記ファイル共有クライアント上に分散されたデータベースに追加するフィンガープリント手段と
    を有するファイル共有クライアント。
  3. 請求項2に記載のファイル共有クライアントであって、
    前記分散されたデータベースの部分を維持するDBMS手段を更に有するファイル共有クライアント。
  4. 請求項3に記載のファイル共有クライアントであって、
    前記DBMS手段により維持される前記分散されたデータベースの前記部分の大きさが、そのクライアントが動作するコンピュータシステムの性能に依存するファイル共有クライアント。
  5. 請求項3に記載のファイル共有クライアントであって、
    前記DBMS手段が、前記計算されたフィンガープリントと取得された一式のメタデータを前記それぞれの部分に追加するように構成されたファイル共有クライアント。
  6. 請求項2に記載のファイル共有クライアントであって、
    前記フィンガープリント手段が、前記計算されたフィンガープリントと前記取得された一式のメタデータとを、前記ファイル共有ネットワークの他のファイル共有クライアントに送信するように構成されたファイル共有クライアント。
  7. 請求項6に記載のファイル共有クライアントであって、
    前記他のファイル共有クライアントが、前記ファイル共有ネットワークのスーパーノード(super node)であるファイル共有クライアント。
  8. 請求項6に記載のファイル共有クライアントであって、
    前記他のファイル共有クライアントにマルチメディアオブジェクトを送信することと同時に前記送信が行われるファイル共有クライアント。
  9. 請求項2に記載のファイル共有クライアントであって、
    前記フィンガープリント手段は、前記マルチメディアオブジェクトが前記ストレージに保存されている時に、前記フィンガープリントを計算し、前記マルチメディアオブジェクトの前記一式のメタデータを取得するように構成されたファイル共有クライアント。
  10. 多目的コンピュータを請求項2に記載のファイル共有クライアントとして機能させるように構成されたコンピュータプログラム製品。
  11. 請求項2に記載の少なくとも1つのクライアントを有するファイル共有ネットワーク。
JP2003548122A 2001-11-29 2002-10-31 フィンガープリントのデータベースの維持方法及びシステム Pending JP2005510806A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01204599 2001-11-29
PCT/IB2002/004605 WO2003046760A2 (en) 2001-11-29 2002-10-31 Fingerprint database maintenance method and system

Publications (2)

Publication Number Publication Date
JP2005510806A true JP2005510806A (ja) 2005-04-21
JP2005510806A5 JP2005510806A5 (ja) 2006-01-05

Family

ID=8181326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003548122A Pending JP2005510806A (ja) 2001-11-29 2002-10-31 フィンガープリントのデータベースの維持方法及びシステム

Country Status (10)

Country Link
US (1) US20050108242A1 (ja)
EP (1) EP1451723A2 (ja)
JP (1) JP2005510806A (ja)
KR (1) KR100916162B1 (ja)
CN (1) CN1596407A (ja)
AU (1) AU2002348960A1 (ja)
BR (1) BR0206784A (ja)
CA (1) CA2468474A1 (ja)
MX (1) MXPA04005037A (ja)
WO (1) WO2003046760A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011517816A (ja) * 2008-03-31 2011-06-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 分散型媒体フィンガープリントリポジトリ

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829368B2 (en) * 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US7711564B2 (en) * 1995-07-27 2010-05-04 Digimarc Corporation Connected audio and other media objects
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US7302574B2 (en) * 1999-05-19 2007-11-27 Digimarc Corporation Content identifiers triggering corresponding responses through collaborative processing
US8121843B2 (en) * 2000-05-02 2012-02-21 Digimarc Corporation Fingerprint methods and systems for media signals
AU2002232817A1 (en) * 2000-12-21 2002-07-01 Digimarc Corporation Methods, apparatus and programs for generating and utilizing content signatures
US7248715B2 (en) * 2001-04-06 2007-07-24 Digimarc Corporation Digitally watermarking physical media
US7046819B2 (en) 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
US7421096B2 (en) * 2004-02-23 2008-09-02 Delefevre Patrick Y Input mechanism for fingerprint-based internet search
WO2005022397A1 (en) * 2003-08-28 2005-03-10 Trihedron Co., Ltd. Method of data synchronization in multiplayer network games
US20070135907A1 (en) 2003-10-02 2007-06-14 The Regents Of The University Of California Stent with expandable foam
US7961650B2 (en) 2004-02-16 2011-06-14 Christopher Michael Davies Network architecture
EP1721414A4 (en) * 2004-02-16 2011-06-29 Chrsitopher Michael Davies NETWORK ARCHITECTURE
US20100023499A1 (en) * 2007-12-24 2010-01-28 Brian David Johnson System and method for a content fingerprint filter
US8776244B2 (en) 2007-12-24 2014-07-08 Intel Corporation System and method for the generation of a content fingerprint for content identification
WO2010129630A1 (en) 2009-05-08 2010-11-11 Dolby Laboratories Licensing Corporation Storing and searching fingerprints derived from media content based on a classification of the media content
US8121993B2 (en) * 2009-10-28 2012-02-21 Oracle America, Inc. Data sharing and recovery within a network of untrusted storage devices using data object fingerprinting
CN101742702B (zh) * 2009-12-31 2014-03-19 中兴通讯股份有限公司 移动互联网业务共享系统及方法
US9626456B2 (en) * 2010-10-08 2017-04-18 Warner Bros. Entertainment Inc. Crowd sourcing for file recognition
US20140280272A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Media content substitution
US10015012B2 (en) * 2013-07-03 2018-07-03 Red Hat, Inc. Precalculating hashes to support data distribution
KR101723171B1 (ko) 2016-09-19 2017-04-05 주식회사 코베아 버너

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3662161A (en) * 1969-11-03 1972-05-09 Bell Telephone Labor Inc Global highly parallel fast fourier transform processor
DE3375777D1 (en) * 1982-12-17 1988-04-07 Hoechst Ag Process and apparatus for the manufacture of alkali metal polyphosphates
US6715100B1 (en) * 1996-11-01 2004-03-30 Ivan Chung-Shung Hwang Method and apparatus for implementing a workgroup server array
US7756892B2 (en) * 2000-05-02 2010-07-13 Digimarc Corporation Using embedded data with file sharing
US6108703A (en) * 1998-07-14 2000-08-22 Massachusetts Institute Of Technology Global hosting system
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
KR20010090014A (ko) * 2000-05-09 2001-10-18 김대연 네트워크 보호 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011517816A (ja) * 2008-03-31 2011-06-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 分散型媒体フィンガープリントリポジトリ

Also Published As

Publication number Publication date
KR20040062975A (ko) 2004-07-09
MXPA04005037A (es) 2004-08-11
EP1451723A2 (en) 2004-09-01
WO2003046760A3 (en) 2004-06-17
AU2002348960A1 (en) 2003-06-10
WO2003046760A2 (en) 2003-06-05
BR0206784A (pt) 2004-02-10
CN1596407A (zh) 2005-03-16
US20050108242A1 (en) 2005-05-19
KR100916162B1 (ko) 2009-09-08
CA2468474A1 (en) 2003-06-05

Similar Documents

Publication Publication Date Title
KR100978023B1 (ko) 핑거프린트 데이터베이스 업데이트 방법, 클라이언트 및 서버
JP2005510806A (ja) フィンガープリントのデータベースの維持方法及びシステム
US9348918B2 (en) Searching content in distributed computing networks
Ng et al. Peerdb: A p2p-based system for distributed data sharing
US7711729B2 (en) Searching a document based on a customer defined metadata schemata
US7487551B2 (en) Access to content addressable data over a network
US20110143650A1 (en) Playing digital content from satellite radio media based on taste profiles
US20150039629A1 (en) Method for storing and searching tagged content items in a distributed system
EP1573592A1 (en) Monitor file storage and transfer on a peer-to-peer network
US20050131871A1 (en) Multi-tiered structure for file sharing based on social roles
JP2007012077A (ja) ネットワークを介したコンテンツをアドレス可能なデータに対するアクセス
JP2004005491A (ja) ピア・ツー・ピア・ファイル共有の方法及びその装置
KR20040072640A (ko) 콘텐트 오브젝트 디텍토리들에서의 리던던시 결정
Boncz et al. AmbientDB: relational query processing in a P2P network
Brunner et al. Network-aware summarisation for resource discovery in P2P-content networks
US7660876B2 (en) Electronic file management
Shavitt et al. Estimating peer similarity using distance of shared files.
KR100797898B1 (ko) 그리드 컴퓨팅을 이용한 사용자 디지털컨텐츠의 저작권필터링 시스템 및 방법
Mima et al. A Novel Method for Content Consistency and Efficient Full-text Search for P2P Content Sharing Systems
Zhang Efficient indexing and query processing in distributed search engines
Hsu Scenarios for Music Information Retrieval: A Value-Based Model for P2P Network Community
HK1146967B (en) System and method for advertising on a peer-to-peer network
HK1146967A1 (en) System and method for advertising on a peer-to-peer network

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051027

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090107

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090519