JP2001511991A - マルチメディア・レコードのためのラベル・インターバル・データの格納および取得の方法及び装置 - Google Patents
マルチメディア・レコードのためのラベル・インターバル・データの格納および取得の方法及び装置Info
- Publication number
- JP2001511991A JP2001511991A JP52049099A JP52049099A JP2001511991A JP 2001511991 A JP2001511991 A JP 2001511991A JP 52049099 A JP52049099 A JP 52049099A JP 52049099 A JP52049099 A JP 52049099A JP 2001511991 A JP2001511991 A JP 2001511991A
- Authority
- JP
- Japan
- Prior art keywords
- interval
- data
- interval data
- intervals
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 21
- 238000002372 labelling Methods 0.000 claims abstract description 36
- 238000004891 communication Methods 0.000 claims abstract description 9
- 230000005540 biological transmission Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/567—Multimedia conference systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/12—Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
(57)【要約】
複数のインターバルを含む会議電話呼をデジタルに記録および再生する通信会議システムを開示する。この通信会議システムは、会議呼の間に第1組の複数のインターバルを検出するスキム・サーバと2組の複数のインターバルを検出する会議ブリッジとを含む。インターバル・データベース・サーバは、全ての検出されたインターバルのラベル付けインターバル・データを発生し、このラベル付けインターバル・データをデータベースに格納する。ラベル付けインターバル・データは、各インターバルを規定するインターバル・データ・エレメントを含む。会議呼を記録した後に、分類された基準に基づいて、ラベル付けインターバル・データを検索および取得することができる。取得されたラベル付けインターバル・データに関連する記録された会議呼の部分も、取得および再生することができる。これは、記録された会議呼の所望部分の容易な取得および再生に役立つ。更に、会議呼の再生の間、ユーザ・インタフェースを発生する。ユーザ・インタフェースは、格納されたラベル付けインターバル・データを表示する。ユーザは、ユーザ・インタフェースの部分を選択することによって、会議呼の所望部分を容易に選択またはスキップすることができる。
Description
【発明の詳細な説明】
マルチメディア・レコードのためのラベル・インターバル・
データの格納および取得の方法及び装置
発明の分野
本発明は、マルチメディア・データの格納および取得を対象とする。更に特定
すれば、本発明は、データベース内のラベル付けされたインターバル・データの
格納および取得を対象とする。
発明の背景
文字による通信の記録とは異なり、音声による通信のレコードは、デジタル音
声の格納が容易に行われ得るにもかかわらず、格納は言うまでもなく、記録され
ることはまれである。現在、デジタルに記録された音声または他の種類のマルチ
メディア情報(例えば映像)のギガバイトおよびテラバイトさえも、格納するこ
とは実行可能である。長期保管の目的以外に、ユーザが関心を持ち得る格納デー
タの部分のみを識別および取得することが可能な機構を有せずにかかるデータを
格納することには、実際的な理由はない。
データベースに格納されたデジタル音声レコードの検索および取得に固有の問
題は、特定のレコードの位置を突き止めるためにデータベースに問い合わせる従
来の手法から生じる。ほとんどのデータベース問い合わせは、検索対象のレコー
ド内における指定された特徴の有無に基づく論理問い合わせである。データベー
ス問い合わせの有用性を増すためにブール論理およびファジイ論理が用いられて
いるが、これらの技法は、1つかそれ以上の言葉、指標、または他
の識別特性が、検索対象のレコードに存在するか(または存在しないか)という
、極めて典型的なデータベース問い合わせの基本的な原則を単に拡張したに過ぎ
ない。
デジタル音声レコードは、音声−テキスト変換もしくはトランスクリプション
によってテキストに変換することなく、またはその他の方法で解析することなく
、従来のデータベース問い合わせ技法を用いて位置決めおよび/または識別する
ことはできない。なぜなら、記録した音声の選択部分に、単語(または句)が現
われるか否かを判定することは現実的でないからである。従って、トランスクリ
プションを行っていないデジタル音声レコードの調査は、多くの場合、対象の言
葉または複数の言葉が聞こえるまでデジタル記録音声を傾聴することに限られる
。しかしながら、これは、かなりの程度の無関係または重要でない音声の傾聴を
必要とすることが多く、何ら十分な説明を与えずに極めて長時間を要する可能性
がある。更に、デジタル音声レコードが3人以上の話者のものである場合、デジ
タル音声レコードはしばしば長い一時的停止を含み、話し手を識別することは不
可能でないにしても難しい場合が多く、記録デジタル音声において特定の部分を
識別する問題を更に悪化させている。
デジタル音声レコードを別個のデジタル・レコーディングに分割した場合にも
、各レコーディングは個別にアクセス可能であると共に識別され、デジタルに記
録されたデータは使用が限られている。例えば、デジタル格納媒体に10個の会
議呼を記録した場合、ユーザは、探している情報がある特定の会議呼内にあるこ
とを運良く知っていたならば、特定の日付の当該特定の会議呼を位置決めするこ
とができるであろう。そうであったとしても、ユーザはやはり、当
該会議呼のレコーディング全体を聞かなければならない。会議呼の特定の参加者
が行った特定のコメントをユーザが識別したい場合に、当該ユーザが会議呼全体
を聞かなければならないことは、極めて非効率的である。更に、ユーザが、その
人物が発言した会議呼の具体的な日付および時間を知らない場合、ユーザは、所
望の情報を見出す前に、いくつかの会議呼レコーディングを聞かなければならな
いこともあり得る。明らかに、レコーディングの格納数が最小数よりも多くなる
と直ちに、ユーザが会議呼のレコーディングを聞くことによってのみ所望の情報
を位置決めすることは実用的でなくなる。
前述の説明に基づいて、格納されたデジタル音声および他のデジタル・マルチ
メディア・レコードを容易に識別、位置決め、および取得するための方法および
装置に対する要望がある。
発明の概要
発明の一実施形態は、複数のインターバルを含む会議電話呼をデジタルに記録
および再生するための通信会議システムである。この通信会議システムは、会議
呼の間に第1組の複数のインターバルを検出するスキム・サーバと第2組の複数
のインターバルを検出する会議ブリッジとを含む。インターバル・データベース
・サーバは、全ての検出されたインターバルのラベル付けインターバル・データ
を発生し、このラベル付けインターバル・データをデータベースに格納する。ラ
ベル付けインターバル・データは、各インターバルを規定するインターバル・デ
ータ・エレメントを含む。会議呼を記録した後に、分類された基準に基づいて、
ラベル付けインターバル・データを検索および取得することができる。取得され
たラベル付けインターバル・データに関連する記録された会議呼の部分も、取得
および再生することができる。これは、記録された会議呼の所望部分の容易な取
得および再生に役立つ。
更に、会議呼の再生の間、ユーザ・インタフェースを発生する。ユーザ・イン
タフェースは、格納されたラベル付けインターバル・データを表示する。ユーザ
は、ユーザ・インタフェースの部分を選択することによって、会議呼の所望部分
を容易に選択またはスキップすることができる。
図面の簡単な説明
図1は、本発明の一実施形態による通信会議システムを示す。
図2は、記録された会議に関連するラベル付けインターバル・データを形成す
るインターバル・データ・エレメントのフォーマットを示す。
図3は、本発明の一実施形態による会議再生文書を示す。
図4は、いかにして重複インターバルを表示するかを詳細に示す。
詳細な説明
本発明の一実施形態では、記録されたデジタル音声または他のマルチメディア
・データ内のインターバルを、明確に識別すると共にラベル付けする。ラベル付
けインターバル・データが提供する機構によって、ユーザは、デジタルに記録さ
れたマルチメディア内のインターバルを明確に識別することができ、当該インタ
ーバルを識別した後に、これと、所望の特徴を共有する他のインターバルとを取
得することができる。
図1は、本発明の一実施形態による通信会議システムを示す。通信会議システ
ム200は、通信会議呼および関連するラベル付けインターバル・データを記録
および格納する。通信会議システム
200は、更に、格納したラベル付けインターバル・データを用いて、記録した
通信会議を再生することができる。
通信会議システム200の主な構成要素は、会議レコーダ110、スキム・サ
ーバ55、インターバル・データベース(「IDB」)・サーバ65、およびJ
avaユーザ・インタフェース85である。
通信会議システム200において、複数の電話31、32、および33は、公
衆交換電話網(「PSTN」)40を介して相互接続されている。1人以上の個
人が、各電話31ないし33を介して通信会議に参加し得る。参加者は、彼らが
電話をかけている電話機によって、あるいは通信会議の間の音声認識または他の
形態の識別によって、識別され得る。
通信会議は、会議ホストがWebRoomサーバ50上のWebRoomイン
タフェースにアクセスすることによって開始することができる。WebRoom
インタフェースは、参加者の通信会議への積極的な追加および/または通信会議
からの消去を可能とする機構を提供する。一実施形態では、通信会議の全参加者
のためのWebRoomインタフェースは、Hyper−Text Markup Language(「
HTML」)文書による通信会議の双方向制御を与えるHyper Text Transport P
rotocol Web Server(「Httpd」)70上のCommon Gateway Interface(「
CGI」)プログラム60として実施される。HTML文書は、Netscape(登録
商標)NavigatorまたはInternet Explorer(登録商標)等のウエブ・ブラウザ9
0を介して、会議ページ80としてアクセス可能である。
記録時には、会議ホストは、WebRoomサーバ50を用いて、会議の書記
にダイアルする。会議の書記は、通信会議の追加の参加
者として機能する。同時に、会議レコーダ110はIDBサーバ65に命令して
、この特定のレコーディングに関する全データを格納するための「倉庫」と呼ば
れる新しい収集点を生成させ、更に、スキム・サーバ55に命令して、例えばDi
alogic Corp.のDialogicボード57またはその同等物を用いて、オーデ
ィオ・ファイルの記録を開始させる。通信会議システム200内の倉庫は、Open
Database Connectivity(「ODBC」)インタフェース36に結合された構造
化問い合わせ言語(「SQL」)データベース35とすることができる。会議が
行われている間、会議ブリッジ100は、呼制御イベント(例えば、どの参加者
が発言中かということ、新しい参加者が加わったこと等)を検出し、これらのイ
ベントをウエブルーム・サーバ50および会議レコーダ110を介して新しい倉
庫(すなわちSQLデータベース35)に送出する。その間、スキム・サーバ5
5は、音声における一時的停止を検出し、これらのイベントも倉庫に加える。会
議ブリッジ100およびスキム・サーバ55の双方によって検出されたイベント
は、「インターバル」と呼ばれる。
通信会議システム200において記録された会議を再生する場合、ユーザはJ
avaユーザ・インタフェース85を稼働して、IDBサーバ65を介してアク
セスするレコーディングを選択する。ユーザ・インタフェース85は、当該レコ
ーディングのラベル付けインターバル・データを取得し、それらを用いて、視覚
的なイベント・タイム・ラインを表示する。ユーザは電話番号を入力し、これが
スキム・サーバ55に受け渡されるので、これがDialogicボード57を
介して会議の再生のためにユーザの電話機に電話をか
けることができる。ユーザの電話機でオーディオが再生されると、Javaユー
ザ・インタフェース85は、グラフィック表示を連続的に更新し、いかにしてス
キム・サーバ55を用いてレコーディングを再生するかを制御する。本発明の一
実施形態では、Javaユーザ・インタフェース85および会議レコーダ110
のような全クライアントは、CORBAアプリケーション・プログラミング・イ
ンタフェースによって、スキム・サーバ55およびIDBサーバ65と通信する
。CORBAを選択した理由は、異なるプラットフォームで実行する異なる言語
で書かれたプログラム間の単純なインタフェースを可能とすることである。本発
明の一実施形態では、サーバ50および55ならびに会議レコーダ110の双方
は、C++で書かれ、Sun Solarisプラットフォームで実行する。
スキム・サーバ55は、以下の機能を実行する。
1. 電話回線からファイルにオーディオを記録する。
2. 記録中に音声イベントを検出し、それらをデータベースに記入する。
3. ファイルから電話回線に、
−レコーディング内のいかなる箇所からも、
−様々な速度で、
−一時的停止を除去して、または除去せずに、
再生を行う。
一実施形態では、スキム・サーバ55は、標準的なボイス・メール・サーバと
同じ形式のハードウエアに基づき、多くの同一機能を実行する。スキム・サーバ
55と、より通常のボイス・メール・サーバとの間の1つの相違点は、スキム・
サーバが、音声イベント
を処理し、それらをIDBサーバ65に記入することであり、更に、オーディオ
・ファイルのどの部分を再生し、どの部分をスキップするかについて優れた制御
を与えることである。
IDBサーバ65の機能の1つは、記録した会議に関するラベル付けインター
バル・データを格納および取得することである。これは、発言者、音声内の一時
的停止、電話呼の制御データ等、音声内の特定のインターバルについての特性を
記述するデータである。これは、映像シーンの変化にマークを付すインターバル
を必要とするアプリケーションに、または自動音声認識出力をレコーディングに
関連付けるアプリケーションに、更に拡張することができる。ラベル付けインタ
ーバル・データは、多数の異なるアプリケーションによって生成、格納、および
取得することができる。生の音声データから自動的に得られるものもあれば、ユ
ーザ・アクティビティの副作用であるものもあり、更に、記録時または再生時に
手動で入力し得るものもある。
図2は、記録した会議に関連するラベル付けインターバル・データを形成する
インターバル・データ・エレメント130のフォーマットを示す。記録した会議
の間の全インターバルは、インターバル・データ・エレメント130に関連付け
られている。一実施形態では、各インターバル・データ・エレメント130は、
以下を含む。
1. レコーディングIDまたは倉庫122:インターバルに関連するレコーデ
ィングおよび、レコーディングを格納する収集点を示す。
2. 開始時間123:アプリケーションは、絶対時間および、レコーディング
開始時間に対して相対的な時間の双方を必要とする。
相対時間の方がコンパクトであり、絶対開始時間がレコーディングと共に格納さ
れる限り、絶対時間への変換が容易である。
3. 持続時間または終了時間124。
4. 種類:このインターバルの意味を識別するコード。これが音声内の一時的
停止であるのか、シーンの変化であるのか等。
5. 種類特定データ値126。このデータは、種類に応じて、文字列、数字、
URL等とすることができる。
ラベル付けインターバル・データは、一度に2つ以上を、格納、取得、および
操作することができなければならない。アプリケーションによっては、開始時間
および終了時間を除く全てを共有する大きいインターバル集合を扱うものもある
(例えば、特定の人物が発言している全時間)。
アプリケーションは、いかなる時でも、すなわちレコーディングの開始前、レ
コーディング中、およびその後も、データベース内にインターバル・データを格
納することができなければならない。例えば、通信会議では、電話の前には発呼
者のidおよび呼び出しイベントを記録し、電話中には発言者を記録し、電話後
にはその電話についての注釈を行うことが必要であり得る。アプリケーションに
よっては、レコーディングの進行中に(例えば現在進行中の会議に追いついて)
、不完全なインターバル・データを表示する必要があるので、開始しているがま
だ終了していないインターバルを記入し、後に終了時間を記入することが可能で
なければならない。また、例えばインターバル・データを他のデータと再編成す
るために、当該インターバル・データを調整することが可能でなければならない
。
イベントをIDBサーバ65に記入する全てのアプリケーション
は、各インターバルの開始時間および終了時間のために、精密なミリ秒オフセッ
トを指定しなければならない。全オフセットは、レコーディングの絶対開始時間
からのものである。リアルタイムで異なる機械からインターバルを記入するには
、イベントを記入している全クライアントがクロックを同期している必要がある
ので、これらの機械の全てにおいて、標準的なネットワーク時間プロトコル(「
NTP」)ソフトウエアを実行する。
閲覧アプリケーション、検索アプリケーション、および再生アプリケーション
は、インターバル・データのサブセットを問い合わせおよび表示する必要がある
。本発明によって対応可能な問い合わせの例は、以下を含む。
・ 時間および種類に基づいて格納された、特定のレコーディングの全インター
バル・データ。
・ 特定の値または特定の範囲内の値を有する特定の種類の全インターバル。
・ ある絶対時間または相対時間範囲内のインターバル。
・ 特定の持続時間のインターバル。
本発明は、論理/設定オペレーションを提供する。例えば、人物Aまたは人物
Bが発言していた時のレコーディングの部分のみをユーザが見ることおよび/ま
たは聞くことを望み、更に、一時的停止を全て除外することを望むと仮定する。
これは、3つの問い合わせを行うことによって表現可能である。すなわち、Aが
発言していた時のインターバル(Aを設定)、Bが発言していた時のインターバ
ル(Bを設定)、および一時的停止インターバル(Pを設定)である。所望の設
定は、「A結合B、Pを除く」として表現可能であ
り、または、これらの設定が長いビット・マスクと考えられる場合には、これら
は論理演算(A B)&(P)として記述することができる。
インターバルの種類によっては、明確な開始時間および終了時間を有しない場
合がある。イベントの正確な時間が明白でないので、各時間増分における2値の
オン/オフ状態の代わりに、経時的な関連確率曲線を有するデータもある。自動
音声認識からの出力(例えば音素格子)は、いずれかの所与の時点でどの単語が
発言されているかについてのいくつかの重複する仮説を含む可能性がある。本発
明の一実施形態では、IDBサーバ65は、「ファジイ」インターバルに対応す
る。別の実施形態では、IDBサーバ65は、種類特定の数値データ・フィール
ドの確率値と共に2値のインターバルを用いて、ファジイ・インターバルと同様
の効果を達成するが、ファジイ論理演算は行わない。
単語と時間との間でいかに精密なマッピングが所望であるかに応じて、おそら
くインターバル当たり1文、またはインターバル当たり1語で、トランスクリプ
ションを、インターバル・データとして格納可能である。トランスクリプション
は、クローズド・キャプションの文字、より高品質のオフ・ライン・トランスク
リプション、またはより低品質の自動音声認識システムから生成したものとする
ことができる。
通信会議システム200は、会議再生文書を用いて、記録した会議の再生を行
う。このシステムは、会議に関連した格納ラベル付けインターバル・データを利
用する。図3は、本発明の一実施形態による会議再生文書300を示す。会議再
生文書300は、図1の
Javaユーザ・インタフェース85によるJavaアプレットとして実施され
る。これは、タイム・ライン・ウインドウ315と呼ぶ領域内の水平時間軸にプ
ロットした一連のカラー・コード・インターバル(例えばインターバル305お
よび310)のような、レコーディングの視覚構造化を用いる。呼の各参加者(
例えば参加者316ないし320)には、別個のタイム・ラインを割り当てて、
当該人物に関連した全てのラベル付けインターバル(例えば、ダイアル中、接続
中、無言、発言中、等)をグラフィック表示する。
図4は、いかにして重複するインターバルを表示するかを詳細に示す。図4に
示すように、1度に1つの各インターバル種類をプロットすることにより、発言
者バーから開始して、文書は、同一ライン上に重複するインターバルを表示する
。
再び図3を参照すると、個人に関連するのではないインターバルは、参加者の
上部に別個にプロットされる(例えばハイパーリング330、音声部分等)。タ
イム・ライン・ウインドウ315は、全ての参加者のアクティビティの概観を提
供し、レコーディング内を自由に見て回るために用いることができる。
一実施形態では、ユーザが一旦、記録された会議の再生装置に電話接続を確立
したなら、タイム・ラインの下部のツールバー350を用いて、オーディオの再
生を開始し、スキミング・パラメータを調整することができる。別の実施形態で
は、会議再生文書300と共にオーディオ会議レコーディングを「流す」ことが
できるので、別個の電話接続は必要ない。
ツールバー350は、再生装置を制御するための5個のボタンを与える。すな
わち、「最初に戻る351」、「巻き戻し352」、
「停止353」、「再生354」、および「早送り355」である。また、再生
速度を調整するためのスライダー356(0.7x、1.0x、1.3x、1.
7x、および2.0x)、ズーム倍率を選択するためのズーム・メニュー357
(なし、20min、10min、および5min)、および、一時的停止の除
去のためのオン/オフ・ポーズ・ボタン358も含む。
記録した会議オーディオが再生されると、垂直な赤い針360がタイム・ライ
ンを横切って動く。針360が動くと、全ての参加者の名札に色が付き、会議の
その時点での当該人物の状態を反映する。図3は、持続時間全体を見ることがで
きる1時間の会議を示す(ズーム=なし)。この図では、視覚的な構造が、呼の
詳細の一部を速やかに明らかにすることに役立っている。例えば、明るい色の付
いたバーの番号および範囲は、最も中心的な/最も中心的でない発言者を識別す
ることができる。最初の長い連続的な発言帯は、誰が正式な発表を行ったかを示
す。最後に、質問および回答セッションが開始した時点は、多くの参加者の間で
多数の短い発言インターバルが分散している呼のほぼ中間部に見ることができる
。更に詳細な情報を得るには、オーディオを聞くか、またはリンクされた注釈、
画像、および他の文書を検索するかのいずれかを行わなければならない。
ズーム機構によって、ユーザは、タイム・ライン・ウインドウに表示される持
続時間を狭くすることができる。付番されたスクロール・バーによって、ユーザ
は、持続時間全体に拡大部分を登録し、マウスのクリックまたはキーボード上の
矢印キーを用いてスクロールすることができる。スクロールは、再生装置の位置
の針360と
は独立しているので、ユーザは、リスニングを中断することなく、それとは別に
複数の領域に目を通すことができる。再生装置の針360は、タイム・ライン上
でクリックすることによって、または早回し/巻戻しボタンを押すことによって
、動かすことができる。これが行われると、スキム・サーバは、短い非音声オー
ディオ・キューを発生し、新しい位置で再生を開始する。
針を動かさずに、ハイパーリング(例えばリンク330)を選択するために、
最上部付近でのタイム・ラインのクリックを用いる。リンクを選択すると、また
は「リンク」ボタン340を押すと、ダイアログが、レコーディングの全リンク
を表示する。このダイアログを用いて、リンクを訪問し、リンクを編集し、また
はタイム・ライン内へのリンクおよびタイム・ライン外へのリンクの双方を生成
することができる。本発明の一実施形態は、以下の種類のリンクに対応する。す
なわち、注釈、オーディオ、文書、画像、および一般のURLである。インター
バル・データとしてテキスト内容を格納する注釈を除いた全てのリンクは、UR
Lを用いて実施される。リンクの各種類は、それを表すアイコンと共にタイム・
ライン上に表示される。
タイム・ライン内へのハイパーリンクまたはタイム・ライン外へのハイパーリ
ンクは、インターバルとして格納され、開始および終了時間オフセットの双方を
含む。このため、あるリンクは、タイム・ラインの特定の時点または領域を示す
ことができ、一連の多数のスキミングの代替案を可能にする。例えば、リンクを
追うことによって、ある時点で再生を開始し、ある時点で再生を終了し、または
選択した領域を順に行うことができる。これが意味するのは、リン
クを迫うことによって、再生装置の針を動かすことおよび文書ページを変えるこ
とを含む多数の効果を有することが可能だということである。
上述したように、本発明の一実施形態は、通信会議レコーダおよび再生装置で
ある。会議を記録する場合、インターバル・データベースは、会議に関連したラ
ベル付けインターバル・データを格納する。ラベル付けインターバル・データは
、記録した会議の検索および取得を可能とし、記録した会議の再生を容易にする
。
本発明のいくつかの実施形態を、具体的に図示および/または説明した。しか
しながら、本発明の変更および変形は、上述の教示によって包含されると共に、
本発明の精神および意図する範囲から逸脱することなく、添付の特許請求の範囲
の範囲内にあることは認められよう。
例えば、開示した実施形態はインターネット上で実施するが、本発明は、私設
ネットワークを用いて、またはいずれかの他の公知または将来のデータ通信方法
を用いて、実施することができる。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 ウェイマー,ディヴィッド エム.
アメリカ合衆国.07747 ニュージャーシ
ィ,アバーデーン,イムブルック レーン
16
(72)発明者 ウェルナー,ピエール ディヴィッド
アメリカ合衆国.07748 ニュージャーシ
ィ,ミドルタウン,キングス ハイウェー
82
【要約の続き】
タフェースの部分を選択することによって、会議呼の所
望部分を容易に選択またはスキップすることができる。
Claims (1)
- 【特許請求の範囲】 1.複数のインターバルを含むマルチメディア・データを記録および再生するた めのシステムであって: 前記複数のインターバルの第1組を検出するスキム・サーバと; 前記スキム・サーバに結合されたインターバル・データベース・サーバであ って、前記スキム・サーバによって検出された前記複数のインターバルの前記第 1組のためのラベル付けされたインターバル・データを発生する前記インターバ ル・データベース・サーバと; 前記インターバル・データベース・サーバに結合されると共に前記ラベル付 けインターバル・データを格納するデータベースと; を備え、前記ラベル付けインターバル・データが、前記検出された複数のイン ターバルの各々のインターバル・データ・エレメントを備えるシステム。 2.前記インターバル・データベース・サーバに結合され、前記複数のインター バルの第2組を検出する会議ブリッジ; を更に備え、前記インターバル・データベース・サーバが、更に、前記スキム ・サーバによって検出された前記複数のインターバルの前記第2組のためのラベ ル付けされたインターバル・データを発生する請求項1のシステム。 3.前記複数のインターバルの前記第1組が音声内の一時的停止を含む請求項2 のシステム。 4.前記複数のインターバルの前記第2組が呼の制御イベントを含む請求項2の システム。 5.前記マルチメディア・データが会議電話呼を含む請求項1のシ ステム。 6.前記インターバル・データ・エレメントが: 前記検出されたインターバルの種類と; 前記検出されたインターバルの開始時間と; 前記検出されたインターバルの持続時間と; を備える請求項1のシステム。 7.前記インターバル・データ・エレメントが、更に: 前記検出されたインターバルのレコーディング識別と; 前記検出されたインターバルの種類特定データ値と; を備える請求項6のシステム。 8.前記インターバル・データベース・サーバが: 前記格納されたラベル付けインターバル・データを検索するための手段を備 える請求項1のシステム。 9.前記インターバル・データベース・サーバが、更に: 前記格納されたラベル付けインターバル・データおよび関連するマルチメデ ィア・データを取得するための手段を備える請求項8のシステム。 10.前記会議呼の再生の間に発生されるユーザ・インタフェースを更に備え、前 記ユーザ・インタフェースが前記格納されたラベル付けインターバル・データを 表示する請求項5のシステム。 11.複数のインターバルを含むマルチメディア・データを記録および再生する方 法であって: 前記複数のインターバルを検出するステップと; 前記複数のインターバルのためのラベル付けインターバル・データを発生す るステップと; 前記ラベル付けインターバル・データをデータベースに格納するステップと ; を備え、前記ラベル付けインターバル・データが、前記複数のインターバルの 各々に関連したインターバル・データ・エレメントを備える方法。 12.前記インターバル・データ・エレメントが: 前記関連するインターバルの種類と; 前記関連するインターバルの開始時間と; 前記関連するインターバルの持続時間と; を備える請求項11の方法。 13.前記インターバル・データ・エレメントが、更に: 前記関連するインターバルのレコーディング識別と; 前記関連するインターバルの種類特定データ値と; を備える請求項12の方法。 14.前記マルチメディア・データをデータベースに格納するステップを更に備え る請求項11の方法。 15.1つまたはそれ以上のラベル付けインターバル・データ・パラメータに基づ いて前記データベースに問い合わせるステップと; 少なくとも1つのインターバル・データ・エレメントおよび関連するマルチ メディア・データを前記データベースから取得するステップと; を更に備える請求項14の方法。 16.前記マルチメディア・データが会議電話呼を備える請求項11の方法。 17.前記ラベル付けインターバル・データを表示するユーザ・イン タフェースを発生するステップと; 前記ユーザ・インタフェースの選択に基づいて前記会議呼を再生するステッ プと; を備える請求項16の方法。 18.通信会議電話呼を記録および再生する方法であって: 前記電話呼の間に複数のインターバルを検出するステップと; 前記複数のインターバルの各々のためのラベル付けされたインターバル・デ ータを発生するステップと; 前記ラベル付けインターバル・データをデータベースに格納するステップと ; を備える方法。 19.前記ラベル付けインターバル・データが複数のインターバル・データ・エレ メントを備え、前記方法が、更に: 前記データベースに問い合わせ、前記格納されたインターバル・データ・エ レメントの1つまたはそれ以上を取得するステップと; 前記取得したインターバル・データ・エレメントの各々に関連した前記通信 会議電話呼の部分を再生するステップと; を備える請求項18の方法。 20.前記検出されたインターバルが: 話者のアイデンティティと; 音声内の一時的停止と; 電話呼の制御と; を備える請求項18の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US6061997P | 1997-10-01 | 1997-10-01 | |
US60/060,619 | 1997-10-01 | ||
PCT/US1998/020446 WO1999017235A1 (en) | 1997-10-01 | 1998-09-30 | Method and apparatus for storing and retrieving labeled interval data for multimedia recordings |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001511991A true JP2001511991A (ja) | 2001-08-14 |
Family
ID=22030673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP52049099A Pending JP2001511991A (ja) | 1997-10-01 | 1998-09-30 | マルチメディア・レコードのためのラベル・インターバル・データの格納および取得の方法及び装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2001511991A (ja) |
CA (1) | CA2271745A1 (ja) |
WO (1) | WO1999017235A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006507765A (ja) * | 2002-11-25 | 2006-03-02 | テレセクター リソーシーズ グループ インコーポレイテッド | 電話会議緩衝を行うための方法及び装置 |
JP2017102965A (ja) * | 2011-10-10 | 2017-06-08 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 通信システム |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2797132B1 (fr) * | 1999-07-16 | 2001-10-05 | Matra Nortel Communications | Procede et systeme de restitution sonore a effet spatial, et terminal de telephone incorporant un tel systeme |
GB2359155A (en) | 2000-02-11 | 2001-08-15 | Nokia Mobile Phones Ltd | Memory management of acoustic samples eg voice memos |
WO2002065745A1 (en) * | 2001-02-15 | 2002-08-22 | Sivashunmugam Columbus | Context association for multimedia using mark-up intelligence |
GB0108603D0 (en) * | 2001-04-05 | 2001-05-23 | Moores Toby | Voice recording methods and systems |
US20040021765A1 (en) * | 2002-07-03 | 2004-02-05 | Francis Kubala | Speech recognition system for managing telemeetings |
US20040117188A1 (en) | 2002-07-03 | 2004-06-17 | Daniel Kiecza | Speech based personal information manager |
US20040083104A1 (en) | 2002-10-17 | 2004-04-29 | Daben Liu | Systems and methods for providing interactive speaker identification training |
US7003286B2 (en) | 2002-10-23 | 2006-02-21 | International Business Machines Corporation | System and method for conference call line drop recovery |
US20040207724A1 (en) * | 2003-04-17 | 2004-10-21 | Siemens Information And Communication Networks, Inc. | System and method for real time playback of conferencing streams |
CN1635792A (zh) * | 2003-12-29 | 2005-07-06 | 皇家飞利浦电子股份有限公司 | 一种节目特定片段的创建方法和装置 |
US7308476B2 (en) | 2004-05-11 | 2007-12-11 | International Business Machines Corporation | Method and system for participant automatic re-invite and updating during conferencing |
EP1811759A1 (en) * | 2006-01-23 | 2007-07-25 | Hewlett-Packard Development Company, L.P. | Conference call recording system with user defined tagging |
NO325487B1 (no) * | 2006-09-14 | 2008-05-13 | Tandberg Telecom As | Fremgangsmate og anordning for dynamisk streaming-/arkiveringskonfigurasjon |
EP2302867B1 (en) * | 2009-09-25 | 2019-06-05 | BlackBerry Limited | Method and apparatus for managing multimedia communication recordings |
US8838179B2 (en) | 2009-09-25 | 2014-09-16 | Blackberry Limited | Method and apparatus for managing multimedia communication recordings |
WO2013026457A1 (en) | 2011-08-19 | 2013-02-28 | Telefonaktiebolaget L M Ericsson (Publ) | Technique for video conferencing |
WO2016205296A1 (en) | 2015-06-16 | 2016-12-22 | Dolby Laboratories Licensing Corporation | Post-teleconference playback using non-destructive audio transport |
US10471348B2 (en) | 2015-07-24 | 2019-11-12 | Activision Publishing, Inc. | System and method for creating and sharing customized video game weapon configurations in multiplayer video games via one or more social networks |
CN113259740A (zh) * | 2021-05-19 | 2021-08-13 | 北京字跳网络技术有限公司 | 一种多媒体处理方法、装置、设备及介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02134785A (ja) * | 1988-11-15 | 1990-05-23 | Sony Corp | 音声信号記録装置 |
JPH052540A (ja) * | 1991-06-24 | 1993-01-08 | Fujitsu Ltd | 議事録作成機能を有する電子会議システム |
US5550965A (en) * | 1993-12-27 | 1996-08-27 | Lucent Technologies Inc. | Method and system for operating a data processor to index primary data in real time with iconic table of contents |
US5619555A (en) * | 1995-07-28 | 1997-04-08 | Latitude Communications | Graphical computer interface for an audio conferencing system |
US5559875A (en) * | 1995-07-31 | 1996-09-24 | Latitude Communications | Method and apparatus for recording and retrieval of audio conferences |
-
1998
- 1998-09-30 CA CA002271745A patent/CA2271745A1/en not_active Abandoned
- 1998-09-30 WO PCT/US1998/020446 patent/WO1999017235A1/en not_active Application Discontinuation
- 1998-09-30 JP JP52049099A patent/JP2001511991A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006507765A (ja) * | 2002-11-25 | 2006-03-02 | テレセクター リソーシーズ グループ インコーポレイテッド | 電話会議緩衝を行うための方法及び装置 |
JP2017102965A (ja) * | 2011-10-10 | 2017-06-08 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 通信システム |
US9942293B2 (en) | 2011-10-10 | 2018-04-10 | Microsoft Technology Licensing, Llc | Communication system |
Also Published As
Publication number | Publication date |
---|---|
WO1999017235A1 (en) | 1999-04-08 |
CA2271745A1 (en) | 1999-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001511991A (ja) | マルチメディア・レコードのためのラベル・インターバル・データの格納および取得の方法及び装置 | |
US7092496B1 (en) | Method and apparatus for processing information signals based on content | |
US20030128820A1 (en) | System and method for gisting, browsing and searching voicemail using automatic speech recognition | |
US7848493B2 (en) | System and method for capturing media | |
US6298129B1 (en) | Teleconference recording and playback system and associated method | |
CA2326012C (en) | Bookmarking voice messages | |
CN102483917B (zh) | 针对显示文本的命令 | |
US20040132432A1 (en) | Voice recordal methods and systems | |
US5983187A (en) | Speech data storage organizing system using form field indicators | |
JPH11313173A (ja) | デジタル音声記録システム | |
JPWO2005027092A1 (ja) | 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム | |
US20120323925A1 (en) | System and Method for Synchronously Generating An Index to a Media Stream | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
JP2004523039A (ja) | 音声xmlファイルを自動的に生成する方法およびシステム | |
WO1993007562A1 (en) | Method and apparatus for managing information | |
US20040008827A1 (en) | Management of a voicemail system | |
JP2001092838A (ja) | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 | |
JP3437617B2 (ja) | 時系列データ記録再生装置 | |
JPH06161704A (ja) | 音声インタフェース・ビルダ・システム | |
JP2741833B2 (ja) | マルチメデイア提示内で音声的サーチ・パターンを使用するためのシステム及びその方法 | |
JP2000099524A (ja) | マルチメディア情報視聴装置 | |
JP4080965B2 (ja) | 情報提示装置及び情報提示方法 | |
KR100806225B1 (ko) | 회의록 웹페이지의 자동생성장치 및 그에 따른 이벤트정보를 이용한 회의록 검색시스템 | |
MXPA99005025A (en) | Method and apparatus for storing and retrieving labeled interval data for multimedia recordings | |
JP3346758B2 (ja) | 情報提供システム |