[go: up one dir, main page]

JP3979566B2 - 動画像付帯時変テキスト情報分割装置 - Google Patents

動画像付帯時変テキスト情報分割装置 Download PDF

Info

Publication number
JP3979566B2
JP3979566B2 JP2001326227A JP2001326227A JP3979566B2 JP 3979566 B2 JP3979566 B2 JP 3979566B2 JP 2001326227 A JP2001326227 A JP 2001326227A JP 2001326227 A JP2001326227 A JP 2001326227A JP 3979566 B2 JP3979566 B2 JP 3979566B2
Authority
JP
Japan
Prior art keywords
time
varying text
varying
text
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001326227A
Other languages
English (en)
Other versions
JP2003134477A (ja
Inventor
茂之 酒澤
悟史 宮地
幸一 高木
泰利 渡辺
康弘 滝嶋
正裕 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2001326227A priority Critical patent/JP3979566B2/ja
Publication of JP2003134477A publication Critical patent/JP2003134477A/ja
Application granted granted Critical
Publication of JP3979566B2 publication Critical patent/JP3979566B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は動画像付帯時変テキスト情報分割装置に関し、特に、動画像・音声、およびそれらと同期して時間的に変化する文字情報(時変テキスト)からなるコンテンツを分割するときに、該時変テキストを視聴者に違和感なく分割できる動画像付帯時変テキスト情報分割装置に関する。
【0002】
【従来の技術】
動画像、音声、および時変テキスト(すなわち、テロップ(商品名))を表現するための書式として、SMIL言語が存在する。ここに、時変テキストは、時間と共に変化する文字情報を意味し、例えば画面の左方から右方へ流れる文字情報を想定することができる。
【0003】
これらの表現形式は、一旦作成した後は、そのまま配信されることが前提となっており、時変テキストを、動画像・音声の関係を考慮に入れて分割するコンテンツ分割技術は、提案されていない。
【0004】
さて、ライブ中継などの場合には、途中から視聴を開始したユーザは、分割後のデータの先頭から受信を開始することになるため、その先頭データはそれ単独で復号可能なデータ形式である必要がある。例えば、動画像データの場合であれば、先頭データはキーフレーム(フレーム内符号化された画像フレーム)の先頭でなければならない。音声データの場合は、それ単独で復号が可能であるような音声フレームの切れ目で分割される必要がある。時変テキストの場合は、それ単独で復号が可能であるデータの塊で表現され、その塊は時間的広がりを持つ。例えばドラマにおける俳優の台詞を時変テキストで表現する場合には、俳優が一息で話す台詞を一塊りとし、俳優が話している時間だけ、その台詞が表示されることになる。
【0005】
【発明が解決しようとする課題】
しかしながら、携帯電話などのように、通信路容量、蓄積容量に限りがあるような受信装置では、コンテンツ全体をダウンロードするのではなく、それを細分化してダウンロードおよび再生を行う必要が生ずる。また、前記したように、ライブ中継などの場合には、途中から視聴を開始したユーザは、分割後のデータの先頭から受信を開始することになる。
【0006】
そこで、前記のような場合に、コンテンツ分割をしようとすると、単純に動画像のキーフレーム(フレーム内符号化された画像フレーム)に着目した分割、すなわち該キーフレームの先頭で分割することしか行われず、分割時点における動画像と時変テキストとの関係が不定となり、視聴者に違和感が生ずるという問題があった。
【0007】
より具体的に説明すると、動画像のキーフレームで分割する場合には、音声データは動画像のキーフレームの1周期(例えば、1GOP期間)に比べて短い時間間隔で分割できるため、その先頭データが本来出力されるべき時刻と、動画像の表示時刻とのずれは十分に小さくなる。しかし、時変テキストの場合には、動画像フレームに比べてかなり長い時間間隔でしか分割できないため、時変テキストを表示すべき時刻と、動画像の先頭フレームの表示時刻とが大きくずれてしまう。例えば、俳優が台詞を話している動画像が表示されているにも拘わらず、台詞データが分割の前の方に付属させられて、分割の後ろ側の台詞データがなくなってしまい、台詞が表示されなくなることが起こり得る。
【0008】
本発明は、前記した従来技術に鑑みてなされたものであり、その目的は、時変テキストを視聴者に違和感なく分割できる動画像付帯時変テキスト情報分割装置を提供することにある。
【0009】
【課題を解決するための手段】
前記した目的を達成するために、本発明は、動画像、音声、およびそれらと同期して時間的に変化する文字情報(以下、時変テキストという)からなるコンテンツの該時変テキストを分割する動画像付帯時変テキスト情報分割装置において、前記時変テキストを、分割点である動画像のキーフレームの先頭に同期させて分割する分割手段を具備し、該分割手段は、前記分割点の時刻に表示される時変テキストを抽出し、該時変テキストを、ある時間解像度単位で時間的変化を伴わない静的時変テキストに展開し、該静的時変テキストの開始時刻および終了時刻を前記分割点の時刻で区切ることにより、前記時変テキストを分割するようにした点に特徴がある。
【0011】
前記特徴によれば、時変テキストを、動画像の分割点と同期させて分割することができるようになり、時変テキストを視聴者に違和感なく分割できるようになる。
【0012】
【発明の実施の形態】
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明を含む動画像再生装置の概略構成を示すブロック図である。
【0013】
図示されているように、時変テキスト付きコンテンツファイルが音声/動画/時変テキスト分離部1に入力すると、該分離部1は該時変テキスト付きコンテンツファイルを音声データ、動画像データ、および時変テキストデータに分離する。分離された音声データ2a、動画像データ3a、および時変テキストデータ4aは、分割処理部5に入力し、分割処理の指示7があった場合には本発明による分割処理をされ、一方分割処理の指示がなかった場合にはそのまま通過して、音声/動画/時変テキスト多重化部6に送られる。該多重化部6は音声/動画/時変テキストを多重化し、元の時変テキスト付きコンテンツファイルと同様の形式にて出力する。
【0014】
図2は、前記音声データ2a、動画像データ3a、および時変テキストデータ4aの概念図を示す。
【0015】
図示されているように、音声データ2aは符号化時の符号化フレームA1,A2,A3、・・・から構成されている。
【0016】
動画像データ3aは画像列から構成されており、その画像列の中にキーフレーム(フレーム内符号化された画像フレーム)が定期的に挿入されている。図中の11〜14は、該キーフレームの先頭を示す。また、あるキーフレームから次のキーフレームまでの期間Kはキーフレーム周期(1GOP期間)を示す。なお、該キーフレームは、図示されていない動画像符号化装置において挿入される。
【0017】
また、時変テキストデータ4aは、一塊りのデータ(例えば、台詞の一塊りのデータ)T1、T2、T3・・・の列から構成されている。図から明らかなように、時変テキストデータの塊T1、T2、・・・は、動画像データや音声データに比べて大きな時間的広がりを持つことは明らかである。また、時変テキストは、動画像の意味内容(例えば、ドラマの台詞など)に応じて挿入されるため、時変テキストデータの切れ目は、必ずしも動画像データのキーフレーム位置11,12,13,・・・とは一致しない。
【0018】
なお、時変テキストでは、文字情報に様々な修飾が施される。該修飾には、(1)時間的挙動を伴うものと、(2)伴わないものとがある。時間的挙動を伴うものには、スクロール、ブリンク、ワイプなどがある。スクロールは文字列が流れていくようにする挙動、ブリンクは文字列が点滅する挙動、ワイプは文字列中の文字色が変化していく挙動(例、カラオケの歌詞)である。一方、時間的挙動を伴わないものには、文字色、背景色、あるいは下線などがある。
【0019】
次に、本発明の要部である分割処理部5の構成および動作を説明する。図3は、該分割処理部5中の動画像付帯時変テキスト情報分割装置の構成を示すブロック図である。該動画像付帯時変テキスト情報分割装置20は、分割時変テキスト探索器21と文字修飾分割器22から構成されている。
【0020】
前記分割処理部5は、任意の時間T’に分割指示信号7が入力すると、前記音声データ2a、動画像データ3a、および時変テキストデータ4aを、図2に示されている分割点Tで分割する。すなわち、動画像データ3aの分割点のデータは、それ単独で復号可能なデータ形式である必要があるため、その先頭データがキーフレーム(フレーム内符号化された画像フレーム)となるように分割しなければならない。このため、分割点Tはキーフレームの先頭に合わされる。
【0021】
音声データ2aは、分割点Tが符号化フレームA2の途中に来るので、符号化フレームA1とA2の境界で分割され、A1は分割前のファイルに、またA2は分割後のファイルに格納される。
【0022】
次に、時変テキストデータ4aに関しては、例えば、図2に示されているように、時変テキストデータ4aがデータの塊T2で二つに分割される時、分割の前後で整合性が保たれるように補完する必要が生ずる。また、文字情報の修飾も、分割の前後で連続性を保ちつつ、かつ分割点から受信を初めて開始した場合でも文字情報が失われないようにする必要がある。そこで、本実施形態では、下記のように分割処理を行う。
【0023】
動画像付帯時変テキスト情報分割装置20は、分割の対象となる時変テキストを探索する分割時変テキスト探索器21と、該時変テキストおよびその修飾を分割する文字修飾分割器22とからなる。
【0024】
まず、分割時変テキスト探索器21の動作を、図4のフローチャートを参照して説明する。前提として、分割時刻をT、時変テキストデータ4aの塊T1、T2、・・・の各開始時刻をti、各終了時刻をti'とする。ステップS1では、時変テキストデータの塊を表す数iを0と置き、ステップS2では時変テキストデータ4aの塊Tiを読み込む。ステップS3では、分割時刻Tがti<T<ti'を満足するか否かの判断がなされる。この判断が否定の時にはステップS4に進んで、全ての時変テキストデータを判定したか否かの判断がなされる。この判断が否定の時には、ステップS5に進んでiに1が加算される。そして、ステップS2に戻り、前記した処理が繰り返される。前記ステップS3の判断が肯定になった時には、データの塊Tiは分割対象であるから、ステップS6に進んで処理対象の時変テキストとして保持される。
【0025】
次に、前記文字修飾分割器22の動作を説明する。該文字修飾分割器22の動作手順は、次のようである。
(1)時間挙動のある時変テキストを、時変挙動のない時変テキスト(以下、静的時変テキストという)に展開する。
(2)分割時刻にある静的時変テキストを、分割時刻Tで二つに分割する。
【0026】
前記の手順(1)、(2)を、具体的に説明する。この(1)では、ある時間解像度で時変テキストの状態を見て、その状態の静的時変テキストを順次出力する。
【0027】
いま、時変テキストデータT2として、図5に示されているように、例えば、「ニューヨークで大事件が発生しました」を想定する。この時変テキストデータT2は、5文字表示され、毎秒1文字ずつ移動していくとすると、図示されているように、「0秒から12秒までスクロール、1文字/秒、窓は5文字、ニューヨークで大事件が発生しました」と表すことができる。現象的には、図示されているように、5文字を通す窓Wが1秒毎に矢印aの方向に移動すると考えることができる。なお、時間解像度の定め方は、例えばブリンクの場合はブリンク周期の1/2,ワイプの場合はワイプの1文字移動速度とする。
【0028】
これを前記(1)の静的時変テキストに展開すると、図5に示されているように、第0秒「ニューヨー」、第1秒「ューヨーク」、第2秒「ーヨークで」、・・・、第12秒「生しました」となる。この場合の時間解像度は1秒である。
【0029】
次に、前記(2)では、前記静的時変テキストを、分割時刻Tで二つに分割する処理が行われる。
【0030】
前記データ塊T2の静的時変テキストが図6に示されているように表されたとすると、前記分割点Tは、該静的時変テキストのどこかに対応することになる。今、該分割点Tが第4秒「ークで大事」に対応したとすると、前記(2)の処理では、まず、該分割点Tが属する静的時変テキストを探索する動作をし、該探索の結果、静的時変テキストとして、例えば第4秒「ークで大事」が検出されると、次いで、該第4秒「ークで大事」を分割点Tで分割する処理をする。なお、前記分割点Tが属する静的時変テキストを探索する処理は、図4と同様の処理を採用することができる。
【0031】
この処理は、分割点Tを分割前の時変テキストの終了時刻、また該分割点Tを分割後の時変テキストの開始時刻とする処理である。前記の例では、4〜5秒の時変テキスト「ークで大事」の時間4〜Tを分割前の時変テキストの終了時変テキストとし、時間T〜5を分割後の時変テキストの開始時変テキストとする処理をする。
【0032】
以上の分割処理により、時変テキストデータ4aは、分割の前後で整合性が保たれるように補完され、かつ文字情報の修飾も、分割の前後で連続性を保ちつつ、かつ分割点から受信を初めて開始した場合でも文字情報が失われないようにできるようになる。また、分割点Tにおける動画像のキーフレームとの整合も取れるようになる。
【0033】
【発明の効果】
以上の説明から明らかなように、本発明によれば、任意の時刻に、動画像データおよび音声データと同期させて、時変データを分割できるようになる。このため、時変テキストを視聴者に違和感なく分割できるようになる。
【0034】
また、携帯電話などのように、通信路容量、蓄積容量に限りがあるような受信装置において、コンテンツを細分化してダウンロードおよび再生をする場合であっても、分割点における時変テキストを視聴者に違和感なく提供できるようになる。
【図面の簡単な説明】
【図1】 本発明が適用される再生装置の概略の構成を示すブロック図である。
【図2】 音声データ、動画像データ、および時変テキストデータの概念図である。
【図3】 本発明の一実施形態の動画像付帯時変テキスト情報分割装置の構成を示すブロック図である。
【図4】 図3の分割時変テキスト探索器の動作を示すフローチャートである。
【図5】 時変テキストと静的時変テキストの説明図である。
【図6】 図3の文字修飾分割器の動作の説明図である。
【符号の説明】
1・・・ファイル仕分け部、2・・・音声復号部、3・・・動画像復号部、4・・・時変テキスト復号部、5・・・分割処理部、6・・・画像表示部、20・・・動画像付帯時変テキスト情報分割装置、21・・・分割時変テキスト探索器、22・・・文字修飾分割器。

Claims (2)

  1. 動画像、音声、およびそれらと同期して時間的に変化する文字情報(以下、時変テキストという)からなるコンテンツの該時変テキストを分割する動画像付帯時変テキスト情報分割装置において、
    前記時変テキストを、分割点である動画像のキーフレームの先頭に同期させて分割する分割手段を具備し
    該分割手段は、前記分割点の時刻に表示される時変テキストを抽出し、該時変テキストを、ある時間解像度単位で時間的変化を伴わない静的時変テキストに展開し、該静的時変テキストの開始時刻および終了時刻を前記分割点の時刻で区切ることにより、前記時変テキストを分割することを特徴とする動画像付帯時変テキスト情報分割装置。
  2. 前記時変テキストは、時間的挙動を伴う修飾および時間的挙動を伴わない修飾の少なくとも一方が施されていることを特徴とする請求項1に記載の動画像付帯時変テキスト情報分割装置。
JP2001326227A 2001-10-24 2001-10-24 動画像付帯時変テキスト情報分割装置 Expired - Lifetime JP3979566B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001326227A JP3979566B2 (ja) 2001-10-24 2001-10-24 動画像付帯時変テキスト情報分割装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001326227A JP3979566B2 (ja) 2001-10-24 2001-10-24 動画像付帯時変テキスト情報分割装置

Publications (2)

Publication Number Publication Date
JP2003134477A JP2003134477A (ja) 2003-05-09
JP3979566B2 true JP3979566B2 (ja) 2007-09-19

Family

ID=19142638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001326227A Expired - Lifetime JP3979566B2 (ja) 2001-10-24 2001-10-24 動画像付帯時変テキスト情報分割装置

Country Status (1)

Country Link
JP (1) JP3979566B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005002231A1 (ja) * 2003-06-27 2006-08-17 株式会社日立製作所 映像編集装置
JP4994623B2 (ja) * 2005-08-31 2012-08-08 富士通株式会社 テキスト編集・再生装置、コンテンツ編集・再生装置及びテキスト編集・再生方法

Also Published As

Publication number Publication date
JP2003134477A (ja) 2003-05-09

Similar Documents

Publication Publication Date Title
JP4430036B2 (ja) 拡張型字幕ファイルを用いて付加情報を提供する装置及び方法
JP5173337B2 (ja) 要約コンテンツ生成装置およびコンピュータプログラム
KR950030107A (ko) 디지탈 비디오/오디오 데이타 스트림의 동기 유지 장치 및 방법, 디지탈 비디오/오디오 재생 시스템 및 재생 서브시스템과 비디오/오디오 데이타의 동기 화면 제공 시스템
JP3025176B2 (ja) 複数のメディア成分を有する情報伝達フレーム列の圧縮方法及びその装置
JP2010206279A (ja) 映像音声再生装置および映像音声再生方法
US20060140591A1 (en) Systems and methods for load balancing audio/video streams
JP5775814B2 (ja) 視聴覚システムを視聴者の注目度に合わせる装置及び方法
JP3877371B2 (ja) 映像再生装置
JP3979566B2 (ja) 動画像付帯時変テキスト情報分割装置
JP3642019B2 (ja) Avコンテンツ自動要約システム及びavコンテンツ自動要約方法
JP4994623B2 (ja) テキスト編集・再生装置、コンテンツ編集・再生装置及びテキスト編集・再生方法
JP2002344871A (ja) 字幕放送記録装置および記録方法
JP4254297B2 (ja) 画像処理装置及びその方法並びにそれを用いた画像処理システム及びプログラム
JP2004032607A (ja) ディジタル映像再生装置
JP5163005B2 (ja) 映像信号再生装置、映像信号処理装置および映像信号処理方法
JP2008294722A (ja) 動画再生装置および動画再生方法
US20070248170A1 (en) Transmitting Apparatus, Receiving Apparatus, and Reproducing Apparatus
JP2002084505A (ja) 映像閲覧時間短縮装置及び方法
KR960013217B1 (ko) 엠펙 복호화 시스템의 영상 및 음성 신호 동기 장치
JPH10210483A (ja) 動画像再生装置及びその方法
JP3894362B2 (ja) 複数動画像の閲覧装置および記録媒体
JP3350583B2 (ja) 音声・画像・文字情報の同調出力方法
JPH10290406A (ja) 説明表示方法及び画面表示システム及び画面表示端末
JPH11225309A (ja) 音響信号処理装置及びオーディオ高速再生方法
JPH0984008A (ja) 画像・音声の符号化装置および復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070404

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070622

R150 Certificate of patent or registration of utility model

Ref document number: 3979566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100706

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130706

Year of fee payment: 6

EXPY Cancellation because of completion of term