JP3764878B2 - VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM - Google Patents
VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM Download PDFInfo
- Publication number
- JP3764878B2 JP3764878B2 JP2002303519A JP2002303519A JP3764878B2 JP 3764878 B2 JP3764878 B2 JP 3764878B2 JP 2002303519 A JP2002303519 A JP 2002303519A JP 2002303519 A JP2002303519 A JP 2002303519A JP 3764878 B2 JP3764878 B2 JP 3764878B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- audio
- signal
- output
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は,1倍速以外の速度で再生しても映像と音声との同期が保たれる映像音声再生装置,映像音声再生方法,プログラム,および媒体に関する。
【0002】
【従来の技術】
従来の映像音声再生装置では,つぎに説明するような映像と音声との同期を保つ方法を用いて再生が行われている(たとえば特許文献1参照)。また,1倍速以外の速度で再生しても映像と音声との同期が保たれるようにした従来の映像音声再生装置のブロック図を図11に示す。
【0003】
システム解析回路1は,入力されたデータを映像データと音声データに分別する回路である。
【0004】
映像入力バッファ回路2は,システム解析回路1が出力する映像データを蓄える回路であり,映像デコード回路3は,映像入力バッファ回路2から映像データを取り込んで復号し映像信号に変換する回路である。
【0005】
映像出力バッファ回路4は,映像デコード回路3が出力する映像信号を蓄えて出力する回路である。
【0006】
音声入力バッファ回路5は,システム解析回路1が出力する音声データを蓄える回路であり,音声デコード回路6は,音声入力バッファ回路5から音声データを取り込んで復号し音声信号に変換する回路である。
【0007】
音声出力バッファ回路9は,音声デコード回路6の出力する音声信号を蓄えて出力する回路である。
【0008】
速度設定回路7は,リモコンなどを用いたユーザの指示に応じて所望の速度を設定する回路であり,映像出力制御回路21は,速度設定回路7で設定された速度に基づいて,継続時間を縮める場合には映像信号をスキップするように映像出力バッファ回路4に制御信号を出力し,継続時間を延ばす場合には映像信号をフリーズするように映像出力バッファ回路4に制御信号を出力する回路である。
【0009】
音声出力制御回路22は,音声出力バッファ回路9の音声信号の蓄積具合を観測し,(1)継続時間を縮める場合には,音声出力バッファ回路9の音声信号が溢れ気味になるので,音声信号をスキップするように音声出力バッファ回路9に制御信号を出力し,(2)継続時間を延ばす場合には,音声出力バッファ回路9の音声信号が不足気味になるので,音声信号をリピートまたはポーズするように音声出力バッファ回路9に制御信号を出力する回路である。
【0010】
つぎに,従来の映像音声再生装置の動作について説明する。
【0011】
システム解析回路1は,入力されたデータを映像データと音声データに分別する。
【0012】
映像入力バッファ回路2は,システム解析回路1が出力する映像データを蓄え,映像デコード回路3は,映像入力バッファ回路2から映像データを取り込んで復号し映像信号に変換する。
【0013】
映像出力バッファ回路4は,映像デコード回路3が出力する映像信号を蓄えて出力する。
【0014】
音声入力バッファ回路5は,システム解析回路1が出力する音声データを蓄え,音声デコード回路6は,音声入力バッファ回路5から音声データを取り込んで復号し音声信号に変換する。
【0015】
音声出力バッファ回路9は,音声デコード回路6の出力する音声信号を蓄えて出力する。
【0016】
速度設定回路7は,リモコンなどを用いたユーザの指示に応じて所望の速度を設定し,映像出力制御回路21は,速度設定回路7で設定された速度に基づいて,継続時間を縮める場合には映像信号をスキップするように映像出力バッファ回路4に制御信号を出力し,継続時間を延ばす場合には映像信号をフリーズするように映像出力バッファ回路4に制御信号を出力する。
【0017】
音声出力制御回路22は,音声出力バッファ回路9の音声信号の蓄積具合を観測し,(1)継続時間を縮める場合には,音声出力バッファ回路9の音声信号が溢れ気味になるので,音声信号をスキップするように音声出力バッファ回路9に制御信号を出力し,(2)継続時間を延ばす場合には,音声出力バッファ回路9の音声信号が不足気味になるので,音声信号をリピートまたはポーズするように音声出力バッファ回路9に制御信号を出力する。
【0018】
したがって,(1)継続時間を縮める場合には,音声信号をスキップするように音声出力バッファ回路9に制御信号が出力されるため,音声出力バッファ回路9の音声信号が溢れ気味になることは抑制され,(2)継続時間を延ばす場合には,音声信号をリピートまたはポーズするように音声出力バッファ回路9に制御信号が出力されるため,音声出力バッファ回路9の音声信号が不足気味になることは抑制される。
【0019】
【特許文献1】
特開2001−8170号公報
【0020】
【発明が解決しようとする課題】
しかしながら,上述した従来の映像音声再生装置においては,継続時間を縮めたり延ばしたりするように速度が設定された速度変換中に,映像信号の出力タイミングと音声信号の出力タイミングとが通常再生時に比べて大きくずれてしまい,同期が正確に保たれないことがあるという課題があった。
【0021】
なお,コンテンツの早見や遅聞きのニーズがあり,早見や遅聞きが行われる場合にもAV同期が保証される必要がある。
【0022】
本発明は,上記従来のこのような課題を考慮し,再生速度が通常再生速度とは異なるように設定されているときにも,映像信号の出力タイミングと音声信号の出力タイミングとが通常再生時に比べて大きくずれることなく,それらの同期をより正確に保つことができる映像音声再生装置,映像音声再生方法,プログラム,および媒体を提供することを目的とするものである。
【0037】
第1の本発明は,音声データと映像データとを有する外部から入力されるMPEG(Moving Picture Experts Group)データを,前記音声データと前記映像データとに分別する分別手段と,
前記分別された音声データをデコードして,音声信号を生成する音声信号生成手段と, 外部から設定される外部設定再生速度に基づいて決定される実際に再生を実行するための実行再生速度に応じて,所定の音声速度変換を前記生成された音声信号に対して行う音声速度変換手段と,
前記音声速度変換が行われた音声信号を蓄積し,前記蓄積されている音声信号を前記実行再生速度に応じて出力する音声信号蓄積出力手段と,
前記分別された映像データをデコードして映像信号を生成する映像信号生成手段と,
前記生成された映像信号を蓄積し,前記蓄積されている映像信号を前記実行再生速度に応じて出力する映像信号蓄積出力手段と,
前記外部設定再生速度に関する前記生成された音声信号の音声速度変換比αを,前記実行再生速度に関する有理数βに変換する音声速度変換比変換手段とを備え,
前記音声速度変換手段は,前記有理数βに応じて,前記所定の音声速度変換を前記生成された音声信号に対して行い,
前記音声信号蓄積出力手段は,前記音声速度変換が行われた音声信号を蓄積し,前記有理数βに基づき,前記蓄積されている音声信号を前記実行再生速度に応じて出力し,
前記映像信号蓄積出力手段は,前記生成された映像信号を蓄積し,前記実行再生速度に応じて,(1)前記有理数βが1より小さい場合には,前記蓄積されている映像信号をスキップを利用して出力し,(2)前記有理数βが1より大きい場合には,前記蓄積されている映像信号をフリーズを利用して出力する映像音声再生装置である。
【0038】
第2の本発明は,前記映像信号蓄積出力手段は,前記有理数βが1より小さい場合には,前記蓄積されている映像信号のBピクチャの全部または一部をスキップする第1の本発明の映像音声再生装置である。
【0039】
第3の本発明は,前記分別手段と前記映像信号生成手段との間に挿入された,前記分別された映像データを蓄積するための映像データ蓄積手段をさらに備え,
前記映像データ蓄積手段は,前記有理数βが1より小さい場合には,前記分別された映像データのBピクチャの全部または一部を廃棄する第1の本発明の映像音声再生装置である。
【0040】
第4の本発明は,前記実行再生速度は,前記蓄積されている映像信号が前記実行再生速度に応じて出力できたか否かに基づいて調節される第1の本発明の映像音声再生装置である。
第5の本発明は,前記蓄積されている映像信号が前記実行再生速度に応じて出力できたか否かに基づいて調節されるとは,前記蓄積されている映像信号が前記実行再生速度に応じて出力できなかった場合には1倍速により近づくように調節され,前記蓄積されている映像信号が前記実行再生速度に応じて出力できた場合には前記外部設定再生速度により近づくように調節される第4の本発明の映像音声再生装置である。
【0041】
第6の本発明は,前記映像信号蓄積出力手段は,(1)前記有理数βが1より小さい場合には,
【0042】
【数1】
1−β=n(1)/m(1)
なる整数m(1),n(1)(1≦n(1)<m(1))から所定の基準に基づいて決定されるn(1)個の整数m(1) j(j=1,2,…,n(1))による整数m(1)の分割
【0043】
【数4】
m(1)=Σj m(1) j (Σは1≦j≦n(1)に関して考える)
を利用して,はじめのm(1) 1映像フレームにおいて1映像フレームをスキップし,つぎのm(1) 2映像フレームにおいて1映像フレームをスキップし,…というようにして前記蓄積されている映像信号を出力し,(2)前記有理数βが1より大きい場合には,
【0044】
【数5】
β−1=n(2)/m(2)
なる整数m(2),n(2)(1≦n(2)<m(2))から所定の基準に基づいて決定されるn(2)個の整数m(2) j(j=1,2,…,n(2))による整数m(2)の分割
【0045】
【数8】
m(2)=Σj m(2) j (Σは1≦j≦n(2)に関して考える)
を利用して,はじめのm(2) 1映像フレームにおいて1映像フレームをフリーズし,つぎのm(2) 2映像フレームにおいて1映像フレームをフリーズし,…というようにして前記蓄積されている映像信号を出力する第1の本発明の映像音声再生装置である。
【0046】
第7の本発明は,(1)前記n(1)個の整数m(1) j(j=1,2,…,n(1))とは,
【0047】
【数2】
m(1)=n(1)q(1)+r(1)
なる整数q(1),r(1)(0≦r(1)<n(1))を利用して
【0048】
【数3】
r(1)=0の場合には,
m(1) j=q(1)(j=1,…,n(1))
r(1)≧1の場合には,
m(1) j=q(1)+1(j=1,…,r (1) ),
m(1) j=q(1)(j=r (1) +1,…,n(1))
として決定されるn(1)個の整数m(1) j(j=1,2,…,n(1))であり,(2)前記n(2)個の整数m(2) j(j=1,2,…,n(2))とは,
【0049】
【数6】
m(2)=n(2)q(2)+r(2)
なる整数q(2),r(2)(0≦r(2)<n(2))を利用して
【0050】
【数7】
r(2)=0の場合には,
m(2) j=q(2)(j=1,…,n(2))
r(2)≧1の場合には,
m(2) j=q(2)+1(j=1,…,r(2)),
m(2) j=q(2)(j=r(2)+1,…,n(2))
として決定されるn(2)個の整数m(2) j(j=1,2,…,n(2))である第6の本発明の映像音声再生装置である。
【0051】
第8の本発明は,音声データと映像データとを有する外部から入力されるMPEG(Moving Picture Experts Group)データを,前記音声データと前記映像データとに分別する分別ステップと,
前記分別された音声データをデコードして,音声信号を生成する音声信号生成ステップと,
外部から設定される外部設定再生速度に基づいて決定される実際に再生を実行するための実行再生速度に応じて,所定の音声速度変換を前記生成された音声信号に対して行う音声速度変換ステップと,
前記音声速度変換が行われた音声信号を蓄積し,前記蓄積されている音声信号を前記実行再生速度に応じて出力する音声信号蓄積出力ステップと,
前記分別された映像データをデコードして映像信号を生成する映像信号生成ステップと,
前記生成された映像信号を蓄積し,前記蓄積されている映像信号を前記実行再生速度に応じて出力する映像信号蓄積出力ステップとを備え,
前記音声速度変換ステップにおいては,前記有理数βに応じて,前記所定の音声速度変換が前記生成された音声信号に対して行われ,
前記音声信号蓄積出力ステップにおいては,前記音声速度変換が行われた音声信号が蓄
積され,前記有理数βに基づき,前記蓄積されている音声信号が前記実行再生速度に応じて出力され,
前記映像信号蓄積出力ステップにおいては,前記生成された映像信号が蓄積され,前記実行再生速度に応じて,(1)前記有理数βが1より小さい場合には,前記蓄積されている映像信号がスキップを利用して出力され,(2)前記有理数βが1より大きい場合には,前記蓄積されている映像信号がフリーズを利用して出力される映像音声再生方法である。
【0052】
第9の本発明は,第8の本発明の映像音声再生方法の,分別ステップと,音声信号生成ステップと,音声速度変換ステップと,音声信号蓄積出力ステップと,映像信号生成ステップと,映像信号蓄積出力ステップとをコンピュータに実行させるためのプログラムである。
【0053】
第10の本発明は,第9の本発明のプログラムを担持した媒体であって,コンピュータにより処理可能な媒体である。
【0054】
【発明の実施の形態】
以下に,本発明の実施の形態について,図面を参照しつつ説明を行う。
【0055】
(実施の形態1)
はじめに,本発明の実施の形態1のMPEG規格に準拠した映像音声再生装置のブロック図である図1を主として参照しながら,本実施の形態の映像音声再生装置の構成について説明する。
【0056】
システム解析回路1001は,本発明の実施の形態1の入力データの説明図である図2に示されているような入力データから,V−PTS(video−presentation time stamp,映像タイムスタンプ)を伴う映像データとA−PTS(audio−presentation time stamp,音声タイムスタンプ)を伴う音声データを分別する回路である。
【0057】
なお,MPEG規格によれば,時間的に前後して復号される画像データや音声データは,それぞれ上述のV−PTSやA−PTSが示す再生時間に関する情報を利用して再配列されて出力される。
【0058】
映像入力バッファ回路1002は,システム解析回路1001が出力する映像データとV−PTSを蓄える回路であり,映像デコード回路1003は,映像入力バッファ回路1002から映像データを取り込んで復号し映像信号に変換し,対応するV−PTSをV−PTSバッファ回路1104に出力する回路である。
【0059】
映像出力バッファ回路1004は,映像デコード回路1003が出力する映像信号と対応するV−PTSを蓄えて出力する回路である。
【0060】
V−PTSバッファ回路1104は,映像デコード回路1003が出力するV−PTSを蓄えて出力する回路である。
【0061】
音声入力バッファ回路1005は,システム解析回路1001が出力する音声データとA−PTSを蓄える回路であり,音声デコード回路1006は,音声入力バッファ回路1005から音声データを取り込んで復号し音声信号に変換し,対応するA−PTSをA−PTSバッファ回路1209に出力する回路である。
【0062】
速度設定回路1007は,リモコンなどを用いた外部からのユーザの指示に応じて所望の音声速度変換比αを設定する回路である。
【0063】
なお,たとえば音声速度変換比α=1/2である場合には,音声が1倍の速さで再生される場合に比べて,音声信号の継続時間が1/2倍になり,計時回路1010においては2倍の頻度でA−PTSが更新されるので,計時回路1010の示す時刻は連続的ではないが2倍の速さで進むことになる。要するに,音声信号の継続時間を伸張する場合にはA−PTSバッファ回路1209からA−PTSが出力される間隔は広がり,音声信号の継続時間を圧縮する場合にはA−PTSバッファ回路1209からA−PTSが出力される間隔は縮まる。このA−PTSが計時回路1010に出力されることになるので,計時回路1010のカウンタは音声速度変換比に応じて強制的にA−PTSで修正されるわけである。
【0064】
音声速度変換回路1008は,周波数(音程)を変えることなく継続時間のみを変える音声速度変換方法を利用して,速度設定回路1007から出力された音声速度変換比αに基づいて音声デコード回路1006が出力する音声信号に音声速度変換処理を施し,A−PTS出力タイミングの時間対応関係を維持して音声出力バッファ1009に出力させる回路である。
【0065】
なお,本実施の形態における音声速度変換方法としては,特許番号第2532731号明細書などに記載されている音声速度変換方法を利用することができる。この音声速度変換方法は,入力された音声波形に対し,窓関数を乗算し,相関関数の値が大きくなるような重畳加算を行って,音声波形の振幅や位相の不連続性,音声データの欠落がほとんど発生しない音声速度変換を実現するものである。
【0066】
たとえば,このような音声速度変換方法による音声速度変換比α=2/3の音声速度変換を利用して,本発明の実施の形態1の音声速度変換方法の説明図(その1)である図3(A)に示されているような音声波形W1〜W9を,本発明の実施の形態1の音声速度変換方法の説明図(その2)である図3(B)に示されているような音声波形W1′〜W9′に変換することができる。
【0067】
より具体的に説明すると,たとえば,音声波形W1,W2は,振幅の不連続性が生じないように重畳され,実質的に周波数が変えられることなく継続時間のみが変えられることで,音声波形W1′,W2′に変換されている。また,音声波形W3は,ほぼそのままで,音声波形W3′に変換されている。また,音声波形W4,W5は,振幅の不連続性が生じず位相がずらされて重畳され,実質的に周波数が変えられることなく継続時間のみが変えられることで,音声波形W4′,W5′に変換されている。
【0068】
音声出力バッファ回路1009は,音声速度変換回路1008の出力する音声信号とA−PTS出力タイミングを蓄えて音声信号をサンプリング周波数に基づいて連続的に出力し,対応する音声信号が出力される時にA−PTS出力タイミングをA−PTSバッファ回路1209に出力する回路である。
【0069】
A−PTSバッファ回路1209は,音声出力バッファ回路1009が出力するA−PTS出力タイミングに同期して,音声デコード回路1006が出力するA−PTSを蓄えて出力する回路である。
【0070】
計時回路1010は,A−PTSバッファ回路1209が出力するA−PTSを設定して時刻T(後述のカウンタ値とほぼ同じものである)を測る回路である。
【0071】
比較回路1011は,計時回路1010が出力する時刻TとV−PTSバッファ回路1104が出力するV−PTSを比較して,(1)音声速度変換回路1008が音声の継続時間を延ばすことにより,時刻TよりもV−PTSが進んでいる場合には,映像出力バッファ回路1004に対して映像信号をフリーズするように制御し,(2)音声速度変換回路1008が音声の継続時間を縮めることにより,時刻TよりもV−PTSが遅れている場合には,映像出力バッファ回路1004に対して映像信号(たとえば,映像デコード回路1003が他のピクチャのデコード時に参照しない映像タイプのBピクチャ)をスキップするように制御する回路である。
【0072】
また,比較回路1011は,時刻TよりもV−PTSが遅れている後者の場合には,映像入力バッファ回路1002に対してBピクチャの映像データを廃棄するように制御する回路である。もちろん,比較回路1011によるこのような制御は,映像デコード回路1003の処理量をデコード時の支障なく減らすためのものであり,必須ではない。
【0073】
このような制御により,音声出力バッファ回路1009の出力する音声信号と映像出力バッファ回路1004の出力する映像信号とは,より確実に同期をとれることとなる。
【0074】
なお,システム解析回路1001を含む手段は本発明の分別手段に対応し,音声デコード回路1006を含む手段は本発明の音声信号生成手段に対応し,音声速度変換回路1008を含む手段は本発明の音声速度変換手段に対応し,音声出力バッファ回路1009を含む手段は本発明の音声信号蓄積出力手段に対応し,映像デコード回路1003を含む手段は本発明の映像信号生成手段に対応し,映像出力バッファ回路1004を含む手段は本発明の映像信号蓄積出力手段に対応し,比較回路1011を含む手段は本発明の比較手段に対応する。また,映像入力バッファ回路1002を含む手段は,本発明の映像データ蓄積手段に対応する。
【0075】
つぎに,本発明の実施の形態1の映像音声再生装置のフロー図(その1)である図4を主として参照しながら,本実施の形態の映像音声再生装置の動作について説明する。なお,本実施の形態の映像音声再生装置の動作について説明しながら,本発明の映像音声再生方法の一実施の形態についても説明する。
【0076】
ステップ100,101;処理が開始され(ステップ100),システム解析回路1001は,ビットストリームを入力する(ステップ101)。
【0077】
ステップ102;システム解析回路1001は,ビットストリームから映像データとそれに対応するV−PTSが記録されている映像パケットとを抽出し,映像入力バッファ回路1002は,それらを記憶する。
【0078】
ステップ103;システム解析回路1001は,ビットストリームから音声データとそれに対応するA−PTSが記録されている音声パケットとを抽出し,音声入力バッファ回路1005は,それらを記憶する。
【0079】
ステップ104,105;映像デコード回路1003は,映像入力バッファ回路1002から映像データを取り込んで復号処理を施して映像信号に変換する(ステップ104)。
【0080】
映像出力バッファ回路1004は,その映像信号とV−PTS出力タイミングとを記憶し,V−PTSバッファ回路1104は,V−PTSを記憶する(ステップ105)。
【0081】
ステップ106〜108;音声デコード回路1006は,音声入力バッファ回路1005から音声データを取り込んで復号処理を施して音声信号に変換する(ステップ106)。
【0082】
音声速度変換回路1008は,速度設定回路1007が設定した音声速度変換比αに基づいて音声信号に音声速度変換処理を施す(ステップ107)。
【0083】
音声出力バッファ回路1009は,その継続時間を変えられた音声信号とA−PTS出力タイミングとを記憶し,A−PTSバッファ回路1209は,A−PTSを記憶する(ステップ108)。
【0084】
ステップ109;計時回路1010は,A−PTSバッファ回路1209が出力するA−PTSに対応する(したがって,音声出力バッファ回路1009が出力する音声信号に対応する)カウンタ値を計測し,比較回路1011は,V−PTSバッファ回路1104が出力する映像信号に対応するV−PTSからカウンタ値を減算してそれらの差分δを計算する。
【0085】
ステップ110〜114;比較回路1011は,差分δと所定の閾値δ0との関係を判断する(ステップ110)。
【0086】
(1)映像出力バッファ回路1004は,δ<−δ0(すなわち,音声タイムスタンプよりも映像タイムスタンプがかなり遅れている)と判断された場合には,自身が記憶している映像信号を1映像フレーム分スキップして出力する(ステップ111)。
【0087】
また,比較回路1011は,映像入力バッファ回路1002に対してBピクチャの映像データを廃棄するように制御を行う(ステップ112)。
【0088】
(2)映像出力バッファ回路1004は,δ>δ0(すなわち,音声タイムスタンプよりも映像タイムスタンプがかなり進んでいる)と判断された場合には,自身が記憶している映像信号を1映像フレーム分フリーズして出力する(ステップ113)。
【0089】
(3)映像出力バッファ回路1004は,−δ0≦δ≦δ0(すなわち,音声タイムスタンプよりも映像タイムスタンプがほとんど進んでも遅れてもいない)と判断された場合には,スキップもフリーズもしないで映像信号を出力する(ステップ114)。
【0090】
ステップ115〜118;音声出力バッファ回路1009は,音声信号を出力し(ステップ115),その音声信号に対応するA−PTSをA−PTSバッファ回路1209を通じて計時回路1010のカウンタに設定して(ステップ116),(1)再生終了である場合には,一連の処理が終了され,(2)再生終了でない場合には,一連の処理が繰り返される(ステップ117,118)。
【0091】
以上においては,本実施の形態の映像音声再生装置の構成および動作について詳細に説明した。
【0092】
(A)なお,映像出力バッファ回路1004に対し比較回路1011によって映像信号をスキップする旨の制御が行われる代わりに(または,そのような映像信号をスキップする旨の制御が行われるとともに),その旨が比較回路1011から映像入力バッファ回路1002に対して通知され,その通知を認識した映像デコード回路1003がBピクチャの映像データを自身で識別してスキップしてもよい。
【0093】
要するに,Bピクチャをそれ以外のピクチャと区別して,Bピクチャの映像データのみを廃棄したりスキップしたりすることで,映像デコード回路1003の処理量をデコード時の支障なく減らし,映像出力バッファ回路1004の容量を小さくすることが可能になる。
【0094】
(B)ただし,全体のピクチャに対するBピクチャ以外のピクチャの割合pが外部から設定された音声速度変換比α0<1に比べて多すぎる場合(すなわち,Bピクチャの割合が音声速度変換比α0に比べて少なすぎる場合)がある。このような場合には,Bピクチャの映像信号の廃棄やスキップが十分に行われず,映像出力バッファ回路1004の出力するV−PTSが計時回路1010の出力する時刻T(カウンタ値)に対してどんどん小さくなっていく可能性がある。
【0095】
そして,そのままにしておくと,映像信号と音声信号の同期がとれなくなるだけでなく,映像出力バッファ回路1004がオーバーフローしてしまう恐れもある。
【0096】
そこで,必要に応じて音声速度変換比αをα0≦α≦1の範囲において調節するための制御シーケンスが設けられていてもよい。
【0097】
より具体的に説明すると,本発明の実施の形態1の映像音声再生装置のフロー図(その2)である図5に示されているように,本実施の形態の映像音声再生装置はつぎのような音声速度変換比調節モードを実装していてもよい。
【0098】
ステップ401〜406;比較回路1011は,前述のようなBピクチャの1映像フレーム分のスキップができたか否かを判断する(ステップ401)。
【0099】
(1)速度設定回路1007は,スキップできたと判断された場合には,その時点での音声速度変換比αと音声速度変換比α0との関係を判断する(ステップ402)。
【0100】
速度設定回路1007は,(a)α=α0と判断した場合には,そのままのαを保ち,(b)α≠α0と判断した場合には,前述の差分δと所定の閾値δ0′との関係を判断し(ステップ403),(b1)δ<−δ0′(すなわち,V−PTSがかなり遅れている)と判断した場合には,αを減少させてα0に近づけることはせずにそのままのαを保ち,(b2)δ≧−δ0′と判断した場合には,αを減少させてα0に近づける(ステップ404)。
【0101】
(2)速度設定回路1007は,スキップできなかったと判断された場合には,差分δと所定の閾値δ0′との関係を判断する(ステップ405)。
【0102】
速度設定回路1007は,(a)δ<−δ0′と判断した場合には,αを増大させて1に近づけ(ステップ406),(b)δ≧−δ0′と判断した場合には,αを増大させて1に近づけることはせずにそのままのαを保つ。
【0103】
(C)もちろん,音声速度変換比αをα0≦α≦1の範囲において調節するとは,音声速度変換比αをα=α0またはα=1となるように調節することであってもよい。
【0104】
たとえば,ステップ406において即座にα=1とすることで,α>1とならないようにするための演算処理が不要になり,映像信号がBピクチャを全く有しない場合でも音声信号と映像信号との同期ずれや映像出力バッファ1004のオーバーフローを容易に回避できる。また,ステップ404において即座にα=α0とすることで,α<α0とならないようにするための演算処理が不要になり,全体のピクチャに対するBピクチャ以外のピクチャの割合pが少なくなった場合には本来の音声速度変換比を速やかに実現できる。
【0105】
(D)なお,本実施の形態の映像音声再生装置においては,(1)音声速度変換回路1008は,速度設定回路1007からの設定に応じて,A−PTSに関する情報が維持されるような音声速度変換を音声デコード回路1006によって生成された音声信号に対して行い,(2)比較回路1011は,音声出力バッファ回路1009がA−PTSバッファ回路1209に対して出力するA−PTS出力タイミングを利用して,A−PTSとV−PTSとを比較した。
【0106】
しかし,これに限らず,音声速度変換回路1008での処理遅延と音声出力バッファ回路1009での待ち時間とがあらかじめ推定される場合には,音声出力バッファ回路1009から出力されるA−PTS出力タイミングに合わせて,A−PTSがA−PTSバッファ回路1209から出力されなくてもよい。
【0107】
より具体的に説明すると,本発明の一実施の形態の映像音声再生装置のブロック図である図6に示されているように,(1)音声速度変換回路1008′は,速度設定回路1007からの設定に応じて,音声速度変換を音声デコード回路1006によって生成された音声信号に対して行い,(2)A−PTSバッファ回路1209′は,音声デコード回路1006から出力されたA−PTSに対して,音声速度変換回路1008′での処理遅延と,音声出力バッファ回路1009′での待ち時間との両方の合計時間だけ遅延処理を施して,計時回路1010に出力し,(3)比較回路1011は,計時回路1010が出力する時刻T(カウンタ値)とV−PTSバッファ回路1104が出力するV−PTSとを比較してもよい。
【0108】
もちろん,音声速度変換回路1008′での処理遅延と音声出力バッファ回路1009′での待ち時間とが,速度設定回路1007の設定値によって変化する場合には,速度設定回路1007の設定値を,A−PTSバッファ回路1209′に出力し,遅延時間長を音声速度変換比に応じて変化させてもよい。
【0109】
なお,音声速度変換回路1008′を含む手段は本発明の音声速度変換手段に対応し,音声出力バッファ回路1009′を含む手段は本発明の音声信号蓄積出力手段に対応する。また,A−PTSバッファ回路1209′を含む手段は,本発明の遅延情報生成手段に対応する。
【0110】
また,本発明の所定の遅延情報は,音声速度変換回路1008′での処理遅延と音声出力バッファ回路1009′での待ち時間とを考慮して上述のような時間遅延の補償を行うための情報に対応する。
【0111】
(実施の形態2)
はじめに,本発明の実施の形態2の映像音声再生装置のブロック図である図7を主として参照しながら,本実施の形態の映像音声再生装置の構成について説明する。
【0112】
システム解析回路2001は,入力データから,映像データと音声データを分別する回路である。
【0113】
映像入力バッファ回路2002は,システム解析回路2001が出力する映像データを蓄える回路であり,映像デコード回路2003は,映像入力バッファ回路2002から映像データを取り込んで復号し映像信号に変換する回路である。
【0114】
映像出力バッファ回路2004は,映像デコード回路2003が出力する映像信号を蓄えて出力する回路である。
【0115】
音声入力バッファ回路2005は,システム解析回路2001が出力する音声データを蓄える回路であり,音声デコード回路2006は,音声入力バッファ回路2005から音声データを取り込んで復号し音声信号に変換する回路である。
【0116】
速度設定回路2007は,リモコンなどを用いた外部からのユーザの指示に応じて所望の音声速度変換比α(実数)を設定する回路である。
【0117】
速度制御回路2012は,有理数変換回路2013および頻度計算回路2014を有する回路である。
【0118】
有理数変換回路2013は,速度設定回路2007が出力する音声速度変換比αの値をその近傍の有理数βに変換して出力する回路である。
【0119】
頻度計算回路2014は,有理数変換回路2013が出力する有理数βに基づいて,(1)音声の継続時間を延ばす場合には,映像出力バッファ回路2004に対して,有理数βに基づいた頻度で映像信号をフリーズするように制御し,(2)音声の継続時間を縮める場合には,映像出力バッファ回路2004に対して,有理数βに基づいた頻度で映像信号(たとえば,映像デコード回路2003が他のピクチャのデコード時に参照しない映像タイプのBピクチャ)をスキップするように制御する回路である。
【0120】
また,頻度計算回路2014は,音声の継続時間を縮める後者の場合には,映像入力バッファ回路2002に対してBピクチャの映像データを,有理数βに基づいた頻度で廃棄するように制御する回路である。
【0121】
このような制御により,音声出力バッファ回路2009の出力する音声信号と映像出力バッファ回路2004の出力する映像信号とは,より確実に同期をとれることとなる。
【0122】
音声速度変換回路2008は,音声速度変換回路1008と類似した構成を有しており,周波数を変えることなく継続時間のみを変える音声速度変換方法を利用して,速度制御回路2012から出力された有理数βに基づいて音声デコード回路2006が出力する音声信号に音声速度変換処理を施す回路である。
【0123】
音声出力バッファ回路2009は,音声速度変換回路2008の出力する音声信号を蓄えて音声信号をサンプリング周波数に基づいて連続的に出力する回路である。
【0124】
なお,システム解析回路2001を含む手段は本発明の分別手段に対応し,音声デコード回路2006を含む手段は本発明の音声信号生成手段に対応し,音声速度変換回路2008を含む手段は本発明の音声速度変換手段に対応し,音声出力バッファ回路2009を含む手段は本発明の音声信号蓄積出力手段に対応し,映像デコード回路2003を含む手段は本発明の映像信号生成手段に対応し,映像出力バッファ回路2004を含む手段は本発明の映像信号蓄積出力手段に対応する。また,有理数変換回路2013を含む手段は,本発明の音声速度変換比変換手段に対応する。また,映像入力バッファ回路2002を含む手段は,本発明の映像データ蓄積手段に対応する。
【0125】
つぎに,本発明の実施の形態2の映像音声再生装置のフロー図(その1)である図8を主として参照しながら,本実施の形態の映像音声再生装置の動作について説明する。なお,本実施の形態の映像音声再生装置の動作について説明しながら,本発明の映像音声再生方法の一実施の形態についても説明する。
【0126】
ステップ200,201;処理が開始され(ステップ200),速度設定回路2007は,音声速度変換比α(0<α≦2)を入力する(ステップ201)。
【0127】
ステップ202;有理数変換回路2013は,音声速度変換比αをその近傍の有理数βに変換する。
【0128】
ステップ203;システム解析回路2001は,ビットストリームを入力する。
【0129】
ステップ204;システム解析回路2001は,ビットストリームから映像パケットを抽出し,映像入力バッファ回路2002は,それらを記憶する。
【0130】
ステップ205;システム解析回路2001は,ビットストリームから音声パケットを抽出し,音声入力バッファ回路2005は,それを記憶する。
【0131】
ステップ206,207;映像デコード回路2003は,映像入力バッファ回路2002から映像データを取り込んで復号処理を施して映像信号に変換する(ステップ206)。
【0132】
映像出力バッファ回路2004は,その映像信号を記憶する(ステップ207)。
【0133】
ステップ208〜210;音声デコード回路2006は,音声入力バッファ回路2005から音声データを取り込んで復号処理を施して音声信号に変換する(ステップ208)。
【0134】
音声速度変換回路2008は,有理数変換回路2013が変換した有理数βに基づいて音声信号に音声速度変換処理を施し,その継続時間を変更する(ステップ209)。
【0135】
音声出力バッファ回路2009は,その継続時間を変えられた音声信号を記憶する(ステップ210)。
【0136】
ステップ211〜217;頻度計算回路2014は,有理数βと1との関係を判断する(ステップ211)。
【0137】
(1)頻度計算回路2014は,0<β<1(すなわち,再生速度を速くする)と判断した場合には,
【0138】
【数1】
1−β=n(1)/m(1)
なる互いに素な整数m(1),n(1)(1≦n(1)<m(1))を計算し,
【0139】
【数2】
m(1)=n(1)q(1)+r(1)
なる整数q(1),r(1)(0≦r(1)<n(1))を計算し,
【0140】
【数3】
r(1)=0の場合には,
m(1) j=q(1)(j=1,…,n(1))
r(1)≧1の場合には,
m(1) j=q(1)+1(j=1,…,r (1) ),
m(1) j=q(1)(j=r (1) +1,…,n(1))
なるn(1)個の整数m(1) j(j=1,…,n(1))による整数m(1)の分割
【0141】
【数4】
m(1)=Σj m(1) j (Σは1≦j≦n(1)に関して考える)
を計算する(ステップ212)。映像出力バッファ回路2004は,記憶している映像信号を利用して,はじめのm(1) 1映像フレームにおいて1映像フレームをスキップし,つぎのm(1) 2映像フレームにおいて1映像フレームをスキップし,…(都合,m(1)映像フレームにおいてn(1)映像フレームをスキップする)というようにして映像信号を出力する(ステップ213)。
【0142】
このような整数m(1)の分割を利用してきめ細かくスキップすることで,たとえばm(1)映像フレームにおける最初のn(1)映像フレームをまとめてスキップするよりも,ギクシャクした感じをユーザに与えないより滑らかな動画再生が実現されるものである。
【0143】
または,頻度計算回路2014は,映像入力バッファ回路2002に対してBピクチャの映像データを廃棄するように制御する(ステップ214)。
【0144】
(2)頻度計算回路2014は,1<β≦2(すなわち,再生速度を遅くする)と判断した場合には,
【0145】
【数5】
β−1=n(2)/m(2)
なる互いに素な整数m(2),n(2)(1≦n(2)≦m(2))を計算し,
【0146】
【数6】
m(2)=n(2)q(2)+r(2)
なる整数q(2),r(2)(0≦r(2)<n(2))を計算し,
【0147】
【数7】
r(2)=0の場合には,
m(2) j=q(2)(j=1,…,n(2))
r(2)≧1の場合には,
m(2) j=q(2)+1(j=1,…,r (2) ),
m(2) j=q(2)(j=r (2) +1,…,n(2))
なるn(2)個の整数m(2) j(j=1,…,n(2))による整数m(2)の分割
【0148】
【数8】
m(2)=Σj m(2) j (Σは1≦j≦n(2)に関して考える)
を計算する(ステップ215)。映像出力バッファ回路2004は,記憶している映像信号を利用して,はじめのm(2) 1映像フレームにおいて1映像フレームをフリーズし,つぎのm(2) 2映像フレームにおいて1映像フレームをフリーズし,…(都合,m(2)映像フレームにおいてn(2)映像フレームをフリーズする)というようにして映像信号を出力する(ステップ216)。
【0149】
このような整数m(2)の分割を利用してきめ細かくフリーズすることで,たとえばm(2)映像フレームにおける最初のn(2)映像フレームをまとめてフリーズするよりも,ギクシャクした感じをユーザに与えないより滑らかな動画再生が実現されるものである。
【0150】
(3)頻度計算回路2014は,β=1(すなわち,再生速度を速くもせず遅くもしない)と判断した場合には,それ以上何も計算せず,映像出力バッファ回路2004は,記憶している映像信号を利用して,スキップもフリーズもしないで映像信号を出力する(ステップ217)。
【0151】
ステップ218〜220;音声出力バッファ回路2009は,音声信号を出力し(ステップ218),(1)再生終了である場合には,一連の処理が終了され,(2)再生終了でない場合には,一連の処理が繰り返される(ステップ219,220)。
【0152】
以上においては,本実施の形態の映像音声再生装置の構成および動作について詳細に説明した。
【0153】
(A)なお,前述した実施の形態1の場合と同様,映像出力バッファ回路2004に対し速度制御回路2012によって映像信号(たとえばBピクチャ)をスキップする旨の制御が行われる代わりに(または,そのような映像信号をスキップする旨の制御が行われるとともに),その旨が速度制御回路2012より映像入力バッファ回路2002に対して通知され,その通知を認識した映像デコード回路2003が映像信号(たとえばBピクチャ)の映像データを自身で識別して廃棄してもよい。
【0154】
要するに,Bピクチャをそれ以外のピクチャと区別して,Bピクチャの映像信号のみを廃棄したりスキップしたりすることで,映像デコード回路2003の処理量をデコード時の支障なく減らし,映像出力バッファ回路2004の容量を小さくすることが可能になる。
【0155】
(B)ただし,全体のピクチャに対するBピクチャ以外のピクチャの割合pが外部から設定された音声速度変換比α0(したがって,音声速度変換比α0が変換された有理数β0)に比べて多すぎる場合がある。このような場合には,Bピクチャの映像信号の廃棄やスキップが十分に行われなくなる可能性がある。
【0156】
そして,そのままにしておくと,映像信号と音声信号の同期がとれなくなるだけでなく,映像出力バッファ回路2004がオーバーフローしてしまう恐れもある。
【0157】
そこで,必要に応じて有理数βをβ0≦β≦1の範囲において調節するための制御シーケンスが設けられていてもよい。
【0158】
より具体的に説明すると,本発明の実施の形態2の映像音声再生装置のフロー図(その2)である図9に示されているように,本実施の形態の映像音声再生装置はつぎのような音声速度変換比調節モードを実装していてもよい。
【0159】
ステップ501〜506;速度設定回路2007は,その時点での音声速度変換比αが変換された有理数βと1との関係を判断する(ステップ501)。
【0160】
頻度計算回路2014は,(a)β≧1と判断された場合には,そのままのβを保ち,(b)β<1と判断された場合には,前述のようなBピクチャの1映像フレーム分のスキップができたか否かを判断する(ステップ502)。
【0161】
(1)速度設定回路2007は,スキップできなかったと判断した場合には,βを増大させて1に近づける(ステップ503)。
【0162】
(2)速度設定回路2007は,スキップできたと判断した場合には,β=β0か否かを判断する(ステップ504)。
【0163】
速度設定回路2007は,(a)β=β0と判断した場合には,そのままのβを保ち,(b)β≠β0と判断した場合には,その時点での全体のピクチャに対するBピクチャ以外のピクチャの割合pと有理数βとの関係を判断し(ステップ505),(b1)p≦β(すなわち,Bピクチャの割合1−pが十分に大きい)と判断した場合には,βを減少させてβ0に近づけ(ステップ506),(b2)p>βと判断した場合には,βを減少させてβ0に近づけることはせずにそのままのβを保つ。
【0164】
なお,全体のピクチャ数に対するBピクチャ以外のピクチャの割合の検出についてより具体的に述べると,つぎの通りである。
【0165】
映像デコード回路2003は,映像データをデコードしながら,映像データの各ピクチャのデータに記述してある映像タイプの識別を行う。そして,速度設定回路2007は,たとえば過去1秒間分(NTSCの場合は30フレーム)の各映像タイプ(Iピクチャ,Pピクチャ,Bピクチャ)の累積数を求め,(数9)を利用してその累積数から全体のピクチャに対するBピクチャ以外のピクチャの割合を求める。
【0166】
【数9】
A=(Iピクチャ+Pピクチャ)/(Iピクチャ+Pピクチャ+Bピクチャ)速度設定回路2007は,求められた値Aが設定されている音声速度変換比αよりも大きい場合には,設定されている音声速度変換比αをAと1の間の値に修正する。そして,速度設定回路7は,この値Aが元々設定されていた音声速度変換比α0よりも小さい値に回復した場合には,音声速度変換比αを音声速度変換比α0に設定し直す。
【0167】
(C)もちろん,有理数βをβ0≦β≦1の範囲において調節するとは,有理数βをβ=β0またはβ=1となるように調節することであってもよい。
【0168】
たとえば,ステップ503において即座にβ=1とすることで,β>1とならないようにするための演算処理が不要になり,映像信号がBピクチャを全く有しない場合でも音声信号と映像信号との同期ずれや映像出力バッファ2004のオーバーフローを容易に回避できる。また,ステップ506において即座にβ=β0とすることで,β<β0とならないようにするための演算処理が不要になり,全体のピクチャに対するBピクチャ以外のピクチャの割合pが少なくなった場合には本来の音声速度変換比を速やかに実現できる。
【0169】
(D)なお,前述した実施の形態1の場合と同様,映像データがV−PTSを伴っており,音声データがA−PTSを伴っている場合には,映像出力バッファ2004が出力するV−PTSと音声出力バッファ2009が出力するA−PTSとを比較して,映像出力バッファ2004が蓄積している映像フレームのフリーズ/スキップをさらに行うようにしてもよい。
【0170】
このようなV−PTSとA−PTSとの比較による映像フレームのフリーズ/スキップを行うことで,音声速度変換処理以外の原因(たとえば,記録媒体における傷やゴミの付着,映像信号のデコード時間と音声信号のデコード時間との相違などに起因して発生する原因)による映像と音声の同期ずれを補償するための,映像と音声の同期(AV同期)を実現することができる。
【0171】
より具体的に説明すると,上述した実施の形態2で説明された原理を利用して音声速度変換処理が行われている場合における映像と音声の同期をとりつつ,上述した実施の形態1で説明された原理を利用して音声速度変換処理以外の原因による映像と音声の同期ずれを補償してもよい。たとえば,本発明の一実施の形態の映像音声再生装置のブロック図である図10に示された構成を有する映像音声再生装置は,そのような機能を備えた映像音声再生装置の具体例である。
【0172】
なお,発明のプログラムは,上述した本発明の映像音声再生装置の全部または一部の手段(または,装置,素子,回路,部など)の機能をコンピュータにより実行させるためのプログラムであって,コンピュータと協働して動作するプログラムである。また,本発明のプログラムは,上述した本発明の映像音声再生方法の全部または一部のステップ(または,工程,動作,作用など)の動作をコンピュータにより実行させるためのプログラムであって,コンピュータと協働して動作するプログラムである。
【0173】
また,発明のデータ構造は,上述した本発明の映像音声再生装置または映像音声再生方法の全部または一部の手段やステップで,コンピュータと協働して利用されるデータ構造である。
【0174】
また,発明の媒体は,上述した本発明の映像音声再生装置の全部または一部の手段の全部または一部の機能をコンピュータにより実行させるためのプログラムを担持した媒体であり,コンピュータにより読み取り可能,かつ読み取られた前記プログラムが前記コンピュータと協動して前記機能を実行する媒体である。また,本発明の媒体は,上述した本発明の映像音声再生方法の全部または一部のステップの全部または一部の動作をコンピュータにより実行させるためのプログラムを担持した媒体であり,コンピュータにより読み取り可能,かつ読み取られた前記プログラムが前記コンピュータと協動して前記動作を実行する媒体である。また,発明の媒体は,上述した本発明の映像音声再生装置または映像音声再生方法の全部または一部の手段やステップで,コンピュータと協働して利用されるデータ構造を担持した媒体であり,コンピュータにより読み取り可能,かつ読み取られた前記データ構造が前記コンピュータと協動して利用される媒体である。
【0175】
なお,本発明の上記「一部の手段(または,装置,素子,回路,部など)」,本発明の上記「一部のステップ(または,工程,動作,作用など)」とは,それらの複数の手段またはステップの内の,幾つかの手段またはステップを意味し,あるいは,一つの手段またはステップの内の,一部の機能または一部の動作を意味するものである。
【0176】
また,本発明のプログラムの一利用形態は,コンピュータにより読み取り可能な記録媒体に記録され,コンピュータと協働して動作する態様であってもよい。また,本発明のプログラムの一利用形態は,伝送媒体中を伝送し,コンピュータにより読みとられ,コンピュータと協働して動作する態様であってもよい。
【0177】
また,発明のデータ構造としては,データベース,データフォーマット,データテーブル,データリスト,データの種類などを含む。
【0178】
また,記録媒体としては,ROMなどが含まれ,伝送媒体としては,インターネットなどの伝送媒体,光・電波・音波などが含まれる。
【0179】
また,上述した発明のコンピュータは,CPUなどの純然たるハードウェアに限らず,ファームウェアや,OS,更に周辺機器を含むものであってもよい。
【0180】
以上説明したように,本発明の構成は,ソフトウェア的に実現してもよいし,ハードウェア的に実現してもよい。
【0181】
【発明の効果】
以上述べたところから明らかなように,本発明は,再生速度が通常再生速度とは異なるように設定されているときにも,映像信号の出力タイミングと音声信号の出力タイミングとが通常再生時に比べて大きくずれることなく,それらの同期をより正確に保つことができるという長所を有する。
【図面の簡単な説明】
【図1】本発明の実施の形態1の映像音声再生装置のブロック図である。
【図2】本発明の実施の形態1の入力データの説明図である。
【図3】(A)本発明の実施の形態1の音声速度変換方法の説明図(その1)である。
(B)本発明の実施の形態1の音声速度変換方法の説明図(その2)である。
【図4】本発明の実施の形態1の映像音声再生装置のフロー図(その1)である。
【図5】本発明の実施の形態1の映像音声再生装置のフロー図(その2)である。
【図6】本発明の一実施の形態の映像音声再生装置のブロック図である。
【図7】本発明の実施の形態2の映像音声再生装置のブロック図である。
【図8】本発明の実施の形態2の映像音声再生装置のフロー図(その1)である。
【図9】本発明の実施の形態2の映像音声再生装置のフロー図(その2)である。
【図10】本発明の一実施の形態の映像音声再生装置のブロック図である。
【図11】従来の映像音声再生装置のブロック図である。
【符号の説明】
1001 システム解析回路
1002 映像入力バッファ回路
1003 映像デコード回路
1004 映像出力バッファ回路
1104 V−PTSバッファ回路
1005 音声入力バッファ回路
1006 音声デコード回路
1007 速度設定回路
1008 音声速度変換回路
1009 音声出力バッファ回路
1209 A−PTSバッファ回路
1010 計時回路
1011 比較回路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a video / audio reproduction device, a video / audio reproduction method, a program, and a medium in which synchronization between video and audio is maintained even when reproduction is performed at a speed other than 1 × speed.
[0002]
[Prior art]
In a conventional video / audio reproduction device, reproduction is performed using a method for maintaining synchronization between video and audio as described below (see, for example, Patent Document 1). Further, FIG. 11 shows a block diagram of a conventional video / audio reproducing apparatus in which the video and audio are kept synchronized even when reproduced at a speed other than 1 × speed.
[0003]
The
[0004]
The video
[0005]
The video
[0006]
The audio
[0007]
The audio
[0008]
The speed setting circuit 7 is a circuit that sets a desired speed in accordance with a user instruction using a remote controller or the like, and the video
[0009]
The audio
[0010]
Next, the operation of the conventional video / audio reproduction device will be described.
[0011]
The
[0012]
The video
[0013]
The video
[0014]
The audio
[0015]
The audio
[0016]
The speed setting circuit 7 sets a desired speed in accordance with a user instruction using a remote controller or the like, and the video
[0017]
The audio
[0018]
Therefore, (1) when the duration time is shortened, the control signal is output to the audio
[0019]
[Patent Document 1]
JP 2001-8170 A
[0020]
[Problems to be solved by the invention]
However, in the conventional video / audio playback device described above, the output timing of the video signal and the output timing of the audio signal are different from those during normal playback during speed conversion in which the speed is set so as to shorten or extend the duration. As a result, there is a problem that synchronization may not be maintained accurately.
[0021]
It should be noted that there is a need for quick viewing and slow listening of content, and AV synchronization needs to be guaranteed even when fast viewing and slow listening are performed.
[0022]
In consideration of the above-described conventional problems, the present invention provides that the output timing of the video signal and the output timing of the audio signal are the same during normal playback even when the playback speed is set to be different from the normal playback speed. It is an object of the present invention to provide a video / audio reproduction device, a video / audio reproduction method, a program, and a medium that can maintain synchronization more accurately without greatly deviating from the above.
[0037]
First1According to the present invention, MPEG (Moving Picture Experts Group) data input from outside having audio data and video data is classified into the audio data and the video data;
In accordance with an audio signal generating means for decoding the sorted audio data and generating an audio signal, and an execution playback speed for actually executing playback determined based on an externally set playback speed set from the outside Voice speed conversion means for performing a predetermined voice speed conversion on the generated voice signal;
An audio signal accumulating / outputting means for accumulating the audio signal subjected to the audio speed conversion and outputting the accumulated audio signal according to the execution reproduction speed;
Video signal generating means for decoding the sorted video data and generating a video signal;
Video signal storage and output means for storing the generated video signal and outputting the stored video signal according to the execution reproduction speed;
An audio speed conversion ratio converting means for converting an audio speed conversion ratio α of the generated audio signal relating to the externally set reproduction speed into a rational number β relating to the execution reproduction speed;
The voice speed conversion means performs the predetermined voice speed conversion on the generated voice signal according to the rational number β,
The audio signal accumulation output unit accumulates the audio signal subjected to the audio speed conversion, and outputs the accumulated audio signal according to the execution reproduction speed based on the rational number β.
The video signal storage / output means stores the generated video signal, and according to the execution playback speed, (1) when the rational number β is smaller than 1, skips the stored video signal. (2) When the rational number β is greater than 1, the video / audio reproduction device outputs the stored video signal using freeze.
[0038]
First2In the present invention, the video signal storage output means skips all or part of the B picture of the stored video signal when the rational number β is smaller than 1.1This is a video / audio reproduction device of the present invention.
[0039]
First3The present invention further comprises video data storage means for storing the sorted video data inserted between the sorting means and the video signal generating means,
The video data storage means discards all or part of the B pictures of the sorted video data when the rational number β is smaller than 1.1This is a video / audio reproduction device of the present invention.
[0040]
First4In the present invention, the execution playback speed is:in frontIt is adjusted based on whether the stored video signal can be output according to the execution playback speed.FirstThis is a video / audio reproduction device of the present invention.
According to a fifth aspect of the present invention, the stored video signal is adjusted according to whether or not the stored video signal is output according to the execution playback speed. If the stored video signal can be output in accordance with the execution playback speed, it is adjusted to approach the externally set playback speed. 4 is a video / audio reproduction device of the present invention.
[0041]
First6According to the present invention, the video signal storage and output means is (1) when the rational number β is smaller than 1,
[0042]
[Expression 1]
1-β = n(1)/ M(1)
An integer m(1), N(1)(1 ≦ n(1)<M(1)N) determined based on a predetermined criterion(1)Integer m(1) j(J = 1, 2,..., N(1)) Integer m(1)Split
[0043]
[Expression 4]
m(1)= Σjm(1) j (Σ is 1 ≦ j ≦ n(1)Think about)
The first m(1) 1One video frame is skipped in the video frame, and the next m(1) 2In the video frame, one video frame is skipped, and the accumulated video signal is output as follows. (2) When the rational number β is larger than 1,
[0044]
[Equation 5]
β-1 = n(2)/ M(2)
An integer m(2), N(2)(1 ≦ n(2)<M(2)N) determined based on a predetermined criterion(2)Integer m(2) j(J = 1, 2,..., N(2)) Integer m(2)Split
[0045]
[Equation 8]
m(2)= Σjm(2) j (Σ is 1 ≦ j ≦ n(2)Think about)
The first m(2) 1Freeze one video frame in the video frame and(2) 2The first video frame is frozen in the video frame, and so on.1This is a video / audio reproduction device of the present invention.
[0046]
First7The present invention includes (1) the n(1)Integer m(1) j(J = 1, 2,..., N(1))
[0047]
[Expression 2]
m(1)= N(1)q(1)+ R(1)
An integer q(1), R(1)(0 ≦ r(1)<N(1))
[0048]
[Equation 3]
r(1)If = 0,
m(1) j= Q(1)(J = 1, ..., n(1))
r(1)If ≧ 1,
m(1) j= Q(1)+1 (j = 1,..., R (1) ),
m(1) j= Q(1)(J = r (1) +1, ..., n(1))
N determined as(1)Integer m(1) j(J = 1, 2,..., N(1)And (2) n(2)Integer m(2) j(J = 1, 2,..., N(2))
[0049]
[Formula 6]
m(2)= N(2)q(2)+ R(2)
An integer q(2), R(2)(0 ≦ r(2)<N(2))
[0050]
[Expression 7]
r(2)If = 0,
m(2) j= Q(2)(J = 1, ..., n(2))
r(2)If ≧ 1,
m(2) j= Q(2)+1 (j = 1,..., R(2)),
m(2) j= Q(2)(J = r(2)+1, ..., n(2))
N determined as(2)Integer m(2) j(J = 1, 2,..., N(2)) Is the first6This is a video / audio reproduction device of the present invention.
[0051]
First8The present invention includes a separation step of separating MPEG (Moving Picture Experts Group) data input from outside having audio data and video data into the audio data and the video data;
An audio signal generation step of decoding the sorted audio data and generating an audio signal;
An audio speed conversion step for performing a predetermined audio speed conversion on the generated audio signal in accordance with an execution playback speed for actually executing playback determined based on an externally set playback speed set from the outside When,
An audio signal accumulation output step of accumulating the audio signal subjected to the audio speed conversion and outputting the accumulated audio signal according to the execution reproduction speed;
A video signal generating step for generating a video signal by decoding the sorted video data;
A video signal storage output step for storing the generated video signal and outputting the stored video signal in accordance with the execution reproduction speed;
In the voice speed conversion step, the predetermined voice speed conversion is performed on the generated voice signal according to the rational number β,
In the audio signal storage output step, the audio signal subjected to the audio speed conversion is stored.
And based on the rational number β, the accumulated audio signal is output according to the execution playback speed,
In the video signal storage output step, the generated video signal is stored, and depending on the execution playback speed, (1) when the rational number β is smaller than 1, the stored video signal is skipped. (2) In the video / audio reproduction method, when the rational number β is larger than 1, the stored video signal is output using freeze.
[0052]
First9The present invention is the first8In the video / audio reproduction method of the present invention, the computer executes the classification step, the audio signal generation step, the audio speed conversion step, the audio signal accumulation output step, the video signal generation step, and the video signal accumulation output step. It is a program for.
[0053]
First10The present invention is the first9A medium carrying the program of the present invention, which can be processed by a computer.
[0054]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0055]
(Embodiment 1)
First, the configuration of the video / audio reproduction device of the present embodiment will be described with reference mainly to FIG. 1 which is a block diagram of the video / audio reproduction device compliant with the MPEG standard of the first embodiment of the present invention.
[0056]
The
[0057]
According to the MPEG standard, image data and audio data that are decoded before and after are rearranged and output using information related to playback times indicated by the V-PTS and A-PTS, respectively. The
[0058]
The video
[0059]
The video
[0060]
The V-
[0061]
The audio
[0062]
The
[0063]
For example, when the voice speed conversion ratio α = 1/2, the duration of the voice signal is halved compared to the case where the voice is reproduced at a speed of one time, and the
[0064]
The voice
[0065]
In addition, as a voice speed conversion method in the present embodiment, a voice speed conversion method described in Japanese Patent No. 2532731 can be used. This voice speed conversion method multiplies the input voice waveform by a window function and performs a superposition addition that increases the value of the correlation function. It realizes voice speed conversion with almost no missing part.
[0066]
For example, a diagram (part 1) illustrating the voice speed conversion method according to the first embodiment of the present invention using voice speed conversion with a voice speed conversion ratio α = 2/3 by such a voice speed conversion method. The voice waveforms W1 to W9 as shown in FIG. 3 (A) are shown in FIG. 3 (B) which is an explanatory diagram (part 2) of the voice speed conversion method according to the first embodiment of the present invention. Voice waveforms W1 'to W9'.
[0067]
More specifically, for example, the speech waveforms W1 and W2 are superimposed so that no amplitude discontinuity occurs, and the speech waveform W1 is changed by changing only the duration without substantially changing the frequency. ', W2'. Further, the voice waveform W3 is converted into the voice waveform W3 ′ almost as it is. In addition, the speech waveforms W4 and W5 are superimposed with a phase shift without causing an amplitude discontinuity, and the speech waveforms W4 ′ and W5 ′ are changed by changing only the duration without substantially changing the frequency. Has been converted.
[0068]
The audio
[0069]
The
[0070]
The
[0071]
The
[0072]
The
[0073]
By such control, the audio signal output from the audio
[0074]
The means including the
[0075]
Next, the operation of the video / audio reproduction device of the present embodiment will be described with reference mainly to FIG. 4 which is a flowchart (part 1) of the video / audio reproduction device of the first embodiment of the present invention. While describing the operation of the video / audio reproduction device of the present embodiment, an embodiment of the video / audio reproduction method of the present invention will also be described.
[0076]
Steps 100 and 101: Processing is started (Step 100), and the
[0077]
Step 102: The
[0078]
Step 103: The
[0079]
Steps 104 and 105: The
[0080]
The video
[0081]
Steps 106 to 108: The
[0082]
The voice
[0083]
The audio
[0084]
Step 109: The
[0085]
Steps 110 to 114: The
[0086]
(1) The video
[0087]
The
[0088]
(2) The video
[0089]
(3) The video
[0090]
Steps 115 to 118: The audio
[0091]
In the foregoing, the configuration and operation of the video / audio reproduction device of the present embodiment have been described in detail.
[0092]
(A) Instead of controlling the video
[0093]
In short, by distinguishing the B picture from other pictures and discarding or skipping only the video data of the B picture, the processing amount of the
[0094]
(B) However, the ratio p of the picture other than the B picture to the whole picture is the audio speed conversion ratio α set from the outside.0<Too much compared to 1 (that is, the ratio of the B picture is the audio speed conversion ratio α0If there are too few compared to). In such a case, the video signal of the B picture is not sufficiently discarded or skipped, and the V-PTS output from the video
[0095]
If it is left as it is, not only the video signal and the audio signal cannot be synchronized, but also the video
[0096]
Therefore, if necessary, the voice speed conversion ratio α is set to α0A control sequence for adjustment in the range of ≦ α ≦ 1 may be provided.
[0097]
More specifically, as shown in FIG. 5 which is a flowchart (part 2) of the video / audio reproduction device of the first embodiment of the present invention, the video / audio reproduction device of the present embodiment is as follows. A voice speed conversion ratio adjustment mode may be implemented.
[0098]
Steps 401 to 406: The
[0099]
(1) When it is determined that the
[0100]
The speed setting circuit 1007: (a) α = α0If it is determined, α is kept as it is, and (b) α ≠ α0Is determined, the above-described difference δ and a predetermined threshold value δ0(Step 403), (b1) δ <−δ0′ (That is, V-PTS is considerably delayed), α is decreased and α0(B2) δ ≧ −δ0If ′ is judged, α is decreased and α0(Step 404).
[0101]
(2) If it is determined that the
[0102]
The
[0103]
(C) Of course, the voice speed conversion ratio α is α0To adjust within the range of ≦ α ≦ 1, the voice speed conversion ratio α is set to α = α0Alternatively, it may be adjusted so that α = 1.
[0104]
For example, by immediately setting α = 1 in
[0105]
(D) In the video / audio reproduction device according to the present embodiment, (1) the audio
[0106]
However, the present invention is not limited to this, and when the processing delay in the audio
[0107]
More specifically, as shown in FIG. 6 which is a block diagram of the video / audio reproduction apparatus according to the embodiment of the present invention, (1) the audio
[0108]
Of course, when the processing delay in the audio
[0109]
The means including the audio speed conversion circuit 1008 'corresponds to the audio speed conversion means of the present invention, and the means including the audio output buffer circuit 1009' corresponds to the audio signal storage / output means of the present invention. The means including the
[0110]
The predetermined delay information according to the present invention is information for compensating for the time delay as described above in consideration of the processing delay in the voice speed conversion circuit 1008 'and the waiting time in the voice output buffer circuit 1009'. Corresponding to
[0111]
(Embodiment 2)
First, the configuration of the video / audio reproduction device of the present embodiment will be described with reference mainly to FIG. 7 which is a block diagram of the video / audio reproduction device of the second embodiment of the present invention.
[0112]
A
[0113]
The video
[0114]
The video
[0115]
The audio
[0116]
The
[0117]
The
[0118]
The rational
[0119]
Based on the rational number β output from the rational
[0120]
The
[0121]
By such control, the audio signal output from the audio
[0122]
The voice
[0123]
The audio
[0124]
The means including the
[0125]
Next, the operation of the video / audio reproduction device of the present embodiment will be described with reference mainly to FIG. 8 which is a flowchart (part 1) of the video / audio reproduction device of the second embodiment of the present invention. While describing the operation of the video / audio reproduction device of the present embodiment, an embodiment of the video / audio reproduction method of the present invention will also be described.
[0126]
Steps 200 and 201: The processing is started (Step 200), and the
[0127]
Step 202: The rational
[0128]
Step 203: The
[0129]
Step 204: The
[0130]
Step 205: The
[0131]
Steps 206 and 207: The
[0132]
The video
[0133]
Steps 208 to 210: The
[0134]
The voice
[0135]
The audio
[0136]
Steps 211 to 217; The
[0137]
(1) When the
[0138]
[Expression 1]
1-β = n(1)/ M(1)
A disjoint integer m(1), N(1)(1 ≦ n(1)<M(1))
[0139]
[Expression 2]
m(1)= N(1)q(1)+ R(1)
An integer q(1), R(1)(0 ≦ r(1)<N(1))
[0140]
[Equation 3]
r(1)If = 0,
m(1) j= Q(1)(J = 1, ..., n(1))
r(1)If ≧ 1,
m(1) j= Q(1)+1 (j = 1,..., R (1) ),
m(1) j= Q(1)(J = r (1) +1, ..., n(1))
N(1)Integer m(1) j(J = 1, ..., n(1)) Integer m(1)Split
[0141]
[Expression 4]
m(1)= Σjm(1) j (Σ is 1 ≦ j ≦ n(1)Think about)
Is calculated (step 212). The video
[0142]
Such an integer m(1)For example, m(1)The first n in the video frame(1)Rather than skipping together video frames, smoother video playback that does not give the user a jerky feeling is realized.
[0143]
Alternatively, the
[0144]
(2) When the
[0145]
[Equation 5]
β-1 = n(2)/ M(2)
A disjoint integer m(2), N(2)(1 ≦ n(2)≦ m(2))
[0146]
[Formula 6]
m(2)= N(2)q(2)+ R(2)
An integer q(2), R(2)(0 ≦ r(2)<N(2))
[0147]
[Expression 7]
r(2)If = 0,
m(2) j= Q(2)(J = 1, ..., n(2))
r(2)If ≧ 1,
m(2) j= Q(2)+1 (j = 1,..., R (2) ),
m(2) j= Q(2)(J = r (2) +1, ..., n(2))
N(2)Integer m(2) j(J = 1, ..., n(2)) Integer m(2)Split
[0148]
[Equation 8]
m(2)= Σjm(2) j (Σ is 1 ≦ j ≦ n(2)Think about)
Is calculated (step 215). The video
[0149]
Such an integer m(2)For example, m(2)The first n in the video frame(2)Rather than freeze video frames together, smoother video playback that does not give the user a jerky feeling is realized.
[0150]
(3) If the
[0151]
Steps 218 to 220: The audio
[0152]
In the foregoing, the configuration and operation of the video / audio reproduction device of the present embodiment have been described in detail.
[0153]
(A) As in the case of the first embodiment described above, instead of controlling the video
[0154]
In short, by distinguishing the B picture from other pictures and discarding or skipping only the video signal of the B picture, the processing amount of the
[0155]
(B) However, the ratio p of the picture other than the B picture to the whole picture is the audio speed conversion ratio α set from the outside.0(Thus, the voice speed conversion ratio α0Is the rational number β0) May be too much. In such a case, there is a possibility that the video signal of the B picture is not sufficiently discarded or skipped.
[0156]
If this is left as it is, not only the video signal and the audio signal cannot be synchronized, but also the video
[0157]
Therefore, if necessary, the rational number β is changed to β0A control sequence for adjustment in the range of ≦ β ≦ 1 may be provided.
[0158]
More specifically, as shown in FIG. 9 which is a flowchart (part 2) of the video / audio reproduction device of the second embodiment of the present invention, the video / audio reproduction device of the present embodiment is as follows. A voice speed conversion ratio adjustment mode may be implemented.
[0159]
Steps 501 to 506: The
[0160]
The
[0161]
(1) If the
[0162]
(2) If the
[0163]
The
[0164]
More specifically, the detection of the ratio of pictures other than B pictures to the total number of pictures will be described as follows.
[0165]
The
[0166]
[Equation 9]
A = (I picture + P picture) / (I picture + P picture + B picture) The
[0167]
(C) Of course, the rational number β is changed to β0≦ β ≦ 1 is to adjust the rational number β to β = β0Alternatively, it may be adjusted so that β = 1.
[0168]
For example, by immediately setting β = 1 in step 503, an arithmetic process for preventing β> 1 is unnecessary, and even if the video signal does not have any B picture, the audio signal and the video signal A synchronization error and an overflow of the
[0169]
(D) As in the case of the first embodiment, when the video data is accompanied by V-PTS and the audio data is accompanied by A-PTS, the V− output from the
[0170]
By performing freeze / skip of the video frame by comparing the V-PTS and the A-PTS, causes other than the audio speed conversion process (for example, attachment of scratches or dust on the recording medium, decoding time of the video signal, and the like) Video and audio synchronization (AV synchronization) can be realized to compensate for the video and audio synchronization shift caused by differences in the audio signal decoding time and the like.
[0171]
More specifically, the first embodiment will be described while synchronizing the video and audio when the audio speed conversion process is performed using the principle described in the second embodiment. Using this principle, it is possible to compensate for a video and audio synchronization shift caused by causes other than the audio speed conversion processing. For example, the video / audio reproduction device having the configuration shown in FIG. 10 which is a block diagram of the video / audio reproduction device according to the embodiment of the present invention is a specific example of the video / audio reproduction device having such a function. .
[0172]
The program of the invention is a program for causing a computer to execute the functions of all or part of the above-described video / audio reproduction device of the present invention (or device, element, circuit, unit, etc.). It is a program that operates in cooperation with. The program of the present invention is a program for causing a computer to execute all or some of the steps (or processes, operations, actions, etc.) of the video / audio reproduction method of the present invention described above. It is a program that works in cooperation.
[0173]
The data structure of the invention is a data structure used in cooperation with a computer in all or part of the steps and steps of the video / audio reproduction device or video / audio reproduction method of the present invention described above.
[0174]
The medium of the invention is a medium carrying a program for causing the computer to execute all or part of the functions of all or part of the above-described video / audio reproduction device of the present invention, and is readable by the computer. The read program is a medium for executing the function in cooperation with the computer. The medium of the present invention is a medium carrying a program for causing a computer to execute all or part of the operations of all or some of the steps of the video / audio reproduction method of the present invention described above, and is readable by the computer. And the read program is a medium for executing the operation in cooperation with the computer. The medium of the invention is a medium carrying a data structure used in cooperation with a computer in all or part of means or steps of the video / audio reproduction device or video / audio reproduction method of the present invention described above. The medium is readable by a computer and the data structure read is used in cooperation with the computer.
[0175]
The “part of means (or apparatus, element, circuit, part, etc.)” of the present invention and the “part of step (or process, operation, action, etc.)” of the present invention are those It means several means or steps among a plurality of means or steps, or means some function or part of operation within one means or step.
[0176]
Further, one usage form of the program of the present invention may be an aspect in which the program is recorded on a computer-readable recording medium and operates in cooperation with the computer. Further, one usage form of the program of the present invention may be an aspect in which the program is transmitted through a transmission medium, read by a computer, and operated in cooperation with the computer.
[0177]
The data structure of the invention includes a database, a data format, a data table, a data list, a data type, and the like.
[0178]
Further, the recording medium includes a ROM and the like, and the transmission medium includes a transmission medium such as the Internet, light, radio waves, sound waves, and the like.
[0179]
The computer of the above-described invention is not limited to pure hardware such as a CPU, and may include firmware, an OS, and peripheral devices.
[0180]
As described above, the configuration of the present invention may be realized by software or hardware.
[0181]
【The invention's effect】
As is apparent from the above description, the present invention provides a video signal output timing and an audio signal output timing that are different from those during normal playback even when the playback speed is set to be different from the normal playback speed. Therefore, they have the advantage of being able to keep their synchronization more accurately without greatly deviating.
[Brief description of the drawings]
FIG. 1 is a block diagram of a video / audio reproduction device according to a first embodiment of the present invention.
FIG. 2 is an explanatory diagram of input data according to the first embodiment of the present invention.
FIG. 3A is an explanatory diagram (part 1) of the audio speed conversion method according to the first embodiment of the present invention.
(B) It is explanatory drawing (the 2) of the audio | voice speed conversion method of
FIG. 4 is a flowchart (No. 1) of the video / audio reproduction device according to the first embodiment of the present invention;
FIG. 5 is a flowchart (part 2) of the video / audio reproduction device according to the first embodiment of the present invention;
FIG. 6 is a block diagram of a video / audio reproduction device according to an embodiment of the present invention.
FIG. 7 is a block diagram of a video / audio reproduction device according to
FIG. 8 is a flowchart (No. 1) of the video / audio reproduction device according to the second embodiment of the present invention;
FIG. 9 is a flowchart (No. 2) of the video / audio reproduction device according to the second embodiment of the present invention;
FIG. 10 is a block diagram of a video / audio reproduction device according to an embodiment of the present invention.
FIG. 11 is a block diagram of a conventional video / audio reproduction device.
[Explanation of symbols]
1001 System analysis circuit
1002 Video input buffer circuit
1003 Video decoding circuit
1004 Video output buffer circuit
1104 V-PTS buffer circuit
1005 Audio input buffer circuit
1006 Audio decoding circuit
1007 Speed setting circuit
1008 Voice speed conversion circuit
1009 Audio output buffer circuit
1209 A-PTS buffer circuit
1010 Timekeeping circuit
1011 Comparison circuit
Claims (10)
前記分別された音声データをデコードして,音声信号を生成する音声信号生成手段と, 外部から設定される外部設定再生速度に基づいて決定される実際に再生を実行するための実行再生速度に応じて,所定の音声速度変換を前記生成された音声信号に対して行う音声速度変換手段と,
前記音声速度変換が行われた音声信号を蓄積し,前記蓄積されている音声信号を前記実行再生速度に応じて出力する音声信号蓄積出力手段と,
前記分別された映像データをデコードして映像信号を生成する映像信号生成手段と,
前記生成された映像信号を蓄積し,前記蓄積されている映像信号を前記実行再生速度に応じて出力する映像信号蓄積出力手段と,
前記外部設定再生速度に関する前記生成された音声信号の音声速度変換比αを,前記実行再生速度に関する有理数βに変換する音声速度変換比変換手段とを備え,
前記音声速度変換手段は,前記有理数βに応じて,前記所定の音声速度変換を前記生成された音声信号に対して行い,
前記音声信号蓄積出力手段は,前記音声速度変換が行われた音声信号を蓄積し,前記有理数βに基づき,前記蓄積されている音声信号を前記実行再生速度に応じて出力し,
前記映像信号蓄積出力手段は,前記生成された映像信号を蓄積し,前記実行再生速度に応じて,(1)前記有理数βが1より小さい場合には,前記蓄積されている映像信号をスキップを利用して出力し,(2)前記有理数βが1より大きい場合には,前記蓄積されている映像信号をフリーズを利用して出力する映像音声再生装置。A separating means for separating MPEG (Moving Picture Experts Group) data input from outside having audio data and video data into the audio data and the video data;
In accordance with an audio signal generating means for decoding the sorted audio data and generating an audio signal, and an execution playback speed for actually executing playback determined based on an externally set playback speed set from the outside Voice speed conversion means for performing a predetermined voice speed conversion on the generated voice signal;
An audio signal accumulating / outputting means for accumulating the audio signal subjected to the audio speed conversion and outputting the accumulated audio signal according to the execution reproduction speed;
Video signal generating means for decoding the sorted video data and generating a video signal;
Video signal storage and output means for storing the generated video signal and outputting the stored video signal in accordance with the execution reproduction speed;
An audio speed conversion ratio converting means for converting an audio speed conversion ratio α of the generated audio signal relating to the externally set reproduction speed into a rational number β relating to the execution reproduction speed;
The voice speed conversion means performs the predetermined voice speed conversion on the generated voice signal according to the rational number β,
The audio signal accumulation output unit accumulates the audio signal subjected to the audio speed conversion, and outputs the accumulated audio signal according to the execution reproduction speed based on the rational number β.
The video signal storage / output means stores the generated video signal, and according to the execution playback speed, (1) when the rational number β is smaller than 1, skips the stored video signal. (2) A video / audio reproduction device that outputs the stored video signal using freeze when the rational number β is greater than 1.
前記映像データ蓄積手段は,前記有理数βが1より小さい場合には,前記分別された映像データのBピクチャの全部または一部を廃棄する請求項1記載の映像音声再生装置。Video data storage means for storing the sorted video data inserted between the classification means and the video signal generation means,
The video data storage unit, when the rational β is less than 1, video and audio reproduction apparatus according to claim 1, wherein the discarding all or part of the B-pictures of the separated video data.
前記分別された音声データをデコードして,音声信号を生成する音声信号生成ステップと,
外部から設定される外部設定再生速度に基づいて決定される実際に再生を実行するための実行再生速度に応じて,所定の音声速度変換を前記生成された音声信号に対して行う音声速度変換ステップと,
前記音声速度変換が行われた音声信号を蓄積し,前記蓄積されている音声信号を前記実行再生速度に応じて出力する音声信号蓄積出力ステップと,
前記分別された映像データをデコードして映像信号を生成する映像信号生成ステップと,
前記生成された映像信号を蓄積し,前記蓄積されている映像信号を前記実行再生速度に応じて出力する映像信号蓄積出力ステップとを備え,
前記音声速度変換ステップにおいては,前記有理数βに応じて,前記所定の音声速度変換が前記生成された音声信号に対して行われ,
前記音声信号蓄積出力ステップにおいては,前記音声速度変換が行われた音声信号が蓄
積され,前記有理数βに基づき,前記蓄積されている音声信号が前記実行再生速度に応じて出力され,
前記映像信号蓄積出力ステップにおいては,前記生成された映像信号が蓄積され,前記実行再生速度に応じて,(1)前記有理数βが1より小さい場合には,前記蓄積されている映像信号がスキップを利用して出力され,(2)前記有理数βが1より大きい場合には,前記蓄積されている映像信号がフリーズを利用して出力される映像音声再生方法。A separation step of separating MPEG (Moving Picture Experts Group) data input from outside having audio data and video data into the audio data and the video data;
An audio signal generation step of decoding the sorted audio data and generating an audio signal;
An audio speed conversion step for performing a predetermined audio speed conversion on the generated audio signal in accordance with an execution playback speed for actually executing playback determined based on an externally set playback speed set from the outside When,
An audio signal accumulation output step of accumulating the audio signal subjected to the audio speed conversion and outputting the accumulated audio signal according to the execution reproduction speed;
A video signal generating step for generating a video signal by decoding the sorted video data;
A video signal storage output step for storing the generated video signal and outputting the stored video signal in accordance with the execution reproduction speed;
In the voice speed conversion step, the predetermined voice speed conversion is performed on the generated voice signal according to the rational number β,
In the audio signal accumulation output step, the audio signal subjected to the audio speed conversion is accumulated, and based on the rational number β, the accumulated audio signal is output according to the execution reproduction speed,
In the video signal storage and output step, the generated video signal is stored, and according to the execution playback speed, (1) when the rational number β is smaller than 1, the stored video signal is skipped. (2) A video / audio reproduction method in which, when the rational number β is larger than 1, the stored video signal is output using freeze.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002303519A JP3764878B2 (en) | 2001-10-18 | 2002-10-17 | VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001-320167 | 2001-10-18 | ||
JP2001320167 | 2001-10-18 | ||
JP2002303519A JP3764878B2 (en) | 2001-10-18 | 2002-10-17 | VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003199053A JP2003199053A (en) | 2003-07-11 |
JP3764878B2 true JP3764878B2 (en) | 2006-04-12 |
Family
ID=27615539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002303519A Expired - Fee Related JP3764878B2 (en) | 2001-10-18 | 2002-10-17 | VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3764878B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4735932B2 (en) * | 2003-09-02 | 2011-07-27 | ソニー株式会社 | Content receiving apparatus, video / audio output timing control method, and content providing system |
JP4991129B2 (en) | 2005-07-19 | 2012-08-01 | Necディスプレイソリューションズ株式会社 | Video / audio playback apparatus and video / audio playback method |
-
2002
- 2002-10-17 JP JP2002303519A patent/JP3764878B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003199053A (en) | 2003-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6512884B1 (en) | Method and apparatus for synchronized play back of audio-video signals | |
US9489980B2 (en) | Video/audio synchronization apparatus and video/audio synchronization method | |
US8620134B2 (en) | Video and audio reproducing apparatus and video and audio reproducing method for reproducing video images and sound based on video and audio streams | |
JP3698376B2 (en) | Synchronous playback device | |
JP3063838B2 (en) | Audio / video synchronous playback apparatus and method | |
JP3063824B2 (en) | Audio / video synchronous playback device | |
JP3106987B2 (en) | Audio / video synchronous playback device | |
US6956871B2 (en) | Apparatus and method for synchronization of audio and video streams | |
US7158187B2 (en) | Audio video reproduction apparatus, audio video reproduction method, program, and medium | |
JP4983923B2 (en) | Decoder device and decoding method | |
JP5147180B2 (en) | Software-based audio rendering | |
US8582947B2 (en) | Method and apparatus for processing video and audio data received in decoding system | |
JP3159098B2 (en) | Synchronized playback device for image and audio | |
JP3764878B2 (en) | VIDEO / AUDIO PLAYER, VIDEO / AUDIO PLAYBACK METHOD, PROGRAM, AND MEDIUM | |
JP4359024B2 (en) | Synchronous control method and apparatus, synchronous playback apparatus and television receiver using the same | |
JP2001078185A (en) | Signal processor | |
JP2006060699A (en) | Signal processor | |
JP3986147B2 (en) | Acoustic signal processing apparatus and audio high-speed playback method | |
US10262690B2 (en) | Signal processing device, signal processing system, signal processing method, and program | |
JP3165661B2 (en) | Audio synchronized playback device | |
JP2020145585A (en) | Synchronization device, synchronization method, and program | |
JP2005229168A (en) | Medium output system, synchronous error control system thereof and program | |
JPH114433A (en) | Image receiver | |
JPH08307862A (en) | Signal synchronization control method and decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040910 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20040910 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20041006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050111 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050314 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050510 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050607 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060123 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090127 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100127 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110127 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110127 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120127 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130127 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140127 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |