JP3594409B2 - Mpegオーディオ再生装置およびmpeg再生装置 - Google Patents
Mpegオーディオ再生装置およびmpeg再生装置 Download PDFInfo
- Publication number
- JP3594409B2 JP3594409B2 JP16945496A JP16945496A JP3594409B2 JP 3594409 B2 JP3594409 B2 JP 3594409B2 JP 16945496 A JP16945496 A JP 16945496A JP 16945496 A JP16945496 A JP 16945496A JP 3594409 B2 JP3594409 B2 JP 3594409B2
- Authority
- JP
- Japan
- Prior art keywords
- mpeg
- audio
- signal
- picture
- mpeg video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
【発明の属する技術分野】
本発明はMPEG(Moving Picture Expert Group )オーディオ再生装置およびMPEG再生装置に係り、詳しくは、話速変換機能を備えたMPEGオーディオ再生装置およびMPEG再生装置に関するものである。
【0002】
【従来の技術】
マルチメディアで扱われる情報は、膨大な量で且つ多種多様であり、これらの情報を高速に処理することがマルチメディアの実用化を図る上で必要となってくる。情報を高速に処理するためには、データの圧縮・伸長技術が不可欠となる。そのようなデータの圧縮・伸長技術として「MPEG」方式が挙げられる。このMPEG方式は、ISO(International Organization for Standardization)/IEC(Intarnational Electrotechnical Commission )傘下のMPEG委員会(ISO/IEC JTC1/SC29/WG11)によって標準化されつつある。
【0003】
MPEGは3つのパートから構成されている。パート1の「MPEGシステムパート」(ISO/IEC IS 11172 Part1:Systems)では、ビデオデータとオーディオデータの多重化構造(マルチプレクス・ストラクチャ)および同期方式が規定される。パート2の「MPEGビデオパート」(ISO/IEC IS 11172 Part2:Video)では、ビデオデータの高能率符号化方式およびビデオデータのフォーマットが規定される。パート3の「MPEGオーディオパート」(ISO/IEC IS 11172 Part3:Audio)では、オーディオデータの高能率符号化方式およびオーディオデータのフォーマットが規定される。
【0004】
MPEGビデオパートで取り扱われるビデオデータは動画に関するものであり、その動画は1秒間に数十個(例えば、30個)のフレーム(静止画、コマ)によって構成されている。ビデオデータは、シーケンス(Sequence)、GOP(Group Of Pictures )、ピクチャ、スライス(Slice )、マクロブロック(Macroblock)、ブロックの順に6層の階層構造から成る。
【0005】
また、MPEGには主にエンコードレートの違いにより、現在のところ、MPEG−1,MPEG−2の2つの方式がある。MPEG−1においてフレームはピクチャに対応している。MPEG−2においては、フレームまたはフィールドをピクチャに対応させることもできる。フィールドは、2個で1つのフレームを構成している。ピクチャにフレームが対応している構造はフレーム構造と呼ばれ、ピクチャにフィールドが対応している構造はフィールド構造と呼ばれる。
【0006】
MPEGでは、フレーム間予測と呼ばれる圧縮技術を用いる。フレーム間予測は、フレーム間のデータを時間的な相関に基づいて圧縮する。フレーム間予測では双方向予測が行われる。双方向予測とは、過去の再生画像(または、ピクチャ)から現在の再生画像を予測する順方向予測と、未来の再生画像から現在の再生画像を予測する逆方向予測とを併用することである。
【0007】
この双方向予測は、Iピクチャ(Intra−Picture ),Pピクチャ(Predictive−Picture),Bピクチャ(Bidirectionally predictive−Picture)と呼ばれる3つのタイプのピクチャを規定している。Iピクチャは、過去や未来の再生画像とは無関係に、独立して生成される。Pピクチャは順方向予測(過去のIピクチャまたはPピクチャからの予測)により生成される。Bピクチャは双方向予測により生成される。双方向予測においてBピクチャは、以下に示す3つの予測のうちいずれか1つにより生成される。▲1▼順方向予測;過去のIピクチャまたはPピクチャからの予測、▲2▼逆方向予測;未来のIピクチャまたはPピクチャからの予測、▲3▼双方向予測;過去および未来のIピクチャまたはPピクチャからの予測。そして、これらI,P,Bピクチャがそれぞれエンコードされる。つまり、Iピクチャは過去や未来のピクチャが無くても生成される。これに対し、Pピクチャは過去のピクチャが無いと生成されず、Bピクチャは過去または未来のピクチャが無いと生成されない。
【0008】
フレーム間予測では、まず、Iピクチャが周期的に生成される。次に、Iピクチャよりも数フレーム先のフレームがPピクチャとして生成される。このPピクチャは、過去から現在への一方向(順方向)の予測により生成される。続いて、Iピクチャの前、Pピクチャの後に位置するフレームがBピクチャとして生成される。このBピクチャを生成するとき、順方向予測,逆方向予測,双方向予測の3つの中から最適な予測方法が選択される。一般的に連続した動画では、現在の画像とその前後の画像とは良く似ており、異なっているのはその一部分に過ぎない。そこで、前のフレーム(例えば、Iピクチャ)と次のフレーム(例えば、Pピクチャ)とは同じであると仮定し、両フレーム間に変化があればその差分(Bピクチャ)のみを抽出して圧縮する。これにより、フレーム間のデータを時間的な相関に基づいて圧縮することができる。
【0009】
MPEGビデオパートに準拠してエンコードされたビデオデータのデータ列(ビットストリーム)は、MPEGビデオストリーム(以下、ビデオストリームと略す)と呼ばれる。また、MPEGオーディオパートに準拠してエンコードされたオーディオデータのデータ列は、MPEGオーディオストリーム(以下、オーディオストリームと略す)と呼ばれる。そして、ビデオストリームとオーディオストリームは、MPEGシステムパートに準拠して時分割多重化され、1本のデータ列としてのMPEGシステムストリーム(以下、システムストリームと略す)となる。システムストリームはマルチプレックスストリームとも呼ばれる。
【0010】
MPEGパートにおけるエンコードからデコードまでの流れは、以下のようになっている。MPEGシステムエンコーダ(以下、システムエンコーダと略す)は、ビデオデータとオーディオデータのそれぞれを連係を保ちながら別個にエンコードを行い、ビデオストリームとオーディオストリームを生成する。次に、MPEGシステムエンコーダに装備されたマルチプレクサ(MUX;Multiplexer )は、伝送媒体または記録媒体のフォーマットに適合するように、ビデオストリームとオーディオストリームの多重化を行い、システムストリームを生成する。そのシステムストリームは、伝送媒体を介してMUXから伝送されるか、または記録媒体に記録される。
【0011】
MPEGシステムデコーダ(以下、システムデコーダと略す)に装備されたデマルチプレクサ(DMUX;DeMUltipleXer )は、システムストリームをビデオストリームとオーディオストリームに分離する。次に、システムデコーダは各ストリームを個別にデコードして、ビデオのデコード出力(以下、ビデオ出力という)とオーディオのデコード出力(以下、オーディオ出力という)を生成する。ビデオ出力はディスプレイへ出力され、ディスプレイで動画が再生される。オーディオ出力はD/A(Digital/Analog)コンバータおよびオーディオアンプを介してスピーカへ出力され、スピーカから音声が再生される。
【0012】
ところで、MPEG−1は主にビデオCD(Compact Disc),CD−ROM(CD−Read Only Memory ),DVD(Digital Video Disc)などの記録媒体を用いた蓄積メディアに対応しており、MPEG−2はMPEG−1をも含む幅広い範囲のアプリケーションに対応している。
【0013】
蓄積メディアにおいては、以下に示す2つの可変速再生が要求される。▲1▼動画を通常(標準)の再生速度より高速で再生(以下、高速再生という)する機能。▲2▼動画を通常の再生速度より低速で再生(以下、低速再生という)する機能。高速再生機能は、例えば、ユーザが短時間に動画を見るために早送り再生を行う際や、見たい動画を探索するために早送り再生または早送り逆転再生を行う際に用いられる。また、低速再生機能は、例えば、ユーザが動画を注意深く見る際などに用いられる。
【0014】
記録媒体から読み出されたシステムストリームのビットレートは、読み出し速度に対応したものになる。従って、高速再生を行うには記録媒体からシステムストリームを高速で読み出し、低速再生を行うには記録媒体からシステムストリームを低速で読み出す。例えば、記録媒体としてビデオCDやDVDを用いた場合には、ビデオCDやDVDの回転速度を通常の再生時(標準再生時)よりも速くしたり遅くしたりすることで、システムストリームを所望の速度で読み出すようにする。
【0015】
【発明が解決しようとする課題】
従来、MPEGにおいては、前記したような動画の可変速再生については検討されていたものの、音声の可変速再生については何らの検討もなされていなかった。
【0016】
オーディオストリームのビットレートはシステムストリームのそれと同一である。そのため、動画の高速再生時には、オーディオストリームのビットレートも大きくなり、再生される音声の音程(ピッチ)が上がるのに加えて、発声速度(話速)が速くなる。また、動画の低速再生時には、オーディオストリームのビットレートも小さくなり、再生される音声のピッチは変化しないものの、音声が途切れ途切れになる。このように、動画の可変速再生時には、音声が聞き苦しいものになるという問題があった。
【0017】
ところで、近年、ピッチを変化させることなく話速を任意に制御する話速変換技術の開発が進められており、本出願人もVTRやテープレコーダに利用可能な話速変換処理LSIを既に開発している(特開平7−192392号公報(G11B 20/02)、日経エレクトロニクス 1994 年11月21日号(No.622) P.93 〜98. 参照)。しかし、話速変換技術をMPEGに利用する試みはなされていない。
【0018】
また、音声と動画(映像)の同期生成においては、「リップシンク」を考慮する必要がある。リップシンクとは、ディスプレイに映し出される人物の口の動きと、スピーカから発声される音声との同期がとれていることをいう。口の動きより音声の方が早くなったり、逆に遅くなったりする状態をリップシンクにずれがあるという。リップシンクのずれが人間の聴覚の許容範囲を外れると、視聴者は違和感を覚える。一般に、音声が動画より遅れることによって生じるリップシンクのずれとして許容できる時間は、約50〜250msであるといわれている。
【0019】
本発明は上記要求を満足するためになされたものであって、以下の目的を有するものである。
〔1〕可変速再生時においても自然で聞き易い音声を再生することが可能なMPEGオーディオ再生装置を提供する。
【0020】
〔2〕上記〔1〕のMPEGオーディオ再生装置とMPEGビデオデコーダとを備えたMPEG再生装置を提供する。
〔3〕上記〔1〕のMPEGオーディオ再生装置とMPEGビデオデコーダとを備え、音声と動画との時間ずれを低減することが可能なMPEG再生装置を提供する。
【0024】
【課題を解決するための手段】
請求項1に記載の発明は、記録媒体(21)から読み出されたMPEGオーディオストリームをMPEGオーディオパートに準拠してデコードし、オーディオ信号を生成するMPEGオーディオデコーダ(3)と、オーディオ信号に対して話速変換処理を行う話速変換処理手段(2,4)とを備え、話速変換処理手段は、オーディオストリームのビットレートが通常時よりも大きい場合には、再生される各音声区間の時間長さを長くすると共に各無音区間の時間長さを短くするようにして話速変換処理を行い、オーディオストリームのビットレートが通常時よりも小さい場合には、再生される各音声区間の時間長さを長くすると共に各無音区間の時間長さを短くするか、または、各無音区間を削除して各音声区間をつなぎ合わせた後に無音区間を挿入するようにして話速変換処理を行うことをその要旨とする。
【0025】
請求項2に記載の発明は、請求項1に記載のMPEGオーディオ再生装置において、話速変換処理手段(2,4)は、オーディオ信号を蓄積するリングメモリ(32)と、リングメモリの蓄積量を検出する検出手段(33)とを備え、リングメモリの蓄積量に応じて音声区間の時間長さの圧縮伸長率を調整することをその要旨とする。
【0026】
請求項3に記載の発明は、請求項2に記載のMPEGオーディオ再生装置において、話速変換処理手段(2,4)は、オーディオ信号の音声区間と無音区間とを判別する音声判別部(41)と、無音区間の削除処理または挿入処理を行う無音削除挿入部(42)と、リングメモリ(32)の蓄積量に基づいて音声区間の圧縮伸長処理を行うことで圧縮伸長率を調整する時間軸圧縮伸長部(43)とを備えたことをその要旨とする。
【0027】
請求項4に記載の発明は、請求項1〜3のいずれか1項に記載のMPEGオーディオ再生装置(1)と、記録媒体(21)から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダ(12)とを備えたことをその要旨とする。
【0028】
請求項5に記載の発明は、請求項2または請求項3に記載のMPEGオーディオ再生装置(1)と、記録媒体(21)から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダ(12)と、リングメモリ(32)に書き込まれる以前のオーディオ信号に、時刻に関する情報としてのインデックス信号を付加するインデックス付加回路(51)と、リングメモリ(32)から読み出されたオーディオ信号に付加されているインデックス信号を検出し、そのインデックス信号から得られる時刻情報と現在の時刻情報とから、話速変換処理手段(2,4)における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダ(12)へ供給するインデックス検出回路(52)とを備え、MPEGビデオデコーダ(12)は、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御することをその要旨とする。
【0029】
請求項6に記載の発明は、請求項3に記載のMPEGオーディオ再生装置(1)と、記録媒体(21)から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダ(12)と、音声判別部(41)の処理結果と、オーディオストリームのビットレートとに基づいて、話速変換処理手段(2,4)における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダ(12)へ供給する遅延時間検出回路(53)とを備え、MPEGビデオデコーダ(12)は、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御することをその要旨とする。
【0030】
請求項7に記載の発明は、請求項3に記載のMPEGオーディオ再生装置(1)と、記録媒体(21)から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダ(12)と、リングメモリ(32)の蓄積量に基づいて、話速変換処理済みのオーディオ信号とビデオ信号との同期を得るための制御信号を生成し、その制御信号をMPEGビデオデコーダ(12)へ供給する制御回路(54)とを備え、MPEGビデオデコーダ(12)は、前記制御信号に基づいて自己の動作のタイミングを制御することをその要旨とする。
【0031】
請求項8に記載の発明は、請求項3に記載のMPEGオーディオ再生装置(1)と、記録媒体(21)から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダ(12)と、音声判別部(41)および時間軸圧縮伸長部(43)の処理結果に基づいて、話速変換処理手段(2,4)における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダ(12)へ供給する遅延時間検出回路(55)とを備え、MPEGビデオデコーダ(12)は、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御することをその要旨とする。
【0032】
【発明の実施の形態】
(第1実施形態)
以下、本発明を具体化した第1実施形態を図面に従って説明する。
【0033】
図1に、本実施形態のブロック回路図を示す。
本実施形態のMPEGオーディオ再生装置1は、再生速度検出回路2、MPEGオーディオデコーダ3、話速変換処理回路4、D/Aコンバータ5、オーディオアンプ6から構成されている。尚、各回路2〜6は1チップのLSIに搭載することもできる。
【0034】
また、本実施形態のMPEG再生装置23は、MPEGオーディオ再生装置1に加え、オーディオビデオパーサ(AVパーサ)11、MPEGビデオデコーダ12を備えている。
【0035】
話速変換処理回路4は、例えば、DSP(Digital Signal Processor)31、リングメモリ32、アップダウンカウンタ33、読み出しクロック生成回路36を備えている。尚、話速変換処理回路4の動作については、前記文献(日経エレクトロニクス 1994 年11月21日号(No.622) P.93 〜98. )に詳述されている。
【0036】
再生速度検出回路2は、ビデオCDやDVDなどの記録媒体21から読み出されたMPEGシステムストリームのビットレートに対応したデコードクロックを生成する。そのデコードクロックは各回路12,3,4へ出力される。
【0037】
AVパーサ11は、デマルチプレクサ(DMUX)13を備えており、記録媒体21から読み出されたMPEGシステムストリームを入力する。DMUX13は、システムストリームをMPEGビデオストリームとMPEGオーディオストリームに分離する。ビデオストリームはビデオデコーダ12へ出力され、オーディオストリームはオーディオデコーダ3へ出力される。
【0038】
ビデオデコーダ12は、MPEGビデオパートに準拠してビデオストリームをデコードし、ビデオ出力(以下、ビデオ信号という)を生成する。そのビデオ信号はディスプレイ22へ出力され、ディスプレイ22で動画が再生される。
【0039】
オーディオデコーダ3は、MPEGオーディオパートに準拠してオーディオストリームをデコードし、ディジタル信号のオーディオ出力(以下、オーディオ信号という)を生成する。そのオーディオ信号は話速変換処理回路4へ出力される。話速変換処理回路4において信号処理されたオーディオ信号はD/Aコンバータ5によってD/A変換された後、オーディオアンプ6で増幅されてスピーカ23へ送られる。そして、スピーカ23から音声が再生される。
【0040】
記録媒体21から読み出されたシステムストリームのビットレートは、読み出し速度に対応したものになる。また、各回路3,4,12の動作はデコードクロックによって規定される。
【0041】
従って、ビデオデコーダ12は、システムストリームのビットレートに対応したビデオ信号を生成する。すなわち、システムストリームのビットレートが、通常の再生時(標準再生時)よりも大きければディスプレイ22では動画が高速再生され、通常の再生時よりも小さければディスプレイ22では動画が低速再生される。
【0042】
また、オーディオデコーダ3は、システムストリームのビットレートに対応したオーディオ信号を生成する。すなわち、システムストリームのビットレートが、通常の再生時よりも大きければオーディオ信号のビットレートも大きくなり、通常の再生時より小さければオーディオ信号のビットレートも小さくなる。
【0043】
ところで、ビデオ信号とオーディオ信号とは、通常の再生時において同期生成されるようになっている。
DSP31は、フレームメモリ34および話速変換部35から構成されている。フレームメモリ34は、適宜なフレーム数分(例えば、2フレーム分)のオーディオ信号を記憶する。話速変換部35は、フレームメモリ34に記憶されたオーディオ信号に対してフレーム単位で話速変換処理を行い、話速変換処理済みのオーディオ信号(以下、データという)を生成する。尚、1フレームは、適宜な数(例えば、200個)のサンプリングデータから構成される。
【0044】
フレームメモリ34の内部は、2つの領域(以下、A領域、B領域と記載して区別する)に分けられている。オーディオデコーダ3から出力されたオーディオ信号がB領域に書き込まれるのと同時に、A領域に蓄積されている1フレーム分のオーディオ信号が読み出されて話速変換部35へ転送される。そして、B領域に1フレーム分のオーディオ信号が蓄積されると、今度は、B領域に蓄積された1フレーム分のオーディオ信号が読み出されて話速変換部35へ転送され、それと同時に、オーディオデコーダ3から出力されたオーディオ信号がA領域に書き込まれる。
【0045】
話速変換部35の生成したデータは、話速変換部35が生成した書き込みクロックに従ってリングメモリ32に書き込まれる。リングメモリ32は、例えば、FIFO(First−In−First−Out)構成のRAM(Random Access Memory)から成る。
【0046】
読み出しクロック生成回路36は、デコードクロックに従って読み出しクロックを生成する。
リングメモリ32に蓄積されたデータは、読み出しクロックに従って読み出され、その読み出されたデータはD/Aコンバータ5へ出力される。D/Aコンバータ5は、読み出しクロックをサンプリング周波数として用いる。
【0047】
書き込みクロックはアップダウンカウンタ33のアップカウント入力端子UPに入力され、読み出しクロックはアップダウンカウンタ33のダウンカウント入力端子DOWNに入力される。アップダウンカウンタ33は、書き込みクロックの総数と読み出しクロックの総数との差をカウントする。そのカウント値は、リングメモリ32の蓄積量に対応する。つまり、アップダウンカウンタ33は、書き込みクロックと読み出しクロックとに基づいて、リングメモリ32の蓄積量を検出する。そのリングメモリ32の蓄積量は話速変換部35へ出力される。
【0048】
図2に、話速変換部35に内部構成を示す。
話速変換部35は、音声判別部41、無音削除挿入部42、時間軸圧縮伸長部43から構成されている。
【0049】
音声判別部41は、フレームメモリ34から読み出されたオーディオ信号が、音声区間(音声が存在している区間)か、または、無音区間(音声が存在していない区間)かを判別する。尚、人間が発声する音声以外の背景雑音は無音区間として取り扱う。
【0050】
無音削除挿入部42は、音声判別部41の判別した無音区間に対して、その無音区間の削除処理、または、新たな無音区間の挿入処理を行う。
時間軸圧縮伸長部43は、音声判別部41の判別した音声区間に対して、リングメモリ32の蓄積量に基づいて圧縮処理または伸長処理を行う。
【0051】
また、各部42,43は、その処理内容に対応した書き込みクロックを生成する。
次に、高速再生時における話速変換部35の動作について説明する。
【0052】
オーディオデコーダ3から出力されるオーディオ信号のビットレートは、オーディオストリームのそれと同一になる。従って、高速再生時には、通常の再生時に比べて、オーディオ信号のビットレートが大きくなる。通常の再生時よりもビットレートの大きなオーディオ信号をそのままD/Aコンバータ5へ送った場合、通常の再生時に比べて、スピーカ23から再生される音声のピッチは上がり話速は速くなる。
【0053】
そこで、話速変換部35において、スピーカ23から再生される音声のピッチを通常の再生時とほぼ同一にし、且つ、スピーカ23から再生される話速を通常の再生時に近づけるように話速変換処理を行う。
【0054】
すなわち、無音削除挿入部42は、音声判別部41の判別した無音区間の継続長を算出し、その継続長が所定長以上の場合は無音区間を削除する。
また、時間軸圧縮伸長部43は、音声判別部41の判別した音声区間に対して、例えば、自己相関法を用いてピッチ抽出を行い、抽出したピッチ波形に対して圧縮処理を行う。その結果、高速再生時において、オーディオ信号のビットレートが大きくなった場合に、スピーカ23から再生される音声区間の時間長さは伸長される。
【0055】
尚、時間軸圧縮伸長部43における圧縮処理に際しては、無音区間の状態とリングメモリ32の蓄積量とに応じて動的に圧縮率を変化させる。
例えば、同一のピッチ周期をもつ3周期波形を2周期波形に圧縮することで、2/3倍の圧縮(圧縮率;2/3)を得る。具体的には、3周期波形から、時間軸方向で前にある2周期波形と、後ろにある2周期波形とをそれぞれ切り出す。そして、前の2周期波形に単調減少する三角窓関数を、後ろの2周期波形に単調増加する三角窓関数をそれぞれ乗じる。この二つの波形を加算することで出力波形を得る。
【0056】
また、0.9倍の圧縮(圧縮率;0.9)を得るには、例えば、10周期波形から9周期波形に圧縮する。この場合は、先頭の3周期波形に対して同様の処理を施す。つまり、入力の10周期波形のうち、先頭の3周期波形を除いた7周期波形は処理に使わない。
【0057】
このM周期波形からN周期波形に圧縮する組み合わせを色々と用意しておくことで、多種類の圧縮率を得る。ところで、無音区間が短い場合、圧縮率が低い(圧縮の度合いが大きい)とリングメモリ32がオーバーフローする恐れがある。これを防ぐためには、リングメモリ32の蓄積量に応じて、時間軸圧縮伸長部43における圧縮率を動的に変化させればよい。また、背景雑音が存在する場合、音声区間やピッチの抽出誤りが生じる。これを防ぐためには、音声判別部41における音声区間の検出レベルを雑音信号に応じて変化させればよい。
【0058】
次に、低速再生時における話速変換部35の動作について、図3および図4に従って説明する。
図3に、通常の再生時および0.5倍速再生時において再生される音声の例を示す。
【0059】
低速再生時には、通常の再生時に比べて、オーディオ信号のビットレートが小さくなる。そのため、方法1に示すように、通常の再生時よりもビットレートの小さなオーディオ信号をそのままD/Aコンバータ5へ送った場合、通常の再生時に比べて、スピーカ23から再生される音声のピッチは変化しないものの、音声が途切れ途切れになる。つまり、各音声区間(「あ」「い」「う」「え」)の時間長さは通常の再生時のそれと変わらず、全く音の存在していない無音区間が各音声区間の間に挿入されるため、音声が途切れ途切れになり、ユーザは聴感上違和感を覚える。
【0060】
そこで、話速変換部35において、方法2または方法3に示すように話速変換処理を行う。尚、MPEGオーディオでは、低速再生時に音声のピッチが変化しないため、高速再生時のように時間軸圧縮伸長部43においてピッチを変える処理を行う必要はない。
【0061】
(方法2)
方法2では、時間軸圧縮伸長部43において各音声区間の長さを伸長させ、それと共に、無音削除挿入部42において各無音区間の長さを短くすることで、音声の途切れを目立たなくする。
【0062】
尚、時間軸圧縮伸長部43において音声区間の長さを伸長させるには、音声判別部41の判別した音声区間に対して、例えば、自己相関法を用いてピッチ抽出を行い、抽出したピッチ波形に対して伸長処理を行う。例えば、同一のピッチ周期をもつ2周期波形を3周期波形に伸長することで、3/2倍の伸長(伸長率;3/2)を得る。また、同一のピッチ周期をもつ3周期波形を4周期波形に伸長することで、4/3倍の伸長(伸長率;4/3)を得る。その結果、低速再生時において、オーディオ信号のビットレートが小さくなった場合に、スピーカ23から再生される音声区間の時間長さは伸長される。
【0063】
このとき、音声区間を伸長し過ぎると、音声区間が間延びして聞こえるため、音声の途切れは目立たなくなるものの、やはり不自然になる。これを防止するには、通常の再生時における音声区間の長さL1に対して、低速再生時における音声区間の長さL2を、例えば、以下の式に示すように設定する。
【0064】
L2/L1≦1.4
尚、上記式は0.5倍速再生時だけでなく、あらゆる倍率の低速再生時に適用できる。ここで、時間軸圧縮伸長部43における音声区間の伸長率は一定値にしてもよく、以下の▲1▼▲2▼に示すように可変にしてもよい。
【0065】
▲1▼リングメモリ32の蓄積量に対応して音声区間の伸長率を動的に変化させる。無音区間が短い場合、音声区間の伸長率が大きい(伸長の度合いが大きい)とリングメモリ32がオーバーフローする恐れがある。これを防ぐためには、音声区間の伸長率を小さくすればよい。
【0066】
▲2▼音声のピッチ変化に対応して音声区間の伸長率を動的に変化させる。つまり、図4に示すように、音声のピッチ変化に対応して音声区間の伸長率を変化させることで、話速を変化させる。この場合、音声の聞き易さをさらに向上させることができる。尚、音声のピッチ変化に対応して音声区間の伸長率を変化させることで話速を変化させる技術は公知である(信学技報 SP92−56,HC92−33(1992−09),P.49〜56. 参照)。
【0067】
(方法3)
方法3では、無音削除挿入部42において、各無音区間を削除して各音声区間をつなぎ合わせた後で、音声区間に続いて新たに無音区間を挿入することで、音声の途切れを目立たなくする。尚、挿入する無音区間は、以下の▲1▼〜▲3▼のいずれであってもよい。
【0068】
▲1▼全く音の存在しない無音区間。
▲2▼視聴者が違和感を覚えないような白色雑音を含む無音区間。尚、そのような白色雑音は、予め作成して別メモリ(図示略)に記憶しておく。
【0069】
▲3▼音声判別部41において無音区間と判別したオーディオ信号を別メモリ(図示略)に保持しておき、それを無音区間として挿入する。
このように、本実施形態によれば、以下の作用および効果を得ることができる。
【0070】
(1)話速変換処理回路4を設けることで、高速再生時において、スピーカ23から再生される音声のピッチを通常の再生時とほぼ同一にし、且つ、スピーカ23から再生される話速を通常の再生時に近づけることが可能になり、自然で聞き易い音声を再生することができる。
【0071】
ところで、m倍速再生時(m>1)には、オーディオストリームおよびデコードクロックのビットレートは通常の再生時のm倍になる。このとき、話速変換部35から出力されるデータのビットレートを通常の再生時とほぼ同一になるようにすれば、再生される音声のピッチを通常の再生時とほぼ同一にすることができる。すなわち、話速変換部35においてビットレートをm→1に変換すれば、再生される音声のピッチは通常の再生時とほぼ同一になる。
【0072】
(2)話速変換処理回路4を設けることで、低速再生時において再生される音声の途切れを目立たなくすることが可能になり、自然で聞き易い音声を再生することができる。
【0073】
ところで、上記方法2と方法3とを、以下の(1)(2)に示すように併用してもよい。
(1) MPEGオーディオ再生装置1のユーザが、方法2と方法3とを任意に切り換え選択できるようにする。このようにすれば、個々のユーザの聴覚特性に合わせることが可能になり、ユーザにとって聞き易い音声を再生することができる。
(2) 低速再生の倍率に対応して方法2と方法3とが自動的に切り換え選択されるようにする。例えば、1〜0.5倍速再生時には方法3が選択され、0.5倍速以下の再生時には方法2が選択されるようにする。このようにすれば、再生速度に応じて、自然な音声を再生することができる。
【0074】
(3)各回路2〜6を1チップのLSIに搭載した場合には、MPEGオーディオ再生装置1を小型化することができる。
(第2実施形態)
以下、本発明を具体化した第2実施形態を図面に従って説明する。尚、本実施形態において、第1実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0075】
図5に、本実施形態の要部ブロック回路図を示す。本実施形態において、第1実施形態と異なるのは、インデックス付加回路51およびインデックス検出回路52が設けられている点だけである。
【0076】
インデックス付加回路51は、フレームメモリ34の前段(すなわち、MPEGオーディオデコーダ3と話速変換処理回路4の間)に設けられている。インデックス付加回路51は、デコードクロックに従って、オーディオデコーダ3の生成したオーディオ信号に一定周期でインデックス信号を付加する。そのインデックス信号が付加されたオーディオ信号は、フレームメモリ34へ出力される。
【0077】
インデックス検出回路52は、リングメモリ32から読み出されたデータに付加されているインデックス信号を検出し、そのインデックス信号から得られる時刻情報と現在時刻とから、話速変換処理回路4が信号処理に要する時間Δtを算出し、その時間Δtに関する検出信号をビデオデコーダ12へ供給する。ビデオデコーダ12は、その時間Δtに関する検出信号に従って、自己の動作のタイミングを制御する。
【0078】
このように、本実施形態によれば、第1実施形態の作用および効果に加えて、以下の作用および効果を得ることができる。
(1)前記したように、ビデオデコーダ12の生成するビデオ信号と、オーディオデコーダ3の生成するオーディオ信号とは、通常の再生時において同期生成されるようになっている。そのため、オーディオデコーダ3とD/Aコンバータ5の間に話速変換処理回路4を設けると、話速変換処理回路4における信号処理に要する時間分(すなわち、話速変換処理回路4における遅延時間分)だけ、オーディオ信号が遅延することになる。
【0079】
そこで、インデックス付加回路51を用いて、フレームメモリ34へ入力されるオーディオ信号に予め一定周期でインデックス信号を付加する。
インデックス検出回路52は、リングメモリ32から読み出されたデータに付加されているインデックス信号を検出し、話速変換処理回路4が信号処理に要する時間Δtを算出し、その時間Δtに関する検出信号をビデオデコーダ12へ供給する。ビデオデコーダ12は、その時間Δtに関する検出信号に従って、自己の動作のタイミングを制御する。また、インデックス検出回路52が次にインデックス信号を検出したとき、ビデオデコーダ12は、そのときに算出された時間と前回算出された時間との差だけ、自己の動作のタイミングを遅らせたり早めたりする。
【0080】
その結果、話速変換処理回路4における遅延時間に関係なく、リングメモリ32から読み出されたデータ(すなわち、話速変換処理済みのオーディオ信号)とビデオ信号との同期をとることができる。
【0081】
(2)上記(1)より、スピーカ23で再生される音声と、ディスプレイ22で再生される動画との時間ずれを低減することが可能になり、リップシンクのずれを人間の聴覚の許容範囲内にすることができる。
【0082】
(3)オーディオ信号に付加されたインデックス信号は、無音削除挿入部42によって削除されることがある。しかし、インデックス信号を付加する周期を短くして、オーディオ信号に十分な数のインデックス信号を付加しておけば、そのインデックス信号の内のいくつかが無音削除挿入部42によって削除されたとしても、リングメモリ32から読み出されたデータには一定数以上のインデックス信号が残ることになる。その残ったインデックス信号により、上記(1)の作用および効果を得ることができる。
【0083】
(第3実施形態)
以下、本発明を具体化した第3実施形態を図面に従って説明する。尚、本実施形態において、第2実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0084】
図6に、本実施形態の要部ブロック回路図を示す。本実施形態において、第2実施形態と異なるのは、インデックス付加回路51が、フレームメモリ34と音声判別部41の間に設けられている点だけである。インデックス付加回路51は、デコードクロックに従って、フレームメモリ34から読み出されたオーディオ信号に一定周期でインデックス信号を付加する。そのインデックス信号が付加されたオーディオ信号は、音声判別部41へ出力される。
【0085】
前記したように、フレームメモリ34が2フレーム分のオーディオ信号を蓄積する場合、フレームメモリ34の記憶容量は、例えば、0.8Kバイト程度あれば十分である。このように、フレームメモリ34の記憶容量が小さい場合には、話速変換処理回路4における遅延時間に比べて、フレームメモリ34における書き込み動作および読み出し動作に要する時間(すなわち、フレームメモリ34における遅延時間)は僅かであり、無視しても差し支えない。
【0086】
従って、本実施形態によれば、第2実施形態と同様の作用および効果を得ることができる。
(第4実施形態)
以下、本発明を具体化した第4実施形態を図面に従って説明する。尚、本実施形態において、第2実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0087】
図7に、本実施形態の要部ブロック回路図を示す。本実施形態において、第2実施形態と異なるのは、インデックス付加回路51が、音声判別部41と無音削除挿入部42および時間軸圧縮伸長部43との間にそれぞれ設けられている点だけである。インデックス付加回路51は、デコードクロックに従って、音声判別部41における信号処理が済んだオーディオ信号に一定周期でインデックス信号を付加する。そのインデックス信号が付加されたオーディオ信号は、無音削除挿入部42および時間軸圧縮伸長部43へ出力される。
【0088】
前記したように、フレームメモリ34の記憶容量が小さい場合には、話速変換処理回路4における遅延時間に比べて、フレームメモリ34における遅延時間は僅かであり、無視しても差し支えない。
【0089】
また、音声判別部41における信号処理に要する時間(すなわち、音声判別部41における遅延時間)は、話速変換処理回路4における遅延時間に比べて僅かであり、無視しても差し支えない。
【0090】
従って、本実施形態によれば、第2実施形態と同様の作用および効果を得ることができる。
(第5実施形態)
以下、本発明を具体化した第5実施形態を図面に従って説明する。尚、本実施形態において、第2実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0091】
図8に、本実施形態の要部ブロック回路図を示す。本実施形態において、第2実施形態と異なるのは、インデックス付加回路51が、無音削除挿入部42および時間軸圧縮伸長部43とリングメモリ32との間に設けられている点だけである。インデックス付加回路51は、デコードクロックに従って、各部42,43における信号処理が済んだオーディオ信号に一定周期でインデックス信号を付加する。そのインデックス信号が付加されたオーディオ信号は、リングメモリ32へ出力される。
【0092】
前記したように、フレームメモリ34の記憶容量が小さい場合には、話速変換処理回路4における遅延時間に比べて、フレームメモリ34における遅延時間は僅かであり、無視しても差し支えない。
【0093】
また、各部41〜43における信号処理に要する時間(すなわち、各部41〜43における遅延時間)は、話速変換処理回路4における遅延時間に比べて僅かであり、無視しても差し支えない。
【0094】
つまり、話速変換処理回路4における遅延時間は、主に、リングメモリ32における書き込み動作および読み出し動作に要する時間(すなわち、リングメモリ32における遅延時間)によって決定される。
【0095】
従って、本実施形態によれば、第2実施形態と同様の作用および効果を得ることができる。また、本実施形態によれば、第2実施形態のようにオーディオ信号に付加されたインデックス信号が無音削除挿入部42によって削除されることがない。そのため、付加したインデックス信号が全て活用され、インデックス信号の数を減らすことが可能になることから、インデックス付加回路51の回路規模を小さくすることができる。
【0096】
(第6実施形態)
以下、本発明を具体化した第6実施形態を図面に従って説明する。尚、本実施形態において、第1実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0097】
図9に、本実施形態の要部ブロック回路図を示す。本実施形態において、第1実施形態と異なるのは、遅延時間検出回路53が設けられている点だけである。
前記したように、音声判別部41は、フレームメモリ34から読み出されたオーディオ信号が、音声区間か又は無音区間かを判別する。つまり、音声判別部41の処理結果には、オーディオ信号に音声が含まれているか否かという情報が含まれている。
【0098】
また、デコードクロックは、システムストリームのビットレートに対応している。つまり、デコードクロックには、予めオーディオ信号の圧縮伸長率の情報が含まれている。
【0099】
そこで、遅延時間検出回路53は、オーディオ信号に音声が含まれているか否かという情報と圧縮伸長率の情報とに基づいて、話速変換処理回路4における遅延時間を検出し、その検出信号をビデオデコーダ12へ供給する。ビデオデコーダ12は、遅延時間検出回路53の検出信号に基づいて、自己の動作のタイミングを制御する。その結果、話速変換処理回路4における遅延時間に関係なく、リングメモリ32から読み出されたデータ(すなわち、話速変換処理済みのオーディオ信号)とビデオ信号との同期をとることができる。
【0100】
このように、本実施形態によれば、第2実施形態と同様の効果を得ることができる。
(第7実施形態)
以下、本発明を具体化した第7実施形態を図面に従って説明する。尚、本実施形態において、第1実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0101】
図10に、本実施形態の要部ブロック回路図を示す。本実施形態において、第1実施形態と異なるのは、制御回路54が設けられている点だけである。
制御回路54は、アップダウンカウンタ33の検出したリングメモリ32の蓄積量に基づいて、ビデオデコーダ12の動作速度を制御するための制御信号を生成し、その制御信号をビデオデコーダ12へ供給する。ビデオデコーダ12は、制御回路54の制御信号に基づいて、自己の動作のタイミングを制御する。その結果、リングメモリ32から読み出されたデータと、ビデオデコーダ12の生成するビデオ信号との同期をとることができる。
【0102】
前記したように、話速変換処理回路4における遅延時間は、主にリングメモリ32における遅延時間によって決定される。リングメモリ32における遅延時間は、その蓄積量と相関関係があり、蓄積量が大きくなるほど遅延時間も大きくなる。従って、リングメモリ32の蓄積量に基づいてビデオデコーダ12の動作速度を制御すれば、リングメモリ32から読み出されたデータ(すなわち、話速変換処理済みのオーディオ信号)とビデオ信号との同期をとることができる。
【0103】
このように、本実施形態によれば、第2実施形態と同様の効果を得ることができる。
(第8実施形態)
以下、本発明を具体化した第8実施形態を図面に従って説明する。尚、本実施形態において、第1実施形態と同じ構成部材については符号を等しくしてその詳細な説明を省略する。
【0104】
図11に、本実施形態の要部ブロック回路図を示す。本実施形態において、第1実施形態と異なるのは、遅延時間検出回路55が設けられている点だけである。
【0105】
前記したように、音声判別部41の処理結果には、オーディオ信号に音声が含まれているか否かという情報が含まれている。
また、時間軸圧縮伸長部43の処理結果には、オーディオ信号の圧縮伸長率の情報が含まれている。
【0106】
そこで、遅延時間検出回路55は、オーディオ信号に音声が含まれているか否かという情報と圧縮伸長率の情報とに基づいて、話速変換処理回路4における遅延時間を検出し、その検出信号をビデオデコーダ12へ供給する。ビデオデコーダ12は、遅延時間検出回路55の検出信号に基づいて、自己の動作のタイミングを制御する。その結果、話速変換処理回路4における遅延時間に関係なく、リングメモリ32から読み出されたデータ(すなわち、話速変換処理済みのオーディオ信号)とビデオ信号との同期をとることができる。
【0107】
このように、本実施形態によれば、第2実施形態と同様の効果を得ることができる。
図12に、可変速再生機能を備えたMPEGビデオデコーダ12の要部ブロック回路を示す。
【0108】
MPEGビデオデコーダ12は、ビットバッファ202、ピクチャヘッダ検出回路203、MPEGビデオデコードコア回路(以下、デコードコア回路と略す)204、可変閾値オーバーフロー判定回路(以下、判定回路と略す)205、ピクチャスキップ回路206、制御コア回路207から構成されている。尚、各回路203〜207は1チップのLSIに搭載することもできる。
【0109】
制御コア回路207は各回路2〜6を制御する。
AVパーサ11から転送されてきたMPEGビデオストリームはビットバッファ202へ入力される。
【0110】
ビットバッファ202はFIFO構成のRAMから成るリングメモリによって構成され、転送されてくるビデオストリームをそのまま順次蓄積する。
ピクチャヘッダ検出回路203は、ビットバッファ202に蓄積されたビデオストリームの各ピクチャの先頭に付くピクチャヘッダを検出し、その各ピクチャヘッダに規定されているピクチャのタイプ(I,P,B)を検出する。
【0111】
制御コア回路207は、ピクチャヘッダ検出回路203の検出結果と後記する判定回路205の判定結果とに基づいて、ビットバッファ202から1フレーム期間毎に適宜なピクチャ分のビデオストリームを読み出す。尚、ビットバッファ202から読み出されたビデオストリームは、読み出された後もビットバッファ202にそのまま残される。
【0112】
ビットバッファ202から読み出された各ピクチャは、ピクチャスキップ回路206を介してデコードコア回路204へ転送される。
デコードコア回路204は、各ピクチャをMPEGビデオパートに準拠してデコードし、各ピクチャ毎のビデオ信号を生成する。
【0113】
ピクチャスキップ回路206は、制御コア回路207の制御に従って各ノード206a,206b側への接続が切り換えられる。そして、ピクチャスキップ回路206がノード206a側に接続されると、ビットバッファ202から読み出されたピクチャはそのままデコードコア回路204へ転送される。また、ノード206b側に接続されると、ビットバッファ202から読み出されたピクチャはデコードコア回路204へ転送されずにスキップされる。その結果、デコードコア回路204へ転送されるピクチャは、ピクチャスキップ回路206によってスキップされた分だけピクチャ単位で間引かれる。
【0114】
判定回路205は、再生速度検出回路2の生成したデコードクロックに基づいてビットバッファ202の占有量Bm の閾値Bthn を設定し、ビットバッファ202の占有量Bm と閾値Bthn とを比較する。尚、判定回路205では、再生速度検出回路2の生成した実際のデコードクロックの周波数と、通常の再生時のデコードクロックの周波数との比を求め、その比を再生速度の倍率nとする。従って、2倍速再生時には倍率n=2となり、閾値Bthn =Bth2 となる。また、通常の再生時には倍率n=1となり、閾値Bthn =Bth1 となる。
【0115】
そして、判定回路205は、ビットバッファ202の占有量Bm が閾値Bthn を越えない場合には、ビットバッファ202がオーバーフローする恐れがなく正常であると判定する。この場合、制御コア回路207は、ビットバッファ202から1ピクチャ分のビデオストリームを読み出す。そして、制御コア回路207は、ピクチャスキップ回路206をノード206a側に接続し、そのビットバッファ202から読み出されたピクチャをデコードコア回路204へ転送させる。
【0116】
また、判定回路205は、ビットバッファ202の占有量Bm が閾値Bthn を越えた場合には、ビットバッファ202がオーバーフローする恐れがあると判定する。この場合、制御コア回路207は、ビットバッファ202の占有量Bm が閾値Bthn を下回るまで、ビットバッファ202から適宜なピクチャ分のビデオストリームを読み出す。そして、制御コア回路207は、ピクチャスキップ回路206をノード206b側に接続し、そのビットバッファ202から読み出された適宜なピクチャ分のビデオストリームを全てスキップさせる。
【0117】
図13に、ビットバッファ202の占有量Bm の変化を示す。
ビットバッファ202の占有量Bm はビットレートRB をグラフの傾きとして上昇する。ビットレートRB は、シーケンスの先頭に付くシーケンスヘッダのBR(Bit Rate)に従って式(1)に示すように規定される。また、AVパーサ11から転送されてくるビデオストリームのピクチャレートRP はシーケンスヘッダのPR(Picture Rate)によって規定される。そして、ビットバッファ202の容量Bは、シーケンスヘッダのVBV(Vbv[Video Bufferring Verifier] Buffer Size)に従って式(2)に示すように規定される。そして、1フレーム期間毎に、デコードコア回路204がそのときデコードしようとする1ピクチャ分のビデオストリームが、ビットバッファ202から一気に読み出される。ここで、1フレーム期間にビットバッファ202に入力されるビデオストリームのデータ量Xは、ビットレートRB およびピクチャレートRP に従って式(3)に示すように規定される。従って、ビットバッファ202から1ピクチャ分のビデオストリームが一気に読み出された直後のビットバッファ202の占有量Bm (=B0 〜B6 )は、データ量Xとビットバッファ202の容量Bとに基づいて、式(4)に示す条件を満たすように規定される。
【0118】
RB =400×BR ………(1)
B=16×1024×VBV ………(2)
X=RB /RP ………(3)
0<Bm <B−X=B−(RB /RP ) ………(4)
式(4)に示す条件を満たすようにビットバッファ202の占有量Bm が規定されていれば、ビットバッファ202がオーバーフローしたりアンダーフローしたりすることはない。逆に言えば、ビットバッファ202の占有量Bm が閾値(B−X)を越えると、次の1フレーム期間にビットバッファ202に入力されるビデオストリームによってビットバッファ202がオーバーフローする可能性が極めて高くなる。
【0119】
ビデオデコーダ12では、通常の再生時において、式(4)が満たされるように、ビットレートRB 、ピクチャレートRP 、容量Bの各値が規定されている。つまり、式(2)に示すようにビットバッファ202の容量Bを設定しておけば、ピクチャスキップ回路206の接続をノード206a側に固定しておいたとしても、理想的な状態ではビットバッファ202がオーバーフローしたりアンダーフローしたりすることはない。
【0120】
従って、通常の再生時において、ビットバッファ202から1ピクチャ分のデータが一気に読み出された直後の占有量Bm (=B0 〜B4 )は、閾値Bth1 に基づいて、式(5)に示す条件を満たすように規定される。尚、閾値Bth1 は、式(4)に基づいて、式(6)に示すように設定される。
【0121】
0<Bm <Bth1 <B ………(5)
Bth1 =B−X=B−(RB /RP ) ………(6)
ところで、実際の状態では、式(2)に示すようにビットバッファ202の容量Bを設定しておいても、ピクチャスキップ回路206の接続をノード206a側に固定しておくと、ビットバッファ202がオーバーフローする恐れがある。
【0122】
しかし、ビデオデコーダ12では、通常の再生時において、ビットバッファ202の占有量Bm が閾値Bth1 を越えた場合、ビットバッファ202がオーバーフローする恐れがあると判定される。すると、ビットバッファ202の占有量Bm が閾値Bth1 を下回るまで、ビットバッファ202から適宜なピクチャ分のビデオストリームが読み出される。そして、ピクチャスキップ回路206はノード206b側に接続され、そのビットバッファ202から読み出された適宜なピクチャ分のビデオストリームは全てスキップされる。従って、ビデオデコーダ12によれば、通常の再生時において、ビットバッファ202がオーバーフローすることはない。
【0123】
高速再生時におけるビットバッファ202の占有量Bm はビットレートn×RB をグラフの傾きとして上昇する。例えば、2倍速再生時におけるビットバッファ202の占有量Bm はビットレート2×RB をグラフの傾きとして上昇する。
【0124】
従って、高速再生時において、ビットバッファ202から1ピクチャ分のデータが一気に読み出された直後の占有量Bm (=B0 〜B4 )は、閾値Bthn に基づいて、式(7)に示す条件を満たすように規定される。尚、閾値Bthn は式(8)に示すように設定される。
【0125】
0<Bm <Bthn ………(7)
Bthn =B−n×X=B−(n×RB /RP ) ………(8)
高速再生時においては、ビットバッファ202の占有量Bm が閾値Bthn を越えた場合、ビットバッファ202がオーバーフローする恐れがあると判定される。例えば、2倍速再生時には占有量Bm が閾値Bth2 (=B−(2×RB /RP ))を越えた場合、3倍速再生時には占有量Bm が閾値Bth3 (=B−(3×RB /RP ))を越えた場合に、ビットバッファ202がオーバーフローする恐れがあると判定される。すると、ビットバッファ202の占有量Bm が閾値Bthn を下回るまでビットバッファ202から適宜なピクチャ分のビデオストリームが読み出され、そのビデオストリームは全てスキップされる。従って、ビデオデコーダ12によれば、高速再生時において、ビットバッファ202がオーバーフローすることはない。
【0126】
デコードコア回路204において任意のピクチャをデコードしている途中でビットバッファ202がオーバーフローすると、デコード処理中のピクチャのビットバッファ202に残っている部分に対して、新たに入力されたビデオストリームが上書きされる。その結果、デコード処理中のピクチャのビットバッファ202に残っている部分が破壊されて失われる。すると、デコードコア回路204では、そのピクチャのデコードを完了することが不可能になり、そのピクチャのビデオ信号を生成することができなくなる。従って、デコードコア回路204において任意のピクチャをデコードしている途中でビットバッファ202がオーバーフローすることは絶対に避けなければならない。
【0127】
そのため、ビットバッファ202がオーバーフローする恐れがあるかどうかの判定は、デコードコア回路204において任意のピクチャのデコードを開始する前に行う必要がある。より正確には、ピクチャヘッダ検出回路203がピクチャヘッダを検出した時点で、ビットバッファ202がオーバーフローする恐れがあるかどうかを判定し、そのピクチャをピクチャスキップ回路206を介してスキップするかどうかを決定する必要がある。
【0128】
ところで、1つのピクチャのデータ量は0〜40バイトであるが、そのデータ量はデコードコア回路204においてデコードが終了した時点でないとわからない。また、1つのピクチャのデコード処理時間は、そのピクチャのデータ量やデコードコア回路204の動作速度によって異なるが、通常、1フレーム期間の1/3〜3/4程度である。
【0129】
ビットバッファ202から読み出されたピクチャのデータ量が0バイトの場合、そのピクチャの読み出し前後でビットバッファ202の占有量Bm は変化しないため、そのピクチャをスキップしたとしてもオーバーフローを回避することはできない。逆に言えば、ビットバッファ202から読み出されたピクチャのデータ量が0バイトの場合でも、ビットバッファ202に十分な空き容量があればオーバーフローすることはない。
【0130】
そこで、1フレーム期間にビットバッファ202に入力されるビデオストリームのデータ量分の空き容量を、ビットバッファ202に確保しておく。そうすれば、ビットバッファ202から読み出されたピクチャのデータ量が0バイトの場合でもオーバーフローすることはない。
【0131】
1フレーム期間にビットバッファ202に入力されるビデオストリームのデータ量は、(n×X=n×RB /RP )になる。ビットバッファ202の空き容量がこのデータ量以上であればオーバーフローすることはない。従って、式(8)に示すように閾値Bthn を設定しておけば、ビットバッファ202のオーバーフローを確実に回避することができる。
【0132】
すなわち、判定回路205は、ピクチャヘッダ検出回路203がピクチャヘッダを検出した時点でビットバッファ202の空き容量をチェックし、十分な空き容量(n×X=n×RB /RP )が確保されているかどうかを判定する。十分な空き容量が確保されていなければ、そのピクチャヘッダに基づいて制御コア回路207がビットバッファ202から読み出したピクチャを、ピクチャスキップ回路206を介してスキップする。続いて、判定回路205は、ピクチャヘッダ検出回路203が次のピクチャヘッダを検出した時点で、再びビットバッファ202の空き容量をチェックする。これらの処理に要する時間は、デコードコア回路204のデコード処理時間に比べてはるかに短いため、ビットバッファ202に十分な空き容量が確保できてからデコードコア回路204のデコード処理を開始しても十分に間に合う。
【0133】
ところで、ピクチャヘッダ検出回路203がピクチャヘッダを検出した時点や、デコードコア回路204がデコードを開始した後に、ビットバッファ202がアンダーフローすることがある。この場合は、ビデオストリームがビットバッファ202に入力され次第、ビットバッファ202から1ピクチャ分のビデオストリームを逐次読み出せばよいため、特に問題とはならない。
【0134】
以上詳述したように、ビデオデコーダ12によれば、以下に示す効果を得ることができる。
▲1▼通常の再生時において、ビットバッファ202のオーバーフローを回避することができる。
【0135】
▲2▼高速再生時において、ビットバッファ202のオーバーフローを回避することができる。
▲3▼判定回路205およびピクチャスキップ回路206を設けることにより、ビットバッファ202のオーバーフローを回避することができる。上記したように判定回路205およびピクチャスキップ回路206の制御は簡単であるため、制御コア回路207はマイクロコンピュータを用いて構成する必要がない。そして、各回路203〜207を1チップのLSIに搭載した場合には、ビデオデコーダ12を小型化することができる。
【0136】
▲4▼ピクチャスキップ回路206のノード206b側からスキップされるビデオストリームは、ピクチャ単位となる。そのため、デコードコア回路204へ転送されるピクチャの途中でデータが途切れることはない。従って、デコードコア回路204では、IピクチャだけでなくPピクチャやBピクチャについてもデコード可能になる。その結果、ディスプレイ22で再生される動画に生じるコマ落ちが少なくなる。そのため、2〜4倍という比較的遅い高速再生時において、数コマ/秒の表示が可能になる。従って、高速再生時における動画の動きを滑らかにして画質を大幅に向上させることができる。
【0137】
ところで、上記したビデオデコーダ12において、式(9)に示す規定を満たすように、2つの閾値B2thn,B3thnを設定してもよい。尚、各閾値B2thn,B3thnの値は、上記のように再生速度に応じて設定されると共に、ディスプレイ22で再生される動画の画質を実際に検討して適宜に設定すればよい。
【0138】
0<B3thn<B2thn<B ………(9)
判定回路205は、ビットバッファ202の占有量Bm と各閾値Bthn ,B2thnとを比較し、占有量Bm が式(10)〜(12)に示すどの領域に含まれるかを判定する。
【0139】
Bm <B3thn ………(10)
B3thn<Bm <B2thn ………(11)
B2thn<Bm ………(12)
判定回路205は、式(10)に示すように、ビットバッファ202の占有量Bm が閾値B3thnを越えない場合には、ビットバッファ202がオーバーフローする恐れがなく正常であると判定する。この場合、制御コア回路207は、ビットバッファ202から1ピクチャ分のビデオストリームを読み出す。そして、制御コア回路207は、ピクチャスキップ回路206をノード206a側に接続し、そのビットバッファ202から読み出されたピクチャをデコードコア回路204へ転送させる。
【0140】
判定回路205は、式(12)に示すように、ビットバッファ202の占有量Bm が閾値B2thnを越え且つ閾値Bthn を越えない場合に、ビットバッファ202から読み出されたピクチャがIピクチャまたはPピクチャならば、第1のフラグを立てる。また、式(11)に示すように、ビットバッファ202の占有量Bm が閾値B3thnを越え且つ閾値B2thnを越えない場合に、ビットバッファ202から読み出されたピクチャがPピクチャならば、第2のフラグを立てる。第1または第2のフラグが立っている場合、式(10)に示す場合でも、制御コア回路207は、ビットバッファ202から読み出されたピクチャがBピクチャならば、ピクチャスキップ回路206をノード206b側に接続し、そのピクチャをスキップさせる。
【0141】
図13に、2つの閾値B2thn,B3thnを設定した場合におけるビットバッファ202の占有量Bm の変化を示す。
占有量Bm が閾値B3thnを越えた場合、ビットバッファ202から読み出されたピクチャがBピクチャであればデコードせずにスキップする(図示※1)。ここで、Bピクチャのスキップ後に占有量Bm がまだ閾値B3thnを越えていても、ビットバッファ202から次に読み出されたピクチャがIピクチャまたはPピクチャであればデコードする(図示※2)。
【0142】
占有量Bm が閾値B3thnを越えた場合でも、ビットバッファ202から読み出されたピクチャがIピクチャまたはPピクチャであればデコードする(図示※3)。ここで、IピクチャまたはPピクチャのデコード後に占有量Bm がまだ閾値B3thnを越えている場合、ビットバッファ202から次に読み出されたピクチャがBピクチャであればデコードせずにスキップする(図示※4)。このBピクチャのスキップは、占有量Bm が閾値B3thnを下回るまで繰り返し行う(図示※5)。
【0143】
占有量Bm が閾値B2thnを越えた場合、ビットバッファ202から読み出されたピクチャがIピクチャまたはPピクチャであれば、判定回路205は第1のフラグを立てる(図示※6)。第1のフラグが立っている場合、ビットバッファ202から次に読み出されたピクチャがBピクチャであれば、占有量Bm が閾値B3thnを下回っていても、そのBピクチャをスキップする(図示※7)。
【0144】
占有量Bm が閾値B3thnを越え且つ閾値B2thnを越えない場合、ビットバッファ202から読み出されたピクチャがPピクチャであれば、判定回路205は第2のフラグを立てる(図示※8)。第2のフラグが立っている場合、ビットバッファ202から次に読み出されたピクチャがBピクチャであれば、占有量Bm が閾値B3thnを下回っていても、そのBピクチャをスキップする(図示※9)。
【0145】
占有量Bm が閾値B3thnを越え且つ閾値B2thnを越えない場合、ビットバッファ202から読み出されたピクチャがIピクチャのときには、判定回路205は第2のフラグを立てない(図示※10)。第2のフラグが立っていない場合、占有量Bm が閾値B3thnを下回っていれば、ビットバッファ202から次に読み出されたピクチャがBピクチャであってもデコードする。
【0146】
以上のように、2つの閾値B2thn,B3thnを設定した場合には、上記したビデオデコーダ12の効果▲1▼〜▲3▼に加えて、以下の効果を得ることができる。
▲4▼ビットバッファ202の占有量Bm が閾値B3thnを越え且つ閾値Bthn を越えない場合、IピクチャおよびPピクチャを可能な限りデコードすると共に、Bピクチャを優先してスキップする。
【0147】
Bピクチャは双方向予測によって生成されるため、その重要度はIピクチャやPピクチャに比べて低い。従って、重要度の低いBピクチャを優先してスキップすることにより、ディスプレイ22で再生される動画に生じるコマ落ちをさらに少なくすることができる。その結果、高速再生時における動画の動きをさらに滑らかにして画質をより向上させることができる。
【0148】
▲5▼第1のフラグを設定することで、IピクチャまたはPピクチャのデコード後にビットバッファ202の占有量Bm が閾値B3thnを下回っても、余裕をみて次にビットバッファ202から読み出されるBピクチャを予めスキップすることができる。また、第2のフラグを設定することで、Pピクチャのデコード後にビットバッファ202の占有量Bm が閾値B3thnを下回っても、余裕をみて次にビットバッファ202から読み出されるBピクチャを予めスキップすることができる。
【0149】
このように、Bピクチャを予めスキップすることは、ビットバッファ202の次回のオーバーフローに対して予防措置を講ずることに他ならない。従って、ビットバッファ202のオーバーフローをより確実に回避することができる。
【0150】
▲6▼Iピクチャのデータ量はPピクチャのそれの2〜3倍と多い。そのため、Pピクチャが読み出された場合に比べて、Iピクチャが読み出された場合の方がビットバッファ202の占有量Bm の減少の度合いが大きい。従って、Pピクチャが読み出された後よりも、Iピクチャが読み出された後の方がビットバッファ202がオーバーフローする可能性が小さくなる。そこで、第1および第2のフラグを設定することにより、IピクチャとPピクチャとで前記予防措置に差をつける。すなわち、Iピクチャに対する予防措置の閾値B2thnを、Pピクチャに対する予防措置の閾値B3thnよりも高い値に設定することで、Iピクチャに対する予防措置をPピクチャのそれに比べて緩くすることが可能になる。その結果、Bピクチャの無駄なスキップを少なくすることができる。
【0151】
▲7▼以下のa)b)に示すGOP構成(ピクチャのタイプの並び)のビデオストリームがAVパーサ11から転送されてきた場合についてシミュレーションしたところ、以下に示す結果が得られた。
【0152】
a)IBPBPBPBP・・・
b)IBBPBBPBBPBBPBBIBP・・・
[1] 2倍速再生時;a)の場合、IピクチャおよびPピクチャの全てがデコード可能であり、その結果、30コマ/秒のフルレートで表示できる。b)の場合、IピクチャおよびPピクチャの全てとBピクチャの一部がデコード可能であり、その結果、25コマ/秒以上で表示できる。
【0153】
[2] 4倍速再生時;a)b)共に、Iピクチャおよびそれに続く3〜4枚のPピクチャがデコード可能であり、その結果、15コマ/秒以上で表示できる。
ところで、第2〜第3実施形態において、ビデオデコーダ12の動作速度を制御するには、デコードコア回路204におけるデコード処理の速度を制御すればよい。
【0154】
尚、上記各実施形態は以下のように変更してもよく、その場合でも同様の作用および効果を得ることができる。
(1)リングメモリ32を、DSP31の後段ではなく、DSP31の前段(すなわち、MPEGオーディオデコーダ3とDSP31の間)に設ける。
【0155】
(2)MPEG再生装置23を構成する各回路1,11,12を1チップのLSIに搭載する。このようにすれば、MPEG再生装置23を小型化することができる。
【0156】
(3)第2〜第8実施形態において、ビデオデコーダ12の動作速度を制御するのではなく、ビデオデコーダ12とディスプレイ22の間に遅延回路を挿入し、その遅延回路の遅延時間を制御する。
【0157】
(4)第2〜第8実施形態の内いずれか2つ以上の実施形態を適宜に組み合わせて実施する。このようにすれば、組み合わせた各実施形態の相乗作用によりさらに優れた効果を得ることができる。
【0158】
(5)第1〜第8実施形態をCPUを用いたソフトウェア的な処理に置き代える。すなわち、各回路(1〜55)における信号処理をCPUを用いたソフトウェア的な信号処理に置き代える。
【0159】
(6)図12に示したMPEGビデオデコーダ12においては、説明を分かり易くするため、ピクチャスキップ回路206が各ノード206a,206bを有し、制御コア回路207の制御に従って各ノード206a,206bの接続が切り換えられる構成としたが、この構成に代えて、ピクチャスキップ回路206を、制御コア回路207の制御に従って、デコードコア回路204でデコードされるべきピクチャだけを通過させる論理回路によって構成してもよい。
【0160】
以上、本発明を具体化した各実施形態について説明したが、上記実施形態から把握できる請求項以外の技術的思想について、以下にそれらの効果と共に記載する。
(イ)請求項1〜3のいずれか1項に記載のMPEGオーディオ再生装置において、オーディオ信号をD/A変換するD/Aコンバータ(5)と、D/Aコンバータの出力を増幅するオーディオアンプ(6)とを備えたMPEGオーディオ再生装置。
【0161】
このようにすれば、ディジタルのオーディオ信号からスピーカを駆動するためのアナログ信号を生成することができる。
(ロ)請求項4〜8のいずれか1項に記載のMPEG再生装置において、記録媒体(21)から読み出されたMPEGシステムストリームを、MPEGオーディオストリームとMPEGビデオストリームとに分離するデマルチプレクサ(13)を備えたMPEG再生装置。
【0162】
このようにすれば、オーディオデコーダへオーディオストリームを、ビデオデコーダへビデオストリームをそれぞれ転送することができる。
【0163】
【発明の効果】
請求項1〜3のいずれか1項に記載の発明によれば、可変速再生時においても自然で聞き易い音声を再生することが可能なMPEGオーディオ再生装置を提供することができる。
【0164】
請求項4に記載の発明によれば、可変速再生時においても自然で聞き易い音声を再生することが可能なMPEGオーディオ再生装置とMPEGビデオデコーダとを備えたMPEG再生装置を提供することができる。
【0165】
請求項5〜8のいずれか1項に記載の発明によれば、可変速再生時においても自然で聞き易い音声を再生することが可能なMPEGオーディオ再生装置とMPEGビデオデコーダとを備え、音声と動画との時間ずれを低減することが可能なMPEG再生装置を提供することができる。
【図面の簡単な説明】
【図1】第1実施形態のブロック回路図。
【図2】第1実施形態の要部ブロック回路図。
【図3】第1実施形態の作用を説明するための模式図。
【図4】第1実施形態の作用を説明するための模式図。
【図5】第2実施形態の要部ブロック回路図。
【図6】第3実施形態の要部ブロック回路図。
【図7】第4実施形態の要部ブロック回路図。
【図8】第5実施形態の要部ブロック回路図。
【図9】第6実施形態の要部ブロック回路図。
【図10】第7実施形態の要部ブロック回路図。
【図11】第8実施形態の要部ブロック回路図。
【図12】MPEGビデオデコーダの要部ブロック回路図。
【図13】MPEGビデオデコーダの動作を説明するためのグラフ。
【図14】MPEGビデオデコーダの動作を説明するためのグラフ。
【符号の説明】
1…MPEGオーディオ再生装置
2…話速変換手段としての再生速度検出回路
3…MPEGオーディオデコーダ
4…話速変換手段としての話速変換処理回路
12…MPEGビデオデコーダ
21…記録媒体
32…リングメモリ
33…検出手段としてのアップダウンカウンタ
41…音声判別部
42…無音削除挿入部
43…時間軸圧縮伸長部
51…インデックス付加回路
52…インデックス検出回路
53,55…遅延時間検出回路
54…制御回路
Claims (8)
- 記録媒体から読み出されたMPEGオーディオストリームをMPEGオーディオパートに準拠してデコードし、オーディオ信号を生成するMPEGオーディオデコーダと、
オーディオ信号に対して話速変換処理を行う話速変換処理手段とを備え、
話速変換処理手段は、オーディオストリームのビットレートが通常時よりも大きい場合には、再生される各音声区間の時間長さを長くすると共に各無音区間の時間長さを短くするようにして話速変換処理を行い、オーディオストリームのビットレートが通常時よりも小さい場合には、再生される各音声区間の時間長さを長くすると共に各無音区間の時間長さを短くするか、または、各無音区間を削除して各音声区間をつなぎ合わせた後に無音区間を挿入するようにして話速変換処理を行うMPEGオーディオ再生装置。 - 請求項1に記載のMPEGオーディオ再生装置において、
話速変換処理手段は、
オーディオ信号を蓄積するリングメモリと、
リングメモリの蓄積量を検出する検出手段とを備え、
リングメモリの蓄積量に応じて音声区間の時間長さの圧縮伸長率を調整するMPEGオーディオ再生装置。 - 請求項2に記載のMPEGオーディオ再生装置において、
話速変換処理手段は、
オーディオ信号の音声区間と無音区間とを判別する音声判別部と、
無音区間の削除処理または挿入処理を行う無音削除挿入部と、
リングメモリの蓄積量に基づいて音声区間の圧縮伸長処理を行うことで圧縮伸長率を調整する時間軸圧縮伸長部とを備えたMPEGオーディオ再生装置。 - 請求項1〜3のいずれか1項に記載のMPEGオーディオ再生装置と、
記録媒体から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダとを備えたMPEG再生装置。 - 請求項2または請求項3に記載のMPEGオーディオ再生装置と、
記録媒体から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダと、
リングメモリに書き込まれる以前のオーディオ信号に、時刻に関する情報としてのインデックス信号を付加するインデックス付加回路と、リングメモリから読み出されたオーディオ信号に付加されているインデックス信号を検出し、そのインデックス信号から得られる時刻情報と現在の時刻情報とから、話速変換処理手段における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダへ供給するインデックス検出回路とを備え、
MPEGビデオデコーダは、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御するMPEG再生装置。 - 請求項3に記載のMPEGオーディオ再生装置と、
記録媒体から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダと、
音声判別部の処理結果と、オーディオストリームのビットレートとに基づいて、話速変換処理手段における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダへ供給する遅延時間検出回路とを備え、
MPEGビデオデコーダは、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御するMPEG再生装置。 - 請求項3に記載のMPEGオーディオ再生装置と、
記録媒体から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダと、
リングメモリの蓄積量に基づいて、話速変換処理済みのオーディオ信号とビデオ信号との同期を得るための制御信号を生成し、その制御信号をMPEGビデオデコーダへ供給する制御回路とを備え、
MPEGビデオデコーダは、前記制御信号に基づいて自己の動作のタイミングを制御するMPEG再生装置。 - 請求項3に記載のMPEGオーディオ再生装置と、
記録媒体から読み出されたMPEGビデオストリームをMPEGビデオパートに準拠してデコードし、ビデオ信号を生成するMPEGビデオデコーダと、
音声判別部および時間軸圧縮伸長部の処理結果に基づいて、話速変換処理手段における信号遅延時間を検出し、その検出された遅延時間を示す信号をMPEGビデオデコーダへ供給する遅延時間検出回路とを備え、
MPEGビデオデコーダは、前記遅延時間を示す信号に基づいて自己の動作のタイミングを制御するMPEG再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16945496A JP3594409B2 (ja) | 1995-06-30 | 1996-06-28 | Mpegオーディオ再生装置およびmpeg再生装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7-166385 | 1995-06-30 | ||
JP16638595 | 1995-06-30 | ||
JP16945496A JP3594409B2 (ja) | 1995-06-30 | 1996-06-28 | Mpegオーディオ再生装置およびmpeg再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0973299A JPH0973299A (ja) | 1997-03-18 |
JP3594409B2 true JP3594409B2 (ja) | 2004-12-02 |
Family
ID=26490781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16945496A Expired - Lifetime JP3594409B2 (ja) | 1995-06-30 | 1996-06-28 | Mpegオーディオ再生装置およびmpeg再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3594409B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3063682B2 (ja) * | 1997-06-05 | 2000-07-12 | 日本電気株式会社 | 音声再生時刻の制御機能を有する画像音声デコーダ |
JP3017715B2 (ja) | 1997-10-31 | 2000-03-13 | 松下電器産業株式会社 | 音声再生装置 |
KR100287366B1 (ko) | 1997-11-24 | 2001-04-16 | 윤순조 | 엠피이지 방식을 이용한 휴대용 음향 재생장치 및 방법 |
JP2000050182A (ja) * | 1998-08-03 | 2000-02-18 | Japan Advanced Inst Of Science & Technology Hokuriku | A−v用オーディオ信号処理方法 |
US6292454B1 (en) * | 1998-10-08 | 2001-09-18 | Sony Corporation | Apparatus and method for implementing a variable-speed audio data playback system |
JP3468183B2 (ja) | 1999-12-22 | 2003-11-17 | 日本電気株式会社 | 音声再生記録装置および方法 |
JP2001222300A (ja) * | 2000-02-08 | 2001-08-17 | Nippon Hoso Kyokai <Nhk> | 音声再生装置および記録媒体 |
JP2001344905A (ja) | 2000-05-26 | 2001-12-14 | Fujitsu Ltd | データ再生装置、その方法及び記録媒体 |
JP2002268692A (ja) * | 2001-03-14 | 2002-09-20 | Sanyo Electric Co Ltd | データ再生装置 |
JP2003006991A (ja) * | 2001-06-21 | 2003-01-10 | Sony Corp | デジタル信号処理装置及びデジタル信号処理方法、並びにデジタル信号再生受信システム |
US7149412B2 (en) * | 2002-03-01 | 2006-12-12 | Thomson Licensing | Trick mode audio playback |
JP4007331B2 (ja) | 2004-02-24 | 2007-11-14 | ソニー株式会社 | 再生装置および方法 |
EP1770688B1 (en) | 2004-07-21 | 2013-03-06 | Fujitsu Limited | Speed converter, speed converting method and program |
CN101203907B (zh) | 2005-06-23 | 2011-09-28 | 松下电器产业株式会社 | 音频编码装置、音频解码装置以及音频编码信息传输装置 |
JP4687908B2 (ja) * | 2006-09-22 | 2011-05-25 | カシオ計算機株式会社 | 動画再生装置及びそのプログラム |
JP4743084B2 (ja) * | 2006-11-07 | 2011-08-10 | カシオ計算機株式会社 | 記録装置及び記録プログラム |
JP2011055386A (ja) * | 2009-09-04 | 2011-03-17 | Sanyo Electric Co Ltd | 音響信号処理装置及び電子機器 |
PL3779979T3 (pl) | 2010-04-13 | 2024-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
JP6181921B2 (ja) * | 2012-11-20 | 2017-08-16 | 日本放送協会 | 音声再生装置および音声合成再生装置ならびにこれらのプログラム |
JP6519316B2 (ja) * | 2015-05-25 | 2019-05-29 | ヤマハ株式会社 | 音素材処理装置および音素材処理プログラム |
-
1996
- 1996-06-28 JP JP16945496A patent/JP3594409B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0973299A (ja) | 1997-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5809454A (en) | Audio reproducing apparatus having voice speed converting function | |
JP3594409B2 (ja) | Mpegオーディオ再生装置およびmpeg再生装置 | |
JP3053541B2 (ja) | デジタル記録音声及びビデオの同期式可変速度再生 | |
JP4717060B2 (ja) | 記録再生装置および記録再生方法および記録再生プログラムを格納した記録媒体および記録再生装置において用いられる集積回路 | |
US7400685B2 (en) | Decoding method and apparatus and recording method and apparatus for moving picture data | |
JP3063838B2 (ja) | オーディオ・ビデオ同期再生装置および方法 | |
KR100290331B1 (ko) | 오디오-비디오 신호의 동기 재생 장치 | |
JP3197766B2 (ja) | Mpegオーディオデコーダ、mpegビデオデコーダおよびmpegシステムデコーダ | |
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
JP4098420B2 (ja) | 音響データ・動画データの同期再構築方法及び装置 | |
JP2003046949A (ja) | データ多重化方法、データ記録媒体、データ記録装置及びデータ記録プログラム | |
US10244271B2 (en) | Audio recording device, audio recording system, and audio recording method | |
JP2005519537A (ja) | トリック・モードで再生中の音声データの削除および消音 | |
WO2004047441A1 (ja) | 伝送装置と伝送方法と再生装置と再生方法およびプログラムと記録媒体 | |
US5896099A (en) | Audio decoder with buffer fullness control | |
JP3416403B2 (ja) | Mpegオーディオデコーダ | |
JP3622235B2 (ja) | 多重化データの復号装置 | |
WO2006040827A1 (ja) | 送信装置、受信装置、並びに再生装置 | |
JP3986147B2 (ja) | 音響信号処理装置及びオーディオ高速再生方法 | |
JP3926102B2 (ja) | Mpeg方式の映像・音声データ記録システム及びその編集システム | |
JP2003216195A (ja) | Mpegオーディオデコーダ | |
JP3338426B2 (ja) | Mpegビデオデコーダ | |
JP2003259287A (ja) | マルチメディア通信装置 | |
JPH08237135A (ja) | 符号化データ復号装置およびそれを用いた画像オーディオ多重化データ復号装置 | |
JP2004153631A (ja) | デジタル映像音声記録装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040721 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040831 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070910 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080910 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |