本発明の具体例として示す信号再生装置は、マルチチャンネル方式で作成され、複数の音源情報を含む音楽データに対して、一般調和信号解析技術をはじめとする音源信号抽出と音場合成技術とを用いて、オーディオ信号から特定の音源信号を抽出し、この音源信号の音像を最適な仮想音源位置に定位させる信号処理を行う再生装置である。
なお、本発明では、オーディオ信号が多重化されたデータとは、例えば、複数の楽器で演奏された音楽データ、“演奏”と“歌声”とが含まれる音楽データのように複数の音源が含まれるオーディオデータであって、リニアPCM(Linear Pulse Code Modulation)、ドルビーデジタル、DTS(Digital Theater Systems)、DVD−Audioフォーマット、DVD−Videoフォーマットに決められたオーディオデータを含むが、いわゆるMIDI(Musical Instrument Digital Interface)規格に準拠するデータのように、予めチャンネル毎(音源毎)に作成された複数パートのデータを合成(多重化)してできるオーディオデータは、本発明及び本発明の具体例では含まれない。
以下、本発明の第1の具体例として示す信号再生装置1について、図面を参照して詳細に説明する。信号再生装置1は、記録媒体から入力したオーディオデータを含むコンテンツデータを再生する再生装置である。
図1に示す信号再生装置1は、光ディスクを回転駆動し記録されたデータを読み出す光ディスク再生部11と、読み出したデータを圧縮されたオーディオデータ、ビデオデータ、字幕データ、その他のデータ等に分離する信号分離回路12とを備える。また、圧縮されたオーディオデータを復号するオーディオデコーダ13と、復号されたオーディオデータを再生するとともに仮想音源の位置情報に応じて音場合成するオーディオ信号処理回路14と、圧縮された字幕データを復号する字幕デコーダ15と、復号された字幕を再生する字幕再生回路16とを備えている。また、圧縮されたビデオデータを復号するビデオデコーダ17と、復号されたビデオデータを再生するビデオ信号再生回路18と、ビデオ信号に同期して字幕を合成する字幕合成回路19と、字幕が合成されたビデオ信号を外部に出力するビデオ信号出力回路20とを備える。
なお、オーディオデコーダ13からの出力とこれに対応する音源信号算出処理部26及びオーディオ信号再生処理部23への入力、並びに音が合成処理部27からの出力とこれに対応する多チャンネルアンプ21への入力、オーディオ信号出力回路22への入力及び出力は、チャンネル数に併せた信号線が用意されている。
オーディオデータ及びビデオデータとしては、MPEG1、MPEG2、AVI、WMV、WMA等の各フォーマットが適用可能であるが、以下に説明する例では、光ディスクとしてDVD(Digital Versatile Disc)を使用する。この場合、ビデオデータはMPEG(Moving Picture Experts Group)によって標準化されたMPEG2であり、オーディオデータは、リニアPCM、ドルビーデジタル、DTS、SDDS等が適用される。
オーディオ信号処理回路14は、オーディオデコーダ13で復号されたオーディオデータを再生するオーディオ信号再生処理部23と、光ディスク再生部11で再生された再生信号から音像情報を抽出する処理を行う音像情報抽出処理部24と、仮想音源位置を算出する仮想音源位置算出処理部25と、音像情報から音源信号を算出する音源信号算出処理部26と、音源信号と仮想音源位置に基づいて音場を合成する音場合成処理部27とを備える。
オーディオ信号再生処理部23は、オーディオデコーダ13で復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
音像情報抽出処理部24は、光ディスク再生部11が読み出したデータから音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。音源情報としては、オーディオデータを構成する楽器、音声等があげられる。また、音像情報抽出処理部24は、一般調和信号解析により数種類の音源からの音が混在した音声波形から主要音源の時間変動に相関がある周波数成分を抽出する。例えば、音像情報抽出処理部24は、一般調和信号解析によって、目的の女声ボーカル信号を構成する周波数成分を分離することができる。また、例えば中央位置に定位させる音源信号の周波数成分を分離することができる。
仮想音源位置算出処理部25は、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置を算出する。ここで、音場合成すべき音源位置とは、後段の音場合成処理部27の精度やスピーカ配置に応じた仮想音源の位置である。仮想音源位置算出処理部25は、例えば中央位置に音像定位する音源信号であれば、聴取点からこの音仮想源信号までの仮想音源距離を、後段の音場合成処理部27の精度やスピーカ配置に応じて計算して算出又は変更する。
音源信号算出処理部26は、音像情報抽出処理部24で一般調和信号解析によって音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータを与える。図2〜図5には、オーディオデータから分離された周波数波形を示す。
音源信号算出処理部26は、2チャンネルオーディオデータ、多チャンネルオーディオデータ等のオーディオデータから音像情報抽出処理部24及び仮想音源位置算出処理部25における解析結果に基づいて特定位置に音像定位する音源信号、パート毎に異なる音源信号を分離している。例えば、音源信号算出処理部26は、音像情報抽出処理部24で一般調和信号解析によって分離された目的の女声ボーカル信号を構成する周波数成分から女声ボーカルの音源信号を算出する。また、例えば中央位置に定位させる音源信号の周波数成分を分離することができる。音源信号算出処理部26は、算出した音源信号を音場合成処理部27に送る。
また、音源信号算出処理部26は、分離した所定の周波数成分を広がり方向(水平方向)、又は奥行き方向に定位位置変更する制御パラメータを算出する。
音源音像を広がり方向(水平方向)に定位位置変更するための制御パラメータの変更例として、音源信号算出処理部26は、例えば、観測点と仮想音源との方向に関して、後述する音場合成処理部27の精度が10°刻み程度の精度でしか音場合成できない場合には、音像方向8°刻みの音像位置変化を生じさせるパラメータを10°に再変換する。また、スピーカ配置上の制約で横方向に40°の範囲内にしか音像配置できない場合には、音像位置50°という音像位置変化を生じさせるパラメータは40°に再変換する。
また、観測点と仮想音源との距離である音像位置距離データについても同様である。一般的に、3メートル以上の遠方の音源に対しては人間の距離知覚の精度が低下することが知られている。そこで音源信号算出処理部26は、音源音像を奥行き方向に定位位置変更するための制御パラメータの変更例として、例えば、音像距離5メートル程度の距離変化を生じさせるパラメータを音源位置3メートル程度に音像定位させるパラメータに変換し、音像距離8メートル程度の距離変化を生じさせるパラメータを音源距離10メートルに再変換する。
また、音源信号算出処理部26は、分離された音源に基づいて新たな音源信号を作成することもできる。例えば、音像情報抽出処理部24によって分離された特定音源の音源信号を別の位置に定位させるパラメータを算出したり、特定音源と周波数が若干異なる音源信号を生じるための制御パラメータを算出したりする。これにより、ある音源に対していわゆるユニゾンする別の音源、或いはある音源とハーモニーを生じる別の音源の周波数成分を生成することができる。
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号を仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。また、音場合成処理部27は、中央位置に音像定位する音源信号が取り除かれたインテンシティステレオ信号を通常のインテンシティステレオ再生し、分離した音源信号を中央位置に再配置する音場合成を行う。
オーディオ信号出力回路22にオーディオ信号の出力手段の一例として平面アレイスピーカが使用される場合、音場合成処理部27は、中央位置から同心円状に広がる音波を出力するためのアレイスピーカ駆動用のデジタルフィルタ係数を算出し、目的のボーカル信号に畳み込み演算を行う。
図2〜図5は、音像情報抽出処理部24によって分離された周波数成分を示している。図2〜図5において横軸は時間であり、縦軸は信号レベルを表している。図2に示す周波数成分f1の信号レベルと図3に示す周波数成分f2の信号レベルは、互いに時間変動に強い相関があるため、音場合成処理部27は、f1とf2を同じ音源として音像定位する。また、音場合成処理部27は、同様に、図4に示す周波数成分f3と図5に示す周波数成分f4とを同じ音源として音像定位する。
音源信号算出処理部26は、元のオーディオ信号から一般調和信号解析によって分離された図2〜図5に示す周波数成分f1〜f4に対して、互いに時間変動に強い相関があるものを同じ音源とし、再生空間内における同一位置に定位させるための制御パラメータを与える。音場合成処理部27は、与えられた制御パラメータを抽出した周波数成分に、例えばf1とf2に重畳して再合成する。そして、この抽出した音源の周波数成分に所定の音源に、同じ音源として音像定位させるためのパラメータが与えられ、所定の楽器の周波数成分として再合成する。
続く多チャンネルアンプ21は、アレイスピーカ用の多チャンネル信号を増幅するとともに、オーディオ信号のうち再合成されなかった音源信号を2チャンネル又は5.1チャンネルで再生するための増幅を行う。例えば、多チャンネルアンプ21は、上述のようにボーカル信号が音場の再合成をするために分離された場合、ボーカル信号をアレイスピーカ用に多チャンネルで増幅し、ボーカル信号成分が分離された後のオーディオ信号をLチャンネル信号、Rチャンネル信号の2チャンネルで増幅する。
上述した構成を有する信号再生装置1が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
光ディスク再生部11は、光ディスクを回転駆動しDVDに記録されたデータを読み出す。光ディスク再生部11によって読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
光ディスク再生部11によって読み出されたデータは、オーディオ信号処理回路14の音像情報抽出処理部24にも送られる。音像情報抽出処理部24は、一般調和信号解析によって、再生信号から音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で一般調和信号解析によって音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて、仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られる。多チャンネルアンプ21では、特定の音声信号、例えばボーカル信号成分が分離された場合、分離されたボーカル信号を多チャンネルで増幅し、ボーカル信号成分が分離された後のオーディオ信号をLチャンネル信号、Rチャンネル信号の2チャンネルで増幅する。
一方、ビデオデータと字幕データは、ビデオデコーダ17、字幕デコーダ15に送られ、続く字幕再生回路16或いはビデオ信号再生回路18で再生される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成される。音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、字幕が合成されたビデオ信号はビデオ信号出力回路20から互いに同期され外部のスピーカシステム、表示装置等に出力される。
したがって、信号再生装置1は、音像情報抽出処理部24においてオーディオデータに含まれる音源毎の楽音を分離算出し、音源信号算出処理部26において聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置算出処理部25において算出された仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築することにより、視聴者の臨場感を高めることができる。上述した信号再生装置1は、本発明の基本的な構成を実現したものである。
以下では、本発明のほかの応用例について説明する。本発明の第2の具体例として信号再生装置2を図6に示す。図2に示す信号再生装置2は、音像毎の音源情報及び音像位置情報が多チャンネルのオーディオデータから独立して、例えば、楽曲、映画等といったコンテンツ毎にメタデータとして用意されていることが特徴である。そして、このメタデータは、コンテンツと対応づけるためにコンテンツを識別するための識別コードに対応して予め所定の領域に格納されている。ここで識別コードとは、所定のルールを用いてオーディオデータ等のコンテンツデータの一部から生成されたコンテンツ毎に固有な情報である。
そのため、信号再生装置2は、オーディオデータから切り離されてコンテンツ毎に所定領域に格納された音源情報及び音像位置情報を読み出すために必要な識別コードを、この識別コードを光ディスクに格納したと同じ手順で生成する識別コード生成部28と、ここで生成された識別コードに対応するメタデータを光ディスクから検索する検索処理部29とを備えることを特徴としている。なお、図6に示す信号再生装置2において、図1に示した信号再生装置1と同様の機能を有する構成は、同一の番号を付けて詳細な説明を省略する。
識別コード生成部28は、オーディオデータから切り離されてメタデータとして所定領域に格納された音源情報及び音像位置情報を読み出すために必要な識別コードを、多チャンネルデータの一部から生成する。識別コードとしては、TOCに記録されているトラック数、各トラックの演奏時間等のデータ、またこれらを組み合わせたデータのほか、多チャンネルデータそのものに対して所定の符号化を施して得られるデータ等があげられる。
検索処理部29は、識別コード生成部28で生成されたコンテンツを特定するための識別コードに応じて演奏対象となっている楽曲の識別コードを多重化されたデータから検索する。
上述した構成を有する信号再生装置2が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
光ディスク再生部11によって読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
オーディオ信号処理回路14の識別コード生成部28は、光ディスク再生部11で読み出されたデータから作成時と同様のルールで識別コードを生成する。そして、検索処理部29は、生成された識別コードに応じて、演奏対象の楽曲の音源情報及び音像位置情報のデータを多重化されたデータから検索する。
信号再生装置2では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて、仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
上述したように信号再生装置2は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意し、更にメタデータを識別コードに対応して予め所定の領域に格納したことにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。また、音像情報抽出処理部24において音源毎の信号を分離し、音源信号算出処理部26において聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置算出処理部25において算出された仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築することにより、視聴者の臨場感を高めることができる。
続いて、本発明の第3の具体例として信号再生装置3を図7に示す。図7では、図1及び図6に示す信号再生装置と同様の機能を有する構成に関しては同一の番号を付けて詳細な説明を省略する。図7に示す信号再生装置3は、上述した多チャンネルのオーディオデータが光ディスクのようないわゆるパッケージングメディアとして提供される場合でなく、ネットワークを介して送られる場合である。そして更に、信号再生装置3では、音像毎の音源情報及び音像位置情報が多チャンネルのオーディオデータから独立して、メタデータとして用意されており、多チャンネルデータとメタデータが混合されてネットワークを介して提供されることが特徴である。
そのため、信号再生装置3は、光ディスク再生部11の代わりに、無線又は有線接続されるローカルエリアネットワーク、オリジナルネットワーク、いわゆるインターネット等のネットワークに接続するネットワークインターフェイス(以下、ネットワークI/Fという。)31と、ネットワークを介して送られたオーディオデータ等のコンテンツデータを一時的に記憶する受信バッファ32を備えている。ネットワークの通信プロトコルとしては、TCP/IPをはじめとする汎用プロトコルがあげられる。
また、信号再生装置3は、コンテンツ毎に作成された音源情報及び音像位置情報のメタデータを読み出すために必要な識別コードをこのコンテンツの識別コードを送信するときと同じ手順で生成する識別コード生成部33と、ここで生成された識別コードに対応するメタデータをネットワークから受け取ったデータ中から検索する検索処理部34とを備えている。
なお、図7に示す信号再生装置3において、ネットワークを介して伝送されるオーディオデータは、リアルタイム再生を可能とするストリームデータであってもよいし、いわゆるダウンロードのような一括伝送データであってもよい。また、信号再生装置3は、識別コード入力部35を備え、ユーザによって、識別コードが直接入力できてもよい。
上述した構成を有する信号再生装置3がネットワークを介して受信したコンテンツデータを再生する動作について説明する。
ネットワークI/F31で受け取ったデータは、受信バッファ32に一時的に記憶され、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
オーディオ信号処理回路14の識別コード生成部33は、ネットワークI/F31で受け取ったデータから作成時と同様のルールで識別コードを生成する。そして、検索処理部34は、生成された識別コードに応じて、演奏対象の楽曲のメタデータを多重化されたデータから検索する。
信号再生装置3では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
上述したように信号再生装置3は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意し、更にメタデータを識別コードに対応して予め所定の領域に格納したことにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。したがって、信号再生装置3は、音源毎の信号を分離し、聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築するという信号処理がネットワークを介して送信されるオーディオデータ等のコンテンツデータに対してもリアルタイムに可能になる。
次に、本発明の第4の具体例として信号再生装置4を図8に示す。図8に示す信号再生装置4は、多チャンネルのオーディオデータから独立して音像毎の音源情報及び音像位置情報がメタデータとして用意されているのは同一であるが、オーディオデータは光ディスクから、また音源情報及び音像位置情報はネットワークを介して信号再生装置4に送られることを特徴としている。
そのため、信号再生装置4は、コンテンツ毎に作成された音源情報及び音像位置情報のメタデータを読み出すために必要な識別コードをこのコンテンツの識別コードを送信するときと同じ手順で生成する識別コード生成部36と、無線又は有線接続されるローカルエリアネットワーク又はオリジナルネットワーク、いわゆるインターネット等のネットワークに接続するネットワークインターフェイス(以下、ネットワークI/Fという。)36と、識別コード生成部36で生成された識別コードに対応するメタデータをネットワークから受け取ったデータ中から検索する検索処理部38とを備えている。信号再生装置4は、図8には図示していないがネットワークを介して送られたオーディオデータ等のコンテンツデータを一時的に記憶する受信バッファを備えている。ネットワークの通信プロトコルとしては、TCP/IPをはじめとする汎用プロトコルがあげられる。なお、図8に示すに示す信号再生装置4において、図1、図6及び図7に示す信号再生装置と同様の機能を有する構成に関しては同一の番号を付けて詳細な説明を省略する。
上述した構成を有する信号再生装置4が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
光ディスク再生部11で読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
オーディオ信号処理回路14の識別コード生成部36は、ネットワークI/F37で受け取った識別コードを検索処理部38に送る。検索処理部38は、生成された識別コードに応じて、演奏対象の楽曲のメタデータを多重化されたデータから検索する。
光ディスク再生部11から読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
信号再生装置4では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
上述したように信号再生装置4は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意して、これをネットワークから受け取る。そして、オーディオデータは光ディスクで提供されることにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。したがって、信号再生装置4は、音源毎の信号を分離し、聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築するという信号処理がネットワークを介して送信されるオーディオデータ等のコンテンツデータに対してもリアルタイムに可能になる。
また例えば、信号再生装置4では、オーディオデータ等のコンテンツデータを提供する提供業者が過去に発売されたCD、DVD等のコンテンツについての音源情報及び音像位置情報が記述されたメタデータをWebページ上で提供するなどして旧来資産であるコンテンツに対しても仮想音場を再構築する信号処理を実行することにより視聴者の臨場感を高めることができる。
図1、図6、図7、図8に示した信号再生装置の多チャンネルアンプ21及びオーディオ信号出力回路22の出力先として適用可能なスピーカシステムの具体例について説明する。
図9に示すスピーカシステム50は、音波面再生用多チャンネル音響増幅回路51と、5.1チャンネル用多チャンネル音響増幅回路52と、音波面再生用スピーカ531、532、・・・、53nと、聴取者の正面スピーカ541、右前方スピーカ542、左前方スピーカ543、右後方スピーカ544、左後方スピーカ545、低音出力用サブウーファースピーカ546の6つのスピーカからなる5.1チャンネル用スピーカシステムとを備えている。
スピーカシステム50は、図1、図6、図7、図8に示した信号再生装置における多チャンネルアンプ21及びオーディオ信号出力回路22を含んで構成されており、多チャンネルアンプ21は、音波面用多チャンネル音響増幅回路51及び5.1チャンネル用音響増幅回路52に相当する。したがって、音波面用多チャンネル音響増幅回路51、5.1チャンネル用音響増幅回路52には、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて仮想音源位置算出処理部25で算出された仮想音源位置に再配置するための音場合成が行われたオーディオ信号が音場合成処理部27から送られるようになっている。
オーディオデータは、音波面用多チャンネル音響増幅回路51、5.1チャンネル用音響増幅回路52によってチャンネル毎に増幅され、音声出力デバイスとしてのスピーカから出力される。5.1チャンネルサラウンド方式の場合には、聴取者の正面、右前方、左前方、右後方、左後方、低音出力用サブウーファースピーカの6つのスピーカから出力される。また、音波面再生用スピーカ531〜53nからは、それぞれ異なる波面をもつ音が出力され、任意の位置に音像定位する波面合成が行われる。
この平面アレイスピーカ50は、例えば、投写型プロジェクタ60と組み合わせて使用することにより、ユーザはより臨場感のある音場を得ることができる。投写型プロジェクタ60から出射された映像光は、音波面再生用スピーカ53前面聴者側に置かれたスクリーン61に投写される。スクリーン61の背後に配置されたスピーカシステムから音場合成処理部27で合成された合成音響信号が各スピーカから出力されると、上述した信号再生装置によって再合成された音場が構築される
1,2,3,4 信号再生装置、 11 光ディスク再生部、 12 信号分離回路、 13 オーディオデコーダ、 14 オーディオ信号処理回路、 15 字幕デコーダ、 16 字幕再生回路、 17 ビデオデコーダ、 18 ビデオ信号再生回路、 19 字幕合成回路、 20 ビデオ信号出力回路、 21 多チャンネルアンプ、 22 オーディオ信号出力回路、 23 オーディオ信号再生処理部、 24 音像情報抽出処理部、 25 仮想音源位置算出処理部、 26 音源信号算出処理部、 27 音場合成処理部、 28,33,36 識別コード生成部、 29,34,38 検索処理部、 31,37 ネットワークI/F、 32 受信バッファ、 35 識別コード入力部