JP6267860B2

JP6267860B2 - 音声信号送信装置、音声信号受信装置及びその方法

Info

Publication number: JP6267860B2
Application number: JP2012254133A
Authority: JP
Inventors: 炳權崔; 寧道權; 桐秀金; 慶植盧
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-11-28
Filing date: 2012-11-20
Publication date: 2018-01-24
Anticipated expiration: 2032-11-20
Also published as: US9058804B2; EP2597640A2; US20130138431A1; JP2013114264A; EP2597640A3; EP2597640B1

Description

本発明は、音声信号を圧縮して送信し、受信した音声信号を復元する音声信号送信装置、音声信号受信装置及びその方法に関するものである。

一般に音声信号送信装置は、音声信号が音源によって励振された共鳴系の出力と見なされることに着眼して、音声信号を音源及び共鳴系の特性を示す複数のパラメータに分解して伝送し、音声信号受信装置は、これらパラメータによって元の音声信号を合成する。

音声信号送信装置及び音声信号受信装置は、フレーム単位で音声信号をエンコーディング及びデコーディングするコーデックを含み、このようなコーデックのうち、例えば、Ｇ．７２９コーデックは、フレーム部からフレームの入力を受けて、１０ms単位で音声信号のエンコーディング及びデコーディングを行う。

ここで、フレーム部は、外部から８kHzで連続的に伝送される各サンプルを１０ms単位に分割し、このように分割された一つのフレームの８０個のサンプルをＧ．７２９コーデックに入力信号として提供する。

このようなＧ．７２９コーデックは、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）を用いて実現されることもできる。

この場合、ＤＳＰのメモリ構造は、処理するチャネル数に対応する実行コードを生成して格納するコード部と、プログラム活用空間として、広域変数、各チャネルバッファスタックなどを格納するデータ部と、からなる。

このようなコーデックでは、ＤＳＰの処理能力によって、実現可能なチャネルの数が決定され、ＤＳＰで処理できるチャネルの数が増加する場合には、チャネル数に対応する実行コードを生成しなければならないので、必要なメモリの量も増加することになる。

また、多チャネルの音声信号圧縮の際に損失圧縮データが必要とされる場合や、性能を最大化するために無損失データが必要とされる場合、マイクロホンの数だけ伝送しようとする音声データの信号の量が大きくなる。

さらに、多チャネルマイクロホンを通じて音声信号を収集するとき、マイクロホン間の位置や特性によって音声信号の同期が取れず、音声信号間のパワーが相違するため、圧縮が容易ではなく、圧縮効率が低いという問題がある。

一側面は、複数のマイクロホン間の相関関係を用いて、多チャネル音声信号のパワー及び同期を調節した後、圧縮して送信する音声信号送信装置及びその方法を提供する。

他の側面は、受信した音声信号を、パワー係数及び同期係数を用いて復元する音声信号受信装置及びその方法を提供する。

一側面に係る音声信号送信装置は、複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と；多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と；基準音声信号に基づいて、基準音声信号以外の音声信号の同期を調節する同期調節部と；同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と；基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と；圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と；を含む。信号圧縮部は、圧縮した基準音声信号とそれぞれの抽出信号を、暗号化してもよい。

パワー算出部は、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する。パワー算出部は、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出する。

信号生成部は、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成する。

信号生成部は、基準音声信号以外の音声信号のパワーから基準音声信号のパワーをそれぞれ差し引いて相殺させる。信号圧縮部は、それぞれの抽出信号別に基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する。

同期調節部は、基準音声信号が収集されたマイクロホンと基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節する。同期調節部は、複数のマイクロホン間の相関関係を用いて、基準音声信号以外の音声信号の同期をそれぞれ調節する。

他の側面に係る音声信号受信装置は、多チャネルの信号を受信する受信部と；受信した多チャネルの信号を基準音声信号と少なくとも一つの抽出信号に復号化する復号化部と；復号化された少なくとも一つの抽出信号のパワーを復元して、音声信号に復元するパワー復元部と；パワーが復元された少なくとも一つの音声信号の同期を復元する同期復元部と；基準音声信号と、パワー及び同期が復元された少なくとも一つの音声信号をマルチプレクシングするマルチプレクシング部と；マルチプレクシングされた音声信号を出力する出力部と；を含む。

受信部は、受信した信号から基準音声信号と少なくとも一つの抽出信号を復号化部に伝達し、少なくとも一つの抽出信号の情報をパワー復元部及び同期復元部に伝達する。

復号化部は、受信した多チャネルの信号のヘッダをパーシング（ｐａｒｓｉｎｇ）して、基準音声信号と抽出信号とを区分する。

少なくとも一つの抽出信号の情報は、基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む。

パワー復元部は、パワー係数を用いて、抽出信号のパワーを復元して、音声信号に復元する。同期復元部は、パワーが復元された音声信号の同期を、同期係数を用いて復元する。

また他の側面に係る音声信号送信方法は、複数のマイクロホンから音源信号を収集し、収集された音源信号から音声信号をそれぞれ抽出し、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、基準音声信号とそれぞれの抽出信号を圧縮し、圧縮された基準音声信号とそれぞれの抽出信号を送信する。送信前に、圧縮された基準音声信号とそれぞれの抽出信号を暗号化してもよい。

基準音声信号に設定するのは、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む。

抽出信号をそれぞれ生成するのは、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成することを含む。

基準音声信号とそれぞれの抽出信号を圧縮するのは、それぞれの抽出信号別に基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、自身のマイクロホン情報、自身のパワー係数及び自身の同期係数をそれぞれ圧縮することを含む。

基準音声信号以外の音声信号の同期を調節するのは、基準音声信号が収集されたマイクロホンと、基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節することを含む。

また他の側面に係る音声信号受信方法は、多チャネルの信号を受信し、受信した多チャネルの信号を復号化して、基準音声信号、少なくとも一つの抽出信号及び少なくとも一つの抽出信号の情報を生成し、少なくとも一つの抽出信号の情報に基づいて、少なくとも一つの抽出信号のパワー及び同期を復元する。

また他の側面に係る音声信号受信方法は、基準音声信号とパワー及び同期が復元された少なくとも一つの音声信号とをマルチプレクシングし、マルチプレクシングされた音声信号を出力することをさらに含む。

パワーを復元するのは、パワー係数を用いて、抽出信号のパワーを復元することを含む。同期を復元するのは、同期係数を用いて、パワーが復元された音声信号の同期を復元することを含む。パワー係数は、基準音声信号のパワーと少なくとも一つの音声信号のパワーとの割合である。

一側面によれば、多チャネルの音声信号を圧縮する前に、基準音声信号を基準として基準音声信号以外の音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができる。

また、無損失圧縮を基準に１％乃至３％の圧縮効率を得ることができる。

一実施例に係る音声信号送信装置及び音声信号受信装置の構成図である。一実施例に係る音声信号送信装置の詳細構成図である。一実施例に係る音声信号受信装置の詳細構成図である。一実施例に係る音声信号送信方法のフローチャートである。一実施例に係る音声信号送信の前の抽出信号生成の例示図である。一実施例に係る音声信号受信方法のフローチャートである。一実施例に係る音声信号受信の後の音声信号復元の例示図である。

以下では、添付の図面を参照して、本発明について詳細に説明する。

図１は、一実施例に係る音声信号送信装置及び音声信号受信装置の構成図で、図２は、一実施例に係る音声信号送信装置の詳細構成図で、図３は、一実施例に係る音声信号受信装置の詳細構成図である。

音声信号送信装置１００と音声信号受信装置２００は、互いに異なる端末機内に位置可能であり、互いに異なる端末機内で、ネットワークを介して、モニタリング及び音声認識などのための音声信号を送受信する。

例えば、多チャネルマイクを有したロボット（端末）で音声信号の入力を受けて、多チャネル音声信号を処理するための遠隔地のベースステーション（ＢａｓｅＳｔａｔｉｏｎ）と遠隔クライアント（ＲｅｍｏｔｅＣｌｉｅｎｔ）に送る。

この時、音声信号送信装置１００は、音声信号送受信の際の円滑な音声信号の送受信のために、音声信号を圧縮して伝送し、音声信号受信装置２００は、圧縮された音声信号を受信して、圧縮された音声信号を復元する。

すなわち、音声信号送信装置１００は、音源を収集し、収集された音源から音声信号を抽出した後、抽出された音声信号を圧縮及び必要に応じて暗号化して音声信号受信装置２００に伝送する。

そして、音声信号受信装置２００は、圧縮及び必要に応じて暗号化された音声信号を受信すると、受信した音声信号の復号化及び復元を行い、復号化及び復元された音声信号を外部に出力する。

図１に示すように、音声信号送信装置１００は、収集部１１０、抽出部１２０、圧縮部１３０及び送信部１４０を含む。収集部１１０は、互いに一定間隔を置いて設けられた複数のマイクロホン１１１〜１１４を含む。ここで、複数のマイクロホン１１１〜１１４は、音波または超音波を受けて、その振動による電気信号を発生する装置であって、ここでの電気信号は音源信号である。

複数のマイクロホン間の一定間隔は予め格納されており、複数のマイクロホン間の位置情報が予め格納されていることも可能である。このような複数のマイクロホン１１１〜１１４は、周辺の音源を収集し、収集された音源の信号を抽出部１２０に伝送する。抽出部１２０は、複数のマイクロホン１１１〜１１４を介して伝達された多チャネルの音源信号から音声信号を抽出する。圧縮部１３０は、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号と残りの音声信号（すなわち多チャネルの音声信号のうちの基準音声信号以外の音声信号）との相関関係に基づいて、残りの音声信号の容量を減少させ、基準音声信号と容量が減少された残りの音声信号の圧縮及び必要に応じて暗号化を行う。

送信部１４０は、圧縮及び必要に応じて暗号化された基準音声信号と、変化された残りの音声信号を、音声信号受信装置２００に送信する。

図２を参照して、圧縮部１３０をより具体的に説明する。圧縮部１３０は、パワー算出部１３１、同期調節部１３２、信号生成部１３３及び信号圧縮部１３４を含む。パワー算出部１３１は、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。ここで、基準音声信号は、例えば、多チャネルの音声信号のうち、パワーが最も大きい音声信号である。

例えば、第１マイクロホンから収集された第１音声信号、第２マイクロホンから収集された第２音声信号、第３マイクロホンから収集された第３音声信号、第４マイクロホンから収集された第４音声信号が存在する場合、第１音声信号、第２音声信号、第３音声信号、第４音声信号のパワーを算出し、このうちパワーが最も大きい音声信号を基準音声信号に設定する。

さらに、基準音声信号は、基準マイクロホンを予め設定し、該基準マイクロホンから収集された音声信号を基準音声信号に設定することも可能で、パワーが最も小さい音声信号を基準音声信号に設定することも可能である。

ここで、パワー算出は、例えば、平均二乗パワー（ＭｅａｎＳｑｕａｒｅＰｏｗｅｒ）を用いて算出する。この時、第１音声信号が基準音声信号だと仮定すると、第１音声信号に対する第１パワー係数は１になり、第２音声信号に対する第２パワー係数は、基準音声信号のパワーと第２音声信号のパワーとの割合になり、第３音声信号に対する第３パワー係数は、基準音声信号のパワーと第３音声信号のパワーとの割合になり、第４音声信号に対する第４パワー係数は、基準音声信号のパワーと第４音声信号のパワーとの割合になる。

パワー算出部１３１は、マイクロホンの音声信号、基準音声信号及び残りの音声信号のパワー係数を伝達する。

同期調節部１３２は、基準音声信号に基づいて残りの音声信号の同期を調節する（すなわち、基準音声信号と、基準音声信号以外の音声信号とを同期させる）。同期調節部１３２は、各音声信号の間の相関関係（ｃｏｒｒｅｌａｔｉｏｎ）を用いて同期を合せる。

さらに、それぞれ音声信号間の差を用いて最小差値を算出し、これを用いて同期係数を算出してもよく、マイクロホン間の距離に基づいて同期係数を算出してもよい。

同期調節部１３２は、基準音声信号が収集されたマイクロホンを基準として同期テーブルを作り、該同期テーブルに基づいて残りの音声信号の同期を調節する。

信号生成部１３３は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数を用いて、基準音声信号を変化させたものである。

例えば、第２音声信号から基準音声信号を相殺させようとするとき、基準音声信号と第２音声信号のパワーが異なると、第２パワー係数を用いて基準音声信号のパワーを調節することによって、基準音声信号のパワーが第２音声信号のパワーに対応するようにする。このような過程によって基準音声信号のパワーが調節された相殺信号を、第２音声信号から差し引いて抽出信号を獲得する。

すなわち、信号生成部１３３は、残りの音声信号から各相殺信号を差し引いて、新しい信号を生成する。ここで、新しい信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号であって、すなわち、抽出信号という。

信号圧縮部１３４は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮及び必要に応じて暗号化する。この時、それぞれのチャネル別に自身の抽出信号と情報を伝送し、この時、情報には基準音声信号が収集された基準マイクロホンの情報、自身のマイクロホン情報、自身のパワー係数、自身の同期係数などがあり、各情報を集めて、一つのパケットで伝達する。

図１に示すように、音声信号受信装置２００は、受信部２１０、復元部２２０、マルチプレクシング部２３０、出力部２４０及び複数のスピーカー２５０（２５１、２５２）を含む。受信部２１０は、音声信号送信装置１００から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し、受信した基準音声信号と少なくとも一つの抽出信号を復号化部２２１に伝送し、受信した抽出信号の情報をパワー復元部２２２及び同期復元部２２３に伝送する。

復元部２２０は、圧縮された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された一つの抽出信号のパワー及び同期を復元して、少なくとも一つの音声信号を生成する。

マルチプレクシング部２３０は、多重チャネルの音声信号を、一つのチャネルを介して同時に伝達する。すなわち、マルチプレクシング部２３０は、基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行う。出力部２４０は、マルチプレクシングされた音声信号が出力されるようにする。このような出力部２４０は、デジタルの音声信号をアナログの音声信号に変換させ、変換されたアナログの音声信号を増幅することも可能である。

スピーカー２５０（２５１、２５２）は、電気信号を振動板の振動に変え、空気に疎密波を発生させて、音波を放射する装置であって、ここで、電気信号は復元された音声信号である。

図３を参照して、復元部２２０をより具体的に説明する。復元部２２０は、復号化部２２１、パワー復元部２２２、同期復元部２２３を含む。復号化部２２１は、受信部２１０から伝達された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍する。

パワー復元部２２２は、受信部２１０から伝達された抽出信号の情報のうち、パワー係数を用いて、少なくとも一つの抽出信号のパワーを復元して、音声信号に復元する。この時、基準音声信号にパワー係数を適用して、追加信号を生成させて、少なくとも一つの音声信号に追加信号を合算して、音声信号に復元する。

同期復元部２２３は、受信部２１０から伝達された抽出信号の情報のうち、同期係数を用いて、少なくとも一つの音声信号の同期を復元する。この時、少なくとも一つの音声信号は、最初シフトされた同期係数だけ移動する。

図４は、一実施例に係る音声送信方法のフローチャートであって、図５を参照して説明する。まず、音声信号送信装置は、互いに一定間隔を置いて設けられた複数のマイクロホン１１１〜１１４を通じて周辺の音源信号を収集する（２０１）。次に、音声信号送信装置は、多チャネルの音源信号から音声信号をそれぞれ抽出し（２０２）、多チャネルの音声信号のパワーをそれぞれ算出し（２０３）、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定する（２０４）。次に、音源信号送信装置は、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。

例えば、ｐ１が基準音声信号のパワー係数であれば、それぞれのパワー係数ｐ２、ｐ３、ｐ４は、次の通りである。

第２音声信号のパワー係数ｐ２＝第２音声信号のパワー／基準音声信号のパワー
第３音声信号のパワー係数ｐ３＝第３音声信号のパワー／基準音声信号のパワー
第４音声信号のパワー係数ｐ４＝第４音声信号のパワー／基準音声信号のパワー
ここで、各音声信号のパワーは、平均二乗パワー（ＭｅａｎＳｑｕａｒｅＰｏｗｅｒ）を用いて算出した値で、各音声信号のパワーは整数で表現する。

次に、音声信号送信装置は、各音声信号の間の相関関係を用いて同期を合せる。このとき、基準音声信号を基準として、残りの音声信号の同期を調節する（２０５）。ここで、同期とは、マイクロホンの距離によるディレイ時間を合せるためのものである。

この同期係数は、最小差値や相関関係を用いて求め、求められた同期係数によって周期的同期（ＣｙｃｌｉｃＳｙｎｃ）を合せる。この時、同期係数によって調節された音声信号のうち、同期調節によって除去された最初の音声信号は最後の信号に連結する。

実際に測定値を求めてみると、線形マイクロホンにおいて正面での信号は同期０であり、側面のマイクロホンや円形マイクロホンの同期は、解像度によって異なるが、正面のマイクロホンの同期よりも小さい係数を有する。

マイクロホンが４つである状態で、第１音声信号が基準音声信号である場合、残りの音声信号の同期調節された信号は、次の通りである。

同期調節された第２音声信号＝第２音声信号＋ｓ２（ｃｙｃｌｉｃ）
同期調節された第３音声信号＝第３音声信号＋ｓ３（ｃｙｃｌｉｃ）
同期調節された第４音声信号＝第４音声信号＋ｓ４（ｃｙｃｌｉｃ）
ここで、ｓ２、ｓ３、ｓ４は、基準音声信号である第１音声信号に基づいて調節された同期係数である。次に、音声信号送信装置は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数に基づいて、基準音声信号を変化させたものである。

次に、音声信号送信装置は、残りの音声信号から各相殺信号を差し引いて、新しい抽出信号をそれぞれ生成する（２０６）。ここで、新しい抽出信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号である。

例えば、マイクロホンが４つである状態で、第１音声信号が基準音声信号である場合、残りの音声信号に対応する抽出信号を生成する過程は、次の通りである。

第２抽出信号＝同期調節された第２音声信号−(第２パワー係数＊基準音声信号）
第３抽出信号＝同期調節された第３音声信号−(第３パワー係数＊基準音声信号）
第４抽出信号＝同期調節された第４音声信号−(第４パワー係数＊基準音声信号）
次に、音声信号送信装置は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮する（２０７）。音声信号送信装置は、圧縮する前に、圧縮と同時に、または圧縮後に、基準音声信号とそれぞれの抽出信号をさらに暗号化してもよい。この時、基準音声信号、それぞれの抽出信号、各抽出信号の情報を共に圧縮する。ここで、抽出信号の情報は、自身のマイクロホン番号、基準音声データが収集されたマイクロホン番号、パワー係数、同期係数を含み、これを一つのパケットで伝送する。

また、基準音声信号と自身のマイクロホン番号と自身のパワー係数、同期係数を共に伝送する。

次に、音声信号送信装置は、圧縮された基準音声信号と各抽出信号を、音声信号受信装置２００に送信する（２０８）。ここで、抽出信号の生成を、図５を参照して、より具体的に説明する。

第１チャネル（ＣＨ１）のマイクロホンを通じて第１音声信号を収集し、また、第２チャネル（ＣＨ２）のマイクロホンを通じて第２音声信号を収集する。

ここで、第１チャネル（ＣＨ１）のマイクロホンを通じて収集された第１音声信号は、図５の（ａ）に示されたようであり、第２チャネル（ＣＨ２）のマイクロホンを通じて収集された第２音声信号は、図５の（ｂ）に示されたようである。

次に、第１音声信号のパワーと第２音声信号のパワーを算出する。ここで、各音声信号のパワーは、平均二乗パワー（ＭｅａｎＳｑｕａｒｅＰｏｗｅｒ）を用いて算出する値であって、整数で表現する。この時、第１音声信号のパワーは、次の通りである。

第２音声信号のパワーは、次の通りである。

第１音声信号のパワーは７であり、第２音声信号のパワーは５で、第１音声信号のパワーより第２音声信号のパワーが小さいので、第１音声信号を基準音声信号に設定し、第２チャネル（ＣＨ２）のマイクロホンを通じて収集された第２音声信号を抽出信号に変化させる。

まず、図５の（ｃ）に示されたように、基準音声信号を基準に第２音声信号の同期を調節する。すなわち、基準音声信号と第２音声信号の波形が最大限一致するようにするために、第２音声信号を１／４周期だけ左側にシフトする。

次に、パワー係数を算出する。このとき、パワー係数は、基準音声信号のパワーと第２音声信号のパワーとの割合で、５／７である。次に、図５（ａ）に示された第１チャネル（ＣＨ１）信号である基準音声信号の各値に５／７を適用して、相殺信号を生成する。ここで、相殺信号は整数で表現可能である。図５（ｄ）に示されたように、相殺信号は、０、７、０、−７、０、７、０、−７、０の値を有する。

即ち、基準音声信号と第２音声信号との間のパワーが異なると、基準音声信号のパワーが第２音声信号のパワーに対応するように、基準音声信号にパワー係数を適用して、基準音声信号の各値を調節する。この時、パワー係数によって各値が調節された基準音声信号は、相殺信号になる。

次に、図５の（ｅ）に示されたように、同期調節された第２音声信号から相殺信号を差し引いて、抽出信号を生成する。この時、抽出信号は、１（＝１−０）、０（＝７−７）、−１（＝−１−０）、１（＝−６−（−７））、２（＝２−０）、−２（＝５−７）、１（＝−１−０）、０（＝−７−（−７））、−８（＝−８−０）の値を有する。

図６は、一実施例に係る音声信号受信方法のフローチャートであって、図７を参照して説明する。音声信号受信装置は、音声信号送信装置１００から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し（３０１）、受信した多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された基準音声信号と少なくとも一つの抽出信号を復号化する（３０２）。この時、多チャネルの基準音声信号と、少なくとも一つの抽出信号、抽出信号の情報が生成される。

さらに、音声信号受信装置は、受信した信号のヘッダをパーシングして、基準音声信号と抽出信号を判別する。そして、基準音声信号は、圧縮を解凍した後マルチプレクシング部にそのまま送って処理する。

次に、音声信号受信装置は、抽出信号の情報のうちパワー係数を用いて、少なくとも一つの抽出信号のパワーを復元することで（３０３）、少なくとも一つの音声信号に生成し、抽出信号の情報のうち同期係数を用いて、パワーが復元された少なくとも一つの音声信号の同期を復元することで（３０４）、最初音声信号に復元されるようにする。この時、少なくとも一つの音声信号は、音声信号送信装置１００で最初シフトされた同期係数だけ移動する。

例えば、４つのマイクロホンを通じて音源を収集した場合、第１音声信号が基準信号であれば、第２、３、４音声信号に対応した抽出信号のパワー復元信号と同期復元信号は、次の通りである。

第２パワー復元信号＝第２抽出信号＋第２パワー係数＊基準マイク信号
第３パワー復元信号＝第３抽出信号＋第３パワー係数＊基準マイク信号
第４パワー復元信号＝第４抽出信号＋第４パワー係数＊基準マイク信号
第２同期復元信号＝第２パワー復元信号−ｓ２（ｃｙｃｌｉｃ）
第３同期復元信号＝第３パワー復元信号−ｓ３（ｃｙｃｌｉｃ）
第４同期復元信号＝第４パワー復元信号−ｓ４（ｃｙｃｌｉｃ）
ここで、ｓ２、ｓ３、ｓ４は、基準音声信号である第１音声信号に基づいて調節された同期係数である。

次に、音声信号受信装置は、多重チャネルの基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行い（３０５）、マルチプレクシングされた音声信号が少なくても一つのスピーカーを通じて出力されるようにする（３０６）。

少なくとも一つの抽出信号を復元する構成を、図７を参照して具体的に説明する。

図７の（ａ）に示されたように、抽出信号を受信すると、図７の（ｂ）に示されたように、基準音声信号に抽出信号の情報のうちパワー係数を適用させて、追加信号を生成し、生成された追加信号を抽出信号に合算する。次に、図７の（ｃ）に示されたように、同期係数を用いて音声信号をシフトさせて、同期を復元する。

このように、多チャネルの音声信号を圧縮する前に、基準音声信号を基準に残りの音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができ、復元が容易である。

１００音声信号送信装置
１１０収集部
１２０抽出部
１３０圧縮部
１４０送信部
２００音声信号受信装置
２１０受信部
２２０復元部
２３０マルチプレクシング部
２４０出力部
２５０スピーカー

Claims

複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と、
多チャネルの音声信号のパワーをそれぞれ算出し、前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と、
前記基準音声信号に基づいて、前記基準音声信号以外の音声信号の同期を調節する同期調節部と、
前記同期が調節された前記基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と、
前記基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と、
前記圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と、を含み、
前記パワー算出部は、前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
前記信号生成部は、前記基準音声信号以外の音声信号に対応するパワー係数を前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する、
音声信号送信装置。
前記パワー算出部は、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する、請求項１に記載の音声信号送信装置。
前記信号生成部は、
前記基準音声信号以外の音声信号のパワーから前記基準音声信号のパワーをそれぞれ差し引いて相殺させる、請求項１に記載の音声信号送信装置。
前記信号圧縮部は、
それぞれの抽出信号別に前記基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する、請求項１に記載の音声信号送信装置。
前記同期調節部は、
前記基準音声信号が収集されたマイクロホンと前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項１に記載の音声信号送信装置。
前記同期調節部は、
前記複数のマイクロホン間の相関関係を用いて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項１に記載の音声信号送信装置。
複数のマイクロホンから音源信号を収集し、
前記収集された音源信号から音声信号をそれぞれ抽出し、
多チャネルの音声信号のパワーをそれぞれ算出し、
前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、
前記基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、
前記同期が調節された基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、
前記基準音声信号とそれぞれの抽出信号を圧縮し、
前記圧縮された基準音声信号とそれぞれの抽出信号を送信し、
前記抽出信号をそれぞれ生成することは、
前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
前記基準音声信号以外の音声信号に対応するパワー係数を、前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、
前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成することを含む、
音声信号送信方法。
前記基準音声信号に設定するのは、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む、請求項７に記載の音声信号送信方法。
前記基準音声信号とそれぞれの抽出信号を圧縮するのは、
それぞれの抽出信号別に前記基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、前記自身のマイクロホン情報、前記自身のパワー係数及び前記自身の同期係数をそれぞれ圧縮することを含む、請求項７に記載の音声信号送信方法。
前記基準音声信号以外の音声信号の同期を調節するのは、
前記基準音声信号が収集されたマイクロホンと、前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、
それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節することを含む、請求項９に記載の音声信号送信方法。