[go: up one dir, main page]

JP6267860B2 - 音声信号送信装置、音声信号受信装置及びその方法 - Google Patents

音声信号送信装置、音声信号受信装置及びその方法 Download PDF

Info

Publication number
JP6267860B2
JP6267860B2 JP2012254133A JP2012254133A JP6267860B2 JP 6267860 B2 JP6267860 B2 JP 6267860B2 JP 2012254133 A JP2012254133 A JP 2012254133A JP 2012254133 A JP2012254133 A JP 2012254133A JP 6267860 B2 JP6267860 B2 JP 6267860B2
Authority
JP
Japan
Prior art keywords
audio signal
signal
power
synchronization
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012254133A
Other languages
English (en)
Other versions
JP2013114264A (ja
Inventor
炳 權 崔
炳 權 崔
寧 道 權
寧 道 權
桐 秀 金
桐 秀 金
慶 植 盧
慶 植 盧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120017252A external-priority patent/KR101970589B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2013114264A publication Critical patent/JP2013114264A/ja
Application granted granted Critical
Publication of JP6267860B2 publication Critical patent/JP6267860B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本発明は、音声信号を圧縮して送信し、受信した音声信号を復元する音声信号送信装置、音声信号受信装置及びその方法に関するものである。
一般に音声信号送信装置は、音声信号が音源によって励振された共鳴系の出力と見なされることに着眼して、音声信号を音源及び共鳴系の特性を示す複数のパラメータに分解して伝送し、音声信号受信装置は、これらパラメータによって元の音声信号を合成する。
音声信号送信装置及び音声信号受信装置は、フレーム単位で音声信号をエンコーディング及びデコーディングするコーデックを含み、このようなコーデックのうち、例えば、G.729コーデックは、フレーム部からフレームの入力を受けて、10ms単位で音声信号のエンコーディング及びデコーディングを行う。
ここで、フレーム部は、外部から8kHzで連続的に伝送される各サンプルを10ms単位に分割し、このように分割された一つのフレームの80個のサンプルをG.729コーデックに入力信号として提供する。
このようなG.729コーデックは、DSP(Digital Signal Processor)を用いて実現されることもできる。
この場合、DSPのメモリ構造は、処理するチャネル数に対応する実行コードを生成して格納するコード部と、プログラム活用空間として、広域変数、各チャネルバッファスタックなどを格納するデータ部と、からなる。
このようなコーデックでは、DSPの処理能力によって、実現可能なチャネルの数が決定され、DSPで処理できるチャネルの数が増加する場合には、チャネル数に対応する実行コードを生成しなければならないので、必要なメモリの量も増加することになる。
また、多チャネルの音声信号圧縮の際に損失圧縮データが必要とされる場合や、性能を最大化するために無損失データが必要とされる場合、マイクロホンの数だけ伝送しようとする音声データの信号の量が大きくなる。
さらに、多チャネルマイクロホンを通じて音声信号を収集するとき、マイクロホン間の位置や特性によって音声信号の同期が取れず、音声信号間のパワーが相違するため、圧縮が容易ではなく、圧縮効率が低いという問題がある。
一側面は、複数のマイクロホン間の相関関係を用いて、多チャネル音声信号のパワー及び同期を調節した後、圧縮して送信する音声信号送信装置及びその方法を提供する。
他の側面は、受信した音声信号を、パワー係数及び同期係数を用いて復元する音声信号受信装置及びその方法を提供する。
一側面に係る音声信号送信装置は、複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と;多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と;基準音声信号に基づいて、基準音声信号以外の音声信号の同期を調節する同期調節部と;同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と;基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と;圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と;を含む。信号圧縮部は、圧縮した基準音声信号とそれぞれの抽出信号を、暗号化してもよい。
パワー算出部は、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する。パワー算出部は、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出する。
信号生成部は、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成する。
信号生成部は、基準音声信号以外の音声信号のパワーから基準音声信号のパワーをそれぞれ差し引いて相殺させる。信号圧縮部は、それぞれの抽出信号別に基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する。
同期調節部は、基準音声信号が収集されたマイクロホンと基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節する。同期調節部は、複数のマイクロホン間の相関関係を用いて、基準音声信号以外の音声信号の同期をそれぞれ調節する。
他の側面に係る音声信号受信装置は、多チャネルの信号を受信する受信部と;受信した多チャネルの信号を基準音声信号と少なくとも一つの抽出信号に復号化する復号化部と;復号化された少なくとも一つの抽出信号のパワーを復元して、音声信号に復元するパワー復元部と;パワーが復元された少なくとも一つの音声信号の同期を復元する同期復元部と;基準音声信号と、パワー及び同期が復元された少なくとも一つの音声信号をマルチプレクシングするマルチプレクシング部と;マルチプレクシングされた音声信号を出力する出力部と;を含む。
受信部は、受信した信号から基準音声信号と少なくとも一つの抽出信号を復号化部に伝達し、少なくとも一つの抽出信号の情報をパワー復元部及び同期復元部に伝達する。
復号化部は、受信した多チャネルの信号のヘッダをパーシング(parsing)して、基準音声信号と抽出信号とを区分する。
少なくとも一つの抽出信号の情報は、基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む。
パワー復元部は、パワー係数を用いて、抽出信号のパワーを復元して、音声信号に復元する。同期復元部は、パワーが復元された音声信号の同期を、同期係数を用いて復元する。
また他の側面に係る音声信号送信方法は、複数のマイクロホンから音源信号を収集し、収集された音源信号から音声信号をそれぞれ抽出し、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、同期が調節された基準音声信号以外の音声信号から基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、基準音声信号とそれぞれの抽出信号を圧縮し、圧縮された基準音声信号とそれぞれの抽出信号を送信する。送信前に、圧縮された基準音声信号とそれぞれの抽出信号を暗号化してもよい。
基準音声信号に設定するのは、多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む。
抽出信号をそれぞれ生成するのは、基準音声信号以外の音声信号のパワーのそれぞれと、基準音声信号のパワーとの割合に基づいて、基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、基準音声信号以外の音声信号に対応するパワー係数を基準音声信号にそれぞれ反映して、基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、基準音声信号以外の音声信号からそれぞれ対応する相殺信号を相殺させて、抽出信号をそれぞれ生成することを含む。
基準音声信号とそれぞれの抽出信号を圧縮するのは、それぞれの抽出信号別に基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、自身のマイクロホン情報、自身のパワー係数及び自身の同期係数をそれぞれ圧縮することを含む。
基準音声信号以外の音声信号の同期を調節するのは、基準音声信号が収集されたマイクロホンと、基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、基準音声信号以外の音声信号の同期をそれぞれ調節することを含む。
また他の側面に係る音声信号受信方法は、多チャネルの信号を受信し、受信した多チャネルの信号を復号化して、基準音声信号、少なくとも一つの抽出信号及び少なくとも一つの抽出信号の情報を生成し、少なくとも一つの抽出信号の情報に基づいて、少なくとも一つの抽出信号のパワー及び同期を復元する。
また他の側面に係る音声信号受信方法は、基準音声信号とパワー及び同期が復元された少なくとも一つの音声信号とをマルチプレクシングし、マルチプレクシングされた音声信号を出力することをさらに含む。
少なくとも一つの抽出信号の情報は、基準音声信号が収集されたマイクロホンの情報、自身のマイクロホン情報、パワー係数及び同期係数を含む。
パワーを復元するのは、パワー係数を用いて、抽出信号のパワーを復元することを含む。同期を復元するのは、同期係数を用いて、パワーが復元された音声信号の同期を復元することを含む。パワー係数は、基準音声信号のパワーと少なくとも一つの音声信号のパワーとの割合である。
一側面によれば、多チャネルの音声信号を圧縮する前に、基準音声信号を基準として基準音声信号以外の音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができる。
また、無損失圧縮を基準に1%乃至3%の圧縮効率を得ることができる。
一実施例に係る音声信号送信装置及び音声信号受信装置の構成図である。 一実施例に係る音声信号送信装置の詳細構成図である。 一実施例に係る音声信号受信装置の詳細構成図である。 一実施例に係る音声信号送信方法のフローチャートである。 一実施例に係る音声信号送信の前の抽出信号生成の例示図である。 一実施例に係る音声信号受信方法のフローチャートである。 一実施例に係る音声信号受信の後の音声信号復元の例示図である。
以下では、添付の図面を参照して、本発明について詳細に説明する。
図1は、一実施例に係る音声信号送信装置及び音声信号受信装置の構成図で、図2は、一実施例に係る音声信号送信装置の詳細構成図で、図3は、一実施例に係る音声信号受信装置の詳細構成図である。
音声信号送信装置100と音声信号受信装置200は、互いに異なる端末機内に位置可能であり、互いに異なる端末機内で、ネットワークを介して、モニタリング及び音声認識などのための音声信号を送受信する。
例えば、多チャネルマイクを有したロボット(端末)で音声信号の入力を受けて、多チャネル音声信号を処理するための遠隔地のベースステーション(Base Station)と遠隔クライアント(Remote Client)に送る。
この時、音声信号送信装置100は、音声信号送受信の際の円滑な音声信号の送受信のために、音声信号を圧縮して伝送し、音声信号受信装置200は、圧縮された音声信号を受信して、圧縮された音声信号を復元する。
すなわち、音声信号送信装置100は、音源を収集し、収集された音源から音声信号を抽出した後、抽出された音声信号を圧縮及び必要に応じて暗号化して音声信号受信装置200に伝送する。
そして、音声信号受信装置200は、圧縮及び必要に応じて暗号化された音声信号を受信すると、受信した音声信号の復号化及び復元を行い、復号化及び復元された音声信号を外部に出力する。
図1に示すように、音声信号送信装置100は、収集部110、抽出部120、圧縮部130及び送信部140を含む。収集部110は、互いに一定間隔を置いて設けられた複数のマイクロホン111〜114を含む。ここで、複数のマイクロホン111〜114は、音波または超音波を受けて、その振動による電気信号を発生する装置であって、ここでの電気信号は音源信号である。
複数のマイクロホン間の一定間隔は予め格納されており、複数のマイクロホン間の位置情報が予め格納されていることも可能である。このような複数のマイクロホン111〜114は、周辺の音源を収集し、収集された音源の信号を抽出部120に伝送する。抽出部120は、複数のマイクロホン111〜114を介して伝達された多チャネルの音源信号から音声信号を抽出する。圧縮部130は、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号と残りの音声信号(すなわち多チャネルの音声信号のうちの基準音声信号以外の音声信号)との相関関係に基づいて、残りの音声信号の容量を減少させ、基準音声信号と容量が減少された残りの音声信号の圧縮及び必要に応じて暗号化を行う。
送信部140は、圧縮及び必要に応じて暗号化された基準音声信号と、変化された残りの音声信号を、音声信号受信装置200に送信する。
図2を参照して、圧縮部130をより具体的に説明する。圧縮部130は、パワー算出部131、同期調節部132、信号生成部133及び信号圧縮部134を含む。パワー算出部131は、多チャネルの音声信号のパワーをそれぞれ算出し、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定し、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。ここで、基準音声信号は、例えば、多チャネルの音声信号のうち、パワーが最も大きい音声信号である。
例えば、第1マイクロホンから収集された第1音声信号、第2マイクロホンから収集された第2音声信号、第3マイクロホンから収集された第3音声信号、第4マイクロホンから収集された第4音声信号が存在する場合、第1音声信号、第2音声信号、第3音声信号、第4音声信号のパワーを算出し、このうちパワーが最も大きい音声信号を基準音声信号に設定する。
さらに、基準音声信号は、基準マイクロホンを予め設定し、該基準マイクロホンから収集された音声信号を基準音声信号に設定することも可能で、パワーが最も小さい音声信号を基準音声信号に設定することも可能である。
ここで、パワー算出は、例えば、平均二乗パワー(Mean Square Power)を用いて算出する。この時、第1音声信号が基準音声信号だと仮定すると、第1音声信号に対する第1パワー係数は1になり、第2音声信号に対する第2パワー係数は、基準音声信号のパワーと第2音声信号のパワーとの割合になり、第3音声信号に対する第3パワー係数は、基準音声信号のパワーと第3音声信号のパワーとの割合になり、第4音声信号に対する第4パワー係数は、基準音声信号のパワーと第4音声信号のパワーとの割合になる。
パワー算出部131は、マイクロホンの音声信号、基準音声信号及び残りの音声信号のパワー係数を伝達する。
同期調節部132は、基準音声信号に基づいて残りの音声信号の同期を調節する(すなわち、基準音声信号と、基準音声信号以外の音声信号とを同期させる)。同期調節部132は、各音声信号の間の相関関係(correlation)を用いて同期を合せる。
さらに、それぞれ音声信号間の差を用いて最小差値を算出し、これを用いて同期係数を算出してもよく、マイクロホン間の距離に基づいて同期係数を算出してもよい。
同期調節部132は、基準音声信号が収集されたマイクロホンを基準として同期テーブルを作り、該同期テーブルに基づいて残りの音声信号の同期を調節する。
信号生成部133は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数を用いて、基準音声信号を変化させたものである。
例えば、第2音声信号から基準音声信号を相殺させようとするとき、基準音声信号と第2音声信号のパワーが異なると、第2パワー係数を用いて基準音声信号のパワーを調節することによって、基準音声信号のパワーが第2音声信号のパワーに対応するようにする。このような過程によって基準音声信号のパワーが調節された相殺信号を、第2音声信号から差し引いて抽出信号を獲得する。
すなわち、信号生成部133は、残りの音声信号から各相殺信号を差し引いて、新しい信号を生成する。ここで、新しい信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号であって、すなわち、抽出信号という。
信号圧縮部134は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮及び必要に応じて暗号化する。この時、それぞれのチャネル別に自身の抽出信号と情報を伝送し、この時、情報には基準音声信号が収集された基準マイクロホンの情報、自身のマイクロホン情報、自身のパワー係数、自身の同期係数などがあり、各情報を集めて、一つのパケットで伝達する。
図1に示すように、音声信号受信装置200は、受信部210、復元部220、マルチプレクシング部230、出力部240及び複数のスピーカー250(251、252)を含む。受信部210は、音声信号送信装置100から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し、受信した基準音声信号と少なくとも一つの抽出信号を復号化部221に伝送し、受信した抽出信号の情報をパワー復元部222及び同期復元部223に伝送する。
復元部220は、圧縮された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された一つの抽出信号のパワー及び同期を復元して、少なくとも一つの音声信号を生成する。
マルチプレクシング部230は、多重チャネルの音声信号を、一つのチャネルを介して同時に伝達する。すなわち、マルチプレクシング部230は、基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行う。出力部240は、マルチプレクシングされた音声信号が出力されるようにする。このような出力部240は、デジタルの音声信号をアナログの音声信号に変換させ、変換されたアナログの音声信号を増幅することも可能である。
スピーカー250(251、252)は、電気信号を振動板の振動に変え、空気に疎密波を発生させて、音波を放射する装置であって、ここで、電気信号は復元された音声信号である。
図3を参照して、復元部220をより具体的に説明する。復元部220は、復号化部221、パワー復元部222、同期復元部223を含む。復号化部221は、受信部210から伝達された多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍する。
パワー復元部222は、受信部210から伝達された抽出信号の情報のうち、パワー係数を用いて、少なくとも一つの抽出信号のパワーを復元して、音声信号に復元する。この時、基準音声信号にパワー係数を適用して、追加信号を生成させて、少なくとも一つの音声信号に追加信号を合算して、音声信号に復元する。
同期復元部223は、受信部210から伝達された抽出信号の情報のうち、同期係数を用いて、少なくとも一つの音声信号の同期を復元する。この時、少なくとも一つの音声信号は、最初シフトされた同期係数だけ移動する。
図4は、一実施例に係る音声送信方法のフローチャートであって、図5を参照して説明する。まず、音声信号送信装置は、互いに一定間隔を置いて設けられた複数のマイクロホン111〜114を通じて周辺の音源信号を収集する(201)。次に、音声信号送信装置は、多チャネルの音源信号から音声信号をそれぞれ抽出し(202)、多チャネルの音声信号のパワーをそれぞれ算出し(203)、多チャネルの音声信号のうちいずれか一つのチャネルの音声信号を基準音声信号に設定する(204)。次に、音源信号送信装置は、基準音声信号のパワーと残りの音声信号のパワーとの間の割合に基づいて、パワー係数をそれぞれ算出する。
例えば、p1が基準音声信号のパワー係数であれば、それぞれのパワー係数p2、p3、p4は、次の通りである。
第2音声信号のパワー係数p2=第2音声信号のパワー/基準音声信号のパワー
第3音声信号のパワー係数p3=第3音声信号のパワー/基準音声信号のパワー
第4音声信号のパワー係数p4=第4音声信号のパワー/基準音声信号のパワー
ここで、各音声信号のパワーは、平均二乗パワー(Mean Square Power)を用いて算出した値で、各音声信号のパワーは整数で表現する。
次に、音声信号送信装置は、各音声信号の間の相関関係を用いて同期を合せる。このとき、基準音声信号を基準として、残りの音声信号の同期を調節する(205)。ここで、同期とは、マイクロホンの距離によるディレイ時間を合せるためのものである。
この同期係数は、最小差値や相関関係を用いて求め、求められた同期係数によって周期的同期(Cyclic Sync)を合せる。この時、同期係数によって調節された音声信号のうち、同期調節によって除去された最初の音声信号は最後の信号に連結する。
実際に測定値を求めてみると、線形マイクロホンにおいて正面での信号は同期0であり、側面のマイクロホンや円形マイクロホンの同期は、解像度によって異なるが、正面のマイクロホンの同期よりも小さい係数を有する。
マイクロホンが4つである状態で、第1音声信号が基準音声信号である場合、残りの音声信号の同期調節された信号は、次の通りである。
同期調節された第2音声信号=第2音声信号+s2(cyclic)
同期調節された第3音声信号=第3音声信号+s3(cyclic)
同期調節された第4音声信号=第4音声信号+s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。次に、音声信号送信装置は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数に基づいて、基準音声信号を変化させたものである。
次に、音声信号送信装置は、残りの音声信号から各相殺信号を差し引いて、新しい抽出信号をそれぞれ生成する(206)。ここで、新しい抽出信号は、残りの音声信号から相殺信号を差し引いた後抽出された信号である。
例えば、マイクロホンが4つである状態で、第1音声信号が基準音声信号である場合、残りの音声信号に対応する抽出信号を生成する過程は、次の通りである。
第2抽出信号=同期調節された第2音声信号−(第2パワー係数*基準音声信号)
第3抽出信号=同期調節された第3音声信号−(第3パワー係数*基準音声信号)
第4抽出信号=同期調節された第4音声信号−(第4パワー係数*基準音声信号)
次に、音声信号送信装置は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮する(207)。音声信号送信装置は、圧縮する前に、圧縮と同時に、または圧縮後に、基準音声信号とそれぞれの抽出信号をさらに暗号化してもよい。この時、基準音声信号、それぞれの抽出信号、各抽出信号の情報を共に圧縮する。ここで、抽出信号の情報は、自身のマイクロホン番号、基準音声データが収集されたマイクロホン番号、パワー係数、同期係数を含み、これを一つのパケットで伝送する。
また、基準音声信号と自身のマイクロホン番号と自身のパワー係数、同期係数を共に伝送する。
次に、音声信号送信装置は、圧縮された基準音声信号と各抽出信号を、音声信号受信装置200に送信する(208)。ここで、抽出信号の生成を、図5を参照して、より具体的に説明する。
第1チャネル(CH1)のマイクロホンを通じて第1音声信号を収集し、また、第2チャネル(CH2)のマイクロホンを通じて第2音声信号を収集する。
ここで、第1チャネル(CH1)のマイクロホンを通じて収集された第1音声信号は、図5の(a)に示されたようであり、第2チャネル(CH2)のマイクロホンを通じて収集された第2音声信号は、図5の(b)に示されたようである。
次に、第1音声信号のパワーと第2音声信号のパワーを算出する。ここで、各音声信号のパワーは、平均二乗パワー(Mean Square Power)を用いて算出する値であって、整数で表現する。この時、第1音声信号のパワーは、次の通りである。
Figure 0006267860
第2音声信号のパワーは、次の通りである。
Figure 0006267860
第1音声信号のパワーは7であり、第2音声信号のパワーは5で、第1音声信号のパワーより第2音声信号のパワーが小さいので、第1音声信号を基準音声信号に設定し、第2チャネル(CH2)のマイクロホンを通じて収集された第2音声信号を抽出信号に変化させる。
まず、図5の(c)に示されたように、基準音声信号を基準に第2音声信号の同期を調節する。すなわち、基準音声信号と第2音声信号の波形が最大限一致するようにするために、第2音声信号を1/4周期だけ左側にシフトする。
次に、パワー係数を算出する。このとき、パワー係数は、基準音声信号のパワーと第2音声信号のパワーとの割合で、5/7である。次に、図5(a)に示された第1チャネル(CH1)信号である基準音声信号の各値に5/7を適用して、相殺信号を生成する。ここで、相殺信号は整数で表現可能である。図5(d)に示されたように、相殺信号は、0、7、0、−7、0、7、0、−7、0の値を有する。
即ち、基準音声信号と第2音声信号との間のパワーが異なると、基準音声信号のパワーが第2音声信号のパワーに対応するように、基準音声信号にパワー係数を適用して、基準音声信号の各値を調節する。この時、パワー係数によって各値が調節された基準音声信号は、相殺信号になる。
次に、図5の(e)に示されたように、同期調節された第2音声信号から相殺信号を差し引いて、抽出信号を生成する。この時、抽出信号は、1(=1−0)、0(=7−7)、−1(=−1−0)、1(=−6−(−7))、2(=2−0)、−2(=5−7)、1(=−1−0)、0(=−7−(−7))、−8(=−8−0)の値を有する。
図6は、一実施例に係る音声信号受信方法のフローチャートであって、図7を参照して説明する。音声信号受信装置は、音声信号送信装置100から伝送された多チャネルの基準音声信号、少なくとも一つの抽出信号及び抽出信号の情報を受信し(301)、受信した多チャネルの基準音声信号と少なくとも一つの抽出信号の圧縮を解凍し、圧縮が解凍された基準音声信号と少なくとも一つの抽出信号を復号化する(302)。この時、多チャネルの基準音声信号と、少なくとも一つの抽出信号、抽出信号の情報が生成される。
さらに、音声信号受信装置は、受信した信号のヘッダをパーシングして、基準音声信号と抽出信号を判別する。そして、基準音声信号は、圧縮を解凍した後マルチプレクシング部にそのまま送って処理する。
次に、音声信号受信装置は、抽出信号の情報のうちパワー係数を用いて、少なくとも一つの抽出信号のパワーを復元することで(303)、少なくとも一つの音声信号に生成し、抽出信号の情報のうち同期係数を用いて、パワーが復元された少なくとも一つの音声信号の同期を復元することで(304)、最初音声信号に復元されるようにする。この時、少なくとも一つの音声信号は、音声信号送信装置100で最初シフトされた同期係数だけ移動する。
例えば、4つのマイクロホンを通じて音源を収集した場合、第1音声信号が基準信号であれば、第2、3、4音声信号に対応した抽出信号のパワー復元信号と同期復元信号は、次の通りである。
第2パワー復元信号=第2抽出信号+第2パワー係数*基準マイク信号
第3パワー復元信号=第3抽出信号+第3パワー係数*基準マイク信号
第4パワー復元信号=第4抽出信号+第4パワー係数*基準マイク信号
第2同期復元信号=第2パワー復元信号−s2(cyclic)
第3同期復元信号=第3パワー復元信号−s3(cyclic)
第4同期復元信号=第4パワー復元信号−s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。
次に、音声信号受信装置は、多重チャネルの基準音声信号と、少なくとも一つの音声信号のマルチプレクシングを行い(305)、マルチプレクシングされた音声信号が少なくても一つのスピーカーを通じて出力されるようにする(306)。
少なくとも一つの抽出信号を復元する構成を、図7を参照して具体的に説明する。
図7の(a)に示されたように、抽出信号を受信すると、図7の(b)に示されたように、基準音声信号に抽出信号の情報のうちパワー係数を適用させて、追加信号を生成し、生成された追加信号を抽出信号に合算する。次に、図7の(c)に示されたように、同期係数を用いて音声信号をシフトさせて、同期を復元する。
このように、多チャネルの音声信号を圧縮する前に、基準音声信号を基準に残りの音声信号の容量を減少させて、圧縮効率を高めることができ、時間も減らすことができ、復元が容易である。
100 音声信号送信装置
110 収集部
120 抽出部
130 圧縮部
140 送信部
200 音声信号受信装置
210 受信部
220 復元部
230 マルチプレクシング部
240 出力部
250 スピーカー

Claims (10)

  1. 複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と、
    多チャネルの音声信号のパワーをそれぞれ算出し、前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と、
    前記基準音声信号に基づいて、前記基準音声信号以外の音声信号の同期を調節する同期調節部と、
    前記同期が調節された前記基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と、
    前記基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と、
    前記圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と、を含み、
    前記パワー算出部は、前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
    前記信号生成部は、前記基準音声信号以外の音声信号に対応するパワー係数を前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する、
    音声信号送信装置。
  2. 前記パワー算出部は、
    前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する、請求項1に記載の音声信号送信装置。
  3. 前記信号生成部は、
    前記基準音声信号以外の音声信号のパワーから前記基準音声信号のパワーをそれぞれ差し引いて相殺させる、請求項1に記載の音声信号送信装置。
  4. 前記信号圧縮部は、
    それぞれの抽出信号別に前記基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する、請求項1に記載の音声信号送信装置。
  5. 前記同期調節部は、
    前記基準音声信号が収集されたマイクロホンと前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。
  6. 前記同期調節部は、
    前記複数のマイクロホン間の相関関係を用いて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。
  7. 複数のマイクロホンから音源信号を収集し、
    前記収集された音源信号から音声信号をそれぞれ抽出し、
    多チャネルの音声信号のパワーをそれぞれ算出し、
    前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、
    前記基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、
    前記同期が調節された基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、
    前記基準音声信号とそれぞれの抽出信号を圧縮し、
    前記圧縮された基準音声信号とそれぞれの抽出信号を送信し、
    前記抽出信号をそれぞれ生成することは、
    前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
    前記基準音声信号以外の音声信号に対応するパワー係数を、前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、
    前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成することを含む、
    音声信号送信方法。
  8. 前記基準音声信号に設定するのは、
    前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む、請求項に記載の音声信号送信方法。
  9. 前記基準音声信号とそれぞれの抽出信号を圧縮するのは、
    それぞれの抽出信号別に前記基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、前記自身のマイクロホン情報、前記自身のパワー係数及び前記自身の同期係数をそれぞれ圧縮することを含む、請求項に記載の音声信号送信方法。
  10. 前記基準音声信号以外の音声信号の同期を調節するのは、
    前記基準音声信号が収集されたマイクロホンと、前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、
    それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節することを含む、請求項に記載の音声信号送信方法。
JP2012254133A 2011-11-28 2012-11-20 音声信号送信装置、音声信号受信装置及びその方法 Active JP6267860B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2011-0124933 2011-11-28
KR20110124933 2011-11-28
KR10-2012-0017252 2012-02-21
KR1020120017252A KR101970589B1 (ko) 2011-11-28 2012-02-21 음성 신호 송신 장치, 음성 신호 수신 장치 및 그 방법

Publications (2)

Publication Number Publication Date
JP2013114264A JP2013114264A (ja) 2013-06-10
JP6267860B2 true JP6267860B2 (ja) 2018-01-24

Family

ID=47623800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012254133A Active JP6267860B2 (ja) 2011-11-28 2012-11-20 音声信号送信装置、音声信号受信装置及びその方法

Country Status (3)

Country Link
US (1) US9058804B2 (ja)
EP (1) EP2597640B1 (ja)
JP (1) JP6267860B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014170531A1 (en) * 2013-04-16 2014-10-23 Nokia Corporation Signal transmission
KR102280692B1 (ko) * 2019-08-12 2021-07-22 엘지전자 주식회사 지능적 음성 인식 방법, 음성 인식 장치 및 지능형 컴퓨팅 디바이스
KR20220017775A (ko) * 2020-08-05 2022-02-14 삼성전자주식회사 오디오 신호 처리 장치 및 그 동작 방법

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3343962B2 (ja) 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
BR9607605A (pt) 1995-02-28 1998-06-09 Motorola Inc Método de compressão de voz e aparelho em um sistema de comunicação
AUPR647501A0 (en) * 2001-07-19 2001-08-09 Vast Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
JP4195267B2 (ja) * 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
CN101807403B (zh) * 2004-07-02 2012-11-21 日本电信电话株式会社 多信道信号编码方法、解码方法、装置
US7426464B2 (en) * 2004-07-15 2008-09-16 Bitwave Pte Ltd. Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition
BRPI0516658A (pt) * 2004-11-30 2008-09-16 Matsushita Electric Ind Co Ltd aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos
JP4225430B2 (ja) * 2005-08-11 2009-02-18 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
US8139787B2 (en) * 2005-09-09 2012-03-20 Simon Haykin Method and device for binaural signal enhancement
WO2007127182A2 (en) * 2006-04-25 2007-11-08 Incel Vision Inc. Noise reduction system and method
JP4714075B2 (ja) * 2006-05-11 2011-06-29 日本電信電話株式会社 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体
ATE542216T1 (de) * 2006-07-07 2012-02-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zum kombinieren mehrerer parametrisch kodierter audioquellen
KR100917845B1 (ko) 2006-12-04 2009-09-18 한국전자통신연구원 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
JP4455614B2 (ja) * 2007-06-13 2010-04-21 株式会社東芝 音響信号処理方法及び装置
US8612220B2 (en) * 2007-07-03 2013-12-17 France Telecom Quantization after linear transformation combining the audio signals of a sound scene, and related coder
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8332229B2 (en) * 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
FR2945696B1 (fr) * 2009-05-14 2012-02-24 Parrot Procede de selection d'un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu'un dispositif telephonique "mains libres" operant dans un environnement bruite.
US8638951B2 (en) * 2010-07-15 2014-01-28 Motorola Mobility Llc Electronic apparatus for generating modified wideband audio signals based on two or more wideband microphone signals
CN102376309B (zh) * 2010-08-17 2013-12-04 骅讯电子企业股份有限公司 降低环境噪音的系统、方法与应用的装置
US8898058B2 (en) * 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
KR101726737B1 (ko) * 2010-12-14 2017-04-13 삼성전자주식회사 다채널 음원 분리 장치 및 그 방법
US10230346B2 (en) * 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
EP2509337B1 (en) * 2011-04-06 2014-09-24 Sony Ericsson Mobile Communications AB Accelerometer vector controlled noise cancelling method
US8972251B2 (en) * 2011-06-07 2015-03-03 Qualcomm Incorporated Generating a masking signal on an electronic device
US9002027B2 (en) * 2011-06-27 2015-04-07 Gentex Corporation Space-time noise reduction system for use in a vehicle and method of forming same
GB2493327B (en) * 2011-07-05 2018-06-06 Skype Processing audio signals
US8751220B2 (en) * 2011-11-07 2014-06-10 Broadcom Corporation Multiple microphone based low complexity pitch detector

Also Published As

Publication number Publication date
US9058804B2 (en) 2015-06-16
EP2597640A2 (en) 2013-05-29
US20130138431A1 (en) 2013-05-30
JP2013114264A (ja) 2013-06-10
EP2597640A3 (en) 2013-12-18
EP2597640B1 (en) 2014-12-31

Similar Documents

Publication Publication Date Title
DK2211339T3 (en) listening System
AU2009202121B2 (en) Low latency, high quality link for audio transmission
EP2685700B1 (en) Synchronizing audio signal sampling in a wireless, digital audio conferencing system
EP2612322B1 (en) Method and device for decoding a multichannel audio signal
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
DK3116239T3 (en) PROCEDURE FOR CHOOSING THE TRANSFER DIRECTION IN A BINAURAL HEARING
US12328692B2 (en) Synchronization of audio streams and sampling rate for wireless communication
US20190246012A1 (en) System and method for synchronizing audio and video signals for a listening system
US20110112843A1 (en) Signal analyzing device, signal control device, and method and program therefor
JP6267860B2 (ja) 音声信号送信装置、音声信号受信装置及びその方法
JP2019512739A (ja) 入力信号を処理する符号化装置及び符号化信号を処理する復号化装置
KR101970589B1 (ko) 음성 신호 송신 장치, 음성 신호 수신 장치 및 그 방법
CN1918631B (zh) 音频编码设备、方法和音频解码设备、方法
WO2010098120A1 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
US11696075B2 (en) Optimized audio forwarding
US20100002888A1 (en) Method and device for low-delay joint-stereo coding
JP2010166425A (ja) 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法
WO2010134355A1 (ja) 符号化装置、復号装置、およびこれらの方法
CN114727263A (zh) 用于两个装置之间的无线通信的方法、听力仪器系统、介质
KR101607334B1 (ko) 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱
US8117029B2 (en) Method and apparatus for matching sound quality measurement sections of variable bandwidth multi-codec
WO2010134332A1 (ja) 符号化装置、復号装置、およびこれらの方法
JP6343171B2 (ja) 受信装置
JP5741064B2 (ja) 映像音声処理装置および映像音声処理方法
Smyth A lossless/near-lossless audio codec for low latency streaming applications on embedded devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171128

R150 Certificate of patent or registration of utility model

Ref document number: 6267860

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250