JP6267860B2 - 音声信号送信装置、音声信号受信装置及びその方法 - Google Patents
音声信号送信装置、音声信号受信装置及びその方法 Download PDFInfo
- Publication number
- JP6267860B2 JP6267860B2 JP2012254133A JP2012254133A JP6267860B2 JP 6267860 B2 JP6267860 B2 JP 6267860B2 JP 2012254133 A JP2012254133 A JP 2012254133A JP 2012254133 A JP2012254133 A JP 2012254133A JP 6267860 B2 JP6267860 B2 JP 6267860B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- power
- synchronization
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Description
第3音声信号のパワー係数p3=第3音声信号のパワー/基準音声信号のパワー
第4音声信号のパワー係数p4=第4音声信号のパワー/基準音声信号のパワー
ここで、各音声信号のパワーは、平均二乗パワー(Mean Square Power)を用いて算出した値で、各音声信号のパワーは整数で表現する。
同期調節された第3音声信号=第3音声信号+s3(cyclic)
同期調節された第4音声信号=第4音声信号+s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。次に、音声信号送信装置は、基準音声信号に各パワー係数を適用して、相殺信号をそれぞれ生成する。すなわち、相殺信号は、残りの音声信号にそれぞれ対応するパワー係数に基づいて、基準音声信号を変化させたものである。
第3抽出信号=同期調節された第3音声信号−(第3パワー係数*基準音声信号)
第4抽出信号=同期調節された第4音声信号−(第4パワー係数*基準音声信号)
次に、音声信号送信装置は、それぞれのチャネル別に基準音声信号とそれぞれの抽出信号を圧縮する(207)。音声信号送信装置は、圧縮する前に、圧縮と同時に、または圧縮後に、基準音声信号とそれぞれの抽出信号をさらに暗号化してもよい。この時、基準音声信号、それぞれの抽出信号、各抽出信号の情報を共に圧縮する。ここで、抽出信号の情報は、自身のマイクロホン番号、基準音声データが収集されたマイクロホン番号、パワー係数、同期係数を含み、これを一つのパケットで伝送する。
第3パワー復元信号=第3抽出信号+第3パワー係数*基準マイク信号
第4パワー復元信号=第4抽出信号+第4パワー係数*基準マイク信号
第2同期復元信号=第2パワー復元信号−s2(cyclic)
第3同期復元信号=第3パワー復元信号−s3(cyclic)
第4同期復元信号=第4パワー復元信号−s4(cyclic)
ここで、s2、s3、s4は、基準音声信号である第1音声信号に基づいて調節された同期係数である。
110 収集部
120 抽出部
130 圧縮部
140 送信部
200 音声信号受信装置
210 受信部
220 復元部
230 マルチプレクシング部
240 出力部
250 スピーカー
Claims (10)
- 複数のマイクロホンから収集された音源信号から音声信号をそれぞれ抽出する抽出部と、
多チャネルの音声信号のパワーをそれぞれ算出し、前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定するパワー算出部と、
前記基準音声信号に基づいて、前記基準音声信号以外の音声信号の同期を調節する同期調節部と、
前記同期が調節された前記基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する信号生成部と、
前記基準音声信号とそれぞれの抽出信号を圧縮する信号圧縮部と、
前記圧縮された基準音声信号とそれぞれの抽出信号とを送信する送信部と、を含み、
前記パワー算出部は、前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
前記信号生成部は、前記基準音声信号以外の音声信号に対応するパワー係数を前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成する、
音声信号送信装置。 - 前記パワー算出部は、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定する、請求項1に記載の音声信号送信装置。 - 前記信号生成部は、
前記基準音声信号以外の音声信号のパワーから前記基準音声信号のパワーをそれぞれ差し引いて相殺させる、請求項1に記載の音声信号送信装置。 - 前記信号圧縮部は、
それぞれの抽出信号別に前記基準音声信号を収集したマイクロホンの情報、自身の抽出信号、マイクロホン情報、パワー係数及び同期係数をそれぞれ圧縮する、請求項1に記載の音声信号送信装置。 - 前記同期調節部は、
前記基準音声信号が収集されたマイクロホンと前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。 - 前記同期調節部は、
前記複数のマイクロホン間の相関関係を用いて、前記基準音声信号以外の音声信号の同期をそれぞれ調節する、請求項1に記載の音声信号送信装置。 - 複数のマイクロホンから音源信号を収集し、
前記収集された音源信号から音声信号をそれぞれ抽出し、
多チャネルの音声信号のパワーをそれぞれ算出し、
前記多チャネルの音声信号のうちいずれか一つの音声信号を基準音声信号に設定し、
前記基準音声信号に基づいて基準音声信号以外の音声信号の同期を調節し、
前記同期が調節された基準音声信号以外の音声信号から前記基準音声信号をそれぞれ相殺させて、抽出信号をそれぞれ生成し、
前記基準音声信号とそれぞれの抽出信号を圧縮し、
前記圧縮された基準音声信号とそれぞれの抽出信号を送信し、
前記抽出信号をそれぞれ生成することは、
前記基準音声信号以外の音声信号のパワーのそれぞれと、前記基準音声信号のパワーとの割合に基づいて、前記基準音声信号以外の音声信号にそれぞれ対応するパワー係数を算出し、
前記基準音声信号以外の音声信号に対応するパワー係数を、前記基準音声信号にそれぞれ反映して、前記基準音声信号以外の音声信号に対応する相殺信号をそれぞれ生成し、
前記基準音声信号以外の音声信号から前記それぞれ対応する相殺信号をそれぞれ相殺させて、抽出信号をそれぞれ生成することを含む、
音声信号送信方法。 - 前記基準音声信号に設定するのは、
前記多チャネルの音声信号のうち、パワーが最も大きい音声信号を基準音声信号に設定することを含む、請求項7に記載の音声信号送信方法。 - 前記基準音声信号とそれぞれの抽出信号を圧縮するのは、
それぞれの抽出信号別に前記基準音声信号が収集されたマイクロホンの情報、自身の抽出信号、前記自身のマイクロホン情報、前記自身のパワー係数及び前記自身の同期係数をそれぞれ圧縮することを含む、請求項7に記載の音声信号送信方法。 - 前記基準音声信号以外の音声信号の同期を調節するのは、
前記基準音声信号が収集されたマイクロホンと、前記基準音声信号以外の音声信号が収集されたマイクロホンとの距離にそれぞれ基づいて、前記基準音声信号以外の音声信号の同期係数をそれぞれ算出し、
それぞれ算出された同期係数に基づいて、前記基準音声信号以外の音声信号の同期をそれぞれ調節することを含む、請求項9に記載の音声信号送信方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2011-0124933 | 2011-11-28 | ||
KR20110124933 | 2011-11-28 | ||
KR10-2012-0017252 | 2012-02-21 | ||
KR1020120017252A KR101970589B1 (ko) | 2011-11-28 | 2012-02-21 | 음성 신호 송신 장치, 음성 신호 수신 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013114264A JP2013114264A (ja) | 2013-06-10 |
JP6267860B2 true JP6267860B2 (ja) | 2018-01-24 |
Family
ID=47623800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012254133A Active JP6267860B2 (ja) | 2011-11-28 | 2012-11-20 | 音声信号送信装置、音声信号受信装置及びその方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9058804B2 (ja) |
EP (1) | EP2597640B1 (ja) |
JP (1) | JP6267860B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014170531A1 (en) * | 2013-04-16 | 2014-10-23 | Nokia Corporation | Signal transmission |
KR102280692B1 (ko) * | 2019-08-12 | 2021-07-22 | 엘지전자 주식회사 | 지능적 음성 인식 방법, 음성 인식 장치 및 지능형 컴퓨팅 디바이스 |
KR20220017775A (ko) * | 2020-08-05 | 2022-02-14 | 삼성전자주식회사 | 오디오 신호 처리 장치 및 그 동작 방법 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3343962B2 (ja) | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
BR9607605A (pt) | 1995-02-28 | 1998-06-09 | Motorola Inc | Método de compressão de voz e aparelho em um sistema de comunicação |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
JP4195267B2 (ja) * | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
CN101807403B (zh) * | 2004-07-02 | 2012-11-21 | 日本电信电话株式会社 | 多信道信号编码方法、解码方法、装置 |
US7426464B2 (en) * | 2004-07-15 | 2008-09-16 | Bitwave Pte Ltd. | Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition |
BRPI0516658A (pt) * | 2004-11-30 | 2008-09-16 | Matsushita Electric Ind Co Ltd | aparelho de codificação de estéreo, aparelho de decodificação de estéreo e seus métodos |
JP4225430B2 (ja) * | 2005-08-11 | 2009-02-18 | 旭化成株式会社 | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
US8139787B2 (en) * | 2005-09-09 | 2012-03-20 | Simon Haykin | Method and device for binaural signal enhancement |
WO2007127182A2 (en) * | 2006-04-25 | 2007-11-08 | Incel Vision Inc. | Noise reduction system and method |
JP4714075B2 (ja) * | 2006-05-11 | 2011-06-29 | 日本電信電話株式会社 | 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体 |
ATE542216T1 (de) * | 2006-07-07 | 2012-02-15 | Fraunhofer Ges Forschung | Vorrichtung und verfahren zum kombinieren mehrerer parametrisch kodierter audioquellen |
KR100917845B1 (ko) | 2006-12-04 | 2009-09-18 | 한국전자통신연구원 | 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법 |
JP4455614B2 (ja) * | 2007-06-13 | 2010-04-21 | 株式会社東芝 | 音響信号処理方法及び装置 |
US8612220B2 (en) * | 2007-07-03 | 2013-12-17 | France Telecom | Quantization after linear transformation combining the audio signals of a sound scene, and related coder |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
US8332229B2 (en) * | 2008-12-30 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte. Ltd. | Low complexity MPEG encoding for surround sound recordings |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
FR2945696B1 (fr) * | 2009-05-14 | 2012-02-24 | Parrot | Procede de selection d'un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu'un dispositif telephonique "mains libres" operant dans un environnement bruite. |
US8638951B2 (en) * | 2010-07-15 | 2014-01-28 | Motorola Mobility Llc | Electronic apparatus for generating modified wideband audio signals based on two or more wideband microphone signals |
CN102376309B (zh) * | 2010-08-17 | 2013-12-04 | 骅讯电子企业股份有限公司 | 降低环境噪音的系统、方法与应用的装置 |
US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
KR101726737B1 (ko) * | 2010-12-14 | 2017-04-13 | 삼성전자주식회사 | 다채널 음원 분리 장치 및 그 방법 |
US10230346B2 (en) * | 2011-01-10 | 2019-03-12 | Zhinian Jing | Acoustic voice activity detection |
EP2509337B1 (en) * | 2011-04-06 | 2014-09-24 | Sony Ericsson Mobile Communications AB | Accelerometer vector controlled noise cancelling method |
US8972251B2 (en) * | 2011-06-07 | 2015-03-03 | Qualcomm Incorporated | Generating a masking signal on an electronic device |
US9002027B2 (en) * | 2011-06-27 | 2015-04-07 | Gentex Corporation | Space-time noise reduction system for use in a vehicle and method of forming same |
GB2493327B (en) * | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
US8751220B2 (en) * | 2011-11-07 | 2014-06-10 | Broadcom Corporation | Multiple microphone based low complexity pitch detector |
-
2012
- 2012-11-20 JP JP2012254133A patent/JP6267860B2/ja active Active
- 2012-11-22 EP EP20120193761 patent/EP2597640B1/en active Active
- 2012-11-26 US US13/685,221 patent/US9058804B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9058804B2 (en) | 2015-06-16 |
EP2597640A2 (en) | 2013-05-29 |
US20130138431A1 (en) | 2013-05-30 |
JP2013114264A (ja) | 2013-06-10 |
EP2597640A3 (en) | 2013-12-18 |
EP2597640B1 (en) | 2014-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2211339T3 (en) | listening System | |
AU2009202121B2 (en) | Low latency, high quality link for audio transmission | |
EP2685700B1 (en) | Synchronizing audio signal sampling in a wireless, digital audio conferencing system | |
EP2612322B1 (en) | Method and device for decoding a multichannel audio signal | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
DK3116239T3 (en) | PROCEDURE FOR CHOOSING THE TRANSFER DIRECTION IN A BINAURAL HEARING | |
US12328692B2 (en) | Synchronization of audio streams and sampling rate for wireless communication | |
US20190246012A1 (en) | System and method for synchronizing audio and video signals for a listening system | |
US20110112843A1 (en) | Signal analyzing device, signal control device, and method and program therefor | |
JP6267860B2 (ja) | 音声信号送信装置、音声信号受信装置及びその方法 | |
JP2019512739A (ja) | 入力信号を処理する符号化装置及び符号化信号を処理する復号化装置 | |
KR101970589B1 (ko) | 음성 신호 송신 장치, 음성 신호 수신 장치 및 그 방법 | |
CN1918631B (zh) | 音频编码设备、方法和音频解码设备、方法 | |
WO2010098120A1 (ja) | チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法 | |
US11696075B2 (en) | Optimized audio forwarding | |
US20100002888A1 (en) | Method and device for low-delay joint-stereo coding | |
JP2010166425A (ja) | 多地点会議システム、サーバ装置、音声ミキシング装置、及び多地点会議サービス提供方法 | |
WO2010134355A1 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
CN114727263A (zh) | 用于两个装置之间的无线通信的方法、听力仪器系统、介质 | |
KR101607334B1 (ko) | 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱 | |
US8117029B2 (en) | Method and apparatus for matching sound quality measurement sections of variable bandwidth multi-codec | |
WO2010134332A1 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
JP6343171B2 (ja) | 受信装置 | |
JP5741064B2 (ja) | 映像音声処理装置および映像音声処理方法 | |
Smyth | A lossless/near-lossless audio codec for low latency streaming applications on embedded devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6267860 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |