[go: up one dir, main page]

KR100480789B1 - 피드백 구조를 이용한 적응적 빔 형성방법 및 장치 - Google Patents

피드백 구조를 이용한 적응적 빔 형성방법 및 장치 Download PDF

Info

Publication number
KR100480789B1
KR100480789B1 KR10-2003-0003258A KR20030003258A KR100480789B1 KR 100480789 B1 KR100480789 B1 KR 100480789B1 KR 20030003258 A KR20030003258 A KR 20030003258A KR 100480789 B1 KR100480789 B1 KR 100480789B1
Authority
KR
South Korea
Prior art keywords
adaptive
filter
filters
delay time
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR10-2003-0003258A
Other languages
English (en)
Other versions
KR20040066257A (ko
Inventor
최창규
김재우
공동건
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2003-0003258A priority Critical patent/KR100480789B1/ko
Priority to EP04250219A priority patent/EP1439526B1/en
Priority to US10/757,994 priority patent/US7443989B2/en
Priority to JP2004011027A priority patent/JP4166706B2/ja
Publication of KR20040066257A publication Critical patent/KR20040066257A/ko
Application granted granted Critical
Publication of KR100480789B1 publication Critical patent/KR100480789B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

피드백 구조를 이용한 적응적 빔 형성방법 및 장치가 개시된다. 적응적 빔 형성장치는 M(여기서 M은 2 이상) 개의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 M개의 음성신호에 대하여 각각 지연시간을 보상하고, 지연시간이 보상된 M개의 음성신호를 합산하는 고정 빔 형성부, 및 M개의 적응적 제거필터와 피드백 구조로 연결된 M개의 적응적 차단필터를 이용하여 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 순수한 잡음성분을 발생시키고, 상기 M개의 적응적 차단필터와 피드백 구조로 연결된 M개의 적응적 제거필터를 이용하여 상기 고정 빔 형성부의 출력신호로부터 순수한 음성성분을 발생시키는 다중채널 신호분리부를 포함한다.

Description

피드백 구조를 이용한 적응적 빔 형성방법 및 장치 {Method and apparatus for adaptive beamforming using feedback structure}
본 발명은 적응적 빔 형성기에 관한 것으로서, 특히 피드백 구조를 이용한 적응적 빔 형성방법 및 장치에 관한 것이다.
최근 들어 건강, 안전, 홈 네트워크, 엔터테인먼트 등의 필요성에 의해 더욱 더 사람들의 관심을 끌고 있는 이동 로봇을 동작시키기 위해서는 사람과 로봇 간의 상호작용(Human-Robot Interaction)을 필요로 한다. 즉, 이동 로봇은 사람이 하는 것과 마찬가지로 비젼시스템을 가지고 사람을 인식하고 주변 상황을 인지할 수 있어야 하며, 자신의 주위에서 말하는 사람의 위치를 알아야 하고 그 사람이 하는 말을 이해할 수 있어야 한다.
이동 로봇에 있어서 음성 입력시스템은 사람과 로봇 간의 상호작용에 필수적일 뿐만 아니라 자율 주행에도 중요한 이슈가 된다. 실내 환경에서 이동 로봇의 음성 입력시스템에 야기되는 중요한 문제는 잡음, 반향 및 거리이다. 실내 환경에서는 여러가지 잡음원과 벽이나 기타 사물에 의한 반향이 존재한다. 거리에 따라서 음성의 저주파 성분은 고주파 성분에 비하여 더 많이 감쇄되는 특징이 있다. 따라서, 가정의 실내 환경에서 사람과 로봇 간의 상호작용에 필요한 음성 입력시스템은 자율 주행 이동 로봇이 수 미터 떨어진 거리에서 사용자의 평상적인 목소리를 받아들여 음성인식에 직접적으로 사용될 수 있어야 한다.
이러한 음성 입력시스템에서는 음질 및 음성인식율을 향상시키기 위하여 적어도 두개 이상의 마이크로폰으로 이루어진 마이크로폰 어레이를 널리 사용하게 되고, 마이크로폰 어레이로부터 입력되는 음성신호에 포함된 잡음성분을 제거하기 위하여 단일채널 음성강조기법(Single channel speech Enhancement Method), 적응적 음향잡음 제거기법(Adaptive acoustic Noise Canceling Method), 블라인드 신호 분리기법(Blind Signal Separation Method) 및 일반화된 사이드로브 제거기법(Generalized Sidelobe Canceling Method)와 같은 방법들을 사용하고 있다.
Nam-Soo Kim 및 Joon-Hyuk Chang의 "Spectral Enhancement Based on Global Soft Decision" (IEEE Signal Processing Letters, Vol. 7, No. 5 , pp.108-110,2000)에 개시된 단일채널 음성강조기법은 하나의 마이크로폰을 사용하며 정상 배경잡음(stationary background noise)과 같이 잡음의 통계적 특성이 시간적으로 변하지 않은 경우에만 그 성능을 발휘한다. B. Widrow et al.의 "Adaptive Noise Canceling: Principles and Applications" (Proceedings of IEEE, Vol. 63, No. 12, pp. 1692-1716, 1975)에 개시된 음향잡음 제거기법은 두개의 마이크로폰을 사용하는데, 그 중 하나는 잡음만을 수음하는 참조 마이크로폰이므로, 잡음만을 수음할 수 없는 경우 또는 참조 마이크로폰으로 수음한 잡음 이외의 잡음이 혼입되는 경우에는 그 성능이 급격히 저하된다. 또한, 블라인드 신호 분리기법은 실제 환경에 적용하기 어려울 뿐 아니라 실시간 구현이 어려운 단점이 있다.
도 1은 일반화된 사이드로브 제거기법을 채용하는 종래의 적응적 빔 형성장치의 일예를 보여주는 블럭도로서, 고정 빔 형성부(11), 적응적 차단 매트릭스부(13) 및 적응적 다중입력 제거부(15)로 이루어진다. 상기 일반화된 사이드로브 제거기법에 대해서는 O. Hoshuyama et al.의 "A Robust Adaptive Beamformer For Microphone Arrays With A Blocking Matrix Using Constrained Adaptive Filters" (IEEE Trans. Signal Processing, Vol. 47, No. 10, pp. 2677-2684, 1999)에 좀 더 구체적으로 기재되어 있다.
도 1을 참조하면, 고정 빔 형성부(11)에서는 지연-합 빔형성기(Delay and Sum Beamformer)를 사용한다. 즉, 각 마이크로폰을 통하여 입력되는 신호의 상관도를 구하여 각 마이크로폰으로 입력되는 신호간의 시간지연을 계산한다. 계산된 시간지연 만큼 각 마이크로폰으로 입력되는 신호를 보상한 다음, 이들을 더해 줌으로써 신호 대 잡음비를 향상시킨 신호를 출력할 수 있다. 적응적 차단 매트릭스부(13)에서는 고정 빔 형성부(11)으로부터 출력되는 시간지연을 보상한 신호로부터 적응적 차단필터(Adaptive Blocking Filter, ABF라 약함)를 통과한 고정 빔 형성부(11)의 출력신호(b(k))를 빼 줌으로써 잡음성분을 극대화시킨다. 적응적 다중입력 제거부(15)에서는 적응적 차단 매트릭스부(13)의 출력신호(z m ( k), 여기서 m은 1에서 M 사이의 정수)를 적응적 제거필터(Adaptive Canceling Filter, ACF라 약함)를 통과시킨 후 모두 더함으로써, M개의 마이크로폰으로부터 유입된 잡음성분을 발생시킨다. 다음, 소정 시간(D) 지연된 고정 빔 형성부(11)의 출력신호(b(k))로부터 적응적 다중입력 제거부(15)의 출력신호를 빼 줌으로써 잡음성분이 제거된 최종 출력신호(y(k))를 얻는다.
도 1에 도시된 적응적 차단 매트릭스부(13) 및 적응적 다중입력 제거부(15)의 동작을 도 2를 참조하여 좀 더 세부적으로 설명하기로 한다. 적응적 차단 매트릭스부(13) 및 적응적 다중입력 제거부(15)의 동작은 적응적 음향잡음 제거기법과 동일하다.
도 2를 참조하면, 심볼들 즉, s+n, s 및 n 의 사이즈는 주어진 위치에서의 음성신호와 잡음신호의 상대적인 크기를 나타내며, 슬래쉬(/)로 구분된 왼쪽 심볼과 오른쪽 심볼은 각각 이상적인 상태(to-be)와 실제 상태(as-is)를 나타낸다.
적응적 차단필터(ABF, 21)는 제1 감산기(23)의 출력신호에 따라서 고정 빔 형성부(11)의 출력(b(k))를 적응적으로 필터링하여 고정 빔 형성부(11)의 출력(b(k))에 포함된 음성성분이 소정 시간 지연된 마이크로폰 신호(x' m (k))에 포함된 음성성분과 같은 같은 특성을 가진 신호를 출력한다. 제1 감산기(23)는 소정 시간 지연된 마이크로폰 신호(x' m (k), 여기서 m은 1에서 M 사이의 정수)로부터 ABF(21)의 출력신호를 빼 줌으로써 마이크로폰 신호(x' m (k))로부터 음성성분(S)이 제거된 신호를 출력한다.
적응적 제거필터(ACF, 25)는 제2 감산기(27)의 출력신호에 따라서 제1 감산기(23)의 출력(z m (k))를 적응적으로 필터링하여 제1 감산기(23)의 출력( z m (k))에 포함된 잡음성분이 고정 빔 형성부(11)의 출력(b(k))에 포함된 잡음성분과 같은 특성을 가진 신호를 출력한다. 제2 감산기(27)는 고정 빔 형성부(11)의 출력(b(k))로부터 ACF(25)의 출력신호를 빼 줌으로써 고정 빔 형성부(11)의 출력(b(k))로부터 잡음성분(N)이 제거된 신호(y(k))를 출력한다.
그런데, 상기한 일반화된 사이드로브 제거기법은 다음과 같은 단점들이 있다. 첫째, ACF(25)로 순수한 잡음신호만 입력되도록 고정 빔 형성부(11)의 지연-합 빔 형성기는 매우 높은 신호 대 잡음비를 갖는 출력(b(k))을 발생시켜야 하는데, 실제 지연-합 빔 형성기로부터 출력되는 신호의 신호 대 잡음비가 그리 높지 않기 때문에 전체적인 성능 열화를 초래한다. 결국, 적응적 차단 매트릭스부(13)에서는 음성신호가 섞인 잡음신호가 출력되므로 적응적 차단 매트릭스부(13)의 출력을 이용하는 적응적 다중입력 제거부(15)는 적응적 차단 매트릭스부(13)의 출력에 섞인 음성성분도 잡음신호로 간주하여 제거함으로써 적응적 빔 형성장치의 최종 출력신호는 잡음성분이 많이 섞인 음성신호가 출력된다. 둘째, 일반화된 사이드로브 제거기법에 사용되는 필터들은 피드포워드 연결 구조를 가지므로 유한임펄스응답(Finite Impulse Response, 이하 FIR이라 약함) 필터로 구성된다. 이와 같이 FIR 필터를 사용하는 경우에는 반향이 많은 실내 환경의 경우 1000 개 이상의 필터 탭을 필요로 하게 된다. 셋째, ABF(21) 및 ACF(25)의 트레이닝이 적절하게 수행되지 않을 경우 적응적 빔 형성장치의 성능이 저하될 수 있다. ABF(21) 및 ACF(25)의 트레이닝을 위해서는 음성신호 존재구간과 음성신호 부존재구간을 필요로 하는데, 이와 같은 구간들은 실제 구하기 어렵다. 넷째, 적응적 차단 매트릭스부(13) 및 적응적 다중입력 제거부(15)의 적응은 교번적으로 수행되어야 하기 때문에 음성 활성도 검출기(Voice Activity Detector)를 필요로 한다. 즉, ABF(21)의 적응을 위해서는 음성성분이 원하는 신호이고 잡음성분이 원하지 않는 신호가 되는 반면, ACF(25)의 적응을 위해서는 잡음성분이 원하는 신호이고 음성성분이 원하지 않는 신호가 된다.
따라서 본 발명이 이루고자 하는 기술적 과제는 적어도 두개 이상의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 광대역 음성신호에 포함된 잡음성분을 거의 완벽하게 제거시킬 수 있는 피드백 구조를 이용한 적응적 빔 형성방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 상기 적응적 빔 형성방법을 실현하는데 가장 적합한 장치를 제공하는데 있다.
상기 기술적 과제를 달성하기 위하여 본 발명에 따른 적응적 빔 형성방법은 (a) M(여기서 M은 2 이상) 개의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 M개의 음성신호에 대하여 각각 지연시간을 보상하고, 지연시간이 보상된 M개의 음성신호를 합산하는 단계; 및 (b) M개의 적응적 제거필터와 피드백 구조로 연결된 M개의 적응적 차단필터를 이용하여 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 순수한 잡음성분을 발생시키고, 상기 M개의 적응적 차단필터와 피드백 구조로 연결된 상기 M개의 적응적 제거필터를 이용하여 상기 (a) 단계의 출력신호로부터 순수한 음성성분을 발생시키는 단계를 포함한다.
상기 다른 기술적 과제를 달성하기 위하여 본 발명에 따른 적응적 빔 형성장치는 M(여기서 M은 2 이상) 개의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 M개의 음성신호에 대하여 각각 지연시간을 보상하고, 지연시간이 보상된 M개의 음성신호를 합산하는 고정 빔 형성부; 및 M개의 적응적 제거필터와 피드백 구조로 연결된 M개의 적응적 차단필터를 이용하여 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 순수한 잡음성분을 발생시키고, 상기 M개의 적응적 차단필터와 피드백 구조로 연결된 상기 M개의 적응적 제거필터를 이용하여 상기 고정 빔 형성부의 출력신호로부터 순수한 음성성분을 발생시키는 다중채널 신호분리부를 포함한다.
또한, 상기 다중채널 신호분리부는 바람직하게로는 상기 M개의 적응적 차단필터로 이루어지며, 각 적응적 차단필터를 이용하여 상기 고정빔 형성부의 출력신호를 필터링하는 제1 필터링부; M개의 감산기로 이루어지며, 각 감산기에서는 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 감산하는 제1 감산부; 상기 제1 감산부의 M개의 감산결과를 각각의 적응적 제거필터를 통하여 필터링하는 제2 필터링부; M개의 감산기로 이루어지며, 각 감산기에서는 상기 고정 빔 형성부의 출력신호로부터 상기 M개의 적응적 제거필터의 출력신호를 감산하고, 각 감산결과는 상기 M개의 적응적 차단필터의 입력으로 제공하는 제2 감산부; 및 상기 제2 감산기의 M개의 감산기로부터의 출력신호를 가산하는 제2 가산부를 구비한다.
또한, 상기 다중채널 신호분리부는 바람직하게로는 상기 M개의 적응적 차단필터로 이루어지며, 각 적응적 차단필터에서는 상기 고정빔 형성부의 출력신호를 필터링하는 제1 필터링부; M개의 감산기로 이루어지며, 각 감산기에서는 상기 지연시간이 보상된 M개의 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 감산하는 제1 감산부; 상기 M개의 적응적 제거필터로 이루어지며, 상기 제1 감산부의 M개의 감산기의 출력을 필터링하는 제2 필터링부; 상기 제2 필터링부의 M개의 적응적 제거필터의 출력신호를 가산하는 제2 가산부; 및 상기 고정 빔 형성부의 출력신호로부터 상기 제2 가산부의 출력신호를 감산하고, 그 감산결과를 상기 M개의 적응적 차단필터의 입력으로 제공하는 제2 감산부를 구비한다.
이하, 본 발명의 실시예에 대하여 첨부된 도면들을 참조하여 상세하게 설명하기로 한다.
도 3은 본 발명에 적용된 피드백 구조를 설명하기 위한 회로도로서, 적응적 차단필터(ABF, 31), 제1 감산기(33), 적응적 제거필터(ACF, 35) 및 제2 감산기(37) 로 이루어진다.
도 3을 참조하면, 적응적 차단필터(ABF, 31)는 제2 감산기(37)의 출력신호(y(k))를 적응적으로 필터링하여 제2 감산기(37)의 출력신호(y(k))에 포함된 음성성분이 소정 시간 지연된 마이크로폰 신호(x' m (k))에 포함된 음성성분과 같은 같은 특성을 가진 신호를 출력한다. 제1 감산기(33)는 M(여기서 M은 2 이상인 정수)개의 마이크로폰 중 m번째 마이크로폰의 입력신호(x m (k))를 소정 시간(D m) 지연시킨 신호(x m (k-D m ), 즉 x m '(k))로부터 적응적 차단필터(ABF, 31)의 출력신호를 감산한다. 그 결과, 제1 감산기(33)에서는 마이크로폰의 입력신호(x m (k ))에 포함된 순수한 잡음신호(N)만 출력된다.
적응적 제거필터(ACF, 35)는 제1 감산기(33)의 출력신호(z m (k))를 적응적으로 필터링하여 제1 감산기(33)의 출력신호(z m (k))에 포함된 잡음성분이 고정 빔 형성부(11)의 출력(b(k))에 포함된 잡음성분과 같은 특성을 가진 신호를 출력한다. 제2 감산기(37)는 고정빔 형성부(11)의 출력신호(b(k))로부터 적응적 제거필터(ACF, 35)의 출력신호를 감산한다. 그 결과, 제2 감산기(37)에서는 고정빔 형성부(11)의 출력신호(b(k))에서 잡음성분이 제거된 순수한 음성신호(S)만 출력된다.
도 4는 본 발명에 따른 적응적 빔 형성장치의 제1 실시예의 구성을 나타낸 블럭도로서, 크게 고정빔 형성부(410)와 멀티채널 신호분리부(430)로 이루어진다. 고정빔 형성부(410)는 M개의 마이크로폰(411a,411b,411c)으로 이루어지는 마이크로폰 어레이(411), 지연시간 추정기(413), M의 지연소자(415a,415b,415c)로 이루어지는 지연부(415) 및 제1 가산부(417)를 포함한다. 멀티채널 신호분리부(430)는 M개의 적응적 차단필터(ABF,431a,431b)로 이루어지는 제1 필터링부(431), M개의 감산기(433a,433b)로 이루어지는 제1 감산부(433), M개의 적응적 제거필터(ACF,435a,435b)로 이루어지는 제2 필터링부(435), M개의 감산기(437a,437b)로 이루어지는 제2 감산부(437) 및 제2 가산부(439)를 포함한다.
도 4를 참조하면, 고정빔 형성부(410)에 있어서, 마이크로폰 어레이(411)는 M개의 마이크로폰(411a,411b,411c)으로부터 각각 음성신호(x 1 (k), x 2 (k),...,x M (k))를 입력받는다. 지연시간 추정기(413)는 마이크로폰 어레이(411)의 M개의 마이크로폰(411a,411b,411c)을 통하여 입력되는 신호들의 상관도를 구하여 각 음성신호(x 1 (k), x 2 (k),...,x M (k))간의 시간지연을 계산한다. 지연부(415)는 M개의 지연소자(415a,415b,415c)에서 지연시간 추정기(413)에서 계산된 지연시간(D1, D2,...,DM)만큼 각 음성신호(x 1 (k), x 2 (k),...,x M (k))를 지연시키고, 지연된 음성신호(x 1 '(k), x 2 '(k),...,x M '(k))출력한다. 여기서, 지연시간 추정기(413)는 상관도 계산 이외에 다양한 방법으로 각 음성신호간 지연시간을 계산할 수 있다.
제1 가산부(417)는 지연부(415)로부터 출력되는 지연된 음성신호(x 1 '(k ), x 2 '(k),...,x M '(k))를 가산하고, 가산된 신호(b(k))를 출력한다. 제1 가산부(417)의 출력(b(k))는 다음 수학식 1과 같이 나타낼 수 있다.
멀티채널 신호 분리부(430)에 있어서, 제1 필터링부(431)의 M개의 ABF(431a,431b)에서는 제2 감산기(437a,437b)의 출력신호를 적응적으로 필터링하여 제2 감산기(437a,437b)의 출력신호에 포함된 음성성분이 소정 시간 지연된 마이크로폰 신호(x' m (k))에 포함된 음성성분과 같은 같은 특성을 가진 신호를 출력한다.
제1 감산부(433)는 M개의 감산기(433a,433b)에서 각각 지연된 M개의 음성신호(x 1 '(k), x 2 '(k),...,x M '(k))로부터 제1 필터링부(431)의 M개의 ABF(431a,431b)의 출력을 각각 감산하고, 각 감산기(433a,433b)의 출력신호(u 1 (k), u 2 (k),...,u M (k))를 제2 필터링부(435)에서 해당하는 ACF(435a,435b)로 인가한다. 제1 필터링부(431)에서 m번째 ABF의 계수벡터를 , 탭수를 L이라 할때, 제1 감산부(433)의 각 감산기(433a,433b)의 출력신호(u m (k))는 다음 수학식 2와 같이 나타낼 수 있다.
상기 수학식 1에서 는 각각 다음 수학식 3 및 수학식 4와 같이 나타낼 수 있다.
상기 수학식 3에서 h m,l (k)는 의 ℓ 번째 계수를 나타낸다.
즉, w m (k)의 N 개의 과거 값을 모은 벡터이고, N은 ACF(435a,435b)의 필터 탭수를 나타낸다.
제2 필터링부(435)의 M개의 ACF(435a,435b)에서는 제1 감산기(431a,431b)의 출력신호를 적응적으로 필터링하여 제1 감산기(431a,431b)의 출력신호에 포함된 잡음성분이 고정 빔 형성부(11)의 출력(b(k))에 포함된 잡음성분과 같은 특성을 가진 신호를 출력한다.
제2 감산부(437)는 M개의 감산기(437a,437b)에서 각각 고정빔 형성부(410)의 출력신호(b(k))로부터 제2 필터링부(435)의 M개의 ACF(435a,435b)의 출력을 각각 감산하고, 각 감산기(437a,437b)의 출력신호(w 1 (k), w 2 (k),...,w M (k))를 제2 가산부(439)로 인가한다. 제2 필터링부(435)에서 m번째 ACF의 계수벡터를 , 탭수를 N이라 할때, 제2 감산부(437)의 각 감산기(437a,437b)의 출력신호(w m (k))는 다음 수학식 5와 같이 나타낼 수 있다.
상기 수학식 5에서 는 각각 다음 수학식 6 및 수학식 7과 같이 나타낼 수 있다.
상기 수학식 6에서 g m,l (k)는 의 ℓ 번째 계수를 나타낸다.
즉, u m (k)의 L 개의 과거 값을 모은 벡터이고, L은 ABF(431a,431b)의 필터 탭수를 나타낸다.
제2 가산부(439)는 제2 감산부(437)의 M개의 감산기(437a,437b)의 출력신호(w m (k))를 가산하여, 최종적으로 잡음성분이 제거된 신호( y(k))를 출력한다. 제2 가산부(439)의 출력신호(y(k))는 다음 수학식 8과 같이 나타낼 수 있다.
도 5는 본 발명에 따른 적응적 빔 형성장치의 제2 실시예의 구성을 나타낸 블럭도로서, 크게 고정빔 형성부(510)와 멀티채널 신호분리부(530)로 이루어진다. 고정빔 형성부(510)는 M개의 마이크로폰(511a,511b,511c)으로 이루어지는 마이크로폰 어레이(511), 지연시간 추정기(513), M의 지연소자(515a,515b,515c)로 이루어지는 지연부(515) 및 제1 가산부(517)를 포함한다. 멀티채널 신호분리부(530)는 M개의 적응적 차단필터(531a,531b,531c)로 이루어지는 제1 필터링부(531), M개의 감산기(533a,533b,533c)로 이루어지는 제1 감산부(533), M개의 적응적 제거필터(535a,535b,535c)로 이루어지는 제2 필터링부(535), 제2 가산부(537) 및 제2 감산부(539)를 포함한다. 여기서, 고정빔 형성부(510)의 구성 및 동작은 도 4에 도시된 제1 실시예와 동일하므로 그 세부적인 설명을 생략하고, 멀티채널 신호 분리부(530)에 대하여 중점적으로 설명하기로 한다.
도 5를 참조하면, 멀티채널 신호 분리부(530)에 있어서, 제1 필터링부(531)의 M개의 ABF(531a,531b,531c)에서는 제2 감산부(539)의 출력신호를 적응적으로 필터링하여 제2 감산부(539)의 출력신호에 포함된 음성성분이 소정 시간 지연된 마이크로폰 신호(x' m (k))에 포함된 음성성분과 같은 같은 특성을 가진 신호를 출력한다.
제1 감산부(533)는 M개의 감산기(533a,533b,533c)에서 소정시간 지연된 마이크로폰 신호(x 1 '(k), x 2 '(k),..., x M '(k))로부터 M개의 ABF(531a,531b,531c)의 출력을 각각 감산하고, 각 감산기(533a,533b,533c)의 출력신호(z 1 (k), z 2 (k),...,z M (k))를 제2 필터링부(535)에서 해당하는 ACF(535a,535b,535c)로 인가한다. 제1 필터링부(531)에서 m번째 ABF의 계수벡터를 , 탭수를 L이라 할때, 제1 감산부(533)의 각 감산기(533a,533b,533c)의 출력신호(z m (k))는 다음 수학식 9와 같이 나타낼 수 있다.
상기 수학식 9에서 는 각각 다음 수학식 10 및 수학식 11과 같이 나타낼 수 있다.
상기 수학식 10에서 h m,l (k)는 의 ℓ 번째 계수를 나타낸다.
즉, y (k)는 y(k)의 L 개의 과거 값을 모은 벡터이고, L은 ABF(531a,531b,531c)의 필터 탭수를 나타낸다.
제2 필터링부(535)의 M개의 ACF(535a,535b,535c)에서는 제1 감산부(533)의 M개의 감산기(533a,533b,533c)의 출력신호를 적응적으로 필터링하여 M개의 감산기(533a,533b,533c)의 출력신호에 포함된 잡음성분이 고정 빔 형성부(11)의 출력(b(k))에 포함된 잡음성분과 같은 특성을 가진 신호를 출력한다.
제2 가산부(537)는 M개의 ACF(535a,535b,535c)의 출력신호를 가산한다. 제2 필터링부(535)의 m번째 ACF의 필터계수를 , 탭수를 N이라 할때, 제2 가산부(537)의 출력신호(v(k))는 다음 수학식 12와 같이 나타낼 수 있다.
상기 수학식 12에서 는 각각 다음 수학식 13 및 수학식 14와 같이 나타낼 수 있다.
상기 수학식 13에서 g m,l (k)는 의 ℓ 번째 계수를 나타낸다.
즉, z m (k)의 N 개의 과거 값을 모은 벡터이고, N은 ACF(535a,535b,535c)의 필터 탭수를 나타낸다.
제2 감산부(539)는 고정빔 형성부(510)의 출력신호(b(k))로부터 제2 가산부(537)의 출력신호(v(k))를 감산하고, 감산된 신호(y(k))를 출력한다. 제2 감산부(539)의 출력신호(y(k))는 다음 수학식 15와 같이 나타낼 수 있다.
한편, 본 발명의 제1 및 제2 실시예에 있어서, 제1 필터링부(431,531)와 제2 필터링부(435,535)를 각각 구성하는 ABF(431a,431b,531a,531b,531c) 및 ACF(435a,435b,535a,535b,535c)는 유한임펄스응답(Finite Impulse Response, 이하 FIR로 약함) 필터로 이루어진다. 각 필터의 입력과 출력 측면에서 볼 때 각각의 필터는 FIR 필터이지만, 멀티채널 신호 분리부(430,530)의 입력(즉, 고정빔 형성부(410,510)의 출력신호(b(k))와 소정 시간 지연된 마이크로폰신호((x 1 '(k), x 2 '(k),...,x M '(k)))과 출력(즉, 도 4의 제2 가산부(439)와 도 5의 제2 감산부(539)의 출력신호(y(k)))) 측면에서 볼 때 멀티채널 신호 분리부(430,530)는 무한임펄스응답(Infinite Impulse Response, 이하 IIR로 약함) 필터로 구현된 것으로 볼 수 있다. 이것은 제1 필터링부(431,531)의 ABF(431a,431b,531a,531b,531c)와 제2 필터링부(435,535)의 ACF(435a,435b,535a,535b,535c)가 피드백 구조로 연결되어 있기 때문이다.
각 FIR 필터의 필터계수는 예를 들면, Anthony J. Bell 이 제안한 정보 최대화 알고리즘(Information Maximization Algorithm)에 의해 갱신되어진다. 정보 최대화 알고리즘은 독립성분분석(Independent Component Analysis) 분야에서 널리 알려진 통계적 학습규칙들 중 하나로서, 잠재적인 신호원들이 통계적으로 독립적이라는 가정하에 센서 어레이 출력값으로부터 잠재적인 신호원들의 비가우시안(non-Gaussian) 데이터구조를 찾아낸다. 정보 최대화 알고리즘은 음성 활성도 검출기(Voice Activity Detector)를 필요로 하지 않기 때문에 원하는 신호 및 원하지 않는 신호의 레벨을 모르더라도 자동적으로 ABF 및 ACF의 필터계수를 적응시킬 수 있다. 상기 정보 최대화 알고리즘에 의하면 ABF(431a,431b,531a,531b,531c) 및 ACF(435a,435b,535a,535b,535c)의 필터계수는 다음 수학식 16 및 수학식 17과 같이 갱신되어진다.
상기 수학식 16 및 17에 있어서, α및 β는 학습규칙을 위한 스텝사이즈이고, SGN(·)는 부호(sign) 함수로서 인수의 값이 0보다 크면 +1, 같으면 0, 작으면 -1이다.
상기한 바와 같이 상기 ABF(431a,431b,531a,531b,531c) 및 ACF(435a,435b,535a,535b,535c)를 FIR 필터로 구현하고 피드백 구조로 연결하면, 마이크로폰 어레이(411, 511)를 구성하는 마이크로폰의 수가 8개인 경우 도 4 및 도 5에 도시된 본 발명에 따른 적응 빔 형성장치는 사용된 필터 탭수가 8*(128+128)=2048개로서, 도 1에 도시된 종래의 적응 빔 형성장치에서 사용된 8*(512+128)=5120개에 비해 대폭 감소될 수 있다.
도 6는 본 발명과 도 1에 도시된 종래기술의 성능을 비교하기 위하여 사용된 실험환경을 도시한 것으로서, 길이, 폭, 높이가 각각 6.5 m, 4.1 m, 3.5 m 인 방의 중앙에 직경 30 cm 인 원형 마이크로폰 어레이를 배치하였다. 원형 마이크로폰 어레이의 상부에는 8 개의 마이크로폰이 동일한 간격을 두고 설치되어 있다. 바닥에서부터 마이크로폰 어레이, 목적음원, 잡음원까지의 높이는 모두 0.79 m 이다. 4 명의 남성 화자가 발성한 40 개의 고립 단어를 목적음으로 사용하였고, 잡음으로는 팬(FAN) 잡음과 음악(MUSIC) 잡음을 사용하였다.
상기한 실험환경에서 객관적 평가, 예를 들면 신호대잡음비(Signal-to-Noise Ratio) 향상에 대한 비교결과는 다음 표 1에 나타난 바와 같다.
원신호 종래기술(GSC) 본 발명
FAN 9.0 19.5 27.5
MUSIC 6.9 15.5 24.9
ΔFAN X 10.5 18.5
ΔMUSIC X 8.6 18.0
표 1을 참조하면, 본 발명에 의한 빔 형성방법이 종래기술에 의한 빔 형성방법보다 SNR 이 거의 2 배 정도 향상되었음을 알 수 있다.
다음, 상기한 실험환경에서 주관적 평가, 예를 들면 AB 선호도를 테스트하기 위하여, 10 명의 사람들에게 종래기술에 의한 빔 형성장치의 출력과 본 발명에 의한 빔 형성장치의 출력을 들려 준 다음, 'A 신호가 B 신호보다 훨씬 좋다', 'A 신호가 B 신호보다 좋다', 'A 신호와 B 신호가 같다', 'A 신호가 B 신호보다 나쁘다', 및 'A 신호가 B 신호보다 훨씬 나쁘다'와 같은 5 개의 평가 항목 중 하나를 선택하도록 하였다. 어느 장치의 출력이 A 신호가 될지는 테스트 프로그램에서 임의로 결정하며, '훨씬 좋다'라고 평가된 출력에 2 점, '좋다'라고 평가된 출력에 1 점, '같다'라고 평가된 출력에 0 점을 주어 모든 점수를 합하였다. 이 과정은 팬 잡음과 음악 잡음에 대하여 40 단어씩 비교하도록 하였으며, 최종 비교결과는 다음 표 2에 나타난 바와 같다.
종래기술(GSC) 본 발명
FAN 78 517
MUSIC 140 284
표 2를 참조하면, 종래기술에 의한 빔 형성장치의 출력에 비하여 본 발명에 따른 빔 형성장치의 출력에 대한 선호도가 훨씬 높다는 것을 알 수 있다.
한편, 상기한 본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
또한, 본 발명에 따른 적응적 빔 형성방법 및 장치는 마이크로폰 어레이가 부착된 자율주행 이동로봇 뿐만 아니라 사용되는 마이크로폰의 수가 적은 PDA(Personal Digital Assistant), 웹패드(WebPad) 또는 차량에 설치되는 휴대폰 등과 같이 사용자의 입과 단말기가 상당히 떨어진 환경에서도 적용가능하며, 이 경우에도 음성인식기의 성능을 대폭 향상시킬 수 있다.
상술한 바와 같이 본 발명에 따르면, 적응적 차단 필터와 적응적 제거필터를 피드백 구조로 연결시킴으로써, 적어도 두개 이상의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 광대역 음성신호에 포함된 잡음성분을 거의 완벽하게 제거할 수 있다. 또한, 적응적 차단 필터와 적응적 제거필터를 FIR 필터로 구현하면서도 피드백 구조로 연결시킴으로써, 적응적 차단필터와 적응적 제거필터를 IIR 필터로 구현가능함으로써 필요로 하는 필터탭수를 줄일 수 있다. 또한, 적응적 차단 필터와 적응적 제거필터의 계수를 학습시키기 위하여 정보 최대화 알고리즘을 사용함으로써 학습에 필요한 파라미터 수를 줄일 수 있을 뿐만 아니라 음성신호의 존재여부를 판단하는 음성 활성도 검출기를 구비할 필요가 없다.
또한, 본 발명에 따른 적응적 빔 형성방법 및 장치는 마이크로폰 어레이의 크기, 배열방식 및 구조에 의한 영향이 적을 뿐 아니라 잡음의 종류에 상관없이 룩 디렉션 에러(look direction error)에 강인한 이점이 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
도 1은 종래의 적응적 빔 형성장치의 일예를 보여주는 블럭도,
도 2는 도 1에 적용된 피드포워드 구조를 설명하기 위한 회로도,
도 3은 본 발명에 적용된 피드백 구조를 설명하기 위한 회로도,
도 4는 본 발명에 따른 적응적 빔 형성장치의 제1 실시예의 구성을 나타낸 블럭도,
도 5는 본 발명에 따른 적응적 빔 형성장치의 제2 실시예의 구성을 나타낸 블럭도, 및
도 6는 본 발명에 따른 적응적 빔 형성장치와 도 1에 도시된 빔 형성장치의 성능을 비교하기 위하여 사용된 실험환경을 도시한 것이다.

Claims (15)

  1. (a) M(여기서 M은 2 이상인 정수) 개의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 M개의 잡음섞인 음성신호에 대하여 각각 지연시간을 보상하고, 지연시간이 보상된 M개의 잡음섞인 음성신호를 합산하는 단계; 및
    (b) M개의 적응적 제거필터와 피드백 구조로 연결된 M개의 적응적 차단필터를 이용하여 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 순수한 잡음성분을 발생시키고, 상기 M개의 적응적 차단필터와 피드백 구조로 연결된 상기 M개의 적응적 제거필터를 이용하여 상기 (a) 단계의 출력신호로부터 순수한 음성성분을 발생시키는 단계를 포함하는 적응적 빔 형성방법.
  2. 제1 항에 있어서, 상기 (b) 단계는
    (b1) 상기 M개의 적응적 차단필터를 이용하여 상기 (a) 단계의 출력신호를 필터링하는 단계;
    (b2) 상기 지연시간이 보상된 M개의 잡음 섞인 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 각각 감산하는 단계;
    (b3) 상기 (b2) 단계에서 발생되는 M개의 감산결과를 각각의 적응적 제거필터를 통하여 필터링하는 단계;
    (b4) 상기 (a) 단계의 출력신호로부터 상기 M개의 적응적 제거필터의 출력신호를 감산하고, 각 감산결과는 상기 M개의 적응적 차단필터의 입력으로 제공하는 단계; 및
    (b5) 상기 (b4) 단계에서 발생되는 M개의 감산결과를 가산하는 단계를 구비하는 적응적 빔 형성방법.
  3. 제1 항에 있어서, 상기 (b) 단계는
    (b1) 상기 M개의 적응적 차단필터를 이용하여 상기 (a) 단계의 출력신호를 필터링하는 단계;
    (b2) 상기 지연시간이 보상된 M개의 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 각각 감산하는 단계;
    (b3) 상기 M개의 적응적 제거필터를 이용하여 상기 (b2) 단계에서 발생하는 M개의 감산결과를 각각의 적응적 제거필터를 통하여 필터링하는 단계;
    (b4) 상기 (b3) 단계의 M개의 적응적 제거필터의 출력신호를 가산하는 단계; 및
    (b5) 상기 (a) 단계의 출력신호로부터 상기 (b4) 단계의 출력신호를 감산하고, 그 감산결과를 상기 M개의 적응적 차단필터의 입력으로 제공하는 단계를 구비하는 적응적 빔 형성방법.
  4. 제2 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터는 각각 유한임펄스응답 필터로 구현되며, 피드백 구조로 연결되는 적응적 빔 형성방법.
  5. 제4 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터의 필터계수는 정보 최대화 알고리즘에 의해 갱신되는 적응적 빔 형성방법.
  6. 제3 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터는 각각 유한임펄스응답 필터로 구현되며, 피드백 구조로 연결되는 적응적 빔 형성방법.
  7. 제6 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터의 필터계수는 정보 최대화 알고리즘에 의해 갱신되는 적응적 빔 형성방법.
  8. M(여기서 M은 2 이상인 정수) 개의 마이크로폰으로 이루어지는 마이크로폰 어레이로부터 입력되는 M개의 잡음 섞인 음성신호에 대하여 각각 지연시간을 보상하고, 지연시간이 보상된 M개의 잡음 섞인 음성신호를 합산하는 고정 빔 형성부; 및
    M개의 적응적 제거필터와 피드백 구조로 연결된 M개의 적응적 차단필터를 이용하여 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 순수한 잡음성분을 발생시키고, 상기 M개의 적응적 차단필터와 피드백 구조로 연결된 상기 M개의 적응적 제거필터를 이용하여 상기 고정 빔 형성부의 출력신호로부터 순수한 음성성분을 발생시키는 다중채널 신호분리부를 포함하는 적응적 빔 형성장치.
  9. 제8 항에 있어서, 상기 고정 빔 형성부는
    상기 마이크로폰 어레이로부터 입력되는 M개의 음성신호에 대하여 각각 지연시간을 계산하는 지연시간 추정기;
    상기 지연시간 추정기에서 계산된 지연시간만큼 상기 M개의 음성신호를 각각 지연시키는 지연부; 및
    상기 지연부에서 지연되는 M개의 음성신호를 가산하는 제1 가산부를 포함하는 적응적 빔 형성장치.
  10. 제8 항 또는 제9 항에 있어서, 상기 다중채널 신호분리부는
    상기 M개의 적응적 차단필터로 이루어지며, 각 적응적 차단필터를 이용하여 상기 고정빔 형성부의 출력신호를 필터링하는 제1 필터링부;
    M개의 감산기로 이루어지며, 각 감산기에서는 상기 지연시간이 보상된 M개의 잡음섞인 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 감산하는 제1 감산부;
    상기 제1 감산부의 M개의 감산결과를 각각의 적응적 제거필터를 통하여 필터링하는 제2 필터링부;
    M개의 감산기로 이루어지며, 각 감산기에서는 상기 고정 빔 형성부의 출력신호로부터 상기 M개의 적응적 제거필터의 출력신호를 감산하고, 각 감산결과는 상기 M개의 적응적 차단필터의 입력으로 제공하는 제2 감산부; 및
    상기 제2 감산기의 M개의 감산기로부터의 출력신호를 가산하는 제2 가산부를 구비하는 적응적 빔 형성장치.
  11. 제8 항 또는 제9 항에 있어서, 상기 다중채널 신호분리부는
    상기 M개의 적응적 차단필터로 이루어지며, 각 적응적 차단필터에서는 상기 고정빔 형성부의 출력신호를 필터링하는 제1 필터링부;
    M개의 감산기로 이루어지며, 각 감산기에서는 상기 지연시간이 보상된 M개의 음성신호로부터 상기 M개의 적응적 차단필터의 출력신호를 감산하는 제1 감산부;
    상기 M개의 적응적 제거필터로 이루어지며, 상기 제1 감산부의 M개의 감산기의 출력을 필터링하는 제2 필터링부;
    상기 제2 필터링부의 M개의 적응적 제거필터의 출력신호를 가산하는 제2 가산부; 및
    상기 고정 빔 형성부의 출력신호로부터 상기 제2 가산부의 출력신호를 감산하고, 그 감산결과를 상기 M개의 적응적 차단필터의 입력으로 제공하는 제2 감산부를 구비하는 적응적 빔 형성장치.
  12. 제10 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터는 각각 유한임펄스응답 필터로 구현되며 피드백 구조로 연결되는 적응적 빔 형성장치.
  13. 제12 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터의 필터계수는 정보 최대화 알고리즘에 의해 갱신되는 적응적 빔 형성장치.
  14. 제11 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터는 각각 유한임펄스응답 필터로 구현되며 피드백 구조로 연결되는 적응적 빔 형성장치.
  15. 제14 항에 있어서, 상기 적응적 차단필터와 상기 적응적 제거필터의 필터계수는 정보 최대화 알고리즘에 의해 갱신되는 적응적 빔 형성장치.
KR10-2003-0003258A 2003-01-17 2003-01-17 피드백 구조를 이용한 적응적 빔 형성방법 및 장치 Expired - Fee Related KR100480789B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR10-2003-0003258A KR100480789B1 (ko) 2003-01-17 2003-01-17 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
EP04250219A EP1439526B1 (en) 2003-01-17 2004-01-16 Adaptive beamforming method and apparatus using feedback structure
US10/757,994 US7443989B2 (en) 2003-01-17 2004-01-16 Adaptive beamforming method and apparatus using feedback structure
JP2004011027A JP4166706B2 (ja) 2003-01-17 2004-01-19 フィードバック構造を利用した適応ビーム形成方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0003258A KR100480789B1 (ko) 2003-01-17 2003-01-17 피드백 구조를 이용한 적응적 빔 형성방법 및 장치

Publications (2)

Publication Number Publication Date
KR20040066257A KR20040066257A (ko) 2004-07-27
KR100480789B1 true KR100480789B1 (ko) 2005-04-06

Family

ID=32588971

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0003258A Expired - Fee Related KR100480789B1 (ko) 2003-01-17 2003-01-17 피드백 구조를 이용한 적응적 빔 형성방법 및 장치

Country Status (4)

Country Link
US (1) US7443989B2 (ko)
EP (1) EP1439526B1 (ko)
JP (1) JP4166706B2 (ko)
KR (1) KR100480789B1 (ko)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233642B2 (en) * 2003-08-27 2012-07-31 Sony Computer Entertainment Inc. Methods and apparatuses for capturing an audio signal based on a location of the signal
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
KR101149571B1 (ko) * 2004-04-28 2012-05-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 적응성 빔 형성기, 사이드로브 소거기, 핸즈프리 음성 통신 디바이스
DE602004015987D1 (de) * 2004-09-23 2008-10-02 Harman Becker Automotive Sys Mehrkanalige adaptive Sprachsignalverarbeitung mit Rauschunterdrückung
CN100399721C (zh) * 2005-01-11 2008-07-02 中国人民解放军理工大学 基于发送辅助选择用户反馈的正交预波束成形传输方法
US7925504B2 (en) 2005-01-20 2011-04-12 Nec Corporation System, method, device, and program for removing one or more signals incoming from one or more directions
EP1736964A1 (en) * 2005-06-24 2006-12-27 Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO System and method for extracting acoustic signals from signals emitted by a plurality of sources
US8103023B2 (en) * 2005-07-06 2012-01-24 Koninklijke Philips Electronics N.V. Apparatus and method for acoustic beamforming
WO2007007414A1 (ja) * 2005-07-14 2007-01-18 Rion Co., Ltd. 遅延和型センサアレイ装置
TW200715147A (en) * 2005-10-03 2007-04-16 Omnidirectional Control Technology Inc Sound collection device of sound entering array
KR100959050B1 (ko) * 2006-03-01 2010-05-20 소프트맥스 인코퍼레이티드 분리된 신호를 생성하는 시스템 및 방법
GB2438259B (en) * 2006-05-15 2008-04-23 Roke Manor Research An audio recording system
US7848529B2 (en) * 2007-01-11 2010-12-07 Fortemedia, Inc. Broadside small array microphone beamforming unit
US8160273B2 (en) * 2007-02-26 2012-04-17 Erik Visser Systems, methods, and apparatus for signal separation using data driven techniques
WO2009076523A1 (en) * 2007-12-11 2009-06-18 Andrea Electronics Corporation Adaptive filtering in a sensor array system
US9392360B2 (en) 2007-12-11 2016-07-12 Andrea Electronics Corporation Steerable sensor array system with video input
US8175291B2 (en) * 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8321214B2 (en) * 2008-06-02 2012-11-27 Qualcomm Incorporated Systems, methods, and apparatus for multichannel signal amplitude balancing
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
CN101686500B (zh) * 2008-09-25 2013-01-23 中国移动通信集团公司 确定相关参数的方法、用户终端以及信号赋形方法、基站
EP2237270B1 (en) * 2009-03-30 2012-07-04 Nuance Communications, Inc. A method for determining a noise reference signal for noise compensation and/or noise reduction
EP2237271B1 (en) 2009-03-31 2021-01-20 Cerence Operating Company Method for determining a signal component for reducing noise in an input signal
JP5544110B2 (ja) * 2009-03-31 2014-07-09 鹿島建設株式会社 参照信号加工装置、参照信号加工装置を有する能動騒音制御装置及び能動騒音制御システム
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
KR101581885B1 (ko) * 2009-08-26 2016-01-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
TWI441525B (zh) * 2009-11-03 2014-06-11 Ind Tech Res Inst 室內收音系統及室內收音方法
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8638951B2 (en) * 2010-07-15 2014-01-28 Motorola Mobility Llc Electronic apparatus for generating modified wideband audio signals based on two or more wideband microphone signals
US8861756B2 (en) * 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
TWI459381B (zh) 2011-09-14 2014-11-01 Ind Tech Res Inst 語音增強方法
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
CN102820036B (zh) * 2012-09-07 2014-04-16 歌尔声学股份有限公司 一种自适应消除噪声的方法和装置
EP2806424A1 (en) * 2013-05-20 2014-11-26 ST-Ericsson SA Improved noise reduction
US9742573B2 (en) * 2013-10-29 2017-08-22 Cisco Technology, Inc. Method and apparatus for calibrating multiple microphones
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US11064291B2 (en) 2015-12-04 2021-07-13 Sennheiser Electronic Gmbh & Co. Kg Microphone array system
US9894434B2 (en) 2015-12-04 2018-02-13 Sennheiser Electronic Gmbh & Co. Kg Conference system with a microphone array system and a method of speech acquisition in a conference system
US9659555B1 (en) * 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) * 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
US11344723B1 (en) 2016-10-24 2022-05-31 Hrl Laboratories, Llc System and method for decoding and behaviorally validating memory consolidation during sleep from EEG after waking experience
US10716514B1 (en) * 2017-04-10 2020-07-21 Hrl Laboratories, Llc System and method for optimized independent component selection for automated signal artifact removal to generate a clean signal
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
GB2561408A (en) * 2017-04-10 2018-10-17 Cirrus Logic Int Semiconductor Ltd Flexible voice capture front-end for headsets
CN108986831B (zh) * 2017-05-31 2021-04-20 南宁富桂精密工业有限公司 语音干扰滤除的方法、电子装置及计算机可读存储介质
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
CN112335261B (zh) 2018-06-01 2023-07-18 舒尔获得控股公司 图案形成麦克风阵列
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN112889296B (zh) 2018-09-20 2025-01-10 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN118803494A (zh) 2019-03-21 2024-10-18 舒尔获得控股公司 具有抑制功能的波束形成麦克风瓣的自动对焦、区域内自动对焦、及自动配置
WO2020237206A1 (en) 2019-05-23 2020-11-26 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
US11302347B2 (en) 2019-05-31 2022-04-12 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
WO2021041275A1 (en) 2019-08-23 2021-03-04 Shore Acquisition Holdings, Inc. Two-dimensional microphone array with improved directivity
CN110767245B (zh) * 2019-10-30 2022-03-25 西南交通大学 基于s型函数的语音通信自适应回声消除方法
US12028678B2 (en) 2019-11-01 2024-07-02 Shure Acquisition Holdings, Inc. Proximity microphone
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
CN118216161A (zh) 2021-10-04 2024-06-18 舒尔获得控股公司 联网自动混合器系统及方法
US12250526B2 (en) 2022-01-07 2025-03-11 Shure Acquisition Holdings, Inc. Audio beamforming with nulling control system and methods
CN114550734A (zh) * 2022-03-02 2022-05-27 上海又为智能科技有限公司 音频增强方法和装置、计算机存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4536887A (en) * 1982-10-18 1985-08-20 Nippon Telegraph & Telephone Public Corporation Microphone-array apparatus and method for extracting desired signal
JP2792311B2 (ja) * 1992-01-31 1998-09-03 日本電気株式会社 多チャンネルエコー除去方法および装置
CA2157418C (en) * 1994-09-01 1999-07-13 Osamu Hoshuyama Beamformer using coefficient restrained adaptive filters for detecting interference signals
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
JP3216704B2 (ja) * 1997-08-01 2001-10-09 日本電気株式会社 適応アレイ装置
ATE230917T1 (de) * 1999-10-07 2003-01-15 Zlatan Ribic Verfahren und anordnung zur aufnahme von schallsignalen
DE60142583D1 (de) * 2001-01-23 2010-08-26 Koninkl Philips Electronics Nv Asymmetrisches mehrkanalfilter

Also Published As

Publication number Publication date
US20040161121A1 (en) 2004-08-19
KR20040066257A (ko) 2004-07-27
US7443989B2 (en) 2008-10-28
EP1439526A3 (en) 2005-01-12
JP4166706B2 (ja) 2008-10-15
JP2004229289A (ja) 2004-08-12
EP1439526B1 (en) 2011-11-02
EP1439526A2 (en) 2004-07-21

Similar Documents

Publication Publication Date Title
KR100480789B1 (ko) 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
KR100486736B1 (ko) 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치
EP3170173B1 (en) Active noise cancellation device
US7925007B2 (en) Multi-input channel and multi-output channel echo cancellation
US6449586B1 (en) Control method of adaptive array and adaptive array apparatus
CN100477704C (zh) 用于与自适应波束形成组合的回声抵消的方法和设备
EP1848243A1 (en) Multi-channel echo compensation system and method
Knecht et al. Neural network filters for speech enhancement
US8958572B1 (en) Adaptive noise cancellation for multi-microphone systems
EP2238592B1 (en) Method for reducing noise in an input signal of a hearing device as well as a hearing device
US8000482B2 (en) Microphone array processing system for noisy multipath environments
Adel et al. Beamforming techniques for multichannel audio signal separation
JP4654777B2 (ja) 音響エコーキャンセル装置
JP5738488B2 (ja) ビームフォーミング装置
US6381272B1 (en) Multi-channel adaptive filtering
Schwartz et al. Nested generalized sidelobe canceller for joint dereverberation and noise reduction
JP3403473B2 (ja) ステレオエコーキャンセラ
CN106024001A (zh) 一种提高麦克风阵列语音增强性能的方法
JPH07264102A (ja) ステレオエコーキャンセラ
Kawamura et al. A noise reduction method based on linear prediction analysis
JP5228903B2 (ja) 信号処理装置および方法
JP3616341B2 (ja) 多チャネルエコーキャンセル方法、その装置、そのプログラム及び記録媒体
JP3765567B2 (ja) 収音装置、収音方法、収音プログラムおよび記録媒体
JP3489587B2 (ja) 適応型雑音低減装置
JPH05191884A (ja) 雑音低減装置

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20030117

PA0201 Request for examination
PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20050221

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20050324

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20050325

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20080115

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20090316

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20091224

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20110103

Start annual number: 7

End annual number: 7

PR1001 Payment of annual fee

Payment date: 20120116

Start annual number: 8

End annual number: 8

FPAY Annual fee payment

Payment date: 20130221

Year of fee payment: 9

PR1001 Payment of annual fee

Payment date: 20130221

Start annual number: 9

End annual number: 9

FPAY Annual fee payment

Payment date: 20140221

Year of fee payment: 10

PR1001 Payment of annual fee

Payment date: 20140221

Start annual number: 10

End annual number: 10

FPAY Annual fee payment

Payment date: 20150212

Year of fee payment: 11

PR1001 Payment of annual fee

Payment date: 20150212

Start annual number: 11

End annual number: 11

FPAY Annual fee payment

Payment date: 20160218

Year of fee payment: 12

PR1001 Payment of annual fee

Payment date: 20160218

Start annual number: 12

End annual number: 12

FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 13

PR1001 Payment of annual fee

Payment date: 20170220

Start annual number: 13

End annual number: 13

FPAY Annual fee payment

Payment date: 20180220

Year of fee payment: 14

PR1001 Payment of annual fee

Payment date: 20180220

Start annual number: 14

End annual number: 14

FPAY Annual fee payment

Payment date: 20190220

Year of fee payment: 15

PR1001 Payment of annual fee

Payment date: 20190220

Start annual number: 15

End annual number: 15

FPAY Annual fee payment

Payment date: 20200225

Year of fee payment: 16

PR1001 Payment of annual fee

Payment date: 20200225

Start annual number: 16

End annual number: 16

PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20220104