KR100922963B1 - User speech recognition apparatus using microphone array and method for driving microphone array - Google Patents
User speech recognition apparatus using microphone array and method for driving microphone array Download PDFInfo
- Publication number
- KR100922963B1 KR100922963B1 KR1020070012222A KR20070012222A KR100922963B1 KR 100922963 B1 KR100922963 B1 KR 100922963B1 KR 1020070012222 A KR1020070012222 A KR 1020070012222A KR 20070012222 A KR20070012222 A KR 20070012222A KR 100922963 B1 KR100922963 B1 KR 100922963B1
- Authority
- KR
- South Korea
- Prior art keywords
- microphone array
- voice
- user
- unit
- input
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract description 35
- 238000001914 filtration Methods 0.000 description 6
- 238000003491 array Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
본 발명은 음성인식 장치에 관한 것으로 특히, 마이크로폰 어레이를 이용하여 음성을 인식하는 음성인식 장치에서 음성신호의 입력 방향으로 고지향성을 가지는 빔패턴을 형성하기 위한 마이크로폰 어레이 장치 및 그 마이크로폰 어레이 장치에서의 마이크로폰 어레이를 구동하기 위한 방법에 관한 것이다. 이를 위하여 본 발명은 엔드파이어 형태의 마이크로폰 어레이를 음성인식 장치에 내장되도록 장착한 후 사용자가 인식되면 마이크로폰 어레이를 돌출한 후에, 마이크로폰 어레이를 통해 주변 환경의 잡음을 억제하고 좀더 정확한 음성신호를 입력 받을 수 있도록 한다.The present invention relates to a voice recognition device, and more particularly, to a microphone array device and a microphone array device for forming a beam pattern having a high directivity in the direction of input of a voice signal in a voice recognition device using a microphone array. A method for driving a microphone array. To this end, the present invention is equipped with an end-fired microphone array to be embedded in the voice recognition device, and then, if the user is recognized, after projecting the microphone array, the microphone array to suppress the noise of the surrounding environment and receive a more accurate voice signal To help.
엔드파이어, 브로드사이드, 빔패턴, 로봇 Endfire, Broadside, Beam Pattern, Robot
Description
도 1은 일반적으로 마이크로폰 어레이로 입력되는 입력신호의 방향에 따라 달라지는 이득(Gain)을 설명하기 위한 도면,1 is a view for explaining a gain (Gain) that varies depending on the direction of the input signal input to the microphone array in general,
도 2는 브로드사이드 방식과 엔드파이어 방식으로 형성되는 빔형성을 설명하기 위한 도면,2 is a view for explaining beamforming formed by a broadside method and an endfire method;
도 3은 브로드사이드 방식과 엔드파이어 방식으로 형성된 빔패턴을 도시하는 도면,3 is a view illustrating a beam pattern formed by a broadside method and an endfire method;
도 4는 일반적으로 브로드사이드 방식의 마이크로폰 어레이를 장착한 로봇를 도시하는 도면,4 illustrates a robot generally equipped with a broadside microphone array;
도 5은 본 발명의 실시 예에 따라 엔드파이어 형태의 마이크로폰 어레이를 장착한 음성인식 장치의 내부 구성도,5 is an internal configuration diagram of a voice recognition device equipped with an endfire type microphone array according to an embodiment of the present invention;
도 6은 본 발명의 실시 예에 따라 엔드파이어 형태의 마이크로폰 어레이를 장착한 음성인식 장치에서 마이크로폰 어레이를 구동하기 위한 과정을 나타내는 흐름도,6 is a flowchart illustrating a process for driving a microphone array in a voice recognition device equipped with an endfire type microphone array according to an embodiment of the present invention;
도 7은 본 발명의 실시 예에 따라 마이크로폰 어레이가 엔드파이어 형태로 로봇에 장착되는 예를 도시하는 도면.7 is a diagram illustrating an example in which a microphone array is mounted to a robot in an endfire form according to an embodiment of the present invention.
본 발명은 음성인식 장치에 관한 것으로 특히, 마이크로폰 어레이를 이용하여 음성을 인식하는 음성인식 장치에서 음성신호의 입력 방향으로 고지향성을 가지는 빔패턴을 형성하기 위한 마이크로폰 어레이 장치 및 그 마이크로폰 어레이 장치에서의 마이크로폰 어레이를 구동하기 위한 방법에 관한 것이다.The present invention relates to a voice recognition device, and more particularly, to a microphone array device and a microphone array device for forming a beam pattern having a high directivity in the direction of input of a voice signal in a voice recognition device using a microphone array. A method for driving a microphone array.
일반적으로 마이크로폰이란 공기의 진동으로 전달되어 온 음향신호를 전기신호로 변환하는 변환기(transducer)이다. 최근 들어 로봇제어에 대한 기술이 발전하면서 로봇과 사용자가 서로 자유롭게 의사를 전달하는 수단으로 마이크로폰이 로봇의 음성 인터페이스로 사용되고 있다. 로봇은 로봇의 음성 인터페이스인 마이크로폰을 통해 입력되는 음성신호를 전기적 신호로 변환하여 그 내용을 분석함으로써 사용자의 음성을 인지할 수 있다.In general, a microphone is a transducer that converts an acoustic signal transmitted by air vibration into an electrical signal. Recently, with the development of the technology for robot control, a microphone is used as a voice interface of a robot as a means of freely communicating a robot and a user. The robot may recognize the user's voice by converting the voice signal input through the microphone, which is the voice interface of the robot, into an electrical signal and analyzing the contents.
로봇이 사용자의 특정 음성신호를 입력받을 때, 마이크로폰의 위치가 음성신호가 입력되는 방향을 향해 지향성을 형성한다면, 주위의 환경에서 발생하는 소음의 입력을 배제할 수 있을 것이다. 이때, 고지향성을 가진 하나의 마이크로폰으로도 특정 음성신호가 입력되는 방향을 향해 지향성을 형성할 수 있다. 그러나, 하나의 마이크로폰 보다는 여러 개의 마이크로폰을 배열하여 마이크로폰 어레이를 형성 하는 경우 사용목적에 알맞은 형태의 지향적 특성을 자유롭게 얻을 수 있는 장점을 가질 수 있게 된다. When the robot receives the user's specific voice signal, if the position of the microphone forms a directivity toward the direction in which the voice signal is input, the input of noise generated in the surrounding environment may be excluded. In this case, even one microphone having high directivity may form directivity toward a direction in which a specific voice signal is input. However, when a microphone array is formed by arranging a plurality of microphones rather than a single microphone, it is possible to have an advantage of freely obtaining a directional characteristic of a form suitable for a purpose of use.
한편, 마이크로폰 어레이를 통해 입력되는 음성신호를 필터링하기 위한 소프트웨어적 처리를 수행하게 되면 소프트웨어 처리에 따라 마이크로폰 어레이로부터 특정 방향으로 빔을 형성하게 된다. 또한, 이와 같이 마이크로폰 어레이를 이용하여 빔을 형성해서 마이크로부터 원하는 방향으로 고지향성을 나타내도록 하는 목적으로 빔포밍 기술이 이용된다.On the other hand, if the software process for filtering the voice signal input through the microphone array is performed to form a beam from the microphone array in a specific direction in accordance with the software processing. In addition, a beamforming technique is used for the purpose of forming a beam using the microphone array so as to exhibit high directivity from the microphone in a desired direction.
이와 같은 빔포밍을 통해 사용자의 음성이 입력되는 방향으로 고지향성이 형성되면, 그 빔 외부의 방향들로부터 입력되는 음성신호는 자동적으로 감쇄되며, 관심 있는 방향으로부터 입력되는 음성신호를 선택적으로 취득할 수 있다. 마이크로폰 어레이는 이러한 빔포밍 기술을 사용하여 실내의 컴퓨터 팬 소음, TV 소리와 같은 주변 잡음 및 가구 및 벽과 같은 사물로부터 반사되어 나오는 반향파들의 부분을 억제할 수 있다. 즉, 마이크로폰 어레이는 빔포밍 기술을 사용하여 관심 방향의 빔으로 부터 발생하는 사운드 신호들에 대해 더 높은 SNR(signal to noise ratio)을 얻을 수 있다. 따라서, 빔포밍은 "빔"을 음원에 포인팅하고 다른 방향들로부터 입력되는 모든 신호를 억제하는 공간 필터링(spatial filtering)에서 중요한 역할을 한다. When the high directivity is formed in the direction in which the user's voice is input through such beamforming, the voice signal input from the directions outside the beam is automatically attenuated, and the voice signal input from the direction of interest may be selectively acquired. Can be. Microphone arrays can use this beamforming technology to suppress part of echo waves reflected from objects such as furniture and walls and computer noise in the room, ambient noise such as TV sounds, and furniture. That is, the microphone array can use beamforming technology to obtain higher signal to noise ratio (SNR) for sound signals originating from the beam in the direction of interest. Therefore, beamforming plays an important role in spatial filtering, which points the "beam" to the sound source and suppresses all signals coming from different directions.
일반적으로 마이크로폰 어레이를 통해 형성되는 빔패턴은 어레이로 입력되는 입력신호의 방향에 따라 취득되는 정도를 이득(Gain)으로 계산되는데, 이와 같이 계산된 이득은 도 1과 같이 나타낼 수 있다. 마이크로폰 어레이에서 정면으로 향하 는 90°부근에서 이득이 가장 높아지며, 다른 방향의 이득은 현저하게 낮아진다. 도 1에서 입력신호의 이득이 가장 큰 방향에서 형성된 빔을 메인로브(mainlobe)라고 하며, 그밖에 다른 방향에 낮은 이득으로 형성된 빔을 사이드로브(sidelobe)라고 한다. 빔포밍은 음성신호를 취득하고자 하는 방향의 메인로브가 최대의 이득을 가지도록 유지하며, 사이드로브의 이득은 최소화하도록 하는 것에 목적이 있다. 그리고 이와 같은 빔포밍 특성은 모든 주파수 영역에서 일관되게 나타날수록 효과적인 성능을 보여준다.In general, the beam pattern formed through the microphone array is calculated as a gain obtained according to the direction of an input signal input to the array, and the gain thus calculated may be represented as shown in FIG. 1. In the microphone array, the gain is highest near 90 ° to the front and the gain in the other direction is significantly lower. In FIG. 1, a beam formed in a direction in which the gain of the input signal is greatest is called a mainlobe, and a beam formed in a low gain in other directions is called a sidelobe. The beamforming aims to keep the main lobe of the direction in which the audio signal is to be obtained to have the maximum gain, and to minimize the gain of the side lobe. And such beamforming characteristics show more effective performance as they appear consistently in all frequency domains.
일반적으로 마이크로폰 어레이를 구비하는 장치에서 마이크로폰 어레이는 일정한 간격으로 한중으로 배열되어 있는 균등(Uniform) 배열 방식을 사용하거나, 마이크로폰 어레이가 음원을 마주보고 늘어서 있는 방식을 사용한다. 상기의 형태로 구성되는 마이크로폰 어레이 빔형성과 관련된 기술은 국내특허 2001-7005783호, 2003-0014006호, 2004-0013029호에 기재되어 있다.In general, in a device having a microphone array, the microphone array uses a uniform arrangement method, which is arranged in a single space at regular intervals, or a method in which the microphone array is lined up to face a sound source. The technology related to the microphone array beam forming configured in the above form is described in Korean Patent Nos. 2001-7005783, 2003-0014006, and 2004-0013029.
선(line)형으로 배치된 마이크로폰 어레이에 음원이 입력되는 방식은 마이크로폰 어레이의 배열 위치에 따라 브로드사이드(broadside) 방식과 엔드파이어(endfire) 방식으로 구분할 수 있다. 도 2를 참조하면, 브로드사이드 방식과 엔드파이어 방식의 차이를 보여준다. 브로드사이드 방식은 입력신호 위치가 마이크로폰 어레이가 배열된 방향의 수직 방향에 위치하는 방식이다. 또한, 엔드파이어 방식은 입력신호 위치가 마이크로폰 어레이가 배열된 방향의 연장선 상에 위치하는 방식이다. 이때, 입력신호가 하나의 주파수 성분으로만 이루어져 있다면, 도 1과 같이 하나의 2차원 평면으로 빔패턴을 완벽하게 표현이 가능하다. 하지만 실제 입 력신호의 주파수 대역은 넓게 형성되어 있으므로, 각각의 주파수에서 형성된 빔패턴을 세부적으로 표현하여 분석할 필요가 있다.The sound source is input to the microphone array arranged in a line form, and may be classified into a broadside method and an endfire method according to the arrangement position of the microphone array. Referring to FIG. 2, the difference between the broadside method and the endfire method is shown. The broadside method is a method in which the input signal position is located in the vertical direction of the direction in which the microphone array is arranged. In addition, the endfire method is a method in which the input signal position is located on an extension line in the direction in which the microphone array is arranged. In this case, if the input signal consists of only one frequency component, as shown in FIG. 1, the beam pattern can be perfectly represented in one two-dimensional plane. However, since the frequency band of the actual input signal is wide, it is necessary to express and analyze the beam pattern formed at each frequency in detail.
한편, 이와 같이 마이크로폰 어레이와 입력신호의 위치에 따른 브로드사이드 방식과 엔드파이어 방식으로 형성된 빔은 도 3과 같이 도시할 수 있다. 도 3을 참조하면, 마이크로폰 어레이로 입력되는 신호를 1Hz에서부터 4000Hz까지 세부적으로 분류해서 표현하고 있다. 도 3에서 가운데 방향으로 진하게 형성된 것이 메인로브임을 알 수 있다. 또한, 도 3은 입력신호를 MVDR 알고리즘을 적용하여 계산한 결과 즉, 형성된 빔패턴이다. 여기서, MVDR 알고리즘은 일반적인 빔패턴 인식을 위해 사용되는 알고리즘이므로 본 발명에서 이 알고리즘에 대한 구체적인 설명을 생략하도록 한다.Meanwhile, the beam formed in the broadside method and the endfire method according to the position of the microphone array and the input signal may be illustrated in FIG. 3. Referring to FIG. 3, signals input to the microphone array are classified and expressed in detail from 1 Hz to 4000 Hz. In FIG. 3, it can be seen that the main lobe is formed in a dark direction. 3 is a result of calculating the input signal by applying the MVDR algorithm, that is, the formed beam pattern. Here, since the MVDR algorithm is used for general beam pattern recognition, a detailed description of this algorithm will be omitted in the present invention.
도 3을 참조하여 상기의 두 방식의 결과를 비교하면, (a)는 입력신호가 브로드사이드 방식으로 마이크로폰 어레이에 입력된 경우 형성된 빔 패턴이다. 또한, (b)는 입력신호가 엔드사이드 방식으로 마이크로폰 어레이에 입력된 경우 형성된 빔 패턴이다. (a)를 참조하면, 음성신호가 입력되는 방향인 90° 부근으로 메인로브가 형성되는 것을 볼 수 있다. 하지만, 형성된 메인로브의 폭이 넓어서 이득 특성이 약한 것을 알 수 있다. 특히, 저주파 대역에서는 모든 방향에서 이득 값이 0.5보다 커서 메인로브의 폭은 매우 넓어지며, 마이크로폰 어레이를 향한 거의 모든 방향의 입력신호를 받아들이게 된다. 이렇게 함으로써 빔포밍의 정상적인 기능 수행하는 것에 큰 방해가 된다.Referring to FIG. 3, the results of the above two schemes are compared, and (a) is a beam pattern formed when the input signal is input to the microphone array in a broadside manner. Further, (b) is a beam pattern formed when the input signal is input to the microphone array in an endside manner. Referring to (a), it can be seen that the main lobe is formed near 90 ° in which the voice signal is input. However, it can be seen that the gain characteristics are weak due to the wide width of the formed main lobe. In particular, in the low frequency band, the gain value is larger than 0.5 in all directions, so the width of the main lobe becomes very wide, and receives input signals in almost all directions to the microphone array. This greatly interferes with the normal functioning of the beamforming.
상술한 바와 같이 종래의 음성인식 장치에 마이크로폰 어레이를 장착하는 방식은 도 4와 같이 입력신호와 수직 방향인 브로드사이드 방향으로 배열하는 방식을 사용한다. 이와 같이 마이크로폰 어레이를 브로드사이드 방향으로 배열하는 방식으로 인해 형성된 빔은 지향성이 다소 약하며, 음원의 방향 외에서 들어오는 신호를 억압하는 정도가 낮은 단점이 있다. 또한, 마이크로폰이 등 간격으로 배열 되어있기 때문에, 입사각이 같더라도 저주파대역에서는 입력신호의 파장의 길이가 마이크로폰 사이의 간격보다 훨씬 길어서 메인로브의 이득 특성을 매우 약해지게 된다.As described above, the microphone array is mounted in the conventional voice recognition apparatus using a method of arranging the microphone array in a broadside direction perpendicular to the input signal as shown in FIG. 4. As such, the beams formed by the microphone arrays arranged in the broadside direction have a weak directivity, and have a low degree of suppressing a signal coming out of the direction of the sound source. In addition, since the microphones are arranged at equal intervals, even if the angle of incidence is the same, in the low frequency band, the length of the wavelength of the input signal is much longer than the interval between the microphones, which greatly weakens the gain characteristic of the main lobe.
따라서 본 발명은 음성신호의 입력 방향으로 고지향성을 가지는 빔패턴을 형성하기 위한 마이크로폰 어레이를 구비하는 음성인식 장치 및 그 마이크로폰 어레이를 구동하기 위한 방법에 관한 것이다.Accordingly, the present invention relates to a voice recognition device having a microphone array for forming a beam pattern having a high directivity in the input direction of a voice signal, and a method for driving the microphone array.
또한, 본 발명은 마이크로폰 어레이를 이용하여 음성을 인식하는 장치에서 실내 환경에서 주변에서 발생하는 소음을 억제하고, 사용자의 음성 신호를 좀 더 정확하게 인식할 수 있도록 하기 위한 마이크로폰 어레이 장치 및 그 마이크로폰 어레이 장치에서의 마이크로폰 어레이를 구동하기 위한 방법에 관한 것이다.In addition, the present invention is a microphone array device and a microphone array device for suppressing the noise generated in the surrounding environment in the indoor environment in the device for recognizing the voice using the microphone array, and more accurately recognize the user's voice signal A method for driving a microphone array in.
상술한 바를 달성하기 위한 본 발명은 마이크로폰 어레이를 이용하여 음성을 인식하는 음성인식 장치에 있어서, 적어도 둘 이상의 마이크로폰으로 구성되고, 음성입력을 엔드파이어 방향으로 입력받을 수 있도록 상기 음성인식 장치에 엔드파이어 형태로 장착한 마이크로폰 어레이와, 상기 마이크로폰 어레이를 내장하기 위한 마이크로폰 어레이 내장부와, 상기 마이크로폰 어레이 구동을 위한 제어신호에 따라 상기 마이크로폰 어레이를 상기 마이크로폰 어레이 내장부로부터 돌출 또는 내장시키는 마이크로폰 어레이 구동부와, 사용자가 인식되면 마이크로폰 어레이를 돌출시키기 위한 제어신호를 상기 마이크로폰 어레이 내장부로 출력하는 제어부를 포함함을 특징으로 한다.According to an aspect of the present invention, a voice recognition device for recognizing a voice using a microphone array includes at least two microphones and an end fire in the voice recognition device to receive a voice input in an end fire direction. A microphone array mounted in a form, a microphone array embedding unit for embedding the microphone array, a microphone array driving unit for protruding or embedding the microphone array from the microphone array embedding unit according to a control signal for driving the microphone array; And a control unit for outputting a control signal for projecting the microphone array to the microphone array embedded unit when the user is recognized.
또한, 본 발명은 마이크로폰 어레이를 이용하여 음성을 인식하는 음성인식 장치에서 상기 마이크로폰 어레이를 구동하기 위한 방법에 있어서, 적어도 둘 이상의 마이크로폰으로 구성되고, 음성입력을 엔드파이어 방향으로 입력받을 수 있도록 상기 음성인식 장치에 엔드파이어 형태로 장착한 마이크로폰 어레이와 마이크로폰 어레이를 내장하기 위한 마이크로폰 어레이 내장부를 구비하는 과정과, 사용자가 인식되는지 검사하는 과정과, 사용자가 인식되면 마이크로폰 어레이를 상기 마이크로폰 어레이 내장부로부터 돌출시키는 과정과, 상기 마이크로폰 어레이를 상기 마이크로폰 어레이 내장부로부터 돌출시킨 후, 미리 설정된 시간동안 음성신호 입력이 없으면 상기 마이크로폰 어레이를 상기 마이크로폰 어레이 내장부로 내장시키는 과정을 포함하여 이루어짐을 특징으로 한다.In addition, the present invention is a method for driving the microphone array in a speech recognition apparatus for recognizing speech using a microphone array, comprising at least two microphones, so that the voice input can be received in the end fire direction Providing a microphone array mounted in an endfire form in the recognition device and a microphone array embedding unit for embedding the microphone array, checking whether the user is recognized, and protruding the microphone array from the microphone array embedding unit if the user is recognized. And protruding the microphone array from the microphone array internal part, and then embedding the microphone array into the microphone array internal part if there is no voice signal input for a predetermined time. It characterized by more than true.
이하 본 발명의 바람직한 실시 예들을 첨부한 도면을 참조하여 상세히 설명한다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의해야 한다. 또한 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. It should be noted that the same elements in the figures are represented by the same numerals wherever possible. In addition, detailed descriptions of well-known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.
본 발명은 마이크로폰 어레이를 사용하는 음성인식 장치에 마이크로폰 어레이를 엔드파이어 형태로 구성함으로써 사용자가 입력하는 음성신호 방향으로 샤프(sharp)한 빔이 형성되도록 한다. 이와 같이 음성인식 장치에 음원이 제공되는 방향으로 집중하여 샤프한 빔이 형성되도록 마이크로폰 어레이를 장착함으로써 주위의 잡음신호를 억제하고 사용자 음성신호를 더 정확하게 인식할 수 있도록 하기 위한 방안을 제공한다.The present invention configures the microphone array in the form of an end fire in the voice recognition device using the microphone array so that a sharp beam is formed in the direction of the voice signal input by the user. The microphone array is mounted in such a way that a sharp beam is formed by concentrating in the direction in which the sound source is provided to the voice recognition device, thereby providing a method for suppressing the surrounding noise signal and recognizing the user's voice signal more accurately.
그러면, 도 5을 참조하여 본 발명의 실시 예에 따라 음원이 제공되는 방향으로 샤프한 빔을 형성하기 위해 마이크로폰 어레이를 엔드파이어 형태로 장착한 음성인식 장치에 대하여 살펴보도록 한다.Then, a voice recognition apparatus equipped with a microphone array in the form of an end fire to form a sharp beam in a direction in which a sound source is provided according to an embodiment of the present invention will be described with reference to FIG. 5.
제어부(500)는 음성인식 장치의 전반적인 동작을 제어하고, 마이크로폰 어레이(504)를 통해 입력되는 입력신호를 공간 필터링하는 빔포밍부(508)를 통해 빔포밍 동작을 수행한 후 음성인식, 사용자 인식과 같은 동작을 수행한다. 특히, 본 발명에 따라 음원이 제공되는 이벤트가 발생하면 마이크로폰 어레이 구동부(506)를 제어하여 마이크로폰 어레이(504)가 자동으로 돌출되도록 제어한다. 또한, 음원이 미리 설정된 시간동안 입력되지 않으면 마이크로폰 어레이 구동부(506)를 제어하여 돌출된 마이크로폰 어레이(504)가 마이크로폰 어레이 내장부(502)로 내장되도록 한다. The
메모리부(510)는 음성인식을 위한 프로그램을 저장하고, 음성인식 동작에서 발생하는 데이터를 저장한다.The
마이크로폰 어레이(504)는 마이크로폰 어레이 내장부(502)에 내장되고, 본 발명에서의 마이크로폰 어레이(504)는 적어도 둘 이상의 마이크로폰으로 구성된다. 또한, 마이크로폰 어레이(504)는 마이크로폰 어레이 구동부(506)의 구동신호에 따라 마이크로폰 어레이 내장부(502)에 내장되거나 돌출된다. 또한, 본 발명에 따른 마이크로폰 어레이(504)는 입력신호 방향으로 샤프하게 빔형성이 될 수 있도록 음성 인식장치에 엔드파이어 형태로 장착한다. 본 발명에서는 상기와 같이 음성 인식장치에 엔드파이어 형대로 마이크로폰 어레이(504)를 장착함으로써 입력신호를 마이크로폰 어레이(504)를 통해 필터링할 때 더 향상된 지향 특성을 가질 수 있도록 한다. 즉, 실내 환경에서 주변에서 발생하는 소음을 억제하고, 사용자의 음성 신호를 더 명확하게 음성 인식장치가 인식할 수 있도록 마이크로폰 어레이(504)를 구성한다.The
그러면, 마이크로폰 어레이(504)가 엔드파이어 형태로 음성 인식장치에 장착되는 경우에 대하여 도 7을 참조하여 살펴보도록 한다. 도 7은 음성 인식장치 중 로봇의 경우에 마이크로폰 어레이(504)가 엔드파이어 형태로 로봇에 장착되는 예를 도시하고 있다. 이때, 마이크로폰의 어레이(504)는 사용자의 음성이 발성되는 위치와 같은 높이에 장착되는 것이 가장 이상적이다. 일반적으로 로봇의 신장이 사람의 신장보다 작기 때문에 마이크로폰 어레이(504)가 사용자가 위치하는 방향을 향해 위를 바라보도록 설계하는 경우를 예로 보여준다. 도 7과 같이 로봇의 상단에 엔드파이어 형태로 어레이를 설치하여, 형성된 빔이 최대한 사용자의 방향으로 향할 수 있도록 각도를 조절해야 할 필요가 있다. 또한, 로봇의 상단에 장착된 마이크로폰 어레이(504)가 지속적으로 외부에 돌출되어 있는 상태를 유지한다면, 외부의 충격 에 손상이 위험이 있을 수 있다. 또한, 마이크로폰 어레이(504)를 사용하지 않을 경우에는 이동중에 장애가 될 요인이 될 수 있다.Then, the case in which the
따라서, 본 발명에서는 로봇 내부에 마이크로폰 어레이(504)가 내장되는 공간인 마이크로폰 어레이 내장부(502)를 구비한다. 또한, 마이크로폰 어레이(504)를 마이크로폰 어레이 내장부(502)에 내장 및 돌출되도록 하기 위한 소형 전동기인 마이크로폰 어레이 구동부(506)를 구비한다. 이와 같이 마이크로폰 어레이 내장부(502)와 마이크로폰 어레이 구동부(506)를 구비하는 음성인식 장치에서 마이크로폰 어레이(504)를 사용하지 않는 경우인 평소에는 로봇의 마이크로폰 어레이 내장부(502)에 마이크로폰 어레이(504)를 내장시키도록 한다. 또한, 음성신호의 입력이 필요한 경우에만 자동적으로 마이크로폰 어레이(504)를 외부로 돌출시키도록 한다. 이때, 얼굴인식, 옷색깔 인식, 키 인식 또는 음원 인식을 통해 음성신호의 입력이 필요한 경우를 음성인식 장치로 자동으로 음성신호의 입력이 필요한 경우임을 인식시킬 수도 있다. 만약, 얼굴인식 옷색깔 인식, 키 인식과 같은 영상신호를 기반으로 사용자를 인식하는 경우에는 음성인식 장치에 카메라를 설치한 후, 사용자가 음성인식 장치의 정면에 위치할 때를 인식하도록 한 후에 마이크로폰 어레이가 돌출되도록 동작시킬 수 있다. 또한, 마이크로폰 어레이를 돌출하도록 터치 센서 또는 리모콘 등을 이용해서 사용자가 음성인식 장치로 직접 음성신호의 입력이 필요한 경우임을 인지시킬 수도 있다.Therefore, the present invention includes a microphone
빔포밍부(508)는 마이크로폰 어레이(504)로부터 입력되는 입력신호를 공간 필터링한다. 이후, 빔포밍부(508)를 거쳐 출력되는 신호는 음성인식, 사용자 인식 과 같은 인식 동작에 사용되거나, 추가적인 잡음제거 알고리즘에 연결되어 적용될 수도 있다.The
또한, 상기와 같이 음성인식 장치에 엔드파이어 형태로 마이크로폰 어레이를 장착한 경우 입력되는 음원에 대하여 빔포밍부(508)를 통해 형성되는 빔패턴은 도 3의 (b)와 같이 나타낼 수 있다. 도 3을 참조하면, (b)와 같이 엔드파이어 방향으로 음원이 입력되는 방식과 (a)와 같이 브로드사이트 방향으로 음원이 입력되는 방식을 비교하면, 엔드파이어 방향으로 음원이 입력되는 방식이 메인 로브와 사이드로브의 이득의 차이가 더 크게 나타난다. 또한, 엔드파이어 방향으로 음원이 입력되는 방식이 저주파에서 고주파 대역까지 모든 주파수 대역에서 거의 일정하게 메인로브의 폭을 유지하고 있다. 즉, 엔드파이어 방식으로 음원이 입력될 시 음성신호에 대하여 지향성이 더 높은 것을 알 수 있다. 여기에서 마이크로폰 어레이(504)를 구성하는 마이크로폰의 수가 증가할수록 메인로브의 폭은 더 좁아지며 사이드로브의 이득은 더욱 낮아지는 특징을 보인다. 따라서 마이크로폰 어레이(504)를 장착할 장치의 부피와 원하는 성능의 목적에 맞는 마이크로폰의 수를 조절해서 적용할 수 있다.In addition, when the microphone array is mounted on the voice recognition device in the form of an end fire as described above, the beam pattern formed through the
그러면, 본 발명의 실시 예에 따른 음성인식 장치에서 엔드파이어 형태로 장착된 마이크로폰 어레이를 통해 입력된 음성신호가 빔포밍부(508)로 입력될 시 빔포밍부(508)에서 형성되는 빔패턴을 도 3의 (b)를 참조하여 살펴보도록 한다. 도 3의 (b)의 빔패턴은 MVDR(Minimum Variance Distortionless Response) 알고리즘을 사용하여 수퍼디렉티브(superdirective) 빔포밍부(508)를 구성한 것이다. 이때, 형 성되는 빔패턴은 물리적으로 형성되는 빔이 아니고, 입력되는 입력신호를 빔패턴 형성을 위한 수학식을 통해 형성되는 것이다. 따라서, 본 발명의 실시 예에 따른 MVDR 알고리즘을 사용하여 빔패턴을 구성하는 수식은 다음의 전개 과정을 통해 얻을 수 있다.Then, when the voice signal input through the microphone array mounted in the form of an end fire in the voice recognition device according to an embodiment of the present invention is input to the
시간영역에서 입력된 음성신호를 주파수 영역으로 변환시킨 후에 빔포밍부(508)로 입력하면, 빔포밍부의 출력값 은 하기의 <수학식 1>과 같이 도출될 수 있다.When the voice signal input in the time domain is converted into the frequency domain and input to the
이때, 필터의 계수 는 잡음 환경의 형태에 따라 달라지며, MVDR 알고리즘을 이용하여 최적의 값을 얻을 수 있다. 그 수식은 하기의 <수학식 2>와 같다.At this time, the coefficient of the filter Depends on the shape of the noise environment, and the optimal value can be obtained using the MVDR algorithm. The formula is shown in Equation 2 below.
여기에서 은 잡음 신호의 N*N 크기의 전력 스펙트럼 밀도(PSD) 행렬이며, d는 마이크로폰이 음원을 향하도록 방향을 결정지어 주는 벡터이다. 로봇에서 사용할 선형(linear) 어레이에서는 d를 하기의 <수학식 3>과 같다.From here Is the N * N magnitude power spectral density (PSD) matrix of the noise signal, and d is a vector that directs the microphones toward the sound source. In the linear array to be used in the robot, d is represented by Equation 3 below.
구체적으로 n번째 해당하는 값은 이며, c는 음속 , 는 마이크로폰 어레이가 음원을 향하는 각도이다. 이때, 엔드파이어의 경우에는 =0이고, 브로드사이드의 경우에는 이다. Specifically, the nth corresponding value is C is the speed of sound, Is the angle at which the microphone array is facing the sound source. At this time, in the case of end fire = 0 and for Broadside to be.
또한, 잡음신호가 실내 공간에서 정상성(stationary)을 보이고, 호모지니우스(homogeneous)하다고 가정한다면, 잡음은 전력 스펙드럼 밀도 를 가진다.Also, if the noise signal is stationary in the indoor space and is assumed to be homogeneous, then the noise is a power spectral density. Has
두 신호 의 복소 코히런스(coherence)는 하기의 <수학식 4>와 같이 정의할 수 있다.Two signals The complex coherence of may be defined as in Equation 4 below.
상기의 <수학식 4>에서의 필터 계수는 코히런스를 사용하여, 하기의 <수학식 5>와 같이 나타낼 수 있다.The filter coefficients in Equation 4 may be expressed as Equation 5 below using coherence.
일반적으로 실내 잡음환경에서는 벽과 가구 등의 장애물로 인해 파형이 반사 되어 퍼져나간다. 이것으로 인해 공간의 모든 위치에 마이크로폰으로 입력되는 파형의 전력(power)은 일정하다고 간주하는데, 이것을 디퓨즈(Diffuse) 환경이라고 한다. 이와 같은 디퓨즈 환경에서 코히런스는 하기의 <수학식 6>과 같이 모델링한다.In general, in the indoor noise environment, the waveform is reflected and spread due to obstacles such as walls and furniture. Because of this, the power of the waveform input to the microphone at every location in the space is considered to be constant, which is called a diffuse environment. In this diffuse environment, coherence is modeled as in
여기에서 는 두 마이크로폰 i와 j 사이의 간격을 말한다.From here Is the distance between two microphones i and j.
상기와 같은 <수학식 5>, <수학식 6>을 사용하여 엔드파이어 방향에서 입력되는 입력신호의 주파수에 따라 형성된 빔은 도 3과 같이 음성신호에 대한 필터링의 지향 특성을 향상시킬 수 있음을 알 수 있다.Using the
물론, 본 발명의 실시 예에 따라 빔패턴 구성 시 MVDR 알고리즘을 사용하는 예를 기재하였지만, MVDR 알고리즘은 빔패턴을 구성하는 알고리즘 중 하나의 알고리즘이므로 다른 빔패턴을 구성하기 위한 알고리즘을 사용할 수 있다. Of course, an example of using the MVDR algorithm when configuring the beam pattern according to an embodiment of the present invention has been described. However, since the MVDR algorithm is one of the algorithms constituting the beam pattern, an algorithm for configuring another beam pattern may be used.
그러면, 상기의 도 5와 같이 엔드파이어 형태의 마이크로폰 어레이를 장착한 음성인식 장치에서 마이크로폰 어레이(504)를 구동하기 위한 과정에 대하여 도 6을 참조하여 살펴보도록 한다.Next, a process for driving the
먼저, 600단계에서 음성인식 장치의 제어부(500)는 대기상태를 유지하다가 602단계에서 음성 서비스가 설정되면 604단계로 진행한다. 이때, 음성 서비스란 음성인식 장치가 입력되는 입력신호 중 필터링을 거쳐 잡음신호를 제거한 후 음성신 호를 추출하고, 추출된 음성신호를 특정 명령으로 인식하여 명령에 대응되는 동작을 수행하는 서비스이다.First, in
602단계에서 음성 서비스가 설정되었으면 604단계로 진행하여 제어부(500)는 사용자 인식을 자동으로 하기 위한 자동모드가 설정되었는지 수동으로 하기 위한 수동모드가 설정되었는지 검사한다.If the voice service is set in
만약, 수동모드가 설정되었다면 제어부(500)는 618단계로 진행하여 사용자 인식을 위한 이벤트가 발생하였는지 검사한다. 이때, 사용자 인식을 위한 이벤트란 사용자가 음성인식 장치에게 곧 음성입력을 할 것이므로 음성인식을 위한 준비를 하라는 명령을 음성인식 장치로 입력하는 이벤트를 말한다. 예를 들어, 터치 센서 또는 적외선 모듈 등의 방식을 이용하여 간단하게 설계되는 리모콘 등을 이용해서 사용자가 음성인식 장치로 직접 음성신호의 입력이 필요한 경우임을 인지시킬 수도 있다. 만약, 618단계 검사 결과 사용자 인식을 위한 이벤트가 발생하였으면 608단계로 진행한다.If the manual mode is set, the
한편 604단계 검사결과 만약 자동모드가 설정되었다면 606단계로 진행하여 제어부(500)는 음원 추적을 통해 음원 방향을 인지한다. 이때, 음성인식 장치의 제어부(500) 음원 추적을 통해 음원 방향을 인지하는 기술은 일반적인 기술이므로 본 발명의 상세한 설명에서 구체적인 기술내용의 기재는 생략하도록 한다.If the automatic mode is set in
한편, 618단계 및 606단계에서 진행한 608단계에서 제어부(500)는 마이크로폰 어레이 구동부(506)로 마이크로폰 어레이(504)를 돌출시키도록 구동하기 위한 제어신호를 출력한다. 그러면, 돌출시키도록 구동하기 위한 제어신호를 입력받은 마이크로폰 어레이 구동부(506)는 608단계에서 마이크로폰 어레이 내장부(502)로부터 마이크로폰 어레이(504)를 돌출시킨다. 이후, 610단계에서 제어부(500)는 마이크로폰 어레이(504)를 통해 입력되는 음성신호를 획득하여 빔포밍부(508)로 출력함으로써 빔포밍부(508)에서 빔포밍 동작을 수행하도록 제어한다.In
이후, 612단계에서 제어부(500)는 미리 설정된 소정의 시간동안 음성신호 입력이 없는 지를 검사한다. 이때, 제어부(500)는 메모리부(510)에 저장된 미리 설정된 소정의 시간 동안 음성입력이 없으면 음성입력이 없는 것으로 판단한다.Thereafter, in
만약, 612단계 검사결과 미리 설정된 시간동안 음성신호 입력이 없는 것으로 판단되면 제어부(500)는 마이크로폰 어레이(504)를 마이크로폰 어레이 내장부(520)에 내장시키도록 구동하기 위한 구동 제어신호를 마이크로폰 어레이 구동부(506)로 출력한다. 그러면, 마이크로폰 어레이 구동부(506)는 614단계에서 돌출된 마이크로폰 어레이(504)를 마이크로폰 어레이 내장부(502)로 자동 내장시킨다. 즉, 이와 같이 함으로써 음성입력이 없는 경우에 돌출된 마이크로폰 어레이(504)를 음성인식 장치의 마이크로폰 어레이 내장부(502)에 내장시키는 것이다.If it is determined in
이후, 614단계에서 616단계로 진행하면 제어부(500)는 음성 서비스 종료를 위한 요구가 있는지 검사한 후, 만약 음성 서비스 종료를 위한 요구가 있으면 종료하고, 그렇지 않으면 604단계로 진행하여 계속하여 음성 서비스를 위한 동작을 수행한다.Thereafter, if the process proceeds from
상기와 같이 본 발명은 엔드파이어 형태의 마이크로폰 어레이를 음성인식 장치에 내장되도록 장착한 후 사용자가 인식되면 마이크로폰 어레이를 돌출한 후에, 마이크로폰 어레이를 통해 주변 환경의 잡음을 억제하고 음성신호를 좀 더 정확하게 입력 받을 수 있도록 한다. 이와 같이 입력받은 음성신호는 음성인식, 화자인식과 같은 다양한 방식의 음성 인터페이스 기능을 수행할 수 있다. 한편, 본 발명의 실시 예에서는 음성인식 장치의 예를 로봇의 예를 들어 설명하였지만, 모든 마이크로폰 어레이를 사용하여 음성을 인식하는 음성인식 장치에서 마이크로폰 어레이를 상기와 같이 엔드파이어 형태로 장착할 수 있다. 또한, 엔드파이어 형태의 마이크로폰 어레이를 장착한 음성인식 장치에 상기의 도 6와 같은 과정과 같이 마이크로폰 어레이를 구동시킬 수 있다.As described above, the present invention mounts the end-fired microphone array to be embedded in the voice recognition device, and then, if the user is recognized, protrudes the microphone array, thereby suppressing the noise of the surrounding environment through the microphone array and more accurately correcting the voice signal. Allow input. The input voice signal may perform a voice interface function of various methods such as voice recognition and speaker recognition. Meanwhile, in the embodiment of the present invention, an example of a voice recognition device has been described as an example of a robot, but in the voice recognition device that recognizes voice using all the microphone arrays, the microphone array may be mounted in the form of an end fire as described above. . In addition, the microphone array may be driven in the voice recognition apparatus equipped with the endfire type microphone array as shown in FIG. 6.
상술한 바와 같이 본 발명의 음성인식 장치는 음성신호의 입력 방향으로 고지향성을 가지는 빔패턴을 형성하기 위해 엔드파이어 형태의 마이크로폰 어레이를 구비한다. 이와 같이 엔드파이어 형태로 구비되는 마이크로폰 어레이를 통해 형성되는 빔은 종래의 브로드사이드 방식보다 더 정확하게 사용자의 음성 방향으로 방향성을 가질 수 있다. 즉, 사용자의 음성이 나오는 방향외의 다른 곳에서 오는 소음을 더 많이 억제 할 수 있는 이점이 있다.As described above, the voice recognition device of the present invention includes an end-fired microphone array to form a beam pattern having high directivity in the input direction of the voice signal. As such, the beam formed through the microphone array provided in the form of an end fire may have direction in the voice direction of the user more accurately than the conventional broadside method. That is, there is an advantage that can suppress more noise coming from a place other than the direction of the user's voice.
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070012222A KR100922963B1 (en) | 2007-02-06 | 2007-02-06 | User speech recognition apparatus using microphone array and method for driving microphone array |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070012222A KR100922963B1 (en) | 2007-02-06 | 2007-02-06 | User speech recognition apparatus using microphone array and method for driving microphone array |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080073516A KR20080073516A (en) | 2008-08-11 |
KR100922963B1 true KR100922963B1 (en) | 2009-10-22 |
Family
ID=39883262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070012222A KR100922963B1 (en) | 2007-02-06 | 2007-02-06 | User speech recognition apparatus using microphone array and method for driving microphone array |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100922963B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012036424A2 (en) * | 2010-09-13 | 2012-03-22 | Samsung Electronics Co., Ltd. | Method and apparatus for performing microphone beamforming |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102623998B1 (en) * | 2018-07-17 | 2024-01-12 | 삼성전자주식회사 | Electronic device for speech recognition and method thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5715319A (en) * | 1996-05-30 | 1998-02-03 | Picturetel Corporation | Method and apparatus for steerable and endfire superdirective microphone arrays with reduced analog-to-digital converter and computational requirements |
KR19980054696A (en) * | 1996-12-27 | 1998-09-25 | 구자홍 | Directional controller and control method of microphone system |
US20050169487A1 (en) | 1999-03-05 | 2005-08-04 | Willem Soede | Directional microphone array system |
KR20060044008A (en) * | 2004-11-11 | 2006-05-16 | 주식회사 대우일렉트로닉스 | Speech recognition device for discriminating multiple speakers |
-
2007
- 2007-02-06 KR KR1020070012222A patent/KR100922963B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5715319A (en) * | 1996-05-30 | 1998-02-03 | Picturetel Corporation | Method and apparatus for steerable and endfire superdirective microphone arrays with reduced analog-to-digital converter and computational requirements |
KR19980054696A (en) * | 1996-12-27 | 1998-09-25 | 구자홍 | Directional controller and control method of microphone system |
US20050169487A1 (en) | 1999-03-05 | 2005-08-04 | Willem Soede | Directional microphone array system |
KR20060044008A (en) * | 2004-11-11 | 2006-05-16 | 주식회사 대우일렉트로닉스 | Speech recognition device for discriminating multiple speakers |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012036424A2 (en) * | 2010-09-13 | 2012-03-22 | Samsung Electronics Co., Ltd. | Method and apparatus for performing microphone beamforming |
WO2012036424A3 (en) * | 2010-09-13 | 2012-06-28 | Samsung Electronics Co., Ltd. | Method and apparatus for performing microphone beamforming |
US9330673B2 (en) | 2010-09-13 | 2016-05-03 | Samsung Electronics Co., Ltd | Method and apparatus for performing microphone beamforming |
Also Published As
Publication number | Publication date |
---|---|
KR20080073516A (en) | 2008-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11509999B2 (en) | Microphone array system | |
US9113242B2 (en) | Sound source signal processing apparatus and method | |
KR100499124B1 (en) | Orthogonal circular microphone array system and method for detecting 3 dimensional direction of sound source using thereof | |
US9774970B2 (en) | Multi-channel multi-domain source identification and tracking | |
US20210152946A1 (en) | Audio Analysis and Processing System | |
US9820036B1 (en) | Speech processing of reflected sound | |
CN105532017B (en) | Device and method for Wave beam forming to obtain voice and noise signal | |
CN106872945B (en) | Sound source positioning method and device and electronic equipment | |
KR100856246B1 (en) | Beamforming Apparatus and Method Reflecting Characteristics of Real Noise Environment | |
JP4376902B2 (en) | Voice input system | |
US8204248B2 (en) | Acoustic localization of a speaker | |
RU2559520C2 (en) | Device and method for spatially selective sound reception by acoustic triangulation | |
US20070172076A1 (en) | Moving object equipped with ultra-directional speaker | |
US20160165338A1 (en) | Directional audio recording system | |
KR20120071452A (en) | Directonal sound source filtering apparatus using microphone array and controlling method thereof | |
CN107068164B (en) | Audio signal processing method and device and electronic equipment | |
JP2005253071A (en) | System and method for beamforming using microphone array | |
CN103181190A (en) | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation | |
US20160161594A1 (en) | Swarm mapping system | |
JP2020503788A (en) | Audio capture using beamforming | |
US20180146285A1 (en) | Audio Gateway System | |
KR100922963B1 (en) | User speech recognition apparatus using microphone array and method for driving microphone array | |
CN112672251A (en) | Control method and system of loudspeaker, storage medium and loudspeaker | |
JP5086768B2 (en) | Telephone device | |
JP2001519110A (en) | Recording equipment especially for loudspeakers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20070206 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20080328 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20080929 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20090327 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20090925 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20091014 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20091014 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20120927 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20120927 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20130927 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20130927 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140929 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20140929 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150925 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20150925 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160929 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20160929 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170927 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20170927 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180921 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20180921 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20191014 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20191014 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20201111 Start annual number: 12 End annual number: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20230207 Start annual number: 14 End annual number: 14 |