KR102476600B1 - 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 - Google Patents
전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 Download PDFInfo
- Publication number
- KR102476600B1 KR102476600B1 KR1020150146422A KR20150146422A KR102476600B1 KR 102476600 B1 KR102476600 B1 KR 102476600B1 KR 1020150146422 A KR1020150146422 A KR 1020150146422A KR 20150146422 A KR20150146422 A KR 20150146422A KR 102476600 B1 KR102476600 B1 KR 102476600B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- trigger
- detected
- unit
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Circuit For Audible Band Transducer (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
Description
도 1b는 본 발명의 다른 실시 예에 따른 전자 장치의 구성을 설명하기 위한 개략적인 블럭도,
도 2는 본 발명의 일 실시 예에 따른 전자 장치의 전처리부를 설명하기 위한 블럭도,
도 3은 본 발명의 일 실시 예에 따른 전자 장치의 빔포밍부를 설명하기 위한 블럭도,
도 4는 본 발명의 일 실시 예에 따른 전자 장치의 음성 인식부를 설명하기 위한 도면,
도 5는 본 발명의 일 실시 예에 따른 전자 장치의 구성을 상세히 설명하기 위한 블럭도,
도 6a 및 도 6b는 본 발명의 다양한 실시 예에 따른 전자 장치의 오디오 입력부를 설명하기 위한 도면,
도 7은 본 발명의 일 실시 예에 따른 전자 장치에서의 신호, 정보의 전달을 설명하기 위한 도면, 그리고,
도 8은 본 발명의 일 실시 예에 따른 전자 장치의 음성 인식 방법을 설명하기 위한 흐름도이다.
120: 전처리부 121: 음성 검출부
123: 감지부 125: 빔포밍부
125-1: 고정 빔포밍부 125-3: 블록 매트릭스부
125-5: 다중 입력 상쇄부 125-7: 후 필터부
130: 음성 인식부 131: 트리거 인식부
133: 단어/문장 인식부 140: 모드 판단부
Claims (20)
- 서로 다른 위치에서 음원을 입력받아 복수의 음성 신호를 제공하는 오디오 입력부;
상기 복수의 음성 신호에 대한 전처리를 수행하는 전처리부; 및
상기 전처리부에서 처리된 음성 신호를 이용한 음성 인식에 대응하는 기능을 수행하여 기설정된 트리거가 감지되면 트리거 정보를 생성하는 음성 인식부;를 포함하고,
상기 전처리부는,
상기 음성 인식부에서 획득한 상기 트리거 정보를 피드백 받아, 상기 트리거 정보에 따라 전처리 방식을 변경하고, 상기 변경된 전처리 방식으로 상기 복수의 음성 신호를 처리하며,
상기 전처리부는,
상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하는 음성 검출부;
상기 복수의 음성 신호를 이용하여 발화 방향을 감지하기 위한 감지부; 및
상기 복수의 음성 신호를 이용하여 강화된 음성 신호를 획득하기 위한 빔포밍부;를 포함하고,
상기 음성 검출부는,
상기 트리거가 감지되지 않으면, 제1 길이의 행오버 길이에 기초하여 상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하고, 상기 트리거가 감지되면, 상기 제1 길이보다 긴 제2 길이의 상기 행오버 길이에 기초하여 상기 복수의 음성 신호에서 상기 유성 구간 및 상기 무성 구간을 식별하고,
상기 감지부는,
상기 유성 구간에서 상기 트리거가 감지되지 않으면, 이전 검색 범위 보다 검색 범위를 넓혀 상기 발화 방향을 감지하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 트리거가 감지된 방향에 대응되는 검색 범위에 대해서만 상기 발화 방향을 감지하고,
상기 빔포밍부는,
상기 무성 구간이 식별되면, 상기 강화된 음성 신호를 획득하기 위한 적응 필터의 스텝 사이즈를 최소 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되지 않으면, 상기 적응 필터의 스텝 사이즈를 중간 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 적응 필터의 스텝 사이즈를 최대 사이즈로 설정하는 전자 장치. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서,
영상을 표시하는 디스플레이부; 및
상기 음성 인식에 대응하는 기능에 따라 영상이 표시되도록 상기 디스플레이부를 제어하는 제어부;를 더 포함하는 것을 특징으로 하는 전자 장치. - 제1항에 있어서,
상기 음성 인식에 대응하는 기능의 결과를 외부 장치로 전달하는 통신부;를 더 포함하는 것을 특징으로 하는 전자 장치. - 제1항에 있어서,
상기 음성 인식에 대응하는 기능에 따라 음성 출력 이벤트를 출력하는 스피커부;를 더 포함하는 것을 특징으로 하는 전자 장치. - 서로 다른 위치에서 음원을 입력받아 복수의 음성 신호를 제공하는 단계;
상기 복수의 음성 신호에 대한 전처리를 수행하는 단계;
상기 전처리된 음성 신호를 이용한 음성 인식에 대응하는 기능을 수행하여 기설정된 트리거가 감지되면 트리거 정보를 획득하는 단계;
상기 트리거 정보를 피드백 하여, 상기 트리거 정보에 따라 전처리 방식을 변경하는 단계; 및
상기 변경된 전처리 방식으로 상기 복수의 음성 신호를 처리하는 단계;를 포함하며,
상기 복수의 음성 신호를 처리하는 단계는,
상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하는 단계;
상기 복수의 음성 신호를 이용하여 발화 방향을 감지하는 단계; 및
상기 복수의 음성 신호를 이용하여 강화된 음성 신호를 획득하는 단계;를 포함하고,
상기 식별하는 단계는,
상기 트리거가 감지되지 않으면, 제1 길이의 행오버 길이에 기초하여 상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하고, 상기 트리거가 감지되면, 상기 제1 길이보다 긴 제2 길이의 상기 행오버 길이에 기초하여 상기 복수의 음성 신호에서 상기 유성 구간 및 상기 무성 구간을 식별하고,
상기 발화 방향을 감지하는 단계는,
상기 유성 구간에서 상기 트리거가 감지되지 않으면, 이전 검색 범위 보다 검색 범위를 넓혀 상기 발화 방향을 감지하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 트리거가 감지된 방향에 대응되는 검색 범위에 대해서만 상기 발화 방향을 감지하고,
상기 강화된 음성 신호를 획득하는 단계는,
상기 무성 구간이 식별되면, 상기 강화된 음성 신호를 획득하기 위한 적응 필터의 스텝 사이즈를 최소 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되지 않으면, 상기 적응 필터의 스텝 사이즈를 중간 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 적응 필터의 스텝 사이즈를 최대 사이즈로 설정하는 전자 장치의 음성 인식 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 전자 장치의 음성 인식 방법을 실행하기 위한 프로그램을 포함하는 비일시적 컴퓨터 판독가능 기록매체에 있어서,
상기 음성 인식 방법은,
서로 다른 위치에서 음원을 입력받아 복수의 음성 신호를 제공하는 단계;
상기 복수의 음성 신호에 대한 전처리를 수행하는 단계;
상기 전처리된 음성 신호를 이용한 음성 인식에 대응하는 기능을 수행하여 기설정된 트리거가 감지되면 트리거 정보를 획득하는 단계;
상기 트리거 정보를 피드백 하여, 상기 트리거 정보에 따라 전처리 방식을 변경하는 단계; 및
상기 변경된 전처리 방식으로 상기 복수의 음성 신호를 처리하는 단계;를 포함하며,
상기 복수의 음성 신호를 처리하는 단계는,
상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하는 단계;
상기 복수의 음성 신호를 이용하여 발화 방향을 감지하는 단계; 및
상기 복수의 음성 신호를 이용하여 강화된 음성 신호를 획득하는 단계;를 포함하고,
상기 식별하는 단계는,
상기 트리거가 감지되지 않으면, 제1 길이의 행오버 길이에 기초하여 상기 복수의 음성 신호에서 유성 구간 및 무성 구간을 식별하고, 상기 트리거가 감지되면, 상기 제1 길이보다 긴 제2 길이의 상기 행오버 길이에 기초하여 상기 복수의 음성 신호에서 상기 유성 구간 및 상기 무성 구간을 식별하고,
상기 발화 방향을 감지하는 단계는,
상기 유성 구간에서 상기 트리거가 감지되지 않으면, 이전 검색 범위 보다 검색 범위를 넓혀 상기 발화 방향을 감지하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 트리거가 감지된 방향에 대응되는 검색 범위에 대해서만 상기 발화 방향을 감지하고,
상기 강화된 음성 신호를 획득하는 단계는,
상기 무성 구간이 식별되면, 상기 강화된 음성 신호를 획득하기 위한 적응 필터의 스텝 사이즈를 최소 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되지 않으면, 상기 적응 필터의 스텝 사이즈를 중간 사이즈로 설정하고, 상기 유성 구간에서 상기 트리거가 감지되면, 상기 적응 필터의 스텝 사이즈를 최대 사이즈로 설정하는 비일시적 컴퓨터 판독가능 기록매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150146422A KR102476600B1 (ko) | 2015-10-21 | 2015-10-21 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US15/761,506 US10796688B2 (en) | 2015-10-21 | 2016-10-21 | Electronic apparatus for performing pre-processing based on a speech recognition result, speech recognition method thereof, and non-transitory computer readable recording medium |
PCT/KR2016/011888 WO2017069556A1 (ko) | 2015-10-21 | 2016-10-21 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150146422A KR102476600B1 (ko) | 2015-10-21 | 2015-10-21 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170046294A KR20170046294A (ko) | 2017-05-02 |
KR102476600B1 true KR102476600B1 (ko) | 2022-12-12 |
Family
ID=58557428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150146422A Active KR102476600B1 (ko) | 2015-10-21 | 2015-10-21 | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10796688B2 (ko) |
KR (1) | KR102476600B1 (ko) |
WO (1) | WO2017069556A1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782585B (zh) * | 2017-01-26 | 2020-03-20 | 芋头科技(杭州)有限公司 | 一种基于麦克风阵列的拾音方法及系统 |
US10789949B2 (en) * | 2017-06-20 | 2020-09-29 | Bose Corporation | Audio device with wakeup word detection |
JP6991041B2 (ja) * | 2017-11-21 | 2022-01-12 | ヤフー株式会社 | 生成装置、生成方法、および生成プログラム |
KR102527278B1 (ko) * | 2017-12-04 | 2023-04-28 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 |
CN111742362B (zh) * | 2018-01-23 | 2024-04-09 | 谷歌有限责任公司 | 在调用短语检测中选择性地适配和利用噪声降低技术 |
KR102459920B1 (ko) * | 2018-01-25 | 2022-10-27 | 삼성전자주식회사 | 저전력 에코 제거를 지원하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
US11150869B2 (en) * | 2018-02-14 | 2021-10-19 | International Business Machines Corporation | Voice command filtering |
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
US10586538B2 (en) * | 2018-04-25 | 2020-03-10 | Comcast Cable Comminications, LLC | Microphone array beamforming control |
US11238856B2 (en) | 2018-05-01 | 2022-02-01 | International Business Machines Corporation | Ignoring trigger words in streamed media content |
US11200890B2 (en) | 2018-05-01 | 2021-12-14 | International Business Machines Corporation | Distinguishing voice commands |
JP7001029B2 (ja) * | 2018-09-11 | 2022-01-19 | 日本電信電話株式会社 | キーワード検出装置、キーワード検出方法、およびプログラム |
TWI719385B (zh) * | 2019-01-11 | 2021-02-21 | 緯創資通股份有限公司 | 電子裝置及其語音指令辨識方法 |
KR20200132613A (ko) * | 2019-05-16 | 2020-11-25 | 삼성전자주식회사 | 웨이크 언 보이스(Wake on Voice, WoV) 기술을 이용한 음성 인식 수행 방법 및 장치 |
US11380312B1 (en) * | 2019-06-20 | 2022-07-05 | Amazon Technologies, Inc. | Residual echo suppression for keyword detection |
US11355108B2 (en) | 2019-08-20 | 2022-06-07 | International Business Machines Corporation | Distinguishing voice commands |
KR20210031265A (ko) * | 2019-09-11 | 2021-03-19 | 삼성전자주식회사 | 전자 장치 및 그 동작방법 |
CN111312214B (zh) * | 2020-03-31 | 2022-12-16 | 广东美的制冷设备有限公司 | 空调器的语音识别方法、装置、空调器和可读存储介质 |
CN113450767A (zh) * | 2021-06-24 | 2021-09-28 | 平安国际智慧城市科技股份有限公司 | 语音识别测试方法、装置、测试设备及存储介质 |
CN114694638B (zh) * | 2022-04-19 | 2024-11-26 | 深圳市未艾智能有限公司 | 一种语音唤醒方法、终端及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040064315A1 (en) * | 2002-09-30 | 2004-04-01 | Deisher Michael E. | Acoustic confidence driven front-end preprocessing for speech recognition in adverse environments |
US20080147397A1 (en) * | 2006-12-14 | 2008-06-19 | Lars Konig | Speech dialog control based on signal pre-processing |
US20120065973A1 (en) * | 2010-09-13 | 2012-03-15 | Samsung Electronics Co., Ltd. | Method and apparatus for performing microphone beamforming |
US20120123772A1 (en) * | 2010-11-12 | 2012-05-17 | Broadcom Corporation | System and Method for Multi-Channel Noise Suppression Based on Closed-Form Solutions and Estimation of Time-Varying Complex Statistics |
US20130282373A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
WO2015092400A1 (en) * | 2013-12-18 | 2015-06-25 | Cirrus Logic International (Uk) Limited | Voice command triggered speech enhancement |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100762588B1 (ko) | 2001-06-26 | 2007-10-01 | 엘지전자 주식회사 | 화자적응과 오입력 거절을 결합한 음성인식 방법 |
US6937980B2 (en) | 2001-10-02 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech recognition using microphone antenna array |
EP1473964A3 (en) | 2003-05-02 | 2006-08-09 | Samsung Electronics Co., Ltd. | Microphone array, method to process signals from this microphone array and speech recognition method and system using the same |
DE10339973A1 (de) * | 2003-08-29 | 2005-03-17 | Daimlerchrysler Ag | Intelligentes akustisches Mikrofon-Frontend mit Spracherkenner-Feedback |
EP1640971B1 (en) | 2004-09-23 | 2008-08-20 | Harman Becker Automotive Systems GmbH | Multi-channel adaptive speech signal processing with noise reduction |
KR20110028095A (ko) * | 2009-09-11 | 2011-03-17 | 삼성전자주식회사 | 실시간 화자 적응을 통한 음성 인식 시스템 및 방법 |
KR20140057018A (ko) * | 2012-11-02 | 2014-05-12 | 현대모비스 주식회사 | 스마트 피드백 음성인식 시스템 |
KR20140147587A (ko) * | 2013-06-20 | 2014-12-30 | 한국전자통신연구원 | Wfst를 이용한 음성 끝점 검출 장치 및 방법 |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
-
2015
- 2015-10-21 KR KR1020150146422A patent/KR102476600B1/ko active Active
-
2016
- 2016-10-21 WO PCT/KR2016/011888 patent/WO2017069556A1/ko active Application Filing
- 2016-10-21 US US15/761,506 patent/US10796688B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040064315A1 (en) * | 2002-09-30 | 2004-04-01 | Deisher Michael E. | Acoustic confidence driven front-end preprocessing for speech recognition in adverse environments |
US20080147397A1 (en) * | 2006-12-14 | 2008-06-19 | Lars Konig | Speech dialog control based on signal pre-processing |
US20120065973A1 (en) * | 2010-09-13 | 2012-03-15 | Samsung Electronics Co., Ltd. | Method and apparatus for performing microphone beamforming |
US20120123772A1 (en) * | 2010-11-12 | 2012-05-17 | Broadcom Corporation | System and Method for Multi-Channel Noise Suppression Based on Closed-Form Solutions and Estimation of Time-Varying Complex Statistics |
US20130282373A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
WO2015092400A1 (en) * | 2013-12-18 | 2015-06-25 | Cirrus Logic International (Uk) Limited | Voice command triggered speech enhancement |
Also Published As
Publication number | Publication date |
---|---|
WO2017069556A1 (ko) | 2017-04-27 |
US10796688B2 (en) | 2020-10-06 |
US20180268808A1 (en) | 2018-09-20 |
KR20170046294A (ko) | 2017-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102476600B1 (ko) | 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체 | |
US11158333B2 (en) | Multi-stream target-speech detection and channel fusion | |
CN112074901B (zh) | 语音识别登入 | |
US11094323B2 (en) | Electronic device and method for processing audio signal by electronic device | |
US11978478B2 (en) | Direction based end-pointing for speech recognition | |
US9330673B2 (en) | Method and apparatus for performing microphone beamforming | |
US9916832B2 (en) | Using combined audio and vision-based cues for voice command-and-control | |
KR102515996B1 (ko) | 음성 인식을 위한 전자 장치 및 그 제어 방법 | |
US10109294B1 (en) | Adaptive echo cancellation | |
US11227588B2 (en) | System and method for feature based beam steering | |
US9437188B1 (en) | Buffered reprocessing for multi-microphone automatic speech recognition assist | |
US10157611B1 (en) | System and method for speech enhancement in multisource environments | |
US11443760B2 (en) | Active sound control | |
US20240079004A1 (en) | System and method for receiving a voice command | |
US11600275B2 (en) | Electronic device and control method thereof | |
EP3539128A1 (en) | Processing speech from distributed microphones | |
US10482878B2 (en) | System and method for speech enhancement in multisource environments | |
KR102331234B1 (ko) | 음성 인식 방법 및 이에 사용되는 장치 | |
KR20210080788A (ko) | 전자장치 및 그 제어방법 | |
US20220084505A1 (en) | Communication between devices in close proximity to improve voice control of the devices | |
KR20210001434A (ko) | 음성 인식 서비스를 제공하는 단말, 방법 및 서버 | |
JP2015192361A (ja) | 移動通信端末及び移動通信端末の制御方法 | |
JP2011081322A (ja) | 音声認識システム及び音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20151021 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200916 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20151021 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20211222 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220622 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220913 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221207 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20221208 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |