KR20210066647A - 전자 장치 및 이의 제어 방법 - Google Patents
전자 장치 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR20210066647A KR20210066647A KR1020190156146A KR20190156146A KR20210066647A KR 20210066647 A KR20210066647 A KR 20210066647A KR 1020190156146 A KR1020190156146 A KR 1020190156146A KR 20190156146 A KR20190156146 A KR 20190156146A KR 20210066647 A KR20210066647 A KR 20210066647A
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- user
- voice
- electronic device
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 1b는 본 개시의 일 실시예에 따른, 키워드 인식 모델의 구성 및 동작을 설명하기 위한 도면,
도 2는 본 개시의 일 실시예에 따른, 전자 장치의 제어 방법을 설명하기 위한 순서도,
도 3a 및 도 3b는 본 개시의 일 실시예에 따른, 제1 키워드 인식 모델이 실행될 때의 전자 장치의 동작을 설명하기 위한 도면,
도 4a, 도 4b 및 도 4c는 본 개시의 일 실시예에 따른, 제2 키워드 인식 모델이 실행될 때의 전자 장치의 동작을 설명하기 위한 도면,
도 5는 본 개시의 일 실시예예 따른, 전자 장치가 키워드를 등록하는 과정을 설명하기 위한 도면,
도 6은 본 개시의 일 실시예에 따른, 전자 장치의 구성을 상세히 도시한 블록도이다.
동작 상태의 종류 | 실행될 키워드 인식 모델 |
제1 동작 상태 | 제1 키워드 인식 모델 |
제2 동작 상태 | 제2 키워드 인식 모델 |
제3 동작 상태 | 키워드 인식 모델 미실행 |
키워드의 종류 | 키워드에 대응되는 동작을 수행하기 위한 명령어 |
취소 | Stop_Processing or Stop_Speaking |
그만 | Stop_Speaking |
다음 | Next_Action |
이전 | Previous_Action |
130: 프로세서
Claims (18)
- 전자 장치에 있어서,
마이크;
복수의 키워드 인식 모델을 저장하는 메모리;
상기 마이크 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 프로세서;를 포함하고,
상기 프로세서는,
상기 전자 장치의 동작 상태 정보를 바탕으로 상기 복수의 키워드 인식 모델 중 적어도 하나의 키워드 인식 모델을 선택적으로 실행하고,
상기 마이크를 통해 제1 사용자 음성이 입력되면, 상기 실행된 키워드 인식 모델을 이용하여 상기 실행된 키워드 인식 모델에 대응하는 적어도 하나의 키워드가 상기 제1 사용자 음성에 포함되어 있는 지를 확인하고,
상기 제1 사용자 음성에 포함된 것으로 확인된 적어도 하나의 키워드를 바탕으로, 상기 적어도 하나의 키워드에 대응하는 상기 전자 장치의 동작을 수행하는 전자 장치. - 제1항에 있어서,
상기 프로세서는,
상기 실행된 키워드 인식 모델을 통해 상기 적어도 하나의 키워드의 신호 패턴과 상기 제1 사용자 음성의 신호 패턴 간의 유사도 값을 획득하고,
상기 제1 사용자 음성의 신호 패턴 구간 중 상기 적어도 하나의 키워드의 신호 패턴과의 유사도 값이 임계값을 초과하는 구간이 있는 경우, 상기 제1 사용자 음성에 상기 적어도 하나의 키워드가 포함되어 있다고 식별하는 전자 장치. - 제1항에 있어서,
상기 프로세서는,
상기 전자 장치에 저장된 대화 시스템이 비활성화된 제1 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델 중 상기 제1 상태에 대응되는 제1 키워드 인식 모델을 실행하고,
상기 대화 시스템이 활성화되어 상기 마이크를 통해 입력된 제2 사용자 음성에 대응되는 텍스트를 처리하는 제2 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델 중 상기 제2 상태에 대응되는 제2 키워드 인식 모델을 실행하는 전자 장치. - 제3항에 있어서,
상기 프로세서는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 키워드를 인식하지 못한 경우, 상기 제1 사용자 음성을 상기 대화 시스템의 ASR 모듈에 입력하여 상기 제1 사용자 음성에 대응되는 텍스트를 획득하고,
상기 제1 사용자 음성에 대응되는 텍스트를 바탕으로 상기 제1 사용자 음성에 대한 응답을 제공하는 전자 장치. - 제1항에 있어서,
상기 프로세서는,
상기 대화 시스템이 활성화되어 상기 마이크를 통해 입력된 제2 사용자 음성을 상기 대화 시스템의 ASR 모듈을 통해 인식하는 제3 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델의 실행을 중지하고 상기 ASR 모듈을 통해 상기 제2 사용자 음성에 대응되는 텍스트를 획득하는 전자 장치. - 제3항에 있어서,
상기 프로세서는,
상기 제1 동작 상태로 동작하는 동안 실행된 제1 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 기정의된 동작을 요청하는 의미가 포함된 키워드가 포함되어 있다고 확인되면, 상기 기정의된 동작을 수행하도록 제어하는 전자 장치. - 제3항에 있어서,
상기 프로세서는,
상기 제1 동작 상태로 동작하는 동안 실행된 상기 제1 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 다음 또는 이전 동작을 요청하는 의미가 포함된 키워드가 포함되어 있다고 확인되면, 대화 히스토리 정보를 바탕으로 상기 제1 키워드 인식 모델이 상기 키워드가 상기 제1 사용자 음성에 포함되어 있다고 확인하기 전 상기 대화 시스템에 의해 상기 전자 장치가 수행한 동작을 식별하고,
상기 식별된 전자 장치가 수행한 동작의 다음 또는 이전 동작에 대응되는 동작을 수행하도록 제어하는 전자 장치. - 제3항에 있어서,
상기 프로세서는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 동작을 중지하라는 의미가 포함된 키워드가 포함되어 있다고 확인되면, 상기 대화 시스템에 의한 상기 제2 사용자 음성에 대응되는 텍스트에 대한 처리를 중지하도록 제어하는 전자 장치. - 제3항에 있어서,
상기 프로세서는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 동작을 반복하라는 의미가 포함된 키워드가 포함되어 있다고 확인되하면, 상기 대화 시스템이 수행하는 상기 제2 사용자 음성에 대응되는 텍스트의 처리를 중단하고 대화 히스토리 정보를 바탕으로 상기 텍스트의 처리를 반복하도록 제어하는 전자 장치. - 전자 장치의 제어 방법에 있어서,
상기 전자 장치의 동작 상태 정보를 바탕으로 상기 복수의 키워드 인식 모델 중 적어도 하나의 키워드 인식 모델을 선택적으로 실행하는 단계;
마이크를 통해 제1 사용자 음성이 입력되면, 상기 실행된 키워드 인식 모델을 이용하여 상기 실행된 키워드 인식 모델에 대응되는 적어도 하나의 키워드가 상기 제1 사용자 음성에 포함되어 있는지를 확인하는 단계; 및
상기 제1 사용자 음성에 포함된 것으로 확인된 적어도 하나의 키워드를 바탕으로, 상기 적어도 하나의 키워드에 대응하는 상기 전자 장치의 동작을 수행하는 단계;를 포함하는 전자 장치의 제어 방법. - 제10항에 있어서,
상기 인식하는 단계는,
상기 실행된 키워드 인식 모델을 통해 상기 적어도 하나의 키워드의 신호 패턴과 상기 제1 사용자 음성의 신호 패턴 간의 유사도 값을 획득하는 단계; 및
상기 제1 사용자 음성의 신호 패턴 구간 중 상기 적어도 하나의 키워드의 신호 패턴과의 유사도 값이 임계값을 초과하는 구간이 있는 경우, 상기 제1 사용자 음성에 상기 적어도 하나의 키워드가 포함되어 있다고 식별하는 단계;를 포함하는 전자 장치의 제어 방법. - 제10항에 있어서,
상기 실행하는 단계는,
상기 전자 장치에 저장된 대화 시스템이 비활성화된 제1 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델 중 상기 제1 상태에 대응되는 제1 키워드 인식 모델을 실행하고,
상기 대화 시스템이 활성화되어 상기 마이크를 통해 입력된 제2 사용자 음성에 대응되는 텍스트를 처리하는 제2 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델 중 상기 제2 상태에 대응되는 제2 키워드 인식 모델을 실행하는 단계;를 포함하는 전자 장치의 제어 방법. - 제12항에 있어서,
상기 인식하는 단계는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 키워드를 인식하지 못한 경우, 상기 키워드가 포함된 제1 사용자 음성을 상기 대화 시스템의 ASR 모듈에 입력하여 상기 제1 사용자 음성에 대응되는 텍스트를 획득하는 단계; 및
상기 제1 사용자 음성에 대응되는 텍스트를 바탕으로 상기 제1 사용자 음성에 대한 응답을 제공하는 단계;를 포함하는 전자 장치의 제어 방법. - 제10항에 있어서,
상기 실행하는 단계는,
상기 대화 시스템이 활성화되어 상기 마이크를 통해 입력된 제2 사용자 음성을 상기 대화 시스템의 ASR 모듈을 통해 인식하는 제3 동작 상태로 상기 전자 장치가 동작하는 경우, 상기 복수의 키워드 인식 모델의 실행을 중지하고 상기 ASR 모듈을 통해 상기 제2 사용자 음성에 대응되는 텍스트를 획득하는 단계;를 포함하는 전자 장치의 제어 방법. - 제12항에 있어서,
상기 수행하는 단계는,
상기 제1 동작 상태로 동작하는 동안 실행된 제1 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 기정의된 동작을 요청하는 의미가 포함된 키워드가 포함되어 있다고 확인되하면, 상기 기정의된 동작을 수행하는 단계;를 포함하는 전자 장치의 제어 방법. - 제12항에 있어서,
상기 수행하는 단계는,
상기 제1 동작 상태로 동작하는 동안 실행된 상기 제1 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 다음 또는 이전 동작을 요청하는 의미가 포함된 키워드가 포함되어 있다고 확인되하면, 대화 히스토리 정보를 바탕으로 상기 제1 키워드 인식 모델이 상기 키워드가 상기 제1 사용자 음성에 포함되어 있다고 확인하기 전 상기 대화 시스템에 의해 상기 전자 장치가 수행한 동작을 식별하는 단계; 및
상기 식별된 전자 장치가 수행한 동작의 다음 또는 이전 동작에 대응되는 동작을 수행하는 단계;를 포함하는 전자 장치의 제어 방법. - 제12항에 있어서,
상기 수행하는 단계는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 동작을 중지하라는 의미가 포함된 키워드가 포함되어 있다고 확인되면, 상기 대화 시스템에 의한 상기 제2 사용자 음성에 대응되는 텍스트에 대한 처리를 중지하는 단계;를 포함하는 전자 장치의 제어 방법. - 제12항에 있어서,
상기 수행하는 단계는,
상기 제2 동작 상태로 동작하는 동안 실행된 상기 제2 키워드 인식 모델을 이용하여 상기 제1 사용자 음성에 동작을 반복하라는 의미가 포함된 키워드가 포함되어 있다고 확인되면, 상기 대화 시스템이 수행하는 상기 제2 사용자 음성에 대응되는 텍스트의 처리를 중단하고 대화 히스토리 정보를 바탕으로 상기 텍스트의 처리를 반복하는 단계;를 포함하는 전자 장치의 제어 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190156146A KR20210066647A (ko) | 2019-11-28 | 2019-11-28 | 전자 장치 및 이의 제어 방법 |
US17/003,176 US11580964B2 (en) | 2019-11-28 | 2020-08-26 | Electronic apparatus and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190156146A KR20210066647A (ko) | 2019-11-28 | 2019-11-28 | 전자 장치 및 이의 제어 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210066647A true KR20210066647A (ko) | 2021-06-07 |
Family
ID=76091864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190156146A Pending KR20210066647A (ko) | 2019-11-28 | 2019-11-28 | 전자 장치 및 이의 제어 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11580964B2 (ko) |
KR (1) | KR20210066647A (ko) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US12283269B2 (en) | 2020-10-16 | 2025-04-22 | Sonos, Inc. | Intent inference in audiovisual communication sessions |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
EP4181120A4 (en) * | 2020-11-25 | 2024-01-10 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE FOR GENERATING A RESPONSE TO A USER INPUTION AND OPERATING METHOD THEREFOR |
CN113851117B (zh) * | 2021-09-27 | 2025-02-25 | 苏州科达科技股份有限公司 | 语音关键词识别方法、系统、设备及存储介质 |
EP4409933A1 (en) | 2021-09-30 | 2024-08-07 | Sonos, Inc. | Enabling and disabling microphones and voice assistants |
WO2023056258A1 (en) | 2021-09-30 | 2023-04-06 | Sonos, Inc. | Conflict management for wake-word detection processes |
US12327549B2 (en) | 2022-02-09 | 2025-06-10 | Sonos, Inc. | Gatekeeping for voice intent processing |
KR102581221B1 (ko) * | 2023-05-10 | 2023-09-21 | 주식회사 솔트룩스 | 재생 중인 응답 발화를 제어 및 사용자 의도를 예측하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체 |
CN118981644B (zh) * | 2024-10-18 | 2025-05-27 | 每日互动股份有限公司 | 一种目标用户的识别方法、装置、设备及介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101990037B1 (ko) | 2012-11-13 | 2019-06-18 | 엘지전자 주식회사 | 이동 단말기 및 그것의 제어 방법 |
WO2015030474A1 (ko) * | 2013-08-26 | 2015-03-05 | 삼성전자 주식회사 | 음성 인식을 위한 전자 장치 및 방법 |
EP3067884B1 (en) | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
US10175933B1 (en) * | 2015-12-28 | 2019-01-08 | Amazon Technologies, Inc. | Interactive personalized audio |
US10311875B2 (en) | 2016-12-22 | 2019-06-04 | Soundhound, Inc. | Full-duplex utterance processing in a natural language virtual assistant |
KR102643501B1 (ko) | 2016-12-26 | 2024-03-06 | 현대자동차주식회사 | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
US10431217B2 (en) * | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
KR102203720B1 (ko) | 2017-06-26 | 2021-01-15 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 장치 |
US11423879B2 (en) * | 2017-07-18 | 2022-08-23 | Disney Enterprises, Inc. | Verbal cues for high-speed control of a voice-enabled device |
TW201908920A (zh) | 2017-07-21 | 2019-03-01 | 致伸科技股份有限公司 | 數位語音助理之操作系統 |
GB2577879B (en) * | 2018-10-08 | 2022-08-24 | B & W Group Ltd | Content playback system |
US11232788B2 (en) * | 2018-12-10 | 2022-01-25 | Amazon Technologies, Inc. | Wakeword detection |
US10861446B2 (en) * | 2018-12-10 | 2020-12-08 | Amazon Technologies, Inc. | Generating input alternatives |
JP7358407B2 (ja) * | 2019-02-27 | 2023-10-10 | グーグル エルエルシー | コンピューティングデバイスとの継続的な会話の検出 |
US11094324B2 (en) * | 2019-05-14 | 2021-08-17 | Motorola Mobility Llc | Accumulative multi-cue activation of domain-specific automatic speech recognition engine |
US11158308B1 (en) * | 2019-11-27 | 2021-10-26 | Amazon Technologies, Inc. | Configuring natural language system |
-
2019
- 2019-11-28 KR KR1020190156146A patent/KR20210066647A/ko active Pending
-
2020
- 2020-08-26 US US17/003,176 patent/US11580964B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20210166680A1 (en) | 2021-06-03 |
US11580964B2 (en) | 2023-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11580964B2 (en) | Electronic apparatus and control method thereof | |
JP6980119B2 (ja) | 音声認識方法、並びにその装置、デバイス、記憶媒体及びプログラム | |
US11790912B2 (en) | Phoneme recognizer customizable keyword spotting system with keyword adaptation | |
CN110998716B (zh) | 经由教师-学生学习在话音识别中进行的域自适应 | |
US11842735B2 (en) | Electronic apparatus and control method thereof | |
US11631400B2 (en) | Electronic apparatus and controlling method thereof | |
KR102790926B1 (ko) | 페르소나 챗봇 제어 방법 및 시스템 | |
EP3966809B1 (en) | Wake word selection assistance architectures and methods | |
CN114270361B (zh) | 用于注册用于语音助理服务的设备的系统和方法 | |
US9466286B1 (en) | Transitioning an electronic device between device states | |
US20200143809A1 (en) | Electronic apparatus and control method thereof | |
US11468892B2 (en) | Electronic apparatus and method for controlling electronic apparatus | |
US11705110B2 (en) | Electronic device and controlling the electronic device | |
US20210110816A1 (en) | Electronic apparatus and method of providing sentence thereof | |
KR20200132673A (ko) | 전자 장치 및 이의 제어 방법 | |
KR102684936B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US10952075B2 (en) | Electronic apparatus and WiFi connecting method thereof | |
US20210241771A1 (en) | Electronic device and method for controlling the electronic device thereof | |
EP3736685B1 (en) | Display apparatus and method for controlling thereof | |
KR102836970B1 (ko) | 전자 장치 및 이의 제어 방법 | |
KR20210065698A (ko) | 전자 장치 및 이의 제어 방법 | |
KR20210014053A (ko) | 보이스 어시스턴트 서비스를 위한 디바이스를 등록하는 시스템 및 방법 | |
KR102811886B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US20240119960A1 (en) | Electronic device and method of recognizing voice | |
US20240194187A1 (en) | Electronic device for performing speech recognition and a control method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20191128 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20221109 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20191128 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20250702 Patent event code: PE09021S01D |