KR102411766B1 - 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 - Google Patents
음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 Download PDFInfo
- Publication number
- KR102411766B1 KR102411766B1 KR1020170107963A KR20170107963A KR102411766B1 KR 102411766 B1 KR102411766 B1 KR 102411766B1 KR 1020170107963 A KR1020170107963 A KR 1020170107963A KR 20170107963 A KR20170107963 A KR 20170107963A KR 102411766 B1 KR102411766 B1 KR 102411766B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- call word
- user
- processor
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000003213 activating effect Effects 0.000 title claims description 16
- 238000004891 communication Methods 0.000 claims abstract description 79
- 230000006870 function Effects 0.000 claims abstract description 52
- 230000004044 response Effects 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims abstract description 38
- 238000010801 machine learning Methods 0.000 claims abstract description 10
- 230000004913 activation Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 27
- 238000013473 artificial intelligence Methods 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 238000013135 deep learning Methods 0.000 abstract description 4
- 210000004556 brain Anatomy 0.000 abstract description 3
- 230000019771 cognition Effects 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 34
- 238000005516 engineering process Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 235000015278 beef Nutrition 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
다양한 실시예는 스피커, 마이크, 통신 인터페이스, 상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및 상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금, 사용자 입력에 응답하여 음성 인식 서비스를 활성화하고, 상기 활성화된 음성 인식 서비스에 의해 입력된 음성 정보에 대한 태스크를 처리하고, 상기 음성 정보를 분석하여 적어도 하나의 사용자 호출어를 등록하고, 상기 적어도 하나의 사용자 호출어 감지에 응답하여 상기 음성 인식 서비스를 활성화하도록 설정된 전자 장치 및 방법을 제공한다. 또한, 상기 사용자 호출어는 제스처(예: 수화), 모스 부호, 특정 부호어, 텍스트, 시각 등 다양한 입력 방식을 통해 등록할 수 있다.
Description
도 2는 다양한 실시예들에 따른 전자 장치의 구성을 도시한 블록도이다.
도 3은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시한 흐름도이다.
도 4는 다양한 실시예들에 따른 사용자 호출어를 이용하여 음성 인식 서비스를 활성화하는 일례를 도시한 도면이다.
도 5는 다양한 실시예들에 따른 전자 장치의 사용자 호출어 등록 방법을 도시한 흐름도이다.
도 6은 다양한 실시예들에 따른 사용자 호출어를 편집하는 일례를 도시한 도면이다.
도 7은 다양한 실시예들에 따른 사용자 호출어를 이용하여 음성 인식 서비스를 활성화하는 방법을 도시한 흐름도이다.
도 8은 다양한 실시예들에 따른 사용자 호출어를 초기화하는 방법을 도시한 흐름도이다.
도 9는 다양한 실시예들에 따른 화자의 수에 따라 사용자 호출어 서비스를 제어하는 방법을 도시한 흐름도이다.
도 10a 및 도 10b는 다양한 실시예들에 따른 사용자 호출어 서비스를 제어하는 일례를 도시한 도면들이다.
도 11은 다양한 실시예들에 따른 현재 조건에 대응하여 사용자 호출어를 제어하는 방법을 도시한 흐름도이다.
도 12a 및 도 12b는 다양한 실시예들에 따른 현재 조건에 따라 사용자 호출어를 제어하는 일례를 도시한 도면들이다.
210: 프로세서
211: 호출어 감지 모듈 213: 음성 인식 모듈
215: 호출어 제어 모듈 217: 화자 식별 모듈
219: 조건 판단 모듈
220: 마이크 230: 스피커
240: 메모리 250: 통신부
Claims (20)
- 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
사용자 입력에 응답하여 음성 인식 서비스를 활성화하고,
상기 활성화된 음성 인식 서비스에 의해 입력된 음성 정보에 대한 태스크를 처리하고,
상기 음성 정보를 분석하여 적어도 하나의 사용자 호출어를 등록하고,
상기 적어도 하나의 사용자 호출어 감지에 응답하여 상기 음성 인식 서비스를 활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보로부터 텍스트 정보를 추출하고, 상기 텍스트 정보로부터 적어도 하나의 단어를 획득하고, 상기 획득된 단어를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제2항에 있어서,
상기 인스트럭션들은 상기 텍스트 정보로부터 적어도 하나의 제1 단어를 획득하고, 상기 제1 단어로부터 상기 제1 단어와 연관된 적어도 하나의 제2 단어를 획득하고, 상기 제1 단어 또는 상기 제2 단어를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제3항에 있어서,
상기 인스트럭션들은 상기 제1 단어 및 상기 제2 단어를 이용하여 적어도 하나의 제3 단어를 획득하고, 상기 제1 단어 내지 상기 제3 단어 중 적어도 하나를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보에 대한 태스크를 처리한 후 활성화 대기시간을 카운트하고, 상기 활성화 대기시간 동안 음성이 검출되지 않는 경우, 상기 음성 인식 서비스를 비활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 인식 서비스가 비활성화된 상태에서 음성이 감지되면, 상기 입력된 음성에 메인 호출어가 포함되어 있는지 판단하고, 상기 입력된 음성에 상기 메인 호출어가 포함되어 있는 경우 상기 등록된 사용자 호출어를 초기화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 화자를 식별하고, 상기 식별된 화자의 인원수에 따라 상기 사용자 호출어를 이용한 음성 인식 서비스를 제어하도록 설정된 전자 장치. - 제7항에 있어서,
상기 인스트럭션들은 상기 화자가 한 명을 초과하는 경우 상기 사용자 호출어를 이용한 음성 인식 서비스를 비활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 현재 조건이 조건 정보에 해당하는지 여부를 판단하고, 상기 현재 조건이 조건 정보에 해당하는 경우, 상기 조건 정보에 대응하는 적어도 하나의 사용자 호출어를 인에이블하도록 설정된 전자 장치. - 제9항에 있어서,
상기 인스트럭션들은 상기 조건 정보가 만료되는지 여부를 판단하고, 상기 조건 정보가 만료되는 경우 상기 조건 정보에 대응하는 적어도 하나의 사용자 호출어를 디스에이블하도록 설정된 전자 장치. - 제1항에 있어서,
상기 사용자 입력은, 음성 호출어, 터치, 또는 버튼 중 적어도 하나를 포함하는 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보에 대한 태스크를 처리한 후 상기 사용자 호출어를 제어하기 위한 사용자 인터페이스를 디스플레이에 표시하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 인식 서비스가 활성화되는 동안 화자 식별에 따른 상기 사용자 호출어를 이용한 음성 인식 서비스를 제어하도록 설정된 전자 장치. - 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
상기 마이크를 통해 적어도 하나의 메인 호출어를 수신하고,
상기 수신된 메인 호출어에 응답하여 외부 서버에서 제공되거나, 상기 전자 장치에 구현된 음성 인식 기능을 활성화하고,
상기 마이크를 통해 적어도 하나의 사용자 호출어를 포함하는 사용자 발화를 수신하고,
상기 메인 호출어 없이 상기 수신된 사용자 호출어에 응답하여 상기 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 제14항에 있어서,
상기 적어도 하나의 메인 호출어는 상기 전자 장치와 연관된 이름 또는 제목을 포함하도록 설정된 전자 장치. - 제14항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자에 의해 선택된 이름 또는 제목을 포함하도록 설정된 전자 장치. - 제14항에 있어서,
상기 인스트럭션들은 설정된 시간 주기 동안만 상기 수신된 사용자 호출어에 응답하여 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
상기 마이크를 통해 적어도 하나의 메인 호출어를 수신하고,
하루의 특정 시점에 관계없이(regardless of a point in time in a day) 상기 수신된 메인 호출어에 응답하여 외부 서버에서 제공되거나, 상기 전자 장치에 구현된 음성 인식 기능을 활성화하고,
상기 마이크를 통해 적어도 하나의 사용자 호출어를 수신하고,
하루의 일정 기간 동안(during a period of time during a day) 상기 수신된 사용자 호출어에 응답하여 상기 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 제18항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자 발화의 주제(subject matter) 또는 토픽과 연관된 것인 전자 장치. - 제18항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자의 발화 이력 또는 기계 학습(machine learning)으로부터 선택된 것인 전자 장치.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170107963A KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
PCT/KR2018/009821 WO2019039915A1 (en) | 2017-08-25 | 2018-08-24 | METHOD FOR ACTIVATION OF VOICE RECOGNITION SERVICE AND ELECTRONIC DEVICE IMPLEMENTING THE SAME |
EP18190758.5A EP3447764B1 (en) | 2017-08-25 | 2018-08-24 | Electronic device for implementing method of activiating voice-recognition service |
US16/113,602 US10692495B2 (en) | 2017-08-25 | 2018-08-27 | Method of receiving commands for activating voice-recognition service and electronic device for implementing same |
CN201810979837.3A CN109427333B (zh) | 2017-08-25 | 2018-08-27 | 激活语音识别服务的方法和用于实现所述方法的电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170107963A KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190022109A KR20190022109A (ko) | 2019-03-06 |
KR102411766B1 true KR102411766B1 (ko) | 2022-06-22 |
Family
ID=63490205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170107963A Active KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10692495B2 (ko) |
EP (1) | EP3447764B1 (ko) |
KR (1) | KR102411766B1 (ko) |
CN (1) | CN109427333B (ko) |
WO (1) | WO2019039915A1 (ko) |
Families Citing this family (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US10097919B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Music service selection |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11348595B2 (en) | 2017-01-04 | 2022-05-31 | Blackberry Limited | Voice interface and vocal entertainment system |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
GB201707050D0 (en) | 2017-05-03 | 2017-06-14 | British American Tobacco Investments Ltd | Data communication |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US20190130898A1 (en) * | 2017-11-02 | 2019-05-02 | GM Global Technology Operations LLC | Wake-up-word detection |
CN107895573B (zh) * | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
KR102361458B1 (ko) * | 2018-01-25 | 2022-02-10 | 삼성전자주식회사 | 사용자 발화 응답 방법 및 이를 지원하는 전자 장치 |
US10789940B2 (en) * | 2018-03-27 | 2020-09-29 | Lenovo (Singapore) Pte. Ltd. | Dynamic wake word identification |
CN108600911B (zh) * | 2018-03-30 | 2021-05-18 | 联想(北京)有限公司 | 一种输出方法及电子设备 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10929097B2 (en) * | 2018-06-26 | 2021-02-23 | ROVl GUIDES, INC. | Systems and methods for switching operational modes based on audio triggers |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US12062362B2 (en) * | 2018-07-20 | 2024-08-13 | Sony Corporation | Information processing device, information processing system, and information processing method |
US11289097B2 (en) * | 2018-08-28 | 2022-03-29 | Dell Products L.P. | Information handling systems and methods for accurately identifying an active speaker in a communication session |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
EP3849755A1 (en) | 2018-09-13 | 2021-07-21 | The Charles Stark Draper Laboratory, Inc. | Determining how to assemble a meal |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
JP7202853B2 (ja) * | 2018-11-08 | 2023-01-12 | シャープ株式会社 | 冷蔵庫 |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11211061B2 (en) * | 2019-01-07 | 2021-12-28 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
TW202029181A (zh) * | 2019-01-28 | 2020-08-01 | 正崴精密工業股份有限公司 | 語音識別用於特定目標喚醒的方法及裝置 |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
JP7198122B2 (ja) * | 2019-03-07 | 2022-12-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP2020144275A (ja) * | 2019-03-07 | 2020-09-10 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
US12256142B2 (en) * | 2019-03-22 | 2025-03-18 | Sony Olympus Medical Solutions Inc. | Control device and medical observation system |
CN110012166B (zh) * | 2019-03-31 | 2021-02-19 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
US10964324B2 (en) * | 2019-04-26 | 2021-03-30 | Rovi Guides, Inc. | Systems and methods for enabling topic-based verbal interaction with a virtual assistant |
EP4481727A3 (en) | 2019-05-06 | 2025-02-26 | Google Llc | Selectively activating on-device speech recognition, and using recognized text in selectively activating on-device nlu and/or on-device fulfillment |
US11200888B2 (en) | 2019-05-09 | 2021-12-14 | Lg Electronics Inc. | Artificial intelligence device for providing speech recognition function and method of operating artificial intelligence device |
KR102671211B1 (ko) * | 2019-05-23 | 2024-06-03 | 삼성전자 주식회사 | 하우징의 입력에 대응하는 피드백을 제공하는 전자 장치 |
KR102674536B1 (ko) * | 2019-06-03 | 2024-06-13 | 엘지전자 주식회사 | 의류처리장치 및 의류처리장치의 음성인식 방법 |
CN115482806B (zh) * | 2019-06-06 | 2024-06-25 | 腾讯科技(深圳)有限公司 | 语音处理系统、方法、装置、存储介质和计算机设备 |
KR20200144366A (ko) | 2019-06-18 | 2020-12-29 | 엘지전자 주식회사 | 로봇을 위한 기동어 인식 모델의 생성 |
KR102246936B1 (ko) | 2019-06-20 | 2021-04-29 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
CN110265029A (zh) * | 2019-06-21 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 语音芯片和电子设备 |
KR102246661B1 (ko) * | 2019-06-25 | 2021-05-03 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법 및 장치 |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
KR20210017392A (ko) * | 2019-08-08 | 2021-02-17 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
US11639944B2 (en) * | 2019-08-26 | 2023-05-02 | Apple Inc. | Methods and apparatus for detecting individual health related events |
EP3792914A3 (en) * | 2019-09-12 | 2021-05-05 | Orcam Technologies Ltd. | Wearable apparatus and methods for processing audio signals |
CN110989963B (zh) * | 2019-11-22 | 2023-08-01 | 北京梧桐车联科技有限责任公司 | 唤醒词推荐方法及装置、存储介质 |
CN112835413B (zh) * | 2019-11-25 | 2024-05-31 | Oppo广东移动通信有限公司 | 可穿戴设备的控制方法和装置、电子设备 |
US11295741B2 (en) | 2019-12-05 | 2022-04-05 | Soundhound, Inc. | Dynamic wakewords for speech-enabled devices |
WO2021118269A1 (en) * | 2019-12-12 | 2021-06-17 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
CN113096651A (zh) * | 2020-01-07 | 2021-07-09 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、可读存储介质及电子设备 |
KR20210089347A (ko) * | 2020-01-08 | 2021-07-16 | 엘지전자 주식회사 | 음성 인식 장치 및 음성데이터를 학습하는 방법 |
WO2021145895A1 (en) | 2020-01-17 | 2021-07-22 | Google Llc | Selectively invoking an automated assistant based on detected environmental conditions without necessitating voice-based invocation of the automated assistant |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
JP7482640B2 (ja) * | 2020-02-05 | 2024-05-14 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11321048B2 (en) * | 2020-02-25 | 2022-05-03 | Motorola Solutions, Inc. | Method and apparatus for temporary hands-free voice interaction |
US11862168B1 (en) * | 2020-03-30 | 2024-01-02 | Amazon Technologies, Inc. | Speaker disambiguation and transcription from multiple audio feeds |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
KR20210146737A (ko) * | 2020-05-27 | 2021-12-06 | 삼성전자주식회사 | 서버 및 그의 제어 방법 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US12223946B2 (en) * | 2020-09-11 | 2025-02-11 | International Business Machines Corporation | Artificial intelligence voice response system for speech impaired users |
CN112201239B (zh) * | 2020-09-25 | 2024-05-24 | 海尔优家智能科技(北京)有限公司 | 目标设备的确定方法及装置、存储介质、电子装置 |
US11462219B2 (en) * | 2020-10-30 | 2022-10-04 | Google Llc | Voice filtering other speakers from calls and audio messages |
US12062361B2 (en) * | 2020-11-02 | 2024-08-13 | Aondevices, Inc. | Wake word method to prolong the conversational state between human and a machine in edge devices |
US11783824B1 (en) * | 2021-01-18 | 2023-10-10 | Amazon Technologies, Inc. | Cross-assistant command processing |
US11776550B2 (en) * | 2021-03-09 | 2023-10-03 | Qualcomm Incorporated | Device operation based on dynamic classifier |
CN113160821A (zh) * | 2021-04-30 | 2021-07-23 | 中天智领(北京)科技有限公司 | 一种基于语音识别的控制方法及装置 |
CN113568318A (zh) * | 2021-05-31 | 2021-10-29 | 舌尖科技(北京)有限公司 | 一种多功能舱及相应计算机可读存储介质 |
US11893989B2 (en) * | 2021-07-13 | 2024-02-06 | Snap Inc. | Voice-controlled settings and navigation |
EP4409933A1 (en) | 2021-09-30 | 2024-08-07 | Sonos, Inc. | Enabling and disabling microphones and voice assistants |
WO2023056258A1 (en) | 2021-09-30 | 2023-04-06 | Sonos, Inc. | Conflict management for wake-word detection processes |
WO2023132574A1 (ko) * | 2022-01-10 | 2023-07-13 | 엘지전자 주식회사 | 인공 지능 기기 |
FI20225762A1 (en) * | 2022-08-31 | 2024-03-01 | Elisa Oyj | A COMPUTER-IMPLEMENTED METHOD FOR DETECTING ACTIVITY IN A VOICE STREAM |
KR20240048966A (ko) * | 2022-10-07 | 2024-04-16 | 엘지전자 주식회사 | 인공지능 기기 및 그의 동작 방법 |
CN117198287B (zh) * | 2023-08-30 | 2024-07-05 | 南京汇智互娱网络科技有限公司 | 一种用于智能体的人机交互的语音识别系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100657059B1 (ko) * | 2004-07-19 | 2006-12-13 | 삼성전자주식회사 | 음성인식구동방법 |
US8099287B2 (en) * | 2006-12-05 | 2012-01-17 | Nuance Communications, Inc. | Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands |
EP2531999A4 (en) * | 2010-02-05 | 2017-03-29 | Nuance Communications, Inc. | Language context sensitive command system and method |
KR101754686B1 (ko) * | 2010-07-23 | 2017-07-06 | 엘지전자 주식회사 | 음성인식 공기조화기 및 그 제어방법 |
US8924219B1 (en) * | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
US8666751B2 (en) * | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US10304465B2 (en) * | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
WO2014084413A1 (ko) * | 2012-11-28 | 2014-06-05 | 엘지전자 주식회사 | 가전 기기 구동 장치 및 방법 |
KR20140073889A (ko) | 2012-12-07 | 2014-06-17 | 현대자동차주식회사 | 대화형 음성인식을 위한 호출어 버퍼링 및 필링 인터페이스 |
KR20140089871A (ko) * | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 서버, 그 제어 방법 및 대화형 시스템 |
EP2816554A3 (en) * | 2013-05-28 | 2015-03-25 | Samsung Electronics Co., Ltd | Method of executing voice recognition of electronic device and electronic device using the same |
WO2015030474A1 (ko) * | 2013-08-26 | 2015-03-05 | 삼성전자 주식회사 | 음성 인식을 위한 전자 장치 및 방법 |
US9245527B2 (en) * | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9147397B2 (en) * | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
US9368105B1 (en) * | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
TWI525532B (zh) * | 2015-03-30 | 2016-03-11 | Yu-Wei Chen | Set the name of the person to wake up the name for voice manipulation |
US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
US9542941B1 (en) * | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US9940929B2 (en) * | 2015-12-09 | 2018-04-10 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
US10210863B2 (en) * | 2016-11-02 | 2019-02-19 | Roku, Inc. | Reception of audio commands |
-
2017
- 2017-08-25 KR KR1020170107963A patent/KR102411766B1/ko active Active
-
2018
- 2018-08-24 WO PCT/KR2018/009821 patent/WO2019039915A1/en active Application Filing
- 2018-08-24 EP EP18190758.5A patent/EP3447764B1/en active Active
- 2018-08-27 CN CN201810979837.3A patent/CN109427333B/zh active Active
- 2018-08-27 US US16/113,602 patent/US10692495B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3447764A1 (en) | 2019-02-27 |
WO2019039915A1 (en) | 2019-02-28 |
CN109427333A (zh) | 2019-03-05 |
KR20190022109A (ko) | 2019-03-06 |
CN109427333B (zh) | 2024-04-16 |
EP3447764B1 (en) | 2021-06-23 |
US10692495B2 (en) | 2020-06-23 |
US20190066680A1 (en) | 2019-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102411766B1 (ko) | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 | |
KR102374910B1 (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
US11217244B2 (en) | System for processing user voice utterance and method for operating same | |
CN110945584B (zh) | 基于上下文信息确定接收语音输入的持续时间的电子设备和系统 | |
KR20190109868A (ko) | 사운드 데이터를 처리하는 시스템 및 시스템의 제어 방법 | |
US11120792B2 (en) | System for processing user utterance and controlling method thereof | |
US12087298B2 (en) | Electronic device and method of controlling thereof | |
KR102594838B1 (ko) | 사용자 발화에 응답하여 통화를 포함하는 태스크를 수행하는 전자 장치 및 그 동작 방법 | |
KR102740847B1 (ko) | 사용자 입력 처리 방법 및 이를 지원하는 전자 장치 | |
US12198687B2 (en) | System for processing user utterance and control method thereof | |
KR20190032026A (ko) | 자연어 표현 제공 방법 및 이를 지원하는 전자 장치 | |
US11361750B2 (en) | System and electronic device for generating tts model | |
KR102787542B1 (ko) | 변형 발화 텍스트를 제공하는 전자 장치 및 그것의 동작 방법 | |
KR102741650B1 (ko) | 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치 | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
US11145290B2 (en) | System including electronic device of processing user's speech and method of controlling speech recognition on electronic device | |
CN113678119A (zh) | 用于生成自然语言响应的电子装置及其方法 | |
KR102511517B1 (ko) | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
US11127400B2 (en) | Electronic device and method of executing function of electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170825 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200721 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20170825 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210916 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220328 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220617 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220620 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |