KR20190022109A - 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 - Google Patents
음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 Download PDFInfo
- Publication number
- KR20190022109A KR20190022109A KR1020170107963A KR20170107963A KR20190022109A KR 20190022109 A KR20190022109 A KR 20190022109A KR 1020170107963 A KR1020170107963 A KR 1020170107963A KR 20170107963 A KR20170107963 A KR 20170107963A KR 20190022109 A KR20190022109 A KR 20190022109A
- Authority
- KR
- South Korea
- Prior art keywords
- user
- processor
- caller
- voice
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000003213 activating effect Effects 0.000 title claims abstract description 26
- 238000004891 communication Methods 0.000 claims abstract description 73
- 230000006870 function Effects 0.000 claims abstract description 49
- 230000004044 response Effects 0.000 claims abstract description 45
- 238000001514 detection method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000010801 machine learning Methods 0.000 claims abstract description 9
- 230000004913 activation Effects 0.000 claims description 35
- 238000010304 firing Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 30
- 238000013473 artificial intelligence Methods 0.000 abstract description 10
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 238000013135 deep learning Methods 0.000 abstract description 4
- 210000004556 brain Anatomy 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 235000015278 beef Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 206010033307 Overweight Diseases 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
다양한 실시예는 스피커, 마이크, 통신 인터페이스, 상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및 상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금, 사용자 입력에 응답하여 음성 인식 서비스를 활성화하고, 상기 활성화된 음성 인식 서비스에 의해 입력된 음성 정보에 대한 태스크를 처리하고, 상기 음성 정보를 분석하여 적어도 하나의 사용자 호출어를 등록하고, 상기 적어도 하나의 사용자 호출어 감지에 응답하여 상기 음성 인식 서비스를 활성화하도록 설정된 전자 장치 및 방법을 제공한다. 또한, 상기 사용자 호출어는 제스처(예: 수화), 모스 부호, 특정 부호어, 텍스트, 시각 등 다양한 입력 방식을 통해 등록할 수 있다.
Description
도 2는 다양한 실시예들에 따른 전자 장치의 구성을 도시한 블록도이다.
도 3은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시한 흐름도이다.
도 4는 다양한 실시예들에 따른 사용자 호출어를 이용하여 음성 인식 서비스를 활성화하는 일례를 도시한 도면이다.
도 5는 다양한 실시예들에 따른 전자 장치의 사용자 호출어 등록 방법을 도시한 흐름도이다.
도 6은 다양한 실시예들에 따른 사용자 호출어를 편집하는 일례를 도시한 도면이다.
도 7은 다양한 실시예들에 따른 사용자 호출어를 이용하여 음성 인식 서비스를 활성화하는 방법을 도시한 흐름도이다.
도 8은 다양한 실시예들에 따른 사용자 호출어를 초기화하는 방법을 도시한 흐름도이다.
도 9는 다양한 실시예들에 따른 화자의 수에 따라 사용자 호출어 서비스를 제어하는 방법을 도시한 흐름도이다.
도 10a 및 도 10b는 다양한 실시예들에 따른 사용자 호출어 서비스를 제어하는 일례를 도시한 도면들이다.
도 11은 다양한 실시예들에 따른 현재 조건에 대응하여 사용자 호출어를 제어하는 방법을 도시한 흐름도이다.
도 12a 및 도 12b는 다양한 실시예들에 따른 현재 조건에 따라 사용자 호출어를 제어하는 일례를 도시한 도면들이다.
210: 프로세서
211: 호출어 감지 모듈 213: 음성 인식 모듈
215: 호출어 제어 모듈 217: 화자 식별 모듈
219: 조건 판단 모듈
220: 마이크 230: 스피커
240: 메모리 250: 통신부
Claims (20)
- 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
사용자 입력에 응답하여 음성 인식 서비스를 활성화하고,
상기 활성화된 음성 인식 서비스에 의해 입력된 음성 정보에 대한 태스크를 처리하고,
상기 음성 정보를 분석하여 적어도 하나의 사용자 호출어를 등록하고,
상기 적어도 하나의 사용자 호출어 감지에 응답하여 상기 음성 인식 서비스를 활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보로부터 텍스트 정보를 추출하고, 상기 텍스트 정보로부터 적어도 하나의 단어를 획득하고, 상기 획득된 단어를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제2항에 있어서,
상기 인스트럭션들은 상기 텍스트 정보로부터 적어도 하나의 제1 단어를 획득하고, 상기 제1 단어로부터 상기 제1 단어와 연관된 적어도 하나의 제2 단어를 획득하고, 상기 제1 단어 또는 상기 제2 단어를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제3항에 있어서,
상기 인스트럭션들은 상기 제1 단어 및 상기 제2 단어를 이용하여 적어도 하나의 제3 단어를 획득하고, 상기 제1 단어 내지 상기 제3 단어 중 적어도 하나를 상기 사용자 호출어로 등록하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보에 대한 태스크를 처리한 후 활성화 대기시간을 카운트하고, 상기 활성화 대기시간 동안 음성이 검출되지 않는 경우, 상기 음성 인식 서비스를 비활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 인식 서비스가 비활성화된 상태에서 음성이 감지되면, 상기 입력된 음성에 메인 호출어가 포함되어 있는지 판단하고, 상기 입력된 음성에 상기 메인 호출어가 포함되어 있는 경우 상기 등록된 사용자 호출어를 초기화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 화자를 식별하고, 상기 식별된 화자의 인원수에 따라 상기 사용자 호출어를 이용한 음성 인식 서비스를 제어하도록 설정된 전자 장치. - 제7항에 있어서,
상기 인스트럭션들은 상기 화자가 한 명을 초과하는 경우 상기 사용자 호출어를 이용한 음성 인식 서비스를 비활성화하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 현재 조건이 조건 정보에 해당하는지 여부를 판단하고, 상기 현재 조건이 조건 정보에 해당하는 경우, 상기 조건 정보에 대응하는 적어도 하나의 사용자 호출어를 인에이블하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 조건 정보가 만료되는지 여부를 판단하고, 상기 조건 정보가 만료되는 경우 상기 조건 정보에 대응하는 적어도 하나의 사용자 호출어를 디스에이블하도록 설정된 전자 장치. - 제1항에 있어서,
상기 사용자 입력은, 음성 호출어, 터치, 또는 버튼 중 적어도 하나를 포함하는 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 정보에 대한 태스크를 처리한 후 상기 사용자 호출어를 제어하기 위한 사용자 인터페이스를 디스플레이에 표시하도록 설정된 전자 장치. - 제1항에 있어서,
상기 인스트럭션들은 상기 음성 인식 서비스가 활성화되는 동안 화자 식별에 따른 상기 사용자 호출어를 이용한 음성 인식 서비스를 제어하도록 설정된 전자 장치. - 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
상기 마이크를 통해 적어도 하나의 메인 호출어를 수신하고,
상기 수신된 메인 호출어에 응답하여 외부 서버에서 제공되거나, 상기 전자 장치에 구현된 음성 인식 기능을 활성화하고,
상기 마이크를 통해 적어도 하나의 사용자 호출어를 포함하는 사용자 발화를 수신하고,
상기 메인 호출어 없이 상기 수신된 사용자 호출어에 응답하여 상기 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 제14항에 있어서,
상기 적어도 하나의 메인 호출어는 상기 전자 장치와 연관된 이름 또는 제목을 포함하도록 설정된 전자 장치. - 제14항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자에 의해 선택된 이름 또는 제목을 포함하도록 설정된 전자 장치. - 제14항에 있어서,
상기 인스트럭션들은 설정된 시간 주기 동안만 상기 수신된 사용자 호출어에 응답하여 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 전자 장치에 있어서,
스피커;
마이크;
통신 인터페이스;
상기 스피커, 상기 마이크 또는 상기 통신 인터페이스와 전기적으로 연결된 프로세서; 및
상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들은 실행 시에 상기 프로세서로 하여금,
상기 마이크를 통해 적어도 하나의 메인 호출어를 수신하고,
하루의 특정 시점에 관계없이(regardless of a point in time in a day) 상기 수신된 메인 호출어에 응답하여 외부 서버에서 제공되거나, 상기 전자 장치에 구현된 음성 인식 기능을 활성화하고,
상기 마이크를 통해 적어도 하나의 사용자 호출어를 수신하고,
하루의 일정 기간 동안(during a period of time during a day) 상기 수신된 사용자 호출어에 응답하여 상기 음성 인식 기능을 활성화하도록 설정된 전자 장치. - 제18항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자 발화의 주제(subject matter) 또는 토픽과 연관된 것인 전자 장치. - 제18항에 있어서,
상기 적어도 하나의 사용자 호출어는 사용자의 발화 이력 또는 기계 학습(machine learning)으로부터 선택된 것인 전자 장치.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170107963A KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
EP18190758.5A EP3447764B1 (en) | 2017-08-25 | 2018-08-24 | Electronic device for implementing method of activiating voice-recognition service |
PCT/KR2018/009821 WO2019039915A1 (en) | 2017-08-25 | 2018-08-24 | METHOD FOR ACTIVATION OF VOICE RECOGNITION SERVICE AND ELECTRONIC DEVICE IMPLEMENTING THE SAME |
US16/113,602 US10692495B2 (en) | 2017-08-25 | 2018-08-27 | Method of receiving commands for activating voice-recognition service and electronic device for implementing same |
CN201810979837.3A CN109427333B (zh) | 2017-08-25 | 2018-08-27 | 激活语音识别服务的方法和用于实现所述方法的电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170107963A KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190022109A true KR20190022109A (ko) | 2019-03-06 |
KR102411766B1 KR102411766B1 (ko) | 2022-06-22 |
Family
ID=63490205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170107963A Active KR102411766B1 (ko) | 2017-08-25 | 2017-08-25 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10692495B2 (ko) |
EP (1) | EP3447764B1 (ko) |
KR (1) | KR102411766B1 (ko) |
CN (1) | CN109427333B (ko) |
WO (1) | WO2019039915A1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190082689A (ko) * | 2019-06-20 | 2019-07-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
WO2020226213A1 (ko) * | 2019-05-09 | 2020-11-12 | 엘지전자 주식회사 | 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법 |
KR20200138916A (ko) * | 2019-06-03 | 2020-12-11 | 엘지전자 주식회사 | 의류처리장치 및 의류처리장치의 음성인식 방법 |
WO2021118269A1 (en) * | 2019-12-12 | 2021-06-17 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
US11250852B2 (en) | 2019-06-18 | 2022-02-15 | Lg Electronics Inc. | Generation of trigger recognition models for robot |
WO2023132574A1 (ko) * | 2022-01-10 | 2023-07-13 | 엘지전자 주식회사 | 인공 지능 기기 |
Families Citing this family (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180190306A1 (en) | 2017-01-04 | 2018-07-05 | 2236008 Ontario Inc. | Voice interface and vocal entertainment system |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US20190130898A1 (en) * | 2017-11-02 | 2019-05-02 | GM Global Technology Operations LLC | Wake-up-word detection |
CN107895573B (zh) * | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
KR102361458B1 (ko) * | 2018-01-25 | 2022-02-10 | 삼성전자주식회사 | 사용자 발화 응답 방법 및 이를 지원하는 전자 장치 |
US10789940B2 (en) * | 2018-03-27 | 2020-09-29 | Lenovo (Singapore) Pte. Ltd. | Dynamic wake word identification |
CN108600911B (zh) * | 2018-03-30 | 2021-05-18 | 联想(北京)有限公司 | 一种输出方法及电子设备 |
US10929097B2 (en) * | 2018-06-26 | 2021-02-23 | ROVl GUIDES, INC. | Systems and methods for switching operational modes based on audio triggers |
WO2020017166A1 (ja) * | 2018-07-20 | 2020-01-23 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11289097B2 (en) * | 2018-08-28 | 2022-03-29 | Dell Products L.P. | Information handling systems and methods for accurately identifying an active speaker in a communication session |
WO2020056380A1 (en) | 2018-09-13 | 2020-03-19 | The Charles Stark Draper Laboratory, Inc. | Locating and attaching interchangeable tools in-situ |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
JP7202853B2 (ja) * | 2018-11-08 | 2023-01-12 | シャープ株式会社 | 冷蔵庫 |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11211061B2 (en) * | 2019-01-07 | 2021-12-28 | 2236008 Ontario Inc. | Voice control in a multi-talker and multimedia environment |
TW202029181A (zh) * | 2019-01-28 | 2020-08-01 | 正崴精密工業股份有限公司 | 語音識別用於特定目標喚醒的方法及裝置 |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
JP7198122B2 (ja) * | 2019-03-07 | 2022-12-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP2020144275A (ja) * | 2019-03-07 | 2020-09-10 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP7629848B2 (ja) * | 2019-03-22 | 2025-02-14 | ソニー・オリンパスメディカルソリューションズ株式会社 | 制御装置及び医療用観察システム |
CN110012166B (zh) * | 2019-03-31 | 2021-02-19 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
US10964324B2 (en) | 2019-04-26 | 2021-03-30 | Rovi Guides, Inc. | Systems and methods for enabling topic-based verbal interaction with a virtual assistant |
EP3759709B1 (en) * | 2019-05-06 | 2024-11-13 | Google LLC | Selectively activating on-device speech recognition, and using recognized text in selectively activating on-device nlu and/or on-device fulfillment |
KR102671211B1 (ko) * | 2019-05-23 | 2024-06-03 | 삼성전자 주식회사 | 하우징의 입력에 대응하는 피드백을 제공하는 전자 장치 |
CN115482806B (zh) * | 2019-06-06 | 2024-06-25 | 腾讯科技(深圳)有限公司 | 语音处理系统、方法、装置、存储介质和计算机设备 |
CN110265029A (zh) * | 2019-06-21 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 语音芯片和电子设备 |
KR102246661B1 (ko) * | 2019-06-25 | 2021-05-03 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법 및 장치 |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
KR20210017392A (ko) * | 2019-08-08 | 2021-02-17 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
US11639944B2 (en) * | 2019-08-26 | 2023-05-02 | Apple Inc. | Methods and apparatus for detecting individual health related events |
EP3792914A3 (en) * | 2019-09-12 | 2021-05-05 | Orcam Technologies Ltd. | Wearable apparatus and methods for processing audio signals |
CN110989963B (zh) * | 2019-11-22 | 2023-08-01 | 北京梧桐车联科技有限责任公司 | 唤醒词推荐方法及装置、存储介质 |
CN112835413B (zh) * | 2019-11-25 | 2024-05-31 | Oppo广东移动通信有限公司 | 可穿戴设备的控制方法和装置、电子设备 |
US11295741B2 (en) | 2019-12-05 | 2022-04-05 | Soundhound, Inc. | Dynamic wakewords for speech-enabled devices |
CN113096651A (zh) * | 2020-01-07 | 2021-07-09 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、可读存储介质及电子设备 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
KR20210089347A (ko) * | 2020-01-08 | 2021-07-16 | 엘지전자 주식회사 | 음성 인식 장치 및 음성데이터를 학습하는 방법 |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
JP7482640B2 (ja) * | 2020-02-05 | 2024-05-14 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11321048B2 (en) | 2020-02-25 | 2022-05-03 | Motorola Solutions, Inc. | Method and apparatus for temporary hands-free voice interaction |
US11862168B1 (en) * | 2020-03-30 | 2024-01-02 | Amazon Technologies, Inc. | Speaker disambiguation and transcription from multiple audio feeds |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
KR20210146737A (ko) * | 2020-05-27 | 2021-12-06 | 삼성전자주식회사 | 서버 및 그의 제어 방법 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US12223946B2 (en) * | 2020-09-11 | 2025-02-11 | International Business Machines Corporation | Artificial intelligence voice response system for speech impaired users |
CN112201239B (zh) * | 2020-09-25 | 2024-05-24 | 海尔优家智能科技(北京)有限公司 | 目标设备的确定方法及装置、存储介质、电子装置 |
US12062361B2 (en) * | 2020-11-02 | 2024-08-13 | Aondevices, Inc. | Wake word method to prolong the conversational state between human and a machine in edge devices |
US11955112B1 (en) * | 2021-01-18 | 2024-04-09 | Amazon Technologies, Inc. | Cross-assistant command processing |
US11776550B2 (en) * | 2021-03-09 | 2023-10-03 | Qualcomm Incorporated | Device operation based on dynamic classifier |
CN113160821A (zh) * | 2021-04-30 | 2021-07-23 | 中天智领(北京)科技有限公司 | 一种基于语音识别的控制方法及装置 |
CN113568318A (zh) * | 2021-05-31 | 2021-10-29 | 舌尖科技(北京)有限公司 | 一种多功能舱及相应计算机可读存储介质 |
US11893989B2 (en) * | 2021-07-13 | 2024-02-06 | Snap Inc. | Voice-controlled settings and navigation |
WO2023056026A1 (en) * | 2021-09-30 | 2023-04-06 | Sonos, Inc. | Enabling and disabling microphones and voice assistants |
FI20225762A1 (en) * | 2022-08-31 | 2024-03-01 | Elisa Oyj | A COMPUTER-IMPLEMENTED METHOD FOR DETECTING ACTIVITY IN A VOICE STREAM |
KR20240048966A (ko) * | 2022-10-07 | 2024-04-16 | 엘지전자 주식회사 | 인공지능 기기 및 그의 동작 방법 |
CN117198287B (zh) * | 2023-08-30 | 2024-07-05 | 南京汇智互娱网络科技有限公司 | 一种用于智能体的人机交互的语音识别系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140097365A (ko) * | 2011-11-17 | 2014-08-06 | 마이크로소프트 코포레이션 | 장치 활성화를 위한 오디오 패턴 정합 |
KR20160055162A (ko) * | 2013-08-26 | 2016-05-17 | 삼성전자주식회사 | 음성 인식을 위한 전자 장치 및 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100657059B1 (ko) * | 2004-07-19 | 2006-12-13 | 삼성전자주식회사 | 음성인식구동방법 |
US8099287B2 (en) * | 2006-12-05 | 2012-01-17 | Nuance Communications, Inc. | Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands |
US20110288859A1 (en) * | 2010-02-05 | 2011-11-24 | Taylor Andrew E | Language context sensitive command system and method |
KR101754686B1 (ko) * | 2010-07-23 | 2017-07-06 | 엘지전자 주식회사 | 음성인식 공기조화기 및 그 제어방법 |
US8924219B1 (en) * | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US10304465B2 (en) * | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
WO2014084413A1 (ko) * | 2012-11-28 | 2014-06-05 | 엘지전자 주식회사 | 가전 기기 구동 장치 및 방법 |
KR20140073889A (ko) | 2012-12-07 | 2014-06-17 | 현대자동차주식회사 | 대화형 음성인식을 위한 호출어 버퍼링 및 필링 인터페이스 |
KR20140089871A (ko) | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 서버, 그 제어 방법 및 대화형 시스템 |
US20140358535A1 (en) * | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
US9245527B2 (en) * | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9147397B2 (en) * | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
US9368105B1 (en) * | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
TWI525532B (zh) * | 2015-03-30 | 2016-03-11 | Yu-Wei Chen | Set the name of the person to wake up the name for voice manipulation |
US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
US9542941B1 (en) * | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US9940929B2 (en) * | 2015-12-09 | 2018-04-10 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
US10210863B2 (en) * | 2016-11-02 | 2019-02-19 | Roku, Inc. | Reception of audio commands |
-
2017
- 2017-08-25 KR KR1020170107963A patent/KR102411766B1/ko active Active
-
2018
- 2018-08-24 EP EP18190758.5A patent/EP3447764B1/en active Active
- 2018-08-24 WO PCT/KR2018/009821 patent/WO2019039915A1/en active Application Filing
- 2018-08-27 US US16/113,602 patent/US10692495B2/en active Active
- 2018-08-27 CN CN201810979837.3A patent/CN109427333B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140097365A (ko) * | 2011-11-17 | 2014-08-06 | 마이크로소프트 코포레이션 | 장치 활성화를 위한 오디오 패턴 정합 |
KR20160055162A (ko) * | 2013-08-26 | 2016-05-17 | 삼성전자주식회사 | 음성 인식을 위한 전자 장치 및 방법 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020226213A1 (ko) * | 2019-05-09 | 2020-11-12 | 엘지전자 주식회사 | 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법 |
US11200888B2 (en) | 2019-05-09 | 2021-12-14 | Lg Electronics Inc. | Artificial intelligence device for providing speech recognition function and method of operating artificial intelligence device |
KR20200138916A (ko) * | 2019-06-03 | 2020-12-11 | 엘지전자 주식회사 | 의류처리장치 및 의류처리장치의 음성인식 방법 |
US11250852B2 (en) | 2019-06-18 | 2022-02-15 | Lg Electronics Inc. | Generation of trigger recognition models for robot |
KR20190082689A (ko) * | 2019-06-20 | 2019-07-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11308955B2 (en) | 2019-06-20 | 2022-04-19 | Lg Electronics Inc. | Method and apparatus for recognizing a voice |
WO2021118269A1 (en) * | 2019-12-12 | 2021-06-17 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
US11688396B2 (en) | 2019-12-12 | 2023-06-27 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
US12205593B2 (en) | 2019-12-12 | 2025-01-21 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
WO2023132574A1 (ko) * | 2022-01-10 | 2023-07-13 | 엘지전자 주식회사 | 인공 지능 기기 |
Also Published As
Publication number | Publication date |
---|---|
CN109427333B (zh) | 2024-04-16 |
US10692495B2 (en) | 2020-06-23 |
EP3447764A1 (en) | 2019-02-27 |
CN109427333A (zh) | 2019-03-05 |
US20190066680A1 (en) | 2019-02-28 |
EP3447764B1 (en) | 2021-06-23 |
WO2019039915A1 (en) | 2019-02-28 |
KR102411766B1 (ko) | 2022-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102411766B1 (ko) | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 | |
US10832674B2 (en) | Voice data processing method and electronic device supporting the same | |
US11430438B2 (en) | Electronic device providing response corresponding to user conversation style and emotion and method of operating same | |
KR20190109868A (ko) | 사운드 데이터를 처리하는 시스템 및 시스템의 제어 방법 | |
EP3608906A1 (en) | System for processing user voice utterance and method for operating same | |
KR102406718B1 (ko) | 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템 | |
KR20210016815A (ko) | 복수의 지능형 에이전트를 관리하는 전자 장치 및 그의 동작 방법 | |
KR102740847B1 (ko) | 사용자 입력 처리 방법 및 이를 지원하는 전자 장치 | |
KR20200043642A (ko) | 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법 | |
US12183327B2 (en) | Voice recognition service operating method and electronic device supporting same | |
KR102421745B1 (ko) | Tts 모델을 생성하는 시스템 및 전자 장치 | |
EP3794809B1 (en) | Electronic device for performing task including call in response to user utterance and operation method thereof | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
KR20200099380A (ko) | 음성 인식 서비스를 제공하는 방법 및 그 전자 장치 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
KR20210116897A (ko) | 외부 장치의 음성 기반 제어를 위한 방법 및 그 전자 장치 | |
KR102511517B1 (ko) | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
US11145290B2 (en) | System including electronic device of processing user's speech and method of controlling speech recognition on electronic device | |
KR20210015234A (ko) | 전자 장치, 및 그의 음성 명령에 따른 기능이 실행되도록 제어하는 방법 | |
KR20190130202A (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
KR20210044606A (ko) | 웨이크업 모델 생성 방법 및 이를 위한 전자 장치 | |
KR102786492B1 (ko) | 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법 | |
KR20200042137A (ko) | 변형 발화 텍스트를 제공하는 전자 장치 및 그것의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170825 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200721 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20170825 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210916 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220328 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220617 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220620 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |