KR102653450B1 - 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 - Google Patents
전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 Download PDFInfo
- Publication number
- KR102653450B1 KR102653450B1 KR1020170002830A KR20170002830A KR102653450B1 KR 102653450 B1 KR102653450 B1 KR 102653450B1 KR 1020170002830 A KR1020170002830 A KR 1020170002830A KR 20170002830 A KR20170002830 A KR 20170002830A KR 102653450 B1 KR102653450 B1 KR 102653450B1
- Authority
- KR
- South Korea
- Prior art keywords
- speaker
- electronic device
- score
- voice
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 title claims abstract description 180
- 238000000034 method Methods 0.000 title claims description 49
- 238000004891 communication Methods 0.000 claims description 34
- 238000003058 natural language processing Methods 0.000 claims description 25
- 230000009471 action Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 31
- 238000005516 engineering process Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000000605 extraction Methods 0.000 description 13
- 238000007726 management method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 230000009118 appropriate response Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000005316 response function Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 208000006930 Pseudomyxoma Peritonei Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000002583 angiography Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002567 electromyography Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000001646 magnetic resonance method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 229920000306 polymethylpentene Polymers 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000002601 radiography Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 229910052724 xenon Inorganic materials 0.000 description 1
- FHNFHKCVQCLJFQ-UHFFFAOYSA-N xenon atom Chemical compound [Xe] FHNFHKCVQCLJFQ-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/12—Score normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 2는 다양한 실시 예에 따른 전자 장치의 블록도를 도시한다.
도 3은 다양한 실시 예에 따른 프로그램 모듈의 블록도를 도시한다.
도 4는 다양한 실시 예에 따른 전자 장치에서 화자 모델을 등록하기 위한 블록도이다.
도 5는 다양한 실시 예에 따른 전자 장치의 프로세서의 구성도이다.
도 6은 다양한 실시 예에 따른 전자 장치의 세부 구성도이다.
도 7은 다양한 실시 예에 따른 전자 장치에 포함된 응답 결정 및 선택 모듈의 세부 구성도이다.
도 8은 다양한 실시 예에 따른 화자의 스코어 구간을 세분화하는 전자 장치의 일부 구성도이다.
도 9는 다양한 실시 예에 따른 전자 장치의 화자 모델 생성 동작의 흐름도이다.
도 10은 다양한 실시 예에 따른 전자 장치의 음성 입력에 대응하는 응답을 제공하는 동작의 흐름도이다.
도 11은 다양한 실시 예에 따른 전자 장치의 음성 입력에 대응하는 응답 결과를 나타낸 화면 예시도이다.
도 12는 다양한 실시 예에 따른 전자 장치(예: 전자 장치(101))의 입력 음성에 대한 응답 동작의 흐름도이다.
Claims (20)
- 전자 장치에 있어서,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서에 전기적으로 연결된 메모리를 포함하며,
상기 메모리는 상기 적어도 하나의 프로세서에 의해 실행될 때,
동작에 대한 요청을 나타내는 수신된 제1 음성을 인식하고,
상기 인식된 제1 음성에 기초하여 제1 화자를 인식하고,
상기 수신된 제1 음성으로부터 상기 제1 화자의 특징을 추출하고,
상기 추출된 특징 및 상기 메모리에 미리 저장된 화자 모델에 기초하여, 상기 제1 화자와 상기 미리 저장된 화자 모델의 유사성을 나타내는 스코어를 계산하고,
상기 스코어가 제1 문턱 값보다 크다는 것을 식별하는 것에 기초하여 3개의 스코어 구간들 중 제1 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제1 응답을 출력하고,
상기 스코어가 제1 문턱 값 이하이고, 상기 제1 문턱 값보다 작은 제2 문턱 값보다 크다는 것을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제2 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제2 응답을 출력하고,
상기 스코어가 상기 제2 문턱 값 이하임을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제3 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행하지 않을 것임을 나타내는 제3 응답을 출력하도록 상기 전자 장치를 제어하는 인스트럭션들(instructions)을 저장하는 전자 장치. - 삭제
- 제 1항에 있어서, 상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 제1 화자가 상기 미리 저장된 화자 모델과 서로 대응하는 경우, 상기 수신된 제1 음성의 음성 데이터를 이용하여 상기 미리 저장된 화자 모델을 업데이트하도록 하는 전자 장치. - 제 1항에 있어서, 상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 제1 화자의 인식 결과에 기초하여 미리 저장된 복수의 응답들 중 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 선택하도록 하는 전자 장치. - 제 1항에 있어서, 상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 제1 화자의 인식 결과에 기초하여 미리 저장된 복수의 응답들 중 적어도 일부를 이용하여 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 생성하도록 하는 전자 장치. - 제 1항에 있어서, 상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 인식된 제1 음성에 대한 자연 언어 처리를 통해 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 결정하도록 하는 전자 장치. - 삭제
- 제 1항에 있어서, 상기 메모리는,
복수의 스코어 구간들과, 상기 복수의 스코어 구간들 각각에 대응하는 상기 미리 저장된 화자 모델의 복수의 응답들을 저장하는 전자 장치. - 제 1항에 있어서, 상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 인식된 제1 음성 및 상기 계산된 스코어에 기초하여, 상기 제1 문턱 값, 또는 상기 제2 문턱 값 중 적어도 하나를 조정하도록 하는 전자 장치. - 제 1항에 있어서,
상기 제1 음성을 수신하는 마이크; 및
출력 장치를 포함하며,
상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 출력 장치를 이용하여 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 출력하도록 하는 것을 더 포함하는 전자 장치. - 제 1항에 있어서,
통신 인터페이스를 더 포함하며,
상기 인스트럭션들은, 상기 적어도 하나의 프로세서가,
상기 통신 인터페이스를 통해 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 다른 전자 장치로 전송하도록 하는 것을 더 포함하는 전자 장치. - 삭제
- 전자 장치의 입력 음성에 대한 응답 방법에 있어서,
동작에 대한 요청을 나타내는 수신된 제1 음성을 인식하는 동작;
상기 인식된 제1 음성에 기초하여 제1 화자를 인식하는 동작;
상기 수신된 제1 음성으로부터 상기 제1 화자의 특징을 추출하는 동작;
상기 추출된 특징 및 상기 전자 장치의 메모리에 미리 저장된 화자 모델에 기초하여, 상기 제1 화자와 상기 화자 모델의 유사성을 나타내는 스코어를 계산하는 동작;
상기 스코어가 제1 문턱 값보다 크다는 것을 식별하는 것에 기초하여 3개의 스코어 구간들 중 제1 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제1 응답을 출력하는 동작;
상기 스코어가 제1 문턱 값 이하이고, 상기 제1 문턱 값보다 작은 제2 문턱 값보다 크다는 것을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제2 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제2 응답을 출력하는 동작; 및
상기 스코어가 상기 제2 문턱 값 이하임을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제3 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행하지 않을 것임을 나타내는 제3 응답을 출력하는 동작;을 포함하는 전자 장치의 입력 음성에 대한 응답 방법. - 삭제
- ◈청구항 15은(는) 설정등록료 납부시 포기되었습니다.◈제 13항에 있어서,
상기 인식된 제1 음성에 대한 자연 언어 처리를 수행하는 동작;을 더 포함하는 전자 장치의 입력 음성에 대한 응답 방법. - 삭제
- ◈청구항 17은(는) 설정등록료 납부시 포기되었습니다.◈제 13항에 있어서,
복수의 스코어 구간들과, 상기 복수의 스코어 구간들 각각에 대응하는 상기 미리 저장된 화자 모델의 복수의 응답들을 저장하는 동작;을 포함하는 전자 장치의 입력 음성에 대한 응답 방법. - ◈청구항 18은(는) 설정등록료 납부시 포기되었습니다.◈제 13항에 있어서,
상기 전자 장치의 마이크를 이용하여 상기 제1 음성을 수신하는 동작; 및
상기 전자 장치의 출력 장치를 이용하여 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 출력하는 동작;을 더 포함하는 전자 장치의 입력 음성에 대한 응답 방법. - ◈청구항 19은(는) 설정등록료 납부시 포기되었습니다.◈제 13항에 있어서,
상기 전자 장치의 통신 인터페이스를 통해 상기 인식된 제1 음성에 대응하는 상기 제1 응답, 상기 제2 응답, 또는 상기 제3 응답 중 적어도 하나를 다른 전자 장치로 전송하는 동작;을 더 포함하는 전자 장치의 입력 음성에 대한 응답 방법. - ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈전자 장치의 입력 음성에 대한 응답 방법을 실행하기 위한 프로그램을 기록한 기계로 읽을 수 있는 저장 매체에 있어서, 상기 방법은,
동작에 대한 요청을 나타내는 수신된 제1 음성을 인식하는 동작;
상기 인식된 제1 음성에 기초하여 제1 화자를 인식하는 동작;
상기 수신된 제1 음성으로부터 상기 제1 화자의 특징을 추출하는 동작;
상기 추출된 특징 및 상기 전자 장치의 메모리에 미리 저장된 화자 모델에 기초하여, 상기 제1 화자와 상기 화자 모델의 유사성을 나타내는 스코어를 계산하는 동작;
상기 스코어가 제1 문턱 값보다 크다는 것을 식별하는 것에 기초하여 3개의 스코어 구간들 중 제1 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제1 응답을 출력하는 동작;
상기 스코어가 제1 문턱 값 이하이고, 상기 제1 문턱 값보다 작은 제2 문턱 값보다 크다는 것을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제2 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행할 것임을 나타내는 제2 응답을 출력하는 동작; 및
상기 스코어가 상기 제2 문턱 값 이하임을 식별하는 것에 기초하여 상기 3개의 스코어 구간들 중 제3 스코어 구간에 포함됨을 확인하면, 상기 제1 화자와 상기 미리 저장된 화자 모델이 서로 대응하지 않고 상기 전자 장치가 상기 요청된 동작을 수행하지 않을 것임을 나타내는 제3 응답을 출력하는 동작;을 포함하는 저장 매체.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170002830A KR102653450B1 (ko) | 2017-01-09 | 2017-01-09 | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 |
| US15/850,081 US10636420B2 (en) | 2017-01-09 | 2017-12-21 | Method of responding to input voice of electronic device and electronic device therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170002830A KR102653450B1 (ko) | 2017-01-09 | 2017-01-09 | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20180081922A KR20180081922A (ko) | 2018-07-18 |
| KR102653450B1 true KR102653450B1 (ko) | 2024-04-02 |
Family
ID=62783208
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020170002830A Active KR102653450B1 (ko) | 2017-01-09 | 2017-01-09 | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10636420B2 (ko) |
| KR (1) | KR102653450B1 (ko) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102476756B1 (ko) * | 2017-06-20 | 2022-12-09 | 삼성전자주식회사 | 사용자 인증을 위한 등록 데이터베이스의 적응적 갱신 방법 및 장치 |
| US10984795B2 (en) * | 2018-04-12 | 2021-04-20 | Samsung Electronics Co., Ltd. | Electronic apparatus and operation method thereof |
| KR102621897B1 (ko) * | 2018-10-10 | 2024-01-08 | 주식회사 케이티 | 화자 인식 장치 및 그 동작방법 |
| KR102622350B1 (ko) * | 2018-10-12 | 2024-01-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
| KR102141150B1 (ko) * | 2018-12-31 | 2020-08-04 | 서울시립대학교 산학협력단 | 화자종속 언어모델을 이용한 화자인식 장치 및 화자인식 방법 |
| CN109769099B (zh) * | 2019-01-15 | 2021-01-22 | 三星电子(中国)研发中心 | 通话人物异常的检测方法和装置 |
| KR102720486B1 (ko) * | 2019-02-18 | 2024-10-23 | 주식회사 케이티 | 화자 모델을 업데이트하는 음성 인식 장치, 방법 및 컴퓨터 프로그램 |
| KR102879134B1 (ko) * | 2019-11-04 | 2025-11-03 | 삼성전자주식회사 | 사용자 발화를 통해 화자인식 기능을 제공하는 전자장치 및 그 제어방법 |
| CN116711006A (zh) | 2021-02-23 | 2023-09-05 | 三星电子株式会社 | 电子装置及其控制方法 |
| KR20220120197A (ko) * | 2021-02-23 | 2022-08-30 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
| KR20230094005A (ko) * | 2021-12-20 | 2023-06-27 | 삼성전자주식회사 | 음향 센서를 이용한 화자 분류 장치 및 방법 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060020473A1 (en) | 2004-07-26 | 2006-01-26 | Atsuo Hiroe | Method, apparatus, and program for dialogue, and storage medium including a program stored therein |
| US20130339018A1 (en) * | 2012-06-15 | 2013-12-19 | Sri International | Multi-sample conversational voice verification |
| US20160092160A1 (en) * | 2014-09-26 | 2016-03-31 | Intel Corporation | User adaptive interfaces |
| US20160098996A1 (en) | 2014-10-02 | 2016-04-07 | International Business Machines Corporation | Management of voice commands for devices in a cloud computing environment |
| KR101618512B1 (ko) | 2015-05-06 | 2016-05-09 | 서울시립대학교 산학협력단 | 가우시안 혼합모델을 이용한 화자 인식 시스템 및 추가 학습 발화 선택 방법 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4968663B2 (ja) | 2006-01-25 | 2012-07-04 | 株式会社メガチップス | インターホンシステム |
| US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
| KR20130133629A (ko) | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
| US9147399B1 (en) * | 2012-08-31 | 2015-09-29 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
| US20140358535A1 (en) | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
| US9384738B2 (en) * | 2014-06-24 | 2016-07-05 | Google Inc. | Dynamic threshold for speaker verification |
| KR102199246B1 (ko) * | 2014-11-18 | 2021-01-07 | 에스케이텔레콤 주식회사 | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 |
-
2017
- 2017-01-09 KR KR1020170002830A patent/KR102653450B1/ko active Active
- 2017-12-21 US US15/850,081 patent/US10636420B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060020473A1 (en) | 2004-07-26 | 2006-01-26 | Atsuo Hiroe | Method, apparatus, and program for dialogue, and storage medium including a program stored therein |
| US20130339018A1 (en) * | 2012-06-15 | 2013-12-19 | Sri International | Multi-sample conversational voice verification |
| US20160092160A1 (en) * | 2014-09-26 | 2016-03-31 | Intel Corporation | User adaptive interfaces |
| US20160098996A1 (en) | 2014-10-02 | 2016-04-07 | International Business Machines Corporation | Management of voice commands for devices in a cloud computing environment |
| KR101618512B1 (ko) | 2015-05-06 | 2016-05-09 | 서울시립대학교 산학협력단 | 가우시안 혼합모델을 이용한 화자 인식 시스템 및 추가 학습 발화 선택 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| US10636420B2 (en) | 2020-04-28 |
| US20180197539A1 (en) | 2018-07-12 |
| KR20180081922A (ko) | 2018-07-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102653450B1 (ko) | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 | |
| US12354605B2 (en) | Electronic device for processing user speech and operating method therefor | |
| CN110199350B (zh) | 用于感测语音结束的方法和实现该方法的电子设备 | |
| KR102405793B1 (ko) | 음성 신호 인식 방법 및 이를 제공하는 전자 장치 | |
| CN109243432B (zh) | 话音处理方法以及支持该话音处理方法的电子设备 | |
| KR102414122B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 그 동작 방법 | |
| CN108023934B (zh) | 电子装置及其控制方法 | |
| CN108121490B (zh) | 用于处理多模式输入的电子装置、方法和服务器 | |
| KR102495517B1 (ko) | 전자 장치, 전자 장치의 음성 인식 방법 | |
| KR102880884B1 (ko) | 전자 장치 및 그의 동작 방법 | |
| KR102636638B1 (ko) | 컨텐츠 운용 방법 및 이를 구현한 전자 장치 | |
| US10825453B2 (en) | Electronic device for providing speech recognition service and method thereof | |
| US10706847B2 (en) | Method for operating speech recognition service and electronic device supporting the same | |
| KR102640423B1 (ko) | 음성 입력 처리 방법, 이를 지원하는 전자 장치, 및 시스템 | |
| EP2816554A2 (en) | Method of executing voice recognition of electronic device and electronic device using the same | |
| US11074910B2 (en) | Electronic device for recognizing speech | |
| KR102561572B1 (ko) | 센서 활용 방법 및 이를 구현한 전자 장치 | |
| US11915700B2 (en) | Device for processing user voice input | |
| KR20160027640A (ko) | 전자 장치 및 전자 장치에서의 개체명 인식 방법 | |
| US20200326832A1 (en) | Electronic device and server for processing user utterances | |
| US11004075B2 (en) | Device and method for performing payment using utterance | |
| KR20170093491A (ko) | 음성 인식 방법 및 이를 사용하는 전자 장치 | |
| KR102602480B1 (ko) | 사용자에게 뷰티 스타일링을 추천하는 전자 장치 및 그 동작 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170109 |
|
| PG1501 | Laying open of application | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20211230 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20170109 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230809 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20240119 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240327 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20240328 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |
