KR20170083391A - 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 - Google Patents
음성 인식 시스템에서의 발화 검증 장치 및 그 방법 Download PDFInfo
- Publication number
- KR20170083391A KR20170083391A KR1020160002792A KR20160002792A KR20170083391A KR 20170083391 A KR20170083391 A KR 20170083391A KR 1020160002792 A KR1020160002792 A KR 1020160002792A KR 20160002792 A KR20160002792 A KR 20160002792A KR 20170083391 A KR20170083391 A KR 20170083391A
- Authority
- KR
- South Korea
- Prior art keywords
- unit
- sentence
- speech
- event
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000005259 measurement Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000000945 filler Substances 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 208000037656 Respiratory Sounds Diseases 0.000 claims description 3
- 230000029058 respiratory gaseous exchange Effects 0.000 claims description 2
- 238000012706 support-vector machine Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 238000012937 correction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 208000003028 Stuttering Diseases 0.000 description 1
- 206010046542 Urinary hesitation Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/197—Probabilistic grammars, e.g. word n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명에 따른 음성 인식 시스템에 대한 전체 블록 구성을 나타낸 도면.
도 3은 도 2에 도시된 이벤트 검출기의 상세 구성을 나타낸 도면.
도 4는 도 2에 도시된 발화 검증부에 대한 상세 블록 구성을 나타낸 도면.
도 5는 도 4에 도시된 단어 단위 발화 검증부에 대한 상세 동작을 설명하기 위한 동작 플로우챠트.
번호 | 특징 |
1 | 잡음 추정구간 및 추정값 |
2 | 숨소리 구간 및 추정값 |
3 | 간투사 구간 및 추정값 |
4 | 어구반복 구간 및 추정값 |
5 | 머뭇거림 구간 및 추정값 |
6 | 감탄사 구간 및 추정값 |
7 | 장음화 구간 및 추정값 |
8 | 웃음 구간 및 추정값 |
9 | 발화속도 구간 및 추정값 |
10 | 말뭉개짐 구간 및 추정값 |
11 | 이벤트가 검출되지 않은 프레임수 및 로그비 우도값 |
300 : 탐색부 400 : 이벤트 검출부
410 : 잡음 레벨 검출기 420 : 숨소리 검출기
430 : 간투사 검출기 440 : 어구 반복 검출기
450 : 머뭇거림 검출기 460 : 감탄사 검출기
470 : 장음화 검출기 480 : 웃음 검출기
480 : 발화 속도 검출기 490 : 말뭉개짐 검출기
500 : 발화 검증부 510 : 단어단위 발화 검증부
520 : 문장 단위 발화 검증부
530 : 문장 단위 이벤트 적용 발화 검증부
540 : 문장 구조 및 의미 분석부
550 : 판단부 600 : 데이터베이스
Claims (20)
- 입력되는 음성신호에 대한 잡음을 처리하는 잡음 처리부;
잡음 처리된 음성 데이터에 대한 특징을 추출하는 특징 추출부;
상기 잡음 처리된 데이터와 추출된 특징 데이터를 이용하여 해당 음성 데이터에서 발생되는 다수의 음성 특성에 대한 이벤트를 검출하는 이벤트 검출부;
상기 추출된 특징 데이터에 대하여 기 설정된 다수의 음성 인식 모델을 이용하여 음성 인식을 수행하는 탐색부; 및
상기 이벤트 검출부에서 검출된 다중 이벤트 정보와 기 설정된 발화 검증 모델을 사용하여 단어 단위와 문장 단위별로 신뢰도 측정 값을 계산하고, 계산된 신뢰도 측정값에 따라 발화 검증을 수행하는 발화 검증부를 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제1항에 있어서,
상기 이벤트 검출부는,
상기 잡음 처리된 데이터 및 특징이 검출된 데이터로부터 잡음 레벨, 숨소리, 간투사, 어구반복, 머뭇거림, 감탄사, 장음화, 웃음, 발화속도 및 말뭉개짐 중 적어도 하나 이상의 특성을 검출하는 검출기를 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제1항에 있어서,
상기 음성 인식 모델은, 문맥종속 음향 모델, n-gram 언어 모델을 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제1항에 있어서,
상기 발화 검증 모델은, 스무딩 반모델, 상세한 반모델, 필러 모델, SVM 모델을 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제4항에 있어서,
상기 발화 검증부는,
이벤트가 발생한 구간의 단어와 이벤트가 발생하지 않은 단어에 대하여 각각 단어별 신뢰도 스코어를 계산하는 단어 단위 발화 검증부;
상기 단어 단위 발화 검증부에서 계산된 단어 수준 신뢰도 척도에 대해 문장 단위 또는 발화 단위로 신뢰도 스코어를 계산하는 문장 단위 발화 검증부;
단어 경계를 구분하지 않고, 이벤트가 발생한 구간에 대한 구간 정보와 추정된 다수의 특징 파라미터값을 사용하여 이벤트가 적용된 문장 단위의 신뢰도 스코어를 계산하는 문장 단위 이벤트 적용 발화 검증부;
상기 탐색부에서의 탐색 결과인 음성인식 결과 문장에 대해 문장 구조 및 의미를 분석하여 문장에 대한 신뢰도 스코어를 계산하는 문장 구조 및 의미 분석부; 및
상기 문장 단위 발화 검증부에서 계산된 스코어, 문장 단위 이벤트 적용 발화 검증부에서 계산된 스코어, 문장 구조 및 의미 분석부에서 계산된 스코어를 기 설정된 임계값과 각각 비교하여 그 결과에 따라 문장 인식의 수락 여부를 결정하는 판단부를 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제5항에 있어서,
상기 단어 단위 발화 검증부는, 데이터베이스에 기 설정된 상세한 반모델과 필러 모델을 사용하여 단어별 신뢰도 스코어(척도)를 계산하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제5항에 있어서,
상기 문장 단위 이벤트 적용 발화 검증부는, 해당 문장에 대해 자연어의 특성을 반영하고 있는 훈련 데이터를 사용하여 SVM으로 훈련된 데이터베이스에 기 설정된 SVM 모델을 이용하여 신뢰도 스코어를 계산하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제5항에 있어서,
상기 문장 단위 이벤트 적용 발화 검증부에서의 특징 파라미터는, 잡음 추정구간 및 추정값, 숨소리 구간 및 추정값, 간투사 구간 및 추정값, 어구반복 구간 및 추정값, 머뭇거림 구간 및 추정값, 감탄사 구간 및 추정값, 장음화 구간 및 추정값, 웃음 구간 및 추정값, 발화속도 구간 및 추정값, 말뭉개짐 구간 및 추정값, 이벤트가 검출되지 않은 프레임수 및 로그비 우도값 중 적어도 하나 이상의 파라미터를 포함하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제5항에 있어서,
상기 문장 구조 및 의미 분석부에서의 음성인식 결과 문장에 대한 문장 구조 및 의미 분석은 형태소 분석기를 이용하는 것인 음성 인식 시스템의 발화 검증 장치.
- 제5항에 있어서,
상기 판단부는,
상기 문장 단위 발화 검증부에서 계산된 스코어, 문장 단위 이벤트 적용 발화 검증부에서 계산된 스코어, 문장 구조 및 의미 분석부에서 계산된 스코어 중 2개 이상의 스코어가 기 설정된 임계값 보다 크면 문장 인식을 수락하고, 3개의 스코어 모두가 기 설정된 임계값보다 작으면 인식 문장을 거절하고, 상기 3개의 스코어중 1개의 스코어가 기 설정된 임계값보다 크고, 2개의 스코어가 기 설정된 임계값보다 작으면 인식 문장의 판단불가로 판단하는 것인 음성 인식 시스템의 발화 검증 장치.
- 입력되는 음성신호에 대한 잡음을 처리하는 단계;
잡음 처리된 음성 데이터에 대한 특징을 추출하는 단계;
상기 잡음 처리된 데이터와 추출된 특징 데이터를 이용하여 해당 음성 데이터에서 발생되는 다수의 음성 특성에 대한 이벤트를 검출하는 단계;
상기 추출된 특징 데이터에 대하여 기 설정된 다수의 음성 인식 모델을 이용하여 음성 인식을 수행하는 단계; 및
상기 검출된 다중 이벤트 정보와 기 설정된 발화 검증 모델을 사용하여 단어 단위와 문장 단위별로 신뢰도 측정 값을 계산하고, 계산된 신뢰도 측정값에 따라 발화 검증을 수행하는 단계를 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제11항에 있어서,
상기 이벤트는,
상기 잡음 처리된 데이터 및 특징이 검출된 데이터로부터 잡음 레벨, 숨소리, 간투사, 어구반복, 머뭇거림, 감탄사, 장음화, 웃음, 발화속도 및 말뭉개짐 중 적어도 하나를 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제11항에 있어서,
상기 음성 인식 모델은, 문맥종속 음향 모델, n-gram 언어 모델을 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제11항에 있어서,
상기 발화 검증 모델은, 스무딩 반모델, 상세한 반모델, 필러 모델, SVM 모델을 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제14항에 있어서,
상기 발화 검증을 수행하는 단계는,
이벤트가 발생한 구간의 단어와 이벤트가 발생하지 않은 단어에 대하여 각각 단어별 신뢰도 스코어를 계산하는 단계;
상기 계산된 단어 수준 신뢰도 척도에 대해 문장 단위 또는 발화 단위로 신뢰도 스코어를 계산하는 단계;
단어 경계를 구분하지 않고, 이벤트가 발생한 구간에 대한 구간 정보와 추정된 다수의 특징 파라미터값을 사용하여 이벤트가 적용된 문장 단위의 신뢰도 스코어를 계산하는 단계;
상기 음성인식 결과 문장에 대해 문장 구조 및 의미를 분석하여 문장에 대한 신뢰도 스코어를 계산하는 단계; 및
상기 계산된 각각의 스코어를 기 설정된 임계값과 각각 비교하여 그 결과에 따라 문장 인식의 수락 여부를 결정하는 단계를 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제15항에 있어서,
상기 단어별 신뢰도 스코어를 계산하는 단계는, 데이터베이스에 기 설정된 상세한 반모델과 필러 모델을 사용하여 단어별 신뢰도 스코어(척도)를 계산하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제15항에 있어서,
상기 문장 단위 또는 발화 단위로 신뢰도 스코어를 계산하는 단계는,
해당 문장에 대해 자연어의 특성을 반영하고 있는 훈련 데이터를 사용하여 SVM으로 훈련된 데이터베이스에 기 설정된 SVM 모델을 이용하여 신뢰도 스코어를 계산하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제15항에 있어서,
상기 특징 파라미터는, 잡음 추정구간 및 추정값, 숨소리 구간 및 추정값, 간투사 구간 및 추정값, 어구반복 구간 및 추정값, 머뭇거림 구간 및 추정값, 감탄사 구간 및 추정값, 장음화 구간 및 추정값, 웃음 구간 및 추정값, 발화속도 구간 및 추정값, 말뭉개짐 구간 및 추정값, 이벤트가 검출되지 않은 프레임수 및 로그비 우도값 중 적어도 하나 이상의 파라미터를 포함하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제15항에 있어서,
상기 문장 구조 및 의미를 분석하여 문장에 대한 신뢰도 스코어를 계산하는 단계에서, 음성인식 결과 문장에 대한 문장 구조 및 의미 분석은 형태소 분석기를 이용하는 것인 음성 인식 시스템의 발화 검증 방법.
- 제15항에 있어서,
상기 문장 인식의 수락 여부를 결정하는 단계,
상기 계산된 각 스코어 중 2개 이상의 스코어가 기 설정된 임계값 보다 크면 문장 인식을 수락하고, 3개의 스코어 모두가 기 설정된 임계값보다 작으면 인식 문장을 거절하고, 상기 3개의 스코어중 1개의 스코어가 기 설정된 임계값보다 크고, 2개의 스코어가 기 설정된 임계값보다 작으면 인식 문장의 판단불가로 판단하는 것인 음성 인식 시스템의 발화 검증 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160002792A KR102018331B1 (ko) | 2016-01-08 | 2016-01-08 | 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 |
US15/186,286 US9799350B2 (en) | 2016-01-08 | 2016-06-17 | Apparatus and method for verifying utterance in speech recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160002792A KR102018331B1 (ko) | 2016-01-08 | 2016-01-08 | 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170083391A true KR20170083391A (ko) | 2017-07-18 |
KR102018331B1 KR102018331B1 (ko) | 2019-09-04 |
Family
ID=59275883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160002792A Active KR102018331B1 (ko) | 2016-01-08 | 2016-01-08 | 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9799350B2 (ko) |
KR (1) | KR102018331B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190057792A (ko) * | 2017-11-20 | 2019-05-29 | 주식회사 마인즈랩 | 학습 문장 생성 시스템 및 이를 이용한 유사 문장 생성 방법 |
KR20190069992A (ko) * | 2017-12-12 | 2019-06-20 | 세종대학교산학협력단 | 음성 발화 양식을 이용한 발화자 감정인식 방법 및 시스템 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11217266B2 (en) * | 2016-06-21 | 2022-01-04 | Sony Corporation | Information processing device and information processing method |
CN108198548B (zh) * | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其系统 |
CN108509416B (zh) * | 2018-03-20 | 2022-10-11 | 京东方科技集团股份有限公司 | 句意识别方法及装置、设备和存储介质 |
WO2020213996A1 (en) * | 2019-04-17 | 2020-10-22 | Samsung Electronics Co., Ltd. | Method and apparatus for interrupt detection |
KR20210044985A (ko) * | 2019-10-16 | 2021-04-26 | 엘지전자 주식회사 | 음성 처리 방법 및 음성 처리 장치 |
US12223948B2 (en) * | 2022-02-03 | 2025-02-11 | Soundhound, Inc. | Token confidence scores for automatic speech recognition |
KR20250096753A (ko) * | 2022-10-21 | 2025-06-27 | 엘지전자 주식회사 | 인공지능 기기 및 그 동작 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090068856A (ko) * | 2007-12-24 | 2009-06-29 | 한국정보통신대학교 산학협력단 | 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법 |
KR20100073161A (ko) * | 2008-12-22 | 2010-07-01 | 한국전자통신연구원 | 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 |
KR20130068621A (ko) * | 2011-12-15 | 2013-06-26 | 한국전자통신연구원 | 발화검증 기반 대용량 음성 데이터 자동 처리 장치 및 방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030023437A1 (en) * | 2001-01-27 | 2003-01-30 | Pascale Fung | System and method for context-based spontaneous speech recognition |
US7475015B2 (en) * | 2003-09-05 | 2009-01-06 | International Business Machines Corporation | Semantic language modeling and confidence measurement |
US7533019B1 (en) * | 2003-12-23 | 2009-05-12 | At&T Intellectual Property Ii, L.P. | System and method for unsupervised and active learning for automatic speech recognition |
KR100655491B1 (ko) | 2004-12-21 | 2006-12-11 | 한국전자통신연구원 | 음성인식 시스템에서의 2단계 발화 검증 방법 및 장치 |
KR20110070057A (ko) | 2009-12-18 | 2011-06-24 | 한국전자통신연구원 | 자연어 기반 여행 추천 장치 및 방법 |
KR101317339B1 (ko) | 2009-12-18 | 2013-10-11 | 한국전자통신연구원 | 엔베스트 인식 단어 계산량 감소를 위한 2단계 발화검증 구조를 갖는 음성인식 장치 및 방법 |
KR20150129134A (ko) | 2014-05-08 | 2015-11-19 | 한국전자통신연구원 | 질의 응답 시스템 및 그 방법 |
-
2016
- 2016-01-08 KR KR1020160002792A patent/KR102018331B1/ko active Active
- 2016-06-17 US US15/186,286 patent/US9799350B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090068856A (ko) * | 2007-12-24 | 2009-06-29 | 한국정보통신대학교 산학협력단 | 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법 |
KR20100073161A (ko) * | 2008-12-22 | 2010-07-01 | 한국전자통신연구원 | 고립어 엔베스트 인식결과를 위한 발화검증 방법 및 장치 |
KR20130068621A (ko) * | 2011-12-15 | 2013-06-26 | 한국전자통신연구원 | 발화검증 기반 대용량 음성 데이터 자동 처리 장치 및 방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190057792A (ko) * | 2017-11-20 | 2019-05-29 | 주식회사 마인즈랩 | 학습 문장 생성 시스템 및 이를 이용한 유사 문장 생성 방법 |
KR20190069992A (ko) * | 2017-12-12 | 2019-06-20 | 세종대학교산학협력단 | 음성 발화 양식을 이용한 발화자 감정인식 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR102018331B1 (ko) | 2019-09-04 |
US9799350B2 (en) | 2017-10-24 |
US20170200458A1 (en) | 2017-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20170083391A (ko) | 음성 인식 시스템에서의 발화 검증 장치 및 그 방법 | |
KR100834679B1 (ko) | 음성 인식 오류 통보 장치 및 방법 | |
EP2301013B1 (en) | Systems and methods of improving automated speech recognition accuracy using statistical analysis of search terms | |
US20140156276A1 (en) | Conversation system and a method for recognizing speech | |
Prabhavalkar et al. | Automatic gain control and multi-style training for robust small-footprint keyword spotting with deep neural networks | |
CN105632501B (zh) | 一种基于深度学习技术的自动口音分类方法及装置 | |
US8775191B1 (en) | Efficient utterance-specific endpointer triggering for always-on hotwording | |
US8532991B2 (en) | Speech models generated using competitive training, asymmetric training, and data boosting | |
US8751226B2 (en) | Learning a verification model for speech recognition based on extracted recognition and language feature information | |
US20130166296A1 (en) | Method and apparatus for generating speaker-specific spoken passwords | |
CN104143326A (zh) | 一种语音命令识别方法和装置 | |
US9564134B2 (en) | Method and apparatus for speaker-calibrated speaker detection | |
CN103426428A (zh) | 语音识别方法及系统 | |
WO2011135001A1 (en) | Assessing speech prosody | |
CN101452701A (zh) | 基于反模型的置信度估计方法及装置 | |
KR101672484B1 (ko) | 발음 오류 검출 장치 및 이를 이용한 발음 오류 검출 방법 | |
Guo et al. | A comparative study on various confidence measures in large vocabulary speech recognition | |
KR101122591B1 (ko) | 핵심어 인식에 의한 음성 인식 장치 및 방법 | |
KR20130068621A (ko) | 발화검증 기반 대용량 음성 데이터 자동 처리 장치 및 방법 | |
KR101864824B1 (ko) | 발화자에 대한 신뢰도 측정 장치 및 방법 | |
KR101529918B1 (ko) | 다중 스레드를 이용한 음성 인식 장치 및 그 방법 | |
KR101892736B1 (ko) | 실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법 | |
KR20100073160A (ko) | 음성인식 시스템의 발화검증 방법 및 장치 | |
KR100449912B1 (ko) | 음성인식시스템의 핵심어 검출을 위한 후처리방법 | |
JP6675683B2 (ja) | 言語判断装置、音声認識装置、言語判断方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20160108 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20171212 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20160108 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190320 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190528 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190829 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190830 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220720 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230801 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20240724 Start annual number: 6 End annual number: 6 |