KR20050049207A - 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 - Google Patents
대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 Download PDFInfo
- Publication number
- KR20050049207A KR20050049207A KR1020030083115A KR20030083115A KR20050049207A KR 20050049207 A KR20050049207 A KR 20050049207A KR 1020030083115 A KR1020030083115 A KR 1020030083115A KR 20030083115 A KR20030083115 A KR 20030083115A KR 20050049207 A KR20050049207 A KR 20050049207A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- speech recognition
- speech
- recognition system
- conversation
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (5)
- 음성입력 신호를 음성구간과 비음성 구간으로 구분하여 음성인식 시스템의 불필요한 계산량 부하를 막는 끝점 검출부;상기 음성입력 신호로부터 음성인식에 필요한 특징벡터들을 추출하는 특징벡터 추출부;상기 특징벡터 추출부에서 추출된 음성의 특징벡터를 기반으로 음성을 인식하는 음성 인식부;상기 음성 인식부의 출력정보를 기반으로 음성인식 결과를 검증하는 후처리부; 및상기 후처리부를 통하여 전달된 음성인식 결과를 기반으로 사용자의 의도를 파악하고, 다음 대화를 예측하는 대화 턴 검출부를 포함하여 구성되는 것을 특징으로 하는 대화형 연속 음성인식 시스템.
- 제 1항에 있어서, 상기 음성 인식부는발음사전, 음향모델, 탐색모듈, 언어모델로 구성되는 것을 특징으로 하는 대화형 연속 음성인식 시스템.
- (a)끝점 검출모듈 활성 플래그가 온(ON)되어 입력음성 신호를 버퍼링하고, 상기 버퍼링된 입력신호로부터 일정구간 간격으로 프레이밍 하는 단계;(b)상기 프레이밍한 입력신호로부터 음성의 시작점을 검출하는 단계;(c)상기 음성의 시작점 검출 후, 연속되는 프레임 입력신호로부터 음성의 끝점을 검출하는 단계; 및(d)상기 음성의 끝점 검출 후, 대화 턴이 검출될 때까지 상기 끝점 검출모듈을 초기화하여 상기 시작점과 끝점을 검출하는 동작을 반복적으로 수행하는 단계로 이루어지는 것을 특징으로 하는 대화형 연속 음성인식 시스템의 음성끝점 검출방법.
- 제 3항에 있어서, 상기 (c)단계는(e)상기 후처리부에서 음성인식 결과의 신뢰도가 측정 임계값 이상인가를 판단하는 단계;(f)상기 신뢰도가 측정 임계값 이상일 경우, 상기 대화 턴 검출부에서 대화 턴을 검출하는 단계;(g)상기 대화 턴이 검출되었을 경우, 음성의 끝점 검출모듈 비활성화 플레그를 끝점 검출부로 보내는 단계; 및(h)상기 신뢰도가 측정 임계값 이하인 경우, 상기 후처리부에서 끝점 검출모듈을 비활성화하여 상기 음성인식 시스템의 부하를 줄이고 사용자의 음성입력을 받아들이기 위한 끝점 검출부가 다시 활성화되는 단계로 이루어지는 것을 특징으로 하는 대화형 연속 음성인식 시스템을 이용한 음성끝점 검출방법.
- 제 4항에 있어서, 상기 (f)단계는형태소 분석, 구문 분석, 대화 분석 등의 대화 지식을 통하여 대화 턴을 검출하는 지식기반 방법과, 서비스 시나리오를 기반으로 구축된 대화 코퍼스의 통계적 처리를 통해 대화 턴을 검출하는 통계기반 방법 및 상기 지식기반 방법과 통계기반 방법의 대화 턴 검출 방법을 혼용한 하이브리드 방법에 의해 검출되는 것을 특징으로 하는 대화형 연속 음성인식 시스템을 이용한 음성끝점 검출방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030083115A KR20050049207A (ko) | 2003-11-21 | 2003-11-21 | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030083115A KR20050049207A (ko) | 2003-11-21 | 2003-11-21 | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050049207A true KR20050049207A (ko) | 2005-05-25 |
Family
ID=37247766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030083115A KR20050049207A (ko) | 2003-11-21 | 2003-11-21 | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20050049207A (ko) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100718147B1 (ko) * | 2005-02-01 | 2007-05-14 | 삼성전자주식회사 | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 |
KR20080061901A (ko) * | 2006-12-28 | 2008-07-03 | 주식회사 유진로봇 | 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템 |
KR100899660B1 (ko) * | 2007-11-26 | 2009-05-27 | 한국전자통신연구원 | 운전 집중도 알림 장치 및 방법 |
CN103187051A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载互动装置 |
KR20160013592A (ko) * | 2014-07-28 | 2016-02-05 | (주)복스유니버스 | 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법 |
EP2342884B1 (en) | 2008-09-18 | 2018-12-05 | Koninklijke Philips N.V. | Method of controlling a system and signal processing system |
CN109725869A (zh) * | 2019-01-02 | 2019-05-07 | 百度在线网络技术(北京)有限公司 | 连续交互控制方法和装置 |
CN110428854A (zh) * | 2019-08-12 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 车载端的语音端点检测方法、装置和计算机设备 |
WO2021103775A1 (zh) * | 2019-11-27 | 2021-06-03 | 深圳追一科技有限公司 | 语音意图识别方法、装置、计算机设备和存储介质 |
CN113380275A (zh) * | 2021-06-18 | 2021-09-10 | 北京声智科技有限公司 | 语音处理方法、装置、智能设备及存储介质 |
KR20240032596A (ko) | 2022-09-02 | 2024-03-12 | 숭실대학교산학협력단 | 생물학적 소리에 기반한 합성 음성 탐지 방법, 이를 수행하기 위한 기록 매체 및 장치 |
-
2003
- 2003-11-21 KR KR1020030083115A patent/KR20050049207A/ko not_active Application Discontinuation
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100718147B1 (ko) * | 2005-02-01 | 2007-05-14 | 삼성전자주식회사 | 음성인식용 문법망 생성장치 및 방법과 이를 이용한 대화체음성인식장치 및 방법 |
KR20080061901A (ko) * | 2006-12-28 | 2008-07-03 | 주식회사 유진로봇 | 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템 |
KR100899660B1 (ko) * | 2007-11-26 | 2009-05-27 | 한국전자통신연구원 | 운전 집중도 알림 장치 및 방법 |
EP2342884B1 (en) | 2008-09-18 | 2018-12-05 | Koninklijke Philips N.V. | Method of controlling a system and signal processing system |
CN103187051A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载互动装置 |
KR20160013592A (ko) * | 2014-07-28 | 2016-02-05 | (주)복스유니버스 | 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법 |
CN109725869A (zh) * | 2019-01-02 | 2019-05-07 | 百度在线网络技术(北京)有限公司 | 连续交互控制方法和装置 |
CN109725869B (zh) * | 2019-01-02 | 2022-10-21 | 百度在线网络技术(北京)有限公司 | 连续交互控制方法和装置 |
CN110428854A (zh) * | 2019-08-12 | 2019-11-08 | 腾讯科技(深圳)有限公司 | 车载端的语音端点检测方法、装置和计算机设备 |
CN110428854B (zh) * | 2019-08-12 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 车载端的语音端点检测方法、装置和计算机设备 |
WO2021103775A1 (zh) * | 2019-11-27 | 2021-06-03 | 深圳追一科技有限公司 | 语音意图识别方法、装置、计算机设备和存储介质 |
CN113380275A (zh) * | 2021-06-18 | 2021-09-10 | 北京声智科技有限公司 | 语音处理方法、装置、智能设备及存储介质 |
KR20240032596A (ko) | 2022-09-02 | 2024-03-12 | 숭실대학교산학협력단 | 생물학적 소리에 기반한 합성 음성 탐지 방법, 이를 수행하기 위한 기록 매체 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3004883B2 (ja) | 終話検出方法及び装置並びに連続音声認識方法及び装置 | |
JP6772198B2 (ja) | 言語モデルスピーチエンドポインティング | |
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
US7801726B2 (en) | Apparatus, method and computer program product for speech processing | |
US7069221B2 (en) | Non-target barge-in detection | |
US9437186B1 (en) | Enhanced endpoint detection for speech recognition | |
JP5381988B2 (ja) | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム | |
US9818407B1 (en) | Distributed endpointing for speech recognition | |
CN100578612C (zh) | 语音处理装置 | |
JP3886024B2 (ja) | 音声認識装置及びそれを用いた情報処理装置 | |
CN110827795A (zh) | 语音输入结束判断方法、装置、设备、系统以及存储介质 | |
JPH10501078A (ja) | 音声認識システムの言語モデルのサイズを適応させるための方法および装置 | |
EP3739583B1 (en) | Dialog device, dialog method, and dialog computer program | |
Selfridge et al. | Continuously predicting and processing barge-in during a live spoken dialogue task | |
KR20050049207A (ko) | 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법 | |
KR20210081166A (ko) | 다국어 음성 환경에서의 언어 식별 장치 및 방법 | |
Rose et al. | Integration of utterance verification with statistical language modeling and spoken language understanding | |
JP3721948B2 (ja) | 音声始端検出方法、音声認識装置における音声区間検出方法および音声認識装置 | |
JP2009025579A (ja) | 音声認識装置および音声認識方法 | |
JP5427140B2 (ja) | 音声認識方法、音声認識装置及び音声認識プログラム | |
JP2006039382A (ja) | 音声認識装置 | |
JP2006172110A (ja) | 応答データ出力装置、応答データ出力方法およびプログラム | |
JP2007072331A (ja) | 音声対話方法および音声対話システム | |
CN114299962A (zh) | 基于音频流的对话角色分离方法、系统、设备及存储介质 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20031121 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050829 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20060201 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20050829 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |