KR101422020B1 - 음성 인식 방법 및 장치 - Google Patents
음성 인식 방법 및 장치 Download PDFInfo
- Publication number
- KR101422020B1 KR101422020B1 KR1020070121422A KR20070121422A KR101422020B1 KR 101422020 B1 KR101422020 B1 KR 101422020B1 KR 1020070121422 A KR1020070121422 A KR 1020070121422A KR 20070121422 A KR20070121422 A KR 20070121422A KR 101422020 B1 KR101422020 B1 KR 101422020B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- speech
- window
- size
- interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (10)
- 음성 신호를 실시간 수신하는 단계;상기 음성 신호에 초기 음성구간 및 휴지 지점이 검출되면, 상기 초기 음성구간이 하나의 낱말로 구성되는 워드에 해당하는지 또는 둘 이상의 낱말로 구성되는 워드에 해당하는지 여부에 따라 윈도우의 크기를 결정하는 단계; 및,상기 결정된 크기의 윈도우를 이용하여 상기 휴지 지점 이후에 음성 구간이 시작되는지 여부를 판단하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
- 제 1 항에 있어서,하나의 낱말로 구성되는 워드에 해당하는 윈도우의 크기는, 둘 이상의 낱말로 구성되는 워드에 해당하는 윈도우의 크기보다 작은 것을 특징으로 하는 음성 인식 방법.
- 제 2 항에 있어서,하나의 낱말로 구성되는 워드에 해당하는 윈도우의 크기는, 둘 이상의 낱말로 구성되는 워드에 해당하는 윈도우의 크기의 50%인 것을 특징으로 하는 음성 인식 방법.
- 제 2 항에 있어서,하나의 낱말로 구성되는 워드에 해당하는 윈도우의 크기는, 100ms-200ms인 것을 특징으로 하는 음성 인식 방법.
- 제 1 항에 있어서,상기 판단의 결과에 따라, 상기 결정된 크기의 윈도우 내에서 음성구간이 시작되지 않는 경우, 음성 인식을 종료하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 방법.
- 제 1 항에 있어서,질의어 또는 안내어를 출력하는 단계를 더 포함하고,상기 음성신호가 하나의 낱말로 구성되는 워드에 해당하는지 또는 둘 이상의 낱말로 구성되는 워드에 해당하는지 여부는, 상기 질의어 또는 상기 안내어의 유형에 따라 결정되는 것을 특징으로 하는 음성 인식 방법.
- 제 1 항에 있어서,상기 판단의 결과에 따라, 상기 결정된 크기의 윈도우 내에서 음성구간이 시작되지 않는 경우, 상기 휴지 지점 이전의 음성구간에 해당하는 워드에 근거하여, 음성 인식 결과를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 방법.
- 제 7 항에 있어서,상기 음성 인식 결과는, 텍스트로 변환된 단어가 명령어인 경우, 명령에 따른 실행이고, 텍스트로 변환된 데이터가 일반 텍스트인 경우, 텍스트의 출력인 것을 특징으로 하는 음성 인식 방법.
- 음성 신호를 실시간 수신하기 위한 신호 수신부;상기 음성 신호로부터 초기 음성구간 및 휴지 지점을 검출하기 위한 휴지지점 검출부; 및,상기 음성 신호에 초기 음성구간 및 휴지 지점이 검출되면, 상기 초기 음성구간이 하나의 낱말로 구성되는 워드에 해당하는지 또는 둘 이상의 낱말로 구성되는 워드에 해당하는지 여부에 따라 윈도우의 크기를 결정하고, 상기 결정된 크기의 윈도우를 이용하여 상기 휴지 지점 이후에 음성 구간이 시작되는지 여부를 판단하는 휴지기간 판단부를 포함하는 것을 특징으로 하는 음성 인식 장치.
- 제 9 항에 있어서,질의어 또는 안내어를 출력하고, 상기 질의어 또는 상기 안내어에 대응하는 워드의 유형 정보를 상기 휴지기간 판단부에 전달하는 질의어 출력부를 더 포함하고,상기 휴지기간 판단부는, 상기 유형 정보를 근거로 하여, 상기 초기 음성구간이 하나의 낱말로 구성되는 워드에 해당하는지 또는 둘 이상의 낱말로 구성되는 워드에 해당하는지 여부를 결정하는 것을 특징으로 하는 음성 인식 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070121422A KR101422020B1 (ko) | 2007-11-27 | 2007-11-27 | 음성 인식 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070121422A KR101422020B1 (ko) | 2007-11-27 | 2007-11-27 | 음성 인식 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090054642A KR20090054642A (ko) | 2009-06-01 |
KR101422020B1 true KR101422020B1 (ko) | 2014-07-23 |
Family
ID=40986555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070121422A Expired - Fee Related KR101422020B1 (ko) | 2007-11-27 | 2007-11-27 | 음성 인식 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101422020B1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102495517B1 (ko) * | 2016-01-26 | 2023-02-03 | 삼성전자 주식회사 | 전자 장치, 전자 장치의 음성 인식 방법 |
KR20200109835A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 장치의 동작 방법을 컴퓨터에서 실행시키기 위한 프로그램 |
KR20200109837A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 장치의 동작 방법 |
KR20200109827A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 대기 시간을 감소시키는 자동 음성 인식 방법 |
KR20200109833A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 자동 음성 인식에서 대기 시간을 감소시키는 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터에서 실행시키기 위한 프로그램 |
KR20200109844A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식을 위한 컴퓨터 프로그램 |
KR20200109838A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 방법을 실행시키기 위한 컴퓨터 프로그램 |
KR102076212B1 (ko) | 2019-03-14 | 2020-02-11 | 주식회사 포지큐브 | 스피치 인식 장치의 동작 방법 |
KR20200109830A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 대기 시간을 감소시키는 자동 음성 인식 프로그램이 기록된 컴퓨터에서 읽을 수 있는 기록매체 |
KR20200109836A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 장치의 동작 프로그램이 기록된 컴퓨터가 읽을 수 있는 기록매체 |
KR20200109842A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 장치 |
KR20200109834A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 자동 음성 인식에서 대기 시간을 감소시키는 프로그램이 기록된 컴퓨터에서 읽을 수 있는 기록매체 |
KR20200109832A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 자동 음성 인식에서 대기 시간을 감소시키는 방법 |
KR20200109841A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 자동 음성 인식 장치 |
KR20200109839A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 프로그램이 기록된 컴퓨터가 읽을 수 있는 기록매체 |
KR102075399B1 (ko) | 2019-03-14 | 2020-02-10 | 주식회사 포지큐브 | 스피치 인식 장치 |
KR20200109843A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 방법 |
KR20200109826A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 스피치 인식 방법을 실행 시키기 위한 프로그램이 기록된 컴퓨터에서 읽을 수 있는 기록매체 |
KR20200109829A (ko) | 2019-03-14 | 2020-09-23 | 주식회사 포지큐브 | 대기 시간을 감소시키는 자동 음성 인식 컴퓨터 프로그램 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124693A (ja) * | 1997-06-27 | 1999-01-29 | Nec Corp | 音声認識装置 |
JP2003255972A (ja) | 2002-03-04 | 2003-09-10 | Mitsubishi Electric Corp | 音声認識装置 |
KR20040061659A (ko) * | 2002-12-31 | 2004-07-07 | 삼성전자주식회사 | 음성인식방법 및 장치 |
-
2007
- 2007-11-27 KR KR1020070121422A patent/KR101422020B1/ko not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124693A (ja) * | 1997-06-27 | 1999-01-29 | Nec Corp | 音声認識装置 |
JP2003255972A (ja) | 2002-03-04 | 2003-09-10 | Mitsubishi Electric Corp | 音声認識装置 |
KR20040061659A (ko) * | 2002-12-31 | 2004-07-07 | 삼성전자주식회사 | 음성인식방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20090054642A (ko) | 2009-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101422020B1 (ko) | 음성 인식 방법 및 장치 | |
US7941313B2 (en) | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system | |
CN113362828B (zh) | 用于识别语音的方法和装置 | |
CN113327609B (zh) | 用于语音识别的方法和装置 | |
US20160125883A1 (en) | Speech recognition client apparatus performing local speech recognition | |
US20150310863A1 (en) | Method and apparatus for speaker diarization | |
US9570076B2 (en) | Method and system for voice recognition employing multiple voice-recognition techniques | |
CN107808665B (zh) | 用于处理口头话语流的方法、系统和存储介质 | |
US8532995B2 (en) | System and method for isolating and processing common dialog cues | |
KR950015199A (ko) | 음성 인식 방법 및 장치 | |
CN103198831A (zh) | 语音操控方法与移动终端装置 | |
US9679560B2 (en) | Server-side ASR adaptation to speaker, device and noise condition via non-ASR audio transmission | |
US20160077792A1 (en) | Methods and apparatus for unsupervised wakeup | |
JP5387416B2 (ja) | 発話分割システム、発話分割方法および発話分割プログラム | |
US10229701B2 (en) | Server-side ASR adaptation to speaker, device and noise condition via non-ASR audio transmission | |
CN103871416B (zh) | 语音处理设备及语音处理方法 | |
CN103680505A (zh) | 语音识别方法及系统 | |
CN108052195A (zh) | 一种麦克风设备的控制方法及终端设备 | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
JP6549009B2 (ja) | 通信端末及び音声認識システム | |
CN108616667B (zh) | 通话的方法及装置 | |
JP2006039382A (ja) | 音声認識装置 | |
US11195545B2 (en) | Method and apparatus for detecting an end of an utterance | |
JP2001042894A5 (ko) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20071127 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20121024 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20071127 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20131122 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20140511 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20140716 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20140717 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20170614 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20170614 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180614 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20180614 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20190614 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20200612 Start annual number: 7 End annual number: 7 |
|
PC1903 | Unpaid annual fee |