KR100278640B1 - 이동 전화기를 위한 음성 다이얼링 장치 및방법 - Google Patents
이동 전화기를 위한 음성 다이얼링 장치 및방법 Download PDFInfo
- Publication number
- KR100278640B1 KR100278640B1 KR1019980038692A KR19980038692A KR100278640B1 KR 100278640 B1 KR100278640 B1 KR 100278640B1 KR 1019980038692 A KR1019980038692 A KR 1019980038692A KR 19980038692 A KR19980038692 A KR 19980038692A KR 100278640 B1 KR100278640 B1 KR 100278640B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- signal
- speech
- feature
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (15)
- 이동통신 단말기의 다이얼링시 버튼을 누르지 않고, 음성으로 다이얼링하는 장치에 있어서,보코더에서 츨력된 프레임별 패킷 데이터로부터 음성특징 파라미터를 추출하는 입력 인터페이스;상기 입력 인터페이스부로부터 출력된 상기 음성특징 파라미터를 이용하여 음성 구간을 검출하는 음성 구간 검출부;상기 검출돤 음성구간에서 음성 인식용 음성신호의 특징을 추출하는 특징 추출부;상기 특징추출부로부터 추출된 상기 음성 인식용 음성신호의 특징을 각 전화번호에 해당하도록 데이터베이스에 등록시키는 음성 등록부;상기 특징추출부로부터 추출된 상기 음성 인식용 음성신호의 특징을 이용하여 상기 데이터베이스에 등록된 음성신호와 음성 다이얼링을 위해 발성된 음성을 비교하여 가장 가까운 음성 신호를 골라내는 음성 인식부; 및상기 음성인식결과에 해당되는 음성 신호와 전화 번호를 출력하는 결과 출력부을 포함함을 특징으로 하는 음성 다이얼링 장치.
- 제1항에 있어서, 상기 음성구간검출부는상기 음성특징 파라미터를 이용하여 유사신호를 생성하는 유사신호 생성부;상기 유사신호의 절대값을 합해 얻어진 프레임별 유사신호의 게인을 생성하는 유사신호 게인 생성부;상기 유사신호 게인의 중첩평균(moving average)을 시간에 따라 구하는 게인 평균부;상기 게인 평균부의 결과와 이전 프레임들의 결과를 이용한 현재 프레임의 상태를 판정하는 프레임 상태 판정부; 및상기 프레임 상태 판정부의 결과를 보정하는 후처리부을 포함함을 특징으로 하는 음성 다이얼링 장치.
- 제1항에 있어서, 상기 음성등록부는입력발성음과 데이터베이스에 등록된 음성의 유사성을 비교하는 데이터베이스 비교부;상기 발성음이 상기 데이터베이스에 등록된 음성과 유사하지 않으면, 상기 발성음과 재발성된 발성음의 발성특징을 비교하는 발성비교부; 및상기 발성비교부에서 비교된 발성특징이 같으면 상기 발성음의 발성특징을 저장하는 데이터베이스저장부를 포함함을 특징으로 하는 음성 다이얼링 장치.
- 제3항에 있어서, 상기 음성등록부는보코더의 패킷을 해석한 결과를 이용해서 음성특징을 추출함을 특징으로 하는 음성 다이얼링 장치.
- 제3항에 있어서, 상기 발성비교부는상기 발성음과 재발성된 발성음의 발성특징이 다르면 입력음성을 추가하여 발성특징을 재비교하는 추가발성비교부를 더 구비함을 특징으로 하는 음성 다이얼링 장치.
- 제1항에 있어서, 상기 음성인식부는입력발성음과 데이터베이스에 등록된 음성의 유사성을 비교하는 데이터베이스 비교부; 및상기 데이터베이스 비교부에서 결정한 인식후보를 가지고 전화를 걸어줄지 결정하는 인식확인부를 포함함을 특징으로 하는 음성 다이얼링 장치.
- 제6항에 있어서, 상기 음성인식부는보코더의 패킷을 해석한 결과를 이용해서 음성특징을 추출함을 특징으로 하는 음성 다이얼링 장치.
- 제6항에 있어서, 상기 데이터베이스 비교부는입력발성음이 데이터베이스에 등록된 음성과 유사하지 않으면 입력발성음을 추가하여 데이터베이스에 등록된 음성과 재비교하는 추가발성 데이터베이스 비교부를 더 구비함을 특징으로 하는 음성 다이얼링 장치.
- 이동통신 단말기의 다이얼링시 음성으로 다이얼링하는 방법에 있어서,(a)보코더로부터 출력된 패킷 스트림신호를 언패킹 파라미터 스트림신호로 변환하는 단계;(b)상기 언패킹 파라미터 스트림신호의 구간을 검출하는 단계;(c)상기 검출된 신호에서 음성신호의 특징을 검출하는 단계;(d)상기 음성신호의 특징을 각 전화번호에 해당하도록 메모리에 저장시키는 음성 등록 단계;(e)상기 등록된 음성 신호에서 발성된 음성과 가장 가까운 음성 신호를 골라내는 음성 인식 단계; 및(f)상기 음성인식결과에 해당되는 음성 신호와 전화 번호를 출력하는 단계를 포함함을 특징으로 하는 음성 다이얼링 방법.
- 제9항에 있어서, 상기 (b)단계는(b1)상기 보코더에서 상기 음성특징 파라미터를 추출하는 단계;(b2)상기 음성특징 파라미터를 이용하여 유사신호를 생성하는 단계;(b3)상기 유사신호의 절대값을 합해 얻어진 프레임별 유사신호의 게인을 생성하는 단계;(b4)상기 유사신호 게인의 중첩평균을 시간에 따라 구하는 단계;(b5)상기 유사신호 게인의 중첩평균결과와 이전 프레임들의 결과를 이용한 현재 프레임의 음성구간을 결정하는 단계; 및(b6)상기 음성구간의 시작위치와 끝위치를 후처리 보정하는 단계를 포함함을 특징으로 하는 음성 다이얼링 방법.
- 제10항에 있어서, 상기 (h)단계에서 유사신호 x(i)는x(i) = w(i) * G + x(i-L) * B(여기서, i는 샘플 수에 해당하는 시간 변수이고, G값은 프레임별 게인 값, L은 프레임별 피치, B는 프레임별 피치 게인, x(i)는 유사 신호, w(i)는 백색 신호이다. )에 의해 생성됨을 특징으로 하는 음성 다이얼링 방법.
- 제11항에 있어서, 상기 (i)단계에서 유사신호 게인 s(j)는s(j) = abs_sum(x(j*I) ~ x(j*(I+1) - 1))(여기서, j는 프레임 수로서 j = i / I 에 해당한다. I는 프레임의 크기이다. abs_sum(x(k) ~ x(m))는 k번째 유사신호부터 m번째 유사신호까지의 절대값 합을 의미한다.)에 의해 생성됨을 특징으로 하는 음성 다이얼링 방법.
- 제12항에 있어서, 상기 (j)단계에서 유사신호 게인의 중첩평균 nG(j)는nG(j) = (s(j-3) + s(j-2) + s(j-1) + s(j)) / 4에 의해 계산됨을 특징으로 하는 음성 다이얼링 방법.
- 제9항에 있어서, 상기 (d)단계는입력발성음과 데이터베이스에 등록된 음성의 유사성을 비교하는 단계;상기 발성음이 상기 데이터베이스에 등록된 음성과 유사하지 않으면, 상기 발성음과 재발성된 발성음의 발성특징을 비교하는 단계; 및상기 발성음과 재발성된 발성음의 발성특징이 같으면 상기 발성음의 발성특징을 저장하는 단계를 포함함을 특징으로 하는 음성 다이얼링 방법.
- 제9항에 있어서, 상기 (e)단계는입력발성음과 데이터베이스에 등록된 음성과의 유사성을 비교하는 단계;상기 입력발성음과 상기 데이터베이스에 등록된 음성과의 유사성 있는 인식후보를 결정하는 단계; 및상기 인식후보들의 인식 결과값 차이를 이용하여 전화를 걸어줄지 결정하는 단계를 포함함을 특징으로 하는 음성 다이얼링 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980038692A KR100278640B1 (ko) | 1998-09-18 | 1998-09-18 | 이동 전화기를 위한 음성 다이얼링 장치 및방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980038692A KR100278640B1 (ko) | 1998-09-18 | 1998-09-18 | 이동 전화기를 위한 음성 다이얼링 장치 및방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000020201A KR20000020201A (ko) | 2000-04-15 |
KR100278640B1 true KR100278640B1 (ko) | 2001-12-12 |
Family
ID=19551101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980038692A Expired - Fee Related KR100278640B1 (ko) | 1998-09-18 | 1998-09-18 | 이동 전화기를 위한 음성 다이얼링 장치 및방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100278640B1 (ko) |
-
1998
- 1998-09-18 KR KR1019980038692A patent/KR100278640B1/ko not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20000020201A (ko) | 2000-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100719650B1 (ko) | 잡음 신호에서 음성의 엔드포인팅 방법 | |
US6671669B1 (en) | combined engine system and method for voice recognition | |
US6411926B1 (en) | Distributed voice recognition system | |
CA2366892C (en) | Method and apparatus for speaker recognition using a speaker dependent transform | |
EP0950239B1 (en) | Method and recognizer for recognizing a sampled sound signal in noise | |
US7941313B2 (en) | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system | |
EP1220197A2 (en) | Speech recognition method and system | |
JP2004504641A (ja) | 話者独立音声認識システムのための音声テンプレートを構成するための方法及び装置 | |
US5806022A (en) | Method and system for performing speech recognition | |
JP2004523788A (ja) | 音声認識モデルの効率的な記憶のためのシステムおよび方法 | |
GB2347775A (en) | Method of extracting features in a voice recognition system | |
EP0685835B1 (en) | Speech recognition based on HMMs | |
EP0634041B1 (en) | Method and apparatus for encoding/decoding of background sounds | |
Li et al. | A high-performance auditory feature for robust speech recognition. | |
US20080228477A1 (en) | Method and Device For Processing a Voice Signal For Robust Speech Recognition | |
KR100278640B1 (ko) | 이동 전화기를 위한 음성 다이얼링 장치 및방법 | |
KR100647291B1 (ko) | 음성의 특징을 이용한 음성 다이얼링 장치 및 방법 | |
KR100294920B1 (ko) | 심한 잡음 환경에서 이동 전화기의 음성인식을 위한 음성검출방법 및 장치 | |
KR20000019198A (ko) | 이동 전화기의 음성인식을 위한 음성 검출 방법 및 장치 | |
JPH0477795A (ja) | 音声認識装置 | |
HK1015183B (en) | Method and apparatus for encoding/decoding of background sounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19980918 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19980918 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20000929 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20001021 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20001023 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |