KR100434538B1 - 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 - Google Patents
음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 Download PDFInfo
- Publication number
- KR100434538B1 KR100434538B1 KR10-1999-0051065A KR19990051065A KR100434538B1 KR 100434538 B1 KR100434538 B1 KR 100434538B1 KR 19990051065 A KR19990051065 A KR 19990051065A KR 100434538 B1 KR100434538 B1 KR 100434538B1
- Authority
- KR
- South Korea
- Prior art keywords
- peak value
- excitation signal
- speech
- value
- transition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
성능 평가 | 방법 | 클린 환경 | 바블 노이즈 환경 | 차량 노이즈 환경 |
검출율(%) | 종래 | 64.67 | 34.80 | 0.71 |
본 발명 | 92.94 | 85.78 | 71.43 | |
오검출율(%) | 종래 | 1.14 | 0.52 | 0.19 |
본 발명 | 0.11 | 0.14 | 0.00 |
테스트 조건 | 종래(%) | 본 발명(%) |
클린 환경에서의 음성 | 25.52 | 31.25 |
부호화기 두번 통과 | 26.04 | 39.06 |
바블 노이즈 환경에서의 음성 | 18.75 | 25.00 |
Claims (11)
- 음성의 천이 구간 검출 장치에 있어서,음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하는 여기신호 전처리부;전처리된 여기신호의 피크치를 구하고, 소정의 기준 피크치를 이용하여 상대적 피크치를 구하는 상대적 피크치 계산부; 및상기 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 천이 구간 검출부를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
- 제1항에 있어서, 상기 여기신호 전처리부는,상기 여기신호를 정형화하고, 직류 성분을 제거하고, 센터 클리핑을 취함으로써 피크치가 포함된 구간을 강조하는 것을 특징으로 하는 음성의 천이 구간 검출장치.
- 제2항에 있어서, 상기 피크 강조된 여기신호()는 다음 수학식을 이용하여 계산되며,[수학식]여기서,는 여기신호의 평균치를, r'(n)는 여기신호의 절대치와 여기신호의 평균치와의 차를, N은 서브프레임 크기를 각각 나타내는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
- 제1항에 있어서, 상기 상대적 피크치 계산부는,전처리된 여기신호의 피크치를 구하는 제1 피크치 계산기;전처리된 여기신호의 피크치에 대해 일정 신호구간내에 포함된 그 이전 피크치들과의 차를 순차적으로 비교하는 비교기;비교된 결과, 차가 소정의 기준 피크치보다 큰가를 판단하고, 클때마다 1씩 카운팅하는 카운터; 및카운팅된 계수가 소정의 기준 계수보다 크면 제1 값을 설정하고, 그렇지 않으면 제2 값을 설정하여 제1 및 제2 값으로 표현되는 상대적 피크치를 구하는 제2 피크치 계산기를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
- 제4항에 있어서, 상기 전처리된 여기신호의 피크치는 다음 수학식을 이용하여 계산되며,[수학식]여기서,는 i번째 샘플에서의 피크치를,은 피크 강조된 여기신호를, N은 서브프레임 크기를 각각 나타내는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
- 제4항에 있어서, 상기 상대적 피크치는 다음 수학식을 이용하여 계산되며,[수학식]여기서,는 기준 피크치를,는 기준 계수 및 J는 일정 신호구간 크기를 각각 나타내며, i는 해당 서브프레임의 천이 구간 개시점이 되는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
- 음성의 천이 구간 검출 방법에 있어서,(a) 음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하여 여기신호를 전처리하는 단계;(b) 전처리된 여기신호의 피크치를 구하는 단계;(c) 소정의 기준 피크치를 이용하여 전처리된 여기신호의 피크치에 대한 상대적 피크치를 구하는 단계; 및(d) 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 방법.
- 제7항에 있어서, 상기 (a) 단계는,(a1) 여기신호의 절대치와 여기신호의 평균치와의 차를 구하는 단계; 및(a2) 상기 차가 소정의 기준치보다 크면 그대로 차를 이용하고, 그렇지 않으면 0의 값을 설정함으로써 피크 강조된 여기신호를 구하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 방법.
- 제7항에 있어서, 상기 (c) 단계는,(c1) 전처리된 여기신호의 피크치에 대해 일정 신호구간내에 포함된 그 이전 피크치들과의 차를 순차적으로 비교하는 단계;(c2) 비교된 결과, 차가 소정의 기준 피크치보다 큰가를 판단하고, 클때마다 1씩 카운팅하는 단계; 및(c3) 카운팅된 계수가 소정의 기준 계수보다 크면 제1 값을 설정하고, 그렇지 않으면 제2 값을 설정하여 제1 및 제2 값으로 표현되는 상대적 피크치를 구하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출방법.
- 음성의 천이 구간에 대한 음성 합성 방법에 있어서,(a) 음성을 주파수 영역으로 나타낼 때 피치의 하모닉 성분중에서 어느 하모닉에 위상 정보를 할당할 것인가를 판단하는 단계;(b) 판단 결과, 위상 정보가 중요한 하모닉에 대해서는 천이 구간의 개시점과 그때의 위상으로 부터 얻은 위상 정보를 할당하는 단계; 및(c) 할당된 위상 정보를 이용하여 해당 천이 구간을 합성하는 단계를 포함하는 것을 특징으로 하는 천이 구간에 대한 음성 합성 방법.
- 제10항에 있어서, 상기 위상 정보가 중요한 하모닉은 다음 수학식에서의 두개의 식중에서 밑 식으로 나타낸 위상을 할당하고, 위상 정보가 덜 중요한 하모닉은 위 식으로 나타낸 위상을 할당하며,[수학식]여기서,는 각각 이전 및 현재 프레임에서의 기본 주파수를 나타내며, h=1,2,...,H(N)이며, H(N)은 현재 프레임에서의 전체 하모닉의 수를 나타내며,,는 각각 천이 구간의 개시점 및 보정된 위상 정보를 각각 나타내는 것을 특징으로 하는 천이 구간에 대한 음성 합성 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-1999-0051065A KR100434538B1 (ko) | 1999-11-17 | 1999-11-17 | 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 |
US09/562,887 US6385570B1 (en) | 1999-11-17 | 2000-05-01 | Apparatus and method for detecting transitional part of speech and method of synthesizing transitional parts of speech |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-1999-0051065A KR100434538B1 (ko) | 1999-11-17 | 1999-11-17 | 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010047038A KR20010047038A (ko) | 2001-06-15 |
KR100434538B1 true KR100434538B1 (ko) | 2004-06-05 |
Family
ID=19620485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-1999-0051065A Expired - Fee Related KR100434538B1 (ko) | 1999-11-17 | 1999-11-17 | 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6385570B1 (ko) |
KR (1) | KR100434538B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210100823A (ko) | 2020-02-07 | 2021-08-18 | 김민서 | 디지털 음성 마크 생성 장치 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100383668B1 (ko) * | 2000-09-19 | 2003-05-14 | 한국전자통신연구원 | 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법 |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
WO2008002098A1 (en) * | 2006-06-29 | 2008-01-03 | Lg Electronics, Inc. | Method and apparatus for an audio signal processing |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR930014263A (ko) * | 1991-12-23 | 1993-07-22 | 이헌조 | 음성전이구간 검출기 |
JPH05265488A (ja) * | 1992-03-18 | 1993-10-15 | Sony Corp | ピッチ抽出方法 |
JPH096386A (ja) * | 1995-06-19 | 1997-01-10 | Canon Inc | 状態遷移モデルの設計方法及び該状態遷移モデルを用いた音声認識装置 |
US5687288A (en) * | 1994-09-20 | 1997-11-11 | U.S. Philips Corporation | System with speaking-rate-adaptive transition values for determining words from a speech signal |
JPH113095A (ja) * | 1997-06-13 | 1999-01-06 | Sharp Corp | 音声合成装置 |
KR19990066557A (ko) * | 1998-01-30 | 1999-08-16 | 전주범 | 음성 인식시 천이 구간의 음성 식별 방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5241649A (en) * | 1985-02-18 | 1993-08-31 | Matsushita Electric Industrial Co., Ltd. | Voice recognition method |
US5408581A (en) * | 1991-03-14 | 1995-04-18 | Technology Research Association Of Medical And Welfare Apparatus | Apparatus and method for speech signal processing |
US5390278A (en) * | 1991-10-08 | 1995-02-14 | Bell Canada | Phoneme based speech recognition |
US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
WO1997027578A1 (en) * | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US6188979B1 (en) * | 1998-05-28 | 2001-02-13 | Motorola, Inc. | Method and apparatus for estimating the fundamental frequency of a signal |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
-
1999
- 1999-11-17 KR KR10-1999-0051065A patent/KR100434538B1/ko not_active Expired - Fee Related
-
2000
- 2000-05-01 US US09/562,887 patent/US6385570B1/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR930014263A (ko) * | 1991-12-23 | 1993-07-22 | 이헌조 | 음성전이구간 검출기 |
JPH05265488A (ja) * | 1992-03-18 | 1993-10-15 | Sony Corp | ピッチ抽出方法 |
US5687288A (en) * | 1994-09-20 | 1997-11-11 | U.S. Philips Corporation | System with speaking-rate-adaptive transition values for determining words from a speech signal |
JPH096386A (ja) * | 1995-06-19 | 1997-01-10 | Canon Inc | 状態遷移モデルの設計方法及び該状態遷移モデルを用いた音声認識装置 |
JPH113095A (ja) * | 1997-06-13 | 1999-01-06 | Sharp Corp | 音声合成装置 |
KR19990066557A (ko) * | 1998-01-30 | 1999-08-16 | 전주범 | 음성 인식시 천이 구간의 음성 식별 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210100823A (ko) | 2020-02-07 | 2021-08-18 | 김민서 | 디지털 음성 마크 생성 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20010047038A (ko) | 2001-06-15 |
US6385570B1 (en) | 2002-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6138093A (en) | High resolution post processing method for a speech decoder | |
JP4440937B2 (ja) | 暗騒音存在時の音声を改善するための方法および装置 | |
US7124078B2 (en) | System and method of coding sound signals using sound enhancement | |
EP1973104A2 (en) | Method and apparatus for estimating noise by using harmonics of a voice signal | |
JP2002516420A (ja) | 音声コーダ | |
EP1116224A1 (en) | Noise suppression for low bitrate speech coder | |
KR20060007363A (ko) | 백엔드 음성 활동 검출 장치 및 방법을 이용한 분산스피치 인식 | |
EP1386313B1 (en) | Speech enhancement device | |
US5732388A (en) | Feature extraction method for a speech signal | |
EP0882287B1 (en) | System and method for error correction in a correlation-based pitch estimator | |
US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
KR100434538B1 (ko) | 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 | |
Ishizuka et al. | Study of noise robust voice activity detection based on periodic component to aperiodic component ratio. | |
JP3815323B2 (ja) | 周波数変換ブロック長適応変換装置及びプログラム | |
CN106716529A (zh) | 对数字音频信号中的前回声进行辨别和衰减 | |
Vahatalo et al. | Voice activity detection for GSM adaptive multi-rate codec | |
JP2003058186A (ja) | 雑音抑圧方法および雑音抑圧装置 | |
KR100291584B1 (ko) | 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법 | |
JP2002258899A (ja) | 雑音抑圧方法および雑音抑圧装置 | |
JPH0449952B2 (ko) | ||
KR100194953B1 (ko) | 유성음 구간에서 프레임별 피치 검출 방법 | |
KR100399057B1 (ko) | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 | |
KR20040073145A (ko) | 음성인식기의 성능 향상 방법 | |
JPH1097288A (ja) | 背景雑音除去装置及び音声認識装置 | |
JPH0377998B2 (ko) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19991117 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20020624 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 19991117 Comment text: Patent Application |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20040429 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20040525 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20040527 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20070319 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20080312 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20080312 Start annual number: 5 End annual number: 5 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |