KR100608643B1 - 음성 합성 시스템의 억양 모델링 장치 및 방법 - Google Patents
음성 합성 시스템의 억양 모델링 장치 및 방법 Download PDFInfo
- Publication number
- KR100608643B1 KR100608643B1 KR1019990055463A KR19990055463A KR100608643B1 KR 100608643 B1 KR100608643 B1 KR 100608643B1 KR 1019990055463 A KR1019990055463 A KR 1019990055463A KR 19990055463 A KR19990055463 A KR 19990055463A KR 100608643 B1 KR100608643 B1 KR 100608643B1
- Authority
- KR
- South Korea
- Prior art keywords
- syllable
- fundamental frequency
- pattern
- sentence
- accent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 28
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Machine Translation (AREA)
Abstract
Description
상기 언어처리부에서 분석된 문장성분과 음운변동을 학습된 성조 패턴을 예측하기 위한 회귀 나무구조에 적용하여 음절별 성조패턴을 결정하고,
그 음절별 성조패턴을 기본 주파수 궤적을 예측하기 위한 회귀 나무구조에 적용하여 기본 주파수 궤적을 생성하는 억양예측부와;
상기 억양예측부에서 생성된 기본 주파수 궤적을 이용하여, 음성DB로부터 합성단위의 데이터를 오버랩 애드(Overlap Add)를 행하여 그에 따른 합성음의 파형을 생성하는 합성부를 포함하여 구성한 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명은 임의의 입력 텍스트를 한 문장씩 분리하여 한 문장 단위로 구문을 분석하는 제1 단계와;
제1 단계의 구문분석 결과를 틸트(Tilt) 모델에 적용하여 기본 주파수 형태를 계수화시켜 성조 패턴을 예측하는 제2 단계와;
상기 제2 단계의 성조 패턴을 기본 주파수 궤적을 예측하기 위한 회귀 나무구조에 적용하여 기본 주파수 궤적을 예측하는 제3 단계와;
상기 제3 단계에서 예측된 기본주파수 궤적으로 음성DB로부터 합성단위의 데이터를 읽어들여 그에 따른 합성음의 파형을 생성하는 제4 단계로 이루어진 것을 특징으로 한다.
Claims (8)
- 임의의 입력 텍스트를 한 문장씩 분리하여 그 분리된 문장 단위로 구문을 분석하고, 그 분석결과에 근거한 문장성분과 음운변동에 관한 정보를 출력하는 언어처리부와;상기 언어처리부에서 분석된 문장성분과 음운변동을 학습된 성조 패턴을 예측하기 위한 회귀 나무구조에 적용하여 음절별 성조패턴을 결정하고,그 음절별 성조패턴을 기본 주파수 궤적을 예측하기 위한 회귀 나무구조에 적용하여 기본 주파수 궤적을 생성하는 억양예측부와;상기 억양예측부에서 생성된 기본 주파수 궤적을 이용하여, 음성DB로부터 합성단위의 데이터를 오버랩 애드(Overlap Add)를 행하여 그에 따른 합성음의 파형을 생성하는 합성부를 포함하여 구성한 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 장치.
- 제1 항에 있어서, 상기 음절별 성조 패턴은운율구 경계음절과 비경계음절로 구분되는 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 장치.
- 임의의 입력 텍스트를 한 문장씩 분리하여 한 문장 단위로 구문을 분석하는 제1 단계와;제1 단계의 구문분석 결과를 틸트(Tilt) 모델에 적용하여 기본 주파수 형태를 계수화시켜 성조 패턴을 예측하는 제2 단계와;상기 제2 단계의 성조 패턴을 기본 주파수 궤적을 예측하기 위한 회귀 나무구조에 적용하여 기본 주파수 궤적을 예측하는 제3 단계와;상기 제3 단계에서 예측된 기본주파수 궤적으로 음성DB로부터 합성단위의 데이터를 읽어들여 그에 따른 합성음의 파형을 생성하는 제4 단계로 이루어진 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 방법.
- 삭제
- 제3 항에 있어서, 상기 성조패턴은상기 문장 구조 정보와 구문 분석 결과를 입력으로 하는 회귀 나무구조를 통해 학습되는 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 방법.
- 제3 항에 있어서, 상기 성조패턴은음절별 기본 주파수의 평균레벨을 이용하여 예측되는 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 방법.
- 제3 항에 있어서, 상기 성조패턴은운율구 비경계 음절인 경우에 어절에서의 상대적 레벨을 이용하여 예측되고, 운율구 경계음절인 경우에는 틸트(Tilt) 모델의 진폭변이와 틸트(Tilt) 계수를 이용하여 예측되는 것을 특징으로 하는 음성 합성 시스템의 억양 모델링 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990055463A KR100608643B1 (ko) | 1999-12-07 | 1999-12-07 | 음성 합성 시스템의 억양 모델링 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990055463A KR100608643B1 (ko) | 1999-12-07 | 1999-12-07 | 음성 합성 시스템의 억양 모델링 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010054592A KR20010054592A (ko) | 2001-07-02 |
KR100608643B1 true KR100608643B1 (ko) | 2006-08-09 |
Family
ID=19623990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990055463A Expired - Fee Related KR100608643B1 (ko) | 1999-12-07 | 1999-12-07 | 음성 합성 시스템의 억양 모델링 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100608643B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100486457B1 (ko) * | 2002-09-17 | 2005-05-03 | 주식회사 현대오토넷 | Cart를 이용한 자연어 처리 방법 |
-
1999
- 1999-12-07 KR KR1019990055463A patent/KR100608643B1/ko not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20010054592A (ko) | 2001-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Isewon et al. | Design and implementation of text to speech conversion for visually impaired people | |
JP3408477B2 (ja) | フィルタパラメータとソース領域において独立にクロスフェードを行う半音節結合型のフォルマントベースのスピーチシンセサイザ | |
US20050119890A1 (en) | Speech synthesis apparatus and speech synthesis method | |
CN111681641B (zh) | 基于短语的端对端文本到语音(tts)合成 | |
KR102168529B1 (ko) | 인공신경망을 이용한 가창음성 합성 방법 및 장치 | |
JPH10116089A (ja) | 音声合成用の基本周波数テンプレートを収容する韻律データベース | |
JP2002258885A (ja) | テキスト音声合成装置およびプログラム記録媒体 | |
Black et al. | The festival speech synthesis system, version 1.4. 2 | |
Hoffmann et al. | Analysis of verbal and nonverbal acoustic signals with the Dresden UASR system | |
KR100373329B1 (ko) | 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 | |
JP2006030609A (ja) | 音声合成データ生成装置、音声合成装置、音声合成データ生成プログラム及び音声合成プログラム | |
Gujarathi et al. | Review on unit selection-based concatenation approach in text to speech synthesis system | |
JP2021148942A (ja) | 声質変換システムおよび声質変換方法 | |
Chettri et al. | Nepali text to speech synthesis system using esnola method of concatenation | |
US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
KR100608643B1 (ko) | 음성 합성 시스템의 억양 모델링 장치 및 방법 | |
O'Shaughnessy | Design of a real-time French text-to-speech system | |
JP2001034284A (ja) | 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体 | |
Waghmare et al. | Analysis of pitch and duration in speech synthesis using PSOLA | |
Wang et al. | Improved generation of fundamental frequency in HMM-based speech synthesis using generation process model. | |
Santos et al. | Text-to-speech conversion in Spanish a complete rule-based synthesis system | |
Ng | Survey of data-driven approaches to Speech Synthesis | |
EP1589524B1 (en) | Method and device for speech synthesis | |
JP2703253B2 (ja) | 音声合成装置 | |
EP1640968A1 (en) | Method and device for speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19991207 |
|
PG1501 | Laying open of application | ||
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
Patent event date: 20020603 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20040809 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 19991207 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20051212 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20060609 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20060727 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20060728 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20100610 |