KR100574031B1 - 음성합성방법및장치그리고음성대역확장방법및장치 - Google Patents
음성합성방법및장치그리고음성대역확장방법및장치 Download PDFInfo
- Publication number
- KR100574031B1 KR100574031B1 KR1019980044279A KR19980044279A KR100574031B1 KR 100574031 B1 KR100574031 B1 KR 100574031B1 KR 1019980044279 A KR1019980044279 A KR 1019980044279A KR 19980044279 A KR19980044279 A KR 19980044279A KR 100574031 B1 KR100574031 B1 KR 100574031B1
- Authority
- KR
- South Korea
- Prior art keywords
- narrowband
- unvoiced
- voiced
- speech
- wideband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000001308 synthesis method Methods 0.000 title claims description 23
- 230000005284 excitation Effects 0.000 claims description 66
- 230000015572 biosynthetic process Effects 0.000 claims description 65
- 238000003786 synthesis reaction Methods 0.000 claims description 65
- 238000013139 quantization Methods 0.000 claims description 44
- 239000013598 vector Substances 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 22
- 230000002194 synthesizing effect Effects 0.000 claims description 21
- 230000003595 spectral effect Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 13
- 238000011049 filling Methods 0.000 description 13
- 238000009432 framing Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (38)
- 복수 종류의 입력 부호화된 파라미터의 음성을 합성하기 위하여 소정된 시간단위마다 분리된 광대역 유/무성음에서 각각 추출된 유/무성음 특성 파라미터로부터 형성된 광대역 유성음 코드북과 광대역 무성음 코드북, 분리된 광대역 유/무성음의 주파수 대역을 제한함으로써 얻어진 협대역 음성에서 추출된 유/무성음 특성 파라미터로부터 형성된 협대역 유성음 코드북과 협대역 무성음 코드북을 사용하는 음성합성방법에 있어서,복수의 부호화된 파라미터를 복호화하는 단계와,복수의 복호화된 첫 번째 파라미터로부터 여진원(innovation)을 형성하는 단계와,두 번째 복호화된 파라미터를 음성합성 특성파라미터로 변환하는 단계와,세 번째 복호화된 파라미터를 참조하여 유/무성음을 판별하는 단계와,협대역 유/무성음 코드북을 사용함으로써 판별의 결과에 기초한 음성합성 특성파라미터를 양자화하는 단계와,광대역 유/무성음 코드북을 사용함으로써, 협대역 유/무성음 코드북을 사용하여 양자화된 협대역 유/무성음 데이터를 역양자화하는 단계와,역양자화된 데이터와 여진원을 기초로 한 음성을 합성하는 단계를 포함하여 구성하는 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,복수 종류의 부호화된 파라미터는 협대역 음성을 부호화함으로써 얻어지고, 부호화된 첫 번째 파라미터는 여진원에 관련된 파라미터이고, 두 번째 파라미터는 선형예측 파라미터이고, 세 번째 파라미터는 유/무성음 판별 표지(flag)인 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,광대역 유/무성음 코드북을 형성하기 위해 실행된 유/무성음 판별은 세 번째 부호화된 파라미터를 사용하는 것과는 다른 것을 특징으로 하는 음성합성방법.
- 제 3항에 있어서,유/무성음을 판별할 수 없는 파라미터를 제외하고, 입력 음성으로부터 광대역 유/무성음 코드북과 협대역 유/무성음 코드북을 형성하기 위해 파라미터를 추출하는 단계를 더 포함하여 구성되는 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,자기상관(autocorrelation)이 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,켑스트럼(cepstrum)이 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,스펙트럼 엔벌로프(envelope)가 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 1항에 있어서,부호화된 첫 번째 파라미터의 피치 성분이 강한 것으로 판단될 때, 임펄스열이 여진원으로써 취해지는 것을 특징으로 하는 음성합성방법.
- 복수 종류의 입력 부호화된 파라미터로부터 음성을 합성하기 위하여, 소정의 시간단위마다 분리된 광대역 유/무성음에서 각각 추출된 유/무성음 특성파라미터로부터 미리 형성된 광대역 유성음 코드북과 광대역 무성음 코드북과, 분리된 광대역 유/무성음의 주파수 대역을 제한함으로써 얻어진 협대역 음성에서 추출된 유/무성음 특성파라미터로부터 미리 형성된 협대역 유성음 코드북과 협대역 무성음 코드북을 사용하는 음성합성장치에 있어서,복수의 부호화 파라미터를 복호화하는 수단과,복호화 수단에 의해 복호화된 복수의 파라미터들 중 첫 번째 파라미터로부터 여진원을 형성하는 수단과,복호화 수단에 의해 복호화된 부호화 파라미터중 제 2파라미터로부터 음성합성 특성파라미터를 얻는 수단과,복호화수단에 의해 복호화된 부호화 파라미터의 제 3파라미터를 참조하여 유/무성음을 판별하는 수단과,협대역 유/무성음 코드북을 사용함으로써, 유/무성음 판별의 결과에 의거한 음성합성 특성파라미터를 양자화하는 수단과,광대역 유/무성음 코드북을 사용함으로써 유/무성음 양자화 수단으로부터 양자화된 유/무성음 데이터를 역양자화하는 수단과,광대역 유/무성음 역양자화 수단에서의 역양자화된 데이터와 여진원 형성 수단으로부터의 여진원에 의거하는 음성을 합성하는 수단을 포함하여 구성되어 있는 것을 특징으로 하는 음성합성장치.
- 복수 종류의 입력 부호화 파라미터로부터 음성을 합성하기 위해, 소정의 시간단위마다 광대역 유/무성음에서 추출된 특성 파라미터로부터 미리 형성된 광대역 유/무성음 코드북이 사용되는 음성합성방법에 있어서,복수의 부호화 파라미터를 복호화하는 단계와,상기 복수의 복호화 파라미터들 중 첫 번째 파라미터로부터 여진원을 형성하는 단계와,두 번째 복호화된 파라미터를 음성합성 특성파라미터로 변환하는 단계와,상기 광대역 유/무성음 코드북에서 각 코드 벡터로부터 협대역 특성 파라미터를 연산하는 단계와,상기 연산 수단에 의해 연산된 협대역 특성파라미터와 비교함으로써 음성합성 특성파라미터를 양자화하는 단계와,상기 광대역 유/무성음 코드북을 사용함으로써 양자화된 데이터를 역양자화하는 단계와,상기 역양자화된 데이터와 여진원에 의거한 음성을 합성하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성합성방법.
- 제 10항에 있어서,복수 종류의 부호화 파라미터는 협대역 음성을 부호화함으로써 얻어지고, 부호화 파라미터의 첫 번째 파라미터는 여진원과 관련된 파라미터이고, 두 번째 파라미터는 선형예측계수이고, 세 번째 파라미터는 유/무성음 판별 표지인 것을 특징으로 하는 음성합성방법.
- 제 10항에 있어서,첫 번째 부호화된 파라미터의 피치 성분이 강한 것으로 판단될 때, 임펄스열은 여진원으로써 취해지는 것을 특징으로 하는 음성합성방법.
- 제 10항에 있어서,자기상관은 특성 파라미터로써 사용되고, 자기상관은 두 번째 부호화 파라미터로부터 생성되고, 자기상관은 상기 광대역 유/무성음 코드북에서의 광대역 자기상관과 대역스톱필터의 임펄스 응답의 자기상관을 컨벌루션에 의해 결정된 협대역 자기상관과 비교함으로써 양자화되고, 양자화된 데이터는 음성을 합성하기 위하여 상기 광대역 유/무성음 코드북을 사용하여 역양자화되는 것을 특징으로 하는 음성합성방법.
- 제 10항에 있어서,광대역 음성코드북은 소정의 시간단위 마다, 분리된 광대역 유/무성음에서 추출된 유/무성음 특성파라미터로부터 미리 형성된 광대역 유/무성음 코드북이고, 복수의 입력 부호화 파라미터의 세 번째 파라미터를 참조하여 판별가능한 유/무성음 판별의 결과에 의거하여, 음성합성 특성 파라미터는 광대역 유/무성음 코드북에서 각 코드북으로부터 연산에 의해 결정된 협대역 특성 파라미터와 비교함으로써 양자화되고, 양자화된 데이터는 광대역 유/무성음 코드북을 사용하여 역양자화되고, 음성은 역양자화된 데이터와 여진원에 의거하여 합성되는 것을 특징으로 하는 음성합성방법.
- 제 14항에 있어서,자기상관은 특성 파라미터로써 사용되고, 자기상관은 제 2부호화 파라미터로부터 생성되고, 자기상관은 광대역 음성코드북에서 광대역 자기상관과 대역스톱필터의 임펄스 응답의 자기상관을 컨벌루션에 의해 결정된 협대역 자기상관과 비교함으로써 양자화되고, 양자화된 데이터는 음성을 합성하기 위하여 광대역 음성코드북을 사용하여 역양자화되는 것을 특징으로 하는 음성합성방법.
- 제 14항에 있어서,광대역 유/무성음 코드북을 형성하기 위해 실행된 유/무성음 판별은 세 번째 부호화 파라미터를 사용하는 것과 다르게 구성되는 것을 특징으로 하는 음성합성방법.
- 제 14항에 있어서,광대역 유/무성음 코드북과 협대역 유/무성음 코드북을 형성하기 위하여, 유/무성음 판별이 불확실한 것을 제외하고, 입력 음성으로부터 파라미터를 추출하는 것을 특징으로 하는 음성합성방법.
- 복수 종류의 입력 부호화 파라미터로부터 음성을 합성하기 위하여, 소정의 시간단위 마다 광대역 음성에서 추출된 특성 파라미터로부터 미리 형성된 광대역 음성코드북을 사용하는 음성합성장치에 있어서,복수 종류의 부호화 파라미터를 복호화하는 수단과,복호화 수단에 의해 복호화된 복수 종류의 파라미터들 중 첫 번째 파라미터로부터 여진원을 형성하는 수단과,복호화 수단에 의해 복호화된 복수 종류의 파라미터의 두 번째 복호화된 파라미터를 음성 합성 특성파라미터로 변환하는 수단과,광대역 음성코드북에서 각 코드벡터로부터 협대역 특성 파라미터를 연산하는 수단과,연산수단으로부터 협대역 특성 파라미터를 사용함으로써 파라미터 변환수단으로부터 음성합성 특성파라미터를 양자화하는 수단과,광대역 음성코드북을 사용함으로써 양자화하는 수단으로부터 양자화된 데이터를 역양자화하는 수단과,역양자화 수단에서의 역양자화된 데이터와 여진원 형성수단에서의 여진원에 의거하여 음성을 합성하는 수단을 포함하여 구성되어 있는 것을 특징으로 하는 음성합성장치.
- 복수 종류의 입력 부호화 파라미터로부터 음성을 합성하기 위하여, 소정의 시간단위마다, 광대역 음성에서 추출된 특성파라미터로부터 미리 형성된 광대역 음성코드북이 사용된 음성합성방법에 있어서,복수 종류의 부호화 파라미터를 복호화하는 단계와,복수 종류의 복호화된 파라미터중 첫 번째 파라미터로부터 여진원을 형성하는 단계와,두 번째 복호화된 파라미터를 음성합성 특성파라미터로 변환하는 단계와,광대역 음성코드북에서 각 코드 벡터로부터 부분추출에 의해 협대역 특성파라미터를 연산하는 단계와,연산수단에 의해 연산된 협대역 특성 파라미터와 비교함으로써 음성합성 특성파라미터를 양자화하는 단계와,광대역 음성코드북을 사용함으로써 양자화된 데이터를 역양자화하는 단계와,역양자화된 데이터와 여진원에 기초하여 음성을 합성하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,복수 종류의 부호화 파라미터는 협대역 음성을 부호화함으로써 얻어지고, 부호화 파라미터의 첫 번째 파라미터는 여진원에 관련된 파라미터이고, 두 번째 파라미터는 선형예측계수이고, 세 번째 파라미터는 유/무성음 판별 표지인 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,자기상관은 특성 파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,켑스트럼은 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,스펙트럼 엔벌로프가 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,첫 번째 부호화 파라미터의 피치 성분이 강한 것으로 판단될 때, 임펄스열은 여진원으로써 취해지는 것을 특징으로 하는 음성합성방법.
- 제 19항에 있어서,광대역 음성코드북은 소정의 시간단위 마다. 분리된 광대역 유/무성음에서 추출된 유/무성음 특성파라미터로부터 미리 형성된 광대역 유/무성음 코드북이고, 복수의 입력 부호화 파라미터의 세 번째 파라미터를 참조하여 판별가능한 유/무성음 판별의 결과에 의거하여, 음성합성 특성 파라미터는 광대역 유/무성음 코드북에서 각 코드북으로부터 연산에 의해 결정된 협대역 특성 파라미터와 비교함으로써 양자화 되고, 양자화된 데이터는 광대역 유/무성음 코드북을 사용하여 역양자화되고, 음성은 역양자화된 데이터와 여진원에 의거하여 합성되는 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,자기상관은 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,켑스트럼은 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,스펙트럼 엔벌로프가 특성파라미터로써 사용되는 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,광대역 유/무성음 코드북을 형성하기 위해 실행된 유/무성음 판별은 세 번째 부호화된 파라미터를 사용하는 것과 다른 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,유/무성음을 판별이 불확실한 파라미터를 제외하고, 광대역 유/무성음 코드북과 협대역 유/무성음 코드북을 형성하기 위하여 입력음성으로부터 파라미터를 추출하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성합성방법.
- 제 25항에 있어서,첫 번째 부호화 파라미터의 피치 성분이 강한 것으로 판단될 때, 임펄스열은 여진원으로써 취해지는 것을 특징으로 하는 음성합성방법.
- 복수 종류의 입력 부호화 파라미터로부터 음성을 합성하기 위하여, 소정의 시간단위마다, 광대역 유/무성음에서 추출된 특성파라미터로부터 미리 형성된 광대역 유/무성음 코드북을 사용하는 음성합성장치에 있어서,복수 종류의 부호화 파라미터를 복호화하는 수단과,상기 복호화 수단에 의해 복호화된 복수 종류의 파라미터중 첫 번째 파라미터로부터 여진원을 형성하는 수단과,상기 복호화 수단에 의해 복호화된 복수 종류의 파라미터중 두 번째 복호화 파라미터를 음성합성 특성파라미터로 변환하는 수단과,상기 광대역 유/무성음 코드북에서 각 코드벡터로부터 부분추출에 의해 협대역 특성파라미터를 연산하는 수단과,상기 연산 수단으로부터 협대역 특성파라미터를 사용함으로써 파라미터 변환수단으로부터 음성합성 특성파라미터를 양자화하는 수단과,상기 광대역 유/무성음 코드북을 사용함으로써 양자화 수단으로부터 양자화된 데이터를 역양자화하는 수단과,상기 역양자화 수단에서의 역양자화된 데이터와 여진원을 형성하는 수단에서의 여진원에 의거하여 음성을 합성하는 수단을 포함하여 구성되어 있는 것을 특징으로 하는 음성합성장치.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 분리된 광대역 유/무성음에서 각각 추출된 유/무성음 파라미터로부터 미리 형성된 광대역 유성음 코드북과 광대역 무성음 코드북, 분리된 광대역 유/무성음의 주파수 대역을 제한함으로써 얻어진 협대역 음성에서 추출된 유/무성음 특성 파라미터로부터 미리 형성된 협대역 유성음 코드북과 협대역 무성음 코드북이 사용되는 음성대역 확장방법에 있어서,소정의 시간 단위마다 입력 협대역 음성에서 유성음과 무성음을 판별하는 단계와,협대역 유/무성음으로부터 유성파라미터와 무성파라미터를 생성하는 단계와,협대역 유/무성음 코드북을 사용함으로써 협대역 음성의 협대역 유/무성음 파라미터를 양자화하는 단계와,협대역 유/무성음 코드북을 사용하여 양자화된 협대역 유/무성음 데이터를 협대역 유/무성음 코드북을 사용함으로써 역양자화하는 단계와,역양자화된 데이터에 의거하여 협대역 음성의 대역을 확장하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장방법.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 분리된 광대역 유/무성음에서 각각 추출된 유/무성음 파라미터로부터 미리 형성된 광대역 유성음 코드북과 광대역 무성음 코드북과, 분리된 광대역 유/무성음의 주파수 대역을 제한함으로써 얻어진 협대역 음성에서 추출된 유/무성음 특성파라미터로부터 미리 형성된 협대역 유성음 코드북과 협대역 무성음 코드북을 사용하는 음성대역 확장장치에 있어서,소정의 시간 단위마다 입력 협대역 음성에서 유성음과 무성음을 판별하는 수단과,유/무성음 판별수단에 의해 판별된 협대역 유/무성음으로부터 유성음 파라미터와 무성음 파라미터를 생성하는 수단과,협대역 유/무성음 코드북을 사용함으로써 협대역 유/무성음 파라미터를 생성하는 수단으로부터 협대역 유/무성음 파라미터를 양자화하는 수단과,광대역 유/무성음 코드북을 사용함으로써, 협대역 유/무성음 코드북의 사용에 의한 협대역 유/무성음 양자화 수단으로부터 협대역 유/무성음 데이터를 역양자화하는 수단과,광대역 유/무성음을 역양자화하는 수단으로부터 역양자화된 데이터에 의거하여 확장된 협대역 음성의 대역을 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장장치.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 광대역 음성에서 추출된 파라미터로부터 미리 형성된 광대역 유/무성음 코드북이 사용된 음성대역 확장방법에 있어서,입력 협대역 음성에서 협대역 파라미터를 생성하는 단계와,상기 광대역 유/무성음 코드북에서 각 코드벡터로부터 협대역 파라미터를 연산하는 단계와,상기 연산된 협대역 파라미터와 비교함으로써 입력 협대역 음성으로부터 생성된 협대역 파라미터를 양자화하는 단계와,상기 광대역 유/무성음 코드북을 사용함으로써 양자화된 데이터를 역양자화하는 단계와,상기 역양자화된 데이터에 의거하여 협대역 음성의 대역을 확장하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장방법.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 광대역 유/무성음에서 추출된 파라미터로부터 미리 형성된 광대역 유/무성음 코드북을 사용하는 음성대역 확장장치에 있어서,상기 입력 협대역 음성으로부터 협대역 파라미터를 생성하는 수단과,상기 광대역 유/무성음 코드북에서 각 코드 벡터로부터 협대역 파라미터를 연산하는 수단과,상기 협대역 파라미터 연산수단에서 협대역 파라미터와 비교함으로써 입력 협대역 파라미터 생성수단으로부터 협대역 파라미터를 양자화하는 수단과,상기 광대역 유/무성음 코드북을 사용함으로써 협대역 음성 양자화수단으로부터 양자화된 협대역 데이터를 역양자화하는 수단과,상기 광대역 유/무성음을 역양자화 수단으로부터 역양자화된 데이터에 의거하여 확장된 협대역 음성의 대역을 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장장치.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 광대역 유/무성음에서 추출된 파라미터로부터 미리 형성된 광대역 유/무성음 코드북이 사용된 음성대역 확장방법에 있어서,입력 협대역 음성으로부터 협대역 파라미터를 생성하는 단계와,상기 광대역 유/무성음 코드북에서 각 코드벡터로부터 부분추출에 의해 협대역 파라미터를 연산하는 단계와,상기 연산된 협대역 파라미터와 비교함으로써 입력 협대역 음성으로부터 생성된 협대역 파라미터를 양자화하는 단계와,상기 광대역 유/무성음 코드북을 사용함으로써 양자화된 데이터를 역양자화하는 단계와,상기 역양자화된 데이터에 의거하여 협대역 음성의 대역을 확장하는 단계를 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장방법.
- 입력 협대역 음성의 대역을 확장하기 위하여, 소정의 시간단위마다 광대역 유/무성음에서 추출된 파라미터로부터 미리 형성된 광대역 유/무성음 코드북을 사용하는 음성대역 확장장치에 있어서,입력 협대역 음성으로부터 협대역 파라미터를 생성하는 수단과,상기 광대역 유/무성음 코드북에서 각 코드 벡터로부터 부분추출에 의해 협대역 파라미터를 연산하는 수단과,상기 협대역 파라미터를 연산수단에서 협대역 파라미터를 사용함으로써 음성을 사용하는 협대역 파라미터를 생성수단으로부터 생성된 협대역 파라미터를 양자화하는 수단과,상기 광대역 유/무성음 코드북을 사용함으로써 양자화수단으로부터 양자화된 협대역 데이터를 역양자화하는 수단과,상기 역양자화 수단으로부터 역양자화된 데이터에 의거하여 확장된 협대역 음성의 대역을 포함하여 구성되어 있는 것을 특징으로 하는 음성대역 확장장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP97-291405 | 1997-10-23 | ||
JP29140597A JP4132154B2 (ja) | 1997-10-23 | 1997-10-23 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990037291A KR19990037291A (ko) | 1999-05-25 |
KR100574031B1 true KR100574031B1 (ko) | 2006-12-01 |
Family
ID=17768476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980044279A Expired - Fee Related KR100574031B1 (ko) | 1997-10-23 | 1998-10-22 | 음성합성방법및장치그리고음성대역확장방법및장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6289311B1 (ko) |
EP (1) | EP0911807B1 (ko) |
JP (1) | JP4132154B2 (ko) |
KR (1) | KR100574031B1 (ko) |
TW (1) | TW384467B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150070906A (ko) * | 2013-12-17 | 2015-06-25 | 현대자동차주식회사 | 풀핸들 일체형 도어 인사인드 핸들 장치 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0945852A1 (en) * | 1998-03-25 | 1999-09-29 | BRITISH TELECOMMUNICATIONS public limited company | Speech synthesis |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
KR20000047944A (ko) * | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
US6260009B1 (en) | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
SE518446C2 (sv) * | 1999-06-14 | 2002-10-08 | Ericsson Telefon Ab L M | Anordning vid kylning av elektroniska komponenter |
JP4792613B2 (ja) * | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
EP1147515A1 (en) * | 1999-11-10 | 2001-10-24 | Koninklijke Philips Electronics N.V. | Wide band speech synthesis by means of a mapping matrix |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
DE1298643T1 (de) * | 2000-06-14 | 2003-11-27 | Kabushiki Kaisha Kenwood, Tokio/Tokyo | Frequenzinterpolationseinrichtung und frequenzinterpolationsverfahren |
KR100819623B1 (ko) * | 2000-08-09 | 2008-04-04 | 소니 가부시끼 가이샤 | 음성 데이터의 처리 장치 및 처리 방법 |
GB2368761B (en) * | 2000-10-30 | 2003-07-16 | Motorola Inc | Speech codec and methods for generating a vector codebook and encoding/decoding speech signals |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
TWI393120B (zh) | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
JP4815780B2 (ja) * | 2004-10-20 | 2011-11-16 | ヤマハ株式会社 | オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法 |
KR101069268B1 (ko) | 2007-02-14 | 2011-10-04 | 엘지전자 주식회사 | 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법 |
EP2207166B1 (en) * | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
DK2864983T3 (en) | 2012-06-20 | 2018-03-26 | Widex As | PROCEDURE FOR SOUND HEARING IN A HEARING AND HEARING |
US10043535B2 (en) | 2013-01-15 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
US10045135B2 (en) | 2013-10-24 | 2018-08-07 | Staton Techiya, Llc | Method and device for recognition and arbitration of an input connection |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756599A (ja) * | 1993-08-17 | 1995-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH0876799A (ja) * | 1994-09-02 | 1996-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH08123495A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 広帯域音声復元装置 |
JPH08123484A (ja) * | 1994-10-28 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 信号合成方法および信号合成装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
DE4343366C2 (de) | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
JP3275224B2 (ja) * | 1994-11-30 | 2002-04-15 | 富士通株式会社 | ディジタル信号処理システム |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5864797A (en) * | 1995-05-30 | 1999-01-26 | Sanyo Electric Co., Ltd. | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors |
JPH1020891A (ja) * | 1996-07-09 | 1998-01-23 | Sony Corp | 音声符号化方法及び装置 |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
-
1997
- 1997-10-23 JP JP29140597A patent/JP4132154B2/ja not_active Expired - Fee Related
-
1998
- 1998-10-09 TW TW087116840A patent/TW384467B/zh not_active IP Right Cessation
- 1998-10-20 US US09/175,616 patent/US6289311B1/en not_active Expired - Fee Related
- 1998-10-22 KR KR1019980044279A patent/KR100574031B1/ko not_active Expired - Fee Related
- 1998-10-22 EP EP98308629A patent/EP0911807B1/en not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756599A (ja) * | 1993-08-17 | 1995-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH0876799A (ja) * | 1994-09-02 | 1996-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH08123495A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 広帯域音声復元装置 |
JPH08123484A (ja) * | 1994-10-28 | 1996-05-17 | Matsushita Electric Ind Co Ltd | 信号合成方法および信号合成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150070906A (ko) * | 2013-12-17 | 2015-06-25 | 현대자동차주식회사 | 풀핸들 일체형 도어 인사인드 핸들 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP4132154B2 (ja) | 2008-08-13 |
JPH11126098A (ja) | 1999-05-11 |
TW384467B (en) | 2000-03-11 |
EP0911807B1 (en) | 2003-06-25 |
KR19990037291A (ko) | 1999-05-25 |
US6289311B1 (en) | 2001-09-11 |
EP0911807A2 (en) | 1999-04-28 |
EP0911807A3 (en) | 2001-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
US6615169B1 (en) | High frequency enhancement layer coding in wideband speech codec | |
KR100804461B1 (ko) | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 | |
US6694293B2 (en) | Speech coding system with a music classifier | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
KR100769508B1 (ko) | Celp 트랜스코딩 | |
US7848921B2 (en) | Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
KR100798668B1 (ko) | 무성 음성의 코딩 방법 및 장치 | |
KR20010099763A (ko) | 광대역 신호들의 효율적 코딩을 위한 인식적 가중디바이스 및 방법 | |
KR20000077057A (ko) | 음성합성장치 및 방법, 전화장치 및 프로그램 제공매체 | |
KR20070002068A (ko) | 음성 신호 코딩 | |
JP2009541797A (ja) | 種々の音声フレーム・レートの混合励振線形予測(melp)ボコーダ間でトランスコーディングするボコーダ及び関連した方法 | |
WO2003001172A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
US6856961B2 (en) | Speech coding system with input signal transformation | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP2004301954A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP4287840B2 (ja) | 符号化装置 | |
Drygajilo | Speech Coding Techniques and Standards | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
JP2002169595A (ja) | 固定音源符号帳及び音声符号化/復号化装置 | |
JPH08160996A (ja) | 音声符号化装置 | |
Ehnert | Variable-rate speech coding: coding unvoiced frames with 400 bps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19981022 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20030923 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 19981022 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050721 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20060215 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20060419 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20060420 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20090410 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20100413 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20110412 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20120409 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20120409 Start annual number: 7 End annual number: 7 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |