KR930005226B1

KR930005226B1 - 코드북 벡터 발생방법 및 장치

Info

Publication number: KR930005226B1
Application number: KR1019890701670A
Authority: KR
Inventors: 앨런 거슨 아이라
Original assignee: 모토로라 인코포레이티드; 빈센트 죠셉 로너
Priority date: 1988-01-07
Filing date: 1988-12-29
Publication date: 1993-06-16
Anticipated expiration: 2008-12-29
Also published as: CN1021938C; DK176383B1; US4817157A; JP2820107B2; IL88465A0; MX168558B; BR8807414A; NO893202D0; AR246631A1; CA1279404C; DE3853916T2; KR900700994A; FI894151A0; WO1989006419A1; JP2523031B2; EP0372008A1; FI105292B; CN1035379A; DK438189A; NO302849B1

Abstract

내용 없음.

Description

[발명의 명칭]

코드북 벡터 발생방법 및 장치

[도면의 간단한 설명]

제1도는 본 발명에 따른 벡터합 여기 신호 발생 기법을 이용한 코드 여기 선형 예측 음성 코더의 일반적인 블럭선도.

제2a도 및 제2b도는 제1도의 음성 코더에 의해 수행된 동작의 일반적인 순서를 설명하는 단순한 흐름도.

제3도는 본 발명의 벡터합 기법을 설명하고, 제1도의 코드북 발생기 블럭의 상세한 블럭선도.

제4도는 본 발명을 이용하는 음성 합성기의 일반적인 블럭선도.

제5도는 본 발명의 양호한 실시예에 따라 개선된 검색 기법을 설명하고, 제1도의 음성 코더 부분 블럭선도.

제6a도 및 제6b도는 양호한 실시예의 이득 계산 기법을 제공하고, 제5도의 음성 코더에 의해 수행된 동작의 순서를 설명하는 상세한 흐름도.

제7a도 내지 제7c도는 이미 계산된 이득 기법을 이용하고, 제5도의 실시예에 의해 실행된 동작의 순서를 설명하는 상세한 흐름도.

[발명의 상세한 설명]

[발명의 배경]

본 발명은 일반적으로 저 비트 전송속도로 코딩하는 디지탈 음성에 관한 것으로서, 특히, 코드-여기(excited)선형 예측 음성 코더용 여기 정보를 코딩하는 개선된 방법을 제공하는데 있다.

코드-여기 선형 예측(CELP)은 저 비트 전송속도, 즉, 4.8 내지 9.6(kbps)로 고 음질의 합성 음의 포텐셜(potential)를 갖는 음성 코딩 기법이다. 벡터-여기 선형 예측 또는 추계(stochastic)코딩으로도 또한 공지된 음성 코딩의 상기 종류는 다수의 음성 통신 및 음성 합성 응용에 주로 이용된다. CELP는 디지탈 음성 인크립션(encryption) 및 디지탈 무선 전화를 통신 시스템에 특히 적용될 수 있는데, 음질, 데이타율, 사이즈(크기) 및 비용에 상당한 문제가 있다.

CELP 음성 코더에 있어서, 입력 음성 신호의 특성을 모델화하는 장기(“피치 ; pitch”) 및 단기(“포르먼트 ; formant”)예측자는 일련의 시간 변화 선형 필터에 내장된다. 필터의 여기 신호는 기억된 쇄신(innovation)순서의 코드북 또는 코드 벡터로부터 선택된다. 음성의 각 프레임에 대해서, 음성 코더는 개조된 음성 신호를 발생시키기 위해 필터에 개별 코드 벡터를 인가하고, 에러 신호를 발생하기 위해 개조된 신호와 본래의 입력 음성 신호를 비교한다. 이 에러 신호는 인간의 청각 예측에 기초한 응답을 지닌 가중(weighting)필터를 통하여 가중된다. 최적의 여기 신호는 가중된 에러 신호에 현재의 프레임에 대한 최소 에너지를 적하는 코드 벡터를 선택하여 결정된다.

상기 용어 “코드-여기(code-excited)” 또는 “벡터-여기(vector-excited)”란 음성 코더의 여기 순서가 양자화된 벡터라는 사실 즉, 단일 코드워드가 여기 샘플의 순서, 또는 벡터를 표시하기 위해 사용되었다는 사실로부터 유래된 것이다. 이처럼, 샘플당 1비트보다 작은 데이타율은 여기 순서를 코딩할 수 있다. 이 기억된 여기 코드 벡터는 독립 랜덤 화이트 가우스 연속 배열(independent random white Gaussian sequences)로 이루어져 있다. 코드북에서 한 코드 벡터는 N여기 샘플의 각각의 블럭을 나타내는데 사용된다. 기억된 코드 벡터의 각각은 코드워드, 즉, 코드 벡터 메모리 위치의 어드레스로 표현된다. 이 코드워드는 수신기에서 음성 프레임을 개조시키기 위해 통신 채널을 통과하여 음성 합성기(synthesizer)에 전송된다. 상기 CELP의 더 상세한 설명을 위해, 1985년 3월, 엠. 알. 슈로에더 및 비. 에스. 아탤에 의한 음성, 음향 및 신호 수단의 IEEE 국제 협의회의 회의록(ICASSP), 3권, 937 내지 940페이지의 코드 여기 선형 예측(CELP), 즉, “초 저 비트전송속도에서의 고 음질 음성”을 참고한다.

상기 CELP 음성 코딩 기법의 어려운 점은 코드북에서 모든 여기 코드 벡터의 철저한 검색을 실행하는데 매우 높은 계산의 복잡성이 존재하게 된다. 예를들어, 8(KHz)의 샘플링 속도에서, 음성의 5(msec) 프레임은 40샘플로 구성되어 있다. 만일, 여기 정보가 샘플당 0.25비트의 전송속도(2Kbps에 대응함)로 코드화되면, 정보의 10비트가 각 프레임을 코드화시키는데 사용된다. 따라서, 랜덤 코드북은 2¹⁰또는 1024의 랜덤 코드 벡터를 포함한다. 이 벡터 검색 순서는 각각의 코드 벡터에서 40샘플의 각각에 대해 약 15곱셈-산술 계산(MAC)(3차 장기(long term)예측자 및 10차 단기(short term) 예측자를 가정함)이 필요하다. 이것은 600MACs/코드벡터/5msec음성 프레임, 또는 약 120,000,000MACs/sec(600MACs/5msec 프레임 x 1024 코드벡터)에 대응한다. 그중 하나는 최상의 비트 즉 오늘날 디지탈 신호 처리 기법으로, 실시간 실행을 위해 불합리한 타스크에 대해, 1024벡터의 전체 코드북을 검색하기 위해 필요한 특별한 계산의 노력이 있음을 알수 있다.

또한, 독립 랜덤 벡터의 코드북을 기억시키기 위한 메모리 할당 조건도 엄청나다. 상기 실시예를 위해서, 640kbit의 판독 전용 메모리(ROM)는 모두 1024코드 벡터를 기억시키는데 필요하게 되며, 그 각각은 40샘플을 가지며, 각각의 샘플은 16비트 워드로 표현된다. 상기 ROM의 크기 필수조건은 많은 음성 코드의 크기 및 비용의 목표와 모순을 이루고 있다. 따라서, 종래 기술의 코드 여기 선형 예측은 현재 음성 코딩에 실제 가깝지 않다.

이 코드 벡터 음성 처리의 계산상의 복잡성을 감소시키기 위해, 대안적인 방법은 변환 영역에서 검색 계산이 이행되어야 한다. 그러한 과정의 예로서, 아이. 엠. 트랜코소 및 비. 에스. 아텔에 의해 1986년 4월 회의록 ICASSP, 4권, 2375 내지 2378페이지의 추계 코더에서 최적의 기술 혁신을 발견하기 위해 효과적인 절차를 참조한다. 이 해결 방법을 이용하면, 이산 푸리에 변환(DFT's) 또는 다른 변환은 변환 영역에 필터응답을 나타내는데 사이용되므로, 필터 계산은 단일 MAC 연산/샘플/코드벡터로 감소된다. 그러나, 코드벡터를 구하는데 부가적인 2MACs/샘플/코드 벡터가 또한 요구되며, 따라서, 다수의 곱셈-산술 연산, 즉, 120/코드 벡터/5sec 프레임, 또는 상기 예에서 24,000,000MACs/sec로 된다. 또한, 각 코드 벡터의 변환이 역시 기억되어야 하므로, 상기 변환 수법은 적어도 2배의 메모리 용량을 필요로한다. 상기 실시예에 있어서, 1.3메가비트의 ROM은 변환을 이용하는 CELP를 충족시키기 위해 요구된다.

계산의 복잡성을 줄이기 위한 제2수법은 코드 벡터가 더이상 서로 관련되지 않도록 여기 코드북을 구성시키는 것이다. 이러한 방법에 있어서, 코드 벡터의 필터 버젼(version)은 이전의 코드 벡터의 필터된 버전으로부터 계산될 수 있고, 단일 필터 계산 MAC/샘플만을 다시 사용한다. 이러한 수법은 요구된 ROM의 양(상기 예에서 16킬로비트)을 현저하게 감소시키는 동안, 변환 기법과 거의 동일한 계산 필수 조건으로 된다. 이들 형태의 코드북의 예는 1987년 4월, 디. 린에 의해, 회의록 ICASSP의 명칭 “효과적인 의사-추계 블럭 코드를 사용하는 음성 코딩”의 제3권, 1354 내지 1357페이지에 기재되어 있다. 그렇지만, 24,000,000 MACs/sec는 단일 DSP의 계산 용량을 초과한다. 또한, ROM 크기는 2^M×#비트/워드에 기초로하며, 여기서, M은 코드워드에 있어서 비트의 수이므로, 코드북 2^M코드 벡터를 포함한다. 그러므로, 메모리 요구조건은 여기 정보의 프레임을 엔코드하기 위해 사용된 비트의 수와 함께 지수적으로 증가한다. 예를들어, ROM 요구조건 12비트 코드워드를 사용할때 64킬로비트로 증가한다.

그러므로, 철저한 검색을 위해 극도로 큰 계산의 복잡성 뿐만 아니라 여기 코드 벡터를 기억시키는 광대한 메모리 요구조건의 문제점을 어드레스시키는 개선된 음성 코딩 기법을 제공해야 할 필요성이 있다.

[발명의 개요]

따라서, 본 발명의 일반적인 목적은 저 비트 전송속도로 고 음질을 발생하는 개선된 디지탈 음성 코딩 기법을 제공하는데 있다.

본 발명의 다른 목적은 메모리 요구조건이 감소된 유효 여기 벡터 발생 기법을 제공하는데 있다.

본 발명의 또다른 목적은 오늘날의 신호 처리 기법을 이용하여 실시간동안 실제 실행의 계산 복잡성이 감소되어 있는 개선된 코드북 검색 기법을 제공하는 데 있다.

이들 및 다른 목적은 본 발명에 의해 얻을 수 있는데, 간단히 기술하면, 여기 코드 벡터를 갖는 코드북을 이용하는 음성 코더의 개선된 여기 벡터 발생 및 검색 기법을 얻을 수 있다. 본 발명의 제1관점에 따라서, 일련의 기본 벡터는 새로운 “벡터합”기법에 따른 여기 벡터의 코드북을 발생하기 위해 여기 신호와 함께 사용된다. 일련의 2^M코드북 벡터를 발생시키는 상기 방법은 일련의 선택기 코드워드를 입력시키는 단계와 선택기 코드워드를 일반적으로 각각의 선택기 코드워드의 각각의 비트값에 기초로한 다수의 중간 데이타 신호로 변환시키는 단계와 ; 전체의 코드북을 기억하는 대신에 메모리내에 전형적으로 일련의 M기본 벡터를 입력시키는 단계와 ; 다수의 중간 벡터를 발생시키기 위해 일련의 M기본 벡터에 다수의 중간 데이타 신호를 곱하는 단계와 ; 일련의 2^M코드 벡터를 발생시키기 위해 다수의 중간 벡터를 합하는 단계를 구비한다.

본 발명의 제2관점에 따라, 2^M가능 여기 벡터의 전체 코드북은 그들 자신의 각각의 코드 벡터를 매번 발생시키거나, 값을 구할 필요없이, 어떻게 코드 벡터가 기본 벡터로부터 발생되는가의 인식을 이용하여 효과적으로 검색된다. 소정의 여기 벡터와 일치하는 코드워드를 선택하는 상기 방법은, 입력 신호와 일치하는 입력 벡터를 발생시키는 단계와 ; 일련의 M기본 벡터를 입력시키는 단계와 ; 기본 벡터로부터 처리된 다수의 벡터를 발생시키는 단계와 ; 비교 신호를 발생시키기 위해 입력 신호와 처리된 벡터를 비교하는 단계와 ; 일련의 2^M여기 벡터의 각각에 일치하고, 비교 신호에 기초로 한 각각의 코드워드의 파라미터를 계산하는 단계와 ; 각각의 코드워드의 계산된 파라미터를 계산하고, 일련의 2^M여기 벡터의 각각을 발생시키지않고, 입력 신호에 가장 가깝게 정합하는 개조된 신호를 발생시킬 코드 벡터를 나타내는 하나의 코드워드를 선택하는 단계를 구비한다. 또한, 계산의 복잡성의 감소는 소정의 순서화 기법에 따른 시간에서 코드워드의 한 비트만을 변화시켜 한 코드워드로부터 다음 코드워드까지 순서화 함으로서 성취되며, 그결과, 다음 코드워드의 계산은 소정의 순서화 기법에 기초로한 이전의 코드워드로부터 파라미터를 갱신시키기 위해 감소된다.

본 발명의 “벡터합”코드북 발생 수법은 저 비트 전송속도로 고 음질의 장점을 유지하는 동안, CELP 음성 코딩의 이행을 보다 빠르게 한다. 특히, 본 발명은 계산의 복잡성 및 메모리의 요구조건의 문제점에 대해 효과적으로 해결한다. 예를들어, 본 명세서에 기술된 벡터합 수법은 각각의 코드 워드값에 대해 M+3MACs만을 필요로 한다. 이전의 실시예의 견지에서 상기는 변환 수법을 사용하는 표준 CELP 또는 120MACs에 대해 600MACs에 반대된 바와 같이, 단지 13MACs에 일치한다. 상기 개선점은 복잡성의 약 10배로 감소되고, 그결과 초당 2,600,000MACs를 얻는다. 이러한 계산적 복잡성의 감소는 단일 DSP를 이용한 CELP의 실제 실시간을 개선할 수 있다.

또한, M기본 벡터만이, 모든 2^M코드 벡터와 대치되는 것처럼, 메모리에 기억시킬 필요가 있다. 그러므로, 상기 실시예의 ROM 요구는 본 발명의 640키로비트에서 6.4키로비트로 감소된다. 본 발명의 음성 코딩 기법에 따른 장점은 채널 비트 에러에 대해 표준 CELP보다 더 견고하게 된다. 본 발명의 벡터합 여기 음성을 이용하면, 수신된 코드에서 단일 비트 에러는 소정의 여기 벡터와 유사한 여기 벡터를 얻을 수 있다. 같은 조건, 표준 CELP에서, 랜덤 코드북을 이용하면 임의 여기 벡터… 소정의 여기 벡터와 관계가 없는 벡터를 얻을 수 있다.

새로운 기술이라고 생각되는 본 발명의 특징은 청구된 청구범위에 특히 상세히 기술되어 있다. 본 발명은, 다른 목적 및 그 장점과 함께, 첨부된 도면과 함께 다음 설명을 참조로 하여 더 쉽게 이해될 수 있으며, 몇몇의 도면에 있어서 동일한 참고번호는 동일한 요소를 의미한다.

[양호한 실시예의 상세한 설명]

지금, 제1도를 참조하면, 본 발명에 따른 여기 신호 발생 기법을 이용한 코드 여기(excited)선형 예측 음성코더(100)의 일반적인 블럭선도를 나타낸다. 분선된 음향 입력 신호는 마이크로폰(102)에서 음성 코더(100)로 인가된다. 그러면, 전형적인 음성 신호인 입력 신호가 필터(104)에 인가된다. 필터(104)는 일반적으로 대역 통과 특성을 나타낸다. 그러나, 이 음성 대역폭이 이미 적당하게 되면, 필터(104)는 직접 배선 접속된다.

그러면, 필터(104)의 아날로그 음성 신호는 N펄스 샘플의 연속으로 변환되고, 각각의 샘플의 진폭은 공지된 기술처럼 아날로그-디지탈(A/D)변환기(108)에서 디지탈 코드로 나타낸다. 이 샘플링 비율은 샘플 클럭(SC)에 의해 결정되어, 본 양호한 실시예에서 0.8KHz 비율을 나타낸다. 이 샘플 클럭(SC)은 클럭(112)을 통해 프레임 클럭(FC)와 함께 발생된다.

이 A/D변환기(108)의 디지탈 출력은 입력 음성 벡터 S(n)로서 나타내고, 계수 분석기(110)에 인가된다. 이 입력 음성 벡터 S(n)은 분리된 프레임에서 각각 얻게 되는데, 예를들어, 시간의 블럭, 프레임 클럭(FC)에 의해 결정된 길이를 얻을 수 있다. 본 양호한 실시예에 있어서, 입력 음성 벡터 S(n), 1≤n≤N은 N=40샘플을 포함하는 5m초 프레임을 나타내며, 각각의 샘플은 디지탈 코드의 12 내지 16비트로 나타낸다. 음성의 각 블럭을 위해, 한 셋트의 선형 예측 코딩(LPC)파라미터는 계수 분석기(110)에 의해 종래 기법에 따라 발생된다. 단기 예측자 파라미터(STP), 장기 예측자 파라미터(LTP), 가중 필터 파라미터(WFP) 및 여기 이득율(V), (후에 기술될 최고 여기 코드 워드(I)와 함께)은 멀티플렉서(150)에 인가되고, 음성 합성기에 이용하기 위한 채널을 통해 전송된다. 1982년 4월, 비. 에스. 아탈에의해, “IEEE Trans. Commun.”Vol. COM-30, 페이지(600 내지 614)의, 명칭이“저 비트 전송속도에서의 음성의 예측코딩”을 참조하면, 상기 파라미터들을 발생시키는 방법이 기재되어 있다. 입력 음성 벡터 S(n)는 감산기(130)에도 인가되고, 그의 기능은 기술될 것이다.

기본 벡터 기억 장치(114)는 1≤m≤M에서, 한 셋트의 M기본 벡터(Vm(n))를 포함하는데, 1≤n≤N에서 N샘플로 각각 되어 있다. 이들 기본 벡터는, 10≤i≤2^M-1에서, 한 셋트의 2^M의사-랜덤 여기 벡터 Ui(n)를 발생시키기 위한 코드북 발생기(120)에 이용된다. 각각의 M기본 벡터는 직렬의 랜덤 화이트 가우스 샘플로 되어 있고, 다른 형태의 기본 벡터도 본 발명에 이용될 수 있다.

코드북 발생기(120)는 M기본 벡터 Vm(n) 및 0≤i≤2^M-1에서 2^M여기 벡터 Ui(n)을 발생하기 위한 한셋트의 2^M여기 코드워드(Ii)를 이용한다. 본 실시예에 있어서, 각각의 코드워드(Ii)는 지수(i)와 같은데, 즉, Ii=i이다. 만일, 여기 신호가 40샘플(M=10)의 각각에 대해 샘플당 0.25비트의 전송속도로 코드화되면, 1024 여기 벡터를 발생하는데 이용된 10기본 벡터가 존재하게 된다. 이들 여기 벡터는 벡터합 기법에 따라 발생되고, 제2도 및 제3도에 따라 실제로 기술된다. 각각의 여기 벡터 Ui(n)에 대해, 개조된 음성 벡터 Si(n)는 입력 음성 벡터 S(n)과 비교를 위해 발생된다. 이득 블럭(122)은 여기 이득율(γ)에 의해 여기 벡터 Ui(n)를 비율에 따라 정하고, 프레임에 대해서 일정하게 된다. 이 여기 이득율(γ)은 계수 분석기(110)에 의해 미리 계산되어, 제1도에 도시된 것처럼 모든 여기 벡터를 분석하는데 이용되고, 최고 여기 코드워드(I)에 대한 검색과 함께 결합적으로 최적화되고, 코드북 검색 제어기(140)에 의해 발생된다. 이 최적화 이득 기법은 실제로 제5도에 따라 기술될 수 있다.

규격화된 여기 신호 γ Ui(n)는 개조된 음성 벡터 S'i(n)를 발생시키기 위해 장기 예측자 필터(124) 및 단기 예측자 필터(126)에 의해 필터된다. 필터(124)는 주기적으로 음성을 수용하기 위해 장기 예측자 파라미터(LTP)를 이용하고, 필터(126)는 스펙트럼의 엔벨로프를 수용하기 위해 단기 예측자 파라미터(STP)를 이용한다. 블럭(124 및 126)은 그들 각각의 피드백 경로에서 장기 예측자 및 단기 예측자를 포함하는 실제순환(recursive)필터인 점을 주목한다. 이들 시간-변화 순환 필터를 나타내는 전달 함수는 이미 언급된 설명을 참조한다.

i번째 여기 코드 벡터에 대한 개조 음성 벡터 S'i(n)는 감산기(130)에서 이들 두 신호의 감산에 의해 입력된 음성 벡터 S(n)의 동일한 블럭과 비교된다. 차이 벡터 ei(n)는 음성의 원래와 개조 블럭 사이의 차이를 나타낸다. 이 차이 벡터는 가중 필터(132)에 의해 감지할 수 있게 가중화되고, 계수 분석기(110)에 의해 발생된 가중 필터 파라미터(WTP)를 이용한다. 대표적인 가중 필터 전달 함수에 대해서는 이미 언급된 참고 문헌을 참조한다. 감지할 수 있는 가중은 사람귀에 더 심각하게 감지될 수 있는 에러의 주파수를 가중시키고, 다른 주파수를 감쇠시킨다.

에너지 계산기(134)는 가중된 차이 벡터 e'i(n)의 에너지를 계산하고, 이 에러 신호를 코드북 검색 제어기(140)에 인가한다. 이 검색 제어기는 최소 에러를 발생하는 여기 벡터를 결정하기 위해 이전 에러 신호에 대한 현재 여기 벡터 ui(n)와 i번째 에러 신호를 비교한다. 최소 에러를 갖는 i번째 여기 벡터의 코드는 최고 여기 코드(I)처럼 채널을 통해 출력된다. 다른 방식에 있어서, 검색 제어기(140)는 이미 한정된 에러 한계를 만나는 것과 같은, 어떤 선정된 기준이 있는 에러 신호를 제공하는 특정 코드워드를 결장할 수 있다.

음성 코더(100)의 동작을 제2도의 흐름도를 참조로 하여 기술한다. 단계(200)에서 시작하면, 입력 음성 벡터 S(n)의 한 프레임의 N샘플을 단계(202)에서 얻을 수있으며, 감산기(130)에 인가된다. 본 양호한 실시예에서는 N=40 샘플이다. 단계(204)에서, 계수 분석기(100)는 장기 예측자 파라미터(LTP), 단기 예측자 파라미터(STP), 가중 필터 파라미터(WTP) 및 여기 이득율(γ)을 계산한다. 이 장기 예측자 필터(124), 단기 예측자 필터(126) 및 가중 필터(132)의 필터 상태(FS)는 후에 이용될 단계(206)에서 세이브된다. 단계(208)는 도시된 것처럼, 여기 코드워드 지수를 나타내는 파라미터(i) 및 최고 에러 신호를 나타내는 파라미터(Eb)를 초기화한다.

단계(210)로 계속되면, 장기 및 단기 예측자 및 가중 필터의 필터 상태는 단계(206)에서 세이브된 이들 필터로 재저장된다. 이 재저장은 이전 필터 기록을 여기 벡터와 비교하여 동일하게 되도록 한다. 단계(212)에서, 지수(i)는 모든 여기 벡터가 비교되었는지 혹은 비교 안되었는지를 알아보기 위해 시험된다. 만일, i가 2^M보다 작을 때, 다음 코드 벡터에 대해 동작을 계속한다. 단계(214)에서, 기본 벡터 Vm(n)는 벡터합 기법을 통해 여기 벡터 Ui(n)를 계산하기 위해 이용된다.

코드북 발생기(120)에 대한 전형적인 하드웨어 구성을 도시하는 제3도는 벡터합 기법을 설명하기 위해 이용된다. 발생기 블럭(320)은 제1도의 코드북 발생기(120)와 일치하고, 메모리(314)는 기본 벡터 기억 장치(114)와 일치한다. 메모리 블럭(314)는, M기본 벡터(V_1(n)내지 V_M(n)모두를 기억시키며, 여기서, 1≤m≤M, 1≤n≤N이다. 모든 M기본 벡터는 발생기(320)의 멀티플렉서(361 내지 364)에 인가된다.

i번째 여기 코드워드도 역시 발생기(320)에 인가된다. 이 여기 정보는 변환기(360)에 의해 다수의 중간 데이타 신호(Qil 내지 QiM)로 변환된다. 여기서, 1≤m≤M이다. 양호한 실시예에 있어서, 중간 데이타 신호는 선택기의 코드워드(i)의 각각의 비트값을 기초로 하므로, 각각의 중간 데이타 신호(Qim)는 i번째 여기 코드워드의 m-번째 비트와 일치하는 표시를 나타낸다. 예를들어, 여기 코드워드(i)중 하나의 비트가 0일때, Qil은 -1이 된다. 유사하게, 여기 코드워드(i)중 제2비트가 1일때, Qi2는 +1이 된다. 그러나, 중간 데이타 신호가, 예를들어, ROM 탐색표에 의해 결정되는 것처럼, i에서 Qim까지 어떤 다른 변화도 있을 수 있다는 점을 고려할 수 있으며, 또한, 코드워드내의 다수의 비트가 다수의 기본 벡터와 동일하게 되지 않아야 한다는 점을 주목한다. 예를 들어, 코드워드(i)는 비트의 각 쌍이 각각의 Qim에 대해 4값 즉 0, 1, 2, 3 또는 +1, -1, +2, -2등을 한정하는 2M비트를 가질 수 있다.

이 중간 데이타 신호는 승산기(361 재기 364)에도 인가된다. 이 승산기는 일련의 중간 벡터를 발생시키기 위해 일련의 기본 벡터 Vm(n)에 일련의 중간 데이타 신호 Qim를 곱하는데 사용되고, 일련이 중간 벡터는 단일 여기 코드 벡터 Ui(n)을발생시키기 위해 합 네트워크(365)에서 동시에 합하게 된다. 따라서, 이 벡터합 기법은 다음 방정식으로 기술된다.

여기서, Ui(n)은 i번째 여기 코드 벡터의 n번째 샘플이고, 1≤n≤N이다.

제2a도의 단계(216)를 계속하면, 여 기 벡터 Ui(n)는 이득 블럭(122)을 통해 여기 이득율(γ)만큼 증배된다. 이 기준화된 여기 벡터 rui(n)는 개조된 음성 벡터 si'(n)를 계산하기 위해 장기 및 단기 예측자 필터에 의해 단계(218)에서 필터된다. 차분 벡터 ei(n)는 모든 N샘플, 즉, 1≤n≤N에 대해서, 감산기(130)에 의해 단계(220)에서 다음과 같이 계산된다.

ei(n)=s(n)-s'i(n)…………………………………(2)

단계(222)에서, 가중 필터(132)는 가중된 차분 벡터 e'i(n)를 얻기 위해 차분 벡터 ei(n)를 지각적으로 가중하는데 사용된다. 에너지 계산기(134)는 다음 방정식(3)에 의해 단계(224)에서 가중된 차분 벡터의 에너지(Ei)를 계산한다. 즉,

단계(226)에서 최소 에러를 결정하기 위해 이전의 최적 에러 신호(Eb)와 i번째 에러 신호를 비교한다. 현재의 지수(i)가 지금까지의 최소 에러 신호와 일치할때, 최적 에러 신호(Eb)는 단계(228)에서 i번째 에러 신호의 값으로 갱신되고, 따라서 최적 코드워드(I)는 단계(230)에서 i와 같게 설정된다. 이 코드워드 지수(i)는 단계(240)에서 증가되고, 다음 코드 벡터를 검사하기 위해 단계(210)으로 복귀한다.

모든 2^M코드 벡터가 검사될때, 최적 코드워드(I)를 출력시키기 위해 단계(212)에서 단계(232)까지 제어 처리한다. 이 처리는 실제 필터 상태가 최적 코드워드(I)를 사용하여 갱신될때까지 완료하지 않는다. 따라서, 단계(234)는, 최고 코드워드(I)를 이용할때만, 단계(216)에서 실행되었던 것처럼 벡터합 기법을 사용하여 여기 벡터 U₁(n)를 계산한다. 이 여기 벡터는 단계(236)에서 이득율(γ)에 의해 기준화되고, 단계(238)에서 개조된 음성 벡터 S'₁(n)를 계산하기 위해 필터된다. 이 차분 신호 e₁(n)는 단계(242)에서 계산되고, 가중 필터 상태를 갱신하기 위해 단계(244)에 가중된다. 그후, 단계(202)로 복귀된다.

제4도를 참조하면, 본 발명에 따른 벡터합 발생 기법을 사용하여 음성 합성기의 블록선도가 또한 도시되어 있다. 합성기(400)는 디멀티플렉서(450)를 통해, 채널로부터 수신된 단기 예측자 파라미터(STP), 장기 예측자 파라미터(LTP), 여기 이득율(γ) 및 코드워드(I)를 얻는다. 코드워드(I)는 제3도에 기술된 것처럼, 여기 벡터 Ui(n)를 발생시키기 위해 기본 벡터 기억 장치(414)로부터 기본 벡터 Vm(n)의 세트와 함께 코드북 발생기(420)에 인가된다. 단일 여기 벡터 U₁(n)는 블럭(422)에서 이득율(γ)만큼 증배되고, 개조된 음성 벡터 S'₁(n)를 얻기 위해 장기 예측자 필터(424) 및 단기 예측자 필터(426)에 의해 필터된다. 개조된 음성의 한 프레임을 나타내는 상기 벡터는 개조된 아날로그 신호를 발생시키기 위해 아날로그-디지탈(A/D)변환기(408)에 인가되며, 그후, 필터(404)에 의해 에일리어싱(aliasing)을 감소시키기 위해 저역 통과 필터되고, 스피커(402)와 같은 출력 트랜스듀서(transducer)에 인가된다. 클록(412)은 합성기(400)의 샘플 클록 및 프레임 클록을 발생한다.

이제 제5도를 참조하면, 본 발명의 양호한 실시예를 설명하기 위해 제1도의 음성 코더의 대안 실시예의 부분 블록선도가 도시되어 있다. 제1도의 음성 코더(100)와는 두가지의 중요한 차이점이 있다는 것을 주목한다. 첫째로, 코드북 검색 제어기(540)는 최적 코드워드 선택과 함께 이득율(γ)을 계산한다. 따라서, 여기서 코드워드(I)검색 및 여기 이득율(γ) 발생 모두가 제6도의 대응 플로우챠트에 기술되어 있다. 둘째로, 다른 대안 실시예가 계수 해석기(510)에 의해 계산된 소정의 이득을 사용할 수 있다는 점을 주목한다. 제7도의 플로우챠트는 이러한 실시예를 설명한다. 제7도는 부가적인 이득 블럭(542) 및 계수 해석기(510)의 이득율 출력이, 점선으로 도시된 것처럼 삽입된다면, 제5도의 블록선도를 설명하는데 사용된다.

음성 코더(500)동작의 상세한 설명을 계속하기 전에, 본 발명에 의해 최해진 기본 검색 해결 방법을 설명하는 것이 도움이 된다는 점을 알 수 있다. 표준 CELP음성 코더에 있어서, 방정식(2)

ei(n)=s(n)-s'i(n)……………………………(2)

로부터의 차분 벡터는 e'i(n)을 산출하기 위해 가중되며, 다음 방정식

에 의해 에러 신호를 계산하는데 사용되고, 이는 소정의 코드워드(I)를 결정하기 위해 최소화되었다. 모든 2M 여기 벡터는 S(n)에 대해 최적 부합을 시도하고 얻기 위해 계산되어야 한다. 이는 철저한 검색 전략중 기본이 된다.

양호한 실시예에 있어서, 필터의 감쇠(decaying) 응답을 계산에 넣는 것이 필요하다. 이는 프레임의 시작점에 존재하는 필터 상태를 지닌 필터를 초기화하고, 외부 입력 없이 필터 감쇠를 하게 함으로서 실행된다. 입력없이 필터의 출력은 제로 입력 응답이라고 불린다. 또한, 가중 필터 함수는 감산기 출력의 종래 위치로부터 감산기의 두 입력 경로로 이동될 수 있다. 따라서, d(n)이 필터의 제로 입력 응답 벡터일때, 그리고, y(n)이 가중된 입력 음성 벡터일때, 차분 벡터 p(n)는 다음과 같다. 즉,

p(n)=y(n)-d(n)………………………………………(4)

따라서, 초기 필터 상태는 필터의 제로 입력 응답을 감산하여 전체적으로 보상된다.

이 가중된 차이 벡터 e'i(n)는 다음과 같이 된다.

e'i(n)=p(n)-s'i(n)…………………………………(5)

그러나, 이득율(γ)이 최적 코드워드를 검색할때처럼 동시에 최적화되기 때문에, 여과된 여기 벡터 fi(n)는 방정식(5)에서 s'i(n)을 재배치를 위해 각각의 코드워드 이득율(ri)에 의해 증배되는데, 다음과 같이 증배된다.

e'i(n)=p(n)-γnfn(n)………………………………(6)

이 여과된 여기 벡터 fi(n)는 하나로 설정된 이득율(γ) 및 제로로 초기화된 필터 상태와 함께 un(n)의 여과된 변형(version)이다. 다른 워드에 있어서, fi(n)은 코드 벡터 ui(n)에 의해 여기된 필터의 제로 상태응답이다. 이 제로상태 응답은 이 필터 상태 정보가 방정식(4)에서 제로 입력 응답 벡터 d(n)에 의해 이미 보상되었기 때문에 이용된다.

방정식(3)에서 방정식(6)으로부터 e'i(n)의 값을 이용하면 다음 방정식을 얻는다.

상기 방정식(7)을 전개하면 다음 방정식을 얻는다.

fi(n)과 p(n) 사이의 상호 관계를 정의하면,

되고, 여과된 코드 벡터에서 에너지를 정의하면,

가 되고, 방정식(8)을 간단히 하면, 다음과 같은 방정식을 얻을 수 있다.

방정식(11)에서 Ei가 최소화될 최적 이득율(γi)을 결정해야 한다. ri에 관한 Ei의 부분 편향을 얻고, 제로와 같이 설정하면 최적 이득율(ri)을 얻을 수 있다. 이 절차로 다음 방정식,

γi=Ci/Gi……………………………………(12)

을 얻을 수 있고, 방정식(11)에 대입하면 다음 방정식(13)을 얻을 수 있다.

이 방정식(13)에서 에러 Ei를 최소화하고, 항[ci]²/Gi가 최대로 되는 것을 알 수 있다. [ci]²/Gi를 최대화하는 코드북 검색 기법은 제6도의 흐름도에 기술된다.

만일, 이득율(γ)기 계수 분석기(510)에 의해 미리 계산된다면, 방정식(7)은 다음과 같이 바꿔 쓸수 있는

이 방정식(14)에서, y'i(n)은 이미 결정된 이득율(γ)에 의해 증배된 여기 벡터 ui(n)에 대해 필터의 제로상태 응답이다.

만일, 방정식(14)의 제2 및 제3항이,

상기 방정식(15), 방정식(16)처럼 각각 정의된다면, 방정식(14)은 다음 방정식(17)과 같이 감소될 수 있다.

모든 코드워드에 대해 방정식(17)에서 Ei를 최소화시키기 위해, 항[-2Ci+Gi]은 최소화될 것이다. 이것은 제7도의 흐름도에 기술될 코드북 검색 기법에 관한 것이다.

본 발명이 Ui(n)을 발생시키기 위해 기본 벡터의 개념을 이용한다는 점을 고려하면, 이 벡터합 방정식,

을 후에 기술된 Ui의 대치용으로 이용한다. Ei을 최소화시키기 위해, 항 [-2Ci+Gi]은 최소화된다. 이것은 제7도의 흐름도에 기술된 코드북 검색 기법이다.

본 발명은 Ui(n)을 발생시키기 위해 기본 벡터의 개념을 이용한다는 점을 고려하면, 후에 도시될 Ui의 치환하기 위해 다음 벡터합 방정식(1)을 이용할 수 있다.

이 치환의 기본 성질은 기본벡터 Vm(n)가 검색 계산을 위해 요청된 모든 항을 직접 선 계산을 위해 각각의 프레임을 이용될 수 있다는 것이다. 이것은 본 발명이 M에서 선형인 직렬의 곱셈-산술 연산을 수행하므로서 각각의 2M 코드워드를 계산할 수 있게 한다. 양호한 실시예에서, M+3 MACs만이 요구된다.

제5도는 최적 이득을 이용하며 그 동작에 관해서 설명될 것이고, 그 동작은 제6a도 및 제6b도의 흐름도에 설명된다. 시작 블럭(600)에서 개시되면, 한 프레임의 N입력 음성 샘플 S(n)을 제1도에서 실행된것처럼, 아날로그-디지탈 변환기로부터 단계(602)에서 얻는다. 다음, 입력 음성 벡터 S(n)는 계수 분석기(510)에 인가되어, 단계(604)에서 단기 예측자 파라미터(STP), 장기 예측자 파라미터(LTP) 및 가중 필터 파라미터(WFP)를 계산하기 위해 이용된다. 계수 분석기(510)는, 점선에 의해 설명된 것처럼, 본 실시예에서 선정된 이득율(γ)을 계산할 수 없다는 점을 주시한다. 이 입력 음성 벡터 S(n)는 단계(606)에서 가중된다. 상기 언급된 것처럼, 이 가중 필터는, 감산기(130)의 출력의 종래 위치로부터 감산기의 두입력까지 이동되는 것을 제외하고, 제1도의 가중 필터(132)와 같은 기능을 수행한다. 벡터 y(n)가 실제로 한 셋트의 N가중된 음성 벡터를 나타내고, 여기서 1≤n≤N 및 N은 음성 프레임에서 다수의 샘플인 것을 주목한다.

단계(608)에서, 필터 상태(FS)는 제1장기 예측자 필터(524)에서 제2장기 예측자 필터(525)까지, 제1단기 예측자 필터(526)에서 제2단기 예측자 필터(527)까지, 그리고, 제1가중 필터(528)에서 제2가중 필터(527)까지 전달된다. 이들 필터 상태는 필터의 제로 응답 d(n)을 계산하기 위해 단계(610)에서 이용된다. 이 벡터 d(n)는 각 프레임 음성의 시작에서 감쇠 필터 상태를 나타낸다. 이 제로 입력 응답 벡터 d(n)는 제2필터 스트링(525, 527, 529)에 제로 입력을 인가하고, 제1필터 스트링인의 이들과 병합된 필터(524, 526, 528)의 각각의 필터 상태를 가지므로 계산된다. 전형적인 실행에 있어서, 장기 예측자 필터, 단기 예측자 필터 및 가중 필터의 기능은 복잡성을 감소시키기 위해 조합될 수 있다.

단계(612)에서, 차이 벡터 p(n)는 감산기(530)에서 계산된다. 차이 벡터 p(n)는 이미 설명된 방정식(4)에 의해, 가중된 입력 음성 벡터 y(n)와 제로 입력 응답 벡터 d(n) 사이의 차이를 나타낸다. 그후, 이 차이 벡터 p(n)는 코드북 검색 처리에 이용되도록 제1상호 상관기(cross correlator)(533)에 인가된다.

상기 기술된 것처럼 [ci]²/Gi를 최대로 하는 목적을 얻는 항에 있어서, 이 항은, M기본 벡터가 아닌, 2M 코드북 벡터에 대해 각각 계산된다. 그러나, 이 파라미터는 2M코드 벡터보다 다소 적은 M기본 벡터와 병합된 파라미터를 기초로 한 각각의 코드워드에 대해 계산될 수 있다.

그러므로, 제로 상태 응답 벡터 qm(n)는 단계(614)에서 각각의 기본 벡터 Vm(n)에 대해서 계산된다. 기본 벡터 기억 장치 블럭(514)의 각각의 기본 벡터 Vm(n)는 제3장기 예측자 필터(544)(본 실시예에서 이득 블럭(542)을 통하지 않고)에 직접 인가된다. 그후, 각각의 기본 벡터는 장기 예측자 필터(544) ; 단기 예측자 필터(546) 및 가중 필터(548)를 구비한 필터 시리즈 #3에 의해 필터된다. 이 필터 시리즈 #3의 출력에서 발생된 제로 상태 응답 벡터 qm(n)는 제2상호 상관기 뿐만 아니라 제1상호 상관기에도 인가된다.

단계(616)에서, 제1크로스-상관기는 다음 방정식(18)에 따라 상호-상관 배열(Rm)이 계산된다.

배열(Rm)은 m번째 여과된 기본 벡터 m(n)과 사이의 상호-상관 관계를 나타낸다. 유사하게, 제2상호 상관기는 다음 방정식(19)에 따라 단계(618)에서 상호 관계 매트릭스(Dmj)를 계산한다.

여기서, 1≤m≤j≤M이다. 매트릭스(Dmj)는 한쌍의 각각의 여과된 기본 벡터 사이의 상호 관계를 나타낸다. 상기 매트릭스(Dmj)가 대칭 매트릭스 인점을 주목한다. 그러므로, 상기 항의 절반은 아래쪽에 쓴 기호의 제한에 의해 도시된 것처럼 계산될때만 이용된다. 상기 방정식(1)의 벡터합 방정식을 이용하여, 다음 방정식(20)을 얻을 수 있는데,

여기서, fi(n)은 여기 벡터 Ui(n)에 대해 필터의 제로 상태 응답이고, qm(n)은 기본 벡터에 대한 필터의 제로 상태 응답이다. 상기 방정식(9)을 다시 쓰면 다음 방정식(21)을 얻을 수 있다.

방정식(18)을 이용하면, 다음과 같은 방정식(22)을 얻을 수 있다.

제1코드워드에 대해서, i=0, 모든 비트는 제로이다. 그러므로, 1≤m≤M에 대한 Qom은 이미 기술된 것처럼 -1과 같다. 제1상관 관계(Co)는 방정식(22)로부터 i=0일때는 다음 방정식(23)을 얻는데,

이 방정식(23)은 흐름도의 단계(620)에서 계산된다.

qm(n) 및 방정식(20)을 이용하면, 상기 방정식(10)으로부터 다음 방정식(24)을 얻는다.

이 방정식(24)을 전개하면 다음 방정식(25)을 얻을 수 있다.

이 방정식(25)을 상기 방정식(19)에 적용하여 치환하면 다음 방정식(26)을 얻을 수 있다.

코드워드 및 그 보상, 즉, 여기서 모든 코드워드 비트가 변환되는 것을 주목하면, 둘 모두는 동일한 값의 [Ci]²/Gi가 되고, 둘 모두의 코드 벡터는 같은 시간에서 계산될 수 있다. 그후, 이 코드워드 계산은 절반으로 된다. 그런데, i=0에서 계산된 방정식(26)을 이용하면 다음 방정식(27)인 제1에너지항(Go)을 단계(622)에서 계산된다.

그러므로, 상기 단계에 따라, 코드워드 제로에 대한 상관 관계항(Co) 및 에너지항(Go)을 계산할 수 있다.

단계(624)로 계속되면, 파라미터(Qim)는 1≤m≤M에 대해 -1로 초기화된다. 이들 Qim파라미터는 방정식(1)에 의해 기술된 것처럼 현재 코드 벡터를 발생시키기 위해 이용된 M중간 데이타 신호를 나타낸다(Qim에서 아래쪽에 쓴 기호 i는 간략화를 위해 도면에서 삭제되었다). 다음, 최고 상관 관계항(Cb)은 이미 계산된 상관 관계(Co)와 같게 설정되고, 최고 에너지항(Gb)은 이미 계산된 상관 관계(Go)와 같게 설정된다. 이 코드워드(I)는, 특정 입력 음성 프레임 S(n)에 대해 최고 여기 벡터 Ui(n)에 대한 코드워드를 나타내고, 0과 같게 설정된다. 카운터 가변(K)은 제로로 초기화된 후에, 단계(626)에서 증가하게 된다.

제6b도에 있어서, 카운터(K)는 기본 벡터의 2^M조합이 시험되는가를 알기 위해 단계(628)에서 시험된다. 카운터(K)의 최대값이 2^M-1이 되므로, 코드워드 및 그 보수는 상기 기술된 것처럼 동시에 계산된다. 카운터(K)가 2^M-1보다 적으면, 단계(630)에서 플립 기능으로 처리되는데, 파라미터(ℓ)는 코드워드(i)에서 플립으로 다음 비트의 위치를 나타낸다. 이 기능은 본 발명이 어떤 시간에서 한 비트만을 변화하는 코드 벡터를 통해 연속으로 그레이 코드를 이용하기 때문에 실행된다. 그러므로, 각각의 연속 코드워드는 단지 하나의 비트 위치에서 이전의 코드워드와 다르다고 가정할 수 있다. 다시 말하면, 계산된 각각의 연속 코드워드가, 이진 그레이 코드 방법을 이용하여 얻을 수 있는, 단지 하나의 비트에 의해 이전 코드워드와 다르게 되면, 단지 M가산 또는 감산 연산이 관계항 및 에너지항을 계산하기 위해 필요하다. 단계(630)는 코드워드에서 비트(ℓ)의 변화를 교변(reflect)시키기 위해 Qe 내지 -Qe을 설정한다.

상기 그레이 코드를 이용하면, 새로운 상관 관계항(C_K)은 다음 방정식(28)에 따라 단계(632)에서 계산된다.

(C_K)=C_K-1+20θ₁R₁………………………………(28)

상기 방정식(28)은 Qe에 대해 -Q을 치환하여 방정식(22)로부터 유도된다.

다음, 단계(634)에서, 새로운 에너지항(G_R)은 다음 방정식(29)에 따라 계산 되는데,

여기서, D_jR는 j≤R인 값으로만 기억되는데 대칭 매트릭스로서 기억된다. 이 방정식(29)은 동일한 방식으로 방정식(26)에서 유도된다.

G_R및 C_R가 계산되면, [C_R]²/GR는 이전의 최고 [Cb]²/Gb와 비교된다. 이 분할은 원래 천천히 이루어지므로, 상호 곱셈을 피하기 위해서 문제점 제공식화하는데 이용된다. 모든 항이 양수이므로, 이 방정식은, 단계(636)에서 실행된 것처럼, [cb]²×G_K와 [C_K]²×Gb를 비교하여 동일하게 된다. 제1양이 제2양보다 크게 되면, 제어 장치는 단계(638)로 진행시키는데, 여기서 최고 상관 관계항(Cb) 및 최고 에너지항(Gb)은 각각 갱신된다. 단계(642)는, 모든 m비트 ≤m≤M에 대해, Qm이 +1일때 1과 같은 코드워드(I)의 비트 m을 설정하고, Qm이 -1일때 1과 같은 코드워드(I)를 비트 m을 설정하므로 Qm파라미터로부터 여기 코드워드(I)를 계산한다. 그후, 제어장치는, 제1양이 제2양보다 크지 않을 때 즉시 실행되는 것처럼, 다음 코드워드를 시험하기 위해 단계(626)으로 복귀시킨다.

모든 쌍의 보수 코드워드가 시험되고, [cb]²/Gb양을 최소화시키는 코드워드를 알 수 있을때, 제어 장치는 상관 관계항(Cb)이 제로보다 작게 될때를 알기 위해 첵크하는 단계(646)으로 진행시킨다. 이것은 코드북이 한쌍의 보수 코드워드에 의해 검색되었다는 사실을 보상하기 위해 실행된다. Cb가 제로보다 작게 되면, 이득율(γ)은 단계(650)에서 -[Cb/Gb]와 같게 설정되고, 코드워드(I)는 단계(652)에서 보수된다. Cb가 음의 값이 되면, 이득율(γ)를 양의 값으로 만들기 위함이다.

다음, 최상의 코드워드(I)가 단계(654)에서 출력되고, 이들율(γ)은 단계(656)에서 출력된다. 그후, 단계(658)는 최상의 여기 코드워드를 이용하여 개조된 가중 음성 벡터 y'(n)를 계산하기 위해 진행시킨다. 코드북 발생기는 방정식(1)에 따라 여기 벡터 U₁(n)를 발생시키기 위해 기본 벡터 Vm(n) 및 코드워드를 이용한다. 그러면, 코드 벡터 U₁(n)는 이득 블럭(522)의 이득율(γ)에 의해 정규화되고, y'(n)을 발생시키기 위해 필터 스트링 #1에 의해 필터된다. 음성 코더(500)는 제1도에서 실행되었던 것처럼, 개조된 가중 음성벡터 y'(n)를 직접 이용하지 않는다. 대신에, 필터 스트링 #1은 다음 프레임에 대해 제로 입력 응답 벡터 d(n)를 계산하기 위해 필터 스트링 #2로 그들을 전송하므로서 필터 상태(FS)를 갱신하는데 이용된다. 따라서, 제어 장치는 다음 음성 프레임 S(n)을 입력시키기 위해 단계(602)로 복귀시킨다.

제6a도 및 제6b도에 기술된 검색 방법에 있어서, 코드워드(I)가 최적화되는 동시에 이득율(γ)을 계산한다. 이런 방법에서, 각각의 코드워드에 대한 최적 이득율을 알 수 있다. 제7a도 내지 제7c도에 설명된 양자의 검색방법에서, 이득율을 코드워드 결정전에 미리 계산된다. 여기서, 이득율을 프로임 잔류의 RMS 값을 전형적으로 기초로 하는데, 1984년 5월,, 비스.에스.아탤 및 엠.알.슈로에더의 국제협의회의 통신 회의록, VoL.ICC 84, Pt.2, 페이지(1610 내지 1613)의 매우 저 비트율에서 음성 신호의 확률 코딩을 참조한다. 이 참조문의 이미 계산되는 이득율 방법에서의 결점은 음성 코더에 대해 일반적으로 약간의 내부 신호-잡음율(SNR)이 나타난다는 점이다.

지금, 제7도의 흐름도를 참조하면, 이미 결정된 이득율을 이용하는 음성 코더(500)의 동작을 설명한다. 이 입력 음성 프레임 벡터 S(N)는 단계(702)에서 A/D변환기로부터 처음으로 얻어지고, 장기 예측자 파라미터(LTP), 단기 예측자 파라미터(STP) 및 가중 필터 파라미터(WTP)는 단계(602 및 604)에서 각각 실행된 것처럼, 단계(704)에서 계수 분석기(510)에 의해 계산된다. 그러나, 단계(705)에서, 이득율(γ)이 서두 참고문헌에 기술된 것처럼 전체 프레임에 대해 계산된다. 따라서, 계수 분석기(510)는 제5도의 점선으로 도시된 것처럼 이미 결정된 이득율(γ)을 출력하고, 이득 블럭(542)은 점선에 의해 도시된 것처럼 기본 벡터 경로에 삽입된다.

단계(706 내지 712)는 6a도의 단계(606 내지 612)와 각각 동일하므로, 별도로 설명이 필요 없을 것이다. 단계(714)는 제로 상태 응답 벡터 qm(n)이 블럭(542)에서 이득율(γ)에 의해 증배된 후에 기본 벡터 Vm(n)로부터 계산되는 것을 제외하고, 단계(614)와 유사하다. 단계(716 내지 722)는 단계(616 내지 622)와 각각 동일하다. 단계(723)는 상관 관계(Co)가 파라미터(I 및 Eb)를 어떻게 초기화시키는지 결정하기 위해 제로보다 적은지를 시험한다. 만약, Co가 제로보다 적으면, 최상의 코드워드(I)는, 코드워드 I=0보다 더 나은 에러 신호(Eb)를 제공하기 때문에, 보수 코드워드 I=2m-1와 동일하게 설정된다. 그후, 이 최상의 에러 신호(Eb)는, C₂M-1이 -CO와 같기 때문에 2Co+Go와 동일하게 설정된다. 만일, Co가 음의 값이 아니면, 단계(725)는 제로로 I를 초기화시키며, 도시된 것처럼, -2Co+Go로 Eb를 초기화시킨다.

단계(726)는 중간 데이타 신호(Qm)를 -1로, 카운터 파라미터(r)를 제로로 초기화시키기 위해 단계(624)에서 실행된 것처럼 계속 진행된다. 이 파라미터(R)는, 단계(626 및 628)에서 각각 실행되는 것처럼, 단계(727)에서 증가되고, 단계(728)에서 시험된다. 단계(730, 732 및 734)는 단계(630, 632 및 634)와 각각 동일하고, 그후, 상관 관계항(C_R)은 단계(735)에서 시험된다. 만약, C_R가 음의 값이 되면, 에러 신호(E_R)는, 음의 값 C_R가 현재 코드워드보다 더 나은 파라미터 코드워드와 유사하게 나타나기 때문에, 2C_R+G_R와 동일하게 설정된다. 만일, C_R가 양의 값이면, 이전에 실행된 것처럼, 단계(737)는 -2C_R+G_R와 동일하게 E_R를 설정한다.

제7도로 계속 진행되면, 단계(738)는 새로운 에러 신호(E_R)를 이전 최상의 에러 신호(Eb)와 비교한다. 만일, E_R가 Eb보다 작으면, Eb는 단계(739)에서 갱신된다. 만일 그렇지 않으면, 제어 장치는 단계(727)로 복귀한다. 단계(740)는 다시 상관 관계(C_R)를 제로보다 작은가를 시험한다. 만일 크다면, 최상의 코드워드(I)는 제6b도의 단계(642)에서 실행된 것처럼, Qm으로부터 계산된다. 만일, C_R가 제로보다 작으면, I는 보수 코드워드를 얻기 위한 동일한 방식으로 -Qm으로부터 계산된다. 제어 장치는 I가 계산된 후에 단계(727)로 복귀시킨다.

모든 2^M코드워드가 시험되었을 때, 단계(728)는 직접, 코드워드(I)가 검색 제어기로부터 출력되는, 단계(754)로 제어한다. 단계(758)는 단계(658)에서 실행된 것처럼 개조된 가중 음성 벡터 y'(n)를 계산한다. 그후, 제어 장치는 단계(702)에서 흐름도의 시작으로 복귀시킨다.

종합하면, 본 발명은 이미 결정된 이득율과 함께 또는 없이 이용될 수 있는 검색 기법 및 개선된 여기 벡터발생을 제공한다. 2^M여기 벡터의 코드북은 한 셋트의 M기본 벡터로부터 발생된다. 전체의 코드북은 M+3곱셉산술 동작만을 이용하여 코드 벡터값으로 검색될 수 있다. 기억 장치 및 계산의 복잡성의 감소는 오늘날 디지탈 신호 처리기로 CELP음성 코딩의 실시간 실행으로 가능하다.

본 발명의 특정 실시예를 도시 및 설명하였지만, 다른 수정안 및 개선점은 보다 광대한 관점에서 본 발명에 벗어나지 않는 범위에서 구성될 수도 있다. 예를 들어, 기본 벡터의 어떤 형태가 본 명세서에 설명된 벡터합 기법으로 이용될 수 있다. 또한, 코드북 검색 절차의 계산적인 복잡성을 감소하는 동일한 목적을 얻기 위해 기본 벡터에 상이한 계산을 실행할 수 있다. 이러한 모든 수정안은 본 명세서의 설명 및 청구된 기본적 우선 원리를 그대로 이용하며, 본 발명의 범위내에 존재한다.

Claims

능률적인 기억 방식의 벡터 양자화기에 대해 일련의 Y코드북 벡터를 발생하는 방법에 있어서, 적어도 2개의 선택기 코드워드를 입력시키는 단계와, 상기 선택기 코드워드에 기초하여 다수의 중간 데이타신호(Qim)를 한정하는 단계(360)와, X＜Y인 범위에서, 일련의 X기본 벡터 Vm(n)를 입력시키는 단계(314)와, 상기 중간 데이타 신호(Qim)에 의해 확정되는 선형 변형을 상기 X기본 벡터(Vm(n))에 수행하여 상기 코드북 벡터를 발생하는 단계(361, 362, 363, 364, 365)를 포함하는 것을 특징으로 하는 코드북 벡터 발생 방법.
제1항에 있어서, 상기 각각의 선택기 코드워드는 비트로 나타낼 수 있고, 상기 중간 데이타 신호(θim)는 각각의 선택기 코드워드의 각각의 비트값에 기초한 것으로서, 상기 코드북 벡터 발생단계는, 다수의 중간 벡터를 발생시키기 위해 일련의 X기본 벡터(Vm(n))에 상기 다수의 중간 데이타 신호(θim)를 곱하는 단계(361, 362, 363, 364)와, 상기 코드북 벡터를 발생시키기 위해 상기 다수의 중간 벡터를 합하는 단계(365)를 추가로 포함하는 것을 특징으로 하는 코드북 벡터 발생 방법.
저비트 전송 속도에서, 고음질 음성을 유지하는 동안 고속 음성 분석 또는 합성에 사용하기 위해 코드북 여기 벡터를 발생하며, 상기 코드북이 1≤n≤N이고 0≤i≤2^M-1의 범위에서 N요소들을 각각 갖는 적어도 2^M여기 벡터 Ui(n)를 가지며, 상기 코드북 벡터는 1≤n≤N이고 1≤m≤M의 범위에서 N요소를 각각 갖는 일련의 M기본 벡터 Vm(n)로부터 발생되고 0≤i≤2^M-1 범위에서 M비트를 각각 갖는 일련의 2^M디지탈 코드워드 I₁로부터 발생되는 코드북 벡터 발생 장치에 있어서, 코드워드 I₁의 비트 m가 제1상태 일때 θim가 제2값을 갖도록, 각 코드워드 I₁의 각 비트에 대해 신호 θim를 식별하는 수단(360)과, 상기 코드북 여기 벡터 2^M을 다음식, Ui(n) θim Vm(n) (여기서, 1≤n≤N)에 의해 계산하는 수단(361, 362, 363, 364, 365)를 포함하는 것을 특징으로 하는 코드북 벡터 발생 방법.