[go: up one dir, main page]

KR960014427B1 - Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search - Google Patents

Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search Download PDF

Info

Publication number
KR960014427B1
KR960014427B1 KR1019930028674A KR930028674A KR960014427B1 KR 960014427 B1 KR960014427 B1 KR 960014427B1 KR 1019930028674 A KR1019930028674 A KR 1019930028674A KR 930028674 A KR930028674 A KR 930028674A KR 960014427 B1 KR960014427 B1 KR 960014427B1
Authority
KR
South Korea
Prior art keywords
pitch
correlation
vocoder
signal
pitch search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019930028674A
Other languages
Korean (ko)
Other versions
KR950022503A (en
Inventor
유하영
변경진
현진일
김종재
한기천
이훈복
배명진
Original Assignee
재단법인 한국전자통신연구소
양승택
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 한국전자통신연구소, 양승택 filed Critical 재단법인 한국전자통신연구소
Priority to KR1019930028674A priority Critical patent/KR960014427B1/en
Publication of KR950022503A publication Critical patent/KR950022503A/en
Application granted granted Critical
Publication of KR960014427B1 publication Critical patent/KR960014427B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

내용 없음.No content.

Description

보코더용 피치검색법에서 상관관계 대칭특성에 의한 처리시간 단축법Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search

제1도는 본 발명에 따른 하드웨어 구성이 나타난 블럭도.1 is a block diagram showing a hardware configuration according to the present invention.

제2도는 본 발명에 따른 소프트웨어처리 블럭도.2 is a software processing block diagram according to the present invention.

* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings

100 : 마이크로폰(Microphone) 101,110 : 증폭기(Amplifier)100: microphone 101,110: amplifier

102,109 : 저역통과필터(LPF)102,109: low pass filter (LPF)

103 : 아날로그 디지탈 변환기(ADC:Analog to Digital Converter)103: Analog to Digital Converter (ADC)

104 : 입력포트(Input Port) 105 : 메모리104: Input Port 105: Memory

106 : 마이크로 프로세서 107 : 출력포트(Output Port)106: microprocessor 107: output port

108 : 디지탈 아날로그 변환기(DAC:Digital to Analog Converter)108: Digital to Analog Converter (DAC)

111 : 스피커111: Speaker

본 발명은 CELP 보코더의 피치검색방법에 관한 것으로, 구체적으로 종래의 처리 블럭에 상관관계가 높은 봉우리의 대칭성을 측정하여 낮은 구간은 피치검색에서 제외시키는 상관관계 대칭특성을 이용한 CELP 보코더의 피치검색방법에 관한 것이다.The present invention relates to a pitch searching method of a CELP vocoder. Specifically, a pitch searching method of a CELP vocoder using a correlation symmetry characteristic in which low intervals are excluded from a pitch search by measuring symmetry of peaks having a high correlation to a conventional processing block It is about.

디지탈 방식의 휴대용 통신 기기에서는 전송 채널의 대역폭을 효율적으로 사용하고 또한 고음질을 얻기 위하여 여러 가지의 보코더 이론들을 이용하여 음성 부화화기를 실현하고 있다. 그러나 이러한 보코더 기법들은 많은 계산량을 필요로 하며, 특히 피치 검색 부분은 보코더 기법에서 필요로 하는 전체 계산량의 약 절반 가량을 차지한다. .In the digital portable communication device, the voice incubator is realized by using various vocoder theories to efficiently use the bandwidth of the transmission channel and to obtain high sound quality. However, these vocoder techniques require a large amount of computation, and especially the pitch search part takes about half of the total computation required by the vocoder technique. .

음성신호를 부호화하기 위한 보코더 기법은 크게 파형부호화법, 소스부호화법, 혼성부호화법으로 구분된다. 최근의 부호화 기술과 합성된 음질을 고려할 때 보코더용으로 가장 바람직한 기법이 혼성부호화법이다.Vocoder techniques for encoding speech signals are roughly classified into waveform encoding, source encoding, and hybrid encoding. Considering the current coding technique and synthesized sound quality, the most preferable technique for vocoder is hybrid coding.

혼성부호화법은 성도필터를 선형예측 분석법으로 모델링하고 남은 전류를 그대로 전송하는 부호법이며 RELP(Residual Excited Linear Prediction)법, VELP(Voice Excited Linear Prediction)법, CELP(Code Excited Linear Prediction)법 등이 있다.Hybrid coding is a coding method that models the vocal filter by linear predictive analysis method and transmits the remaining current as it is. have.

이들 부호화법중에서 사용 대역폭에 비해 가장 음질이 우수하다고 알려진 것은 CELP 보코더이다.Among these coding methods, the CELP vocoder is known to have the best sound quality compared to the bandwidth used.

CELP 보코더는 입력으로 얻어진 음성신호를 분석하여 필요한 파라미터를 추출하고 이를 이용하여 음성신호를 합성하여 입력 음성신호와 비교하는 합성에 의한 분석방법을 사용하므로써 낮은 전송율에서도 매우 우수한 음질을 합성해서 비교해야 하므로 매우 복잡한 구조를 갖고 그에 따른 방대한 계산량으로 인해 실시간 구현에 어려움이 많다.The CELP vocoder analyzes the speech signal obtained from the input, extracts the necessary parameters, and synthesizes the speech signal using the synthesis method to compare it with the input speech signal. The very complex structure and the enormous amount of computations make it difficult to implement in real time.

CELP 부호화기에서 가장 큰 계산량을 필요로 하는 부분은 코드북에서 입력 여기 신호를 찾아내는 과정과 피치필터의 계수를 구하는 과정이다. 이 중에서 본 발명과 관련되어 있는 부분인 피치분석은 음성신호의 자기 상관관계에 해당하는 피치주기에 관한 정보를 얻어내는 과정인데, CELP 부호화기의 전체 계산량의 50%이상을 차지하는 부분이므로 이 부분의 개선을 전체 부호화기에 많은 영향을 미치게 된다.The part that needs the largest amount of computation in the CELP encoder is the process of finding the input excitation signal in the codebook and the coefficient of the pitch filter. Among these, pitch analysis, which is a part of the present invention, is a process of obtaining information about a pitch period corresponding to autocorrelation of a speech signal, which is more than 50% of the total computation amount of the CELP encoder. This affects a lot of the overall encoder.

음성신호의 경우 피치분석 구간은 일정 크기 이상으로 늘어날 경우 음질이 급속도로 저하하므로 보통 5ms에서 10ms 사이로 결정하여 계산량을 최소화하고 음질을 저하시키지 않도록 한다.In the case of the voice signal, when the pitch analysis section increases more than a certain size, the sound quality deteriorates rapidly, so it is usually determined between 5 ms and 10 ms to minimize the calculation amount and not deteriorate the sound quality.

8kHz의 표본화된 음성신호의 경우 보통 피치필터의 파라미터인 피치지연(L)과 피치이득(b)를 구하는데 있어서 음질이 우수한 폐회로구조를 사용하게 되는데 폐회로 구조에서는 피치지연을 20에서 147까지의 값으로 제한한다.In case of sampled speech signal of 8kHz, closed loop structure with excellent sound quality is used to calculate pitch delay (L) and pitch gain (b), which are parameters of pitch filter. In the closed loop structure, pitch delay values of 20 to 147 are used. Restrict to

이 범위내의 제한된 128개의 지연값에 대해 피치이득을 구하고 이를 이용하여 스텍트럼 필터의 잔여신호에 대한 피치필터의 응답을 얻는다. 각각의 경우에 대한 잔여신호들의 평균제곱 오차값을 계산하여 최소값에 해당하는 b와 L값을 얻으면 최적의 피치필터가 결정된다.Pitch gain is obtained for the limited 128 delay values within this range and used to obtain the response of the pitch filter to the residual signal of the spectrum filter. The optimum pitch filter is determined by calculating the mean square error value of the residual signals for each case to obtain the b and L values corresponding to the minimum values.

즉 최적의 피치 지연값과 이들을 구하기 위해서는 128번의 페루프에 대한 계산을 항상 반복하게 되므로 하나의 피치파라미터값을 구하기 위한 계산량이 엄청나게 많아지므로 피치검색하는데 상당한 시간이 요구된다.That is, since the calculation for the 128 pitches is always repeated to find the optimal pitch delay values and these, a large amount of calculations are needed to find one pitch parameter value, which requires considerable time for pitch searching.

상기한 문제점을 해결하기 위하여 본 발명에서는 피치분석시 음성파형의 상관관계 특성상 양과 음의 봉우리가 반복되어 나타나는 것을 이용하여 음의 상관관계 봉우리 구간은 피치검색에서 제외시켜 처리시간을 단축시키는 피치검색방법을 제공하는데 그 목적이 있다.In order to solve the above problems, in the present invention, the pitch correlation method reduces the processing time by excluding the negative correlation peak interval from the pitch search by using the positive and negative peaks repeatedly appearing due to the correlation characteristics of the speech waveform during the pitch analysis. The purpose is to provide.

다음은 첨부한 도면을 참조하여 본 발명을 상세하게 설명한다.The following describes the present invention in detail with reference to the accompanying drawings.

제1도는 본 발명을 실시하기 위한 하드웨어의 구성예를 나타낸 도면이다. 마이크로폰(100)을 통해 음파가 전기신호로 변환되면 이를 증폭기(101)를 통해 증폭하여, 일정한 레벨로 높이게 된다.1 is a diagram showing a configuration example of hardware for implementing the present invention. When the sound wave is converted into an electrical signal through the microphone 100, it is amplified by the amplifier 101 and raised to a constant level.

마이크로폰을 통해 입력된 신호의 성분은 음성신호인 경우에 20㎐∼20㎑ 범위에 주파수를 갖는 성분으로 구성된다. 이들 성분중 본 발명을 구현하기 위해서는 의사전달 정보 성분만 포함하면 되기 때문에 저역통과 필터(LPF)를 통해 의사전달 정보성분 주파수의 범위인 4㎑이상 주파수 성분은 제거한다.The component of the signal input through the microphone is composed of a component having a frequency in the range of 20 Hz to 20 Hz in the case of an audio signal. In order to implement the present invention among these components, only the communication information component needs to be included, and thus, a low pass filter (LPF) removes a frequency component of 4 kHz or more which is a range of the frequency of the communication information component.

상기한 바와 같이 특정 주파수 이상의 성분을 제거하는 이유는 이 음성신호를 디지탈로 변환하였을 때 1초당 처리할 데이타 수를 줄이기 위해서이다. 4㎑이하의 신호 성분만 남기고 저역 필터링시킨 아날로그 신호에 대해 컴퓨터로 이를 처리하기 위해서 디지탈 신호로 변화하여야 하는데, 이것은 아날로그를 디지탈로 변환하는 변환기(103)(Analog to Digital Converter)에 의해 표본화한다.As described above, the reason for removing the component above a certain frequency is to reduce the number of data to be processed per second when the voice signal is converted to digital. The low frequency filtered analog signal, leaving only 4 GHz or less of signal components, must be converted into a digital signal for processing by a computer, which is sampled by an analog to digital converter (103).

디지탈 신호로 표본화시키는 표본화율은 나이퀴스트(Nyquist)의 표본화 이론에 따라 신호 최대 주파수(본 발명에서는 4㎑)의 두배인 8㎑로 한다. 또한 한 표본당 전압레벨을 양자화(Quantization)해야 하므로 전화음질을 기준으로 하기 위해 12비트(212=4096)레벨을 사용하였다. 이렇게 처리된 디지탈 음성신호는 마이크로The sampling rate sampled by the digital signal is 8 kHz, which is twice the signal maximum frequency (4 kHz in the present invention) according to Nyquist's sampling theory. In addition, since the voltage level per sample needs to be quantized, a 12-bit (212 = 4096) level was used to refer to the phone sound quality. The digital voice signal processed in this way is a micro

입력된 음성신호 데이타는 소프트웨어 처리과정을 통해 처리한 다음에 필요에 따라서 메모리(105)에 저장시키거나 또는 전송채널(121)에 전송하기 위해 입력/출력포트(120)에 출력한다. 그리고 필요시에는 메모리(105)에서 읽어낸 데이타나, 전송채널(121)을 통해 입력된 데이타를 사용하여 복호화 과정을 통해 음성신호를 합성한다.The input voice signal data is processed through a software process and then output to the input / output port 120 for storage in the memory 105 or for transmission to the transmission channel 121 as necessary. If necessary, a voice signal is synthesized through a decoding process using data read from the memory 105 or data input through the transmission channel 121.

이처럼 마이크로프로세서에 의해 복호화 처리가 완료된 합성음성신호는 잘 처리되었는지를 스피커(110)를 통해 들어보기 위해 츨력포트(107)에 전달된다. 출력포트에 데이타가 전달되면 상기 데이타는 디지탈을 아날로그로 변환하는 변환기(108)(Digital to Analog Converter)에 전달된다. 이 경우에도 표본화율 8㎑단위로 아날로그 값으로 변환하게 된다.The synthesized speech signal, which has been decoded by the microprocessor, is transmitted to the output port 107 in order to hear through the speaker 110 whether or not it is well processed. When data is delivered to an output port, the data is transferred to a digital to analog converter 108. In this case, too, the sampling rate is converted into analog values in 8㎑ units.

변환된 신호는 아직 표본율의 고조파가 포함된 개별신호로 나타나기 때문에 저역통과 필터(109)에 통과히켜 기본대역의 신호만 남도록 처리한다. 이렇게 처리된 신호를 스피커를 구동할 수 있도록 증폭기(110)에서 증폭하여 스피커(110)에 공급하게 된다.Since the converted signal appears as an individual signal containing harmonics of sample rate, it passes through the low pass filter 109 to process only the signal of the baseband. The signal thus processed is amplified by the amplifier 110 to drive the speaker and is supplied to the speaker 110.

상기한 바에 의해 처리된 신호를 스피커가 음압파로 변환하여 주기 때문에 인간의 귀를 통해 청취하게 된다.Since the speaker converts the signal processed as described above into a sound pressure wave, it is heard through the human ear.

제2도는 피치검색의 구현을 위한 블럭도를 나타낸 것으로 소프트웨어로 알고리듬을 구현한 것이다.Figure 2 shows a block diagram for the implementation of the pitch search, which implements the algorithm in software.

제2도에 표시된 바와 같이 전체 피치검색 부분에서 점선으로 표시된 부분(A)이 본 발명에서 개선한 부분이다. 종래의 방법에서는 점선의 부분을 제외한 나머지 블록으로써 L 값을 20에서 147까지 1씩 증가시키면서 128번의 페루프에 대한 계산을 하여 오차가 제일 적은 값을 피치지연 L로 정하였다.As shown in FIG. 2, the portion A indicated by a dotted line in the entire pitch search portion is an improvement in the present invention. In the conventional method, as the remaining blocks except for the dotted line, the L value is increased from 20 to 147 by 1, and the calculation for the 128 times of the bumps is made as the pitch delay L.

그러나 개선된 본 발명의 방법에서는 점선(A) 내부의 기능을 추가로 삽입하여 자기 상관관계가 큰 구간은 검출하고 나머지 구간은 0으로 대치하므로써 페루프 계산시 생략구간은 피치 지연값에서 제외시키는 방법을 적용하였다.However, in the improved method of the present invention, by inserting a function inside the dotted line A, a section having a large autocorrelation is detected and the remaining section is replaced with 0, thereby eliminating the skipped section from the pitch delay value. Was applied.

제2도에서 표시된 페루프중L=L+Ks 부분은 종래의 방법에서는 L=L+1이었으므로 총 128번의 페루프를 수행하였으나 개선된 방법에서는 생략구산을 제외하고 페루프를 수행한다. 피치검색시 음성신호s(.)에 대해 시간지연에 따른 상관관계치 E(.)를 다음과 같이 표시한 식에 의해 계산하고 (1)로 표기한다.The L = L + Ks portion of the Peruvian shown in FIG. 2 was L = L + 1 in the conventional method. Therefore, a total of 128 rounds of Peruvian were performed. Calculate the correlation value E (.) According to time delay with respect to the speech signal s (.) In the pitch search by the equation expressed as follows and denote as (1).

...................................................(1) ........................................ .(One)

상기 식(1)에서 M은 부프레임의 길이고, L피치지연을 나타낸다. 이때 상관관계치는 피치주기마다 100%에 근접한 값이 얻어지며, 유사한 정도가 어느 정도인지는 피치검색 구간내에 있는 파형의 주기성과 파형 진폭의 변화에 따라 다르다. 그러나 피치의 주기성이 강한 유성음일 경우에는 보통 70% 이상이 얻어지며, 상관관계값은 시간지연에 대해 그 변화가 느리게 나타난다.In Equation (1), M is the length of the subframe, and L pitch delay. At this time, the correlation value is obtained close to 100% for each pitch period, and the degree of similarity depends on the periodicity of the waveform within the pitch search period and the change of the waveform amplitude. However, when the pitch periodicity is a strong voiced sound, more than 70% is usually obtained, and the correlation value shows a slow change with time delay.

상기 식(1)을 통해 얻어진 음성파형의 상관관계를 살펴보면 그 파형은 다음과 같은 특징이 있다.Looking at the correlation of the speech waveform obtained through Equation (1), the waveform has the following characteristics.

첫째, 느린 변화에 있어서는 음성파형에서 인근 표본간의 상관관계가 높기 때문에 이러한 상관관계를 나타내는 상관관계 파형봉우리도 느리게 변화된다.First, in the case of slow changes, the correlation waveforms representing these correlations also change slowly because of the high correlation between adjacent samples in the speech waveform.

둘째, 봉우리 폭에 있어서는 유성음의 파형에서 제1포만트의 에너지가 가장 크기 때문에 한 피치 주기내의 파형변화는 제1포만트의 구조로 감쇄진동을 하게 된다. 이에 대한 자기 상관관계 파형도 제1포만트의 주기를 그대로 유지하는 파형이 구성된다. 따라서 상관관계 파형은 피치주기 사이에서 일정한 폭을 이루게 된다.Second, in the peak width, since the energy of the first formant is the largest in the waveform of the voiced sound, the waveform change in one pitch period is attenuated and vibrated to the structure of the first formant. The autocorrelation waveform for this also constitutes a waveform which maintains the period of the first formant as it is. Thus, the correlation waveforms have a constant width between pitch periods.

셋째, 음의 봉우리에 있어서 음성파형은 양과 음의 봉우리가 교대로 반복하여 한 피치주기를 이루고 있다. 양의 파형 봉우리를 기준으로 하여 상관관계를 구하면 양의 파형봉우리마다 양의 값이 얻어지며, 음의 파형을 기준으로 하면 응의 파형봉우리마다 양의 값이 얻어지게 된다.Third, in the negative peaks, the speech waveform forms a pitch period in which positive and negative peaks alternately repeat. If a correlation is obtained based on positive waveform peaks, a positive value is obtained for each positive waveform peak, and a positive value is obtained for each positive waveform peak based on a negative waveform reference.

따라서, 상관관계 파형도 시간지연에 따라 음과 양의 봉우리가 반복적으로 나타나는 구조를 이루게 된다. 피치검색과정에서 최대의 상관값이 얻어지는 피치지연(L)을 피치주기로 고려하기 때문에 피치검색에 적용되는 상관관계값은 양의 봉우리를 이루는 경우만을 필요로 한다.Therefore, the correlation waveform also has a structure in which negative and positive peaks repeatedly appear with time delay. Since the pitch delay L, which obtains the maximum correlation value in the pitch search process, is considered as the pitch period, the correlation value applied to the pitch search needs only a positive peak.

또한 상관관계의 특성상 양의 봉우리가 반복되어 나타난다. 이러한 사실은 피치지연(L)에 따라 양의 봉우리가 나타나면 그 봉우리가 끝나는 부분에서부터 양의 봉우리폭 만큼은 음의 봉우리가 존재하는 구간이기 때문에, 이 구간은 상관관계값을 계산할 필요가 없어진다.Also, due to the nature of the correlation, positive peaks appear repeatedly. This fact is that if a positive peak appears according to the pitch delay (L), since there is a negative peak as much as the positive peak width from the end of the peak, the interval does not need to calculate a correlation value.

따라서 본 발명에서는 이러한 성질을 이용하여 불필요한 피치검색시간을 줄이게 된다. 즉 상관관계 양의 봉우리로부터 추정된 음의 봉우리 구간은 피치검색시 페루프의 계산수행이 생략된다. 즉 제2도에서 Ks값이 되는 것이다.Therefore, in the present invention, this property is used to reduce unnecessary pitch search time. That is, in the negative peak interval estimated from the correlated positive peaks, the calculation of the Peruf is omitted during the pitch search. That is, the value of Ks in FIG.

이상에서 설명한 바와 같이, 본 발명에서는 피치검색 방법을 개선하여 음성파형의 자기 상관관계가 높은 구간만을 피치검색에 적용하면 CELP 보코더의 실현시에 음질의 저하없이 보코더의 전체 처리과정의 20% 이상을 줄일 수 있다.As described above, in the present invention, when the pitch search method is improved and only a section having high autocorrelation of speech waveforms is applied to the pitch search, at least 20% of the entire processing of the vocoder can be achieved without deteriorating sound quality when the CELP vocoder is realized. Can be reduced.

따라서 처리속도가 낮은 저가 DSP(Digital Signal Processor)칩으로도 CELP 보코더를 실시간 구현할 수 있게 된다. 또한 피치검색시에 줄인 계산량 만큼의 처리과정을 다른 서비스기능을 위해 사용할 수 있으므로 경제적인 CELP 보코더시스템을 설계할 수 있게 된다.This enables real-time implementation of CELP vocoders with low-cost, low-cost digital signal processor (DSP) chips. In addition, the process can be used for other service functions as much as the amount of calculation reduced during pitch search, thus enabling the design of an economical CELP vocoder system.

그리고 보코더의 처리시간은 소비전력에 직접적인 영향을 주기 때문에 휴대용 보코더의 사용시간을 연장시킬 수 있게 되어, 상품의 대외 경쟁력을 높일 수 있는 효과가 있다.In addition, since the processing time of the vocoder directly affects the power consumption, it is possible to extend the use time of the portable vocoder, thereby increasing the external competitiveness of the product.

Claims (3)

보코더에 의해 음성신호를 부호화하는 과정에서 상기 음성신호의 피치를 검색하는 방법에 있어서, 상기 음성신호의 잔여신호로부터 합성된 음성 합성신호의 피치지연값 중에서 자기 상관관계가 높은 상관관계 양의 구간을 검출하여 피치검색 구간으로 선정한 후 자기 상관관계의 대칭특성을 이용하여 나머지 상관관계 음의 구간을 피치검색 구간에서 제외시키는 것을 특징으로 하는 보코더용 피치검색법에서 상관관계 대칭특성에 의한 처리 시간 단축법.In the method of retrieving the pitch of the speech signal in the process of encoding the speech signal by a vocoder, the interval of the positive amount of correlation high autocorrelation among the pitch delay value of the speech synthesis signal synthesized from the residual signal of the speech signal In the pitch search method for vocoder, it is possible to reduce the processing time by the correlation symmetry characteristic, which is characterized by excluding the remaining negative correlation intervals from the pitch search interval using the symmetry characteristic of autocorrelation after detecting and selecting the pitch search interval. . 제1항에 있어서,상기 상관관계 양의 구간의 검출은The method of claim 1, wherein the detection of the correlation amount interval is (단, L은 피치지연, M은 부프레임의 길이, s는 음성신호를 나타냄)에 의해 검출되는 것을 특징으로 하는 보코더용 피치검색법에서 상관관계 대칭특성에 의한 처리시간 단축법.(However, L is the pitch delay, M is the length of the sub-frame, s is the voice signal), the processing time reduction method by the correlation symmetry characteristic in the pitch search method for vocoder. 제1항 또는 제2항에 있어서, 상기 식을 통해 얻어진 시간지연에 따라 음과 양의 봉우리가 반복적으로 나타나는 자기 상관관계 대칭특성을 이용한 것을 특징으로 하는 보코더용 피치검색법에서 상관관계 대칭특성에 의한 처리시간 단축법.The method of claim 1 or 2, wherein the correlation correlation symmetry characteristic is used in the pitch search method for vocoder, characterized in that it uses autocorrelation symmetry characteristics in which negative and positive peaks appear repeatedly according to the time delay obtained through the above equation. Reduction of processing time by
KR1019930028674A 1993-12-20 1993-12-20 Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search Expired - Fee Related KR960014427B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019930028674A KR960014427B1 (en) 1993-12-20 1993-12-20 Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019930028674A KR960014427B1 (en) 1993-12-20 1993-12-20 Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search

Publications (2)

Publication Number Publication Date
KR950022503A KR950022503A (en) 1995-07-28
KR960014427B1 true KR960014427B1 (en) 1996-10-15

Family

ID=19371817

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930028674A Expired - Fee Related KR960014427B1 (en) 1993-12-20 1993-12-20 Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search

Country Status (1)

Country Link
KR (1) KR960014427B1 (en)

Also Published As

Publication number Publication date
KR950022503A (en) 1995-07-28

Similar Documents

Publication Publication Date Title
KR100427753B1 (en) Method and apparatus for reproducing voice signal, method and apparatus for voice decoding, method and apparatus for voice synthesis and portable wireless terminal apparatus
EP1141947B1 (en) Variable rate speech coding
JP4005359B2 (en) Speech coding and speech decoding apparatus
EP0718822A2 (en) A low rate multi-mode CELP CODEC that uses backward prediction
KR100452955B1 (en) Voice encoding method, voice decoding method, voice encoding device, voice decoding device, telephone device, pitch conversion method and medium
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
JP2778567B2 (en) Signal encoding apparatus and method
KR20070001276A (en) Signal encoding
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH05346797A (en) Voiced sound discriminating method
JPH08179796A (en) Voice coding method
JPH10149199A (en) Voice encoding method, voice decoding method, voice encoder, voice decoder, telephon system, pitch converting method and medium
JP2903533B2 (en) Audio coding method
JP3700890B2 (en) Signal identification device and signal identification method
KR0155315B1 (en) Pitch Search Method of CELP Vocoder Using LSP
JP2779325B2 (en) Pitch search time reduction method using pre-processing correlation equation in vocoder
KR960014427B1 (en) Reduction of Processing Time by Correlation Symmetry in Vocoder Pitch Search
JP3185748B2 (en) Signal encoding device
JP3916934B2 (en) Acoustic parameter encoding, decoding method, apparatus and program, acoustic signal encoding, decoding method, apparatus and program, acoustic signal transmitting apparatus, acoustic signal receiving apparatus
KR100205060B1 (en) Pitch detection method of celp vocoder using normal pulse excitation method
KR0138878B1 (en) Reduction of pitch search processing time for vocoder
KR100263298B1 (en) Pitch search method with correlation characteristic of quantization error in vocoder
KR0138879B1 (en) Method for reducing the pitch detection time of vocoder
JP3468862B2 (en) Audio coding device
JPH0235994B2 (en)

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

G160 Decision to publish patent application
PG1605 Publication of application before grant of patent

St.27 status event code: A-2-2-Q10-Q13-nap-PG1605

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 12

FPAY Annual fee payment

Payment date: 20081001

Year of fee payment: 13

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 13

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20091016

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20091016

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000