[go: up one dir, main page]

KR100221186B1 - Voice coding and decoding device and method thereof - Google Patents

Voice coding and decoding device and method thereof Download PDF

Info

Publication number
KR100221186B1
KR100221186B1 KR1019960055635A KR19960055635A KR100221186B1 KR 100221186 B1 KR100221186 B1 KR 100221186B1 KR 1019960055635 A KR1019960055635 A KR 1019960055635A KR 19960055635 A KR19960055635 A KR 19960055635A KR 100221186 B1 KR100221186 B1 KR 100221186B1
Authority
KR
South Korea
Prior art keywords
signal
speech
encoding
decoding
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019960055635A
Other languages
Korean (ko)
Other versions
KR19980036962A (en
Inventor
배성근
Original Assignee
김영환
현대전자산업주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영환, 현대전자산업주식회사 filed Critical 김영환
Priority to KR1019960055635A priority Critical patent/KR100221186B1/en
Publication of KR19980036962A publication Critical patent/KR19980036962A/en
Application granted granted Critical
Publication of KR100221186B1 publication Critical patent/KR100221186B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

[목적][purpose]

본 발명은 디지털 통신 시스템의 음성신호 처리에 있어서, 선형 스므딩 필터에 의해 입력 음성신호의 대역을 분리하고, 분리된 대역에 따라 각각 델타변조 및 런-랭스(Run-Length) 부호화와 가우시안 랜덤 신호를 이용하여 음성신호를 부호화 및 복호화함으로써 전송 데이터 양을 줄이고 압축율을 높일 수 있음은 물론 빠른 데이터 처리시간을 제공할 수 있는 음성 부호화 및 복호화 장치와 음성 부호화 및 복호화 방법에 관한 것이다.In the speech signal processing of a digital communication system, a band of an input speech signal is separated by a linear smoothing filter, and a delta modulation and a run-length encoding and a Gaussian random signal To a speech encoding and decoding apparatus and a speech encoding and decoding method capable of reducing the amount of transmission data and increasing the compression rate as well as providing a fast data processing time by encoding and decoding a speech signal.

[구성][Configuration]

본 발명의 음성 부호화는, 선형 스므딩 필터를 이용하여 입력 음성신호의 대역을 분리하고 샘플 간의 상관관계를 높인 후 델타변조와 런-랭스 부호화에 의해 양자화 및 양자화 개수로 부호화하고, 오차신호에 대해서는 그 진폭레벨로 부호화하며, 양자화 값, 양자화 개수 및 진폭레벨을 다중화하여 전송하도록 하고, 본 발명의 음성 복호화는, 음성 부호화 장치로부터 전송되는 양자화 값과 개수를 런-랭스 복호화에 의해 원래의 선형 스므딩 필터를 통과한 음성신호로 복호화하고, 진폭레벨을 이용하여 원래의 오차신호를 복호화하여, 선형 스므딩 필터를 통과한 음성신호와 오차신호를 합하여 원래의 음성신호를 복원하도록 한다.In the speech coding of the present invention, a band of an input speech signal is separated using a linear smoothing filter, the correlation between samples is increased, and then the speech signal is quantized and quantized by delta modulation and run-length coding. The quantization value, the quantization number and the amplitude level are multiplexed and transmitted. In the speech decoding of the present invention, the quantization value and the number transmitted from the speech encoding apparatus are subjected to run-length decoding to obtain the original linearity And decodes the original error signal using the amplitude level, and restores the original speech signal by summing the error signal and the voice signal passed through the linear smoothing filter.

Description

음성 부호화 및 복호화 장치와 그 방법Speech coding and decoding apparatus and method thereof

제1도는 종래의 델타변조 과정을 보인 도면.Figure 1 shows a conventional delta modulation process.

제2도는 본 발명에 의한 델타변조 과정을 보인 도면.FIG. 2 is a diagram showing a delta modulation process according to the present invention. FIG.

제3도는 본 발명에 의한 음성 부호화 장치의 블록 구성도.FIG. 3 is a block diagram of a speech coding apparatus according to the present invention; FIG.

제4도는 본 발명에 의한 음성 복호화 장치의 블록 구성도.FIG. 4 is a block diagram of a speech decoding apparatus according to the present invention; FIG.

제5도는 본 발명에 의한 음성 부호화 흐름도.FIG. 5 is a flowchart of speech coding according to the present invention. FIG.

제6도는 본 발명에 의한 음성 복호화 흐름도.6 is a flowchart of speech decoding according to the present invention;

* 도면의 주요부분에 대한 부호의 설명DESCRIPTION OF THE REFERENCE NUMERALS

1 : 저역여파필터 2 : 감산기1: low-pass filter 2: subtractor

3 : 델타변조부 4 : 런-랭스 부호화부3: delta modulation unit 4: run-length encoding unit

5 : 진폭레벨 검출부 6 : 다중화부5: amplitude level detector 6: multiplexer

11 : 역다중화부 12 : 런-랭스 복호화부11: demultiplexing unit 12: run-length decoding unit

13 : 델타복조부 14 : 백색잡음 발생기13: delta demodulation unit 14: white noise generator

15 : 곱셈기 16 : 가산기15: multiplier 16: adder

본 발명은 디지털 통신 시스템의 음성신호 처리에 있어서, 선형 스므딩(Smoothing) 필터에 의해 입력 음성신호의 대역을 분리하고, 분리된 대역에 따라 각각 델타변조 및 런-랭스(Run-Length) 부호화와 가우시안 랜덤(Gaussian Random)신호를 이용하여 음성신호를 부호화 및 복호화함으로써 전송 데이터 양을 줄이고 압축율을 높일 수 있음은 물론 빠른 데이터 처리시간을 제공할 수 있는 음성 부호화 및 복호화 장치와 음성 부호화 및 복호화 방법에 관한 것이다.In the speech signal processing of the digital communication system, a band of an input speech signal is separated by a linear smoothing filter, and a delta modulation and a run-length encoding A speech encoding and decoding apparatus and a speech encoding and decoding method capable of reducing the amount of transmission data and increasing the compression rate as well as providing a fast data processing time by encoding and decoding a speech signal using a Gaussian random signal .

일반적으로 급속히 변화하는 산업사회에서 쏟아지는 많은 정보들은 영상이나 음성을 통해서 전달되게 되며, 특히 상기 음성을 사용한 정보 전달 방법은 통신 수단이나 대화 수단으로서 가장 오랫동안 사용되어 온 통신 방법이다.In general, a lot of information poured in a rapidly changing industrial society is transmitted through video or voice, and in particular, the information transmission method using the voice is the communication method that has been used for the longest time as a communication means or a communication means.

최근들어 디지털 통신방식의 장점이 부각되면서 통신의 대전환이 이루어지며, 음성신호를 디지털화하여 통신함으로써 많은 음성 부호화(speech coder) 및 복호화(speech decoder)기술이 대두되어 오고 있다.2. Description of the Related Art [0002] In recent years, the advantages of a digital communication method have been highlighted, and a large amount of communication has been established. Speech coders and speech decoders have been developed by digitizing and communicating voice signals.

이러한 음성 부호화 및 복호화 기술은 무엇보다 전송에 필요한 데이터가 적으면서 고음질을 유지할 수 있고, 실시간에 적합하면서 구조가 간단한 장치 및 기술들을 필요로 한다.Such a speech encoding and decoding technique requires a simple structure and a simple technology that can maintain high sound quality while requiring less data to be transmitted and suitable for real time.

종래의 음성을 부호화하고 저장하는 방법으로는 음성신호에 존재하는 반복적이고 불필요한 잉여성분을 제거한 후에 저장 및 부호화하는 파형 부호화법(waveform coding method)과 음성 생성과정(speech production model)에 근거한 각 신호원(source)을 필터로 간주하여 여기원(excitation source)의 여기필터와 성도성분(vocal tract)의 여파기 필터로서 부호화하는 신호원 부호화법(source coding method) 및 상기 파형 부호화법과 신호원 부호화법 각각의 장점을 취하여 사용하는 혼성 부호화법(hybrid coding method)이 있다.Conventional methods for encoding and storing speech include a waveform coding method for storing and encoding after eliminating repetitive and unnecessary redundant components existing in a speech signal, and a method for decoding each speech signal based on a speech production model a source coding method for coding an excitation source as a filter of a excitation source and a filter element of a vocal tract by considering the source as a filter and the source coding method for the waveform coding method and the signal source coding method There is a hybrid coding method that takes advantage of this.

상기 파형 부호화법은 시간영역에서 잉여성분만을 제거하여 부호화하므로 음질의 자연성(naturality) 및 명료성(intelligibility)이 매우 높으나, 전송에 필요로하는 데이터가 많아서 메모리에 효율적이지 못하다는 단점을 가지고 있으며, 이런 부호화 방법으로는 PCM(pulse code modulation), DM(delta modulation), ADM(adaptive modulation), DPCM(differential pulse code modulation)등이 있다.The waveform coding method has a disadvantage in that the naturality and intelligibility of the sound quality are very high because only the surplus components are removed in the time domain and thus the sound quality is very high. However, Examples of the encoding method include pulse code modulation (PCM), delta modulation (DM), adaptive modulation (ADM), and differential pulse code modulation (DPCM).

그리고, 음성 생성과정에 근거하여 음성은 음원과 성도필터에 의해 생성되고, 이를 선형 모델링하여 부호화하는 신호원 부호화법은 시간 영역에서 주파수영역으로 변환하여 여기성분(excitation)과 포만트성분(formant)을 분리하여 처리하며, 이런 부호화 방법으로는 LPC(linear predictive coding), LSP(linear spectrum pair), PARCOR 등으로, 특징 파라미터만을 전송함에 따라 전송 메모리 사용이 효율적이라는 장점이 있다.In addition, the speech source is generated by the sound source and the syllable filter based on the speech generation process, and the signal source coding method for linearly modeling the speech is transformed from the time domain to the frequency domain to generate excitation and formant, As such a coding method, there is an advantage that transmission memory is efficiently used by transmitting only the characteristic parameters using LPC (linear predictive coding), LSP (linear spectrum pair), PARCOR, or the like.

그러나, 음의 전이, 음의 시작, 유/무성음의 반복시에는 특징 파라미터만으로는 모델링을 할 수 없기 때문에 음질의 열화가 발생하고, 특히 비음이나 마찰음을 모델링하는 데는 전극형모델(all-pole model)에서 극-영형모델(zero-pole model)이 요구되어 음의 자연성과 명료성이 떨어지는 단점이 있다.However, in the case of negative transition, beginning of sound, and repetition of unvoiced / unvoiced sound, deterioration of sound quality occurs because modeling can not be performed by only the characteristic parameter. Especially, all-pole model is used for modeling non- A zero-pole model is required, which is disadvantageous in that the naturalness and clarity of the sound are inferior.

또한, 상기 파형 보호화법의 장점인 고음질과 신호원 부호화법의 장점인 메모리 효율성을 취한 혼성 부호화법은 여기정보를 어떻게 부호화하는지에 따라 CELP(code excited linear Prediction), VSELP(vector sum linear prediction)등이 사용되며, 합성음의 오차를 줄이기 위해서 반복적인 분석에 의한 합성(synthesis by analysis)을 주로 사용한다.In addition, the hybrid coding method using memory efficiency, which is an advantage of the high-quality sound source and the signal source coding method, which are advantages of the waveform protection method, can be classified into CELP (Code Excited Linear Prediction), VSELP Is used. In order to reduce the error of the synthesized sound, synthesis by analysis is mainly used.

상기 혼성 부호화법은 낮은 비트율로서 고음질을 보장받기 위해서는 반복적인 계산과정과 비교과정이 필요하게 되고, 이로 인하여 계산량이 방대해짐은 물론 구조가 복잡해지고, 실시간에 적합한 알고리즘이 필요하게 되는 단점이 있다.In the hybrid encoding method, it is necessary to perform a repetitive calculation process and a comparison process in order to assure a high sound quality with a low bit rate. In addition, the hybrid encoding method has a disadvantage that a complexity is increased as well as a complexity and an algorithm suitable for real time is required.

상기와 같은 단점을 해결하고자 최근에는 음의 자연성과 명료성이 우수한 파형 부호화법인 델타변조(Delta modulation)를 사용하고 있는데, 이러한 델타변조는 펄스코드 변조(pulse code modulation)에 비해 높은 표본화 주파수와 1비트 양자화를 사용하여 과거 샘플에서 현재 샘플의 차를 1비트 양자화 값으로 추적해가는 부호화법으로 음향 및 음성신호 처리에 널리 사용하고 있다.In order to solve the above-mentioned disadvantages, recently, a delta modulation, which is a waveform encoding method with excellent naturalness and clarity, is used. Such a delta modulation has a higher sampling frequency and a higher bit rate than a pulse code modulation We use quantization to track the difference between the current sample and the previous sample as a 1-bit quantization value, which is widely used for sound and speech signal processing.

그러나, 상기 델타변조에 의한 부호화법은 제1도에 도시된 바와 같이 표본화 주파수가 높아짐에 따라 샘플의 진폭 변화가 심하여 샘플의 추적이 어려울 뿐만 아니라, 부호화 비트의 변화가 매우 심하여 부호화에 필요로하는 데이터 량이 방대해지고, 특히 잡음이 혼합된 신호에 대해서는 보다 더 많은 데이터가 필요하게 되어 실시간적 데이터 처리가 어려워지게 됨은 물론 복호단에서의 복원과정 또한 복잡해지게 되는 문제점이 있었다.However, as shown in FIG. 1, as the sampling frequency increases, the delta modulation method has a problem that the amplitude of the sample changes significantly and the sample is difficult to track. Also, since the change of the encoding bit is very severe, The amount of data is enormous, and in particular, for signals mixed with noises, more data is required, so that real-time data processing becomes difficult and the restoration process at the decoding end becomes complicated.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 창안한 것으로서, 그 목적은 선형 스므딩 필터를 이용하여 입력 음성신호의 대역을 분리하고, 선형 스므딩 필터를 통해 상관관계가 높아진 신호는 델타변조와 런-랭스 부호화에 의해 양자화 값 및 개수로, 원래신호와 선형 스므딩 필터를 통과한 신호와의 오차신호는 그 진폭레벨로 각각 부호화하여 전송하고, 상기 전송되는 양자화 값 및 개수는 런-랭스 복호화와 델타복조에 의해 원래신호로, 상기 진폭레벨을 이용하여 원래의 오차신호로 각각 복호화함으로써, 전송 데이터 양을 감소시켜 데이터 압축율을 높일 수 있음은 물론 적은 데이터 양으로도 고음질을 유지할 수 있으며, 실시간적 데이터 처리가 가능한 음성 부호화 및 복호화 장치와 음성 부호화 및 복호화 방법을 제공하는 데에 있다.SUMMARY OF THE INVENTION Accordingly, the present invention has been made in view of the above problems, and it is an object of the present invention to provide a method and an apparatus for separating a band of an input speech signal using a linear smoothing filter and a signal having a high correlation through a linear smoothing filter, And the error signal between the original signal and the signal that has passed through the linear smoothing filter is encoded by the amplitude level and transmitted by the quantization value and the number by the run-length encoding, and the transmitted quantization value and the number are transmitted to the run- By decoding the original signal using the amplitude level and the original error signal by decoding and delta demod, respectively, it is possible to increase the data compression rate by reducing the amount of data to be transmitted and, of course, And to provide a speech encoding and decoding apparatus and speech encoding and decoding method capable of real-time data processing.

이러한 목적을 달성하기 위한 본 발명의 음성 부호화 장치는, 입력 음성신호를 선형 스므딩 필터를 이용하여 대역분리한 후, 이 선형 스므딩 필터를 통과한 신호에 대해서는 샘플과 샘플 간의 상관관계를 높인 다음 1비트 양자화 값으로 델타변조하고 이어 런-랭스 부호화에 의해 양자화 값 및 양자화 개수로 부호화하고, 원래의 음성신호와 선형 스므딩 필터를 통과한 신호와의 오차신호에 대해서는 가우시안 랜덤 신호로서 그 진폭레벨을 부호화한 후, 상기 양자화 값, 양자화 개수 및 진폭레벨을 다중화하여 전송하도록 한다.In order to achieve the above object, the speech encoding apparatus of the present invention is a speech encoding apparatus for band-separating an input speech signal using a linear smoothing filter, enhancing a correlation between a sample and a sample for a signal passed through the linear smoothing filter 1-bit quantized value, and encoded by a quantization value and a quantization number by a subsequent run-length encoding. For the error signal between the original voice signal and the signal passed through the linear smoothing filter, the amplitude level of the Gaussian random signal The quantization value, the number of quantization levels, and the amplitude level are multiplexed and transmitted.

그리고 본 발명의 음성 복호화 장치는, 음성 부호화 장치로부터 전송되는 양자화 값과 개수를 런-랭스 복호화에 의해 1비트 양자화열을 구성하고 이어 델타복조에 의해 원래의 선형 스므딩 필터를 통과한 음성신호를 복호화하고, 상기 전송되는 진폭레벨을 이용하여 원래의 오차신호를 복호화한 후, 상기 선형 스므딩 필터를 통과한 음성신호와 오차신호를 합하여 원래의 음성신호를 복원하도록 한다.The speech decoding apparatus of the present invention constructs a 1-bit quantization sequence by run-length decoding the quantization value and the number transmitted from the speech coding apparatus, and then outputs the speech signal passed through the original linear smoothing filter by delta demodulation Decodes the original error signal using the transmitted amplitude level, and restores the original speech signal by summing the error signal and the voice signal that has passed through the linear smoothing filter.

이하, 첨부된 제2도 내지 제6도의 도면을 참조하여 본 발명의 음성 부호화 및 복호화 장치와 그 방법을 상세히 설명한다.Hereinafter, a speech encoding and decoding apparatus and a method thereof according to the present invention will be described in detail with reference to the accompanying drawings of FIGS. 2 to 6.

제2도는 본 발명에 의한 델타변조 과정을 보인 도면으로서, 본 발명의 델타변조는 과거 샘플과 현재 샘플의 차를 구하여 그 차가 양(+)이면 양자화 값을 '0'으로, 음(-)이면 '1'로 각각 부호화하여 비트열을 만들어 전송하며, 반대로 델타복조는 부호화된 양자화 값을 사용하여 '0'일때는 지연후 증가하고 '1'일때는 지연후 감소함으로써 원래신호를 재구성한다.FIG. 2 is a diagram illustrating a delta modulation process according to the present invention. In the delta modulation of the present invention, a difference between a past sample and a current sample is obtained. If the difference is positive, the quantization value is '0' And '1', respectively. In contrast, the delta demodulation uses an encoded quantization value to increase the delay time when the signal is '0', and to reduce the delay when the signal is '1', thereby reconstructing the original signal.

제3도는 본 발명에 의한 음성 부호화 장치의 블록 구성도로서, 표본화 주파수가 높고 양자화 비트가 낮은 음성신호를 통과시켜 샘플과 샘플 간의 상관관계를 높이도록 전처리 과정을 수행하는 선형 스므딩 필터인 저역여파필터(1)와, 이 저역여파필터(1)를 통과한 신호와 원래의 입력 음성신호를 감산하여 오차신호를 발생하는 감산기(2)와, 상기 저역여파필터(1)를 통과한 신호를 1비트 양자화 값으로 델타변조하는 델타변조부(3)와, 이 델타변조부(3)에서 변조된 신호의 양자화 값과 그 양자화 값의 개수를 세어 양자화 값과 양자화 개수로 부호화하는 런-랭스 부호화부(4)와, 상기 감산기(2)에서 발생한 오차신호의 진폭레벨을 검출하는 진폭레벨 검출부(5)와, 상기 런-랭스 부호화부(4)의 양자화 값과 양자화 개수, 상기 진폭레벨 검출부(5)에서 검출된 진폭레벨을 다중화하여 전송하는 다중화부(6)로 구성된다.FIG. 3 is a block diagram of a speech encoding apparatus according to the present invention. The speech encoding apparatus according to the present invention is a linear smoothing filter that performs a preprocessing process to increase a correlation between a sample and a sample by passing a speech signal having a high sampling frequency and a low quantization bit, A subtracter 2 for subtracting the original input speech signal from the signal that has passed through the low-order filter 1 and a subtractor 2 for subtracting the original input speech signal from the signal passed through the low- A run-length encoding unit 3 for delta-modulating the quantized value of the signal modulated by the delta modulation unit 3 by a delta modulating unit 3 for quantizing the quantized value, An amplitude level detector 5 for detecting an amplitude level of an error signal generated in the subtractor 2 and a quantization level detector 5 for detecting the quantization value and the quantization number of the run- ) ≪ / RTI > And a multiplexer 6 for multiplexing and transmitting bells.

본 발명에서는 선형 스므딩 필터인 저역여파필터(1)를 이용하여 입력 음성신호의 대역을 분리하고, 이 분리된 대역에 따라 각각 다른 부호화를 적용하게 되는데, 특히 저역여파필터(1)를 통과한 신호는 샘플 간의 상관관계가 높아져 델타변조에 의한 1비트 양자화 값으로도 추적이 용이해진다.In the present invention, the band of the input speech signal is separated using the low-pass filter 1, which is a linear smoothing filter, and different coding is applied according to the separated band. Particularly, The correlation between the samples becomes high, so that the 1-bit quantization value by the delta modulation facilitates tracking.

즉, 상기 방법은 높은 표본화 주파수로 표본화를 수행함에 따라 고주파의 변화를 별도로 추적하지 않기 때문에 샘플과 샘플의 추적이 용이할 뿐 아니라 부호화 비트의 변화를 감소시켜 높은 압축율을 갖게 된다.That is, since sampling is performed at a high sampling frequency, the method does not separately track changes of high frequency, so that it is easy to track samples and samples, and also has a high compression rate by reducing variation of coding bits.

그리고, 저역여파필터(1)를 통과한 신호와 원래신호와의 오차신호는 그 평균 진폭레벨을 조사하여 분석해 본 결과 상관관계가 낮고 진폭의 변화가 심한 랜덤 가우시안 특성을 갖고 있어, 본 발명에서는 오차신호의 진폭레벨을 가우시안 랜덤신호로 대치함에 따라 필요로하는 데이터 량이 감소되어 압축율이 높아지고 실시간 처리가 가능해지게 된다.The error signal between the signal having passed through the low-pass filter 1 and the original signal is analyzed by examining the average amplitude level. As a result, it has a random Gaussian characteristic with a low correlation and a large amplitude variation. By replacing the amplitude level of the signal with a Gaussian random signal, the amount of data required is reduced and the compression rate is increased and real-time processing becomes possible.

제4도는 본 발명에 의한 음성 복호화 장치의 블록 구성도로서, 음성 부호화 장치로부터 전송되는 데이터를 역다중화하는 역다중화부(11)와, 이 역다중화부(11)에서 출력된 양자화 값과 양자화 개수를 런-랭스 복호화하여 1비트 양자화 수열을 생성하는 런-랭스 복호화부(12)와, 이 런-랭스 복호화부(12)에서 생성된 1비트 양자화 수열을 델타복조하여 원래의 저역여파필터(1)를 통과한 신호를 복호화하는 델타복조부(13)와, 백색잡음을 발생하는 백색잡음 발생기(14)와, 상기 역다중화부(11)에서 출력된 진폭레벨과 상기 백색잡음 발생기(14)에서 발생된 백색잡음을 곱하여 원래의 오차신호를 복호화하는 곱셈기(15)와, 이 곱셈기(15)에서 출력된 오차신호와 상기 델타복조부(13)에서 출력되는 신호를 가산하여 원래의 음성신호를 출력하는 가산기(16)로 구성된다.FIG. 4 is a block diagram of a speech decoding apparatus according to the present invention, which includes a demultiplexing unit 11 for demultiplexing data transmitted from a speech encoding apparatus, a demultiplexing unit 11, A run-length decoding unit 12 for performing a run-length decoding on the 1-bit quantized sequence to generate a 1-bit quantized sequence, a delta-demodulator for deleting the 1-bit quantized sequence generated by the run- A white noise generator 14 for generating a white noise and a delta demodulator 13 for decoding the amplitude level output from the demultiplexer 11 and the white noise generator 14 from the white noise generator 14 A multiplier 15 for multiplying the generated error signal by the generated white noise, an error signal output from the multiplier 15 and a signal output from the delta demodulator 13 to output an original speech signal, And an adder 16 for adding an adder.

다음으로 상기와 같이 구성된 본 발명의 음성신호의 부호화와 복호화를 제5도와 제6도를 참조하여 설명하면, 먼저 음성신호의 부호화는 제5도의 흐름도에 간략히 도시된 바와 같이 표본화 주파수가 높고 양자화 레벨이 1비트인 입력 음성신호를 부호화하기 위해 입력 음성신호를 저역여파필터(1)에 통과시킨다(S1).Next, encoding and decoding of the speech signal according to the present invention will be described with reference to FIGS. 5 and 6. First, as shown in the flowchart of FIG. 5, the speech signal is encoded with a high sampling frequency and a quantization level In order to encode the 1-bit input voice signal, the input voice signal is passed through the low-pass filter 1 (S1).

즉, 상기 과정은 샘플과 샘플의 상관관계를 높이기 위한 선형 스므딩 필터과정으로 아래 식1을 이용하며,That is, the above process is a linear smoothing filter process for increasing the correlation between the sample and the sample,

여기서, S(.)는 입력 음성 디지털 신호이고, k는 지연인자이다.Where S (.) Is the input speech digital signal and k is the delay factor.

이어, 상기 단계(S1)에서 여파된 신호가 저역여파필터(1)를 통과한 신호와 원래 음성신호와의 오차신호인지를 판단하여(S2), 저역여파필터(1)를 통과한 신호라면 델타변조부(3)에 의해 델타변조한다(S3).Then, it is determined whether the signal filtered in the step S1 is an error signal between the signal passing through the low-pass filter 1 and the original voice signal. If the signal passed through the low-pass filter 1 is a delta And modulated by the modulation unit 3 (S3).

이때, 델타변조는 과거 샘플과 현재 샘플의 차를 구하여, 그 차이값이 양이면 '0'으로, 음이면 '1'로 각각 양자화 값을 부여함으로써 비트열을 구성하게 된다.At this time, the delta modulation obtains the difference between the past sample and the current sample, and assigns a quantization value to each of '0' if the difference is positive and '1' if it is negative to construct a bit string.

계속해서, 상기 단계(S3)의 델타변조 이후, 런-랭스 부호화부(4)에 의해 런-랭스 부호화를 수행하는데(S4), 이때에는 양자화 값을 최적화하기 위해 델타변조된 양자화 비트열에서 과거의 양자화 값과 현재의 양자화 값을 비교하여 양자화 값이 같다면 그 양자화 값의 개수를 세어 카운트하고, 다르다면 변한 양자화 값을 다시 비교하여 그 양자화 개수를 세어 각 각 카운트하게 된다.Subsequently, after the delta modulation in the step S3, the run-length encoding unit 4 performs run-length encoding (S4). At this time, in order to optimize the quantization value, The current quantization value is compared with the current quantization value, and if the quantization values are the same, the number of quantization values is counted, and if the quantization values are different, the changed quantization values are compared again, and the quantization number is counted.

예를 들어 델타변조된 양자화 값이 '111111000 0011111'이라면, 첫 번째 '1'의 양자화 값은 6개, 두 번째 '0'의 양자화 값은 5개, 그리고 세 번째 '1'의 양자화 값은 5개가 된다.For example, if the delta-modulated quantization value is '111111000 0011111', the quantization value of the first '1' is 6, the quantization value of the second '0' is 5, and the quantization value of the third '1' is 5 Dogs.

따라서, 상기와 같은 런-랭스 부호화에 의해 전송시에는 양자화 값과 그 양자화 개수를 전송하게 된다.Accordingly, the quantization value and the quantization number are transmitted at the time of transmission by the run-length encoding as described above.

한편, 상기 단계(S2)에서 상기 단계(S1)의 신호가 저역여파필터(1)를 통과한 신호와 원래 음성신호와의 오차신호라면, 진폭레벨 검출부(5)를 통하여 오차신호의 진폭레벨을 검출하여(S6) 가우시안 랜덤 신호로서 그 진폭레벨을 전송한다.On the other hand, if it is determined in step S2 that the signal of step S1 is an error signal between the signal passed through the low-pass filter 1 and the original speech signal, the amplitude level of the error signal is (S6) and transmits its amplitude level as a Gaussian random signal.

이때, 진폭레벨(M)은 아래 식 2와 식 3에 의해 얻게 된다.At this time, the amplitude level M is obtained by Equation 2 and Equation 3 below.

이어, 다중화부(6)를 통해 상기 양자화 값 및 양자화 개수, 진폭레벨이 다중화되어 전송되며(S6), 결국 입력 음성 디지털 신호는 상기 양자화 값과 양자화 개수 그리고 진폭레벨로 부호화되어 전송되게 된다.Then, the quantization value, the number of quantization and the amplitude level are multiplexed and transmitted through the multiplexing unit 6 (S6). As a result, the input speech digital signal is encoded and transmitted with the quantization value, the number of quantization, and the amplitude level.

다음은 제6도의 흐름도를 참조하여 본 발명의 음성신호의 복호화를 설명하면, 우선 음성 부호화 장치로부터 전송되는 데이터를 역다중화부(11)에 의해 양자화 값 및 양자화 개수, 진폭레벨로 역다중화하고(S11), 역다중화되어 출력된 신호가 양자화 값 및 양자화 개수인지를 판단하여(S12) 양자화 값 및 양자화 개수라면, 이 양자화 값과 개수를 읽어 런-랭스 복호화부(12)에 의해 런-랭스 복호화를 수행하여 1비트 양자화열을 구성한다(S13).Next, description will be made on the decoding of the speech signal according to the present invention with reference to the flowchart of FIG. 6. First, the data transmitted from the speech coding apparatus is demultiplexed by the demultiplexing unit 11 into a quantization value, a quantization number and an amplitude level S11), it is determined whether the demultiplexed signal is a quantized value and a quantized number (S12). If the quantized value and the quantized number are the quantized value and the number of quantized values, the run-length decoding unit 12 reads the quantized value and the number, To form a 1-bit quantization column (S13).

이어, 상기 단계(S13)에서 구성된 1비트 양자화열에 대해 델타복조부(13)에 의한 델타복조를 수행하여 저역여파필터(1)를 통과한 원래의 신호를 복원한다(S14).Next, the delta demodulation unit 13 performs delta demodulation on the 1-bit quantization sequence constructed in the step S13 to recover the original signal passed through the low-pass filter 1 (S14).

즉, 상기 런-랭스 복호화와 델타복조 과정은 양자화 값을 읽어 그 양자화 값이 "0"이면 지연후 증가하고, "1"이면 지연후 감소하여 원래의 신호를 복호화하는 것이다.That is, the run-length decoding and the delta demodulation process reads the quantization value and increases after the delay if the quantization value is "0". If the quantization value is "1", the run-length decoding and the delta demodulation decrease the delay and decode the original signal.

예를 들어 양자화 값과 그 개수가 "160515"라면, 감소를 6번하고, 이어 증가를 5번하며, 다시 감소를 5번하여 원래의 신호를 재구성한다.For example, if the quantization value and its number are "160515 ", the original signal is reconstructed by decreasing 6 times, then incrementing 5 times, and then decrementing 5 times.

따라서, SL(n)=0이라면 SL(n+1)=-1, SL(n+2)=-2, …, SL(n+5)=-5와 SL(n+6)=-4, SL(n+7)=-3, …, SL(n+10)=-1, 그리고, SL(n+11)=-2, SL(n+12)=-3, …, SL(n+15)=-6으로 복원이 된다.Therefore, if S L (n) = 0, S L (n + 1) = -1, S L (n + 2) = -2, ... , S L (n + 5) = -5, S L (n + 6) = -4, S L (n + 7) = -3, ... , S L (n + 10) = -1, and S L (n + 11) = -2 and S L (n + 12) = -3. , And S L (n + 15) = - 6.

한편, 상기 단계(S12)에서 역다중화되어 출력된 신호가 진폭레벨이라면 전송된 진폭레벨(M)과 백색잡음 발생기(14)에서 발생되는 백색잡음, 즉 가우시안 랜덤 신호(G(.))가 곱셈기(15)에 의해 곱해져 원래의 오차신호를 복원한다(S15).If the signal demultiplexed in step S12 is an amplitude level, the transmitted amplitude level M and the white noise generated in the white noise generator 14, that is, the Gaussian random signal G (.), (15) to restore the original error signal (S15).

이때의 과정을 식 4에서 나타내면,If the process at this time is expressed by Equation 4,

마지막으로, 가산기(16)에 의해 상기 단계(S14)에서 복원된 저역여파필터(1)를 통과한 원래의 신호와 상기 단계(S15)에서 복원된 오차신호를 가산하여 원래의 음성 디지털 신호를 복원한다(S16).Finally, the original signal passed through the low-pass filter 1 restored in the step S14 by the adder 16 is added to the error signal restored in the step S15 to restore the original speech digital signal (S16).

이상, 상기 상세한 설명에서와 같이, 본 발명은 부호화 및 복호화를 분리된 대역에 따라 각각 수행함에 있어 불필요한 고주파 성분을 가우시안 성분으로 대치함으로써 필요로하는 데이터량을 줄일 수 있고, 특히 잡음이 혼합된 신호에 대해서도 선형 스므딩으로 인하여 매우 높은 압축율을 갖게 되는 특장점이 있다.As described above, according to the present invention, unnecessary high-frequency components are replaced with Gaussian components in performing encoding and decoding according to separate bands, thereby reducing the amount of data required. In particular, , Which has a very high compression ratio due to linear smoothing.

Claims (2)

디지털 통신 시스템의 음성신호의 부호화 및 복호화 장치에 있어서, 입력 음성신호를 통과시켜 샘플과 샘플 간의 상관관계를 높이도록 전처리 과정을 수행하는 저역여파필터(1)와, 상기 저역여파필터(1)를 통과한 신호와 원래의 입력 음성신호를 감산하여 오차신호를 발생하는 감산기(2)와, 상기 저역여파필터(1)를 통과한 신호를 델타변조하는 델타변조부(3)와, 상기 델타변조부(3)에서 변조된 신호의 양자화 값과 그 양자화 값의 개수를 세어 양자화 값과 양자화 개수로 부호화하는 런-랭스 부호화부(4)와, 상기 감산기(2)에서 발생한 오차신호의 진폭레벨을 검출하는 진폭레벨 검출부(5)와, 상기 런-랭스 부호화부(4)의 양자화 값과 양자화 개수, 상기 진폭레벨 검출부(5)에서 검출된 진폭레벨을 다중화하여 전송하는 다중화부(6)로 구성된 음성 부호화 장치와; 상기 음성 부호화 장치로부터 전송되는 데이터를 역다중화하는 역다중화부(11)와, 상기 역다중화부(11)에서 출력된 양자화 값과 양자화 개수를 런-랭스 복호화부(12)와, 상기 런-랭스 복호화부(12)의 복호화 이후 델타복조하여 원래의 저역여파필터(1)를 통과한 신호를 복호화하는 델타복조부(13)와, 백색잡음을 발생하는 백색잡음 발생기(14)와, 상기 역다중화부(11)에서 출력된 진폭레벨과 상기 백색잡음 발생기(14)에서 발생된 백색잡음을 곱하여 원래의 오차신호를 복호화하는 곱셈기(15)와, 상기 곱셈기(15)에서 출력된 오차신호와 상기 델타복조부(13)에서 복호화된 신호를 가산하여 원래의 입력 음성신호를 출력하는 가산기(16)로 구성되는 음성 복호화 장치로 이루어짐을 특징으로 하는 음성 부호화 및 복호화 장치.An apparatus for encoding and decoding speech signals in a digital communication system, the apparatus comprising: a low-pass filter (1) for performing a preprocessing process for passing an input speech signal to increase a correlation between a sample and a sample; A subtracter 2 for subtracting the original input speech signal from the passed signal to generate an error signal, a delta modulator 3 for delta modulating the signal passed through the low-pass filter 1, A run-length encoding unit 4 for encoding the quantized value of the modulated signal and the number of quantized values of the signal modulated by the quantization unit 3 and encoding the quantized value and the number of quantized values, And a multiplexer 6 for multiplexing and transmitting the quantization values and quantization numbers of the run-length encoding unit 4 and the amplitude levels detected by the amplitude level detecting unit 5, The encoding device ; A demultiplexer 11 for demultiplexing the data transmitted from the speech encoding apparatus, a demultiplexer 11 for decoding the quantized values and the quantization numbers output from the run-length decoding unit 12, A delta demodulator 13 for delta-demodulating the signal after the decoding by the decoding unit 12 to decode the signal passed through the original low-pass filter 1, a white noise generator 14 for generating white noise, A multiplier 15 for multiplying the amplitude level output from the multiplier 15 by the white noise generated by the white noise generator 14 to decode the original error signal; And an adder (16) for adding the decoded signal from the demodulator (13) and outputting the original input speech signal. ≪ Desc / Clms Page number 13 > 디지털 통신 시스템의 음성신호의 부호화 및 복호화 방법에 있어서, 입력 음성신호를 대역분리하기 위해 저역통과시키는 제1단계와, 상기 제1단계에서 저역통과된 음성신호와 원래의 입력 음성신호와의 오차신호를 발생하는 제2단계와, 상기 제1단계에서 저역통과된 음성신호를 델타변조하는 제3단계와, 상기 제3단계에서 델타변조된 신호를 양자화 값과 양자화화 개수로 런-랭스 부호화하는 제4단계와, 상기 제2단계에서 발생된 오차신호의 진폭레벨을 검출하는 제5단계와, 상기 제4단계에서 런-랭스 부호화된 양자화 값과 개수, 상기 제5단계에서 검출된 진폭레벨을 다중화하여 전송하는 제6단계로 수행되는 음성 부호화 과정과; 상기 음성 부호화 과정에 의해 전송되는 신호를 역다중화하여 양자화 값과 개수 및 진폭레벨을 출력하는 제7단계와, 상기 제7단계에서 출력된 양자화 값과 개수를 양자화 수열로 런-랭스 복호화하는 제8단계와, 상기 제8단계에서 복호화된 양자화 수열을 원래의 저역통과된 음성신호로 델타복조하는 제9단계와, 상기 제7단계에서 출력된 진폭레벨과 백색잡음을 곱하여 원래의 오차신호를 복원하는 제10단계와, 상기 제9단계에서 델타복조된 저역통과된 음성신호와 상기 제10단계에서 복원된 오차신호를 가산하여 원래의 입력 음성신호를 복원하는 제11단계로 수행되는 음성 복호화 과정으로 이루어짐을 특징으로 하는 음성 부호화 및 복호화 방법.A method for encoding and decoding a speech signal in a digital communication system, the method comprising: a first step of performing low-pass filtering of an input speech signal in order to band-separate the speech signal; A third step of delta-modulating the speech signal passed through in the first step; a third step of performing a run-length encoding of the delta-modulated signal by the quantization value and the quantized number in the third step; A fifth step of detecting an amplitude level of the error signal generated in the second step, a quantization step of quantizing the run-length-encoded quantized value and the number in the fourth step and the amplitude level detected in the fifth step, A speech coding step of performing a speech coding process in a sixth step; A seventh step of demultiplexing a signal transmitted by the speech encoding process and outputting a quantization value and a number and an amplitude level; and a seventh step of performing a run-length decoding of the quantization value and the number output from the seventh step, A ninth step of delta-demodulating the quantized sequence decoded in the eighth step into an original low-pass filtered speech signal, and an eighth step of restoring the original error signal by multiplying the amplitude level output from the seventh step by the white noise And an input speech signal reconstructing step of reconstructing an original input speech signal by adding the low-pass filtered speech signal delta-demodulated in the ninth step and the error signal reconstructed in the tenth step, And decoding the encoded audio data.
KR1019960055635A 1996-11-20 1996-11-20 Voice coding and decoding device and method thereof Expired - Fee Related KR100221186B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960055635A KR100221186B1 (en) 1996-11-20 1996-11-20 Voice coding and decoding device and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960055635A KR100221186B1 (en) 1996-11-20 1996-11-20 Voice coding and decoding device and method thereof

Publications (2)

Publication Number Publication Date
KR19980036962A KR19980036962A (en) 1998-08-05
KR100221186B1 true KR100221186B1 (en) 1999-09-15

Family

ID=19482642

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960055635A Expired - Fee Related KR100221186B1 (en) 1996-11-20 1996-11-20 Voice coding and decoding device and method thereof

Country Status (1)

Country Link
KR (1) KR100221186B1 (en)

Also Published As

Publication number Publication date
KR19980036962A (en) 1998-08-05

Similar Documents

Publication Publication Date Title
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US11282530B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
RU2584463C2 (en) Low latency audio encoding, comprising alternating predictive coding and transform coding
US6732075B1 (en) Sound synthesizing apparatus and method, telephone apparatus, and program service medium
JP2010020346A (en) Method for encoding speech signal and music signal
TW463143B (en) Low-bit rate speech encoding method
US6611797B1 (en) Speech coding/decoding method and apparatus
Ramprashad A multimode transform predictive coder (MTPC) for speech and audio
KR20040045586A (en) Apparatus and method for transcoding between CELP type codecs with a different bandwidths
JP3092653B2 (en) Broadband speech encoding apparatus, speech decoding apparatus, and speech encoding / decoding apparatus
KR100221186B1 (en) Voice coding and decoding device and method thereof
JPH0720897A (en) Method and apparatus for quantizing spectral parameters in a digital coder
KR100221185B1 (en) Voice coding and decoding device and method thereof
JP3063087B2 (en) Audio encoding / decoding device, audio encoding device, and audio decoding device
JP3274451B2 (en) Adaptive postfilter and adaptive postfiltering method
Drygajilo Speech Coding Techniques and Standards
JP2853170B2 (en) Audio encoding / decoding system
KR20080092823A (en) Encoding / Decoding Apparatus and Method
JP3071800B2 (en) Adaptive post filter
KR100255297B1 (en) Voice data code/decode apparatus and the method
KR20010082838A (en) Method Of Compressing and Restoring Voice in Digital and Apparatus For Compressing and Restoring Using The Same
HK40036813A (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR20070008211A (en) Method and apparatus for scalable band extension speech encoding / decoding
JPH0291697A (en) System and device for encoding and decoding sound

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 19961120

PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 19961120

Comment text: Request for Examination of Application

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 19990325

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 19990625

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 19990626

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20020517

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20030520

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20040331

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20050523

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20050523

Start annual number: 7

End annual number: 7

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20070510