WO2009152723A1 - 嵌入式编解码方法和装置 - Google Patents
嵌入式编解码方法和装置 Download PDFInfo
- Publication number
- WO2009152723A1 WO2009152723A1 PCT/CN2009/072036 CN2009072036W WO2009152723A1 WO 2009152723 A1 WO2009152723 A1 WO 2009152723A1 CN 2009072036 W CN2009072036 W CN 2009072036W WO 2009152723 A1 WO2009152723 A1 WO 2009152723A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- frequency domain
- time domain
- envelope information
- information
- embedded
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000006467 substitution reaction Methods 0.000 claims description 37
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 59
- 238000013139 quantization Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 239000012792 core layer Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 101150001671 Tfec gene Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Definitions
- the present invention relates to coding techniques, and in particular, to an embedded codec method and apparatus. Background technique
- Embedded coding means that the encoder sorts the bit streams to be encoded according to different importance, and then encodes the bit stream to be encoded in a layered manner to generate a code stream with an embedded inclusion relationship.
- the code stream with embedded inclusion relationships typically includes a core layer and more than one enhancement layer.
- the core layer is located at the lower layer of the code stream and is used to provide the most basic information of the signal; the enhancement layer is located at the upper layer of the code stream and is used to compensate for the detailed information of the signal.
- the decoder can obtain a complete and continuous signal by decoding the core layer of the code stream.
- the decoder can also decode the enhancement layer of the code stream to improve the core. The signal quality decoded by the layer.
- the existing embedded voice/audio encoder generally uses the time domain or frequency domain envelope information of the original signal as basic information. coding. In order to ensure that the encoded bit resources are limited, the time domain or frequency domain envelope information of the original signal can also be encoded in one coding layer.
- the prior art provides two embedded coding methods:
- the coding end uses different entropy encoders or code tables to encode the time domain or frequency domain envelope information of the original signal to form an encoding.
- the coding end uses different entropy encoders or code tables to encode the time domain or frequency domain envelope information of the original signal to form an encoding.
- Floor uses different entropy encoders or code tables to encode the time domain or frequency domain envelope information of the original signal to form an encoding.
- the encoding method has at least the following problems: When the coding bit resource is limited, the coding method has low quantization precision for the time domain or frequency domain envelope information, and the signal quality decoded by the decoding end is poor; and in order to enable the decoding end to know the entropy coding used by the coding end Or the code table, when encoding the original signal, the encoding end needs to encode the information such as the selected entropy encoder or the code table, and transmit it to the decoding end, which wastes the coding bit resource.
- the encoding end encodes the time domain or frequency domain envelope information of the original signal as a lower layer signal to obtain a coded signal to form a coding layer having a lower code stream rate; and then, obtains the time domain of the original signal or a frequency domain envelope information and a residual signal of the encoded signal; comparing the residual signal with a preset threshold; and entropy encoding the residual signal or the preset low-entropy signal as a high-level signal according to the comparison result , forming a coding layer with a higher code stream rate.
- the encoding method has at least the following problems: As in the first encoding method, in the case where the encoding bit resources are limited, the method has low quantization precision for the signal, thereby When the coding layer with a higher code stream rate is not included in the code stream, the decoded signal is poor; and the threshold and the low entropy signal have a large influence on the coding quality of the signal, and the threshold and the low entropy signal are set. The calculation is very complicated; the threshold and the low-entropy signal are fixed and cannot be adjusted according to the original signal, so that the stability of the coding method is poor.
- Embodiments of the present invention provide an embedded codec method and apparatus, which can obtain a signal of better quality after being coded and decoded in the case where the coding bit resources are limited.
- An embedded coding method comprising: dividing time domain or frequency domain envelope information of an original signal into a first part and a second part; establishing a substitution relationship between the first part and the second part, the replacing The relationship is used for decoding to replace the first part with the second part; performing the first part Embedded coding, generating the first rate layer.
- An embedded decoding method comprising: decoding a first rate layer, reconstructing a first part of time domain or frequency domain envelope information of an original signal; according to the reconstructed first part of time domain or frequency domain envelope information And reconstructing a second part of the time domain or frequency domain packet of the original signal according to a substitution relationship between the first part of the time domain or frequency domain envelope information established by the encoding side and the second part of the time domain or frequency domain envelope information Network information; reconstructing the original signal according to the reconstructed first part and the second part of the time domain or frequency domain envelope information.
- An embedded coding device comprising:
- An envelope information dividing unit configured to divide time domain or frequency domain envelope information of the original signal into a first part and a second part
- a substitution relationship establishing unit configured to establish a substitution relationship between the first part and the second part, where the substitution relationship is used to replace the first part into a second part when decoding
- An embedded coding unit configured to perform embedded coding on the first part to generate a first rate layer.
- An embedded decoding device includes:
- a first part information reconstruction unit configured to decode the first rate layer, and reconstruct the first part of the original signal or the frequency domain envelope information
- a second part information reconstruction unit configured to reconstruct a first partial time domain or frequency domain envelope information according to the first partial information reconstruction unit, and a first partial time domain or frequency domain envelope information established according to the coding side a second part of the substitution relationship between the time domain or the frequency domain envelope information, reconstructing the second part of the original signal or the frequency domain envelope information;
- the original signal reconstruction unit is configured to reconstruct the original signal according to the first part and the second part of the time domain or frequency domain envelope information reconstructed by the first partial information reconstruction unit and the second partial information reconstruction unit.
- the embedded codec method and apparatus provided by the embodiments of the present invention may have a substitution relationship between the first part and the second part in advance, so the coding end may only be the original signal time domain or the frequency domain.
- the first part of the envelope information is embedded coded, which solves the problem that the prior art encodes the entire time domain or frequency domain envelope information of the original signal, and causes the time domain or frequency domain envelope information to be limited when the coded bit resource is limited.
- the quantization accuracy is low, and the decoded signal quality is poor.
- the embedded codec method and apparatus provided by the embodiments of the present invention can also perform relatively accurate quantization on the first part of information when the coding bit resources are limited, so that the signal quality decoded by the decoding end is better.
- the embedded codec method and apparatus provided by the embodiments of the present invention do not occupy additional coding bit resources except for performing embedded coding on the first part, and the substitution relationship algorithm between the first part and the second part is simple. High stability. DRAWINGS
- FIG. 1 is a flowchart of an embedded coding method according to an embodiment of the present invention
- FIG. 2 is a flowchart of an embedded decoding method according to an embodiment of the present invention.
- FIG. 3 is a schematic structural diagram of an embedded coding apparatus according to an embodiment of the present invention.
- FIG. 4 is another schematic structural diagram of an embedded coding apparatus according to an embodiment of the present invention.
- FIG. 5 is a schematic structural diagram of an embedded decoding apparatus according to an embodiment of the present disclosure.
- FIG. 6 is another schematic structural diagram of an embedded decoding apparatus according to an embodiment of the present invention. detailed description
- the entire time domain or the frequency domain envelope information of the original signal is embedded, which causes the coding precision to be low, and the decoded signal quality is poor.
- An embedded codec method and apparatus are provided.
- the time domain or frequency domain envelope information of the original signal is divided into a first part and a second part.
- a substitution relationship between the first portion and the second portion is established, and the substitution relationship is used to replace the first portion with the second portion when decoding.
- Another embodiment of the decoding method of the present invention includes:
- the first rate layer is decoded to reconstruct a first portion of the time domain or frequency domain envelope information of the original signal.
- the original signal is reconstructed based on the reconstructed first portion and the second portion of the time domain or frequency domain envelope information.
- the embedded coding method provided by the embodiment of the present invention includes:
- Step 101 Divide time domain or frequency domain envelope information of the original signal into a first part and a second part.
- the first part may be an occasional envelope of the original signal or an odd envelope part of the frequency domain envelope information
- the second part may be an even-numbered packet of the original signal or the envelope of the frequency domain envelope information.
- the first part may be a time domain of the original signal or an even envelope part of the frequency domain envelope information
- the second part may be an odd envelope of the time domain of the original signal or the envelope information of the frequency domain. section.
- the time domain or frequency domain envelope information of the original signal may also be divided by other methods, which is not mentioned here.
- Step 102 Establish a substitution relationship between the first part and the second part, where the substitution relationship is used to replace the first part to obtain the second part.
- substitution relationship between the first part and the second part may be: the time domain or frequency domain envelope information of the second part is equivalent to the average of the time domain or frequency domain envelope information of the first part adjacent thereto Value;
- substitution relationship between the second part and the first part may also be other cases, and is not performed here for each case - introduction.
- Step 103 Perform embedded coding on the first part to generate a first rate layer.
- the step 103 may perform embedded coding on each time domain or frequency domain envelope information in the first part by using an encoding method provided by the prior art, such as scalar quantization Huffman coding, etc.
- the step 103 may also perform the embedded coding on the first part by using the following scheme, including:
- a first rate layer is generated based on the above encoded result.
- step 103 performs embedded coding on more than one first differential signal, and may perform embedded entropy coding on more than one first differential signal.
- the entropy coding can establish a code table according to a probability distribution rule of various signals appearing in the sequence to be coded, a codeword with less coding bits is allocated to a signal with high probability of occurrence, and a codeword with more coding bits is allocated to a signal with low probability of occurrence, so
- the step 103 of encoding the one or more first differential signals by using the embedded entropy coding can make the average coded bits less, and save the coded bit resources.
- the method may further include:
- Step 104 Acquire a second differential signal between the second portion and the second portion replaced by the first portion.
- the method may further include:
- Step 105 Perform embedded coding on the second differential signal to generate a second rate layer.
- the step 105 may specifically perform embedded entropy coding on the second differential signal.
- the step 105 may not only encode the second differential signal in the second rate layer, but after the step 103 is encoded, when the first code rate layer has remaining coded bit resources, Step 105 may further encode a portion of the second differential signal in the first rate layer, and then encode the remaining second differential signal in the second rate layer;
- the method may further include: The number is divided into a first sub-portion and a second sub-portion; the step 105 may specifically be: performing embedded coding on the first sub-portion to generate a first code rate layer;
- the second sub-portion is embedded coded to generate a second rate layer.
- the coding end may only embed the first part of the original signal time domain or the frequency domain envelope information.
- the coding solves the problem that the prior art encodes the entire time domain or frequency domain envelope information of the original signal, resulting in low quantization precision of the time domain or frequency domain envelope information when the coding bit resource is limited.
- the embedded coding method provided by the embodiment of the present invention can also perform the more accurate quantization on the first part of the information when the coding bit resources are limited; and the embedded coding method provided by the embodiment of the present invention, except for the first part
- the extra coding bit resource is not occupied by the embedded coding, and the substitution relationship between the first part and the second part is simple and stable.
- the second differential information may be embedded coded, so that the method has better coding effect and higher coding quality.
- the embedded decoding method provided by the embodiment of the present invention includes:
- Step 201 Decode the first rate layer, and reconstruct a first part of the time domain or frequency domain envelope information of the original signal.
- the first partial time domain or frequency domain envelope information is odd envelope information of the original signal time domain or frequency domain; or even envelope information of the original signal time domain or frequency domain.
- the step 201 may specifically include:
- Decoding the first rate layer to obtain first time domain or frequency domain envelope information of the first part of the time domain or frequency domain envelope information of the original signal and more than one first difference information;
- Step 202 According to the reconstructed first partial time domain or frequency domain envelope information, and the first partial time domain or frequency domain envelope information and the second partial time domain or frequency domain envelope information established according to the coding side
- the substitution relationship may be pre-negotiated by the encoding party and the decoding party, or may be a preset substitution relationship.
- the second partial time domain or frequency domain envelope information described in this embodiment is even envelope information of the original signal time domain or frequency domain; or odd envelope information of the original signal time domain or frequency domain;
- the step 202 may specifically reconstruct the second partial time domain or frequency domain envelope information of the original signal according to the substitution relationship between the first part and the second part established in step 102 as shown in FIG.
- Step 203 Reconstruct an original signal according to the reconstructed first part and the second part of the time domain or frequency domain envelope information.
- the first rate layer includes the second difference information
- the code stream received by the decoding end includes the second rate layer, as shown in FIG. 2, after the step 202 , can also include:
- Step 204 Acquire second difference information. Specifically, the second difference information is obtained from the second rate layer, or the second difference information is obtained from the first rate layer when the second difference information is included in the first rate layer.
- Step 205 Generate an enhanced second partial time domain or frequency domain envelope information according to the second difference information and the reconstructed second partial time domain or frequency domain envelope information.
- the step 203 may specifically be:
- the second code rate layer When the second code rate layer is included in the code stream, generating reconstructed originals according to the reconstructed first partial time domain or frequency domain envelope information and the enhanced second partial time domain or frequency domain envelope information a signal; when the code stream includes only the first rate layer, according to the reconstructed first part and the second part of the time domain or frequency domain envelope information and the enhanced second part time domain or frequency domain envelope Information, reconstruct the original signal.
- the embedded decoding method provided by the embodiment of the present invention may reconstruct the second part time domain or frequency of the original signal according to the preset substitution relationship after decoding the first part of the original signal or the time domain or the frequency domain envelope information.
- the domain envelope information can be adapted to the embedded coding method provided by the embodiment of the present invention, and the original signal with better quality can be reconstructed. In order to enable those skilled in the art to more clearly decode the technical party provided by the embodiments of the present invention.
- Embodiment 1 The input signal of the ultra-wideband embedded encoder is a 32 kHz sampling rate, the bandwidth is 16 kHz, and the processing frame length is 20 ms.
- the embedded codec method provided by the embodiment of the present invention is used to perform the frequency domain envelope of the ultra-wideband portion. Processing, ultra-wideband rate layer coding bit resources are limited.
- the number of sampling points of the input signal in the 8 to 16 kHz band is 320
- the modified discrete cosine transform obtains the frequency domain signal in the frequency band ⁇ _ 6(0), 3 _ 6(1), «, y_swb(319) ⁇ , since the ultra-wideband portion of the UWB embedded encoder processes signals in the 8 to 14 kHz band, the 8 to 14 kHz band is extracted from the obtained frequency domain signal.
- the frequency domain signals ⁇ 3 _ 6(0), 3 _ 6(1), ..., y_swb(239) ⁇ are divided into N subbands in the frequency domain signal in the 8 to 14 kHz band, in this embodiment
- the N 15, obtain a set of frequency i or envelope information ⁇ e"ve(0), enve ⁇ ), ⁇ , enve(14) ⁇ .
- the frequency domain envelope information obtained in the first step is divided into odd envelope parts ⁇ enve ⁇ ), enve(3), , enve (13) ⁇ and even envelope parts ⁇ e"w 0), e"w 2), ⁇ , enve( ⁇ 4) ⁇ .
- quantizing the first differential signal to obtain a quantized first differential signal and the quantized first differential signal Perform embedded entropy coding to obtain the index index (i/2), and add ⁇ index(0), ⁇ ⁇ ⁇ , indexil), index(S), ⁇ ⁇ ⁇ , index( ) ⁇ to the ultra-wideband first.
- the code rate layer the code rate layer.
- the ultra-wideband first rate layer is decoded, and the frequency domain envelope information of the even envelope portion is reconstructed, including:
- the index information ⁇ indexiQ), ---, indexil) ⁇ of the even-numbered envelope portion is obtained from the ultra-wideband first rate layer, and ⁇ e"w ? (0) is obtained according to the index information decoding;
- the envelope information is obtained by the even-numbered envelope portion of the quantized frequency domain envelope information ⁇ e"w ? (0), e"w ? (2) n"w ? (14) ⁇ .
- the index information ⁇ index(S), ⁇ , index( ) ⁇ of the even-numbered envelope portion is obtained from the ultra-wideband second rate layer, and decoded according to the index information.
- enve ' (3), .., ⁇ (13) ⁇ and ⁇ obtain the frequency i or envelope information of the enhanced odd envelope part ⁇ em ⁇ (l), em ⁇ (3 '.,em ⁇ (13) ⁇ .
- Embodiment 2 The input signal of the ultra-wideband embedded encoder is a 32 kHz sampling rate, the bandwidth is 16 kHz, and the processing frame length is 20 ms.
- the embedded codec method provided by the embodiment of the present invention is used to perform the frequency domain envelope of the ultra-wideband portion. Processing, the ultra-wideband rate layer coding bit resources are relatively sufficient.
- Embodiment 1 is similar to the encoding and decoding steps of Embodiment 1, and the difference is:
- the obtained second differential signal d; enveii) - enve (i) is divided into two sub-bands, that is, ⁇ index(S), ⁇ , index( ) ⁇ is divided into two sub-bands ⁇ index(8), ⁇ , index(k) ⁇ and ⁇ index(k + 1), ⁇ ⁇ ⁇ , index( ⁇ 4) ⁇ , ⁇ index(8), ⁇ ⁇ , index(k) ⁇ force the input into the super-band with the first rate layer, and add ⁇ index(k + 1),..., index( ) ⁇ to the ultra-wideband second rate layer.
- the third step of the decoding end of the embodiment 1 is obtained by decoding from the ultra-wideband first rate layer and the second rate layer in the embodiment, that is, obtaining ⁇ « from the ultra-wideband first rate layer. ⁇ , ⁇ , obtained from the ultra-wideband first rate layer
- the code stream received by the decoding end when it does not include the ultra-wideband second rate layer information, it can be based on ⁇ enve q (0), enve q (2), ⁇ ⁇ ⁇ enve 9 ( 14) ⁇ , ⁇ enve 9 (1), enve 9 (3), ⁇ , enve 9 (k) ⁇ and ⁇ enve (k + 1), enve (3), ⁇ , enve '(13) ⁇ , reconstruct the original input signal.
- the embedded coding apparatus includes:
- the envelope information dividing unit 301 is configured to divide the time domain or frequency domain envelope information of the original signal into the first part and the second part;
- the substitution relationship establishing unit 302 is configured to establish a substitution relationship between the first part and the second part, where the substitution relationship is used to replace the first part to obtain the second part when decoding;
- the embedded coding unit 303 is configured to perform embedded coding on the first part to generate a first rate layer.
- the embedded coding unit 303 may include:
- the first differential signal acquiring unit 3031 is configured to obtain, according to the second time domain or frequency domain envelope information of the first part, the current time domain or frequency domain envelope information from the previous time domain or the frequency domain envelope. a first differential signal of information;
- the encoding unit 3032 is configured to perform embedded coding on the first time domain or frequency domain envelope information of the first part and the at least one first differential signal acquired by the first differential signal acquiring unit to generate a first rate layer.
- the embedded coding apparatus may further include:
- a second differential signal acquisition unit 304 configured to acquire a second differential signal between the second portion and the second portion replaced by the first portion
- the embedded coding unit 303 is further configured to perform embedded coding on the second differential signal to generate a second rate layer.
- the embedded coding apparatus may further include:
- a second differential signal dividing unit 305 configured to divide the second differential signal into a first sub-portion and a second sub-portion
- the embedded coding unit 303 is further configured to perform embedded coding on the first part obtained by the envelope information dividing unit 301 and the first sub-part obtained by the second differential signal dividing unit 305 to generate a first code.
- the rate layer performs embedded coding on the second sub-portion obtained by the second differential signal dividing unit 305 to generate a second rate layer.
- the coding end may only embed the first part of the original signal time domain or the frequency domain envelope information.
- the coding solves the problem that the prior art encodes the entire time domain or frequency domain envelope information of the original signal, resulting in low quantization precision of the time domain or frequency domain envelope information when the coding bit resource is limited.
- An embedded coding apparatus provided by an embodiment of the present invention in coding ratio When the special resources are limited, the first part of the information can be more accurately quantized; and the embedded coding apparatus provided by the embodiment of the present invention does not occupy additional coding bit resources except for the embedded coding of the first part.
- the substitution relationship between the first part and the second part is simple and stable.
- the embedded coding apparatus provided by the embodiment of the present invention can also perform embedded coding on the second differential information, so that the method has better coding effect and higher coding quality.
- the embedded decoding apparatus provided by the embodiment of the present invention includes:
- the first part information reconstruction unit 501 is configured to decode the first rate layer, and reconstruct a first part of the time domain or frequency domain envelope information of the original signal;
- the second partial information reconstruction unit 502 is configured to: according to the first partial time domain or frequency domain envelope information reconstructed by the first partial information reconstruction unit 501, and the first partial time domain or frequency domain envelope established according to the coding side Replacing the information with the second part of the time domain or the frequency domain envelope information, reconstructing the second part of the original signal or the frequency domain envelope information;
- the original signal reconstruction unit 503 is configured to reconstruct the original signal according to the first part and the second part of the time domain or frequency domain envelope information reconstructed by the first partial information reconstruction unit 501 and the second partial information reconstruction unit 502. .
- the first partial information reconstruction unit 501 may include: a decoding unit 5011, configured to decode the first rate layer, and obtain the first part of the original signal or the frequency domain envelope information. First time domain or frequency domain envelope information, and more than one first differential information;
- the information reconstruction unit 5012 is configured to reconstruct the subsequent time of the first partial time domain or frequency domain envelope information according to the first time domain or frequency domain envelope information obtained by the decoding unit 5011 and the first difference information. Domain or frequency domain envelope information.
- the embedded decoding apparatus may further include:
- a second difference information obtaining unit 504 configured to acquire second difference information
- the enhanced second part information generating unit 505 is configured to generate an enhanced second partial time domain or a frequency domain according to the second differential information and the reconstructed second partial time domain or frequency domain envelope information Envelope information
- the original signal reconstruction unit 503 is further configured to generate a reconstructed original signal according to the reconstructed first partial time domain or frequency domain envelope information and the enhanced second partial time domain or frequency domain envelope information;
- the original signal is reconstructed based on the reconstructed first and second partial time domain or frequency domain envelope information and the enhanced second partial time domain or frequency domain envelope information.
- the embedded decoding apparatus provided by the embodiment of the present invention may reconstruct the second part time domain or frequency of the original signal according to the preset substitution relationship after decoding the first part of the original signal or the frequency domain envelope information.
- the domain envelope information can be adapted to the embedded coding method provided by the embodiment of the present invention, and the original signal with better quality can be reconstructed.
- the embedded codec method and apparatus provided by the embodiments of the present invention are suitable for embedded coding of signals such as voice and audio to meet high quality audio/video conference, video conference, network communication, mobile communication, network congestion control, and the like.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
嵌入式编解码方法和装置 本申请要求于 2008 年 6 月 20 日提交中国专利局、 申请号为 200810126767.3、发明名称为"嵌入式编解码方法和装置"的中国专利申请的优 先权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及编码技术, 尤其涉及一种嵌入式编解码方法和装置。 背景技术
嵌入式编码是指编码器将待编码的比特流按重要性的不同进行排序, 然 后以分层的方式对所述待编码的比特流进行编码, 生成具有嵌入式包含关系 的码流。 该具有嵌入式包含关系的码流一般包括一个核心层和一个以上的增 强层。 其中, 核心层位于码流的低层, 用于提供信号最基本的信息; 增强层 位于码流的高层, 用于弥补信号的细节信息。 在接收端, 解码器可以通过对 码流的核心层进行解码, 获得完整、 连续的信号, 当码流中包含增强层时, 解码器还可以通过对该码流的增强层进行解码, 提高核心层解码出的信号质 量。
由于语音 /音频信号的时域或者频域包络信息提供了整个信号的轮廓信 息, 所以现有的嵌入式语音 /音频编码器一般将原始信号的时域或者频域包络 信息作为基本信息进行编码。 为了保证编码比特资源有限时, 也能将原始信 号的时域或者频域包络信息编码在一个编码层中, 现有技术提供两种嵌入式 编码方法:
一种是, 根据编码速率的不同, 即根据编码比特资源的不同, 编码端采 用不同的熵编码器或者码表等, 对原始信号的时域或频域包络信息整体进行 编码, 形成一个编码层。
在实现本发明的过程中, 发明人发现该编码方法至少存在如下问题: 在
编码比特资源有限的情况下, 该编码方法对时域或频域包络信息的量化精度 较低, 解码端解码出的信号质量较差; 且为了使解码端能够获知编码端所采 用的熵编码器或码表, 编码端在对原始信号进行编码时, 需要将其选择的熵 编码器或者码表等信息也进行编码, 传输给解码端, 浪费编码比特资源。
另一种是, 编码端将原始信号的时域或频域包络信息作为低层信号进行 编码, 获得编码信号, 形成码流速率较低的编码层; 然后, 获取所述原始信 号的时域或频域包络信息与编码信号的残差信号; 将该残差信号和一预设的 阈值进行比较; 根据比较结果, 将所述残差信号或者预设的低熵信号作为高 层信号进行熵编码, 形成码流速率较高的编码层。
该编码方法与第一种编码方法相比, 当码流中包含所述码流速率较高的 编码层时, 解码端解码出的信号质量较好。 但是, 在实现本发明的过程中, 发明人发现该编码方法至少存在如下问题: 与第一种编码方法相同, 在编码 比特资源有限的情况下, 本方法对信号的量化精度也较低, 从而使得在码流 中不包含码流速率较高的编码层时, 解码出的信号较差; 并且, 所述阈值和 低熵信号对信号的编码质量影响较大, 设置所述阈值和低熵信号的计算很复 杂; 所述阈值和低熵信号是固定不变的, 不能根据原始信号的不同而进行调 整, 使得该编码方法的稳定性较差。
发明内容
本发明的实施例提供一种嵌入式编解码方法和装置, 能够在编码比特资 源有限的情况下 , 经编解码操作后获得质量较好的信号。
使用的编码比特资源较少, 能够解码出质量较好的信号。
为达到上述目的, 本发明的实施例采用如下技术方案:
一种嵌入式编码方法, 包括: 将原始信号的时域或者频域包络信息划分 为第一部分和第二部分; 建立所述第一部分和第二部分之间的代换关系, 所 述代换关系用于解码时将第一部分代换得到第二部分; 对所述第一部分进行
嵌入式编码, 生成第一码率层。
一种嵌入式解码方法, 包括: 对第一码率层进行解码, 重构原始信号的 第一部分时域或者频域包络信息; 根据所述重构的第一部分时域或者频域包 络信息, 以及根据编码方建立的第一部分时域或者频域包络信息与第二部分 时域或者频域包络信息之间的代换关系, 重构原始信号的第二部分时域或者 频域包络信息; 根据所述重构的第一部分和第二部分时域或者频域包络信息, 重构原始信号。
一种嵌入式编码装置, 包括:
包络信息划分单元, 用于将原始信号的时域或者频域包络信息划分为第 一部分和第二部分;
代换关系建立单元, 用于建立所述第一部分和第二部分之间的代换关系, 所述代换关系用于解码时将第一部分代换得到第二部分;
嵌入式编码单元, 用于对所述第一部分进行嵌入式编码, 生成第一码率 层。
一种嵌入式解码装置, 包括:
第一部分信息重构单元, 用于对第一码率层进行解码, 重构原始信号的 第一部分时域或者频域包络信息;
第二部分信息重构单元, 用于根据所述第一部分信息重构单元重构的第 一部分时域或者频域包络信息, 以及根据编码方建立的第一部分时域或者频 域包络信息与第二部分时域或者频域包络信息之间的代换关系, 重构原始信 号的第二部分时域或者频域包络信息;
原始信号重构单元, 用于根据所述第一部分信息重构单元和第二部分信 息重构单元重构的第一部分和第二部分时域或者频域包络信息, 重构原始信 号。
本发明实施例提供的嵌入式编解码方法和装置, 由于预先建立了第一部 分和第二部分之间的代换关系, 所以编码端可以只对原始信号时域或者频域
包络信息的第一部分进行嵌入式编码, 解决了现有技术对原始信号的整个时 域或者频域包络信息进行编码, 造成编码比特资源有限时, 所述时域或者频 域包络信息的量化精度较低, 解码出的信号质量较差的问题。 本发明实施例 提供的嵌入式编解码方法和装置, 在编码比特资源有限时, 也能够对所述第 一部分信息进行较精确的量化, 从而使解码端解码出的信号质量较好。 并且, 本发明实施例提供的嵌入式编解码方法和装置, 除对第一部分进行嵌入式编 码外不占用额外的编码比特资源, 所述第一部分与第二部分之间的代换关系 算法简单、 稳定性高。 附图说明
图 1为本发明实施例提供的嵌入式编码方法流程图;
图 2为本发明实施例提供的嵌入式解码方法流程图;
图 3为本发明实施例提供的嵌入式编码装置结构示意图;
图 4为本发明实施例提供的嵌入式编码装置另一结构示意图;
图 5为本发明实施例提供的嵌入式解码装置结构示意图;
图 6为本发明实施例提供的嵌入式解码装置另一结构示意图。 具体实施方式
为了解决现有技术对原始信号的整个时域或者频域包络信息进行嵌入式 编码, 造成在编码资源有限时, 编码量化精度较低, 解码出的信号质量较差 的问题, 本发明实施例提供一种嵌入式编解码方法和装置。
本发明的一个实施例编码方法包括:
将原始信号的时域或者频域包络信息划分为第一部分和第二部分。
建立所述第一部分和第二部分之间的代换关系, 所述代换关系用于解码 时将第一部分代换得到第二部分。
对所述第一部分进行嵌入式编码, 生成第一码率层。
本发明的另一个实施例解码方法包括:
对第一码率层进行解码, 重构原始信号的第一部分时域或者频域包络信 息。
根据所述重构的第一部分时域或者频域包络信息, 以及根据编码方建立 的第一部分时域或者频域包络信息与第二部分时域或者频域包络信息之间的 代换关系, 重构原始信号的第二部分时域或者频域包络信息。
根据所述重构的第一部分和第二部分时域或者频域包络信息, 重构原始 信号。
如图 1所示, 本发明实施例提供的嵌入式编码方法, 包括:
步骤 101 ,将原始信号的时域或者频域包络信息划分为第一部分和第二部 分。
在本实施例中, 所述第一部分可以为原始信号的时域或者频域包络信息 的奇数包络部分, 所述第二部分可以为原始信号的时域或者频域包络信息的 偶数包络部分; 或者, 所述第一部分可以为原始信号的时域或者频域包络信 息的偶数包络部分, 所述第二部分可以为原始信号的时域或者频域包络信息 的奇数包络部分。 在实际的使用过程中, 还可以通过其他方法对所述原始信 号的时域或者频域包络信息进行划分, 此处不做赞述。
步骤 102, 建立所述第一部分和第二部分之间的代换关系, 所述代换关系 用于解码时将第一部分代换得到第二部分。
所述第一部分和第二部分之间的代换关系可以为: 第二部分的时域或者 频域包络信息等价于与之相邻的第一部分的时域或者频域包络信息的平均 值; 当然, 所述第二部分和第一部分之间的代换关系还可以为其他情况, 此 处不对每种情况进行——介绍。
步骤 103 , 对所述第一部分进行嵌入式编码, 生成第一码率层。
所述步骤 103 可以采用现有技术提供的编码方法, 如标量量化哈夫曼编 码等, 对第一部分中的每个时域或者频域包络信息进行嵌入式编码; 为了达
到节省编码比特资源的目的, 所述步骤 103还可以采用如下方案对第一部分 进行嵌入式编码, 包括:
从所述第一部分的第二个时域或者频域包络信息开始, 获取当前时域或 者频域包络信息相对于前一个时域或者频域包络信息的第一差分信号;
对所述第一部分的第一个时域或者频域包络信息进行嵌入式编码; 对获取的一个以上的第一差分信号进行嵌入式编码;
根据上述编码结果生成第一码率层。
在本实施例中, 步骤 103 对一个以上的第一差分信号进行嵌入式编码具 体可以为对一个以上的第一差分信号进行嵌入式熵编码。
由于熵编码能够根据待编码序列中各种信号出现的概率分布规律建立码 表, 对出现概率高的信号分配编码比特少的码字, 对出现概率低的信号分配 编码比特多的码字, 所以所述步骤 103 利用嵌入式熵编码对所述一个以上的 第一差分信号进行编码能够使平均编码比特较少, 节省编码比特资源。
如图 1所示, 为了进一步提高编码量化精度, 所述步骤 102之后, 还可 以包括:
步骤 104,获取所述第二部分与用第一部分代换后的第二部分之间的第二 差分信号。
则所述步骤 103之后, 还可以包括:
步骤 105 , 对所述第二差分信号进行嵌入式编码, 生成第二码率层。 为了 节省比特资源, 所述步骤 105 具体可以为对所述第二差分信号进行嵌入式熵 编码。
在本实施例中, 所述步骤 105 不仅可以将所述第二差分信号编码在第二 码率层, 当所述步骤 103 编码后, 第一码率层还有剩余的编码比特资源时, 所述步骤 105还可以将一部分第二差分信号编码在第一码率层, 然后将剩余 的第二差分信号编码在第二码率层;
为达到上述目的, 所述步骤 104之后, 还可以包括: 将所述第二差分信
号划分成第一子部分和第二子部分; 则所述步骤 105具体可以为: 对所述第一子部分进行嵌入式编码, 生成第一码率层;
对所述第二子部分进行嵌入式编码, 生成第二码率层。
本发明实施例提供的嵌入式编码方法, 由于预先建立了第一部分和第二 部分之间的代换关系, 所以编码端可以只对原始信号时域或者频域包络信息 的第一部分进行嵌入式编码, 解决了现有技术对原始信号的整个时域或者频 域包络信息进行编码, 造成编码比特资源有限时, 所述时域或者频域包络信 息的量化精度较低的问题。 本发明实施例提供的嵌入式编码方法, 在编码比 特资源有限时, 也能够对所述第一部分信息进行较精确的量化; 并且, 本发 明实施例提供的嵌入式编码方法, 除对第一部分进行嵌入式编码外不占用额 外的编码比特资源, 所述第一部分与第二部分之间的代换关系算法简单、 稳 定性高。 由于本发明实施例提供的嵌入式编码方法, 还可以对所述第二差分 信息进行嵌入式编码, 所以使得本方法编码效果更好, 编码质量更高。
如图 2所示, 本发明实施例提供的嵌入式解码方法, 包括:
步骤 201 , 对第一码率层进行解码, 重构原始信号的第一部分时域或者频 域包络信息。 所述的第一部分时域或者频域包络信息为原始信号时域或者频域的奇数包络 信息; 或者原始信号时域或者频域的偶数包络信息。
在本实施例中, 所述步骤 201具体可以包括:
对第一码率层进行解码, 获得原始信号第一部分时域或者频域包络信息 的第一个时域或者频域包络信息以及一个以上的第一差分信息;
根据所述第一个时域或者频域包络信息以及第一差分信息, 重构所述第 一部分时域或者频域包络信息的后续时域或者频域包络信息。
步骤 202,根据所述重构的第一部分时域或者频域包络信息, 以及根据编 码方建立的第一部分时域或者频域包络信息与第二部分时域或者频域包络信
息之间的代换关系, 重构原始信号的第二部分时域或者频域包络信息。 其中, 代换关系可以由编码方和解码方预先协商, 也可以为预先设定的代换关系。
本实施例所述的第二部分时域或者频域包络信息为原始信号时域或者频 域的偶数包络信息; 或者原始信号时域或者频域的奇数包络信息;
所述步骤 202具体可以根据如图 1所示的步骤 102中建立的第一部分与 第二部分之间的代换关系重构原始信号的第二部分时域或者频域包络信息。
步骤 203 , 根据所述重构的第一部分和第二部分时域或者频域包络信息, 重构原始信号。
在本实施例中, 当所述第一码率层中包含第二差分信息, 或者当解码端 接收到的码流中包含第二码率层时, 如图 2所示, 所述步骤 202之后, 还可 以包括:
步骤 204,获取第二差分信息。具体为:从第二码率层获取第二差分信息, 或者从当所述第一码率层中包含第二差分信息时, 也可以从第一码率层中获 取第二差分信息。
步骤 205 ,根据所述第二差分信息以及所述重构的第二部分时域或者频域 包络信息, 生成增强的第二部分时域或者频域包络信息。
则所述步骤 203具体可以为:
当所述码流中包含第二码率层时, 根据所述重构的第一部分时域或者频 域包络信息和增强的第二部分时域或者频域包络信息, 生成重构的原始信号; 当所述码流中仅包含第一码率层时, 根据所述重构的第一部分和第二部 分时域或者频域包络信息以及增强的第二部分时域或者频域包络信息, 重构 原始信号。
本发明实施例提供的嵌入式解码方法, 在解码出原始信号的第一部分时 域或者频域包络信息以后, 可以根据预先设置的代换关系重构出原始信号的 第二部分时域或者频域包络信息, 能够适应本发明实施例提供的嵌入式编码 方法, 并且, 能够重构出质量较好的原始信号。
为了使本领域技术人员能够更清楚地解码本发明实施例提供的技术方
方法做详细说明。
实施例 1: 超宽带嵌入式编码器的输入信号是 32kHz 采样率, 带宽为 16kHz, 处理帧长为 20ms, 采用本发明实施例提供的嵌入式编解码方法对超 宽带部分的频域包络进行处理, 超宽带码率层编码比特资源有限。
编码端:
第一, 获取所述输入信号超宽带部分的频域包络信息。
所述输入信号在 8 至 16kHz 频带内的采样点个数为 320 个
( ^^(32tffex20愿) = 320 ) , 8 至 16kHz 频 带 内 的 时域信号 为
{y_hi(0),y_hi(l), ······ ,y_hi(319)}, 经修正的离散余弦变换 ( MDCT)得到该频带内 的频域信号{ _ 6(0),3 _ 6(1),…… ,y_swb(319)} ,由于超宽带嵌入式编码器的超 宽带部分进处理 8至 14kHz频带内的信号, 所以从获得频域信号中提取该 8 至 14kHz频带内的频域信号{3 _ 6(0),3 _ 6(1),…… ,y_swb(239)} , 将所述 8至 14kHz频带内的频域信号分为 N个子带, 在本实施例中所述 N=15, 获得一组 频 i或包络信息 {e"ve(0), enve{\), ······ , enve(14)}。
第二, 将第一步中获得的频域包络信息划分为奇数包络部分 {enve{\), enve(3), , enve (13)}和偶数包络部分 {e"w 0),e"w 2), ······ ,enve(\4)}。
第三, 对所述偶数包络部分进行量化, 得到量化后的频域包络信息
[enveq (0), enveq (2), , enveq (14)},建立奇数包络部分 {e"w l),em^(3 ---♦ · , enve (13)}和 量 化 后 的 偶 数 包 络 部 分 各 量 化 后 的 频 域 包 络 信 息 {enveq(0),enveq(2),…… ,enveq(14)} 之 间 的 对 应 关 系 enve \ί) - (enveq (i - 1) + enveq (i + 1)) / 2 , ( i=l, 3, 5…… 13)。
第四, 对偶数包络部分进行嵌入式编码, 生成超宽带第一码率层, 包括: 首先, 对所述偶数包络部分量化后的第一个频域包络 em^(O)进行编码,
得到编码索引 index(O);
然后, 求取偶数包络部分其他量化后的的频域包络相对于前一个量化后 的频域包络的第一差分信号, 即 i,. =em^()-em^( -2), ( i=2, 4, 6......14); 最后, 对所述第一差分信号进行量化, 获得量化后的第一差分信号 , 并对所述量化后的第一差分信号进行嵌入式熵编码, 得到其编码索引 index(i/2), 将 {index(0), · · · , indexil), index(S), · · · , index( )}加入到超宽带第一码率层 中。
第五, 获取奇数包络部分 em^() (i=l, 3, ......15)与代换后的奇数包络 部分 enve '() ( i= 1 , 3, …… 15 )之间的第二差分信号 t; = enveii) - enve (i) ( i= 1 , 3, ......13 ), 对所述第二差分信号 进行嵌入式熵编码, 得到其编码索引 index((i+l)/2+7) ( i=l , 3, …… 13), 将 {"tfec(8),'.、"tfec(14)}加入到超宽带第二 码率层中。
解码端:
第一, 对超宽带第一码率层进行解码, 重构偶数包络部分的频域包络信 息, 包括:
首先, 从超宽带第一码率层中获取偶数包络部分的索引信息 {indexiQ),---, indexil)} , 根据该索引信息解码得到 {e"w?(0), ;
然后, 才艮据公式 =£^ ()-£^£>?( -2), (i=2, 4, 6......14), 获取偶数包 络部分量化后的其他时域包络信息, 得到偶数包络部分量化后的频域包络信 息 {e"w?(0),e"w?(2)n"w?(14)}。
第二, 根据与编码端相同的奇数包络部分与偶数包络部分之间的代换关 系 e"w'() = (e"w?( -l) + e"w?( + l))/2 , (i=l, 3, 5…… 13 ), 重构奇数包络部分 的频 i或包络信息 {e"ve'(l),e"ve'(3V'',e"ve'(13)}。
第三, 从超宽带第二码率层中获取偶数包络部分的索引信息 {index(S), ···, index( )} , 根据该索引信息解码出
第四, 根据 (1), enve' (3),..·, βηνέ (13)}和 { 获得增强的奇数包 络部分的频 i或包络信息 {em^(l),em^(3 '.,em^(13)}。
第五, 根据 { enveq (0), enveq (2), -♦ - enveq (14)}和 {enveq (1), enveq (3),… , enveq (13)} , 重 构原始的输入信号。
实施例 2: 超宽带嵌入式编码器的输入信号是 32kHz 采样率, 带宽为 16kHz, 处理帧长为 20ms, 采用本发明实施例提供的嵌入式编解码方法对超 宽带部分的频域包络进行处理, 超宽带码率层编码比特资源相对充足。
本实施例与实施例 1的编码和解码步骤相似, 其区别在于:
编码端:
在实施例 1 所述编码端第五步基础上, 将获得的第二差分信号 d; = enveii) - enve (i)划分成两个子带, 即将 {index(S), ···, index( )}划分为两个子带 {index(8), ···, index(k)}和 {index(k + 1), · · · , index(\4)} , {index(8), ···, index(k)}力口入超覔带 第一码率层, 将 {index(k + 1),… , index( )}加入超宽带第二码率层。
解码端:
实施例 1解码端的第三步骤所述的 在本实施例中是从超宽 带第一码率层和第二码率层中解码获得的, 即从超宽带第一码率层中获得 {«,···, },从超宽带第一码率层中获得
在本实施例中, 当解码端接收到的码流中不包含超宽带第二码率层信息 时, 可以才艮据 {enveq (0), enveq (2), · · · enve9 (14)}、 {enve9 (1), enve9 (3), ···, enve9 (k)}以及 {enve (k + 1), enve (3), ···, enve '(13)} , 重构原始的输入信号。
如图 3所示, 本发明实施例提供的嵌入式编码装置, 包括:
包络信息划分单元 301,用于将原始信号的时域或者频域包络信息划分为 第一部分和第二部分;
代换关系建立单元 302,用于建立所述第一部分和第二部分之间的代换关 系, 所述代换关系用于解码时将第一部分代换得到第二部分;
嵌入式编码单元 303 , 用于对所述第一部分进行嵌入式编码, 生成第一码 率层。
进一步地, 如图 4所示, 所述嵌入式编码单元 303可以包括:
第一差分信号获取单元 3031 , 用于从所述第一部分的第二个时域或者频 域包络信息开始, 获取当前时域或者频域包络信息相对于前一个时域或者频 域包络信息的第一差分信号;
编码单元 3032, 用于对所述第一部分的第一个时域或者频域包络信息以 及第一差分信号获取单元获取的至少一个第一差分信号进行嵌入式编码, 生 成第一码率层。
进一步地, 如图 4所示, 所述嵌入式编码装置, 还可以包括:
第二差分信号获取单元 304,用于获取所述第二部分与用第一部分代换后 的第二部分之间的第二差分信号;
所述嵌入式编码单元 303 , 还用于对所述第二差分信号进行嵌入式编码, 生成第二码率层。
进一步地, 如图 4所示, 所述嵌入式编码装置, 还可以包括:
第二差分信号划分单元 305 ,用于将所述第二差分信号划分成第一子部分 和第二子部分;
所述嵌入式编码单元 303 ,还用于对所述包络信息划分单元 301获得的第 一部分, 以及所述第二差分信号划分单元 305 获得的第一子部分进行嵌入式 编码, 生成第一码率层, 对第二差分信号划分单元 305 获得的第二子部分进 行嵌入式编码, 生成第二码率层。
本发明实施例提供的嵌入式编码装置, 由于预先建立了第一部分和第二 部分之间的代换关系, 所以编码端可以只对原始信号时域或者频域包络信息 的第一部分进行嵌入式编码, 解决了现有技术对原始信号的整个时域或者频 域包络信息进行编码, 造成编码比特资源有限时, 所述时域或者频域包络信 息的量化精度较低的问题。 本发明实施例提供的嵌入式编码装置, 在编码比
特资源有限时, 也能够对所述第一部分信息进行较精确的量化; 并且, 本发 明实施例提供的嵌入式编码装置, 除对第一部分进行嵌入式编码外不占用额 外的编码比特资源, 所述第一部分与第二部分之间的代换关系算法简单、 稳 定性高。 由于本发明实施例提供的嵌入式编码装置, 还可以对所述第二差分 信息进行嵌入式编码, 所以使得本方法编码效果更好, 编码质量更高。
如图 5所示, 本发明实施例提供的嵌入式解码装置, 包括:
第一部分信息重构单元 501 , 用于对第一码率层进行解码, 重构原始信号 的第一部分时域或者频域包络信息;
第二部分信息重构单元 502,用于根据所述第一部分信息重构单元 501重 构的第一部分时域或者频域包络信息, 以及根据编码方建立的第一部分时域 或者频域包络信息与第二部分时域或者频域包络信息之间的代换关系, 重构 原始信号的第二部分时域或者频域包络信息;
原始信号重构单元 503 ,用于根据所述第一部分信息重构单元 501和第二 部分信息重构单元 502重构的第一部分和第二部分时域或者频域包络信息, 重构原始信号。
进一步地, 如图 6所示, 所述第一部分信息重构单元 501可以包括: 解码单元 5011 , 用于对第一码率层进行解码, 获得原始信号第一部分时 域或者频域包络信息的第一个时域或者频域包络信息, 以及一个以上的第一 差分信息;
信息重构单元 5012,用于根据所述解码单元 5011获得的第一个时域或者 频域包络信息以及第一差分信息, 重构所述第一部分时域或者频域包络信息 的后续时域或者频域包络信息。
进一步地, 如图 6所示, 所述嵌入式解码装置, 还可以包括:
第二差分信息获取单元 504, 用于获取第二差分信息;
增强的第二部分信息生成单元 505 ,用于根据所述第二差分信息以及所述 重构的第二部分时域或者频域包络信息, 生成增强的第二部分时域或者频域
包络信息;
所述原始信号重构单元 503 ,还用于根据所述重构的第一部分时域或者频 域包络信息和增强的第二部分时域或者频域包络信息, 生成重构的原始信号; 或
根据所述重构的第一部分和第二部分时域或者频域包络信息以及增强的 第二部分时域或者频域包络信息, 重构原始信号。
本发明实施例提供的嵌入式解码装置, 在解码出原始信号的第一部分时 域或者频域包络信息以后, 可以根据预先设置的代换关系重构出原始信号的 第二部分时域或者频域包络信息, 能够适应本发明实施例提供的嵌入式编码 方法, 并且, 能够重构出质量较好的原始信号。
本发明实施例提供的嵌入式编解码方法和装置适用于对语音和音频等信 号的嵌入式编码, 以满足高质量的音 /视频会议、 电视电话会议、 网络通信、 移动通信、 网络拥塞控制以及第三代和第四代移动通信对嵌入式语音与音频 编码的广泛需求。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件完成, 所述的程序可以存储于一计算机可 读存储介质中, 如 ROM/RAM、 磁碟或光盘等。
以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限 于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易 想到变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护 范围应所述以权利要求的保护范围为准。
Claims
1、 一种嵌入式编码方法, 其特征在于, 包括:
将原始信号的时域或者频域包络信息划分为第一部分和第二部分; 建立所述第一部分和第二部分之间的代换关系, 所述代换关系用于解码时 将第一部分代换得到第二部分;
对所述第一部分进行嵌入式编码, 生成第一码率层。
2、 根据权利要求 1所述的嵌入式编码方法, 其特征在于, 所述第一部分为 所述原始信号的时域或者频域包络信息的奇数包络部分, 所述第二部分为所述 原始信号的时域或者频域包络信息的偶数包络部分; 或者
所述第一部分为所述原始信号的时域或者频域包络信息的偶数包络部分, 所述第二部分为所述原始信号的时域或者频域包络信息的奇数包络部分。
3、 根据权利要求 1所述的嵌入式编码方法, 其特征在于, 所述对所述第一 部分进行嵌入式编码包括:
从所述第一部分的第二个时域或者频域包络信息开始, 获取当前时域或者 频域包络信息相对于前一个时域或者频域包络信息的第一差分信号;
对所述第一部分的第一个时域或者频域包络信息进行嵌入式编码; 对获取的一个以上的第一差分信号进行嵌入式编码;
根据上述编码结果生成第一码率层。
4、 根据权利要求 3所述的嵌入式编码方法, 其特征在于, 所述对获取的一 个以上的第一差分信号进行嵌入式编码包括: 对获取的一个以上的第一差分信 号进行嵌入式熵编码。
5、 根据权利要求 1所述的嵌入式编码方法, 其特征在于, 所述建立所述第 一部分和第二部分之间的代换关系之后, 还包括:
获取所述第二部分与用第一部分代换后的第二部分之间的第二差分信号; 则所述对所述第一部分进行嵌入式编码, 生成第一码率层步骤之后, 还包 括:
对所述第二差分信号进行嵌入式编码, 生成第二码率层。
6、 根据权利要求 5所述的嵌入式编码方法, 其特征在于, 所述对所述第二 差分信号进行嵌入式编码包括: 对所述第二差分信号进行嵌入式熵编码。
7、 根据权利要求 5所述的嵌入式编码方法, 其特征在于, 所述获取所述第 二部分与用第一部分代换后的第二部分之间的第二差分信号之后还包括:
将所述第二差分信号划分成第一子部分和第二子部分;
则所述对所述第一部分进行嵌入式编码, 生成第一码率层步骤具体为: 对所述第一部分进行嵌入式编码, 以及对所述第一子部分进行嵌入式编码, 生成第一码率层;
对所述第二差分信号进行嵌入式编码, 生成第二码率层步骤具体为; 对所述第二子部分进行嵌入式编码, 生成第二码率层。
8、 一种嵌入式解码方法, 其特征在于, 包括:
对第一码率层进行解码, 重构原始信号的第一部分时域或者频域包络信息; 根据所述重构的第一部分时域或者频域包络信息, 以及根据编码方建立的 第一部分时域或者频域包络信息与第二部分时域或者频域包络信息之间的代换 关系, 重构原始信号的第二部分时域或者频域包络信息;
根据所述重构的第一部分和第二部分时域或者频域包络信息, 重构原始信 号。
9、 根据权利要求 8所述的嵌入式解码方法, 其特征在于, 所述第一部分时 域或者频域包络信息为原始信号时域或者频域的奇数包络信息, 所述第二部分 时域或者频域包络信息为原始信号时域或者频域的偶数包络信息; 或者
所述第一部分时域或者频域包络信息为原始信号时域或者频域的偶数包络 信息, 所述第二部分时域或者频域包络信息为原始信号时域或者频域的奇数包 络信息。
10、 根据权利要求 8 所述的嵌入式解码方法, 其特征在于, 所述对第一码 率层进行解码, 重构原始信号的第一部分时域或者频域包络信息包括:
对第一码率层进行解码, 获得原始信号第一部分时域或者频域包络信息的 第一个时域或者频域包络信息以及一个以上的第一差分信息;
根据所述第一个时域或者频域包络信息以及第一差分信息, 重构所述第一 部分时域或者频域包络信息的后续时域或者频域包络信息。
11、 根据权利要求 8 所述的嵌入式解码方法, 其特征在于, 所述根据所述 重构的第一部分时域或者频域包络信息, 以及预先设置的第一部分时域或者频 域包络信息与第二部分时域或者频域包络信息之间的代换关系, 重构原始信号 的第二部分时域或者频域包络信息之后, 还包括:
获取第二差分信息;
根据所述第二差分信息以及所述重构的第二部分时域或者频域包络信息, 生成增强的第二部分时域或者频域包络信息;
所述根据所述重构的第一部分和第二部分时域或者频域包络信息, 重构原 始信号包括:
根据所述重构的第一部分时域或者频域包络信息和增强的第二部分时域或 者频域包络信息, 重构原始信号; 或
根据所述重构的第一部分和第二部分时域或者频域包络信息以及增强的第 二部分时域或者频域包络信息, 重构原始信号。
12、 一种嵌入式编码装置, 其特征在于, 包括:
包络信息划分单元, 用于将原始信号的时域或者频域包络信息划分为第一 部分和第二部分;
代换关系建立单元, 用于建立所述第一部分和第二部分之间的代换关系, 所述代换关系用于解码时将第一部分代换得到第二部分;
嵌入式编码单元, 用于对所述第一部分进行嵌入式编码, 生成第一码率层。
13、 根据权利要求 12所述的嵌入式编码装置, 其特征在于, 所述嵌入式编 码单元包括:
第一差分信号获取单元, 用于从所述第一部分的第二个时域或者频域包络
信息开始, 获取当前时域或者频域包络信息相对于前一个时域或者频域包络信 息的第一差分信号;
编码单元, 用于对所述第一部分的第一个时域或者频域包络信息以及第一 差分信号获取单元获取的至少一个第一差分信号进行嵌入式编码, 生成第一码 率层。
14、 根据权利要求 12所述的嵌入式编码装置, 其特征在于, 还包括: 第二差分信号获取单元, 用于获取所述第二部分与用第一部分代换后的第 二部分之间的第二差分信号;
所述嵌入式编码单元, 还用于对所述第二差分信号进行嵌入式编码, 生成 第二码率层。
15、 根据权利要求 14所述的嵌入式编码装置, 其特征在于, 还包括: 第二差分信号划分单元, 用于将所述第二差分信号划分成第一子部分和第 二子部分;
所述嵌入式编码单元, 还用于对所述包络信息划分单元获得的第一部分, 以及所述第二差分信号划分单元获得的第一子部分进行嵌入式编码, 生成第一 码率层, 对所述第二差分信号划分单元获得的第二子部分进行嵌入式编码, 生 成第二码率层。
16、 一种嵌入式解码装置, 其特征在于, 包括:
第一部分信息重构单元, 用于对第一码率层进行解码, 重构原始信号的第 一部分时域或者频域包络信息;
第二部分信息重构单元, 用于根据所述第一部分信息重构单元重构的第一 部分时域或者频域包络信息, 以及根据编码方建立的第一部分时域或者频域包 络信息与第二部分时域或者频域包络信息之间的代换关系, 重构原始信号的第 二部分时域或者频域包络信息;
原始信号重构单元, 用于根据所述第一部分信息重构单元和第二部分信息 重构单元重构的第一部分和第二部分时域或者频域包络信息, 重构原始信号。
17、 根据权利要求 16所述的嵌入式解码装置, 其特征在于, 所述第一部分 信息重构单元包括:
解码单元, 用于对第一码率层进行解码, 获得原始信号第一部分时域或者 频域包络信息的第一个时域或者频域包络信息, 以及一个以上的第一差分信息; 信息重构单元, 用于根据所述解码单元获得的第一个时域或者频域包络信 息以及第一差分信息, 重构所述第一部分时域或者频域包络信息的后续时域或 者频域包络信息。
18、 根据权利要求 16所述的嵌入式解码装置, 其特征在于, 还包括: 第二差分信息获取单元, 用于获取第二差分信息;
增强的第二部分信息生成单元, 用于根据所述第二差分信息以及所述重构 的第二部分时域或者频域包络信息, 生成增强的第二部分时域或者频域包络信 息;
所述原始信号重构单元, 还用于根据所述重构的第一部分时域或者频域包 络信息和增强的第二部分时域或者频域包络信息, 重构原始信号; 或
根据所述重构的第一部分和第二部分时域或者频域包络信息以及增强的第 二部分时域或者频域包络信息, 重构原始信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810126767A CN101609679B (zh) | 2008-06-20 | 2008-06-20 | 嵌入式编解码方法和装置 |
CN200810126767.3 | 2008-06-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2009152723A1 true WO2009152723A1 (zh) | 2009-12-23 |
Family
ID=41433686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2009/072036 WO2009152723A1 (zh) | 2008-06-20 | 2009-05-27 | 嵌入式编解码方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101609679B (zh) |
WO (1) | WO2009152723A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102316290A (zh) * | 2010-06-29 | 2012-01-11 | 北京创毅视讯科技有限公司 | 一种模拟移动电视终端的移动状态确定方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1196611A (zh) * | 1997-04-02 | 1998-10-21 | 三星电子株式会社 | 可变规模语音编码/解码的方法和装置 |
CN1218339A (zh) * | 1997-11-20 | 1999-06-02 | 三星电子株式会社 | 可缩放的音频编码/解码方法和装置 |
US20070033023A1 (en) * | 2005-07-22 | 2007-02-08 | Samsung Electronics Co., Ltd. | Scalable speech coding/decoding apparatus, method, and medium having mixed structure |
US20070071089A1 (en) * | 2005-09-28 | 2007-03-29 | Samsung Electronics Co., Ltd. | Scalable audio encoding and decoding apparatus, method, and medium |
CN1942928A (zh) * | 2004-04-15 | 2007-04-04 | 诺基亚公司 | 音频信号编码 |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6510407B1 (en) * | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
US7395210B2 (en) * | 2002-11-21 | 2008-07-01 | Microsoft Corporation | Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform |
-
2008
- 2008-06-20 CN CN200810126767A patent/CN101609679B/zh not_active Expired - Fee Related
-
2009
- 2009-05-27 WO PCT/CN2009/072036 patent/WO2009152723A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1196611A (zh) * | 1997-04-02 | 1998-10-21 | 三星电子株式会社 | 可变规模语音编码/解码的方法和装置 |
CN1218339A (zh) * | 1997-11-20 | 1999-06-02 | 三星电子株式会社 | 可缩放的音频编码/解码方法和装置 |
CN1942928A (zh) * | 2004-04-15 | 2007-04-04 | 诺基亚公司 | 音频信号编码 |
US20070033023A1 (en) * | 2005-07-22 | 2007-02-08 | Samsung Electronics Co., Ltd. | Scalable speech coding/decoding apparatus, method, and medium having mixed structure |
US20070071089A1 (en) * | 2005-09-28 | 2007-03-29 | Samsung Electronics Co., Ltd. | Scalable audio encoding and decoding apparatus, method, and medium |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102316290A (zh) * | 2010-06-29 | 2012-01-11 | 北京创毅视讯科技有限公司 | 一种模拟移动电视终端的移动状态确定方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101609679B (zh) | 2012-10-17 |
CN101609679A (zh) | 2009-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220180881A1 (en) | Speech signal encoding and decoding methods and apparatuses, electronic device, and storage medium | |
CN1890711B (zh) | 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法 | |
JP2012527001A (ja) | 音声復号化方法および音声復号化器 | |
TW201923750A (zh) | 使用不同時間/頻率解析度編碼或解碼方向性音訊寫碼參數之設備及方法 | |
TW200828268A (en) | Dual-transform coding of audio signals | |
TWI671736B (zh) | 對信號的包絡進行寫碼的設備及對其進行解碼的設備 | |
CN1195160A (zh) | 可变规模语音编码/解码的方法和装置 | |
JP2018165834A (ja) | 雑音信号処理方法、雑音信号生成方法、符号化器、復号化器、並びに符号化および復号化システム | |
TW530296B (en) | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions | |
US11526734B2 (en) | Method and apparatus for recurrent auto-encoding | |
US20100191534A1 (en) | Method and apparatus for compression or decompression of digital signals | |
JP2013543146A (ja) | ビットストリーム・ドメインにおけるコード化オーディオフレームのレベルを推定する装置及び方法 | |
CN101548315A (zh) | 用于立体声编码的方法、装置和计算机程序产品 | |
CN102194458B (zh) | 频带复制方法、装置及音频解码方法、系统 | |
WO2009109120A1 (zh) | 一种音频信号的编解码方法和装置 | |
WO2010000179A1 (zh) | 频带扩展的方法、系统和设备 | |
CN101572087A (zh) | 嵌入式语音或音频信号编解码方法和装置 | |
WO2008064577A1 (fr) | Procédé et appareil permettant d'ajuster la qualité de la quantification dans un codeur et décodeur | |
TWI241558B (en) | Audio coding device and method | |
CN103165134B (zh) | 音频信号高频参数编解码装置 | |
WO2009152723A1 (zh) | 嵌入式编解码方法和装置 | |
CN102239518B (zh) | 编码和解码方法及装置 | |
CN100499815C (zh) | 一种支持视频帧随机读取的视频编解码方法 | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
CN101308657B (zh) | 一种基于先进音频编码器的码流合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 09765362 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 09765362 Country of ref document: EP Kind code of ref document: A1 |