CN101572088A - 立体声编解码方法、编解码器及编解码系统 - Google Patents
立体声编解码方法、编解码器及编解码系统 Download PDFInfo
- Publication number
- CN101572088A CN101572088A CNA2008100944366A CN200810094436A CN101572088A CN 101572088 A CN101572088 A CN 101572088A CN A2008100944366 A CNA2008100944366 A CN A2008100944366A CN 200810094436 A CN200810094436 A CN 200810094436A CN 101572088 A CN101572088 A CN 101572088A
- Authority
- CN
- China
- Prior art keywords
- code
- signal
- decoding
- stereosonic
- code check
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000005070 sampling Methods 0.000 claims abstract description 92
- 238000013139 quantization Methods 0.000 claims description 44
- 230000009466 transformation Effects 0.000 claims description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 abstract description 16
- 238000012935 Averaging Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例公开了一种立体声编解码方法、编解码器及编解码系统,涉及多媒体技术领域,能够编解码嵌入式立体声信号。所述立体声编码方法包括:对立体声信号的采样率进行判断,选择相应的编码模式;对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行编码形成嵌入式结构的码流。相对于编码过程,所述立体声解码方法对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号得到中值信号与边带信号合成得到立体声信号。本发明实施例通过构建多个码率层,可以处理16kHz采样的宽带立体声信号和32kHz采样的超宽带立体声信号。
Description
技术领域
本发明涉及多媒体技术领域,具体而言是涉及一种立体声编解码方法、编解码器及编解码系统。
背景技术
伴随着移动多媒体技术的快速发展,语音、音频编码技术得到了越来越广泛的应用,同时随着网络传输容量的增加,人们对于网络所传输信号的质量也提出了更高的要求。由于立体声信号能够提供很好的方位感,给人以身临其境的感觉,因此,适用于网络传输的语音、音频立体声信号编码成为了目前研究的一个热点问题。
对于立体声编码,目前流行的音频编码标准有:第三代合作伙伴计划(3rdGeneration Partnership Project,3GPP)制定的增强自适应多速率宽带标准(Enhanced Adaptive Multi-Rate-Wideband,AMR-WB+),以及移动图像专家组(Moving Picture Expert Group,MPEG)制定的MPEG-1、MPEG-2、MPEG-4等系列编码标准。在AMR-WB+立体声编码标准中,将立体声信号分为高频和低频两个部分,对于低频部分,编码它们左右声道的和、差信号;对于高频部分,两个声道进行独立编码。在MPEG系列立体声编码标准中,采用的是强度立体声编码,根据两个声道之间的相关性和双耳听觉效应来进一步去除声道之间的冗余度和不相关度,去除相关度的方法是M/S方法,即将2个声道的频谱相加或相减,根据两个声道的相关度的大小决定是传输和、差信号还是传输原始信号。
在实现本发明的过程中,发明人发现,现有技术中的立体声编码,是基于固定码流编码或是基于码率的选择进行编码,当在网络带宽受限或出现码流分组丢失的情况下,由于解码端不能接收到完整的编码码流,将导致无法解码而出现信号突然中断。
发明内容
本发明实施例要解决的技术问题是提供一种立体声编解码方法、编解码器及编解码系统,能够编解码嵌入式立体声信号,保证左右声道信号的连续性。
为实现上述目的,本发明实施例是通过如下技术方案实现的:
本发明实施例提供了一种立体声编码方法,包括以下步骤:
对立体声信号的采样率进行判断,选择相应的编码模式;
根据选择的编码模式,对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号;
对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流。
本发明实施例还提供了一种立体声编码装置,包括:
编码模式选择单元,用于对立体声信号的采样率进行判断,选择相应的编码模式;
中值信号获取单元,用于根据选择的编码模式,对立体声信号的左右声道求均值获取立体声的中值信号;
边带信号获取单元,用于根据选择的编码模式,对立体声信号的左右声道求差值获取立体声的边带信号;
中值信号编码单元,用于对所述立体声信号的中值信号进行嵌入式编码,得到嵌入式结构的码流;
边带信号编码单元,用于对所述立体声信号的边带信号进行嵌入式编码,得到嵌入式结构的码流。
本发明实施例还提供了一种立体声解码方法,包括以下步骤:
对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
根据选择的解码模式,对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号;
对解码得到的中值信号和边带信号进行求和与求差,分别求得立体声的左右声道,合成得到立体声信号。
本发明实施例还提供了一种立体声解码装置,包括:
解码模式选择单元,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
码率层选择单元,用于根据选择的解码模式,对嵌入式结构的码流选择不同的码率层;
中值信号解码单元,用于对选择的部分码率层解码得到立体声的中值信号;
边带信号解码单元,用于对选择的部分码率层解码得到立体声的边带信号;
立体声信号合成单元,用于对解码得到的中值信号和边带信号进行求和与求差,分别求得立体声的左右声道,合成得到立体声信号。
本发明实施例还提供了一种立体声编码系统,包括:
编码模式选择单元,用于对立体声信号的采样率进行判断,选择相应的编码模式;
宽带立体声编码装置,用于对宽带立体声的左右声道进行求均值、求差值,分别得到宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成宽带嵌入式结构的码流;
超宽带立体声编码装置,用于对超宽带立体声的左右声道进行求均值、求差值,分别得到超宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成超宽带嵌入式结构的码流。
本发明实施例还提供了一种立体声解码系统,包括:
解码模式选择单元,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
宽带立体声解码装置,用于对宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到宽带立体声信号;
超宽带立体声编码装置,用于对超宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到超宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到超宽带立体声信号。
由以上技术方案可知,在编码端,通过对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号,然后对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流,实现对立体声信号的嵌入式编码;在解码端,通过对嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别解出中值信号与边带信号,然后对所述中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到立体声信号,实现对立体声的嵌入式结构码流的解码。本发明实施例通过在编码端对立体声信号进行嵌入式编码形成嵌入式结构的码流,在解码端通过对嵌入式结构的码流进行相应的嵌入式解码,在没有高层码流信息的情况下仍可单独对低层的码流进行节目,保证了立体声左右声道信号的连续性,增强了立体声信号在信道传输时的鲁棒性。
附图说明
图1为本发明实施例一提供的立体声编码方法的流程图;
图2为本发明实施例二提供的宽带立体声编码方法的流程图;
图3为本发明实施例提供的MLT编码器编码原理框图;
图4为本发明实施例提供的MLT编码器的码流结构图;
图5为本发明实施例提供的MLT编码器的码流分层结构图;
图6为本发明实施例三提供的超宽带立体声编码方法的流程图;
图7为本发明实施例四提供的立体声编码装置的结构图;
图8为本发明实施例五提供的一种16kHz采样率宽带立体声编码装置结构图;
图9为本发明实施例六提供的一种超宽带立体声编码装置结构图;
图10为本发明实施例七提供的32kHz采样率超宽带立体声编码装置结构图;
图11为本发明实施例八提供的立体声解码方法的流程图;
图12为本发明实施例提供的MLT域解码方法原理框图;
图13为本发明实施例九提供的立体声解码装置的结构图;
图14为本发明实施例十提供的16kHz采样率宽带立体声解码装置的结构图;
图15为本发明实施例十一提供的一种超宽带立体声解码装置的结构图;
图16为本发明实施例十二提供的32kHz采样率的超宽带立体声解码装置的结构图;
图17为本发明实施例十三提供的立体声编码系统及实施例十四提供的立体声解码系统的结构图。
具体实施方式
本发明实施例的技术方案是基于嵌入式语音编码标准G.729.1和调制重叠变换(Modulated Lapped Transform,MLT)编码算法,生成一套立体声编码器。该编码器既能够编、解码16kHz采样率的宽带立体声信号,又能够处理32kHz采样的超宽带立体声信号。下面结合说明书附图对本发明实施例进行详细说明。
参见图1,为本发明实施例一提供的立体声编码方法的流程图,包括步骤:
步骤101,对立体声信号的采样率进行判断,选择相应的编码模式;
若判断立体声信号的采样率为16kHz,则选择宽带立体声编码模式;若判断立体声信号的采样率为32kHz,则选择超宽带立体声编码模式。
对于编码16kHz采样的宽带立体声信号,信号有效带宽为7kHz;编码32kHz采样的超宽带立体声信号,处理信号的有效带宽为14kHz。总编码器编码形成的码流是嵌入式的,低层码率的码流包含在高层码率的码流中,解码信号质量由低层到高层逐层递增。
步骤102,根据选择的编码模式,对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号;
步骤103,对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流。
以下对宽带立体声和超宽带立体声编码模式的处理过程分别进行说明:
如图2所示,为本发明实施例二提供的宽带立体声编码方法的流程图,包括步骤:
步骤201,对宽带立体声信号的左右声道进行求均值、求差值,分别得到宽带立体声信号的中值信号和边带信号;
从输入宽带立体声信号中,分别提取出左右声道信号signal_wbleft(n)和signal_wbright(n),对左右声道信号按照公式(1)进行求均值、求差值操作,分别得到宽带立体声信号的中值信号signal_wbmid(n)和边带信号signal_wbside(n)。
其中,中值信号是立体声左、右声道的相关信号,边带信号表示了两个声道信号的差别,这两个信号都是16kHz采样的宽带信号。
步骤202,对所述中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
对所述中值信号signal_wbmid(n)可通过采用嵌入式语音编码标准G.729.1编码器处理得到0~32kbps码率间的码流,但不限于G.729.1编码器,可以适用于任何全码率为32kbps的嵌入式编码器。
步骤203,对所述边带信号进行16kbps码率嵌入式编码,得到32kbps~48kbps码率间的码流。
对所述边带信号signal_wbside(n)可通过采用MLT进行16kbps码率编码,得到32kbps~48kbps码率间的码流,当然也可以通过采用其他具有同样功能的编码器。
MLT编码器编码原理如图3所示,下面详细介绍一下MLT编码方法。
首先,对输入的16kHz边带信号按照公式(2)进行MLT变换:
得到320个MLT系数,这些值表示的是频率0~8kHz范围内的频谱值,由于宽带信号要求处理的带宽范围为0~7kHz,因此提取0~7kHz频带范围的MLT系数进行编码,即提取前280个MLT系数进行处理。
将提取出的MLT系数均匀地划分为14个子带,也称为14个区域,每个子带拥有20个样点,表示的频带宽度为500Hz。
按照公式(3)求出每个子带的平均幅度包络值,子带r的幅度包络值被定义为该区域内MLT系数的均方根。
对得到的14个区域的幅度包络值进行标量量化,并将量化索引值进行哈夫曼编码后写入码流。
根据各个子带幅度包络量化信息的大小,对子带进行排序,同时规定各个子带的重要性,幅度包络值大的子带为重要子带,重要于包络值小的子带的次重要子带,此操作用于后期写入码流。
根据前面得到的幅度包络量化信息与编码MLT系数可利用的比特数,可以得到16种信号分类方法,不同的分类方式下每个子带所分配的比特数是不同的。从16种分类方法中选出最优分类方法,用4比特的分类控制信息来描述,并将这4个分类控制比特写入码流。
将每个子带内的MLT系数都除以该子带幅度包络量化值,得到归一化后的MLT系数。对这些归一化后的系数,进行标量量化,根据选出的最优分类方法,把量化得到的20个索引值分成几组矢量,并对这些矢量进行哈夫曼编码。
在对MLT系数进行哈夫曼编码后,要根据前面求得的各个子带的重要性排序来写入码流,重要的区域的MLT量化索引先写入码流,次重要的区域的索引后写入码流。
最终编码形成的码流信息如图4所示,由三部分构成:各子带的幅度包络量化信息(变长),分类控制信息(4比特)和MLT系数量化索引信息(变长)。
由于加入这部分MLT变换编码后,编码器的总码率扩展为40kbps和48kbps,因此40kbps编码层MLT系数的每帧比特数为:(40-32)kbps*20ms=160比特;48kbps编码层MLT系数的每帧比特数为:(48-40)kbps*20ms=160比特。
在编码时,进行的都是7kHz带宽范围的MLT系数在16kbps码率下的编码,形成每帧320比特的码流信息。若编码端标明,用40kbps的码率编码,则要求对MLT系数编码的码率为8kbps,因此需对形成的320比特信息的码流进行截断,保留320个比特信息的前160个比特信息用于传输,丢弃余下的比特信息。因为在进行哈夫曼编码的时候,是根据子带能量由高到低排序依次写入码流,同时各个子带的幅度包络量化信息、分类控制信息都写在了前80个比特信息中,因此在320个比特信息中前160个的比特信息要远远重要于后160个比特。
图5为具体的码流分层结构图,由图5可知,40kbps层码流包含了各个频带的振幅包络量化值、分类控制信息以及重要子带的MLT系数索引信息,48kbps层码流只包括了次重要子带的MLT系数索引信息。
如图6所示,为本发明实施例三提供的超宽带立体声编码方法的流程图,包括步骤:
步骤301,对超宽带立体声信号的左右声道进行求均值、求差值,分别得到超宽带立体声信号的中值信号和边带信号;
当输入的是32kHz采样率的超宽带立体声信号时,首先,从输入信号中,分别提取出左右声道信号signal_swbleft(n)和signal_swbright(n)。对左右声道信号分别进行求均值、求差值操作,由公式(4)得到输入信号的中值信号signal_swbmid(n)和边带信号signal_swbside(n):
其中,中值信号signal_swbmid(n)是立体声左、右声道的相关信号,边带信号signal_swbside(n)表示了两个声道信号的差别,这两个信号都是32kHz采样的超宽带信号。
步骤302,对所述中值信号0~7kHz频带的信息进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
对32kHz采样率的超宽带立体声的中值信号signal_swbmid(n)进行下2采样到16kHz采样的宽带信号,对此信号可通过采用嵌入式语音编码标准G.729.1编码器处理得到0~32kbps码率间的码流;但并不限于G.729.1编码器,可以适用于任何全码率为32kbps的嵌入式编码器。
步骤303,对所述中值信号的7kHz~14kHz频带的信息进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流;
对超宽带的中值信号signal_swbmid(n)可采用MLT进行16kbps码率编码,得到32kbps~48kbps码率间的码流,当然也可以采用其他具有同样功能的编码器。以下是采用MLT变换编码过程:
将中值信号signal_swbmid(n)按照公式(5)进行MLT变换:
得到640个MLT系数,这些值表示的是频率0~16kHz范围内的频谱值,提取7~14kHz频带范围的MLT系数进行编码,得到280个MLT系数。
对这280个MLT系数编码,采用的是与宽带立体声40kbps、48kbps码率层相同的MLT变换域编码方式。对MLT系数以16kbps码率进行的编码,形成每帧320比特的码流信息。码流中写入的是各个子带的MLT系数的幅度包络量化信息、分类控制比特信息以及各个子带的MLT系数量化索引信息,其中MLT系数量化索引信息是按照子带的重要性由高到低依次写入码流的。若编码端标明,用40kbps的码率编码,即要求对MLT系数编码的码率为8kbps,则保留320个比特信息的前160个比特信息用于传输,丢弃余下的比特信息。
步骤304,对所述边带信号的0~7kHz频带的信息进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流;
步骤305,对所述边带信号7kHz~14kHz频带的信息进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流。
步骤304和步骤305是对边带信号signal_swbside(n)在56kbps、64kbps码率层进行的处理,可通过采用MLT进行8kbps码率编码,其中56kbps码率层编码的是边带信号在0~7kHz频谱范围内的MLT系数,64kbps码率层编码的是边带信号在7~14kHz频谱范围内的MLT系数。这两层编码时采用的都是与40kbps、48kbps码率层相同的MLT变换域编码方式,区别是,在这两层是对带宽为7kHz的MLT系数以8kbps码率进行的编码,形成每帧160比特的码流信息。这样,56kbps码率层的码流包含了边带信号0~7kHz范围内各个子带的振幅包络量化信息、分类控制信息、所有子带的MLT系数量化索引信息;64kbps码率层的码流包含了边带信号7~14kHz范围内各个子带的振幅包络量化信息、分类控制信息以及所有子带的MLT系数量化索引信息。
在本发明实施例提供的立体声编码方法的基础上,本发明实施例四提供了一种立体声编码装置,如图7所示,包括:
编码模式选择单元600,用于对立体声信号的采样率进行判断,选择相应的编码模式;
中值信号获取单元601,用于根据选择的编码模式,对立体声信号的左右声道求均值获取立体声信号的中值信号;
边带信号获取单元602,用于根据选择的编码模式,对立体声信号的左右声道求差值获取立体声信号的边带信号;
中值信号编码单元603,用于对所述立体声信号的中值信号进行嵌入式编码,形成嵌入式结构的码流;
边带信号编码单元604,用于对所述立体声信号的边带信号进行嵌入式编码,形成嵌入式结构的码流。
当立体声为宽带立体声信号时,所述中值信号编码单元603,用于对宽带立体声的中值信号进行全码率为32kbps的嵌入式编码,形成0~32kbps码率间的码流;所述边带信号编码单元604,用于对宽带立体声的边带信号进行16kbps码率的嵌入式编码,形成32kbps~48kbps码率间的码流。
如图8所示,为本发明实施例五提供的一种宽带立体声编码装置,对于16kHz采样率的宽带立体声信号,包括:
中值信号获取单元11和边带信号获取单元12,所述中值信号获取单元11和边带信号获取单元12根据公式(1)分别获得宽带立体声的中值信号和边带信号。
G.729.1编码器13,用于通过采用嵌入式语音编码标准G.729.1编码器对宽带立体声的中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
40kbps层编码模块14,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,且码流中包括了边带信号中各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块15,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,且码流中只包括了边带信号中次重要子带的调制重叠变换系数量化索引信息。
当选择超宽带立体声编码模式时,如图9所示,为本发明实施例六提供的一种超宽带立体声编码装置,包括:
中值信号获取单元601,用于对超宽带立体声信号的左右声道求均值获取超宽带立体声的中值信号;
边带信号获取单元602,用于对超宽带立体声信号的左右声道求差值获取超宽带立体声的边带信号;
中值信号编码单元603,用于对所述超宽带立体声的中值信号进行全码率为48kbps的嵌入式编码,形成0~48kbps码率间的码流;
边带信号编码单元604,用于对所述超宽带立体声的边带信号进行16kbps码率的嵌入式编码,形成48kbps~64kbps码率间的码流。
其中,所述中值信号编码单元603具体包括:
中值信号低频编码模块603A,用于对超宽带立体声的中值信号的低频部分,进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
中值信号高频编码模块603B,用于对超宽带立体声的中值信号的高频部分,进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流。
所述边带信号编码单元604具体包括:
边带信号低频编码模块604A,用于对超宽带立体声的边带信号的低频部分进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流;
边带信号高频编码模块604B,用于对超宽带立体声的边带信号的高频部分进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流。
如图10所示,为本发明实施例七提供的一种具体的超宽带立体声编码装置,对于32kHz采样的超宽带立体声信号,包括:
中值信号获取单元21和边带信号获取单元22,所述中值信号获取单元21和边带信号获取单元22根据公式(4)分别获得超宽带立体声的中值信号和边带信号。
G.729.1编码器23,对应中值信号低频编码模块603A,通过采用嵌入式语音编码标准G.729.1编码器,用于对超宽带立体声的中值信号下2采样到16kHz进行32kbps码率的编码,得到0~32kbps码率间的码流;
40kbps层编码模块24,对应中值信号高频编码模块603B,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中包括了中值信号的7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块25,对应中值信号高频编码模块603B,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中只包括了中值信号的7kHz~14kHz频带范围内次重要子带的调制重叠变换系数量化索引信息;
56kbps层编码模块26,对应所述边带信号低频编码模块604A,用于通过采用调制重叠变换对超宽带立体声的边带信号0~7kHz频带部分的变换域信息进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流,所述码流中包括了边带信号0~7kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息;
64kbps层编码模块27,对应所述边带信号高频编码模块604B,用于通过采用调制重叠变换对超宽带立体声的边带信号7kHz~14kHz频带部分的变换域信息进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流,所述码流中包括了边带信号7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息。
与立体声编码方法对应,如图11所示,为本发明实施例八提供的立体声解码方法的流程图,包括如下步骤:
步骤401,对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
如果判断嵌入式结构的码流的采样率为16KHz,则选择宽带立体声的解码模式;如果判断嵌入式结构的码流的采样率为32KHz,则选择超宽带立体声的解码模式。
步骤402,根据选择的解码模式,对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号;
步骤403,对解码得到的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到立体声信号。
与编码端相对应,下面对宽带和超宽带立体声信号的嵌入式结构的码流的解码处理过程分别进行说明。
对于宽带立体声信号的码流,对0~32kbps码率间的码流,进行全码率为32kbps嵌入式解码,得到宽带立体声的中值信号;对32kbps~48kbps码率部分的码流,进行16kbps码率解码,得到宽带立体声的边带信号。
当接收到16kHz采样的宽带立体声信号的码流信息时,根据接收比特数的不同执行不同的解码操作。
1、码率小于32kbps时进行嵌入式语音编码标准G.729.1解码
当比特数<=640(码率<=32kbps)时,仅仅通过采用嵌入式语音编码标准G.729.1解码器进行解码,根据实际得到的比特数进行解码,生成该码率下16kHz采样的宽带中值信号,而边带信号没有任何码流信息得到,因此将边带信号置0。最终由中值信号与边带信号求得左右声道的信息,得到双声道的输出语音,按公式(6)进行计算:
signal_wbleft(n)=signal_wbmid(n)+signal_wbside(n)
signal_wbright(n)=signal_wbmid(n)-signal_wbside(n)(6)
由于边带信号为0,因此,相当于把中值信号复制给左右声道,以保证左右声道都有信号。
2、40kbps、48kbps码率层的MLT系数解码
当比特数=960(码率=48kbps)时,32kbps码率以下的码流信息利用嵌入式语音编码标准G.729.1解码器进行解码,生成16kHz采样的宽带中值解码信号。同时40kbps、48kbps层码流信息通过采用如图12所示的MLT域解码方式进行解码。
首先恢复出MLT域的各个子带振幅包络的量化值,将该值与解码端可利用的比特数320、接收到的4bit的分类控制信息相结合,得出编码端通过采用的编码分类方法。解码端通过采用与编码端相同的分类方法,对比特信息进行反量化处理得到各个子带去包络后的MLT系数,并将每个子带解得的MLT系数乘以该子带的振幅包络量化值,最终得到了信号的MLT系数。此时解码出的是0~7kHz范围内的MLT系数,将其余频带(7~8kHz)的MLT系数置零,然后对MLT系数进行反变换得到相应的解码边带信号。
将嵌入式语音编码标准G.729.1解码器解码出的宽带中值信号与32kbps~48kbps解码得到的边带信号相结合,根据公式(6)得到解码的宽带立体声信号。
当比特数=800(码率=40kbps)时,同样的,32kbps码率以下的码流信息用嵌入式语音编码标准G.729.1解码器进行解码。由于40kbps码率层码流信息包括了各个子带的振幅包络量化值、分类控制信息以及重要子带的MLT系数索引信息,因此仅能解码出部分子带的MLT系数。解码时恢复出MLT域的各个子带振幅包络的量化值,并将其进行排序,得到重要频段的位置,由此可知该40kbps层码流信息中所包括的那些区域。结合接收到的4bit的分类控制信息,MLT系数码流信息,解码出这些重要子带的MLT系数。对于0~7kHz频段中次重要子带,40kbps码率层的码流中只有它们的幅度包络量化信息,用随机数与这些幅度包络量化信息相结合粗略生成这些子带的MLT系数。这样最终得到所有子带的MLT系数后,将7~8kHz频带的MLT系数置零,进行反变换得到解码的边带信号,与嵌入式语音编码标准G.729.1解码器输出的宽带中值信号相结合,根据公式(6)得到解码的宽带立体声信号。
由此可知,对于宽带立体声码流信息,当码率为48kbps时,完全解码出宽带立体声的中值信号与边带信号,合成宽带立体声信号输出;当码率为40kbps时,解码出宽带立体声的中值信号和含有重要子带信息的宽带立体声的边带信号,合成宽带立体声信号输出;当码率小于等于32kbps,仅能解码出宽带立体声的中值信号,将中值信号赋给左右声道,作为宽带立体声输出。因此保证了左右声道信号的连续性,增强了立体声信号在信道中传输时的鲁棒性。
对于超宽带立体声信号的码流的解码操作同样基于码率判断,对应编码过程,对0~32kbps码率间的码流,进行全码率为32kbps嵌入式解码,得到超宽带立体声的中值信号0~7kHz频带的信息;对32kbps~48kbps码率部分的码流,进行16kbps码率解码,得到超宽带立体声的中值信号7kHz~14kHz频带的信息;对48kbps~56kbps码率部分的码流,进行8kbps码率解码,得到超宽带立体声的边带信号0~7kHz频带的信息;对56kbps~64kbps码率部分的码流,进行8kbps码率解码,得到超宽带立体声的边带信号7kHz~14kHz频带的信息。
当接收到32kHz采样的超宽带立体声信号的码流信息时,根据接收比特数的不同执行不同的解码操作。
1、码率小于等于32kbps的嵌入式语音编码标准G.729.1解码操作
当比特数<=640(码率<=32kbps)时,通过采用嵌入式语音编码标准G.729.1解码器,根据实际得到的比特数进行解码,生成相应码率下的16kHz采样的中值信号,进行上2采样得到32kHz采样的超宽带中值信号的低频信息,因为没有接收到边带信号,无法对边带信号进行解码,所以只能将此中值信号分别复制到左、右声道,得到有效带宽为0~7kHz的超宽带立体声信号。此情况下所得立体声信号左、右声道信号相同。
2、40kbps、48kbps码率层的超宽带MLT系数解码操作
当比特数=960(码率=48kbps)时,32kbps码率以下的码流信息利用嵌入式语音编码标准G.729.1解码器进行解码生成16kHz采样的宽带中值解码信号。同时将得到的40kbps、48kbps层码流信息通过采用与宽带40kbps、48kbps解码层相同的变换编码方式进行解码,首先恢复出MLT域的各个子带振幅包络的量化值,根据幅度包络量化信息得出编码分类方法。对比特信息进行反量化处理得到各个子带去包络后的MLT系数,并将每个子带解得的MLT系数乘以该频带的振幅包络量化值,最终得到了信号的MLT系数。在编码端编码的是7~14kHz范围内的MLT系数,因此需把解码出的MLT系数搬移至7~14kHz范围,并将其余频带(0~7kHz、14~16kHz)的MLT系数置零,然后对其进行反变换得到相应的时域信号。将其与上2采样后的嵌入式语音编码标准G.729.1解码器解码信号相加得到超宽带中值信号。此时因为码流中没有56kbps、64kbps层信息,因此无法解出边带信号,所以将此中值信号分别复制到左、右声道,得到48kbps码率下的超宽带立体声信号。此情况下所得立体声信号的左、右声道信号相同。
当比特数=800(码率=40kbps)时,同样的,32kbps码率以下的码流信息利用嵌入式语音编码标准G.729.1解码器,解码生成宽带中值解码信号。由于40kbps码率层码流信息包括的是7~14kHz频段中重要子带的MLT系数,解码处理时可以恢复出这些子带的MLT系数;对于7~14kHz频段中次重要子带,40kbps码率层的码流中只有它们的幅度包络量化信息,用随机数与这些幅度包络量化信息相结合通过采用噪声填充技术粗略生成这些子带的MLT系数。这样最终得到所有子带的MLT系数后,将其搬移至7~14kHz范围,进行反变换得到相应的时域信号。将其与上2采样后的嵌入式语音编码标准G.729.1解码器解码信号相加得到超宽带中值信号。同样,因为没有边带信号码流信息,无法解出边带信号,所以只能将此中值信号分别复制到左、右声道,得到40kbps码率下的超宽带立体声信号。此情况下所得立体声信号的左、右声道信号相同。
3、56kbps、64kbps码率层的边带信号MLT系数解码操作
当比特数=1120(码率=56kbps)时,48kbps码率以下的码流信息通过前几层解码操作,得到中值信号。56kbps码率层的码流信息包括的是边带信号在0~7kHz范围内的MLT系数。将该层码流信息通过采用与40kbp、48kbps码率层相同的MLT变换域编码的方式进行解码,依次恢复出MLT域各个频带振幅包络的量化值,分类控制信息、编码分类类型,由此解码出MLT系数,然后进行反MLT变换得到解码后的有效带宽为0~7kHz的32kHz采样的边带信号。同样的,将解码得到中值信号和边带信号,分别求和、求差,得到56kbps码率下的32kHz采样的解码超宽带立体声信号。
当比特数=1280(码率=64kbps)时,同样的,48kbps码率以下的码流信息通过前几层解码操作,得到中值信号。56kbps码率层的码流信息包括的是边信号在0~7kHz范围内的MLT系数;64kbps码率层的码流信息描述的是边带信号在7~14kHz范围内的MLT系数。将56kbps、64kbps码率层的码流信息通过采用MLT变换域编码的方式进行解码,解码出频带范围为0~14kHz的MLT系数,对MLT系数进行反变换得到解码后的32kHz采样的边带信号。将解码得到中值信号和边带信号,分别求和、求差,得到64kbps码率下的32kHz采样超宽带立体声信号。
由此可知,当码率为64kbps时,完全解码出超宽带立体声的中值信号与包括0~14kHz频带信息的超宽带立体声的边带信号,合成超宽带立体声信号输出;当码率为56kbps时,解码出超宽带立体声的中值信号和超宽带立体声的0~7kHz频带的边带信号,合成超宽带立体声信号输出;当码率为40kbps和48kbps时,仅解码出超宽带立体声的中值信号,将中值信号赋给左右声道,作为超宽带立体声输出;当码率小于等于32kbps时,仅解码出超宽带立体声的0~7kHz频带的中值信号,将该中值信号赋给左右声道,作为超宽带立体声输出。因此保证了左右声道信号的连续性,增强了立体声信号在信道中传输时的鲁棒性。
在本发明实施例提供的立体声解码方法的基础上,本发明实施例九提供了一种立体声解码装置,如图13所示,包括:
解码模式选择单元800,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
码率层选择单元801,用于根据选择的解码模式,对嵌入式结构的码流选择不同的码率层;
中值信号解码单元802,用于对选择的部分码率层解码得到立体声的中值信号;
边带信号解码单元803,用于对选择的部分码率层解码得到立体声的边带信号;
立体声信号合成单元804,用于对对解码得到的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到立体声信号。
当根据输入的解码模式选择解码宽带立体声信号的码流时,根据码率层选择单元801,所述中值信号解码单元802,选择对0~32kbps码率间的码流,进行全码率为32kbps嵌入式解码,得到宽带立体声的中值信号;所述边带信号解码单元803,选择对32kbps~48kbps码率间的码流,进行16kbps码率解码,得到宽带立体声的边带信号。
如图14所示,为本发明实施例十提供的一种宽带立体声解码装置,对于16kHz采样率的宽带立体声信号的码流,包括:
码率层选择单元31,用于根据选择的解码模式,对宽带立体声的嵌入式结构的码流选择不同的码率层;
G.729.1解码器32,用于对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
40kbps层解码模块33,当码流速率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的MLT系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的MLT系数进行填充,对填充后的MLT系数进行MLT反变换得到宽带立体声信号的边带信号;
48kbps层解码模块34,当码流速率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到宽带立体声信号的边带信号;
立体声信号合成单元35,用于对解码得到的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到宽带立体声信号。
如图15所示,为本发明实施例十一提供的一种超宽带立体声解码装置,对于超宽带立体声信号的码流,包括:
码率层选择单元801,用于根据选择的解码模式,对嵌入式结构的码流选择不同的码率层;
中值信号解码单元802,用于对0~48kbps码率间的码流,进行全码率为48kbps嵌入式解码,得到超宽带立体声的中值信号;
边带信号解码单元803,用于对48kbps~64kbps码率间的码流,进行16kbps码率的嵌入式解码,得到超宽带立体声的边带信号;
立体声信号合成单元804,用于对解码得到的超宽带立体声的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到超宽带立体声信号。
其中,所述中值信号解码单元802具体包括:
中值信号低频解码模块802A,用于对0~32kbps码率间的码流,进行全码率为32kbps的嵌入式解码,得到超宽带立体声中值信号0~7kHz频带信息;
中值信号高频解码模块802B,用于对32kbps~48kbps码率间的码流,进行16kbps码率的嵌入式解码,得到超宽带立体声中值信号7kHz~14kHz频带信息。
所述边带信号解码单元803具体包括:
边带信号低频解码模块803A,用于对48kbps~56kbps码率间的码流,进行8kbps码率的嵌入式解码,得到超宽带立体声边带信号0~7kHz频带信息;
边带信号高频解码模块803B,用于对56kbps~64kbps码率间的码流,进行8kbps码率的嵌入式解码,得到超宽带立体声边带信号7kHz~14kHz频带信息。
如图16所示,为本发明实施例十二提供的一个具体的超宽带立体声解码装置,对于32kHz采样率的超宽带立体声信号的码流,包括:
码率层选择单元41,用于对嵌入式结构的码流选择不同的码率层;
G.729.1解码器42,对应中值信号低频解码模块802A,通过采用嵌入式语音编码标准G.729.1解码器,用于对0~32kbps码率间的码流进行解码,上2采样到32kHz,得到超宽带立体声的0~7kHz频带的中值信号;
40kbps层解码模块43,对应中值信号高频解码模块802B,当码流速率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的MLT系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的MLT系数进行填充,对填充后的MLT系数进行MLT反变换得到超宽带立体声的7kHz-14kHz的中值信号;
48kbps层解码模块44,对应中值信号高频解码模块,当码流速率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的7kHz~14kHz频带的中值信号;
56kbps层解码模块45,对应边带信号低频解码模块803A,用于当码率为56kbps时,根据56kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的0~7kHz频带的边带信号;
64kbps层解码模块46,对应边带信号高频解码模块803B,用于当码率为64kbps时,根据64kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的7kHz~14kHz频带的边带信号;
立体声信号合成单元47,用于对解码得到的中值信号和边带信号进行求和与求差,分别求得立体声的左右声道,合成得到超宽带立体声信号。
在本发明实施例提供的立体声编码装置的基础上,如图17所示,为本发明实施例十三提供的立体声编码系统,包括:
编码模式选择单元910,用于对立体声信号的采样率进行判断,选择相应的编码模式;
宽带立体声编码装置920,用于对宽带立体声的左右声道进行求均值、求差值,分别得到宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成宽带嵌入式结构的码流;
超宽带立体声编码装置930,用于对超宽带立体声的左右声道进行求均值、求差值,分别得到超宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成超宽带嵌入式结构的码流。
当输入的信号为16kHz采样率的宽带立体声信号时,宽带立体声编码装置包括:
G.729.1编码器,通过采用嵌入式语音编码标准G.729.1编码器对所述宽带立体声的中值信号进行32kbps码率编码,得到0~32kbps码率间的码流;
40kbps层编码模块,用于通过采用调制重叠变换对宽带立体声的边带信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,且码流中包括了边带信号中各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换对宽带立体声的边带信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,且码流中只包括了边带信号中次重要子带的调制重叠变换系数量化索引信息。
当输入的信号为32kHz采样率的超宽带立体声信号时,所述超宽带立体声编码装置包括:
G.729.1编码器,用于通过采用嵌入式语音编码标准G.729.1编码器对超宽带立体声的0~7kHz频带的中值信号下2采样到16kHz进行32kbps嵌入式编码,得到0~32kbps码率间的码流;
40kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中包括了中值信号的7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中只包括了中值信号的7kHz~14kHz频带范围内次重要子带的调制重叠变换系数量化索引信息;
56kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的0~7kHz频带的边带信号进行8kbps码率编码,得到48kbps~56kbps码率间的码流,所述码流中包括了边带信号0~7kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息;
64kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的边带信号进行8kbps码率编码,得到56kbps~64kbps码率间的码流,所述码流中包括了边带信号7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息。
在本发明实施例提供的立体声解码装置的基础上,仍如图17所示,为本发明实施例十四提供的立体声解码系统,包括:
解码模式选择单元950,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
宽带立体声解码装置960,用于对宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到宽带立体声信号;
超宽带立体声编码装置970,用于对超宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到超宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到超宽带立体声信号。
当输入的为16kHz采样率的宽带立体声信号的码流,所述宽带立体声解码装置包括:
G.729.1解码器,用于对0~32kbps码率间的码流进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的MLT系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的MLT系数进行填充,对填充后的MLT系数进行MLT反变换得到宽带立体声信号的边带信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到宽带立体声信号的边带信号。
当输入的为32kHz采样率的超宽带立体声信号的码流,所述超宽带立体声解码装置包括:
G.729.1解码器,用于对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,上2采样到32kHz,得到超宽带立体声的0~7kHz频带的中值信号;
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的MLT系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的MLT系数进行填充,对填充后的MLT系数进行MLT反变换得到超宽带立体声的7kHz~14kHz的中值信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的7kHz~14kHz频带的中值信号;
56kbps层解码模块,用于当码率为56kbps时,根据56kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的0~7kHz频带的边带信号;
64kbps层解码模块,用于当码率为64kbps时,根据64kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的MLT系数,进行MLT反变换得到超宽带立体声的7kHz~14kHz频带的边带信号。
本发明实施例的技术方案是基于现有的嵌入式语音编码标准G.729.1编解码器及MLT编解码器,实现一套具有多层嵌套码流结构的语音、音频立体声嵌入式编解码器,可以编解码宽带和超宽带立体声信号。对于宽带立体声,通过构建40kbps、48kbps码率下的两个宽带立体声编码层,对输入立体声信号的左右声道分别求和与做差,得到中值信号与边带信号,利用嵌入式语音编码标准G.729.1与MLT编码方式对这两部分信息进行编码,在解码端分别解得这两部分的信息,合成得到宽带立体声信号,对宽带立体声信号编码的最大码率为48kbps;对于超宽带立体声,通过构建40kbps、48kbps、56kbps、64kbps码率下的四个超宽带立体声编码层,对输入的超宽带立体声信号的左右声道分别求和与做差,得到中值信号与边带信号,利用超宽带单声道编码器部分(0~48kbps)与调制重叠变换MLT编码方式对这两部分信息分别进行编码,在解码端解得这两部分的信号,合成得到超宽带立体声信号,对于超宽带立体声信号最大的编码速率为64kbps。
本发明实施例提出的编码方案,既可以处理8kHz、16kHz采样的单声道信号,又可以处理16kHz采样的宽带立体声信号和32kHz采样的超宽带立体声信号,使得本发明实施例提出的编码器能够处理的信号类型更加多样化,同时也能满足多媒体通信中对多声道音频信号处理的要求,其产生的码流具有相互嵌套的关系,能够根据信道的质量来控制传输的码率,这样使得本发明实施例的技术方案可以满足高质量的音/视频会议、电视电话会议、网络通信、移动通信、网络拥塞控制以及第三代和第四代移动通信对嵌入式语音与音频编码的广泛需求。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台用户终端设备执行本发明各个实施例所述的方法。这里所称的存储介质,如:ROM/RAM、磁盘、光盘等。
以上对本发明所提供的立体声编解码方法、编解码装置及编解码系统,通过具体实施例进行了详细介绍,值得说明的是,实施例中通过采用G.729.1编解码器与MLT编解码器对立体声嵌入式编解码原理进行了说明,但并不局限于实施例中具体的编解码器,可以通过采用其它的具有同样功能的编解码器。以上实施例的说明只是用于帮助理解本发明的方法及其思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (52)
1、一种立体声编码方法,其特征在于,包括以下步骤:
对立体声信号的采样率进行判断,选择相应的编码模式;
根据选择的编码模式,对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号;
对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流。
2、根据权利要求1所述的立体声编码方法,其特征在于,当选择宽带立体声编码模式时,对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流的步骤包括:
对所述中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
对所述边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流。
3、根据权利要求2所述的立体声编码方法,其特征在于,对于16kHz采样率的宽带立体声信号,对所述中值信号通过采用嵌入式语音编码标准G.729.1编码器进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流。
4、根据权利要求2所述的立体声编码方法,其特征在于,对于16kHz采样率的宽带立体声信号,对所述边带信号通过采用调制重叠变换编码器进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流;所述32kbp s~48kbps码率间的码流构成40kbps码率层和48kbps码率层,其中40kbps码率层包括边带信号中各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息,48kbps码率层包括边带信号中次重要子带的调制重叠变换系数量化索引信息。
5、根据权利要求1所述的立体声编码方法,其特征在于,当选择超宽带立体声编码模式时,对所述中值信号和边带信号分别进行嵌入式编码处理,形成嵌入式结构的码流的步骤包括:
对所述中值信号0~7kHz频带的信息进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
对所述中值信号的7kHz~14kHz频带的信息进行16kbps码率嵌入式编码,得到32kbps~48kbps码率间的码流;
对所述边带信号的0~7kHz频带的信息进行8kbps码率嵌入式编码,得到48kbps~56kbps码率间的码流;
对所述边带信号7kHz~14kHz频带的信息进行8kbps码率嵌入式编码,得到56kbps~64kbps码率间的码流。
6、根据权利要求5所述的立体声编码方法,其特征在于,对于32kHz采样率的超宽带立体声信号,对所述中值信号0~7kHz频带的信息通过采用嵌入式语音编码标准G.729.1编码器进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流。
7、根据权利要求5所述的立体声编码方法,其特征在于,对于32kHz采样率的超宽带立体声信号,对所述中值信号的7kHz~14kHz频带的信息通过采用调制重叠变换编码器进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流;所述32kbps~48kbps码率间的码流构成40kbps码率层和48kbps码率层,且所述40kbps码率层包括中值信号的7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息,所述48kbps码率层包括中值信号的7kHz~14kHz频带范围内次重要子带的调制重叠变换系数量化索引信息;所述调制重叠变换系数量化索引信息是按照子带能量由高到低排序依次写入码流。
8、根据权利要求5所述的立体声编码方法,其特征在于,对于32kHz采样率的超宽带立体声信号,对所述边带信号的0~7kHz频带的信息通过采用调制重叠变换编码器进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流;所述48kbps~56kbps码率间的码流构成56kbps码率层,包括边带信号0~7kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息;所述调制重叠变换系数量化索引信息是按照子带能量由高到低排序依次写入码流。
9、根据权利要求5所述的立体声编码方法,其特征在于,对于32kHz采样率的超宽带立体声信号,对所述边带信号7kHz~14kHz频带的信息通过采用调制重叠变换编码器进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流;所述56kbps~64kbps码率间的码流构成64kbps码率层,包括边带信号7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息;所述调制重叠变换系数量化索引信息是按照子带能量由高到低排序依次写入码流。
10、一种立体声编码装置,其特征在于,包括:
编码模式选择单元,用于对立体声信号的采样率进行判断,选择相应的编码模式;
中值信号获取单元,用于根据选择的编码模式,对立体声信号的左右声道求均值获取立体声的中值信号;
边带信号获取单元,用于根据选择的编码模式,对立体声信号的左右声道求差值获取立体声的边带信号;
中值信号编码单元,用于对所述立体声的中值信号进行嵌入式编码,得到嵌入式结构的码流;
边带信号编码单元,用于对所述立体声的边带信号进行嵌入式编码,得到嵌入式结构的码流。
11、根据权利要求10所述的立体声编码装置,其特征在于,当选择宽带立体声编码模式时,
所述中值信号编码单元,进一步用于对宽带立体声的中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
所述边带信号编码单元,进一步用于对宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流。
12、根据权利要求11所述的立体声编码装置,其特征在于,当立体声为16kHz采样率的宽带立体声信号时,所述中值信号编码单元包括:
G.729.1编码器,用于通过采用嵌入式语音编码标准G.729.1编码器对宽带立体声的中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流。
13、根据权利要求11所述的立体声编码装置,其特征在于,当立体声为16kHz采样率的宽带立体声信号时,所述边带信号编码单元包括:
40kbps层编码模块,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,所述码流中包括边带信号中各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,所述码流中包括边带信号中次重要子带的调制重叠变换系数量化索引信息。
14、根据权利要求10所述的立体声编码装置,其特征在于,当选择超宽带立体声编码模式时,
所述中值信号编码单元,进一步用于对超宽带立体声的中值信号进行全码率为48kbps的嵌入式编码,形成0~48kbps码率间的码流;
所述边带信号编码单元,进一步用于对超宽带立体声的边带信号进行16kbps码率的嵌入式编码,形成48kbps~64kbps码率间的码流。
15、根据权利要求14所述的立体声编码装置,其特征在于,所述中值信号编码单元包括:
中值信号低频编码模块,用于对超宽带立体声的中值信号的低频部分进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
中值信号高频编码模块,用于对超宽带立体声的中值信号的高频部分进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流。
16、根据权利要求14所述的立体声编码装置,其特征在于,所述边带信号编码单元包括:
边带信号低频编码模块,用于对超宽带立体声的边带信号的低频部分进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流;
边带信号高频编码模块,用于对超宽带立体声的边带信号的高频部分进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流。
17、根据权利要求15所述的立体声编码装置,其特征在于,当立体声为32kHz采样率的超宽带立体声信号时,所述中值信号低频编码模块包括:
G.729.1编码器,用于通过采用嵌入式语音编码标准G.729.1编码器对超宽带立体声的0~7kHz频带的中值信号下2采样到16kHz进行32kbps的嵌入式编码,得到0~32kbps码率间的码流。
18、根据权利要求15所述的立体声编码装置,其特征在于,当立体声为32kHz采样率的超宽带立体声信号时,所述中值信号高频编码模块包括:
40kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,所述码流中包括中值信号的7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流,所述码流中包括中值信号的7kHz~14kHz频带范围内次重要子带的调制重叠变换系数量化索引信息。
19、根据权利要求16所述的立体声编码装置,其特征在于,当立体声为32kHz采样率的超宽带立体声信号时,所述边带信号低频编码模块包括:
56kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的0~7kHz频带的边带信号进行8kbps码率的嵌入式编码,得到48kbps~56kbps码率间的码流,所述码流中包括边带信号0~7kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息。
20、根据权利要求16所述的立体声编码装置,其特征在于,当立体声为32kHz采样率的超宽带立体声信号时,所述边带信号高频编码模块包括:
64kbps层编码模块,用于通过采用调制重叠变换对超宽带立体声的7kHz~14kHz频带的边带信号进行8kbps码率的嵌入式编码,得到56kbps~64kbps码率间的码流,所述码流中包括边带信号7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息。
21、一种立体声解码方法,其特征在于,包括以下步骤:
对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
根据选择的解码模式,对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号;
对解码得到的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到立体声信号。
22、根据权利要求21所述的立体声解码方法,其特征在于,当选择宽带立体声解码模式时,所述对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号步骤包括:
对0~32kbps码率间的码流,进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
对32kbps~48kbps码率间的码流,进行16kbps码率的嵌入式解码,得到宽带立体声的边带信号。
23、根据权利要求22所述的立体声解码方法,其特征在于,对于16kHz采样率的宽带立体声信号的码流,对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号。
24、根据权利要求22所述的立体声解码方法,其特征在于,对于16kHz采样率的宽带立体声信号的码流,对32kbps~48kbps码率间的码流,通过采用调制重叠反变换解码器进行16kbps码率的嵌入式解码,得到宽带立体声的边带信号;所述调制重叠反变换解码器对不同长度的码流进行解码,按照子带能量由高到低排序优先解码出码流中重要子带的信息。
25、根据权利要求24所述的立体声解码方法,其特征在于,如果解码端收到40kbps码率,则解码得到宽带立体声的边带信号0~7kHz频带范围内的重要子带的调制重叠变换系数,对0~7kHz频带范围内的次重要子带的调制重叠变换系数通过采用噪声填充技术生成。
26、根据权利要求22所述的立体声解码方法,其特征在于,
当码率为48kbps时,完全解码出宽带立体声的中值信号与边带信号;
当码率为40kbps时,解码出宽带立体声的中值信号和含有重要子带信息的宽带立体声的边带信号;
当码率小于等于32kbps,能解码出宽带立体声的中值信号。
27、根据权利要求21所述的立体声解码方法,其特征在于,当选择超宽带立体声解码模式时,所述对于嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号的步骤包括:
对0~32kbps码率间的码流,进行全码率为32kbps的嵌入式解码,得到超宽带立体声的0~7kHz频带的中值信号;
对32kbps~48kbps码率间的码流,进行16kbps码率的嵌入式解码,得到超宽带立体声的7kHz~14kHz频带的中值信号;
对48kbps~56kbps码率间的码流,进行8kbps码率的嵌入式解码,得到超宽带立体声的0~7kHz频带的边带信号;
对56kbps~64kbps码率间的码流,进行8kbps码率的嵌入式解码,得到超宽带立体声的7kHz~14kHz频带的边带信号。
28、根据权利要求27所述的立体声解码方法,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,得到超宽带立体声的0~7kHz频带的中值信号。
29、根据权利要求27所述的立体声解码方法,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,对32kbps~48kbps码率间的码流,通过采用调制重叠反变换解码器进行16kbps码率的嵌入式解码,得到超宽带立体声的0~7kHz频带的中值信号;对48kbps~56kbps码率间的码流,通过采用调制重叠反变换解码器进行8kbps码率的嵌入式解码,得到超宽带立体声的0~7kHz频带的边带信号;对56kbps~64kbps码率间的码流,通过采用调制重叠变换解码器进行嵌入式解码,得到超宽带立体声的7kHz~14kHz频带的边带信号;所述调制重叠反变换解码器对不同长度的码流进行解码,按照子带能量由高到低排序优先解码出码流中重要子带的信息。
30、根据权利要求29所述的立体声解码方法,其特征在于,如果解码端收到40kbps码率,则解码得到超宽带立体声的中值信号7kHz~14kHz频带范围内的重要子带的调制重叠变换系数,对7kHz~14kHz频带范围内的次重要子带的调制重叠变换系数通过采用噪声填充技术粗略生成。
31、根据权利要求27所述的立体声解码方法,其特征在于,
当码率为64kbps时,完全解码出超宽带立体声的中值信号与包括0~14kHz频带信息的超宽带立体声的边带信号;
当码率为56kbps时,解码出超宽带立体声的中值信号和超宽带立体声的0~7kHz频带的边带信号;
当码率为48kbps时,解码出超宽带立体声的中值信号;
当码率小于等于32kbps时,解码出超宽带立体声的0~7kHz频带的中值信号。
32、一种立体声解码装置,其特征在于,包括:
解码模式选择单元,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
码率层选择单元,用于根据选择的解码模式,对嵌入式结构的码流选择不同的码率层;
中值信号解码单元,用于对选择的码率层解码得到立体声的中值信号;
边带信号解码单元,用于对选择的码率层解码得到立体声的边带信号;
立体声信号合成单元,用于对解码得到的中值信号和边带信号进行求和与求差,求得立体声的左右声道,合成得到立体声信号。
33、根据权利要求32所述的立体声解码装置,其特征在于,当选择宽带立体声解码模式时,
所述中值信号解码单元,进一步用于对0~32kbps码率间的码流进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
所述边带信号解码单元,进一步用于对32kbps~48kbps码率间的码流进行16kbps码率的嵌入式解码,得到宽带立体声的边带信号。
34、根据权利要求33所述的立体声解码装置,其特征在于,对于16kHz采样率的宽带立体声信号的码流,所述中值信号解码单元包括:
G.729.1解码器,用于对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号。
35、根据权利要求33所述的立体声解码装置,其特征在于,对于16kHz采样率的宽带立体声信号的码流,所述边带信号解码单元包括:
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的调制重叠变换系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的调制重叠变换系数进行填充,对填充后的调制重叠变换系数进行调制重叠反变换得到宽带立体声信号的边带信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到的全部子带的调制重叠变换系数,进行调制重叠反变换得到宽带立体声信号的边带信号。
36、根据权利要求32所述的立体声解码装置,其特征在于,当选择超宽带立体声解码模式时,
所述中值信号解码单元,进一步用于对0~48kbps码率间的码流进行全码率为48kbps嵌入式解码,得到超宽带立体声的中值信号;
所述边带信号解码单元,进一步用于对48kbps~64kbps码率间的码流进行16kbps码率的嵌入式解码,得到超宽带立体声的边带信号。
37、根据权利要求36所述的立体声解码装置,其特征在于,所述中值信号解码单元包括:
中值信号低频解码模块,用于对0~32kbps码率间的码流进行全码率为32kbps的嵌入式解码,得到超宽带立体声的0~7kHz频带的中值信号;
中值信号高频解码模块,用于对32kbps~48kbps码率间的码流进行16kbps码率的嵌入式解码,得到超宽带立体声的7kHz~14kHz频带的中值信号。
38、根据权利要求36所述的立体声解码装置,其特征在于,所述边带信号解码单元包括:
边带信号低频解码模块,用于对48kbps~56kbps码率间的码流进行8kbps码率的嵌入式解码,得到超宽带立体声的0~7kHz频带的边带信号;
边带信号高频解码模块,用于对56kbps~64kbps码率间的码流进行8kbps码率的嵌入式解码,得到超宽带立体声的7kHz~14kHz频带的边带信号。
39、根据权利要求37所述的立体声解码装置,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,所述中值信号低频解码模块包括:
G.729.1解码器,用于对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,上2采样到32kHz,得到超宽带立体声的0~7kHz频带的中值信号
40、根据权利要求37所述的立体声解码装置,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,所述中值信号高频解码模块包括:
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的调制重叠变换系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的调制重叠变换系数进行填充,对填充后的调制重叠变换系数进行调制重叠反变换得到超宽带立体声的7kHz~14kHz的中值信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到超宽带立体声的7kHz~14kHz频带的中值信号。
42、根据权利要求38所述的立体声解码装置,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,所述边带信号高频解码模块包括:
64kbps层解码模块,用于当码率为64kbps时,根据64kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到超宽带立体声的7kHz~14kHz频带的边带信号。
43、一种立体声编码系统,其特征在于,包括:
编码模式选择单元,用于对立体声信号的采样率进行判断,选择相应的编码模式;
宽带立体声编码装置,用于对宽带立体声的左右声道进行求均值、求差值,分别得到宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成宽带嵌入式结构的码流;
超宽带立体声编码装置,用于对超宽带立体声的左右声道进行求均值、求差值,分别得到超宽带立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行嵌入式编码处理,形成超宽带嵌入式结构的码流。
44、根据权利要求43所述的立体声编码系统,其特征在于,当选择宽带立体声编码模式时,选择宽带立体声编码装置进行嵌入式编码,所述宽带立体声编码装置包括:
中值信号获取单元,用于对宽带立体声信号的左右声道求均值获取宽带立体声的中值信号;
边带信号获取单元,用于对宽带立体声信号的左右声道求差值获取宽带立体声的边带信号;
中值信号编码单元,用于对所述宽带立体声的中值信号进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
边带信号编码单元,用于对所述宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到32kbps~48kbps码率间的码流。
45、根据权利要求44所述的立体声编码系统,其特征在于,当输入的信号为16kHz采样率的宽带立体声信号时,所述中值信号编码单元包括:
G.729.1编码器,用于通过采用嵌入式语音编码标准G.729.1编码器对所述宽带立体声的中值信号进行32kbps码率编码,得到0~32kbps码率间的码流;
及所述边带信号编码单元包括:
40kbps层编码模块,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,且码流中包括了边带信号中各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换编码器对宽带立体声的边带信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,且码流中只包括了边带信号中次重要子带的调制重叠变换系数量化索引信息。
46、根据权利要求43所述的立体声编码系统,其特征在于,当选择超宽带立体声编码模式时,选择超宽带立体声编码装置进行嵌入式编码,所述超宽带立体声编码装置包括:
中值信号获取单元,用于对超宽带立体声信号的左右声道求均值获取超宽带立体声的中值信号;
边带信号获取单元,用于对超宽带立体声信号的左右声道求差值获取超宽带立体声的边带信号;
中值信号编码单元,用于对所述超宽带立体声的中值信号进行全码率为48kbps的嵌入式编码,得到0~48kbps码率间的码流;
边带信号编码单元,用于对超宽带立体声的边带信号进行16kbps码率的嵌入式编码,得到48kbps~64kbps码率间的码流。
47、根据权利要求46所述的立体声编码系统,其特征在于,当输入的信号为32kHz采样率的超宽带立体声信号时,
所述中值信号编码单元包括:
G.729.1编码器,用于通过采用嵌入式语音编码标准G.729.1编码器对超宽带立体声的0~7kHz频带的中值信号下2采样到16kHz进行全码率为32kbps的嵌入式编码,得到0~32kbps码率间的码流;
40kbps层编码模块,用于通过采用调制重叠变换编码器对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中包括了中值信号的7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和重要子带的调制重叠变换系数量化索引信息;
48kbps层编码模块,用于通过采用调制重叠变换编码器对超宽带立体声的7kHz~14kHz频带的中值信号进行16kbps码率编码,得到32kbps~48kbps码率间的码流,所述码流中只包括了中值信号的7kHz~14kHz频带范围内次重要子带的调制重叠变换系数量化索引信息;
所述边带信号编码单元包括:
56kbps层编码模块,用于通过采用调制重叠变换编码器对超宽带立体声的0~7kHz频带的边带信号进行8kbps码率编码,得到48kbps~56kbps码率间的码流,所述码流中包括了边带信号0~7kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息;
64kbps层编码模块,用于通过采用调制重叠变换编码器对超宽带立体声的7kHz~14kHz频带的边带信号进行8kbps码率编码,得到56kbps~64kbps码率间的码流,所述码流中包括了边带信号7kHz~14kHz频带范围内各个子带的幅度包络量化信息、分类控制信息和所有子带的调制重叠变换系数量化索引信息。
48、一种立体声解码系统,其特征在于,包括:
解码模式选择单元,用于对嵌入式结构的码流的采样率进行判断,选择相应的解码模式;
宽带立体声解码装置,用于对宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到宽带立体声信号;
超宽带立体声编码装置,用于对超宽带立体声的嵌入式结构的码流选择不同的码率层进行嵌入式解码,分别得到超宽带立体声的中值信号和边带信号,进行求和与求差得到立体声的左右声道,合成得到超宽带立体声信号。
49、根据权利要求48所述的立体声解码系统,其特征在于,当选择宽带立体声解码模式时,选择宽带立体声解码装置进行嵌入式解码,所述宽带立体声解码装置包括:
码率层选择单元,用于对宽带立体声的嵌入式结构的码流选择不同的码率层;
中值信号解码单元,用于对0~32kbps码率间的码流进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
边带信号解码单元,用于对32kbps~48kbps码率间的码流进行16kbps码率的嵌入式解码,得到宽带立体声的边带信号;
立体声信号合成单元,用于对解码得到的宽带立体声的中值信号和边带信号进行求和与求差,分别求得立体声的左右声道,合成得到宽带立体声信号。
50、根据权利要求49所述的立体声解码系统,其特征在于,对于16kHz采样率的宽带立体声信号的码流,所述中值信号解码单元包括:
G.729.1解码器,用于对0~32kbps码率间的码流进行全码率为32kbps的嵌入式解码,得到宽带立体声的中值信号;
及所述边带信号解码单元包括:
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的调制重叠变换系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的调制重叠变换系数进行填充,对填充后的调制重叠变换系数进行调制重叠反变换得到宽带立体声信号的边带信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbps码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到宽带立体声信号的边带信号。
51、根据权利要求48所述的立体声解码系统,其特征在于,当选择超宽带立体声解码模式时,选择超宽带立体声解码装置进行嵌入式解码,所述超宽带立体声解码装置包括:
码率层选择单元,用于对超宽带立体声的嵌入式结构的码流选择不同的码率层;
中值信号解码单元,用于对0~48kbps码率间的码流进行全码率为48kbps嵌入式解码,得到超宽带立体声的中值信号;;
边带信号解码单元,用于对48kbps~64kbps码率间的码流进行16kbps码率的嵌入式解码,得到超宽带立体声的边带信号;
立体声信号合成单元,用于对解码得到的超宽带立体声的中值信号和边带信号进行求和与求差,分别求得立体声的左右声道,合成得到超宽带立体声信号。
52、根据权利要求51所述的立体声解码系统,其特征在于,对于32kHz采样率的超宽带立体声信号的码流,
所述中值信号解码单元包括:
G.729.1解码器,用于对0~32kbps码率间的码流,通过采用嵌入式语音编码标准G.729.1解码器进行全码率为32kbps的嵌入式解码,上2采样到32kHz,得到超宽带立体声的0~7kHz频带的中值信号;
40kbps层解码模块,用于当码率为40kbps时,根据所述40kbps层码流信息进行16kbps码率的嵌入式解码得到包括重要子带的调制重叠变换系数,并通过采用噪声填充技术对码流中缺少的48kbps解码层的调制重叠变换系数进行填充,对填充后的调制重叠变换系数进行调制重叠反变换得到超宽带立体声的7kHz~14kHz的中值信号;
48kbps层解码模块,用于当码率为48kbps时,根据所述40kbps和48kbps两层码流信息进行16kbp s码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到超宽带立体声的7kHz~14kHz频带的中值信号;
所述边带信号解码单元包括:
56kbps层解码模块,用于当码率为56kbps时,根据56kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到超宽带立体声的0~7kHz频带的边带信号;
64kbps层解码模块,用于当码率为64kbps时,根据64kbps层码流信息进行8kbps码率的嵌入式解码得到包括全部子带的调制重叠变换系数,进行调制重叠反变换得到超宽带立体声的7kHz~14kHz频带的边带信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008100944366A CN101572088A (zh) | 2008-04-30 | 2008-04-30 | 立体声编解码方法、编解码器及编解码系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008100944366A CN101572088A (zh) | 2008-04-30 | 2008-04-30 | 立体声编解码方法、编解码器及编解码系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101572088A true CN101572088A (zh) | 2009-11-04 |
Family
ID=41231421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2008100944366A Pending CN101572088A (zh) | 2008-04-30 | 2008-04-30 | 立体声编解码方法、编解码器及编解码系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101572088A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101964202A (zh) * | 2010-09-09 | 2011-02-02 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
CN102280107A (zh) * | 2010-06-10 | 2011-12-14 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
CN103069721A (zh) * | 2010-08-24 | 2013-04-24 | 杜比国际公司 | 降低调频无线电广播噪声中的伪不相关性 |
CN103854650A (zh) * | 2012-11-30 | 2014-06-11 | 中兴通讯股份有限公司 | 立体声音频编码的方法及装置 |
CN103971692A (zh) * | 2013-01-28 | 2014-08-06 | 北京三星通信技术研究有限公司 | 音频处理方法、装置及系统 |
CN106796798A (zh) * | 2014-07-28 | 2017-05-31 | 弗劳恩霍夫应用研究促进协会 | 用于使用独立噪声填充生成增强信号的装置和方法 |
CN107293303A (zh) * | 2017-06-16 | 2017-10-24 | 苏州蜗牛数字科技股份有限公司 | 一种多声道语音丢包补偿方法 |
CN110462733A (zh) * | 2017-03-31 | 2019-11-15 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN112509591A (zh) * | 2020-12-04 | 2021-03-16 | 北京百瑞互联技术有限公司 | 一种音频编解码方法及系统 |
CN117476024A (zh) * | 2023-11-29 | 2024-01-30 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、装置、可读存储介质 |
-
2008
- 2008-04-30 CN CNA2008100944366A patent/CN101572088A/zh active Pending
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102280107B (zh) * | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
CN102280107A (zh) * | 2010-06-10 | 2011-12-14 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
US9123329B2 (en) | 2010-06-10 | 2015-09-01 | Huawei Technologies Co., Ltd. | Method and apparatus for generating sideband residual signal |
CN103069721A (zh) * | 2010-08-24 | 2013-04-24 | 杜比国际公司 | 降低调频无线电广播噪声中的伪不相关性 |
US9094754B2 (en) | 2010-08-24 | 2015-07-28 | Dolby International Ab | Reduction of spurious uncorrelation in FM radio noise |
CN103069721B (zh) * | 2010-08-24 | 2016-03-23 | 杜比国际公司 | 降低调频无线电广播噪声中的伪不相关性 |
CN101964202B (zh) * | 2010-09-09 | 2012-03-28 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
CN101964202A (zh) * | 2010-09-09 | 2011-02-02 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
CN103854650A (zh) * | 2012-11-30 | 2014-06-11 | 中兴通讯股份有限公司 | 立体声音频编码的方法及装置 |
CN103971692A (zh) * | 2013-01-28 | 2014-08-06 | 北京三星通信技术研究有限公司 | 音频处理方法、装置及系统 |
US11705145B2 (en) | 2014-07-28 | 2023-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
CN106796798A (zh) * | 2014-07-28 | 2017-05-31 | 弗劳恩霍夫应用研究促进协会 | 用于使用独立噪声填充生成增强信号的装置和方法 |
US12205604B2 (en) | 2014-07-28 | 2025-01-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling identified by an identification vector |
CN106796798B (zh) * | 2014-07-28 | 2021-03-05 | 弗劳恩霍夫应用研究促进协会 | 用于使用独立噪声填充生成增强信号的装置和方法 |
US11908484B2 (en) | 2014-07-28 | 2024-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon |
US11264042B2 (en) | 2014-07-28 | 2022-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling information which comprises energy information and is included in an input signal |
CN110462733A (zh) * | 2017-03-31 | 2019-11-15 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
US11386907B2 (en) | 2017-03-31 | 2022-07-12 | Huawei Technologies Co., Ltd. | Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder |
US11894001B2 (en) | 2017-03-31 | 2024-02-06 | Huawei Technologies Co., Ltd. | Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder |
US12154578B2 (en) | 2017-03-31 | 2024-11-26 | Huawei Technologies Co., Ltd. | Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder |
CN107293303A (zh) * | 2017-06-16 | 2017-10-24 | 苏州蜗牛数字科技股份有限公司 | 一种多声道语音丢包补偿方法 |
CN112509591A (zh) * | 2020-12-04 | 2021-03-16 | 北京百瑞互联技术有限公司 | 一种音频编解码方法及系统 |
CN112509591B (zh) * | 2020-12-04 | 2024-05-14 | 北京百瑞互联技术股份有限公司 | 一种音频编解码方法及系统 |
CN117476024A (zh) * | 2023-11-29 | 2024-01-30 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、装置、可读存储介质 |
CN117476024B (zh) * | 2023-11-29 | 2024-09-27 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、装置、可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101572088A (zh) | 立体声编解码方法、编解码器及编解码系统 | |
US8218775B2 (en) | Joint enhancement of multi-channel audio | |
CN101556799B (zh) | 一种音频解码方法和音频解码器 | |
JP4781153B2 (ja) | オーディオデータ符号化及び復号化装置、並びにオーディオデータ符号化及び復号化方法 | |
CN113470667B (zh) | 语音信号的编解码方法、装置、电子设备及存储介质 | |
CN101842832B (zh) | 编码装置和解码装置 | |
RU2439718C1 (ru) | Способ и устройство для обработки звукового сигнала | |
CN101128866B (zh) | 多声道音频编码中的优化保真度和减少的信令 | |
KR101221918B1 (ko) | 신호 처리 방법 및 장치 | |
JP3354864B2 (ja) | ビット率の調節可能なオーディオ符号化/復号化方法及び装置 | |
CN103187065B (zh) | 音频数据的处理方法、装置和系统 | |
JPH11186911A (ja) | ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 | |
JPH11317672A (ja) | ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置 | |
WO2004023457A1 (ja) | 音響符号化装置及び音響符号化方法 | |
TW200818122A (en) | Concept for combining multiple parametrically coded audio sources | |
CN1922660B (zh) | 通信装置和通信方法 | |
CN101572087B (zh) | 嵌入式语音或音频信号编解码方法和装置 | |
US7835915B2 (en) | Scalable stereo audio coding/decoding method and apparatus | |
US8024187B2 (en) | Pulse allocating method in voice coding | |
KR20060036724A (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
CN108417219A (zh) | 一种适应于流媒体的音频对象编解码方法 | |
Singh et al. | Design of medium to low bitrate neural audio codec | |
WO2010102537A1 (zh) | 降低多描述编解码冗余度的方法和装置 | |
Chen et al. | Scalefactor based bit shift FGS audio coding | |
Shen et al. | A progressive algorithm for perceptual coding of digital audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20091104 |