CN1459092A - 编码设备、解码设备和广播系统 - Google Patents
编码设备、解码设备和广播系统 Download PDFInfo
- Publication number
- CN1459092A CN1459092A CN02800600A CN02800600A CN1459092A CN 1459092 A CN1459092 A CN 1459092A CN 02800600 A CN02800600 A CN 02800600A CN 02800600 A CN02800600 A CN 02800600A CN 1459092 A CN1459092 A CN 1459092A
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- data
- integrated
- data set
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一个广播系统100包括一个广播站110与多个住宅120。在该广播系统110与每个住宅120中,分别安装一个编码设备111与一个解码设备122。该编码设备111包括:一个转换单元113,它提取某个声频信号的一帧,并将对应于一个预定时段的该提取的帧转换为某个频域内的一个频谱;一个频谱数据综合单元114,它将该频谱中所包含的至少两个频谱数据集合综合为数目更少的频谱数据集合,并将它们作为综合数据集合输出;以及一个量化单元115与一个编码单元116,它们量化这些综合数据集合并进行编码以便产生并输出该编码数据。该解码设备122包括:一个解码单元124与一个反量化单元125,它们对输入的编码数据进行解码并反量化以便产生反量化数据,而且将该反量化数据转换为该频域内的一个频谱;一个频谱数据扩展单元126,它将该频谱中的每个综合数据集合扩展为至少两个频谱数据集合;以及一个逆转换单元127,它将每个扩展频谱数据集合转换为时域内的一个声频信号并输出该声频信号。
Description
本发明的背景
(1)本发明的领域
本发明涉及对数字声频数据编码与解码以便复现高质量声音的技术。
(2)相关技术的说明
近年来开发了各种声频压缩方法。MPEG-2高级声频信号编码(MPEG-2 AAC)就是这些压缩方法中的一种,它在“ISO/IEC 13818-7(MPEG-2高级声频信号编码,AAC)”中有详细定义。下述内容简单说明与本发明有关的MPEG-2 AAC的特点。
下面首先描述由一个传统编码设备与一个传统解码设备进行的编码与解码。该编码设备接收数字声频数据,并以固定的间隔从该接收到的声频数据提取声频数据。(下文将这种提取的声频数据称为“采样数据”。)然后,该编码设备将时域的采样数据按照修正离散余弦变换(MDCT)转换为频域的频谱数据。然后,这个频谱数据被划分成许多组,而且每一组都经过标准化和量化处理。该量化数据按照霍夫曼编码方法编码而产生一个编码信号。该编码信号被转换为一个MPEG-2 AAC位流并被输出。这个位流或者经由某种传输媒体,譬如经由某个广播电波和一个通信网络被发送到该解码设备,或者被记录到某个记录媒体,譬如一张光盘(包括一张致密光盘(CD)和一张数字通用光盘(DVD))、一个半导体和一个硬盘。
该解码设备通过一条传输通道或者通过一个记录媒体来接收由该编码设备编码的MPEG-2 AAC位流。然后,该解码设备从该接收到的位流中提取该编码信号,并对该提取的编码信号进行解码。更准确地讲,在提取该编码信号后,该解码设备将该编码信号的一个流格式转换为一个适合数据处理的格式。然后,该解码设备对这个编码信号解码以便产生量化数据,并对该量化数据反量化以便产生频域内的频谱数据。接着,该解码设备将该频谱数据按照修正离散余弦反变换(IMDCT)转换为时域的采样数据。如此产生的各个采样数据集合被按顺序进行组合,并作为数字声频数据输出。
在实际的MPEG-2 AAC编码中,还采用了其他技术,包括增益控制、时序噪声整形(TNS)、一个心理声学模型、M/S(中央/侧面)立体声、强度立体声、预估和一个位储存器。
由该编码设备编码并被发送到该解码设备的这种声频数据的品质是可以测量的,譬如通过编码后声频数据的一个再现频带。举例来说,如果一个输入信号被以44.1kHz的采样频率采样,那么这个信号的一个再现频带为22.05kHz。如果将具有22.05kHz再现频带或具有一个接近22.05kHz的更宽的再现频带的声频信号编码为编码声频数据而不发生退化,并将所有编码声频数据都发送到该解码设备,那么这个声频数据就可以被再现为高品质的声音。但是,一个再现频带的宽度影响到频谱数据值的数量,这又反过来影响到供传输的数据数量。譬如,当一个输入信号被以44.1kHz的采样频率采样时,从这个信号产生的频谱数据由1024个采样组成,它具有22.05kHz的再现频带。为了保证这22.05kHz的再现频带,必须传输该频谱数据中的全部1024个采样。这就需要一个声频信号能被有效编码以便保持该编码声频信号的一个长度在某个传输通道的一个传输速率范围之内。
然而,通过一个低速传输通道(譬如便携式电话的传输通道)来传输该频谱数据的多达1024个采样是不现实的。这就是说,如果具有一个宽再现频带的所有频谱数据以如此低的传输速率传输,而同时整个频谱数据的长度被调整得适合该低传输速率,那么分配给每个频带的一个数据长度就变得非常小。这使量化噪声的影响更加强烈,所以经过编码后声音品质下降。
为了防止这种退化,在许多声频信号编码方法中(包括MPEG-2AAC)通过对该频谱数据数值分配权系数和不传输低加权的数值来实现有效的声频信号传输。采用这种方法时,足够的数据长度被分配给对人类听觉重要的某个低频带的频谱数据以便加强它的编码精度,同时某个高频带的频谱数据则被认为不太重要而不一定被传输。
尽管这些技术已被应用于MPEG-2 AAC,现在仍然需要能获得高品质再现和更好压缩效率的声频编码技术。换句话说,对在一个较高频带以及一个低频带上以某个低传输速率来传输一个声频信号的技术,现在存在一种日益增长的需求。
本发明的概要
本发明就是为了对上述日益增长的需求作出响应。根据本发明的一个编码设备接收一个声频信号并对其编码,它包括:一个转换单元,可以运行它以便提取一部分该接收到的声频信号,该提取的部分形成对应于某个预定时间段的一个帧,而且可以运行它以便将该提取的部分转换为频域的一个频谱,该频谱包括多个频谱数据集合;一个综合单元,可以运行它以便按照一个预定的操作将该频谱的一部分中至少两个频谱数据集合综合为数目更少的频谱数据集合,下文将称其为综合数据,而且可以运行它以便输出这些数目更少的综合数据集合,其中该部分频谱对应于某个预定的频带;以及一个编码单元,可以运行它以便量化这些综合数据集合并进行编码,从而生成并输出该编码数据。
对上述编码设备,该综合单元采用能够减少需要传输的编码数据长度的预定操作对多个频谱数据集合进行综合。这可以使该编码数据经由一条低速率传输通道被可靠地传输。除此之外,本发明还有如下所述的另一个优点。上述综合单元对该预定频带内的至少两个频谱数据集合进行综合。举例来说,设定一个高频带来作为上述预定频带,并使该综合单元对这个人类听觉不太灵敏的高频带内的频谱数据进行综合,就可以使由于该综合产生的、可以觉察的声音品质退化达到最小。与根本不传输某个频带内的一个声频信号的某种传统技术不同,本发明传输能代表该某个频带内频谱数据的综合数据。所以,这就使声音品质由于该传输的综合数据而得到提高。这样,本发明既能够降低编码数据长度,又能够传输高品质的编码数据。
本发明的另一个优点是,因为该预定频带内的至少两个频谱数据集合只不过是被综合为数目更少的频谱数据集合,所以由本发明的编码设备产生的编码数据可以采用某种传统解码设备来解码。尽管用该传统解码设备再现的声音品质在该较高频带与一个原始采样声频信号之间有些不同是不可避免的,但通过设置一个人类听觉不太灵敏的较高频带作为上述预定频带就能够使这个可以觉察的声音品质变化降到最小。
本发明的另一个编码设备将频域内相邻或不相邻排列的至少两个频谱数据集合综合为至少一个综合数据集合。这可以使每个频带内的频谱数据被用作综合数据,而不是仅仅使用各个所选频带内的频谱数据。尽管一个解码设备不能从该综合数据与频谱数据完全恢复原始的声音,但上述编码设备能够大幅度降低需要传输的某个编码声频位流的长度,而且还依然能够保证再现接近该原始声音的高品质声音。
对于本发明的另一个编码设备,某种综合方法是根据构成该频谱的多个频谱数据集合中的至少一个集合来确定的,而且该频谱中至少两个频谱数据集合采用该确定的综合方法进行综合。这样就可能选择一种适合原始声音的综合方法并采用该选定的综合方法来综合频谱数据。通过不传输那些估计对恢复该原始声音不必要的频谱数据,本编码设备能降低需要传输的某个编码声频位流的长度,并同时使该综合产生的、可觉察的声音品质退化最小。
本发明的一个解码设备接收由一帧某个声频信号产生的编码数据,对其解码,并恢复该声频信号。该帧由一个编码设备以预定的时间间隔提取自该声频信号。该解码设备包括:一个反量化单元,可以运行它以便对接收到的数据进行解码并反量化从而产生反量化数据,而且可以运行它以便将该反量化数据转换为频域内的一个频谱,其中该频谱包括多个频谱数据集合;一个扩展单元,可以运行它以便利用一个预定的逆操作将该多个频谱数据集合中某些频谱数据集合内的每一个集合扩展为至少两个频谱数据集合,该某些频谱数据集合对应于一个预定的频带;以及一个逆转换单元,可以运行它以便将每个扩展频谱数据集合转换为时域的一个声频信号并输出该声频信号。
上述解码设备能够从由本发明的编码设备产生的编码数据中恢复一个所含频谱数据集合数目与该原始频谱相同的频谱。与不传输某个频带内频谱数据的某种传统技术不同,本解码设备能够在这个频带内恢复接近于该原始频谱数据的频谱数据。所以,本解码设备的一个优点是能从具有某个较短长度的编码数据来恢复具有某个较宽频带的一个声频信号。
附图的简单说明
根据下面结合为演示本发明一个特定实施例所附的附图而作的说明,本发明的这些以及其他目的、优点和特点将会变得显而易见。这些附图为:
图1是说明本发明的一个实施例的某个广播系统结构的方框图;
图2A表示由一个图1所示声频信号输入单元所提取的声频数据沿一个时间轴的某个放大波形的一个示例;
图2B表示由一个图1所示转换单元通过MDCT变换由沿该时间轴的声频数据生成的、沿一个频率轴的频谱数据的一个示例;
图3表示该转换单元将该频谱数据分配到其中的示例比例因子频带;
图4A表示该转换单元输出的、综合前的示例频谱数据;
图4B表示由某个图1所示频谱数据综合单元综合后的示例频谱数据;
图5是流程图,表示图4A与图4B所示频谱数据综合单元进行的综合操作;
图6表示执行图4A与图4B所示频谱数据综合时生成的示例综合信息;
图7A表示要在其中插入该综合信息的、某个MPEG-2 AAC声频位流的一种示例结构;
图7B表示要在其中插入该综合信息的、某个MPEG-2 AAC声频位流的另一种示例结构;
图8A表示图1所示的一个反量化单元输出的未扩展频谱数据的一个示例;
图8B表示经由图1所示的一个扩展单元扩展后的示例频谱数据;
图9是流程图,表示图8所示的、由该频谱数据扩展单元执行的扩展处理;
图10A表示一帧内某个综合目标范围的一个示例;
图10B表示一帧内某个综合目标范围的另一个示例;
图10C表示一帧内几个综合目标范围的另一个示例;
图11A表示对不同帧提供不同综合目标范围的一个示例状态;
图11B表示对不同帧提供不同综合目标范围的另一个示例状态;
图12A表示需要综合到一起的频谱数据采样的一个示例组合;
图12B表示需要综合到一起的频谱数据采样的另一个示例组合;
图12C表示需要综合到一起的频谱数据采样的另一个示例组合;
图13A表示从该频谱数据中两个相邻采样计算一个综合值的一个示例方法;
图13B表示从该频谱数据中两个相邻采样计算一个综合值的另一个示例方法;
图14A表示在该频谱数据被综合前,某个较高频带内的频谱数据与各比例因子频带的一个示例;
图14B表示该较高频带内的综合频谱数据与各比例因子频带之间的一个示例关系;
图14C表示根据本发明的该实施例的、该较高频带内的综合频谱数据与各比例因子频带之间的关系;
优选实施例的说明
下面说明一个基于各种实施例与例图的本发明的广播系统100。
图1是表示根据本发明的一个实施例的广播系统100的结构方框图。广播系统100包括一个广播站110与一组住宅120。广播站110采用本发明的一种编码方法对一个声频信号编码,并经由一个卫星广播电波进行广播。各住宅120借助一个广播卫星130接收这个广播电波。在住宅120中,包含在该接收到的广播电波中的编码声频数据被解码,以便再现成为电影配音、音乐等等。
广播站110
广播站110包括一个编码设备111和一个发送设备118。编码设备111可以产生一个其长度比某个传统声频位流更短的编码声频位流。而且,如果某个传统解码设备与本设备均利用一个长度相同的声频位流,那么这个编码设备111能够产生一个可由某个解码设备解码成为一个品质高于该传统设备的声频信号的声频位流。
编码设备111的实现可以通过由某台通用计算机执行的一个程序,也可以通过硬件,譬如一个专用电路板或一个LSI(大规模集成电路)。编码设备111包括一个声频信号输入单元112、一个转换单元113、一个频谱数据综合单元114、一个量化单元115、一个编码单元116和一个流输出单元117。
声频信号输入单元112接收以某个采样频率(譬如44.1kHz)采样的数字声频数据。声频信号输入单元112从这个数字声频数据提取每组1024个相邻采样。这1024个采样形成作为一个编码单元的一帧。更具体地说,声频信号输入单元112以22.7毫秒的间隔输出由2048个采样组成的数字声频数据,它包括上述的1024个采样以及该1024个采样之前与之后所得的两个512采样的集合。这两个该被提取的512采样的集合与本次提取前、后提取的其他512采样的集合重叠。下文将这些由声频信号输入单元112提取的数字声频数据称为“采样数据”。
转换单元113将这些时域采样数据转换为频域频谱数据。更详细地讲,根据MDCT,转换单元113转换由2048个采样组成的采样数据来产生也包括2048个采样的频谱数据。按照MDCT产生的这一频谱数据的采样对称排列,所以只有它们的半数(即1024个采样)被用于随后的运算。然后,转换单元113将由1024个采样构成的频谱数据划分成许所组,每组都模拟人类听觉的一个关键频带。每个划分的组就被称为一个“比例因子频带”,它被定义为包含由至少一个采样(或者按实际情况讲,总数为4的倍数的采样)构成的频谱数据。在MPEG-2AAC中,当采样频率为44.1kHz,且每帧包括1024个采样时,每帧被定义为包含49个比例因子频带。每一个比例因子频带中包含的频谱数据采样数目因每个比例因子频带的频率而异。一个较低频率的比例因子频带包含较少的频谱数据,而一个较高频率的比例因子频带包含较多的频谱数据。
频谱数据综合单元114从转换单元113接收由1024个采样构成的频谱数据,并将某个频带内每两个或多个采样构成的频谱数据综合为由较少采样构成的频谱数据。更详细地说,频谱数据综合单元114用一个预定的操作将某个较高频带内512个采样中的每两个采样综合为一个代表这两个被综合采样的综合值。这一综合的执行过程是,将该频域内两个相邻采样的绝对值彼此加以比较,具有较高绝对值的采样就被当作一个综合值,而且只将该综合值输出到量化单元115。至于该较低频带的其他512个采样值,频谱数据综合单元114将它们按原样输出到量化单元115。所以,该较高频带内每两个频谱数据采样被综合为一个综合值。频谱数据综合单元114还生成综合信息来表明构成该较高频带512个采样的每两个相邻采样被综合成为某个单一综合值,而且将该生成的综合信息输出到编码单元116。
量化单元115从频谱数据综合单元114接收与由768个采样构成的一帧相对应的频谱数据,这包括该较低频带的512个采样与该较高频带的256个采样。然后,量化单元115在防止该帧的一个位长度超过某个预定值的条件下,在每个比例因子频带内用一个标准化因子对频谱数据进行标准化处理。这个标准化因子被称为比例因子。更详细地说,量化单元115通过适当计算来为每一个比例因子频带确定一个合适的比例因子,使得作为一帧频谱数据某个最终形式的一个声频位流所能具有的一个位长度在某个传输通道的一个传输长度之内。然后,量化单元115对该频谱数据进行标准化与量化。量化单元115将该量化频谱数据(下文称为“量化数据”)以及上面所用的比例因子输出到编码单元116。
编码单元116按照霍夫曼编码方法对该量化数据以及比例因子编码,并转换该编码数据以便生成一个具有某种预定流格式的编码信号。在对各比例因子编码之前,编码单元116计算每两个相邻比例因子频带内所用的两个比例因子数值之差,并对每个算得的差以及该第一比例因子中所用的一个比例因子编码。编码单元116也通过霍夫曼编码方法对频谱数据综合单元114送出的综合信息进行编码,对它进行转换来生成具有该预定流格式的编码综合信息,并将它以及上述编码信号输出到流输出单元117。
流输出单元117将标题信息与其他必要的辅助信息附加到上述编码信号,并将它转换为一个MPEG-2 AAC位流。流输出单元117还将该编码综合信息插入上述位流中某个传统解码设备不予处理、或者未为其定义操作的区域。然后,流输出单元117输出这个MPEG-2 AAC位流。
发送设备118从流输出单元117接收该编码位流,并经由一个卫星广播电波将它发送到广播卫星130。
住宅120
每个住宅120包括一个接收设备121、一个解码设备122和一个扬声器129,借此经由广播卫星130接收该广播电波,提取该接收到的广播电波中的编码位流以及进行解码,并从该声频信号再现声音。
接收设备121的实现方法是通过一个机顶盒(STB)或类似装置来接收该卫星广播电波,从该接收到的广播电波中提取该编码位流,并将它输出到解码单元122。
解码设备122的实现与编码设备111相似,或者借助一个由某台通用计算机执行的程序,或者借助硬件,譬如一个专用电路或一个LSI。接收到包括该编码信号与综合信息的编码位流后,解码设备122就对代表声频数据的编码信号以及表示频谱数据综合方式的编码综合信息进行解码。解码设备122根据该解码的综合信息来扩展该综合频谱数据,并恢复该声频数据。解码设备122包括一个流输入单元123、一个解码单元124、一个反量化单元125、一个频谱数据扩展单元126、一个逆转换单元127和一个声频信号输出单元128。
接收到由接收单元121提取的编码位流后,流输入单元123提取代表该声频数据的霍夫曼编码信号以及该霍夫曼编码综合信息,并将它们输出到解码单元124。
解码单元124从流输入单元123接收具有该流格式的编码信号与综合信息。然后,解码单元124对该编码信号解码以便恢复该量化数据以及比例因子频带之间各比例因子的差。然后,解码单元124将它们输出到反量化单元125。解码单元124也对该编码综合信息解码,并将该综合信息输出到频谱数据扩展单元126。
反量化单元125对由一帧768个采样构成的量化数据进行反量化处理,该帧数据包括该较低频带内的512个采样与该较高频带内的256个采样,以便恢复由该较低频带内512个采样与该较高频带内256个综合值构成的频谱数据。
频谱数据扩展单元126预先储存与不同综合信息关联的各类扩展方法,并扩展由综合值构成的恢复后的频谱数据以便恢复由该较高频带内512个采样构成的频谱数据。
按照MPEG-2 AAC与IMDCT,逆转换单元127将频域的频谱数据转换为时域的采样数据。
声频信号输出单元128将经由逆转换单元127转换的各个采样数据集合彼此组合,并将它作为数字声频数据输出到扬声器129。
扬声器129接收解码设备122如此恢复的数字声频数据,并对该数字声频数据进行D/A(数-模)转换来产生一个模拟声频信号。扬声器129则根据这个模拟信号来再现音乐和声音。
广播卫星130从广播站110接收该广播电波,并将它发送到地面。
下面参看图2A至图6说明广播系统100中编码设备111的处理过程。
图2A是声频信号输入单元112提取的声频数据沿时间轴的某个放大波形的一个示例。图2B表示转换单元113通过MDCT转换由该声频数据产生的一个沿频率轴的示例频谱数据。注意,尽管该采样数据与该频谱数据实际上是离散的数据集合,但在图2A与图2B中它们显示为连续波形。
一个声频信号用一个随时间变化的电压波形表示,见图2A。在这幅图中,沿该垂直轴的一个电压值对应于某个时刻的声音强度。通常,一个声频信号波形包含许多频率分量。当这种声频信号中与某个固定时间段对应的一部分被提取并按照MDCT被转换时,产生的数据就是频谱数据,其中这个提取的信号中的每个频率分量部分既有正值也有负值,如图2B所示。
根据这种声频信号以及人类对该声频信号听觉的特点,在MPEG-2 AAC中的信号处理是采用一个比例因子频带作为一个量化单元来实现的。图3表示转换单元113据此划分频谱数据的示例比例因子频带。在这幅图中,该频谱数据的每个采样值用一个条线图表示。在MPEG-2 AAC中,一帧中所包括的比例因子频带数目取决于所用的是一个长块还是短块,并取决于输入声频数据的某个采样频率。长块指转换单元113对之执行MDCT转换的是2048个采样的一块,而短块指用于MDCT转换的是256个采样的一块。譬如,在本实施例中采用一个长块而且采样频率为44.1kHz,那么一帧就包括49个比例因子频带。在MPEG-2 AAC中,每个比例因子频带中所包括的频谱数据采样数目按照频率确定。更具体地讲,如图3所示,某个较低频带中的一个比例因子频带包括较少采样,而某个较高频带中的一个比例因子频带包括较多采样。这是因为,由于人类听觉对低、中频带的声频信号分量灵敏,所以在这些低、中频带的编码与解码需要高精度。量化单元115采用相同的比例因子将同一个比例因子频带内所包括的频谱数据标准化,并将频谱数据量化。
量化单元115确定每个比例因子,并同时计算传输一帧编码数据所用的一个位长度。若该算得的位长度对该传输通道的一个传输速率而言太大,那么量化单元115就确定能使各个量化数据值变小的比例因子,以便降低编码数据的数量。该较高频带内频谱数据的一个值特别容易被缩小成为数值极小的量化数据。所以,当量化单元115按某个传统方法执行标准化与量化时,该较高频带内所得的量化数据值常常是一串零。然而这些具有零值的量化数据被编码时,该编码数据的结果数据长度并不是零。所以,本实施例的编码设备111有一个在量化单元115进行量化之前执行下述综合操作的频谱数据综合单元114。
图4A表示转换单元113输出的、综合前的示例频谱数据,而图4B表示频谱数据综合单元114进行综合之后的示例频谱数据。如图4A所示,在一帧1024个采样中,该较低频带内的512个采样被原样输出到量化单元115。至于该较高频带内的其余512个采样,则如图4B所示由每两个沿频率轴相邻的采样得到一个综合值。然后,该频谱数据的每个综合值按图示形式被输出到量化单元115。在这幅图中,将该频谱数据中每两个相邻采样的绝对值彼此比较,具有某个较大绝对值的采样(由图中的阴影条形表示)被用作一个综合值。这样,图4A所示的由512个采样构成的较高频带内的频谱数据就被频谱数据综合单元114综合为图4B所示的256个综合值。
由于这样将两个采样综合为一个单独采样,所以编码后的数据长度减少等于未用于编码的采样长度。此外,由于这种综合大幅度减少了需要量化的频谱数据采样数目,所以量化单元115可以调整一个比例因子来防止在该较高频带内的频谱数据不为零时该较高频带内的量化数据取零值。
而且,上述采用一个具有较大绝对值的采样作为一个综合值的方法不仅在该较高频带内两个相邻采样为零时使传输数据量下降了一个重复采样的长度,而且在两个相邻采样中一个为零而另一个不为零时可以采用某个非零值作为一个综合值。
频谱数据综合单元114按照如下步骤执行这种综合。图5是一幅表示频谱数据综合单元114进行综合操作的流程图。在该图中,“i”与“j”代表分配给该频谱数据采样的序号。这一程序中所用的寄存器是临时储存一个变量值的区域。
频谱数据综合单元114从转换单元113接收一帧1024个频谱数据采样,并将它们中的每一个放置到由一维数组表示的一个不同存储区域“spectral[i]”(i=0,1,…,1023)(步骤S501)。然后,频谱数据综合单元114将“512”放置到寄存器“i”与“j”以便对第512个采样(即该较高频带内的第一个采样)以及该频谱数据的较高频带内的其余采样执行下述操作(步骤S502)。接着,数据综合单元114判断寄存器“i”中的某个值是否低于“1024”(步骤S503)。如果是,则综合尚未完成,所以计算第i个数据的一个绝对值“abs”并放置到寄存器“a”。随后,计算第(i+1)个频谱数据的一个绝对值“abs”并放置到寄存器“b”(步骤S504)。对本示例,该频谱数据的第512个采样的一个绝对值被放置到寄存器“a”,而第513个采样的一个绝对值被放置到寄存器“b”。
为将该频谱数据的第j个采样储存到一个存储区域“spectral[j]”,先要放置第i个采样。对本示例,第512个(第i个)采样被放置到存储区域“spectral[j=512]”。然后,频谱数据综合单元114将分别储存在寄存器“a”与“b”中的第i个与第(i+1)个采样的绝对值彼此比较。这就是说,将第512个采样的一个绝对值与第513个采样的一个绝对值进行比较。如果寄存器“b”中第(i+1)个采样的绝对值大于寄存器“a”中第i个采样的绝对值,那么频谱数据综合单元114就用第(i+1)个采样强行改写存储区域“spectral[j]”的值(步骤S505)。对本示例,假设寄存器“b”中第513个采样具有一个比寄存器“a”中第512个采样较大的绝对值。那么第513个采样就被用来强行改写存储区域“spectral[j=512]”的值,从而存储区域“spectral[j=512]”与存储区域“spectral[i=513]”的数值变得相同。随后,频谱数据综合单元114将“i”与“j”分别增加“2”与“1”(步骤S506),该控制流程则返回步骤S503。这时,“i”是“514”,“j”是“513”。
此后,重复步骤S503至S506中的处理过程,从而频谱数据综合单元114将该频谱数据中每两个相邻采样的绝对值彼此比较,并将具有较大绝对值的采样写到由一个“j”的数组代表的一个寄存器“spectral[j]”。结果,当在步骤S503判断“i”为“1024”或更大时,存储区域“spectral[j]”(j=512,513,…,767)就储存256个采样(即综合值),每个都综合了该较高频带内512个采样中的两个采样。然后,控制流程转移到下一步(步骤S507),其中频谱数据综合单元114将储存在不同存储区域“spectral[i]”(i=0~511)与“spectral[j]”(j=512~767)中的第0至第767个采样传送到量化单元115,这一步完成综合处理,但未生成综合信息。
上述综合将该较高频带内的512个频谱数据采样减少为256个采样,将1024个采样构成的一帧减少为768个采样构成的一帧。这样,频谱数据综合单元114就能够通过简单的运算来减少该较高频带内的频谱数据数量。
然后,频谱数据综合单元114将该768个采样中某个预定数目的采样按照采样频率的顺序放置到每个比例因子频带,先放置最低频率的采样。由于这里使用的每个比例因子频带原来是为一帧1024个采样提供的,所以将768个采样放置到这些比例因子频带中不仅减少了比例因子频带的总数,从而降低了量化负荷,而且也减少了需要传输的比例因子数目,从而减少了需要传输的编码信号长度。这样,与该传统技术相比,上述综合运算使该频谱数据的采样数量大幅度下降。因而,如果某个传统编码设备与本发明的编码设备111采用一个相同长度的编码位流,那么本发明的编码设备111就能够为每个量化数据集合分配一个比该传统编码设备更长的位长度。
上述综合只对该较高频带内的频谱数据采样进行,因为人类听觉对由该综合引起的、该较低频带内再现声音中的退化更灵敏。
图6表示已经执行图4所示频谱数据综合后生成的示例综合信息500。综合信息500包括一个标题510和一个或多个块520。标题510表示与综合信息500有关的信息,它包括一个综合信息ID(标识符)511、一个帧序号512和一个数据长度513。综合信息ID511是详细说明综合信息500的ID。帧序号512确定一个将要对其执行综合信息500所指定综合的帧。数据长度513表示综合信息500内从第一个块520的起点到最后一块终点的数据的某个位长度。
每个块520包括与综合操作有关的特定信息,只要在该帧内改变综合方法就要提供这个信息。更具体地讲,每个块520被划分为一个指定某个综合目标范围的区域和一个指定该指定综合目标范围内所采用的某个详细综合方法的区域。指定该综合目标范围的区域中包括的项目为指定方法521、起点522和终点523。指定方法521表示该综合目标范围是由一个比例因子频带序号“sfb”指定还是由一个频谱数据序号“SD”指定。若指定方法521显示为“sfb”,那么该综合目标范围由起点522与终点523所指示的比例因子频带序号指定。另一方面,若指定方法521显示为“SD”,那么该综合目标范围则由起点522与终点523所指示的某个频谱数据序号指定。这样,起点522被显示为一个按照指定方法521来指示综合目标范围起点的数值。终点523被显示为一个按照指定方法521来指示综合目标范围终点的数值。譬如,由“0”至“1023”构成的序号被顺序分配给该频谱数据的采样。当该较高频带内的512个采样按照相同的综合方法综合,而且指定方法521显示“SD”时,起点522与终点523就分别显示为“511”与“1023”。
在每个块520中指定某种综合方法的区域包括一个综合数目524、一个选择方法525、一个数值确定方法526和一个权系数527。综合数目524表示一个需要综合的频谱数据采样数。该图中显示为“2”,它表示该频谱数据的两个采样要进行综合。选择方法525表示如何选择需要综合的频谱数据采样。譬如,选择方法525表示选择综合数目524所示的几个相邻采样进行综合,或者选择每隔一个采样进行综合。在该图中,选择方法525显示为“consecutive”(相邻)。数值确定方法526表示一种由被选频谱数据采样确定某个综合数值的方法。该图中显示为“largest absolute value”(最大绝对值),这是指所有上述被选采样中的最大绝对值被认为是一个综合值。权系数527显示是否向一个上述被选频谱数据采样分配一个权系数,譬如说对每个被选采样乘一个因子。如果分配一个权系数,那么权系数527也会显示一个已分配权系数的采样以及一个加权系数。在该图中,权系数527显示为“none”(无)。
解码设备122参考这个综合信息500,并对该发送的帧识别出如下信息:在该较高频带内的512个采样中,每两个相邻采样被综合为一个综合值,该综合值是这两个采样中具有较高绝对值的一个采样。根据这个信息500,解码设备122能够恢复出接近于该原始频谱数据的频谱数据。在上述示例中,综合信息500只包括一个块520,因为这单个块520指定了整个帧的综合。但是,如果在一个单独的帧内使用多个不同的综合方法,在该综合信息内就要提供多个块。
上面,综合信息500被描述为包括至少一个块520。可以从这个块520中删除预先已经通知编码单元111与解码单元122的预定项目。譬如,如果预先确定该较高频带内的512个采样始终采用相同的综合方法进行综合,那么块520中指定某个综合目标范围的项目,即指定方法521、起点522和终点523,就可以从综合信息500中删除。块520中的其他项目也可以删除。譬如,对于没有分配权系数的一个帧或者一个综合目标范围,权系数527这一项就可以从综合信息500中删除。因而,只是对分配了权系数的一个帧或者一个综合目标范围,综合信息500中才包括权系数527这一项,而且在权系数527的域内还写入一个加权因子。
上述综合信息500用霍夫曼编码方法编码,它被转换为具有某种流格式的数据,并被插入包含在由该编码信号转换所得的一个MPEG-2 AAC位流中的、某个传统解码设备对其不予处理或者没有为其进行操作定义的区域。
图7A表示一种MPEG-2 AAC位流600的示例数据结构,其中已插入了综合信息500。图7B表示包括综合信息500的一个MPEG-2 AAC位流610的另一种示例数据结构。综合信息500被插入这些例图所示的这些编码声频位流的阴影部分。如图7A所示,MPEG-2 AAC位流600包括一个标题601、一个编码信号602和一个区域603,譬如填充单元和数据流单元(DSE)。标题601包括与这个位流600有关的信息,譬如表明这个流遵守MPEG-2 AAC的一个ID、位流600的一个数据长度、与该编码信号602对应的一个帧序号以及与该编码信号602对应的比例因子数目。编码信号602的生成方法是,对经频谱数据综合单元114综合的频谱数据进行量化与编码来产生一个编码信号,并对这个编码信号的一个格式进行转换。
填充单元通常包括:(a)标题信息,它包含一个指明该数据为一个填充单元的填充单元ID,并包含说明该整个填充单元的一个位长度的数据;和(b)一个用零填充以便使该AAC位流600的一个数据长度成为某个固定预定值的区域。譬如说,若区域603是填充单元,那么综合信息500被记录在以零填充的规定区域内。若综合信息500被这样记录到填充单元,那么一个传统的解码设备就不会将信息500识别为一个应当被解码的编码信号,所以不予处理。
DSE是预测到MPEG-2 AAC的未来发展而提供的,在MPEG-2 AAC中只定义了它的物理结构。如同填充单元一样,DSE也包括含有一个DSE ID的标题信息,该ID表示该随后的数据是DSE,DSE还包括表示该整个DSE的一个位长度的数据。譬如说,若区域603是DSE,那么综合信息500就被记录到该标题信息之后的一个数据区域。当该传统解码设备阅读这种DSE中所包含的综合信息500时,该传统解码设备不按照读出的信息500执行任何操作,因为没有定义该传统解码设备根据信息500应当执行的操作。
因而,当该传统设备从本发明的编码设备111接收在上述区域内包含综合信息500的编码声频位流时,该传统解码设备并不将综合信息500当作一个编码声频信号进行解码。所以,这就防止了该传统解码设备由于无法对综合信息500解码而产生噪声。但不可避免的是,当该传统解码设备再现上述声频位流时,该较高频带内再现的声音品质与一个原始采样的声频信号品质不同。这是因为该较高频带的综合频谱数据向该较低频带一侧移动,移动量与未用作综合值的采样数目相符,所以使得该较高频带内的某个再现声音频带变窄。
上面将DSE描述为插入到区域603中该编码声频位流的终点。但另一种方法是将DSE插入标题601与编码信号602之间,或者插入编码信号602。
在上述说明中,综合信息500被储存在一个MPEG-2 AAC位流所包含的、该传统解码设备不予处理的区域内。但是,若编码声频位流610只被发送到本发明的解码设备122,那么综合信息500可以被插入标题601之内的一个预定区域611,或者不插入区域603、而插入编码信号602的一个预定区域(譬如区域612),或者既插入标题601、也插入编码信号602(譬如区域611和612)。没有必要保证在编码声频位流610中有一个连续区域来储存综合信息500,这既适用于标题601,也适用于编码信号602。譬如,综合信息500可以同时插入编码信号602之内的预定区域612与613。
解码设备122经由该卫星广播电波接收上述编码声频位流,它从该接收到的声频位流中提取该编码信号,并对该编码信号解码。在对这一编码信号反量化来恢复该综合频谱数据之后,解码设备122将该综合频谱数据中该较高频带内的256个综合值扩展为512个采样。图8A表示反量化单元125输出的综合频谱数据的一个示例。图8B表示经频谱数据扩展单元126扩展后的示例频谱数据。这里所用的将作为反量化单元125反量化处理结果的一帧768个综合值扩展为1024个采样的方法与图4所示的频谱数据综合方法相对应。更具体地说,如图8A所示,在全部768个采样中,频谱数据扩展单元126保留该较低频带的512个采样不变,但将该较高频带的256个综合值扩展为由512个采样构成的频谱数据,其中每两个沿频率轴相邻的采样值相同。将图8B所示的扩展频谱数据与图4A所示的基于原始声音的频谱数据比较就可以看到,该扩展频谱数据与该原始频谱数据大致相同。
频谱数据扩展单元126按照下述程序执行上述扩展。图9是一幅表示频谱数据扩展单元126的处理过程的流程图。在这幅图中,“i”与“j”代表分配给该综合频谱数据的综合值的序号。频谱数据扩展单元126从反量化单元125接收经解码与反量化后所得的综合频谱数据中分配序号为“j”(j=0,1,…,767)的综合数据(步骤S1001)。每个接收到的频谱数据综合值被储存在由一维数组表示的一个不同存储区域“inv_spectral[j]”(j=0,1…,767)。然后,频谱数据综合单元114将“512”放置到寄存器“i”与“j”(步骤S1002)以便对第512个综合值(该较高频带的第一个值)以及随后的综合值执行下述操作。然后,频谱数据扩展单元126判断“j”是否低于“768”(步骤S1003)。如果是,就意味着该扩展操作尚未结束,那么就将存储区域“inv_spectral[j]”中的一个综合值放置到由相应于i=512,513,…,1023的一维数组表示的临时存储区域“temp[i]”与“temp[i+1]”(步骤S1004)。对本示例,存储区域“inv_spectral[512]”中的一个综合值被放置到临时存储区域“tmp[512]”与“tmp[513]”。
此后,频谱数据扩展单元126将“i”与“j”分别递增“2”与“1”(步骤S1005),控制流程则返回步骤S1003。结果,“i”与“j”分别变为“514”与“513”。
当频谱数据扩展单元126如此重复步骤S1003至S1005的处理过程并同时将“i”与“j”递增“2”与“1”时,一个存储区域“inv_spectral[513]”中的某个综合值就被扩展为存储区域“tmp[514]”与“tmp[515]”中的两个值。类似地,一个存储区域“inv_spectral[514]”中的某个综合值就被扩展为存储区域“tmp[516]”与“tmp[517]”中的两个值。这样,反量化单元125输出的频谱数据中的每个综合值被扩展为两个临时存储区域中的两个值。若在步骤S1003中判断“j”不低于“768”,那么临时存储区域“tmp[i]”(i=512,513,…,1023)就储存该较高频带中512个扩展频谱数据值,其中每两个相邻的值具有相同数值。然后,频谱数据扩展单元126用临时存储区域“tmp[i]”(i=512,513,…,1023)中储存的值与“inv_spectral[j]”(i=0,1,…,511)中储存的值强制写入输出存储区域“inv_spectral[i]”(i=0,1,…,1023)(步骤S1006),并将这些输出存储区域中的值输出到逆转换单元127(步骤S1007)。这样就完成了一帧的扩展处理。
正如已经说明的那样,本编码设备111将由1024个采样构成的一帧频谱数据综合为由768个采样构成的频谱数据。这不仅减少了编码设备111的量化与编码负荷,而且也减少了某个传输通道传输一个编码声频位流的负荷。解码设备122能够通过从一帧768个采样构成的综合频谱数据恢复整个频带上1024个采样构成的频谱数据来再现高品质声频数据。此外,在采用相同长度的一个编码位流时,因为本实施例的广播系统100发送一个包含较少采样的帧,所以每个采样可以拥有比一个传统采样更大的信息量。因而,本发明的编码声频位流中的每个采样能够以更高的精度表示,并能够再现为更接近原声的声音。
本实施例的编码设备111及解码设备122与传统编码设备及传统解码设备的不同之处仅在于,本设备111及122包括频谱数据综合单元114及频谱数据扩展单元126。因而,不需要大规模改变该传统编码设备及解码设备的结构就能很容易地实现本编码设备111及解码设备122。
本实施例的广播系统100一直被描述为一个采用广播卫星130的数字卫星广播系统。不过很自然,本广播系统100也可以是采用一颗通信卫星的一个CS(通信卫星)数字广播系统,或者一个数字地面广播系统。本发明的编码设备与解码设备不仅可以应用于这种广播系统的一个发送设备与一个接收设备,而且也可以应用于采用某个双向通信网络(譬如互联网)的一个内容分配系统,或者应用于某个电话系统中的一个发送设备与一个接收设备。而且,本发明的编码设备可以用于某个将一个声频信号记录到一个记录媒体(譬如一张致密光盘(CD))的记录设备,该解码设备也可以用于某个再现这种记录媒体中声频信号的重放设备。编码设备111与解码设备122的处理过程不仅可以用硬件实现,而且可以用软件实现,或者部分由硬件、其余部分由软件来实现。
在上述实施例中,本发明采用MPEG-2 AAC作为一个传统技术示例来加以说明。但是本发明也能够被应用到其他现有声频编码方法,或者其他新的声频编码方法。
上述实施例中的频谱数据综合单元114只综合整个频带中较高一半内的频谱数据(512个采样),并同时保持该频带中较低一半内的频谱数据(512个采样)不变。但是这种综合范围并不限于上述实施例。譬如,可以如图10A所示综合一帧的较低频带内的更多采样,图中该较低频带内的前256个采样不进行综合就被输出到量化单元115,但某个较高频带内的其余768个采样则被综合。或者如图10B所示,可以综合整个频带中较高一半的较少采样,图中某个较低频带内的前768个采样不经综合就被输出到量化单元115,但某个较高频带内的其余256个采样则被综合。还有一种方法是可以综合全部1024个采样,或者如图10C所示,综合一帧之内的第256至319个相邻采样以及第768至1023个相邻采样。就是说,综合可以对沿该频率轴的多个离散区域进行。
作为一种替代方法,还可以如图11A与图11B所示对不同的帧指定不同的综合范围。在图11A中,一帧内所有1024个采样均被综合,而另一帧内1024个采样则均不综合。在图11B中,一帧内某个较低频带的512个采样不经综合就被输出到量化单元115,而某个较高频带内的其余512个采样则进行综合。在下一帧中,某个较低频带内的768个采样被原样输出,而某个较高频带内的256个采样则进行综合。
在上述实施例中,频谱数据综合单元114被描述为能生成图6所示的综合信息500,该信息为每一帧指定一个综合目标范围。然而,综合信息500并非必须指定这种综合目标范围。譬如,对编码设备111与解码设备122可以事先确定,每个奇数帧中较高频带内的512个采样要被综合,而每个偶数帧中从第768个采样开始的256个采样要被综合。如果这样预先确定了一个综合目标范围,那么综合信息500就不必指定任何综合目标范围。
在上述实施例中,综合信息500包括至少一个能指定综合操作内容的块520。上面也已说明,若在同一帧内进行不同综合操作,那么进行这些不同综合操作的方法就记录在综合信息500内。但是,综合信息500的内容不限于此。譬如,若每帧内的各综合方法已预先决定,那么综合信息500就可以只包含指明每帧是否执行这一综合的一位旗标。若对两个相邻的帧执行相同的综合操作,那么就可以不为该后一帧生成综合信息。
在上述实施例中,频谱数据综合单元114将两个相邻频谱数据采样综合为一个综合值。然而,本发明的综合方法并不限于上述实施例。图12A表示需要综合到一起的采样的另一个组合示例。如该图所示,该频谱数据的三个采样可以综合到一起成为一个综合值,或者更多采样可以被综合到一起。
也可以将不相邻的采样综合成一个综合值。图12B表示需要综合到一起的采样的另一个组合示例。如该图所示,可以选择每隔一个采样综合到一起。类似地,也可以每隔一个采样进行选择而将三个已被选定的相邻采样综合为一个综合值。除了每隔一个值外,也可以每隔两个、三个或多个采样进行选择来综合为一个综合值。在选择需要进行综合的采样时可以重叠。譬如,如图12C所示,可以选择三个相邻采样综合到一起成为一个综合值,在被选定的三个值中,第一个与第三个值可以和与该综合值相邻的、选来构成综合值的最后一个与第一个值重叠。
如何选择需要综合的采样可以随一个帧、或一个频带而异。譬如,可以将一帧内的相邻两个采样综合为一个综合值,而将另一帧内的相邻三个采样综合为一个综合值。另一种方法是,可以将该较低频带内512个采样中每两个相邻采样综合到一起,而将该较高频带内512个采样中每四个相邻采样综合到一起。还有一种方法是,可以对每个比例因子频带来定义将采样组合成一个综合值的方法。如果这样做,那么需要综合到一起的采样数目可以按照各采样的频率确定。譬如,在一个较高频率的比例因子频带中可以将较多采样综合到一起。
需要综合到一起的采样数目可以按照每个采样的某个实际值确定。譬如,如果在一个高频带中十个相邻采样为零,那么这十个值就可以综合为一个单独的零综合值。不仅是需要综合到一起的采样数目,而且一个综合值的某种计算方法、一个综合目标范围、需要综合的采样组合、权系数及其数值的提供等等都可以按照频谱数据采样的实际值确定。如果进行这种综合,那么频谱数据综合单元114就预先储存将一个不同综合方法与每一帧内频谱数据的每个预测模式相关联的信息。频谱数据综合单元114通过对该频谱数据进行操作变换来指定每帧内的每个频谱数据模式。如果所储存的信息中包括该指定的模式,那么频谱数据综合单元114就采用一个与所储信息中该指定模式相关联的综合方法。一种综合方法的某些上述项目可以预先为该编码设备与该解码设备确定,并从综合信息500中省略。所以综合信息500可以只包括根据实际频谱数据生成的项目。
在上述实施例中,一个综合值是需要综合到一起的采样中具有最大绝对值的采样。但是,确定一个综合值的方法不限于这个实施例。图13A表示基于两个相邻采样来计算一个综合值的一个示例方法。如图13A中的①所示,频谱数据的采样“S(A)”与“S(B)”可以分别乘以一个因子“α”与“β”以便给它们权系数,该加权采样中绝对值比另一个更大的那个采样可以被当作一个综合值。另一个示例可见图13A的②,两个采样“S(A)”与“S(B)”的一个平均值可以被当作一个综合值,这个平均值可以根据两个采样“S(A)”与“S(B)”的绝对值计算。还有一个方法是可以对两个采样“S(A)”与“S(B)”加权,然后将这两个加权采样的一个平均值当作两者的一个综合值。如图13A的③中另一个示例所示,还有一种方法是可以从多个需要综合到一起的采样中预先确定某个采样位置作为一个综合值。或者,可以始终采用频率比其他采样低的一个采样作为一个综合值。当然,也可以采用频率比其他采样高的一个采样作为一个综合值。
图13B表示计算该频谱数据中两个相邻采样的一个综合值的另一个示例方法。如该图所示,在以任何规定的方法计算了一个综合值之后,频谱数据综合单元114可以参考与被综合为该综合值的采样相邻的其他采样来调整该计算所得的综合值。举例来说,如图13B所示,频谱数据综合单元114参考与两个采样“S(A)”与“S(B)”相邻并位于其较高与较低频率两侧的四个采样“S(C)”、“S(D)”、“S(E)”与“S(F)”。如果这些采样“S(C)”、“S(D)”、“S(E)”与“S(F)”中的任何一个超过了某个预定的阈值,那么频谱数据综合单元114就将两个采样“S(A)”与“S(B)”的一个综合值乘以一个加权因子“1.5”。上述将要被参考的采样数不限于四,也可以是二、六或更大。频谱数据综合单元114可以只参考需要综合的两个采样的较高频带一侧或较低频带一侧的采样。上述加权因子也不限于“1.5”,它可以小于“1”。譬如,如果与某个综合值相邻的一个采样特别大,那么这个综合值就可以被屏蔽。举例来说,在这种情况下加权因子可以是“0”。
也可以采用计算一个综合值的其他方法。譬如,对需要综合到一起的采样进行预定的操作变换(不是上述的一种)可以获得一个综合值。各帧、各频带或各比例因子频带之间的计算方法可以不同。
计算一个综合值的这种方法可以预先确定并由该编码设备与该解码设备共享,或者写在综合信息500之中。综合信息500可以包含一种采用综合值来扩展综合频谱数据的方法。
尽管在上述实施例中一个比例因子频带中包含的采样数目在频谱数据被综合前、后相同,但这一采样数目在综合前、后可以不同。图14A表示在频谱数据综合前某个较高频带内的频谱数据与比例因子频带的一个示例。图14B表示综合后该较高频带内的频谱数据与比例因子频带之间的一个示例关系,图14C表示上述实施例中这两者之间的同一关系。在这些图中,该较低频带中的频谱数据与比例因子频带未被显示,因对这些频谱数据不进行综合,所以无论是频谱数据还是比例因子频带在该综合前、后均不变。为便于解释,假设分配序号为“40”的一个比例因子频带是包括512个频谱数据的较高频带内第一个比例因子频带。在上述实施例中,频谱数据综合单元114按照图5所示的控制流程来综合频谱数据,该综合后的频谱数据被安排在由转换单元113设定的比例因子频带内。因此如图14C所示,该综合后的频谱数据排列在该图中向左(即较低频带侧)移动,移动情况与未被用作综合值的采样数目相符,所以该较高频带内的比例因子频带数目在综合后下降。这样,上述实施例的频谱数据综合不仅减少了需要作为编码信号发送的量化数据数量,而且还减少也作为该编码信号一部分的比例因子的数量。因而,这大幅度地降低了该编码信号的数据量。
但是,对本发明的综合方法,该比例因子频带的结构并不限于上述结构。尽管在MPEG-2 AAC中定义了一个比例因子频带内包括的采样数量,但对本发明这个数目可以改变。譬如,如图14B所示将两个采样综合为一个综合值后,这个数目就下降到一半。尽管比例因子的数目没有下降,但这能够做到在该综合目标范围内每个比例因子频带中进行高精度量化。所以,图15B所示的比例因子频带结构的优点是,它能传输更精确的声频数据,而同时通过减少构成该量化数据的数值数量来减少该编码信号的数据量。一个比例因子频带结构在综合前、后的这种变化可以预先确定,并通知该编码设备与该解码设备,或者可以将它编码为综合信息。
在上述实施例中,频谱数据扩展单元126将一个综合值扩展为两个采样。但是,一个单独综合值可以经复制而产生两个采样。这就是说,为了产生512个采样,频谱数据扩展单元126可以复制该较高频带内256个综合值的每一个来作为该频域内两个相邻采样中的一个。在复制每个综合值之前也可以将该综合值乘以一个加权因子。另一种方法是,可以将两个扩展(或复制的)采样中的每一个乘以一个加权因子。
如果有综合信息,那么本发明的频谱数据扩展单元126可以根据这种综合信息来扩展综合频谱数据。另一种方法是,频谱数据扩展单元126可以按照它自己的扩展方法来扩展综合频谱数据数据而不管综合信息的规定,或者按照任何其他方法来扩展。
工业实用性
本发明的编码设备可以用作某个卫星广播——包括BS(广播卫星)广播与CS(通信卫星)广播——的某个广播站中所用的一个声频编码设备,或者用作那种通过某种通信网络(譬如互联网)分配内容的一个内容分配服务器中所用一个声频编码设备。
本发明的解码设备不仅可以用作某个家用STB内提供的一个声频解码设备,而且可以用作一台通用计算机为实现声频信号解码而执行的一个程序、一个STB或一台通用计算机中提供的一块电路板及一个LSI、以及插入一个STB或一台通用计算机的一个IC卡。
Claims (22)
1、一个接收某个声频信号并对其编码的编码设备,它包括:
一个转换单元,可以运行它以便提取一部分该接收到的声频信号,该提取的部分构成对应于某个预定时间段的一帧,而且可以运行它以便将该提取的部分转换为某个频域的一个频谱,该频谱包括多个频谱数据集合;
一个综合单元,可以运行它以便将该频谱的一部分中至少两个频谱数据集合综合为数目更少的频谱数据集合,下文称为综合数据,而且可以运行它以便输出这个数目更少的综合数据集合,其中这部分频谱对应于一个预定的频带;以及
一个编码单元,可以运行它以便量化这些综合数据集合并进行编码,而且生成以及输出该编码数据。
2、权利要求1的编码设备,
其中,该综合单元执行一个评估该至少两个频谱数据集合、并将这些已评估的频谱数据集合综合为至少一个综合数据集合的操作。
3、权利要求2的编码设备,
其中,由该操作评估的该至少两个频谱数据集合在该频域相邻排列。
4、权利要求2的编码设备,
其中由该操作评估的该至少两个频谱数据集合在该频域不相邻排列。
5、权利要求2的编码设备,
其中,该操作在该至少两个已评估的频谱数据集合中指定一个具有某个较大绝对值的频谱数据集合,将该指定的频谱数据集合当作一个综合数据集合,并将该至少两个已评估的频谱数据集合综合为该综合数据集合。
6、权利要求2的编码设备,
其中,该操作指定该至少两个已评估的频谱数据集合的一个平均值,将该指定的平均值当作一个综合数据集合,并将该至少两个已评估的频谱数据集合综合为该综合数据集合。
7、权利要求2的编码设备,
其中,该操作从该至少两个已评估的频谱数据集合中指定一个频谱数据集合,将该指定的频谱数据集合当作一个综合数据集合,并将该至少两个已评估的频谱数据集合综合为该综合数据集合,其中该指定的频谱数据集合出现在一个对于该频域中其他各个已评估的频谱数据集合预先确定的位置。
8、权利要求2的编码设备,
其中,该操作在综合这些已评估的频谱数据集合之前向该至少两个已评估的频谱数据集合分配权系数。
9、权利要求2的编码设备,
其中,该综合单元为每个帧选择一个操作,并通过执行该选定操作来综合至少两个频谱数据集合。
10、权利要求2的编码设备,
其中,该综合单元执行的操作按照构成该频谱的多个频谱数据集合中的至少一个集合来确定。
11、权利要求2的编码设备,
其中,该操作根据该至少两个已评估的频谱数据集合以及与这些已评估的频谱数据集合相邻的其他频谱数据集合来指定一个值,将该指定值当作一个综合数据集合,并将该至少两个已评估的频谱数据集合综合为该综合数据集合。
12、权利要求1的编码设备,
其中,该转换单元将构成该频谱的多个频谱数据集合划分为该频域中的多个组,这多个组中每个组包括一个预定数目的频谱数据集合,
该综合单元排列构成该频域内频谱的每个综合数据集合以及各个未综合频谱数据集合,并将这些排列好的数据集合划分为多个组,每个组包括一个预定数目的排列好的数据集合,其中每个预定数目与该转换单元在划分该多个频谱数据集合时所用的数目相同,而且
该编码单元利用分配给该综合单元所划分的每一组的一个参数来量化该组中所包含的每个数据集合。
13、权利要求1的编码设备,
其中,该综合单元包括一个能生成综合信息的信息生成单元,该综合信息显示一种综合该至少两个频谱数据集合的综合方法,而且
该编码单元也对该综合信息编码,将该编码综合信息插入该生成的编码数据,并输出包含该编码综合信息的编码数据。
14、权利要求13的编码设备,
其中,若对两个相邻帧的各频谱数据集合采用同一综合方法,那么该信息生成单元不为该后一帧的各个频谱数据集合生成综合信息。
15、一个接收由一帧某个声频信号产生的编码数据、进行解码并恢复该声频信号的解码设备,其中该帧是由一个编码设备以预定的时间间隔从该声频信号提取,该解码设备包括:
一个反量化单元,可以运行它以便对该接收到的编码数据解码及反量化,从而产生反量化数据,而且可以运行它以便将该反量化数据转换为某个频域的一个频谱,其中该频谱包括多个频谱数据集合;
一个扩展单元,可以运行它以便采用一个预定的操作将该多个频谱数据集合中某些频谱数据集合内的每个集合扩展为至少两个频谱数据集合,该某些频谱数据集合对应于一个预定频带;以及
一个逆转换单元,可以运行它以便将每个扩展频谱数据集合转换为某个时域内的一个声频信号,并输出该声频信号。
16、权利要求15的解码设备,
其中,该预定操作通过复制该某些频谱数集合中的每一个集合来将该某些频谱数据集合中的每一个集合扩展为至少两个频谱数集合。
17、权利要求15的解码设备,
其中,该预定操作在扩展该某些频谱数据集合之前向该某些频谱数据集合分配权系数。
18、权利要求15的解码设备,
其中,若该解码数据包含标明将至少两个频谱数据集合综合为该某些频谱数据集合的一种综合方法的综合信息,那么该反量化单元从该编码数据提取该综合信息,而且
该扩展单元按照该提取的综合信息来扩展该某些频谱数据集合。
19、权利要求18的解码设备,
其中,若该反量化单元不提取综合信息,那么该扩展单元按照该反量化单元最近提取的综合信息来扩展该某些频谱数据集合。
20、一个包括一个编码设备与一个解码设备的广播系统,其中该编码设备接收一个声频信号并进行编码来产生编码数据,该解码设备从该编码设备接收该编码数据并对该接收到的编码数据解码来恢复该声频信号,
该编码设备包括:
一个转换单元,可以运行它以便提取一部分该接收到的声频信号,该提取的部分形成对应于一个预定时间段的一帧,而且可以运行它以便将该提取的部分转换为某个频域的一个频谱,该频谱包括多个频谱数据集合;
一个综合单元,可以运行它以便采用某个第一预定操作来将该频谱的一部分中至少两个频谱数据集合综合为数目更少的频谱数据集合,下文称为综合数据,而且可以运行它以便输出该数目更少的频谱数据集合,其中该部分频谱对应于一个预定的频带;以及
一个编码单元,可以运行它以便量化这些综合数据集合并进行编码,从而产生并输出该编码数据,
该解码设备包括:
一个反量化单元,可以运行它以便对该编码数据解码并反量化,从而产生反量化数据,而且可以运行它以便将该反量化数据转换为频域的一个频谱,其中该频谱包括这些综合数据集合;
一个扩展单元,可以运行它以便采用一个第二预定操作将这些综合数据集合的每一个集合扩展为至少两个频谱数据集合;以及
一个逆转换单元,可以运行它以便转换每个扩展频谱数据集合,从而产生并输出一个时域内的声频信号。
21、一个使一台计算机像一个接收某个声频信号并进行解码的编码设备那样运行的程序,它包括:
一个转换步骤,它提取一部分该接收到的声频信号,该提取的部分形成对应于一个预定时间段的一帧,而且它将该提取的部分转换为某个频域内的一个频谱,该频谱包括多个频谱数据集合;
一个综合步骤,它按照一个预定操作来将该频谱的一部分之内的至少两个频谱数据集合综合为数目更少的频谱数据集合,下文称为综合数据,而且它输出该数目更少的频谱数据集合,其中该部分频谱对应于一个预定的频带;以及
一个编码步骤,它量化这些综合数据集合并进行编码,以便产生并输出该编码数据。
22、一个使一台计算机像一个接收编码数据并进行解码以便恢复某个声频信号的解码设备那样运行的程序,该程序包括:
一个反量化步骤,它对该接收到的编码数据进行解码并反量化以便产生反量化数据,而且将该反量化数据转换为某个频域内的一个频谱,其中该频谱包括多个频谱数据集合;
一个扩展步骤,它采用一个预定操作将该多个频谱数据集合中某些频谱数据集合内的每一个集合扩展为至少两个频谱数据集合,该某些频谱数据集合对应于一个预定的频带;以及
一个逆转换步骤,它将每个扩展频谱数据集合转换为某个时域内的一个声频信号并输出该声频信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP141211/01 | 2001-05-11 | ||
JP2001141211 | 2001-05-11 | ||
JP141211/2001 | 2001-05-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1459092A true CN1459092A (zh) | 2003-11-26 |
CN1231890C CN1231890C (zh) | 2005-12-14 |
Family
ID=18987698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028006003A Expired - Fee Related CN1231890C (zh) | 2001-05-11 | 2002-05-02 | 编码设备、解码设备和广播系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20020169601A1 (zh) |
EP (1) | EP1386310A1 (zh) |
KR (1) | KR20030040203A (zh) |
CN (1) | CN1231890C (zh) |
WO (1) | WO2002093559A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101952890B (zh) * | 2008-02-21 | 2012-08-22 | 株式会社建伍 | 数据转换设备、程序以及方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1701340B1 (en) | 2001-11-14 | 2012-08-29 | Panasonic Corporation | Decoding device, method and program |
US7559076B2 (en) * | 2002-05-17 | 2009-07-07 | Broadcom Corporation | Sample rate reduction in data communication receivers |
KR20060028695A (ko) * | 2003-06-16 | 2006-03-31 | 난양 테크놀러지컬 유니버시티 | 고분자 스텐트 및 이의 제조 방법 |
US7336739B2 (en) * | 2003-09-26 | 2008-02-26 | Lockheed Martin Corporation | Cross-correlation signal detector |
US7565213B2 (en) * | 2004-05-07 | 2009-07-21 | Gracenote, Inc. | Device and method for analyzing an information signal |
US8999364B2 (en) | 2004-06-15 | 2015-04-07 | Nanyang Technological University | Implantable article, method of forming same and method for reducing thrombogenicity |
US20070011604A1 (en) * | 2005-07-05 | 2007-01-11 | Fu-Sheng Chiu | Content integration with format and protocol conversion system |
WO2007040358A1 (en) * | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US8206636B2 (en) | 2008-06-20 | 2012-06-26 | Amaranth Medical Pte. | Stent fabrication via tubular casting processes |
US10898620B2 (en) | 2008-06-20 | 2021-01-26 | Razmodics Llc | Composite stent having multi-axial flexibility and method of manufacture thereof |
US8206635B2 (en) | 2008-06-20 | 2012-06-26 | Amaranth Medical Pte. | Stent fabrication via tubular casting processes |
KR101479011B1 (ko) * | 2008-12-17 | 2015-01-13 | 삼성전자주식회사 | 다중 대역 스케쥴링 방법 및 이를 이용한 방송 서비스 시스템 |
RU2464649C1 (ru) | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
US10699723B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using variable alphabet size |
JP7311319B2 (ja) * | 2019-06-19 | 2023-07-19 | ファナック株式会社 | 時系列データ表示装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
JP3188013B2 (ja) * | 1993-02-19 | 2001-07-16 | 松下電器産業株式会社 | 変換符号化装置のビット配分方法 |
US5581654A (en) * | 1993-05-25 | 1996-12-03 | Sony Corporation | Method and apparatus for information encoding and decoding |
CA2121667A1 (en) * | 1994-04-19 | 1995-10-20 | Jean-Pierre Adoul | Differential-transform-coded excitation for speech and audio coding |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
JP3189660B2 (ja) * | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
US6741965B1 (en) * | 1997-04-10 | 2004-05-25 | Sony Corporation | Differential stereo using two coding techniques |
EP1050113B1 (en) * | 1997-12-27 | 2002-03-13 | STMicroelectronics Asia Pacific Pte Ltd. | Method and apparatus for estimation of coupling parameters in a transform coder for high quality audio |
-
2002
- 2002-05-02 WO PCT/JP2002/004410 patent/WO2002093559A1/en not_active Application Discontinuation
- 2002-05-02 KR KR1020027014077A patent/KR20030040203A/ko not_active Application Discontinuation
- 2002-05-02 EP EP02724689A patent/EP1386310A1/en not_active Withdrawn
- 2002-05-02 CN CNB028006003A patent/CN1231890C/zh not_active Expired - Fee Related
- 2002-05-09 US US10/140,881 patent/US20020169601A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101952890B (zh) * | 2008-02-21 | 2012-08-22 | 株式会社建伍 | 数据转换设备、程序以及方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20030040203A (ko) | 2003-05-22 |
WO2002093559A1 (en) | 2002-11-21 |
US20020169601A1 (en) | 2002-11-14 |
CN1231890C (zh) | 2005-12-14 |
EP1386310A1 (en) | 2004-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1279512C (zh) | 用于改善高频重建的方法和装置 | |
CN1272911C (zh) | 音频信号解码装置及音频信号编码装置 | |
KR101251813B1 (ko) | 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩 | |
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
JP3926726B2 (ja) | 符号化装置および復号化装置 | |
JP5048697B2 (ja) | 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体 | |
CN1459092A (zh) | 编码设备、解码设备和广播系统 | |
CN1897467A (zh) | 信号编码、信号解码装置和方法、程序以及记录介质 | |
JP2006011456A (ja) | 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体 | |
CN1249669C (zh) | 使用时间频率相关编码和/或解码数字音频的方法及装置 | |
JP4308229B2 (ja) | 符号化装置および復号化装置 | |
JP3923783B2 (ja) | 符号化装置及び復号化装置 | |
JP2003108197A (ja) | オーディオ信号復号化装置およびオーディオ信号符号化装置 | |
JP4399185B2 (ja) | 符号化装置および復号化装置 | |
JP2006126826A (ja) | オーディオ信号符号化/復号化方法及びその装置 | |
JP4317355B2 (ja) | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム | |
JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
JP3984468B2 (ja) | 符号化装置、復号化装置及び符号化方法 | |
JP2002534039A (ja) | オーディオエンコード装置において固定マスキング閾値を効果的に実現する装置及び方法 | |
JP2003029797A (ja) | 符号化装置、復号化装置および放送システム | |
JP2008033211A (ja) | 付加信号生成装置、信号変換された信号の復元装置、付加信号生成方法、信号変換された信号の復元方法および付加信号生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20051214 Termination date: 20130502 |