CN101939782B - 噪声填充与带宽扩展之间的自适应过渡频率 - Google Patents
噪声填充与带宽扩展之间的自适应过渡频率 Download PDFInfo
- Publication number
- CN101939782B CN101939782B CN200880105330XA CN200880105330A CN101939782B CN 101939782 B CN101939782 B CN 101939782B CN 200880105330X A CN200880105330X A CN 200880105330XA CN 200880105330 A CN200880105330 A CN 200880105330A CN 101939782 B CN101939782 B CN 101939782B
- Authority
- CN
- China
- Prior art keywords
- frequency
- transition
- band
- spectral coefficient
- transition frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000007704 transition Effects 0.000 title claims abstract description 133
- 230000003044 adaptive effect Effects 0.000 title description 2
- 238000001228 spectrum Methods 0.000 claims abstract description 99
- 230000003595 spectral effect Effects 0.000 claims abstract description 96
- 230000005236 sound signal Effects 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000011084 recovery Methods 0.000 claims abstract description 4
- 239000004606 Fillers/Extenders Substances 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 5
- 230000008447 perception Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 4
- 230000005055 memory storage Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种用于音频信号的频谱解码中的频谱恢复的方法,包括获取(210)表示音频信号的频谱系数的初始集合,并确定(212)过渡频率。过渡频率适应于音频信号的频谱内容。对频谱系数的初始集合中低于过渡频率的频谱空洞进行噪声填充(214),以及在过渡频率以上对频谱系数的初始集合进行带宽扩展(216)。还图示布置用于执行部分或完整方法的解码器和编码器。
Description
技术领域
本发明主要涉及用于对音频信号编码和解码的方法和设备,并且具体来说涉及用于频谱填充的方法和设备。
背景技术
当要存储和/或传送音频信号时,目前的标准方法是根据不同的方案将音频信号编码成数字表示。为了节省存储和/或传送容量,一般期望减小允许以足够的质量来重构音频信号所需的数字表示的大小。编码的信号的大小与信号质量之间的平衡取决于实际应用。
基于变换的音频编码器通过将变换系数量化来压缩音频信号。为了实现低比特率,量化器可能将可用的比特集中于最有能量且感知相关的系数上,并且仅传送那些系数,从而在频谱中留下未量化的系数的“频谱空洞”。
所谓的SBR(频带复制)技术(参见例如3GPP TS 26.404V6.0.0(2004-09),“Enhanced aacPlus general audio codec-encoder SBR part(Release 6)”,2004[1])闭合常规感知编码器的带限信号与约15kHz的可听带宽之间的间隙。SBR后的一般原理是以感知上精确的方式重新创建已解码信号的丢失的高频内容。从心理声学的角度来说,15kHz以上的频率是不那么重要的,但是也可以被重构。但是,SBR无法用作独立的编解码器。它总是结合常规波形编解码器(所谓的核心编解码器)来操作。核心编解码器负责传送原始频谱的较低部分,而SBR解码器(其主要是对常规波形解码器的后处理)重构非传送的频率范围。与常规编解码器中一样,不直接传送高频带的频谱值。该组合的系统提供优于单独的核心编解码器的增益的编码增益。
SBR方法依赖于低频带、编码的感知相关的低频率、以及高频带、未编码的不那么相关的高频率之间固定的过渡频率的定义。但是,在实践中,此过渡频率依赖于原始信号的音频内容。换言之,从一个信号到另一个信号,适合的过渡频率可能变化得很大。例如,在将清晰的话音与全频带的音乐信号比较时,情况是如此。
解码的频谱的“频谱空洞”可以分成两种类型。第一种是较低频率处的小空洞,其是由于瞬时屏蔽(instantaneous masking)的效应所致,参见例如J.D.Johnston的″Estimation of Perceptual Entropy UsingNoise Masking Criteria″(Proc.ICASSP,2524-2527页,1988年五月[2]).第二种是高频率处的较大的空洞,是由于屏蔽的添加和听觉的绝对阈值导致的饱和所引起的[2]。SBR主要涉及第二种。
而且,基于这种方法的典型音频编解码器(其目的在于为高频率填充“频谱空洞”,即未编码的系数,即第二种类型的“频谱空洞”)优选地应该能够填充整个频谱上的频谱空洞。实际上,即使SBR编解码器能够输送全带宽音频信号,重构的高频率仍不会屏蔽编码(即低频带的量化,该低频带即是感知相关的低频率)引入的恼人的伪迹(artefact)。
发明内容
本发明的主要目的在于提供用于实现有效抑制全频带音频信号上频谱空洞引起的感知伪迹的方法和设备。
上面的目的通过如所附专利权利要求所述的方法和设备来实现。总的来说,根据第一方面,一种用于音频信号的频谱解码中的频谱恢复的方法,包括获取表示音频信号的频谱系数的初始集合,并确定过渡频率。过渡频率适应于音频信号的频谱内容。对频谱系数的初始集合中过渡频率以下的频谱空洞进行噪声填充,在过渡频率以上对频谱系数的初始集合进行带宽扩展。
根据第二方面,一种用于在音频信号的频谱编码中使用的方法,包括确定用于表示音频信号的频谱系数的初始集合的过渡频率。过渡频率适应于音频信号的频谱内容。过渡频率定义打算作为用于频谱空洞的噪声填充的对象的频率范围与打算作为用于带宽扩展的对象的频率范围之间的边界。
根据第三方面,一种用于音频信号的频谱解码的解码器,包括用于获取表示音频信号的频谱系数的初始集合的输入和布置用于确定过渡频率的过渡确定电路。过渡频率适应于音频信号的频谱内容。该解码器包括用于噪声填充频谱系数的初始集合中过渡频率以下的频谱空洞的噪声填充器,和布置用于在过渡频率以上带宽扩展频谱系数的初始集合的带宽扩展器。
根据第四方面,一种用于音频信号的频谱编码的编码器,包括布置用于确定用于表示音频信号的频谱系数的初始集合的过渡频率的过渡确定电路。过渡频率适应于音频信号的频谱内容。过渡频率定义打算作为用于频谱空洞的噪声填充的对象的频率范围与打算作为用于带宽扩展的对象的频率范围之间的边界。
本发明具有多个优点。一个优点是过渡频率的使用允许使用噪声填充和带宽扩展的组合频谱填充的使用。而且,过渡频率是以自适应的方式定义的,即根据所使用的编码方案来定义的,这使得频谱填充取决于例如频率分辨率。使用此方法的任何话音和/或音频编解码器能够输送高质量(即减少了恼人的伪迹)且全带宽的音频信号。在该方法可以与任何类型的频率表示(DCT、MDCT等)或滤波器组组合、即与任何编解码器(感知的、参数的等)组合的意义上而言,该方法是灵活的。
附图说明
通过参考下文结合附图的描述,将更好地理解本发明及其进一步的目的和优点,其中:
图1是编解码器系统的示意框图;
图2是根据本发明的音频信号编码器的一个实施例的示意框图;
图3是频谱系数、其组和频带的示意图示;
图4是根据本发明的音频信号解码器的一个实施例的示意框图;
图5A-C是用于查找过渡频率的原理的实施例的图示;
图6是根据本发明的方法的一个实施例的步骤的流程图;
图7是根据本发明的信号处理方法的一个实施例的步骤的流程图。
具体实施方式
在所有附图中,相同的引用数字用于相似或对应的单元。
图1中示意地示出用于音频信号的普通编解码器系统的一个实施例。音频源10产生音频信号15。在编码器20中处理音频信号15,编码器20产生包含表示音频信号15的数据的二进制流(binary flux)25。二进制流25例如在多媒体通信的情况中可通过传送和/或存储装置30来传送。可选地,传送和/或存储装置30还可以包括某些存储容量。二进制流25还可以仅存储在传送和/或存储装置30中,这仅仅在二进制流的利用中引入时间延迟。因此,传送和/或存储装置30是引入二进制流25的空间重定位或时间延迟中至少一项的装置。当使用时,在解码器40中处理二进制流25,解码器40从二进制流中包含的数据产生音频输出35。通常,音频输出35应该在某些约束下尽可能完好地类似于原始音频信号15。
在许多实时应用中,原始音频信号15的产生与产生的音频输出35之间的时间延迟通常不允许超过某个时间。如果传送资源在同时是受限制的,则可用的比特率也通常低。为了以最佳可能的方式利用可用的比特率,开发了感知音频编码。因此,感知音频编码已经成为目前许多多媒体服务的重要部分。其基本原理是,将音频信号转换成频域中的频谱系数,并使用感知模型来确定这些频谱系数的频率和时间相关的屏蔽。
图2示出根据本发明的音频编码器20的一个实施例。在此特定实施例中,感知音频编码器20是基于感知变换器或感知滤波器组的频谱编码器。接收音频源15,包括音频信号x[n]的帧。
在典型的频谱编码器中,转换器21布置用于将时域音频信号15转换成频域的频谱系数Xb[n]的集合24。在典型的变换编码器中,该转换可以例如由离散傅立叶变换(DFT)、离散余弦变换(DCT)或修改的离散余弦变换(MDCT)来执行。因此,转换器21通常可以由频谱变换器来构建。实际变换的细节对于本发明的基本原理并非特别重要,因此不进一步论述。
将频谱系数的集合24,即输入的音频信号的频率表示,提供到量化和编码部分28,其中将频谱系数量化并编码。通常,量化为将可用比特集中在最有能量且感知相关的系数上而操作。这可以使用例如不同类型的屏蔽阈值或带宽缩减来执行。其结果通常将是频谱中未量化的系数的“频谱空洞”。换言之,故意将一些系数保留在外(因为它们在感知上不那么重要),以便不占用其他目的更需要的传送资源。然后可以在解码器一侧通过不同的重构策略来校正或重构此类频谱空洞。通常,呈现两种类型的频谱空洞。第一种类型包括这样的频谱空洞,主要在低频率区域中占据在不同位置的单独的频谱空洞或几个相邻的频谱空洞。第二种类型是在频谱的高频端处或多或少的连续的频谱空洞组。
根据本发明,有利的是以不同的方式来处理这两种不同类型的频谱空洞,以便实现尽可能有效率的频谱填充。要确定的一个参数因此是过渡频率,在此频率处不同的填充方法会合,所以称为过渡频率。因为频谱空洞的分布在不同类型的音频信号之间有所不同,所以过渡频率的最佳选择也有所不同。根据本发明,该过渡频率适应于音频信号的频谱内容。通常,过渡频率适应于音频信号的当前帧的频谱内容,但是,过渡频率还可以取决于音频信号的先前帧的频谱内容,并且如果没有严格的延迟要求,则过渡频率还可以取决于音频信号的将来帧的频谱内容。此适应可以在编码器一侧由过渡确定电路60来执行,过渡确定电路60通常与量化和编码部分28集成在一起。但是,在备选实施例中,过渡确定电路60可以作为单独操作的部分来提供,从而仅将表示过渡频率的参数提供到编码器20的不同功能性。可以在编码器一侧将该过渡频率用于例如在过渡频率不同侧提供用于频率间隔的适合的包络编码。
量化和编码部分28还布置用于根据将要使用的传送或存储标准,将编码的频谱系数与附加的边信息(side information)封装成比特流。从而从量化和编码部分28输出具有表示频谱系数的集合的数据的二进制流25。因为过渡频率可直接从音频信号的频谱内容推导出,所以相同的推导可以在传送接口的两侧执行,即在编码器和解码器来执行。这意味着过渡频率自身的值不一定必须在附加的边信息中传送。但是,如果有可用的比特率容量,则那样做当然是可能的。
在特定实施例中,使用MDCT变换。在由心理声学模型执行的加权后,MDCT系数使用矢量量化来量化。在矢量量化VQ中,将频谱系数划分到小组中。每组系数可以视为单个矢量,并且每个矢量单独地来量化。
例如,因为比特率上的高限制,量化器可将可用的比特集中于最有能量且感知相关的组上,从而导致一些组被设置为零。这些组形成量化的频谱中的频谱空洞。图3中示出此情况。在本实施例中,组70包括相同数量的频谱系数71,在本例中是4个。但是,在备选实施例中,具有不同数量的频谱系数的组也可以是可能的。在一个特定实施例中,所有组每个仅包括一个频谱系数,即组与频谱系数本身是相同的。附图中以未填充的矩形来示出量化的组72,而将设置为零的组73示出为黑色矩形。传送到任何最终用户的通常仅是量化的组72。
系数的组70又划分到不同的频带74中。该划分优选地根据某种心理声学准则来执行。由此可以共同地对待具有基本相似的心理声学属性的组。因此每个频带74的成员的数量、即与频带74关联的组70的数量可以有所不同。如果大频率部分具有相似的属性,则覆盖这些频率的频带可能具有大的频率范围。如果心理声学属性在频率上快速变化,则这反而要求小频率范围的频带。用于频谱填充的例程可以优选地取决于要填充的频带,正如下文进一步详细论述的。
在解码阶段,基本实施反向操作。图4中示出根据本发明的音频解码器40的一个实施例。接收到二进制流25,其具有上文描述的编码器导致的属性。在频谱系数解码器41中执行对接收的二进制流25(例如比特流)的去量化和解码。频谱系数解码器41布置用于将从二进制流恢复的频谱系数解码成频谱系数的初始集合42的解码的频谱系数XQ[n],它们可能被分组在频率组Xb Q[n]中。可能在后处理(例如屏蔽阈值或带宽缩减)之后,频谱系数的初始集合42优选地类似于由编码器一侧的转换器提供的频谱系数的集合。
正如上文进一步论述的,在编码器应用屏蔽阈值或带宽缩减通常导致频谱系数的集合42在它通常包括所谓的“频谱空洞”的意义上来说是不完整的。“频谱空洞”对应于不在二进制流中接收的频谱系数。换言之,频谱空洞是未定义或非编码的频谱系数XQ[n]或由频谱系数解码器41自动设置成预定值(通常为零)的频谱系数。为了避免可听伪迹,这些系数必须在解码器由估计来替代(填充)。
频谱空洞常常以两种类型出现。小频谱空洞通常在低频率处,以及一个或几个大频谱空洞通常出现在高频率处。
为了将解码的音频信号中的伪迹减到最少,解码器通过以系数的估计替代频谱中的频谱空洞来“填充”频谱。这些估计可以基于解码器传送的边信息和/或可以取决于信号本身。此类有用的边信息示例可以是频谱的功率包络和音调,即,丢失的系数的频谱平滑度测量。
可以使用两种不同方法来填充不同类型的频谱空洞。“噪声填充”对于较低频率中的频谱空洞表现很好,而“带宽扩展”在高频率更适合。本发明描述决定应该分别在哪里使用噪声填充和带宽扩展的方法。
本发明依赖于频谱的低相关部分和高相关部分之间的过渡频率的定义。基于此信息,依赖于高质量“噪声填充”过程的典型编码算法将能够减少对于低速率出现的编码伪迹,并且还能够基于“带宽扩展”甚至以低速率并利用低复杂度方案来重新生成全带宽音频信号。这在下文将更详细地进一步论述。
来自频谱系数解码器41的频谱系数的初始集合42通常包括提供到过渡确定电路60的某个数量的频谱空洞。过渡确定电路60布置用于确定过渡频率ft。
还将来自频谱系数解码器41的频谱系数的初始集合42提供到频谱填充器43。频谱填充器43布置用于对频谱系数的初始集合42进行频谱填充,从而得到重构的频谱系数X′b[n]的完整集合44。重构的频谱系数的集合44通常具有定义的某个频率范围内的所有频谱系数。
频谱填充器43又包括噪声填充器50。噪声填充器50布置用于优选地在低频率区域中(即过渡频率ft以下)提供用于频谱空洞的噪声填充的过程。因此,对频谱系数的初始集合中在过渡频率以下由于未包含在接收的编码的比特流中而“丢失”的频谱系数赋值。为此,将来自过渡确定电路60的输出65连接到噪声填充器50,从而提供与过渡频率ft关联的信息。
频谱填充器43还包括带宽扩展器55,带宽扩展器55布置用于在过渡频率以上对频谱系数的初始集合进行带宽扩展以便产生重构的频谱系数的集合44。因此,也将来自过渡确定电路60的输出65连接到带宽扩展器55。
如上所述,来自频谱填充器43的结果是重构的频谱系数X′b[n]的完整集合44,具有定义的某个频率范围内的所有频谱系数。
将重构的频谱系数的集合44提供到连接到频谱填充器43的转换器45。转换器45布置用于将频域的频谱系数的集合44转换成时域的音频信号46。在本实施例中,转换器45基于感知变换器,对应于编码器20中使用的变换技术(图2)。在特定实施例中,利用反向变换(例如反向MDCT-IMDCT或反向DFT-IDFT等)将信号提供回时域。在其他实施例中,可以利用反向滤波器组。与在编码器一侧一样,转换器45的技术同样是本领域中公知的,并且不会进一步论述。可能利用进一步的处理步骤,在用于音频信号的输出35提供最终的感知重构的音频信号34x′[n]。
编解码器必须判定在什么频带中要使用噪声填充以及在什么频带中要使用带宽扩展。当量化要填充的频带的大多数组,并且该频带中只有少数频谱空洞时,噪声填充给出最佳结果。当高频率中大部分信号保留不量化时,带宽扩展是优选的。
一个基本方法将是在噪声填充与带宽扩展之间设置固定的过渡频率。通过噪声填充来填充频带或组中该频率以下的频谱空洞,通过带宽扩展来填充组或频带中该频率以上的频谱空洞。
但是,此方法的问题在于,最佳过渡频率并非对于所有音频信号都是相同的。一些信号具有集中在低频率中的大多数能量,并且信号的大部分能经受带宽扩展。其他信号具有更平均地散布在频谱上的其能量,并且这些信号可受益于仅使用噪声填充。
根据按照本发明的方法的一个实施例,过渡频率自适应地取决于频谱系数的所述初始集合中的频谱空洞的分布。用于查找适合的过渡频率的例程可以是遍历所有频带,从最高(BN)开始向下到1。如果当前频带中没有量化的系数,则将通过带宽扩展来填充它。如果带宽中有量化的系数,则使用噪声填充来填充此频带以及跟随的频带的空洞。因此,将过渡频率设置在从高频率一侧看的其中具有量化的系数的第一频带的上限。这在图5A中示出。频带N中的频谱空洞77(即过渡频率ft以上)因此利用带宽扩展方法来填充。反过来过渡频率ft以下的频谱空洞76通过噪声填充来填充。
图5B中示出一个备选实施例。此处过渡频率的定义直接基于组70,而忽略频带划分。此处,对从最高频率向下到紧接第一量化组78以上的组的所有组使用带宽扩展。反过来过渡频率ft以下的频谱空洞76通过噪声填充来填充。
这些方法对于音频信号和量化器(即编码方案)更具自适应性,但是当信号例如根据图5C来量化时它可能遇到小问题。此处,将信号的高频率的大部分设置为零,并且从频带B9到B12优选地应该使用带宽扩展。但是,因为频带B11中有单个编码的量化组79,所以带宽扩展将完全地在此量化组79以下被禁用,并且在直到此组79的所有频带使用噪声填充。
也是为了避免此问题,还提出另一个实施例,其中根据频带中的频谱空洞的比例来选择过渡频率ft。与先前实施例中一样,编解码器遍历频带,从最高开始向下到1。对于每个频带,对编码的频谱系数或组的数量计数。如果量化的系数或组的数量除以频谱系数或组的总数(即频带的编码的频谱系数的比例)超过某个阈值,则利用噪声填充来填充该频带和跟随的频带的频谱空洞。否则,使用带宽扩展。类似地,可以监视频带中的频谱空洞的比例。换言之,要找出过渡频带,它是其中频谱空洞的比例低于第一阈值的最高频带。
选择过渡频带还有备选准则。一种可能性是使阈值本身取决于频率。以此方式,在高频率部分中可以接受频谱空洞的某个比例以用于仍使用带宽扩展技术,而在低频率部分中不可接受。本领域技术人员认识到,可以通过多种方式来更改选择适合准则的细节,例如根据其他信号相关属性或其他边信息。
在一个实施例中,过渡频率根据过渡频带的频率上限来设置,并且优选地等于过渡频带的频率上限。但是,还有多种备选方案。一种备选方案是搜索最高频率编码的频谱系数或组并将过渡频率设在该组的高频率一侧。
上面描述的实施例的算法还能以如下伪代码来描述:
For currentBand=N to 1
ratio=numCodedCoeffInBand(currentBand)/
numCoeffInBand(currentBand)
If ratio>阈值
过渡位于currentBand与currentBand+1之间
Return
End if
Next
过渡位于频带1的开始处
如果过渡频率在连续帧之间没有太大变化,则这是优选的。太大变化可能被感知为干扰。因此,在一个示范实施例中,过渡频率进一步取决于先前使用的过渡频率。例如,两个连续帧之间禁止过渡频率改变大于预定的绝对或相对量将是可能的。备选的是,可以将临时过渡频率作为值与先前的过渡频率一起输入到滤波器中,从而给出具有更受抑制的变化行为的修改的过渡频率。这样,过渡频率将取决于多于一个先前的过渡频率。
这些例程通常在过渡确定电路中(即优选地分别在解码器中和编码器的量化和编码部分中)执行。
图6是示出根据本发明的方法的一个实施例的步骤的流程图。一种用于音频信号的频谱解码中的频谱恢复的方法开始于步骤200。在步骤210中,获取表示该音频信号的频谱系数的初始集合。在步骤212中,确定过渡频率。过渡频率适应于音频信号的频谱内容。在步骤214中执行频谱系数的初始集合中过渡频率以下的频谱空洞的噪声填充,以及在步骤216中在过渡频率以上执行对频谱系数的初始集合的带宽扩展。该过程结束于步骤249。
类似地,图7是示出根据本发明的另一个方法的一个实施例的步骤的流程图。一种用于在音频信号的频谱编码中使用的方法开始于步骤200。在步骤212中,确定过渡频率。用于表示音频信号的频谱系数的初始集合的过渡频率适应于音频信号的频谱内容。过渡频率定义打算作为用于频谱空洞的噪声填充的对象的频率范围和打算作为用于带宽扩展的对象的频率范围之间的边界。
本发明通过根据所使用的编码方案来自适应地定义过渡频率而获得多个优点。该适应的过渡频率允许使用噪声填充和带宽扩展来有效率地使用组合的频谱填充。使用此方法的任何话音和/或音频编解码器能够输送高质量且全带宽的音频信号同时减少恼人的伪迹。在该方法可以与任何类型的频率表示(DCT、MDCT等)或滤波器组组合、即与任何编解码器(感知的、参数的等)组合的意义上而言,该方法是灵活的。
上文描述的实施例应理解为本发明的几个说明性示例。本领域技术人员将理解在不背离本发明范围的前提下可以对这些实施例进行多种修改、组合和更改。具体来说,在技术上可能之处,可以将不同实施例中的不同部分解决方案组合在其他配置中。但是,本发明的范围由所附权利要求来限定。
参考文献
[1]3GPP TS 26.404V6.0.0(2004-09),″Enhanced aacPlus generalaudio codec-encoder SBR part(Release 6)″,2004
[2]J.D.Johnston,″Estimation of Perceptual Entropy Using NoiseMasking Criteria″,Proc.ICASSP,2524-2527页,1988年5月。
Claims (18)
1.一种用于音频信号的频谱解码中的频谱恢复的方法,包括以下步骤:
获取(210)表示所述音频信号的频谱系数的初始集合(42);
确定(212)过渡频率(ft);
噪声填充(214)频谱系数的所述初始集合(42)中所述过渡频率(ft)以下的频谱空洞;以及
在所述过渡频率(ft)以上带宽扩展(216)频谱系数的所述初始集合(42);
所述过渡频率(ft)适应于所述音频信号的频谱内容;
所述过渡频率(ft)自适应地取决于频谱系数的所述初始集合(42)中频谱空洞的分布。
2.如权利要求1所述的方法,其中确定所述过渡频率(ft)的所述步骤又包括以下步骤:
将频谱系数的所述初始集合(42)的所述频谱系数划分到多个频带(74)中;以及
根据所述频带(74)中频谱空洞的比例来选择所述过渡频率(ft)。
3.如权利要求2所述的方法,其中所述频带(74)具有恒定的频率宽度。
4.如权利要求2所述的方法,其中所述频带(74)的至少两个具有不同的频率宽度。
5.如权利要求2至4中任一项所述的方法,其中选择所述过渡频率(ft)的所述步骤包括:
查找过渡频带,所述过渡频带是其中所述比例低于第一阈值的最高频带。
6.如权利要求5所述的方法,其中选择所述过渡频率(ft)的所述步骤还包括:
根据所述过渡频带的频率上限来设置所述过渡频率(ft)。
7.如权利要求6所述的方法,其中设置所述过渡频率(ft)的所述步骤还取决于先前使用的过渡频率。
8.如权利要求7所述的方法,其中设置所述过渡频率(ft)的所述步骤还取决于多于一个先前使用的过渡频率。
9.如权利要求7所述的方法,其中在两个连续帧之间禁止所述过渡频率(ft)变化大于预定的绝对或相对量。
10.如权利要求8所述的方法,其中在两个连续帧之间禁止所述过渡频率(ft)变化大于预定的绝对或相对量。
11.一种用于在音频信号的频谱编码中使用的方法,包括:
确定(212)用于表示所述音频信号的频谱系数的初始集合(24;42)的过渡频率(ft);
所述过渡频率(ft)定义打算作为用于频谱空洞的噪声填充的对象的频率范围与打算作为用于带宽扩展的对象的频率范围之间的边界;
所述过渡频率(ft)适应于所述音频信号的频谱内容;
所述过渡频率(ft)自适应地取决于频谱系数的所述初始集合(42)中频谱空洞的分布。
12.一种用于音频信号的频谱解码的解码器(40),包括:
输入端,用于获取表示所述音频信号的频谱系数的初始集合(42);
过渡确定电路(60),布置用于确定过渡频率(ft);
噪声填充器(50),用于噪声填充频谱系数的所述初始集合(42)中所述过渡频率(ft)以下的频谱空洞;以及
带宽扩展器(55),布置用于在所述过渡频率(ft)以上带宽扩展频谱系数的所述初始集合(42);
所述过渡频率(ft)适应于所述音频信号的频谱内容;
所述过渡确定电路(60)布置用于根据频谱系数的所述初始集合(42)中频谱空洞的分布来自适应地确定所述过渡频率(ft)。
13.如权利要求12所述的解码器,其中所述过渡确定电路(60)还布置用于将频谱系数的所述初始集合的所述频谱系数划分到多个频带(74)中,以及用于根据所述频带(74)中频谱空洞的比例来选择所述过渡频率(ft)。
14.如权利要求13所述的解码器,其中所述频带(74)具有恒定的频率宽度。
15.如权利要求13所述的解码器,其中所述频带(74)的至少两个具有不同的频率宽度。
16.如权利要求13至15中任一项所述的解码器,其中所述过渡确定电路(60)还布置用于
查找过渡频带,所述过渡频带是其中所述比例低于第一阈值的最高频带。
17.如权利要求16所述的解码器,其中所述过渡确定电路(60)还布置用于
根据所述过渡频带的频率上限来设置所述过渡频率(ft)。
18.一种用于音频信号的频谱编码的编码器(20),包括:
过渡确定电路(60),布置用于确定用于表示所述音频信号的频谱系数的初始集合(24)的过渡频率(ft);
所述过渡频率(ft)定义打算作为用于频谱空洞的噪声填充的对象的频率范围与打算作为用于带宽扩展的对象的频率范围之间的边界;
所述过渡频率(ft)适应于所述音频信号的频谱内容;
所述过渡确定电路(60)布置用于根据频谱系数的所述初始集合(42)中频谱空洞的分布来自适应地确定所述过渡频率(ft)。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96813407P | 2007-08-27 | 2007-08-27 | |
US60/968134 | 2007-08-27 | ||
US60/968,134 | 2007-08-27 | ||
PCT/SE2008/050969 WO2009029037A1 (en) | 2007-08-27 | 2008-08-26 | Adaptive transition frequency between noise fill and bandwidth extension |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101939782A CN101939782A (zh) | 2011-01-05 |
CN101939782B true CN101939782B (zh) | 2012-12-05 |
Family
ID=40387561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880105330XA Active CN101939782B (zh) | 2007-08-27 | 2008-08-26 | 噪声填充与带宽扩展之间的自适应过渡频率 |
Country Status (12)
Country | Link |
---|---|
US (5) | US9269372B2 (zh) |
EP (2) | EP2186086B1 (zh) |
JP (2) | JP5183741B2 (zh) |
CN (1) | CN101939782B (zh) |
BR (1) | BRPI0815972B1 (zh) |
DK (1) | DK2571024T3 (zh) |
ES (2) | ES2403410T3 (zh) |
HK (1) | HK1143239A1 (zh) |
MX (1) | MX2010001394A (zh) |
PL (1) | PL2186086T3 (zh) |
PT (1) | PT2571024E (zh) |
WO (1) | WO2009029037A1 (zh) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2010001394A (es) * | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda. |
EP3591650B1 (en) * | 2007-08-27 | 2020-12-23 | Telefonaktiebolaget LM Ericsson (publ) | Method and device for filling of spectral holes |
KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
AU2009267459B2 (en) * | 2008-07-11 | 2014-01-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102194457B (zh) * | 2010-03-02 | 2013-02-27 | 中兴通讯股份有限公司 | 音频编解码方法、系统及噪声水平估计方法 |
CN102822890A (zh) * | 2010-03-30 | 2012-12-12 | 松下电器产业株式会社 | 音响装置 |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
WO2012033942A2 (en) * | 2010-09-10 | 2012-03-15 | Dts, Inc. | Dynamic compensation of audio signals for improved perceived spectral imbalances |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012053150A1 (ja) * | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US9015042B2 (en) * | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
US8731949B2 (en) | 2011-06-30 | 2014-05-20 | Zte Corporation | Method and system for audio encoding and decoding and method for estimating noise level |
WO2013002623A2 (ko) | 2011-06-30 | 2013-01-03 | 삼성전자 주식회사 | 대역폭 확장신호 생성장치 및 방법 |
JP5416173B2 (ja) * | 2011-07-07 | 2014-02-12 | 中興通訊股▲ふん▼有限公司 | 周波数帯コピー方法、装置及びオーディオ復号化方法、システム |
CN102208188B (zh) * | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
CN106409299B (zh) * | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9881616B2 (en) * | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
WO2014042439A1 (ko) * | 2012-09-13 | 2014-03-20 | 엘지전자 주식회사 | 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치 |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
PL3451334T3 (pl) * | 2013-01-29 | 2020-12-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja wypełniania szumem |
BR112015025022B1 (pt) | 2013-04-05 | 2022-03-29 | Dolby International Ab | Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio |
WO2014161993A1 (en) * | 2013-04-05 | 2014-10-09 | Dolby International Ab | Stereo audio encoder and decoder |
EP2830054A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
WO2015041070A1 (ja) | 2013-09-19 | 2015-03-26 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
MX355452B (es) * | 2013-10-31 | 2018-04-18 | Fraunhofer Ges Forschung | Extension de ancho de banda de audio mediante insercion de ruido pre-formado temporal en el dominio de frecuencia. |
CA2934602C (en) | 2013-12-27 | 2022-08-30 | Sony Corporation | Decoding apparatus and method, and program |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
KR102250472B1 (ko) * | 2016-03-07 | 2021-05-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합 |
FI3696813T3 (fi) | 2016-04-12 | 2023-01-31 | Audiokooderi audiosignaalin koodaamiseksi, menetelmä audiosignaalin koodaamiseksi ja tietokoneohjelma havaitulla huippuspektrialeella tarkastettuna ylemmällä taajuuskaistalla | |
CN110199568B (zh) | 2017-03-18 | 2024-03-15 | 华为技术有限公司 | 连接恢复方法、接入和移动性管理功能实体及用户设备 |
EP3382703A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
CN116157860A (zh) * | 2021-09-22 | 2023-05-23 | 京东方科技集团股份有限公司 | 音频调节方法、装置、设备及存储介质 |
CN118215959A (zh) * | 2022-09-05 | 2024-06-18 | 北京小米移动软件有限公司 | 一种音频信号频带扩展方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1475010A (zh) * | 2000-11-15 | 2004-02-11 | ���뼼�����ɷݹ�˾ | 增强使用高频重建方法的编码系统的性能 |
CN1481545A (zh) * | 2000-11-14 | 2004-03-10 | ���뼼�����ɷݹ�˾ | 利用自适应滤波改善高频重建编码方法的感知性能 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583961A (en) * | 1993-03-25 | 1996-12-10 | British Telecommunications Public Limited Company | Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands |
US5664057A (en) * | 1993-07-07 | 1997-09-02 | Picturetel Corporation | Fixed bit rate speech encoder/decoder |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
WO2002091363A1 (en) * | 2001-05-08 | 2002-11-14 | Koninklijke Philips Electronics N.V. | Audio coding |
US6493668B1 (en) * | 2001-06-15 | 2002-12-10 | Yigal Brandman | Speech feature extraction system |
US7260541B2 (en) * | 2001-07-13 | 2007-08-21 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
WO2003042979A2 (en) * | 2001-11-14 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
GB2388502A (en) * | 2002-05-10 | 2003-11-12 | Chris Dunn | Compression of frequency domain audio signals |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
JP2004134900A (ja) * | 2002-10-09 | 2004-04-30 | Matsushita Electric Ind Co Ltd | 符号化信号復号化装置および復号化方法 |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7548852B2 (en) * | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
JP2006087018A (ja) * | 2004-09-17 | 2006-03-30 | Matsushita Electric Ind Co Ltd | 音響処理装置 |
JP2008513845A (ja) * | 2004-09-23 | 2008-05-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体 |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
EP1869669B1 (en) * | 2006-04-24 | 2008-08-20 | Nero AG | Advanced audio coding apparatus |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US20080208575A1 (en) * | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
EP2186088B1 (en) * | 2007-08-27 | 2017-11-15 | Telefonaktiebolaget LM Ericsson (publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
CA2697920C (en) * | 2007-08-27 | 2018-01-02 | Telefonaktiebolaget L M Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
MX2010001394A (es) * | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda. |
EP3591650B1 (en) * | 2007-08-27 | 2020-12-23 | Telefonaktiebolaget LM Ericsson (publ) | Method and device for filling of spectral holes |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
-
2008
- 2008-08-26 MX MX2010001394A patent/MX2010001394A/es active IP Right Grant
- 2008-08-26 EP EP08828148A patent/EP2186086B1/en active Active
- 2008-08-26 ES ES08828148T patent/ES2403410T3/es active Active
- 2008-08-26 US US12/674,341 patent/US9269372B2/en not_active Expired - Fee Related
- 2008-08-26 JP JP2010522869A patent/JP5183741B2/ja not_active Expired - Fee Related
- 2008-08-26 WO PCT/SE2008/050969 patent/WO2009029037A1/en active Application Filing
- 2008-08-26 BR BRPI0815972A patent/BRPI0815972B1/pt active IP Right Grant
- 2008-08-26 CN CN200880105330XA patent/CN101939782B/zh active Active
- 2008-08-26 PL PL08828148T patent/PL2186086T3/pl unknown
- 2008-08-26 PT PT121969133T patent/PT2571024E/pt unknown
- 2008-08-26 DK DK12196913.3T patent/DK2571024T3/en active
- 2008-08-26 ES ES12196913.3T patent/ES2526333T3/es active Active
- 2008-08-26 EP EP12196913.3A patent/EP2571024B1/en active Active
-
2010
- 2010-10-08 HK HK10109588.7A patent/HK1143239A1/xx unknown
-
2013
- 2013-01-15 JP JP2013004910A patent/JP5458189B2/ja active Active
-
2015
- 2015-12-01 US US14/955,645 patent/US9711154B2/en active Active
-
2017
- 2017-06-30 US US15/639,347 patent/US10199049B2/en active Active
-
2018
- 2018-12-21 US US16/230,777 patent/US10878829B2/en active Active
-
2020
- 2020-12-21 US US17/128,665 patent/US11990147B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1481545A (zh) * | 2000-11-14 | 2004-03-10 | ���뼼�����ɷݹ�˾ | 利用自适应滤波改善高频重建编码方法的感知性能 |
CN1475010A (zh) * | 2000-11-15 | 2004-02-11 | ���뼼�����ɷݹ�˾ | 增强使用高频重建方法的编码系统的性能 |
Also Published As
Publication number | Publication date |
---|---|
JP2010538318A (ja) | 2010-12-09 |
US10878829B2 (en) | 2020-12-29 |
ES2526333T3 (es) | 2015-01-09 |
BRPI0815972A2 (pt) | 2015-09-29 |
JP5183741B2 (ja) | 2013-04-17 |
WO2009029037A1 (en) | 2009-03-05 |
US20210110836A1 (en) | 2021-04-15 |
JP2013117730A (ja) | 2013-06-13 |
US20170301358A1 (en) | 2017-10-19 |
US9711154B2 (en) | 2017-07-18 |
US10199049B2 (en) | 2019-02-05 |
BRPI0815972A8 (pt) | 2017-11-14 |
US20160086614A1 (en) | 2016-03-24 |
US9269372B2 (en) | 2016-02-23 |
US20190122680A1 (en) | 2019-04-25 |
MX2010001394A (es) | 2010-03-10 |
CN101939782A (zh) | 2011-01-05 |
JP5458189B2 (ja) | 2014-04-02 |
PT2571024E (pt) | 2014-12-23 |
HK1143239A1 (en) | 2010-12-24 |
EP2186086A4 (en) | 2012-01-25 |
DK2571024T3 (en) | 2015-01-05 |
BRPI0815972B1 (pt) | 2020-02-04 |
EP2186086B1 (en) | 2013-01-23 |
EP2571024B1 (en) | 2014-10-22 |
EP2186086A1 (en) | 2010-05-19 |
US20110264454A1 (en) | 2011-10-27 |
EP2571024A1 (en) | 2013-03-20 |
ES2403410T3 (es) | 2013-05-17 |
US11990147B2 (en) | 2024-05-21 |
PL2186086T3 (pl) | 2013-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101939782B (zh) | 噪声填充与带宽扩展之间的自适应过渡频率 | |
US9111532B2 (en) | Methods and systems for perceptual spectral decoding | |
KR101586317B1 (ko) | 신호 처리 방법 및 장치 | |
EP2272063B1 (en) | Method and apparatus for selective signal coding based on core encoder performance | |
US7277849B2 (en) | Efficiency improvements in scalable audio coding | |
WO2003096325A1 (en) | Coding method, coding device, decoding method, and decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |