CN107533847A - 音频编码器、音频解码器、用于编码音频信号的方法及用于解码经编码的音频信号的方法 - Google Patents
音频编码器、音频解码器、用于编码音频信号的方法及用于解码经编码的音频信号的方法 Download PDFInfo
- Publication number
- CN107533847A CN107533847A CN201680015022.2A CN201680015022A CN107533847A CN 107533847 A CN107533847 A CN 107533847A CN 201680015022 A CN201680015022 A CN 201680015022A CN 107533847 A CN107533847 A CN 107533847A
- Authority
- CN
- China
- Prior art keywords
- spectral
- spectral coefficient
- encoded
- encoder
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims description 55
- 230000003595 spectral effect Effects 0.000 claims abstract description 513
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/635—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种用于编码音频信号的编码器。该编码器用于在变换域或滤波器组域中编码音频信号,其中该编码器用于为当前帧及至少一个先前帧确定音频信号的频谱系数,其中编码器用于将预测编码选择性地应用于由至少一个频谱系数分隔开的多个个别频谱系数或频谱系数的群组。
Description
技术领域
实施例涉及音频编码,尤其涉及一种使用预测编码对音频信号进行编码的方法和装置以及涉及一种使用预测解码对经编码的音频信号进行解码的方法和装置。优选的实施例涉及用于音高-自适应性频谱预测的方法和装置。更优选的实施例涉及使用频域帧间预测工具借助于变换编码的音调音频信号的感知编码。
背景技术
为了改进特别是在低比特率下的经编码的音调信号的质量,现代音频变换编码器采用非常长的变换和/或长期预测或预滤波/后滤波。然而,长的变换意味着长的演算延迟,其对于低延迟通讯情景来说是不被期望的。因此,基于瞬时基本音高的具有非常低的延迟的预测器近来受到欢迎。IETF(因特网工程任务组)Opus编解码器在其频域CELT(受限能量重叠变换)编码路径中利用音高自适应性预滤波和后滤波[J.M.Valin,K.Vos,andT.Terriberry,“Definition of the Opus audio codec(Opus音频编解码器的定义)”2012,IETF RFC 6716.http://tools.ietf.org/html/rfc67161.],并且3GPP(第三代合作伙伴计划)EVS(增强语音服务)编解码器提供用于经变换解码的信号的感知改进的长期谐波后滤波器[3GPP TS 26.443,“Codec for Enhanced Voice Services(EVS),”Release12,Dec.2014.]。这两种方法在时域中对经完全解码的信号波形进行操作,使得频率选择性地应用它们是困难和/或运算上昂贵的(两种方案仅提供简单的低通滤波器用于一些频率选择性)。因此,通过如在MPEG-2AAC中受支持的频域预测(FDP),提供对时域长期预测(LTP)或预滤波/后滤波(PPF)的受欢迎的替代方案[ISO/IEC13818-7,“Informationtechnology–Part 7:Advanced Audio Coding(AAC)(信息技术-第7部分:高级音频编码)”2006.]。虽然促进频率选择性,此方法具有其本身缺点,如下文所述。
如上所介绍的FDP方法对其他工具有两个缺点。第一,该FDP方法要求高运算复杂度。详细地说,在所有比例因子带中的预测的最坏情况下,对于用于每个帧和通道的数百个频谱仓(spectral bins)应用至少二阶(即来自上两个帧的通道变换仓)的线性预测编码[ISO/IEC 13818-7,“Information technology–Part 7:Advanced Audio Coding(AAC),”2006.]。第二,FDP方法包括受限总体预测增益。更精确地,因为可预测谐波、音调频谱部分之间的噪声分量也受到预测,预测的效率被限制,并由于这些噪声部分通常是不可预测的而引入误差。
此高复杂度归因于预测器的后向自适应性。此代表针对每个仓的预测系数必须基于先前传送的仓(bin)而计算。因此,编码器与解码器之间的数值不准确可导致归因于发散预测系数的重建误差。为了克服此问题,必须保证比特完全相同适应。此外,即使预测器的群组在某些帧中被停用,为了保持预测系数是最新的,必须一直执行适应。
发明内容
因此,本发明的目的在于提供用于编码音频信号和/或解码经编码的音频信号的概念,其避免前述问题中的至少一个(例如,两者)并导致更有效且运算上低廉的实施。
通过独立权利要求实现此目的。
由从属权利要求提出有益的实施。
实施例提供一种用于编码音频信号的编码器。编码器用于在变换域或滤波器组域中编码音频信号,其中编码器用于为当前帧和至少一个先前帧确定音频信号的频谱系数,其中编码器用于将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组,其中编码器用于确定间距值,其中编码器用于基于可作为旁侧信息连同经编码的音频信号被传送的间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
其他实施例提供一种用于对经编码的音频信号(例如,由上述的编码器编码的)进行解码的解码器。解码器用于在变换域或滤波器组域中对经编码的音频信号进行解码,其中解码器用于解析经编码的音频信号以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数,并且其中解码器用于将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中解码器可用于基于经传送的间距值对应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组进行选择。
根据本发明的概念,预测编码(仅)应用于所选频谱系数。可依据信号特性对应用预测编码的频谱系数进行选择。举例而言,通过不将预测编码应用于噪声信号分量,避免了前述由对不可预测的噪声信号分量进行预测所引入的误差。同时,运算复杂度可因为仅将预测编码应用于所选频谱分量而被减少。
举例而言,可利用导引/自适应性频谱域帧间预测方法借助于变换编码(例如,由编码器)执行音调音频信号的感知编码。通过将预测仅应用于(例如)位于基本频率或音高的整数倍(其可在适合的比特流中从编码器被信号发送至解码器(例如)作为间距值)处的谐波信号分量周围的频谱系数,可增加频域预测(FDP)的效率且可降低运算复杂度。本发明的实施例可优选地被实施或整合进MPEG-H 3D音频编解码器中,但也可应用于诸如,例如MPEG-2AAC的任何音频变换编码系统。
其他实施例提供一种用于在变换域或滤波器组域中编码音频信号的方法,该方法包括:
-为当前帧和至少一个先前帧确定音频信号的频谱系数;
-确定间距值;以及
-将预测编码选择性地应用于多个个别频谱系数或频谱系数的群组,其中基于间距值对应用预测编码的多个个别频谱系数或频谱系数的群组进行选择。
其他实施例提供一种用于在变换域或滤波器组域中对经编码的音频信号进行解码的方法,该方法包括:
-对经编码的音频信号进行解析以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数;
-获得间距值;以及
-将预测解码选择性地应用于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组是基于间距值而被选择的。
附图说明
在此,参照附图描述本发明的实施例,其中:
图1展示根据实施例的用于编码音频信号的编码器的示意性框图;
图2在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的应用预测编码的所选频谱系数;
图3在图中展示根据实施例的针对当前帧关于频率绘制的音频信号的幅度和对应的根据MPEG-2AAC受到预测的频谱系数;
图4展示根据实施例的用于对经编码的音频信号进行解码的解码器的示意性框图;
图5展示根据实施例的用于编码音频信号的方法的流程图;
图6展示根据实施例的用于对经编码的音频信号进行解码的方法的流程图。
具体实施方式
在下面的描述中,相等或等效的元件或是具有相等或等效功能的元件被标记有相等或等效的附图标记。
在下面的描述中,阐述多个细节以提供本发明的实施例的更详尽的解释。然而,对本领域技术人员显而易见的是,可在没有这些特定的细节的情况下实践本发明的实施例。在其他示例中,为了避免模糊本发明的实施例,公知的结构和设备是以框图形式而非详细地示出。此外,除非另外有特别注明,之后描述的不同的实施例的特征可互相组合。
图1展示根据实施例的用于编码音频信号102的编码器100的示意性框图。编码器100用于在变换域或滤波器组域104(例如,频域或频谱域)中编码音频信号102,其中编码器100用于为当前帧108_t0确定音频信号102的频谱系数106_t0_f1至106_t0_f6以及为至少一个先前帧108_t-1确定音频信号的频谱系数106_t-1_f1至106_t-1_f6。另外,编码器100用于将预测编码选择性地应用于多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组,其中编码器100用于确定间距值,其中编码器100用于基于间距值选择应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
换句话说,编码器100用于将预测编码选择性地应用于基于作为旁侧信息被传送的间距值所选择的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
间距值可对应于频率(例如,(音频信号102的)谐波音调的基本频率),该频率与其整数倍一起定义了应用预测的所有频谱系数的群组的中心:第一群组可以以此频率为中心、第二群组可以以此频率的两倍为中心、第三群组可以以此频率的三倍为中心,以此类推。对这些中心频率的了解能够实现用来预测对应的正弦信号分量(例如,谐波信号的基音与泛音)的预测系数的计算。因此,不再需要复杂且易出错的预测系数的后向自适应。
在实施例中,编码器100可用于每帧地确定一个间距值。
在实施例中,多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组可被至少一个频谱系数106_t0_f3分隔。
在实施例中,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数,如应用于由至少一个频谱系数分隔的两个个别频谱系数。另外,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的频谱系数的多个群组(每个群组包括至少两个频谱系数),如应用于由至少一个频谱系数分隔的两组频谱系数。另外,编码器100可用于将预测编码应用于由至少一个频谱系数分隔的多个个别频谱系数和/或频谱系数的群组,如应用于由至少一个频谱系数分隔的至少一个个别频谱系数和至少一组频谱系数。
在图1展示的示例中,编码器100用于为当前帧108_t0确定六个频谱系数106_t0_f1至106_t0_f6以及为先前帧108_t-1确定六个频谱系数106_t-1_f1至106_t-1_f6。由此,编码器100用于将预测编码选择性地应用于当前帧的个别第二频谱系数106_t0_f2以及应用于由当前帧108_t0的第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组。正如可见到的,个别第二频谱系数106_t0_f2及由第四和第五频谱系数106_t0_f4和106_t0_f5组成的频谱系数的群组由第三频谱系数106_t0_f3彼此分隔。
应注意的是,此处使用的术语“选择性”是指将预测编码(仅)应用于所选频谱系数。换句话说,预测编码不必应用于所有频谱系数,而是仅应用于所选择的个别频谱系数或频谱系数的群组,所选择的个别频谱系数和/或频谱系数的群组可由至少一个频谱系数互相分隔。换句话说,对于对所选择的多个个别频谱系数或频谱系数的群组进行分隔的至少一个频谱系数,可停用预测编码。
在实施例中,编码器100可用于基于先前帧108_t-1的至少多个对应的个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组将预测编码选择性地应用于当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组。
举例而言,编码器100可用于通过对当前帧108_t0的多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)之间的预测误差进行编码,对当前帧108_t0的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行预测编码。
在图1中,编码器100通过对当前帧108_t0的经预测的个别频谱系数110_t0_f2与当前帧108_t0的个别频谱系数106_t0_f2之间的预测误差以及当前帧的经预测的频谱系数110_t0_f4和110_t0_f5的群组与当前帧的频谱系数106_t0_f4和106_t0_f5的群组之间的预测误差进行编码,对个别频谱系数106_t0_f2及由频谱系数106_t0_f4与106_t0_f5组成的频谱系数的群组进行编码。
换句话说,第二频谱系数106_t0_f2是通过对经预测的第二频谱系数110_t0_f2与(实际的或确定的)第二频谱系数106_t0_f2之间的预测误差(或差异)进行编码而被编码的,其中第四频谱系数106_t0_f4是通过对经预测的第四频谱系数110_t0_f4与(实际的或确定的)第四频谱系数106_t0_f4之间的预测误差(或差异)进行编码而被编码的,且其中第五频谱系数106_t0_f5是通过对经预测的第五频谱系数110_t0_f5与(实际的或确定的)第五频谱系数106_t0_f5之间的预测误差(或差异)进行编码而被编码的。
在实施例中,编码器100可用于借助于先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应实际版本,为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
换句话说,在上述的确定过程中,编码器100可直接地使用先前帧108_t-1的多个实际个别频谱系数106_t-1_f2或实际频谱系数106_t-1_f4和106_t-1_f5的群组(其中106_t-1_f2、106_t-1_f4和106_t-1_f5分别代表原始的、尚未被量化的频谱系数或频谱系数的群组),因为它们被编码器100获得以使得所述编码器可在变换域或滤波器组域104中进行操作。
举例来说,编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的尚未被量化的版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的尚未被量化的版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4,以及基于先前帧的第五频谱系数106_t-1_f5的对应的尚未被量化的版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
通过此方法,预测编码和解码方案可呈现一种量化噪声的谐波成形,因为对应的解码器(关于图4在下文中描述其实施例)在上述确定步骤中仅可以运用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的多个群组的经传输的量化版本来用于预测解码。
虽然此谐波噪声成形,因为其是例如传统上在时域中由长期预测(LTP)所执行的而可主观地对预测编码有利,而在某些情况下其可能是不被期望的因为会导致不想要的、过量的音调被引入经解码的音频信号。由于此原因,下文描述与对应的解码完全同步、并同样地仅利用任何可能的预测增益但却不会导致量化噪声成形的替代预测编码方案。根据此替代编码实施例,编码器100可用于使用先前帧108_t-1的多个个别频谱系数106_t-1_f2或频谱系数106_t-1_f4和106_t-1_f5的群组的对应的量化版本,为当前帧108_t0确定多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
举例而言,编码器100可用于基于先前帧108_t-1的第二频谱系数106_t-1_f2的对应的量化版本确定当前帧108_t0的第二经预测的频谱系数110_t0_f2、基于先前帧108_t-1的第四频谱系数106_t-1_f4的对应的量化版本确定当前帧108_t0的经预测的第四频谱系数110_t0_f4,及基于先前帧108_t-1的第五频谱系数106_t-1_f5的对应的量化版本确定当前帧108_t0的经预测的第五频谱系数110_t0_f5。
另外,编码器100可用于从间距值得出预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5,并使用至少两个先前帧108_t-1和108_t-2的多个个别频谱系数106_t-1_f2和106_t-2_f2或频谱系数106_t-1_f4、106_t-2_f4、106_t-1_f5和106_t-2_f5的群组的对应的量化版本及使用得出的预测系数112_f2、114_f2、112_f4、114_f4、112_f5及114_f5,为当前帧108_t0计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组。
举例而言,编码器100可用于:为第二频谱系数106_t0_f2从间距值得出预测系数112_f2和114_f2、为第四频谱系数106_t0_f4从间距值得出预测系数112_f4和114_f4,以及为第五频谱系数106_t0_f5从间距值得出预测系数112_f5和114_f5。
举例而言,预测系数的得出可以以下述方式得出:若间距值或其经编码的版本对应于频率f0,则启用预测的第K组频谱系数的中心频率为fc=K*f0。若取样频率为fs且变换跃程大小(在连续帧间的移位)为N,则假设具有频率fc的正弦信号的理想预测器系数在第K组中为:
p1=2*cos(N*2*pi*fc/fs)且p2=-1。
若,例如,频谱系数106_t0_f4和106_t0_f5在此群组内,则预测系数为:
112_f4=112_f5=2*cos(N*2*pi*fc/fs)且114_f4=114_f5=-1
出于稳定性原因,可引入阻尼因数d以导致修改的预测系数:
112_f4’=112_f5’=d*2*cos(N*2*pi*fc/fs),114_f4’=114_f5’=d2。
由于间距值是在经编码的音频信号120中传输,解码器可得出完全相同的预测系数212_f4=212_f5=2*cos(N*2*pi*fc/fs)且114_f4=114_f5=-1。若使用阻尼因数,则系数可被相应地修改。
如同图1中所表示,编码器100可用于提供经编码的音频信号120。由此,编码器100可被配置为对于应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组将预测误差的量化版本包括于经编码的音频信号120中。另外,编码器100可被配置为不将预测系数112_f2至114_f5包括于经编码的音频信号120中。
因此,编码器100可仅使用预测系数112_f2至114_f5以计算多个经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组以及来自于其的当前帧的经预测的个别频谱系数110_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组与个别频谱系数106_t0_f2或经预测的频谱系数110_t0_f4和110_t0_f5的群组之间的预测误差,但在经编码的音频信号120中将不会提供个别频谱系数106_t0_f4(或其量化版本)或频谱系数106_t0_f4和106_t0_f5的群组(或其量化版本)也不会提供预测系数112_f2至114_f5。因此,解码器(之后关于图4描述其实施例)可以从间距值得出用于为当前帧计算多个经预测的个别频谱系数或经预测的频谱系数的群组的预测系数112_f2至114_f5。
换句话说,编码器100可被配置为,为应用预测编码的多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组提供包括预测误差的量化版本而不是多个个别频谱系数106_t0_f2的或频谱系数106_t0_f4和106_t0_f5的群组的量化版本的经编码的音频信号120。
另外,编码器100可用于提供包括对多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本的经编码的音频信号120,使得存在频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组(对于其,预测误差的量化版本包括在经编码的音频信号120中)与频谱系数106_t0_f3或频谱系数的群组(对于其,不使用预测编码而提供量化版本)的交替。
在实施例中,编码器100还可用于对预测误差的量化版本以及将多个个别频谱系数106_t0_f2或频谱系数106_t0_f4和106_t0_f5的群组进行分隔的频谱系数106_t0_f3的量化版本进行熵编码,以及将经熵编码的版本(而不是其未经熵编码的版本)包括于经编码的音频信号120中。
图2在图中展示针对当前帧108_t0关于频率绘制的音频信号102的幅度。另外,在图2中,表示了由编码器100为音频信号102的当前帧108_t0确定的变换域或滤波器组域中的频谱系数。
如图2中所示,编码器100可用于将预测编码选择性地应用于由至少一个频谱系数所分隔的频谱系数的多个群组116_1至116_6。详细地说,在图2所示的实施例中,编码器100将预测编码选择性地应用于频谱系数的六个群组116_1至116_6,其中频谱系数的前五个群组116_1至116_5的每个包括三个频谱系数(例如,第二群组116_2包括频谱系数106_t0_f8、106_t0_f9及106_t0_f10),其中频谱系数的第六个群组116_6包括两个频谱系数。因此,频谱系数的此六个群组116_1至116_6是由不应用预测编码的频谱系数的(五个)群组118_1至118_5所分隔。
换句话说,如图2中所表示,编码器100可用于将预测编码选择性地应用于频谱系数的群组116_1至116_6,使得存在应用预测编码的频谱系数的群组116_1至116_6与不应用预测编码的频谱系数的群组118_1至118_5的交替。
在实施例中,编码器100可用于确定间距值(由箭头122_1和122_2表示于图2中),其中编码器100可用于基于间距值选择应用预测编码的频谱系数的多个群组116_1至116_6(或多个个别频谱系数)。
该间距值可为,例如,音频信号102的两个特征频率如音频信号的尖峰124_1及124_2之间的间距(或距离)。另外,该间距值可为近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地,间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号(integer number of)的实值或分数或倍数。
在实施例中,编码器100可用于确定音频信号(102)的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
举例而言,音频信号102的第一尖峰124_1可以是音频信号102的瞬时基本频率(或音高、或第一谐波)。因此,编码器100可用于确定音频信号102的瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。在此情况下,间距值可以是近似于音频信号102的瞬时基本频率124_1与第二谐波124_2之间的间距的频谱系数的整数编号(或其分数或倍数)。
自然地,音频信号102可包括两个以上的谐波。例如,展示于图2中的音频信号102包括频谱上分布的六个谐波124_1至124_6使得音频信号102在每个整数倍的瞬时基频上包括谐波。自然地,音频信号102还可能不包括所有但只包括一些谐波,如第一、第三和第五谐波。
在实施例中,编码器100可用于选择根据由间距值定义的谐波栅(harmonic grid)而频谱布置的频谱系数的群组116_1至116_6(或个别频谱系数)以用于预测编码。由此,由间距值定义的谐波栅描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说,由间距值定义的谐波栅可以是描述音频信号的谐波的等距间距的间距值的序列。
另外,编码器100可用于选择频谱系数(例如,仅那些频谱系数),其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如,预先确定或可变的)内,以用于预测编码。
代表音频信号102的谐波的频谱系数的索引(或编号)可从间距值得出。例如,假设第四频谱系数106_t0_f4代表音频信号102的瞬时基本频率且假设间距值为五,则基于间距值可得出具有索引九的频谱系数。如可在图2中见到的,所得出的具有索引九的频谱系数(即,第九个频谱系数106_t0_f9)代表第二个谐波。同样地,具有索引14、19、24及29的频谱系数可得出,代表第三至第六个谐波124_3至124_6。然而,不仅具有与基于间距值得出的多个频谱索引相等的索引的频谱系数可被预测编码,具有在基于间距值得出的多个频谱索引周围的给定范围内的索引的频谱系数也可被预测编码。举例来说,如图2中所示,该范围可为三,以使得不是多个个别频谱系数而是频谱系数的多个群组被选择用于预测编码。
另外,编码器100可用于选择应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)使得在应用预测编码的频谱系数的群组116_1至116_6(或多个个别频谱系数)与分隔应用预测编码的频谱系数的群组(或多个个别频谱系数)的频谱系数之间存在周期性交替,其以+/-1频谱系数的容差为周期。当音频信号102的两个谐波之间的距离不等于整数间距值(关于频谱系数的索引或编号的整数)而是其分数或倍数时,可能需要+/-1频谱系数的容差。此也可于图2中所见,因为箭头122_1至122_6并不总是完全指向对应频谱系数的中心或中间。
换句话说,音频信号102可包括至少两个谐波信号分量124_1至124_6,其中编码器100可用于将预测编码选择性地应用于代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6周围的频谱环境的频谱系数的多个群组116_1至116_6(或个别频谱系数)。至少两个谐波信号分量124_1至124_6周围的频谱环境可为,例如,+/-1、2、3、4或5个频谱分量。
由此,编码器100可用于不将预测编码应用于不代表音频信号102的至少两个谐波信号分量124_1至124_6或至少两个谐波信号分量124_1至124_6的频谱环境的频谱系数的那些群组118_1至118_5(或多个个别频谱系数)。换句话说,编码器100可用于不将预测编码应用于属于信号谐波124_1至124_6之间的非音调背景噪声的频谱系数的多个群组118_1至118_5(或个别频谱系数)。
另外,编码器100可用于确定指示音频信号102的至少两个谐波信号分量124_1至124_6之间的频谱间距的谐波间距值,该谐波间距值指示代表音频信号102的至少两个谐波信号分量124_1至124_6的多个个别频谱系数或频谱系数的多个群组。
此外,编码器100可用于提供经编码的音频信号120使得经编码的音频信号120包括间距值(例如,每帧一个间距值)或(可选地)可直接得出间距值的参数。
本发明实施例通过将谐波间距值引入FDP过程解决了前述FDP方法的两个问题,该谐波间距值从编码器(发射器)100被信号发送至各个解码器(接收器)使得二者可以以完全同步的方式操作。所述谐波间距值可作为与待编码的帧相关联的一个或多个频谱的瞬时基本频率(或音高)的指示器,并识别哪些频谱仓(频谱系数)应被预测。更明确地,只有位于(关于其索引)基本音高的整数倍(如由谐波间距值定义)处的谐波信号分量周围的那些频谱系数应受到预测。图2和3借助于简单示例示出此音高自适应性预测方法,其中图3展示MPEG-2AAC中的当前技术水平的预测器的操作,其不只在谐波栅周围预测,还使低于一定停止频率的每个频谱仓受到预测,且其中图2绘示具有根据实施例的修改被整合以仅在最接近谐波间距栅的那些“音调”仓上执行预测的相同的预测器。
比较图2与图3揭示根据实施例的修改的两个优点,即:(1)非常少的频谱仓被包括于预测过程中,减少了复杂度(在所给的例子中由于仅预测五分之三的仓而减少大约40%),以及(2)属于谐波信号之间的非音调背景噪声的仓不受预测影响,其应该会增加预测的效率。
应注意的是,谐波间距值不一定需要对应于输入信号的实际瞬时音高,其也可代表真实音高的分数或倍数,只要可对预测过程的效率产生整体改进。此外,必须强调的是,谐波间距值不一定要反映仓索引或带宽单位的整数倍,而可包括所述单位的分数。
随后将描述MPEG式音频编码器的优选实施。
音高自适应性预测被优选地整合至MPEG-2AAC中[ISO/IEC 13818-7,“Information technology–Part 7:Advanced Audio Coding(AAC),”2006.]或,利用如在AAC中的相似预测器而被整合至MPEG-H 3D音频编解码器中[ISO/IEC 23008-3,“Information technology–High efficiency coding,part 3:3D audio(信息技术-高效率编码,第三部分:3D音频)”2015.]。特别地,针对非独立编码的每个帧和通道,一比特旗标可被写入至、且读取自各个比特流(对于独立帧通道,因为可停用预测以确保独立性,旗标可不被传输)。若将旗标设置为一,则其他8比特可被写入和读取。此8比特代表用于给定帧和通道的谐波间距值的量化版本(例如索引)。采用使用线性或非线性映射函数而从量化版本得出的谐波间距值,可以以根据图2所示的实施例的方式实现预测过程。优选地,只有位于谐波栅周围的1.5仓的最大距离内的仓受到预测。例如,若谐波距离值指示在仓索引47.11处的谐波线,则只有在索引46、47及48的仓会受到预测。然而,所述最大距离可被不同地指定,对于所有通道和帧为固定先验的或基于谐波间距值分别用于每个帧及通道。
图4展示用于对经编码的信号120进行解码的解码器200的示意性框图。解码器200用于在变换域或滤波器组域204中对经编码的音频信号120进行解码,其中解码器200用于对经编码的音频信号120进行解析以为当前帧208_t0获得音频信号的经编码的频谱系数206_t0_f1至206_t0_f6以及为至少一个先前帧208_t-1获得经编码的频谱系数206_t-1_f0至206_t-1_f6,及其中解码器200用于将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组。
在实施例中,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数,如应用于由至少一个经编码的频谱系数分隔的两个个别经编码的频谱系数。另外,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的多个群组(每个群组包括至少两个经编码的频谱系数),诸如应用于由至少一个经编码的频谱系数分隔的经编码的频谱系数的两个群组。另外,解码器200可用于将预测解码应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数和/或经编码的频谱系数的群组,诸如应用于由至少一个经编码的频谱系数分隔的至少一个个别经编码的频谱系数及经编码的频谱系数的至少一个群组。
在图4展示的示例中,解码器200可用于为当前帧208_t0确定六个经编码的频谱系数206_t0_f1至206_t0_f6以及为先前帧208_t-1确定六个经编码的频谱系数206_t-1_f1至206_t-1_f6。由此,解码器200用于将预测解码选择性地应用于当前帧的个别第二经编码的频谱系数206_t0_f2以及应用于由当前帧208_t0的第四及第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组。如可见,个别第二经编码的频谱系数206_t0_f2及由第四和第五经编码的频谱系数206_t0_f4与206_t0_f5组成的经编码的频谱系数的群组是通过第三经编码的频谱系数206_t0_f3而彼此分隔的。
应注意的是,此处使用的术语“选择性”是指将预测解码(仅)应用于所选择的经编码的频谱系数。换句话说,预测解码不必要应用于所有经编码的频谱系数,而是仅应用于所选择的个别经编码的频谱系数或经编码的频谱系数的群组,所选择的个别经编码的频谱系数和/或经编码的频谱系数的群组通过至少一个经编码的频谱系数而互相分隔。换句话说,预测解码不应用于分隔所选择的多个个别经编码的频谱系数或经编码的频谱系数的群组的至少一个经编码的频谱系数。
在实施例中,解码器200可用于不将预测解码应用于分隔个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组的至少一个经编码的频谱系数206_t0_f3。
解码器200可用于对经编码的频谱系数进行熵解码,以为待应用预测解码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5获得量化预测误差,及为将不应用预测解码的至少一个频谱系数获得量化频谱系数206_t0_f3。由此,解码器200可用于将量化预测误差应用于多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组,以为当前帧208_t0获得与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数。
举例而言,解码器200可用于为第二量化频谱系数206_t0_f2获得第二量化预测误差及将第二量化预测误差应用于经预测的第二频谱系数210_t0_f2,以获得与第二经编码的频谱系数206_t0_f2相关联的第二经解码的频谱系数,其中解码器200可用于为第四量化频谱系数206_t0_f4获得第四量化预测误差及将第四量化预测误差应用于经预测的第四频谱系数210_t0_f4,以获得与第四经编码的频谱系数206_t0_f4相关联的第四经解码的频谱系数,以及其中解码器200可用于为第五量化频谱系数206_t0_f5获得第五量化预测误差及将第五量化预测误差应用于经预测的第五频谱系数210_t0_f5,以获得与第五经编码的频谱系数206_t0_f5相关联的第五经解码的频谱系数。
另外,解码器200可用于基于先前帧208_t-1的对应的多个个别经编码的频谱系数206_t-1_f2(例如,使用与多个个别经编码的频谱系数206_t-1_f2相关联的多个先前解码的频谱系数)或经编码的频谱系数206_t-1_f4及206_t-1_f5的群组(例如,使用与经编码的频谱系数206_t-1_f4和206_t-1_f5的群组相关联的先前解码的频谱系数的群组),为当前帧208_t0确定多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4及210_t0_f5的群组。
举例而言,解码器200可用于使用与先前帧208_t-1的第二经编码的频谱系数206_t-1_f2相关联的先前解码(量化)的第二频谱系数确定当前帧208_t0的第二经预测的频谱系数210_t0_f2、使用与先前帧208_t-1的第四经编码的频谱系数206_t-1_f4相关联的先前解码(量化)的第四频谱系数确定当前帧208_t0的第四经预测的频谱系数210_t0_f4、及使用与先前帧208_t-1的第五经编码的频谱系数206_t-1_f5相关联的先前解码(量化)的第五频谱系数确定当前帧208_t0的第五经预测的频谱系数210_t0_f5。
此外,解码器200可用于从间距值得出预测系数,且其中解码器200可用于使用至少两个先前帧208_t-1及208_t-2的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组及使用得出的预测系数,为当前帧208_t0计算多个经预测的个别频谱系数210_t0_f2或经预测的频谱系数210_t0_f4和210_t0_f5的群组。
举例而言,解码器200可用于:从间距值得出用于第二经编码的频谱系数206_t0_f2的预测系数212_f2及214_f2、从间距值得出用于第四经编码的频谱系数206_t0_f4的预测系数212_f4及214_f4,以及从间距值得出用于第五经编码的频谱系数206_t0_f5的预测系数212_f5及214_f5。
应注意的是,解码器200可用于解码经编码的音频信号120从而为应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组获得量化预测误差而不是多个个别量化频谱系数或量化频谱系数的群组。
另外,解码器200可用于对经编码的音频信号120进行解码从而获得分隔多个个别频谱系数或频谱系数的群组的量化频谱系数,使得存在经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组(为其获得了量化预测误差)以及经编码的频谱系数206_t0_f3或经编码的频谱系数的群组(为其获得了量化频谱系数)的交替。
解码器200可用于使用与应用预测解码的经编码的频谱系数206_t0_f2、206_t0_f4及206_t0_f5相关联的经解码的频谱系数及使用与不应用预测解码的经编码的频谱系数206_t0_f1、206_t0_f3及206_t0_f6相关联的经熵解码的频谱系数提供经解码的音频信号220。
在实施例中,解码器200可用于获得间距值,其中解码器200可用于基于间距值选择应用预测解码的多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
如以上关于对应的编码器100的描述提及的,间距值可以是,例如,在音频信号的两个特征频率之间的间距(或距离)。另外,间距值可以是近似于音频信号的两个特征频率之间的间距的频谱系数的整数编号(或频谱系数的索引)。自然地,间距值还可以是描述音频信号的两个特征频率之间的间距的频谱系数的整数编号的分数或倍数。
解码器200可用于选择根据由间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组以用于预测解码。由间距值定义的谐波栅可描述音频信号102中的谐波的周期性频谱分布(等距间距)。换句话说,由间距值定义的谐波栅可以是描述音频信号102的谐波的等距间距的间距值的序列。
另外,解码器200可用于选择频谱系数(例如,仅那些频谱系数),其频谱索引与基于间距值得出的多个频谱索引相等或位于基于间距值得出的多个频谱索引周围的范围(例如,预先确定或可变的范围)内,以用于预测解码。由此,解码器200可用于依据间距值而设定该范围的宽度。
在实施例中,经编码的音频信号可包括间距值或其经编码的版本(例如,可从其直接得出间距值的参数),其中解码器200可用于从经编码的音频信号提取间距值或其经编码的版本以获得间距值。
可选地,解码器200可用于由其自身确定间距值,即,经编码的音频信号不包括间距值。在此情况下,解码器200可用于确定(代表音频信号102的经编码的音频信号120的)瞬时基本频率并从瞬时基本频率或其分数或倍数得出间距值。
在实施例中,解码器200可用于选择应用预测解码的多个个别频谱系数或频谱系数的群组使得在应用预测解码的多个个别频谱系数或频谱系数的群组与分隔应用预测解码的多个个别频谱系数或频谱系数的群组的频谱系数之间存在周期性交替,其以+/-1频谱系数的容差为周期。
在实施例中,由经编码的音频信号120代表的音频信号102包括至少两个谐波信号分量,其中解码器200用于将预测解码选择性地应用于代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量周围的频谱环境的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。至少两个谐波信号分量周围的频谱环境可为,例如,+/-1、2、3、4或5个频谱分量。
由此,解码器200可用于识别至少两个谐波信号分量,并将预测解码选择性地应用于与(例如,代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
可选地,经编码的音频信号120可包括识别至少两个谐波信号分量的信息(例如,间距值)。在此情况下,解码器200可用于将预测解码选择性地应用于与(例如,代表经识别的谐波信号分量或环绕经识别的谐波信号分量的)经识别的谐波信号分量相关联的那些多个个别经编码的频谱系数206_t0_f2或经编码的频谱系数206_t0_f4及206_t0_f5的群组。
在前述提及的替代方案中,解码器200可用于不将预测解码应用于不代表音频信号102的至少两个谐波信号分量或至少两个谐波信号分量的频谱环境的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1及206_t0_f6或经编码的频谱系数的群组。
换句话说,解码器200可用于不将预测解码应用于属于音频信号102的信号谐波之间的非音调背景噪声的那些多个个别经编码的频谱系数206_t0_f3、206_t0_f1、206_t0_f6或经编码的频谱系数的群组。
图5展示根据实施例的用于编码音频信号的方法300的流程图。方法300包括:为当前帧或至少一个先前帧确定音频信号的频谱系数的步骤302,以及将预测编码选择性地应用于由至少一个频谱系数分隔的多个个别频谱系数或频谱系数的群组的步骤304。
图6展示根据实施例的用于对经编码的音频信号进行解码的方法400的流程图。方法400包括:对经编码的音频信号进行解析以为当前帧及至少一个先前帧获得音频信号的经编码的频谱系数的步骤402,以及将预测解码选择性地应用于由至少一个经编码的频谱系数分隔的多个个别经编码的频谱系数或经编码的频谱系数的群组的步骤404。
虽然已在装置的上下文中描述一些方面,显然,这些方面还代表对应方法的描述,其中区块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也代表对应装置的对应区块或条目或特征的叙述。可由(或使用)硬件装置(例如,微处理器、可编程计算机或电子电路)执行方法步骤的一些或全部。在一些实施例中,可由此类装置执行一个或多个最重要的方法步骤。
本发明的经编码的音频信号可储存于数字储存媒介上或可在如无线传输媒介的传输媒介或如因特网的有线传输媒介上被传输。
依据某些实施需求,可以以硬件或软件方式实施本发明的实施例。可使用具有储存于其上的电子可读控制信号的数字储存媒介(例如,软式磁盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)执行此实施,其与可编程计算机系统协作(或能够协作)以执行各自的方法。因此,数字储存媒介可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,其能够与可编程计算机系统协作,以执行本文所描述的方法的一个。
一般地,本发明的实施例可被实施为带有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可被操作为执行方法的一个。程序代码可例如储存于机器可读载体上。
其他实施例包括用于执行本文所描述的方法的一个的计算机程序,其储存于机器可读载体上。
换句话说,所发明方法的实施例因此是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,用于执行本文描述的方法的一个。
本发明方法的其他实施例因此是数据载体(或数字储存媒介或计算机可读媒介),其包括,记录于其上的用于执行本文所描述的方法的一个的计算机程序。数据载体、数字储存媒介或计算机可读媒介通常是有形和/或非瞬时的。
本发明方法的其他实施例因此是代表用于执行本文所描述的方法的一个的计算机程序的数据串流或信号序列。数据串流或信号序列可例如用于经由数据通讯连接(例如,经由因特网)而传输。
其他实施例包括运算构件,例如计算机、或可编程逻辑设备,用于或适用于执行本文所描述的方法的一个。
其他实施例包括用于执行本文所描述的方法的一个的计算机,该计算机具有安装于其上的计算机程序。
根据本发明的其他实施例包括用于将用于执行本文所描述的方法的一个的计算机程序传送(例如,电子或光学地)至接收器的装置或系统。该接收器,例如,可以是计算机、行动设备、内存设备或类似装置。该装置或系统可,例如,包括用于将计算机程序传送至接收器的文件服务器。
在一些实施例中,可编程逻辑设备(例如现场可编程门阵列)可用来执行本文所描述的方法的一些或所有功能。在一些实施例中,现场可编程门阵列可与微处理器协作从而执行本文所描述的方法的一个。一般地,优选地由任何硬件装置执行此方法。
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来实施本文所描述的装置。
可使用硬件装置、或使用计算机、或使用硬件装置及计算机的组合来执行本文所描述的方法。
以上描述的实施例仅用于说明本发明的原理。应理解的是,本文所描述的布置及细节的修改和变形对本领域技术人员是显而易见的。因此,此意图为仅由所附权利要求的范围而不是由本文的实施例的说明和描述的方式所呈现的具体细节限制。
Claims (50)
1.一种用于编码音频信号(102)的编码器(100),其中所述编码器(100)用于在变换域或滤波器组域(104)中编码所述音频信号(102),其中所述编码器用于为当前帧(108_t0)和至少一个先前帧(108_t-1)确定所述音频信号(102)的频谱系数(106_t0_f1:106_t0_f6;106_t-1_f1:106_t-1_f6),其中所述编码器(100)用于将预测编码选择性地应用于多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组,其中所述编码器(100)用于确定间距值,其中所述编码器(100)用于基于所述间距值选择应用预测编码的所述多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组。
2.根据权利要求1所述的编码器(100),其中所述间距值是描述谐波之间的间距的谐波间距值。
3.根据权利要求1和2中任一项所述的编码器(100),其中所述多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组由至少一个频谱系数(106_t0_f3)分隔。
4.根据权利要求3所述的编码器(100),其中预测编码不被应用于对所述个别频谱系数(106_t0_f2)或所述频谱系数(106_t0_f4,106_t0_f5)的群组进行分隔的所述至少一个频谱系数(106_t0_f3)。
5.根据权利要求1至4中任一项所述的编码器(100),其中所述编码器(100)用于通过对所述当前帧的多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组与所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组之间的预测误差进行编码,对所述当前帧(108_t0)的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组进行预测编码。
6.根据权利要求5所述的编码器(100),其中所述编码器(100)用于从所述间距值得出预测系数,且其中所述编码器(100)用于使用至少两个先前帧(108_t-2,108_t-1)的对应的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或对应的频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组。
7.根据权利要求5所述的编码器(100),其中所述编码器(100)用于使用先前帧(108_t-1)的多个个别频谱系数(106_t-1_f2)或频谱系数(106_t-1_f4,106_t-1_f5)的群组的对应的量化版本,为所述当前帧(108_t0)确定所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f4)的群组。
8.根据权利要求7所述的编码器(100),其中所述编码器(100)用于从所述间距值得出预测系数,且其中所述编码器(100)用于使用至少两个先前帧(108_t-2,108_t-1)的多个个别频谱系数(106_t-2_f2,106_t-1_f2)或频谱系数(106_t-2_f4,106_t-1_f4;106_t-2_f5,106_t-1_f5)的群组的对应的量化版本以及使用得出的预测系数,为所述当前帧(108_t0)计算所述多个经预测的个别频谱系数(110_t0_f2)或经预测的频谱系数(110_t0_f4,110_t0_f5)的群组。
9.根据权利要求6或8中任一项所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),所述经编码的音频信号(120)不包括预测系数或所述预测系数的经编码的版本。
10.根据权利要求5至9中任一项所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),所述经编码的音频信号(120)对于应用预测编码的多个个别频谱系数或频谱系数的群组包括预测误差的量化版本而不是所述多个个别频谱系数(106_t0_f2)或所述频谱系数(106_t0_f4,106_t0_f5)的群组的量化版本。
11.根据权利要求10所述的编码器(100),其中所述经编码的音频信号(120)包括不应用预测编码的频谱系数(106_t0_f3)的量化版本,使得存在其预测误差的量化版本被包括在所述经编码的音频信号(120)中的频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组与不使用预测编码而为其提供了量化版本的频谱系数(106_t0_f1,106_t0_f3,106_t0_f6)或频谱系数的群组的交替。
12.根据权利要求1至11中任一项所述的编码器(100),其中所述编码器(100)用于确定所述音频信号(102)的瞬时基本频率并从所述瞬时基本频率或所述瞬时基本频率的分数或倍数得出所述间距值。
13.根据权利要求1至12中任一项所述的编码器(100),其中所述编码器(100)用于选择用于预测编码的根据由所述间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组(116_1:116_6)。
14.根据权利要求1至13中任一项所述的编码器(100),其中所述编码器(100)用于选择用于预测编码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
15.根据权利要求14所述的编码器(100),其中所述编码器(100)用于依据所述间距值设定所述范围的宽度。
16.根据权利要求1至15中任一项所述的编码器(100),其中所述编码器(100)用于选择应用预测编码的多个个别频谱系数或频谱系数的群组(116_1:116_6),以使得在应用预测编码的多个个别频谱系数或频谱系数的群组(116_1:116_6)与不应用预测编码的频谱系数或频谱系数的群组(118_1:118_5)之间存在以+/-1频谱系数的容差为周期的周期性交替。
17.根据权利要求1至16中任一项所述的编码器(100),其中所述音频信号(102)包括至少两个谐波信号分量(124_1:124_6),其中所述编码器(100)用于将预测编码选择性地应用于代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)周围的频谱环境的多个个别频谱系数或频谱系数的群组(116_1:116_6)。
18.根据权利要求17所述的编码器(100),其中所述编码器(100)用于不将预测编码应用于不代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)的频谱环境的多个个别频谱系数或频谱系数的群组(118_1:118_5)。
19.根据权利要求17或18所述的编码器(100),其中所述编码器(100)用于不将预测编码应用于属于信号谐波(124_1:124_6)之间的非音调背景噪声的多个个别频谱系数或频谱系数的群组(118_1:118_5)。
20.根据权利要求17至19中任一项所述的编码器(100),其中所述间距值是指示所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)之间的频谱间距的谐波间距值,所述谐波间距值指示代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)的多个个别频谱系数或频谱系数的群组(116_1:116_6)。
21.根据权利要求1至20中任一项所述的编码器(100),其中所述编码器(100)用于提供经编码的音频信号(120),其中所述编码器(100)用于将所述间距值或所述间距值的经编码的版本包括于所述经编码的音频信号(120)中。
22.根据权利要求1至21中任一项所述的编码器(100),其中所述频谱系数是频谱仓。
23.一种用于对经编码的音频信号(120)进行解码的解码器(200),其中所述解码器(200)用于在变换域或滤波器组域(204)中对所述经编码的音频信号(120)进行解码,其中所述解码器(200)用于对所述经编码的音频信号(120)进行解析以为当前帧(208_t0)和至少一个先前帧(208_t-1)获得所述音频信号(120)的经编码的频谱系数(206_t0_f1:206_t0_f6;206_t-1_f1:206_t-1_f6),以及其中所述解码器(200)用于将预测解码选择性地应用于多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组,其中所述解码器(200)用于获得间距值,其中所述解码器(200)用于基于所述间距值选择应用预测解码的所述多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组。
24.根据权利要求23所述的解码器(200),其中所述间距值是描述谐波之间的间距的谐波间距值。
25.根据权利要求24所述的解码器(200),其中所述多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组由至少一个经编码的频谱系数(206_t0_f3)分隔。
26.根据权利要求25所述的解码器(200),其中预测解码不被应用于分隔所述个别频谱系数(206_t0_f2)或所述频谱系数(206_t0_f4,206_t0_f5)的群组的至少一个频谱系数(206_t0_f3)。
27.根据权利要求24至26中任一项所述的解码器(200),其中所述解码器(200)用于对经编码的频谱系数进行熵解码,以为待应用预测解码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)获得量化预测误差,以及为将不应用预测解码的频谱系数(206_t0_f3)获得量化频谱系数;以及
其中所述解码器(200)用于将所述量化预测误差应用于多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组,以为所述当前帧(208_t0)获得与应用预测解码的经编码的频谱系数(206_t0_f2,206_t0_f4,206_t0_f5)相关联的经解码的频谱系数。
28.根据权利要求27所述的解码器(200),其中所述解码器(200)用于基于先前帧(208_t-1)的对应的多个个别经编码的频谱系数(206_t-1_f2)或经编码的频谱系数(206_t-1_f4,206_t-1_f5)的群组,为所述当前帧(208_t0)确定所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组。
29.根据权利要求28所述的解码器(200),其中所述解码器(200)用于从所述间距值得出预测系数,且其中所述解码器(200)用于使用至少两个先前帧的对应的多个先前解码的个别频谱系数或先前解码的频谱系数的群组以及使用得出的预测系数,为所述当前帧(208_t0)计算所述多个经预测的个别频谱系数(210_t0_f2)或经预测的频谱系数(210_t0_f4,210_t0_f5)的群组。
30.根据权利要求24至29中任一项所述的解码器(200),其中所述解码器(200)用于对所述经编码的音频信号(120)进行解码,从而为应用预测解码的多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组获得量化预测误差而不是多个个别量化频谱系数或量化频谱系数的群组。
31.根据权利要求30所述的解码器(200),其中所述解码器用于对所述经编码的音频信号(120)进行解码,从而为不应用预测解码的经编码的频谱系数(206_t0_f3)获得量化频谱系数,使得存在其量化预测误差被获得的经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组以及其量化频谱系数被获得的经编码的频谱系数(206_t0_f3)或经编码的频谱系数的群组的交替。
32.根据权利要求24至31中任一项所述的解码器(200),其中所述解码器(200)用于选择用于预测解码的根据由所述间距值定义的谐波栅而频谱布置的个别频谱系数(206_t0_f2)或频谱系数(206_t0_f4,206_t0_f5)的群组。
33.根据权利要求24至32中任一项所述的解码器(200),其中所述解码器(200)用于选择用于预测解码的频谱系数,所述频谱系数的频谱索引与基于所述间距值得出的多个频谱索引相等或位于基于所述间距值得出的多个频谱索引周围的范围内。
34.根据权利要求33所述的解码器(200),其中所述解码器(200)用于依据所述间距值设定所述范围的宽度。
35.根据权利要求24至34中任一项所述的解码器(200),其中所述经编码的音频信号(120)包括所述间距值或所述间距值的经编码的版本,其中所述解码器(200)用于从所述经编码的音频信号(120)提取所述间距值或所述间距值的经编码的版本以获得所述间距值。
36.根据权利要求24至34中任一项所述的解码器(200),其中所述解码器(200)用于确定所述间距值。
37.根据权利要求36所述的解码器(200),其中所述解码器(200)用于确定瞬时基本频率并从所述瞬时基本频率或所述瞬时基本频率的分数或倍数得出所述间距值。
38.根据权利要求24至37中任一项所述的解码器(200),其中所述解码器(200)用于选择应用预测解码的多个个别频谱系数(206_t0_f2)或频谱系数(206_t0_f4,206_t0_f5)的群组,以使得在应用预测解码的多个个别频谱系数(206_t0_f2)或频谱系数(206_t0_f4,206_t0_f5)的群组与不应用预测解码的频谱系数(206_t0_f3)之间存在以+/-1频谱系数的容差为周期的周期性交替。
39.根据权利要求24至38中任一项所述的解码器(200),其中由所述经编码的音频信号(120)代表的音频信号(102)包括至少两个谐波信号分量(124_1:124_6),其中所述解码器(200)用于将预测解码选择性地应用于代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)周围的频谱环境的多个个别经编码的频谱系数或经编码的频谱系数的群组。
40.根据权利要求39所述的解码器(200),其中所述解码器(200)用于识别所述至少两个谐波信号分量(124_1:124_6),并将预测解码选择性地应用于与经识别的谐波信号分量(124_1:124_6)相关联的多个个别经编码的频谱系数或经编码的频谱系数的群组。
41.根据权利要求39所述的解码器(200),其中所述经编码的音频信号(120)包括所述间距值或所述间距值的经编码的版本,其中所述间距值识别所述至少两个谐波信号分量(124_1:124_6),其中所述解码器(200)用于将预测解码选择性地应用于与经识别的谐波信号分量(124_1:124_6)相关联的多个个别经编码的频谱系数或经编码的频谱系数的群组。
42.根据权利要求39至41中任一项所述的解码器(200),其中所述解码器(200)用于不将预测解码应用于不代表所述音频信号的至少两个谐波信号分量(124_1:124_6)或所述至少两个谐波信号分量(124_1:124_6)的频谱环境的多个个别经编码的频谱系数或经编码的频谱系数的群组。
43.根据权利要求39至42中任一项所述的解码器(200),其中所述解码器(200)用于不将预测解码应用于属于所述音频信号的信号谐波(124_1:124_6)之间的非音调背景噪声的多个个别经编码的频谱系数或经编码的频谱系数的群组。
44.根据权利要求24至43中任一项所述的解码器(200),其中所述经编码的音频信号(120)包括所述间距值或所述间距值的经编码的版本,其中所述间距值是谐波间距值,所述谐波间距值指示代表所述音频信号(102)的至少两个谐波信号分量(124_1:124_6)的多个个别经编码的频谱系数或经编码的频谱系数的群组。
45.根据权利要求24至44中任一项所述的解码器(200),其中频谱系数是频谱仓。
46.一种用于在变换域或滤波器组域中编码音频信号的方法(300),所述方法包括:
为当前帧和至少一个先前帧确定(302)所述音频信号的频谱系数;
确定间距值;以及
将预测编码选择性地应用(304)于多个个别频谱系数或频谱系数的群组,其中应用预测编码的多个个别频谱系数或频谱系数的群组是基于所述间距值而选择的。
47.一种用于在变换域或滤波器组域中对经编码的音频信号进行解码的方法(400),所述方法包括:
对所述经编码的音频信号进行解析(402)以为当前帧和至少一个先前帧获得音频信号的经编码的频谱系数;
获得间距值;以及
将预测解码选择性地应用(404)于多个个别经编码的频谱系数或经编码的频谱系数的群组,其中应用预测解码的多个个别经编码的频谱系数或经编码的频谱系数的群组是基于所述间距值而选择的。
48.一种用于执行根据权利要求46或47所述的方法的计算机程序。
49.一种用于编码音频信号(102)的编码器(100),其中所述编码器(100)用于在变换域或滤波器组域(104)中编码所述音频信号(102),其中所述编码器用于为当前帧(108_t0)和至少一个先前帧(108_t-1)确定所述音频信号(102)的频谱系数(106_t0_f1:106_t0_f6;106_t-1_f1:106_t-1_f6),其中所述编码器(100)用于将预测编码选择性地应用于多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组,其中所述编码器(100)用于确定间距值,其中所述编码器(100)用于基于所述间距值选择应用预测编码的多个个别频谱系数(106_t0_f2)或频谱系数(106_t0_f4,106_t0_f5)的群组;
其中所述编码器(100)用于选择用于预测编码的根据由所述间距值定义的谐波栅而频谱布置的个别频谱系数或频谱系数的群组(116_1:116_6)。
50.一种用于对经编码的音频信号(120)进行解码的解码器(200),其中所述解码器(200)用于在变换域或滤波器组域(204)中对所述经编码的音频信号(120)进行解码,其中所述解码器(200)用于解析所述经编码的音频信号(120)以为当前帧(208_t0)和至少一个先前帧(208_t-1)获得音频信号(120)的经编码的频谱系数(206_t0_f1:206_t0_f6;206_t-1_f1:206_t-1_f6),及其中所述解码器(200)用于将预测解码选择性地应用于多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组,其中所述解码器(200)用于获得间距值,其中所述解码器(200)用于基于所述间距值选择应用预测解码的多个个别经编码的频谱系数(206_t0_f2)或经编码的频谱系数(206_t0_f4,206_t0_f5)的群组;
其中所述解码器(200)用于选择用于预测解码的根据由所述间距值定义的谐波栅而频谱布置的个别频谱系数(206_t0_f2)或频谱系数(206_t0_f4,206_t0_f5)的群组。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110984955.5A CN114067813B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158253 | 2015-03-09 | ||
EP15158253.3 | 2015-03-09 | ||
EPPCT/EP2015/063658 | 2015-06-17 | ||
PCT/EP2015/063658 WO2016142002A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
PCT/EP2016/054831 WO2016142357A1 (en) | 2015-03-09 | 2016-03-07 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110984955.5A Division CN114067813B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A Division CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107533847A true CN107533847A (zh) | 2018-01-02 |
CN107533847B CN107533847B (zh) | 2021-09-10 |
Family
ID=52692424
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680015022.2A Active CN107533847B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984953.6A Pending CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984955.5A Active CN114067813B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110984953.6A Pending CN114067812A (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
CN202110984955.5A Active CN114067813B (zh) | 2015-03-09 | 2016-03-07 | 音频编码器和音频解码器及对应的方法 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10600428B2 (zh) |
EP (3) | EP4297027A3 (zh) |
JP (3) | JP6666356B2 (zh) |
KR (1) | KR102151728B1 (zh) |
CN (3) | CN107533847B (zh) |
AR (6) | AR103890A1 (zh) |
AU (5) | AU2016231220B2 (zh) |
BR (1) | BR112017019185B1 (zh) |
CA (1) | CA2978815C (zh) |
ES (2) | ES2821025T3 (zh) |
HK (1) | HK1244583A1 (zh) |
MX (1) | MX365267B (zh) |
MY (1) | MY181486A (zh) |
PL (2) | PL3373298T3 (zh) |
PT (1) | PT3268960T (zh) |
RU (1) | RU2707151C2 (zh) |
SG (1) | SG11201707349WA (zh) |
TW (1) | TWI613644B (zh) |
WO (1) | WO2016142002A1 (zh) |
ZA (6) | ZA201706604B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109473116A (zh) * | 2018-12-12 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 语音编码方法、语音解码方法及装置 |
CN115004298A (zh) * | 2019-11-27 | 2022-09-02 | 弗劳恩霍夫应用研究促进协会 | 用于对音频编码的音调信号进行频域长期预测的编码器、解码器、编码方法和解码方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6031198A (ja) * | 1983-07-29 | 1985-02-16 | 松下電器産業株式会社 | 予測残差信号符号化方法 |
WO1996002050A1 (en) * | 1994-07-11 | 1996-01-25 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
US20040153316A1 (en) * | 2003-01-30 | 2004-08-05 | Hardwick John C. | Voice transcoder |
US20050078754A1 (en) * | 2003-09-07 | 2005-04-14 | Microsoft Corporation | Scan patterns for interlaced video content |
WO2006113921A1 (en) * | 2005-04-20 | 2006-10-26 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
TW200638336A (en) * | 2005-03-11 | 2006-11-01 | Qualcomm Inc | Time warping frames inside the vocoder by modifying the residual |
US20070016415A1 (en) * | 2005-07-15 | 2007-01-18 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US20080312758A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
US20100063802A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive Frequency Prediction |
US20120029925A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
WO2014108393A1 (en) * | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
WO2014202770A1 (en) * | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
Family Cites Families (259)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH572650A5 (zh) * | 1972-12-21 | 1976-02-13 | Gretag Ag | |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
JPS62234435A (ja) | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US6289308B1 (en) | 1990-06-01 | 2001-09-11 | U.S. Philips Corporation | Encoded wideband digital transmission signal and record carrier recorded with such a signal |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
JP3465697B2 (ja) | 1993-05-31 | 2003-11-10 | ソニー株式会社 | 信号記録媒体 |
CA2140779C (en) | 1993-05-31 | 2005-09-20 | Kyoya Tsutsui | Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal |
TW272341B (zh) | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
GB2281680B (en) | 1993-08-27 | 1998-08-26 | Motorola Inc | A voice activity detector for an echo suppressor and an echo suppressor |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5502713A (en) | 1993-12-07 | 1996-03-26 | Telefonaktiebolaget Lm Ericsson | Soft error concealment in a TDMA radio system |
JPH07336231A (ja) | 1994-06-13 | 1995-12-22 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
EP0820624A1 (en) | 1995-04-10 | 1998-01-28 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
JP3747492B2 (ja) | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
JP3680374B2 (ja) * | 1995-09-28 | 2005-08-10 | ソニー株式会社 | 音声合成方法 |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
DE19747132C2 (de) | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
US6301265B1 (en) * | 1998-08-14 | 2001-10-09 | Motorola, Inc. | Adaptive rate system and method for network communications |
US6061555A (en) | 1998-10-21 | 2000-05-09 | Parkervision, Inc. | Method and system for ensuring reception of a communications signal |
US6400310B1 (en) | 1998-10-22 | 2002-06-04 | Washington University | Method and apparatus for a tunable high-resolution spectral estimator |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP3762579B2 (ja) | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
KR100675309B1 (ko) | 1999-11-16 | 2007-01-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법 |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
AU2001284910B2 (en) | 2000-08-16 | 2007-03-22 | Dolby Laboratories Licensing Corporation | Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information |
US7003467B1 (en) | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
JP2002162998A (ja) * | 2000-11-28 | 2002-06-07 | Fujitsu Ltd | パケット修復処理を伴なう音声符号化方法 |
US20020128839A1 (en) | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
WO2002058053A1 (en) | 2001-01-22 | 2002-07-25 | Kanars Data Corporation | Encoding method and decoding method for digital voice data |
JP2002268693A (ja) | 2001-03-12 | 2002-09-20 | Mitsubishi Electric Corp | オーディオ符号化装置 |
SE522553C2 (sv) | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
US6934676B2 (en) | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
JP2003108197A (ja) | 2001-07-13 | 2003-04-11 | Matsushita Electric Ind Co Ltd | オーディオ信号復号化装置およびオーディオ信号符号化装置 |
MXPA03002115A (es) | 2001-07-13 | 2003-08-26 | Matsushita Electric Ind Co Ltd | DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO. |
EP1304885A3 (de) * | 2001-09-14 | 2005-04-20 | Siemens Aktiengesellschaft | Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen |
EP1446797B1 (en) | 2001-10-25 | 2007-05-23 | Koninklijke Philips Electronics N.V. | Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth |
JP3923783B2 (ja) | 2001-11-02 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置及び復号化装置 |
JP4308229B2 (ja) | 2001-11-14 | 2009-08-05 | パナソニック株式会社 | 符号化装置および復号化装置 |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7206740B2 (en) | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
DE60323331D1 (de) | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
RU2316154C2 (ru) | 2002-04-10 | 2008-01-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование стереофонических сигналов |
KR20040101457A (ko) * | 2002-04-12 | 2004-12-02 | 아치 스페셜티 케미칼즈, 인코포레이티드 | 액체 화학 물질 공급을 원격으로 모니터링 하는 시스템 |
US20030220800A1 (en) | 2002-05-21 | 2003-11-27 | Budnikov Dmitry N. | Coding multichannel audio signals |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
EP1516514A1 (en) | 2002-06-12 | 2005-03-23 | Equtech APS | Method of digital equalisation of a sound from loudspeakers in rooms and use of the method |
KR100462615B1 (ko) | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
DE20321883U1 (de) | 2002-09-04 | 2012-01-20 | Microsoft Corp. | Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
RU2244386C2 (ru) | 2003-03-28 | 2005-01-10 | Корпорация "Самсунг Электроникс" | Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации |
US8311809B2 (en) | 2003-04-17 | 2012-11-13 | Koninklijke Philips Electronics N.V. | Converting decoded sub-band signal into a stereo signal |
EP1475144A2 (de) * | 2003-05-09 | 2004-11-10 | Pfaudler Werke GmbH | Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN1839426A (zh) * | 2003-09-17 | 2006-09-27 | 北京阜国数字技术有限公司 | 多分辨率矢量量化的音频编解码方法及装置 |
US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004007191B3 (de) | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
DE602005014288D1 (de) | 2004-03-01 | 2009-06-10 | Dolby Lab Licensing Corp | Mehrkanalige Audiodekodierung |
US7739119B2 (en) | 2004-03-02 | 2010-06-15 | Ittiam Systems (P) Ltd. | Technique for implementing Huffman decoding |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
CN1677493A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
CN1677491A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US7668711B2 (en) | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
CN1947174B (zh) | 2004-04-27 | 2012-03-14 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法 |
DE102004021403A1 (de) | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
ATE394774T1 (de) | 2004-05-19 | 2008-05-15 | Matsushita Electric Ind Co Ltd | Kodierungs-, dekodierungsvorrichtung und methode dafür |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
CA2572805C (en) | 2004-07-02 | 2013-08-13 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
US7465389B2 (en) | 2004-07-09 | 2008-12-16 | Exxonmobil Research And Engineering Company | Production of extra-heavy lube oils from Fischer-Tropsch wax |
US6963405B1 (en) | 2004-07-19 | 2005-11-08 | Itt Manufacturing Enterprises, Inc. | Laser counter-measure using fourier transform imaging spectrometers |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
TWI498882B (zh) | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
EP2752843A1 (en) | 2004-11-05 | 2014-07-09 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
KR100721537B1 (ko) | 2004-12-08 | 2007-05-23 | 한국전자통신연구원 | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 |
JP4903053B2 (ja) | 2004-12-10 | 2012-03-21 | パナソニック株式会社 | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
TWI277013B (en) * | 2005-02-01 | 2007-03-21 | Ind Tech Res Inst | Method for reducing buffered-frame memory sizes and accesses in a video codec |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
SG163556A1 (en) | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for wideband speech coding |
UA91853C2 (ru) | 2005-04-01 | 2010-09-10 | Квелкомм Инкорпорейтед | Способ и устройство для векторного квантования спектрального представления огибающей |
PT1875463T (pt) | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
US7698143B2 (en) | 2005-05-17 | 2010-04-13 | Mitsubishi Electric Research Laboratories, Inc. | Constructing broad-band acoustic signals from lower-band acoustic signals |
JP2006323037A (ja) | 2005-05-18 | 2006-11-30 | Matsushita Electric Ind Co Ltd | オーディオ信号復号化装置 |
WO2006134992A1 (ja) | 2005-06-17 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd. | ポストフィルタ、復号化装置及びポストフィルタ処理方法 |
JP2009500656A (ja) | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
US7411528B2 (en) | 2005-07-11 | 2008-08-12 | Lg Electronics Co., Ltd. | Apparatus and method of processing an audio signal |
KR100803205B1 (ko) | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
JP4640020B2 (ja) | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
CN100539437C (zh) | 2005-07-29 | 2009-09-09 | 上海杰得微电子有限公司 | 一种音频编解码器的实现方法 |
WO2007055462A1 (en) | 2005-08-30 | 2007-05-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
US20080255859A1 (en) | 2005-10-20 | 2008-10-16 | Lg Electronics, Inc. | Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
KR100717058B1 (ko) | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
DE602006013359D1 (de) | 2006-09-13 | 2010-05-12 | Ericsson Telefon Ab L M | Ender und empfänger |
JP4936569B2 (ja) | 2006-10-25 | 2012-05-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法 |
JP5231243B2 (ja) | 2006-11-28 | 2013-07-10 | パナソニック株式会社 | 符号化装置及び符号化方法 |
KR101365445B1 (ko) * | 2007-01-03 | 2014-02-19 | 삼성전자주식회사 | 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더 |
MX2009007412A (es) | 2007-01-10 | 2009-07-17 | Koninkl Philips Electronics Nv | Decodificador de audio. |
JP2010519602A (ja) | 2007-02-26 | 2010-06-03 | クゥアルコム・インコーポレイテッド | 信号分離のためのシステム、方法、および装置 |
JP5294713B2 (ja) | 2007-03-02 | 2013-09-18 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
DE102007018484B4 (de) * | 2007-03-20 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101411900B1 (ko) | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
CN101067931B (zh) | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
ES2358786T3 (es) | 2007-06-08 | 2011-05-13 | Dolby Laboratories Licensing Corporation | Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial. |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN101325059B (zh) | 2007-06-15 | 2011-12-21 | 华为技术有限公司 | 语音编解码收发方法及装置 |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
JP5255638B2 (ja) | 2007-08-27 | 2013-08-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | ノイズ補充の方法及び装置 |
EP2571024B1 (en) | 2007-08-27 | 2014-10-22 | Telefonaktiebolaget L M Ericsson AB (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
US8527265B2 (en) | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
EP2207166B1 (en) | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
KR101586317B1 (ko) | 2007-11-21 | 2016-01-18 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
AU2008344134B2 (en) | 2007-12-31 | 2011-08-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
DE602008005250D1 (de) | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US20090180531A1 (en) | 2008-01-07 | 2009-07-16 | Radlive Ltd. | codec with plc capabilities |
KR101413967B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
EP2248263B1 (en) | 2008-01-31 | 2012-12-26 | Agency for Science, Technology And Research | Method and device of bitrate distribution/truncation for scalable audio coding |
US8391498B2 (en) | 2008-02-14 | 2013-03-05 | Dolby Laboratories Licensing Corporation | Stereophonic widening |
CN101965612B (zh) | 2008-03-03 | 2012-08-29 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
AU2009221444B2 (en) | 2008-03-04 | 2012-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Mixing of input data streams and generation of an output data stream therefrom |
WO2009109050A1 (en) | 2008-03-05 | 2009-09-11 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
EP2301017B1 (en) | 2008-05-09 | 2016-12-21 | Nokia Technologies Oy | Audio apparatus |
US20090319263A1 (en) | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
CN102105930B (zh) | 2008-07-11 | 2012-10-03 | 弗朗霍夫应用科学研究促进协会 | 用于编码采样音频信号的帧的音频编码器和解码器 |
MX2011000367A (es) | 2008-07-11 | 2011-03-02 | Fraunhofer Ges Forschung | Un aparato y un metodo para calcular una cantidad de envolventes espectrales. |
CN103077722B (zh) | 2008-07-11 | 2015-07-22 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
RU2491658C2 (ru) | 2008-07-11 | 2013-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Синтезатор аудиосигнала и кодирующее устройство аудиосигнала |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
CN102089813B (zh) | 2008-07-11 | 2013-11-20 | 弗劳恩霍夫应用研究促进协会 | 音频编码器和音频解码器 |
ES2422412T3 (es) | 2008-07-11 | 2013-09-11 | Fraunhofer Ges Forschung | Codificador de audio, procedimiento para la codificación de audio y programa de ordenador |
EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
US8406307B2 (en) * | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
US8463603B2 (en) | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
JP5295372B2 (ja) | 2008-09-17 | 2013-09-18 | フランス・テレコム | デジタルオーディオ信号におけるプリエコーの減衰 |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
ES2976382T3 (es) | 2008-12-15 | 2024-07-31 | Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V | Decodificador de extensión de ancho de banda |
JP5423684B2 (ja) | 2008-12-19 | 2014-02-19 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
BR122019023704B1 (pt) | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
AU2010206911B2 (en) * | 2009-01-20 | 2013-08-01 | Med-El Elektromedizinische Geraete Gmbh | High accuracy tonotopic and periodic coding with enhanced harmonic resolution |
JP4977157B2 (ja) | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP5214058B2 (ja) | 2009-03-17 | 2013-06-19 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN101521014B (zh) | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
EP2249333B1 (en) | 2009-05-06 | 2014-08-27 | Nuance Communications, Inc. | Method and apparatus for estimating a fundamental frequency of a speech signal |
CN101556799B (zh) | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
GB2470385A (en) | 2009-05-21 | 2010-11-24 | Gm Global Tech Operations Inc | Vehicle simulation |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
CN101609680B (zh) | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
EP2273493B1 (en) | 2009-06-29 | 2012-12-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Bandwidth extension encoding and decoding |
MY167512A (en) | 2009-07-07 | 2018-09-04 | Xtralis Technologies Ltd | Chamber condition |
US9031834B2 (en) | 2009-09-04 | 2015-05-12 | Nuance Communications, Inc. | Speech enhancement techniques on the power spectrum |
GB2473267A (en) | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
AU2010305383B2 (en) * | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
KR101137652B1 (ko) | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
EP4358082A1 (en) * | 2009-10-20 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
EP2491555B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec |
EP3998606B8 (en) | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
KR101487687B1 (ko) * | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
JP5523589B2 (ja) | 2010-03-09 | 2014-06-18 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 |
JP5456914B2 (ja) * | 2010-03-10 | 2014-04-02 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム |
EP2369861B1 (en) | 2010-03-25 | 2016-07-27 | Nxp B.V. | Multi-channel audio signal processing |
CN101847413B (zh) * | 2010-04-09 | 2011-11-16 | 北京航空航天大学 | 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法 |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
RU2683175C2 (ru) | 2010-04-09 | 2019-03-26 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
PL3779979T3 (pl) | 2010-04-13 | 2024-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
US8886523B2 (en) | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
PL2581905T3 (pl) | 2010-06-09 | 2016-06-30 | Panasonic Ip Corp America | Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio |
JP5387522B2 (ja) * | 2010-07-01 | 2014-01-15 | コニカミノルタ株式会社 | カラー画像形成装置 |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8489403B1 (en) | 2010-08-25 | 2013-07-16 | Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ | Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
IL317702A (en) * | 2010-09-16 | 2025-02-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
CA2813898C (en) * | 2010-10-07 | 2017-05-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for level estimation of coded audio frames in a bit stream domain |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
KR101624019B1 (ko) | 2011-02-14 | 2016-06-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코덱에서 잡음 생성 |
WO2012119655A1 (en) * | 2011-03-10 | 2012-09-13 | Telefonaktiebolaget L M Ericsson (Publ) | Decoding of transforms with curved basis functions |
DE102011106033A1 (de) | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels |
KR102078865B1 (ko) | 2011-06-30 | 2020-02-19 | 삼성전자주식회사 | 대역폭 확장신호 생성장치 및 방법 |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
KR20130022549A (ko) | 2011-08-25 | 2013-03-07 | 삼성전자주식회사 | 마이크 노이즈 제거 방법 및 이를 지원하는 휴대 단말기 |
CN103718240B (zh) | 2011-09-09 | 2017-02-15 | 松下电器(美国)知识产权公司 | 编码装置、解码装置、编码方法和解码方法 |
WO2013058635A2 (ko) * | 2011-10-21 | 2013-04-25 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
PL3624119T3 (pl) | 2011-10-28 | 2022-06-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie kodujące i sposób kodowania |
CN103165136A (zh) | 2011-12-15 | 2013-06-19 | 杜比实验室特许公司 | 音频处理方法及音频处理设备 |
JP5817499B2 (ja) | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
WO2013093172A1 (en) * | 2011-12-20 | 2013-06-27 | Nokia Corporation | Audio conferencing |
KR102123770B1 (ko) | 2012-03-29 | 2020-06-16 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 하모닉 오디오 신호의 변환 인코딩/디코딩 |
RU2610293C2 (ru) | 2012-03-29 | 2017-02-08 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
EP3576089B1 (en) | 2012-05-23 | 2020-10-14 | Nippon Telegraph And Telephone Corporation | Encoding of an audio signal |
CN102798870B (zh) * | 2012-08-07 | 2013-09-25 | 中国空间技术研究院 | 一种卫星导航系统兼容性分析方法 |
US9589570B2 (en) | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
KR101700855B1 (ko) * | 2012-10-01 | 2017-01-31 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
US9135920B2 (en) | 2012-11-26 | 2015-09-15 | Harman International Industries, Incorporated | System for perceived enhancement and restoration of compressed audio signals |
PL3067890T3 (pl) | 2013-01-29 | 2018-06-29 | Fraunhofer Ges Forschung | Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
CA2900592C (en) * | 2013-02-27 | 2016-05-17 | Evolution Engineering Inc. | Fluid pressure pulse generating apparatus and method of using same |
US9478224B2 (en) * | 2013-04-05 | 2016-10-25 | Dolby International Ab | Audio processing system |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
ES2739477T3 (es) * | 2013-10-31 | 2020-01-31 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo |
US9836429B2 (en) | 2013-11-06 | 2017-12-05 | Hitachi, Ltd. | Signal transmission circuit and printed circuit board |
KR101913241B1 (ko) * | 2013-12-02 | 2019-01-14 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
CN106409300B (zh) * | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
SG11201608787UA (en) * | 2014-03-28 | 2016-12-29 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
JP5723472B1 (ja) * | 2014-08-07 | 2015-05-27 | 廣幸 田中 | データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル |
EP3198247B1 (en) * | 2014-09-25 | 2021-03-17 | Sunhouse Technologies, Inc. | Device for capturing vibrations produced by an object and system for capturing vibrations produced by a drum. |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US20170022149A1 (en) * | 2015-07-25 | 2017-01-26 | Mark Quang Nguyen | Fumarate compounds, pharmaceutical compositions thereof, and methods of use |
WO2021104623A1 (en) * | 2019-11-27 | 2021-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, encoding method and decoding method for frequency domain long-term prediction of tonal signals for audio coding |
US11768130B2 (en) * | 2020-10-16 | 2023-09-26 | The Chinese University Of Hong Kong | Microtome and method for controlling and manufacturing the same |
-
2015
- 2015-06-17 WO PCT/EP2015/063658 patent/WO2016142002A1/en active Application Filing
-
2016
- 2016-03-07 CN CN201680015022.2A patent/CN107533847B/zh active Active
- 2016-03-07 ES ES16709331T patent/ES2821025T3/es active Active
- 2016-03-07 RU RU2017134620A patent/RU2707151C2/ru active
- 2016-03-07 MY MYPI2017001298A patent/MY181486A/en unknown
- 2016-03-07 AU AU2016231220A patent/AU2016231220B2/en active Active
- 2016-03-07 EP EP23209483.9A patent/EP4297027A3/en active Pending
- 2016-03-07 PL PL18170157.4T patent/PL3373298T3/pl unknown
- 2016-03-07 CN CN202110984953.6A patent/CN114067812A/zh active Pending
- 2016-03-07 MX MX2017011494A patent/MX365267B/es active IP Right Grant
- 2016-03-07 SG SG11201707349WA patent/SG11201707349WA/en unknown
- 2016-03-07 ES ES18170157T patent/ES2972504T3/es active Active
- 2016-03-07 BR BR112017019185-7A patent/BR112017019185B1/pt active IP Right Grant
- 2016-03-07 JP JP2017546946A patent/JP6666356B2/ja active Active
- 2016-03-07 KR KR1020177028551A patent/KR102151728B1/ko active Active
- 2016-03-07 CA CA2978815A patent/CA2978815C/en active Active
- 2016-03-07 PT PT167093319T patent/PT3268960T/pt unknown
- 2016-03-07 PL PL16709331T patent/PL3268960T3/pl unknown
- 2016-03-07 CN CN202110984955.5A patent/CN114067813B/zh active Active
- 2016-03-07 EP EP16709331.9A patent/EP3268960B1/en active Active
- 2016-03-07 EP EP18170157.4A patent/EP3373298B1/en active Active
- 2016-03-08 TW TW105107024A patent/TWI613644B/zh active
- 2016-03-09 AR ARP160100621A patent/AR103890A1/es active IP Right Grant
-
2017
- 2017-09-06 US US15/697,042 patent/US10600428B2/en active Active
- 2017-10-02 ZA ZA2017/06604A patent/ZA201706604B/en unknown
-
2018
- 2018-03-06 HK HK18103159.1A patent/HK1244583A1/zh unknown
-
2019
- 2019-05-06 AU AU2019203173A patent/AU2019203173B2/en active Active
- 2019-11-01 JP JP2019200326A patent/JP7078592B2/ja active Active
-
2020
- 2020-02-26 US US16/802,397 patent/US12112765B2/en active Active
-
2021
- 2021-05-31 AR ARP210101479A patent/AR122488A2/es unknown
- 2021-05-31 AR ARP210101476A patent/AR122219A2/es unknown
- 2021-05-31 AR ARP210101477A patent/AR122486A2/es unknown
- 2021-05-31 AR ARP210101480A patent/AR122489A2/es unknown
- 2021-05-31 AR ARP210101478A patent/AR122487A2/es unknown
- 2021-08-13 AU AU2021215252A patent/AU2021215252B2/en active Active
-
2022
- 2022-04-29 ZA ZA2022/04764A patent/ZA202204764B/en unknown
- 2022-04-29 ZA ZA2022/04766A patent/ZA202204766B/en unknown
- 2022-04-29 ZA ZA2022/04768A patent/ZA202204768B/en unknown
- 2022-04-29 ZA ZA2022/04767A patent/ZA202204767B/en unknown
- 2022-04-29 ZA ZA2022/04765A patent/ZA202204765B/en unknown
- 2022-05-19 JP JP2022082087A patent/JP2022110116A/ja active Pending
-
2023
- 2023-10-05 AU AU2023241343A patent/AU2023241343B2/en active Active
-
2024
- 2024-09-17 US US18/887,358 patent/US20250014586A1/en active Pending
- 2024-11-27 AU AU2024266944A patent/AU2024266944A1/en active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6031198A (ja) * | 1983-07-29 | 1985-02-16 | 松下電器産業株式会社 | 予測残差信号符号化方法 |
WO1996002050A1 (en) * | 1994-07-11 | 1996-01-25 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
US20040153316A1 (en) * | 2003-01-30 | 2004-08-05 | Hardwick John C. | Voice transcoder |
US20050078754A1 (en) * | 2003-09-07 | 2005-04-14 | Microsoft Corporation | Scan patterns for interlaced video content |
TW200638336A (en) * | 2005-03-11 | 2006-11-01 | Qualcomm Inc | Time warping frames inside the vocoder by modifying the residual |
WO2006113921A1 (en) * | 2005-04-20 | 2006-10-26 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US20070016415A1 (en) * | 2005-07-15 | 2007-01-18 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US20080312758A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
US20100063802A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive Frequency Prediction |
US20120029925A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
CN103038821A (zh) * | 2010-07-30 | 2013-04-10 | 高通股份有限公司 | 用于谐波信号的译码的系统、方法、设备和计算机可读媒体 |
WO2014108393A1 (en) * | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
WO2014202770A1 (en) * | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
Non-Patent Citations (3)
Title |
---|
BOSI M 等: ""ISO/IEC MPEG-2 Advanced Audio Coding"", 《JOURNAL OF THE AUDIO ENGINEERING SOCIETY》 * |
K.N. HAMDY 等: ""Low bit rate high quality audio coding with combined harmonic and wavelet representations"", 《1996 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING CONFERENCE PROCEEDINGS》 * |
计哲: ""低速率语音编码算法研究"", 《CNKI中国博士学位论文全文数据库信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109473116A (zh) * | 2018-12-12 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 语音编码方法、语音解码方法及装置 |
CN109473116B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 语音编码方法、语音解码方法及装置 |
CN115004298A (zh) * | 2019-11-27 | 2022-09-02 | 弗劳恩霍夫应用研究促进协会 | 用于对音频编码的音调信号进行频域长期预测的编码器、解码器、编码方法和解码方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021215252B2 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
JP6385433B2 (ja) | オーディオ信号のスペクトルのスペクトル係数のコード化 | |
TWI590233B (zh) | 解碼器及其解碼方法、編碼器及其編碼方法、電腦程式 | |
JP6248194B2 (ja) | 多チャネルオーディオ符号化におけるノイズ充填 | |
JP2019164367A (ja) | 低複雑度の調性適応音声信号量子化 | |
WO2016142357A1 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |