CN105957532B - 对音频/语音信号进行编码和解码的方法和设备 - Google Patents
对音频/语音信号进行编码和解码的方法和设备 Download PDFInfo
- Publication number
- CN105957532B CN105957532B CN201610515415.1A CN201610515415A CN105957532B CN 105957532 B CN105957532 B CN 105957532B CN 201610515415 A CN201610515415 A CN 201610515415A CN 105957532 B CN105957532 B CN 105957532B
- Authority
- CN
- China
- Prior art keywords
- signal
- unit
- audio
- decoding
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000002123 temporal effect Effects 0.000 claims description 23
- 230000001131 transforming effect Effects 0.000 claims description 13
- 238000007493 shaping process Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 abstract description 40
- 238000013139 quantization Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 30
- 230000009466 transformation Effects 0.000 description 23
- 238000005070 sampling Methods 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供了一种对音频/语音信号进行编码和解码的方法和设备。输入的音频信号或语音信号可被变换为高频率分辨率信号和高时间分辨率信号中的至少一个。可通过确定合适的分辨率来对信号进行编码,可对编码的信号进行解码,从而,可处理音频信号、语音信号以及音频信号和语音信号的混合信号。
Description
本申请是申请日为2009年7月14日,申请号为“200980135987.5”,标题为“对音频/语音信号进行编码和解码的方法和设备”的发明专利申请的分案申请。
技术领域
示例实施例涉及一种对音频/语音信号进行编码和解码的方法和设备。
背景技术
编解码器可被分为语音编解码器和音频编解码器。语音编解码器可使用语音建模在50Hz到7kHz的范围的频带中对信号进行编码/解码。一般来说,语音编解码器可通过对声带和声道进行建模来提取语音信号的参数,以执行编码和解码。音频编解码器可通过应用心理声学建模(如高效高级音频编码(HE-AAC))在0Hz到24Hz的范围的频带中对信号进行编码/解码。音频编解码器可基于人类听觉特征,通过去除不易察觉的信号来执行编码和解码。
语音编解码器虽然适合于对语音信号进行编码/解码,但由于声音质量的下降,语音编解码器不适合于对音频信号进行编码/解码。此外,当音频编解码器对语音信号进行编码/解码时,可能降低信号压缩效率。
发明内容
示例实施例可提供一种对音频/语音信号进行编码和解码的方法和设备,所述方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。
本总体发明构思的另外特征和效用将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过本总体发明构思的实施可以被得知。
根据本总体发明构思的示例实施例,可提供一种对音频/语音信号进行编码的设备,所述设备包括:信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;时域编码单元,基于语音建模,对由信号变换单元变换的信号进行编码;量化单元,对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行编码的设备,所述设备包括:参数立体声处理单元,处理输入的音频信号或语音信号的立体声信息;高频信号处理单元,处理输入的音频信号或语音信号的高频信号;信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;时域编码单元,基于语音建模,对由信号变换单元变换的信号进行编码;量化单元,对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
根据本总体发明构思的示例实施例,还可提供了一种对音频/语音信号进行编码的设备,所述设备包括:信号变换单元,将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个;心理声学建模单元,控制信号变换单元;低码率确定单元,确定变换的信号是否处于低码率;时域编码单元,当变换的信号处于低码率时,基于语音建模,对变换的信号进行编码;时间噪声整形单元,对变换的信号进行整形;高码率立体声单元,对整形的信号的立体声信息进行编码;量化单元,对来自高码率立体声单元的输出信号和来自时域编码单元的输出信号中的至少一个进行量化。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行解码的设备,所述设备包括:分辨率确定单元,基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号,所述信息包括在比特流中;反量化单元,当分辨率确定单元确定所述信号是高频率分辨率信号时,对比特流进行反量化;时域解码单元,从比特流中解码出用于反线性预测的附加信息,并使用该附加信息来恢复高时间分辨率信号;反信号变换单元,将来自时域解码单元的输出信号和来自反量化单元的输出信号中的至少一个反变换到时域的音频信号或语音信号。
根据本总体发明构思的示例实施例,还可提供一种对音频/语音信号进行解码的设备,所述设备包括:反量化单元,对比特流进行反量化;高码率立体声系统/解码器,对反量化的信号进行解码;时间噪声整形器/解码器,处理由高码率立体声系统/解码器解码的信号;反信号变换单元,将处理的信号反变换到时域的音频信号或语音信号,其中,通过将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个来产生比特流。
根据本总体发明构思的示例实施例,对音频/语音信号进行编码和解码的方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。
此外,根据本总体发明构思的示例性实施例,对音频/语音信号进行编码和解码的方法和设备可使用较少比特执行编码和解码,从而可提高声音质量。
本总体发明构思的另外效用将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过实施例的实施可以被得知。
本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行编码的方法,所述方法包括:接收至少一个音频信号和至少一个语音信号;将接收的音频信号和接收的语音信号中的至少一个变换为频率分辨率信号和时域分辨率信号中的至少一个;对变换的信号进行编码;对变换的信号和编码的信号中的至少一个进行量化。
本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行解码的方法,所述方法包括:使用接收的信号的比特流中的关于时域编码或频域编码的信息,来确定当前帧信号是频率分辨率信号还是时域分辨率信号;当接收的信号是频率分辨率信号时,对比特流进行反量化;从比特流中的信息进行反线性预测,并使用该信息来恢复时域分辨率信号;将反量化的信号和恢复的时域分辨率信号中的至少一个反变换到时域的音频信号或语音信号。
附图说明
从下面通过结合附图对示例实施例的描述中,本总体发明构思的这些和/或其它特征及效用将会变得清楚,并且更易于理解,其中:
图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图3是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图4是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图5是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图6是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图7是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图8是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图9是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图10是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图11是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图12是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图13是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图14是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图;
图15是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图;
图16是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的方法的流程图;
图17是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的方法的流程图。
具体实施方式
现在将详细地参照示例实施例,其示例在附图中示出,其中,相同的标号始终表示相同的元件。以下通过参照附图描述示例性实施例以解释本公开。
图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图1,对音频/语音信号进行编码的设备可包括:信号变换单元110、心理声学建模单元120、时域编码单元130、量化单元140、参数立体声处理单元150、高频信号处理单元160和复用单元170。
信号变换单元110可将输入的音频信号或语音信号变换为高分辨率信号(highfrequentcy resoluteion signal)和/或高时间分辨率信号(high temporal resolutionsignal)。
心理声学建模单元120可控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
具体地,心理声学建模单元120可计算用于量化的掩蔽阈值(maskingthreshold),并至少使用计算的掩蔽阈值来控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
时域编码单元130可至少使用语音建模来对由信号变换单元110变换的信号进行编码。
具体地,心理声学建模单元120可将信息信号提供给时域编码单元130以控制时域编码单元130。
在这种情况下,时域编码单元130可包括预测单元(未示出)。预测单元可通过对由信号变换单元110变换的信号应用语音建模并去除相关信息来对数据进行编码。此外,预测单元可包括短时预测器和长时预测器。
量化单元140可对从信号变换单元110和/时域编码单元130输出的信号进行量化和编码。
在这种情况下,量化单元140可包括码激励线性预测(CELP)单元,用于模拟去除了相关信息的信号。在图1中未示出CELP单元。
参数立体声处理单元150可处理输入的音频信号或语音信号的立体声信息。高频信号处理单元160可处理输入的音频信号或语音信号的高频信息。
以下,将更详细地描述对音频/语音信号进行编码的设备。
信号变换单元110可将频谱系数划分为多个频带。心理声学建模单元120可分析频谱特性并确定多个频带的每个频带的时域分辨率或频域分辨率。
当高时间分辨率适合于特定频带时,可由利用变换方案的反变换单元(如反调制重叠变换(IMLT)单元)来对特定频带中的频谱系数进行变换,可由时域编码单元130对变换的信号进行编码。反变换单元可包括在信号变换单元110中。
在这种情况下,时域编码单元130可包括短时预测器和长时预测器。
当输入的信号是语音信号时,由于提高的时域分辨率,时域编码单元130可有效地反映语音产生单元的特性。具体地,短时预测器可处理从信号变换单元110接收的数据,并可去除时域中的采样点的短时相关信息。此外,长时预测器可处理已执行短时预测的残差信号数据,从而可去除长时相关信息。
量化单元140可计算输入的比特率的步长。可处理量化单元140的量化的采样点和附加信息以去除可能包括(例如)算术编码或霍夫曼编码的统计相关信息。
可以以小于32kbps的比特率来操作参数立体声处理单元150。此外,扩展运动图像专家组(MPEG)立体声处理单元可被用作参数立体声处理单元150。高频信号处理单元160可有效地对高频信号进行编码。
复用单元170可将上述单元中的一个或多个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它合适的压缩编码)来产生比特流。
图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图2,对音频/语音信号进行解码的设备可包括:分辨率确定单元210、时域解码单元220、反量化单元230、反信号变换单元240、高频信号处理单元250和参数立体声处理单元260。
分辨率确定单元210可基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
反量化单元230可基于分辨率确定单元210的输出信号来对比特流进行反量化。
时域解码单元220可从反量化单元230接收反量化的信号,从比特流中解码出用于反线性预测的附加信息,并至少使用所述附加信息和所述反量化的信号来恢复高时间分辨率信号。
反信号变换单元240可将来自时域解码单元220的输出信号和/或来自反量化单元230的反量化的信号反变换到时域的音频信号或语音信号。
反频变调制重叠变换(FV-MLT)可以是反信号变换单元240。
高频信号处理单元250可处理反变换的信号的高频信号,参数立体声处理单元260可处理反变换的信号的立体声信息。
可将比特流输入到反量化单元230、高频信号处理单元250和参数立体声处理单元260以对比特流进行解码。
图3是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图3,对音频/语音信号进行编码的设备可包括:信号变换单元310、心理声学建模单元320、时间噪声(temporal noise)整形单元330、高码率(high rate)立体声单元340、量化单元350、高频信号处理单元360和复用单元370。
信号变换单元310可将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
改进离散余弦变换(MDCT)可被用作信号变换单元310。
心理声学建模单元320可控制信号变换单元310将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。
时间噪声整形单元330可对变换的信号的时域噪声进行整形。
高码率立体声单元340可对变换的信号的立体声信息进行编码。
量化单元350可对从时间噪声整形单元330和/或高码率立体声单元340输出的信号进行量化。
高频信号处理单元360可处理音频信号或语音信号的高频信号。
复用单元370可将上述的单元的每个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它适合的编码)来产生比特流。
图4是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图4,对音频/语音信号进行解码的设备可包括:反量化单元410、高码率立体声系统/解码器420、时间噪声整形器/解码器430、反信号变换单元440和高频信号处理单元450。
反量化单元410可对比特流进行反量化。
高码率立体声系统/解码器420可对反量化的信号进行解码。时间噪声整形器/解码器430可对在对音频/语音信号进行编码的设备中执行时域整形的信号进行解码。
反信号变换单元440可将解码的信号反变换到时域的音频信号或语音信号。反MDCT可被用作反信号变换单元440。
高频信号处理单元450可处理反变换的解码的信号的高频信号。
图5是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图5,CELP单元可包括在对音频/语音信号进行编码的设备的时域编码单元520中,然而,CELP单元可包括在图1中的量化单元140中。
也就是说,时域编码单元520可包括:短时预测器、长时预测器和CELP单元。CELP单元可指示模拟去除了相关信息的信号的激励建模模块。
当信号变换单元在心理声学建模单元的控制下,将输入的音频信号或语音信号变换为高时间分辨率信号时,时域编码单元130可在不在频谱量化单元510中对高时间分辨率信号进行量化的情况下,或作为可选,通过使在频谱量化单元510中对高时间分辨率信号的量化最小化,来对变换的高时域分辨信号进行编码。
包括在时域编码单元520中的CELP单元可对短时相关信息和长时相关信息的残差信号进行编码。
图6是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图6,图1中示出的对音频/语音信号进行编码的设备还可包括切换单元610。
切换单元610可至少使用关于时域编码或频域编码的信息来选择任何一个或多个量化单元620的量化和时域编码单元630的编码。量化单元620可以是频谱量化单元。
图7是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图7,图2中示出的对音频/语音信号进行解码的设备还可包括切换单元710。切换单元710可至少根据分辨率确定单元的确定来控制切换到时域解码单元730或频谱反量化单元720。
图8是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图8,图1中示出的对音频/语音信号进行编码的设备还可包括下采样单元810。
下采样单元810可将输入的信号下采样为低频信号。可通过下采样来产生低频信号,当低频信号处于高码率和低码率的双重码率时,可执行下采样。也就是说,当以与高频信号处理单元的采样率的一半或四分之一相应的低采样率操作低频信号编码方案的采样频率时,可利用低频信号。当参数立体声处理单元包括在对音频/语音信号进行编码的设备中时,可在参数立体声处理单元执行正交镜像滤波器(QMF)合成时执行下采样。
在这种情况下,高码率可以是高于64kbps的码率,低码率可以是低于64kbps的码率。
图9是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
分辨率确定单元910可至少部分基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
反量化单元920可基于分辨率确定单元910的输出信号来对比特流进行反量化。
时域解码单元930可从反量化单元920接收编码的残差信号,从比特流中解码出用于反线性预测的附加信息,并使用所述附加信息和所述残差信号来恢复高时间分辨率信号。
反信号变换单元940可将来自时域解码单元930的输出信号和/或来自反量化单元920的反量化的信号反变换到时域的音频信号或语音信号。
在这种情况下,高频信号处理单元950可在图9的对音频/语音信号进行解码的设备中执行上采样。
图10是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图10,图5中示出的对音频/语音信号进行编码的设备还可包括下采样单元1010。也就是说,可通过下采样产生低频信号。
当应用参数立体声处理单元1020时,在参数立体声处理单元1020可执行QMF合成以产生缩混(downmix)信号时,下采样单元1010可执行下采样。时域编码单元1030可包括短时预测器、长时预测器和CELP单元。
图11是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
分辨率确定单元1110可基于关于时域编码或频域编码的信息,确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。
当分辨率确定单元1110确定当前帧信号是高频率分辨率信号时,频谱反量化单元1130可至少部分基于分辨率确定单元1110的输出信号来对比特流进行反量化。
当分辨率确定单元1110确定当前帧信号是高时间分辨率信号时,时域解码单元1120可恢复高时间分辨率信号。
反信号变换单元1140可将来自时域解码单元1120的输出信号和/或来自频谱反量化单元1130的反量化的信号反变换到时域的音频信号或语音信号。
此外,高频信号处理单元1150可在图11的对音频/语音信号进行解码的设备中执行上采样。
图12是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图12,图6中示出的对音频/语音信号进行编码的设备还包括下采样单元1210。也就是说,可通过下采样来产生低频信号。
当应用参数立体声处理单元1220时,在参数立体声处理单元1220执行QMF合成时,下采样单元1210可执行下采样。
图12的对音频/语音信号进行编码的设备的上/下采样因子可以是(例如)高频信号处理单元的采样率的一半或四分之一。也就是说,当以48kHz输入信号时,可通过上/下采样使用24kHz或12kHz。
图13是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图13,图2中示出的对音频/语音信号进行解码的设备还可包括切换单元。也就是说,切换单元可控制切换到时域解码单元1320或频谱反量化单元1310。
图14是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。
参照图14,图1中示出的对音频/语音信号进行编码的设备和图3中示出的对音频/语音信号进行编码的设备可至少部分组合。
也就是说,当作为低码率确定单元1430基于预定的低码率和高码率的确定的结果,变换的信号处于低码率时,可操作信号变换单元1410、时域编码单元1440和量化单元1470。当变换的信号处于高码率时,可操作信号变换单元1410、时间噪声整形单元1450和高码率立体声单元1460。
可基于预定标准打开/关闭参数立体声处理单元1481和高频信号处理单元1491。此外,可不同时操作高码率立体声单元1460和参数立体声处理单元1481。此外,可基于预定信息在高频信号处理确定单元1490和参数立体声处理确定单元1480的控制下,分别操作高频信号处理单元1491和参数立体声处理单元1481。
图15是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。
参照图15,图2中示出的对音频/语音信号进行解码的设备和图4中示出的对音频/语音信号进行解码的设备可至少部分组合。
也就是说,当作为低码率确定单元1510的确定的结果,变换的信号处于高码率时,可操作高码率立体声系统/解码器1520、时间噪声整形器/解码器1530和反信号变换单元1540。当变换的信号处于低码率时,可操作分辨率确定单元1550、时域解码单元1560和高频信号处理单元1570。此外,可基于预定信息在高频信号处理确定单元和参数立体声处理确定单元的控制下,分别操作高频信号处理单元1570和参数立体声处理单元1580。
图16是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的方法的流程图。
在操作S 1610中,输入的音频信号或语音信号可被变换为频域。在操作S 1620中,可确定是否要执行变换到时域。
还可进一步包括对输入的音频信号或语音信号进行下采样的操作。
至少根据操作S 1620中确定的结果,在操作S 1630中,输入的音频信号或语音信号可被变换为高频率分辨率信号和/或高时间分辨率信号。
也就是说,当将要执行变换到时域时,在操作S 1630中,输入的音频信号或语音信号可被变换为高时间分辨率信号并可被量化。当将不执行变换到时域时,在操作S 1640,输入的音频信号或语音信号可被量化并被编码。
图17是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的方法的流程图。
在操作S 1710中,可确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。
在这种情况下,所述确定可基于关于时域编码或频域编码的信息,并且所述信息可包括在比特流中。
在操作S 1720中,可对比特流进行反量化。
在操作S 1730中,可接收反量化的信号,可从比特流中解码出用于反线性预测的附加信息,并且可使用所述附加信息和编码的残差信号来恢复高时间分辨率信号。
在操作S 1740中,可将从时域解码单元输出的信号和/或来自反量化单元的反量化的信号反变换到时域的音频信号或语音信号。
本总体发明构思还可实现为计算机可读介质上的计算机可读代码。计算机可读介质可包括计算机可读记录介质和计算机可读传输介质。计算机可读记录介质是可将数据存储为其后可由计算机系统读取的程序的任何数据存储装置。所述计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储装置。所述计算机可读记录介质也可分布于联网的计算机系统上,以便所述计算机可读代码以分布方式被存储和执行。计算机可读传输介质可通过载波或信号发送(例如,通过因特网的有线数据传输或无线数据传输)。此外,本总体发明构思所属的领域的程序员可容易解释实现本总体发明构思的功能程序、代码和代码段。
虽然已经示出和描述了本总体发明构思的若干示例实施例,但是本领域的技术人员应该理解,在不脱离本总体发明构思的原理和精神的范围内可对这些示例实施例进行改变,本总体发明构思的范围由权利要求及其等同物限定。
Claims (8)
1.一种用于对音频或语音信号进行解码的方法,所述方法包括:
基于包括在比特流中的编码信息,确定当前帧信号是在频域中被编码还是在时域中被编码;
当确定当前帧信号是在频域中被编码时,对比特流进行无损解码和反量化;
当确定当前帧信号是在时域中被编码时,通过使用反线性预测来重建当前帧信号;
将被解码并被反量化的信号反变换为时域信号。
2.如权利要求1所述的方法,还包括:
使用被反变换的信号产生高频带信号。
3.如权利要求2所述的方法,还包括:
从被反变换的信号产生立体声信号。
4.如权利要求1所述的方法,还包括:
当确定当前帧信号是在频域中被编码时,对被解码并被反量化的信号执行时间噪声整形。
5.一种用于对音频或语音信号进行解码的设备,所述设备包括:
确定单元,基于包括在比特流中的编码信息,确定当前帧信号是在频域中被编码还是在时域中被编码;
频域解码单元,当确定单元确定当前帧信号是在频域中被编码时,对比特流进行无损解码和反量化;
时域解码单元,当确定单元确定当前帧信号是在时域中被编码时,通过使用反线性预测来重建当前帧信号;
反变换单元,将被解码并被反量化的信号反变换为时域信号。
6.如权利要求5所述的设备,还包括:
高频产生单元,使用被反变换的信号产生高频带信号。
7.如权利要求6所述的设备,还包括:
立体声处理单元,从被反变换的信号产生立体声信号。
8.如权利要求5所述的设备,还包括:
时间噪声整形单元,当确定单元确定当前帧信号是在频域中被编码时,对被解码并被反量化的信号执行时间噪声整形。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080068377A KR101756834B1 (ko) | 2008-07-14 | 2008-07-14 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
KR10-2008-0068377 | 2008-07-14 | ||
CN200980135987.5A CN102150202B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980135987.5A Division CN102150202B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105957532A CN105957532A (zh) | 2016-09-21 |
CN105957532B true CN105957532B (zh) | 2020-04-17 |
Family
ID=41505940
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610515415.1A Active CN105957532B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
CN200980135987.5A Active CN102150202B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
CN201610509620.7A Active CN105913851B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980135987.5A Active CN102150202B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
CN201610509620.7A Active CN105913851B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
Country Status (10)
Country | Link |
---|---|
US (3) | US8532982B2 (zh) |
EP (1) | EP2313888A4 (zh) |
JP (1) | JP2011528135A (zh) |
KR (1) | KR101756834B1 (zh) |
CN (3) | CN105957532B (zh) |
BR (1) | BRPI0916449A8 (zh) |
IL (1) | IL210664A (zh) |
MX (1) | MX2011000557A (zh) |
MY (1) | MY154100A (zh) |
WO (1) | WO2010008185A2 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
TWI433137B (zh) * | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
ES2810824T3 (es) | 2010-04-09 | 2021-03-09 | Dolby Int Ab | Sistema decodificador, método de decodificación y programa informático respectivo |
JP6001814B1 (ja) | 2013-08-28 | 2016-10-05 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ハイブリッドの波形符号化およびパラメトリック符号化発話向上 |
CN103473836B (zh) * | 2013-08-30 | 2015-11-25 | 福建星网锐捷通讯股份有限公司 | 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统 |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
CN105957533B (zh) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | 语音压缩方法、语音解压方法及音频编码器、音频解码器 |
US10141009B2 (en) | 2016-06-28 | 2018-11-27 | Pindrop Security, Inc. | System and method for cluster-based audio event detection |
US9824692B1 (en) | 2016-09-12 | 2017-11-21 | Pindrop Security, Inc. | End-to-end speaker recognition using deep neural network |
US10553218B2 (en) | 2016-09-19 | 2020-02-04 | Pindrop Security, Inc. | Dimensionality reduction of baum-welch statistics for speaker recognition |
AU2017327003B2 (en) | 2016-09-19 | 2019-05-23 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
US10325601B2 (en) | 2016-09-19 | 2019-06-18 | Pindrop Security, Inc. | Speaker recognition in the call center |
US10397398B2 (en) | 2017-01-17 | 2019-08-27 | Pindrop Security, Inc. | Authentication using DTMF tones |
CN108768587B (zh) * | 2018-05-11 | 2021-04-27 | Tcl华星光电技术有限公司 | 编码方法、设备及可读存储介质 |
US11355103B2 (en) | 2019-01-28 | 2022-06-07 | Pindrop Security, Inc. | Unsupervised keyword spotting and word discovery for fraud analytics |
WO2020163624A1 (en) | 2019-02-06 | 2020-08-13 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
US11646018B2 (en) | 2019-03-25 | 2023-05-09 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
CN111341330B (zh) * | 2020-02-10 | 2023-07-25 | 科大讯飞股份有限公司 | 音频编解码方法、存取方法及其相关设备及存储装置 |
KR20230003546A (ko) * | 2020-08-28 | 2023-01-06 | 구글 엘엘씨 | 오디오 코덱의 감각 불협화음 및 사운드 정위 큐의 불변성 유지 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101010985A (zh) * | 2004-08-31 | 2007-08-01 | 松下电器产业株式会社 | 立体声信号生成装置及立体声信号生成方法 |
CN101010726A (zh) * | 2004-08-27 | 2007-08-01 | 松下电器产业株式会社 | 音频解码器、方法以及程序 |
CN101136202A (zh) * | 2006-08-29 | 2008-03-05 | 华为技术有限公司 | 音频信号处理系统、方法以及音频信号收发装置 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3158932B2 (ja) | 1995-01-27 | 2001-04-23 | 日本ビクター株式会社 | 信号符号化装置及び信号復号化装置 |
JP3342996B2 (ja) * | 1995-08-21 | 2002-11-11 | 三星電子株式会社 | 多チャネルオーディオ符号化器及び符号化方法 |
JP3522012B2 (ja) | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
US6704705B1 (en) * | 1998-09-04 | 2004-03-09 | Nortel Networks Limited | Perceptual audio coding |
AU754877B2 (en) * | 1998-12-28 | 2002-11-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
JP4907826B2 (ja) * | 2000-02-29 | 2012-04-04 | クゥアルコム・インコーポレイテッド | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP4399185B2 (ja) * | 2002-04-11 | 2010-01-13 | パナソニック株式会社 | 符号化装置および復号化装置 |
CN1308913C (zh) * | 2002-04-11 | 2007-04-04 | 松下电器产业株式会社 | 编码设备、解码设备及其方法 |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
JP2005141121A (ja) * | 2003-11-10 | 2005-06-02 | Matsushita Electric Ind Co Ltd | オーディオ再生装置 |
JP2007528025A (ja) * | 2004-02-17 | 2007-10-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法 |
EP1873753A1 (en) * | 2004-04-01 | 2008-01-02 | Beijing Media Works Co., Ltd | Enhanced audio encoding/decoding device and method |
WO2005096508A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Equipement de codage et de decodage audio ameliore, procede associe |
CN1677490A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR101037931B1 (ko) | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
US7548853B2 (en) | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
CN100561576C (zh) * | 2005-10-25 | 2009-11-18 | 芯晟(北京)科技有限公司 | 一种基于量化信号域的立体声及多声道编解码方法与系统 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR101237413B1 (ko) | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
US7809018B2 (en) * | 2005-12-16 | 2010-10-05 | Coding Technologies Ab | Apparatus for generating and interpreting a data stream with segments having specified entry points |
WO2007068294A1 (en) * | 2005-12-16 | 2007-06-21 | Dolby Sweden Ab | Apparatus for generating and interpreting a data stream having a series of segments using data in subsequent data frames |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
KR101196506B1 (ko) * | 2007-06-11 | 2012-11-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 임펄스형 부분 및 정적 부분을 갖는 오디오 신호를 인코딩하는 오디오 인코더 및 인코딩 방법, 디코더, 디코딩 방법 및 인코딩된 오디오 신호 |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101802907B (zh) * | 2007-09-19 | 2013-11-13 | 爱立信电话股份有限公司 | 多信道音频的联合增强 |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
-
2008
- 2008-07-14 KR KR1020080068377A patent/KR101756834B1/ko active IP Right Grant
-
2009
- 2009-07-14 US US12/502,454 patent/US8532982B2/en active Active
- 2009-07-14 MX MX2011000557A patent/MX2011000557A/es active IP Right Grant
- 2009-07-14 CN CN201610515415.1A patent/CN105957532B/zh active Active
- 2009-07-14 WO PCT/KR2009/003870 patent/WO2010008185A2/en active Application Filing
- 2009-07-14 BR BRPI0916449A patent/BRPI0916449A8/pt not_active Application Discontinuation
- 2009-07-14 MY MYPI2011000202A patent/MY154100A/en unknown
- 2009-07-14 CN CN200980135987.5A patent/CN102150202B/zh active Active
- 2009-07-14 EP EP09798088.2A patent/EP2313888A4/en not_active Withdrawn
- 2009-07-14 CN CN201610509620.7A patent/CN105913851B/zh active Active
- 2009-07-14 JP JP2011518646A patent/JP2011528135A/ja active Pending
-
2011
- 2011-01-13 IL IL210664A patent/IL210664A/en active IP Right Grant
-
2013
- 2013-09-06 US US14/020,006 patent/US9355646B2/en active Active
-
2016
- 2016-05-09 US US15/149,847 patent/US9728196B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101010726A (zh) * | 2004-08-27 | 2007-08-01 | 松下电器产业株式会社 | 音频解码器、方法以及程序 |
CN101010985A (zh) * | 2004-08-31 | 2007-08-01 | 松下电器产业株式会社 | 立体声信号生成装置及立体声信号生成方法 |
CN101136202A (zh) * | 2006-08-29 | 2008-03-05 | 华为技术有限公司 | 音频信号处理系统、方法以及音频信号收发装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2010008185A3 (en) | 2010-05-27 |
CN102150202B (zh) | 2016-08-03 |
BRPI0916449A8 (pt) | 2017-11-28 |
MX2011000557A (es) | 2011-03-15 |
IL210664A0 (en) | 2011-03-31 |
CN105913851A (zh) | 2016-08-31 |
CN105913851B (zh) | 2019-12-24 |
MY154100A (en) | 2015-04-30 |
EP2313888A4 (en) | 2016-08-03 |
US8532982B2 (en) | 2013-09-10 |
US20160254005A1 (en) | 2016-09-01 |
JP2011528135A (ja) | 2011-11-10 |
IL210664A (en) | 2014-07-31 |
EP2313888A2 (en) | 2011-04-27 |
US9728196B2 (en) | 2017-08-08 |
KR101756834B1 (ko) | 2017-07-12 |
US20100010807A1 (en) | 2010-01-14 |
KR20100007651A (ko) | 2010-01-22 |
CN102150202A (zh) | 2011-08-10 |
WO2010008185A2 (en) | 2010-01-21 |
CN105957532A (zh) | 2016-09-21 |
US9355646B2 (en) | 2016-05-31 |
US20140012589A1 (en) | 2014-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105957532B (zh) | 对音频/语音信号进行编码和解码的方法和设备 | |
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
KR101435893B1 (ko) | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 | |
KR101373004B1 (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
KR102749858B1 (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
KR20250036948A (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
WO2009048239A2 (en) | Encoding and decoding method using variable subband analysis and apparatus thereof | |
US9390722B2 (en) | Method and device for quantizing voice signals in a band-selective manner | |
WO2009022193A2 (en) | Devices, methods and computer program products for audio signal coding and decoding | |
KR101847076B1 (ko) | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 | |
US20170206905A1 (en) | Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model | |
KR101449432B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 | |
KR101457897B1 (ko) | 대역폭 확장 부호화 및 복호화 방법 및 장치 | |
KR101455648B1 (ko) | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 | |
Herre et al. | 18. Perceptual Perceptual Audio Coding of Speech Signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |