[go: up one dir, main page]

CN102150204A - 编码和解码语音与音频统合信号的设备 - Google Patents

编码和解码语音与音频统合信号的设备 Download PDF

Info

Publication number
CN102150204A
CN102150204A CN2009801356788A CN200980135678A CN102150204A CN 102150204 A CN102150204 A CN 102150204A CN 2009801356788 A CN2009801356788 A CN 2009801356788A CN 200980135678 A CN200980135678 A CN 200980135678A CN 102150204 A CN102150204 A CN 102150204A
Authority
CN
China
Prior art keywords
signal
audio
input signal
sampling rate
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801356788A
Other languages
English (en)
Other versions
CN102150204B (zh
Inventor
李泰辰
白承权
金珉第
张大永
徐廷一
姜京玉
洪镇佑
朴浩综
朴荣喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Research Institute for Industry Cooperation of Kwangwoon University
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Research Institute for Industry Cooperation of Kwangwoon University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Research Institute for Industry Cooperation of Kwangwoon University filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to CN201310487746.5A priority Critical patent/CN103531203B/zh
Publication of CN102150204A publication Critical patent/CN102150204A/zh
Application granted granted Critical
Publication of CN102150204B publication Critical patent/CN102150204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

本发明提供了一种用于统合地编码语音信号和音频信号的编码设备(100),所述编码设备可包括:输入信号分析器(110),其分析输入信号的特征;立体声编码器(120),当所述输入信号是立体声信号时,其将所述输入信号降混频(down mix)为单声道信号(mono signal),并从提取立体声声音图像信息;频带扩展器,其扩展所述输入信号的频带;采样率转换器(140),其转换采样率;语音信号编码器(150),当所述输入信号是语音特征信号时,其使用语音编码模块将输入信号进行编码;音频信号编码器(160),当所述输入信号是音频特征信号时,其使用音频编码模块将输入信号进行编码;比特流生成器(170),其生成比特流。

Description

编码和解码语音与音频统合信号的设备
技术领域
本发明涉及一种用于统合地编码和解码语音信号与音频信号的设备,更特别是,涉及一种方法和设备,其可包括针对语音信号和音频信号以不同的结构操作的编码模块和解码模块,并可根据输入信号的特征有效地选择内部模块,从而有效地编码语音信号和音频信号。
背景技术
语音信号和音频信号有不同的特征。因此,以往使用语音信号和音频信号的独特特征来独立研究语音信号的语音编解码器和音频信号的音频编解码器。近来广泛使用中的语音编解码器,如自适应多速率宽带加AMR-WB+(Adaptive Multi-Rate Wideband Plus)编解码器,具有代码激励线性预测CELP(Code Excitation Linear Prediction)结构,并可根据语音的语音模型基于线性预测编码LPC(Linear Predictive Code)提取和量化语音参数。广泛使用中的音频编解码器,如高效高级编码版本2HE-AAC V2(High-EfficiencyAdvanced Coding version 2)编解码器,可考虑人类在频域的声学特征在心理声学方面最佳量化频率系数。
因此,需要一种编解码器,其可统合音频信号编码器和语音信号的编码器,并可根据信号特征和比特率选择合适的编码体系,从而更有效地执行编码和解码。
发明内容
技术目的
本发明的一个方面,提供一种用于统合地编码和解码语音信号与音频信号的设备与方法,其可根据输入信号的特征有效地选择内部模块,从而在不同的比特率针对语音信号和音频信号提供完美的声音质量。
本发明的另一个方面,还提供一种统合地编码和解码语音信号和音频信号的设备和方法,其可在转换采样率之前扩展频带,从而将频带扩展为更宽的带。
技术方案
跟据本发明的一个方面,提供了一种用于统合地编码语音信号和音频信号的编码设备,所述编码设备包括:输入信号分析器,其分析输入信号的特征;立体声编码器,当所述输入信号是立体声信号时,其将所述输入信号降混频(down mix降混频)为单声道信号(mono单声道signal),并从所述输入信号中提取立体声声音图像信息;频带扩展器,其扩展所述输入信号的频带;采样率转换器,其针对频带扩展器的输出信号来转换采样率;语音信号编码器,当所述输入信号是语音特征信号时,其使用语音编码模块将输入信号进行编码;音频信号编码器,当所述输入信号是音频特征信号时,其使用音频编码模块将输入信号进行编码;比特流生成器,其使用语音信号编码器的输出信号和音频信号编码器的输出信号,来生成比特流。
在这种情况下,所述输入信号分析器,可使用输入信号的过零率ZCR(Zero Crossing Rate)、相关性、帧单位的能量中的至少一个来分析输入信号。
此外,所述立体声声音图像信息可包括:左声道和右声道间的相关性与左声道和右声道间的级别差异中的至少一个。
此外,所述频带扩展器,可在采样率的转换之前将输入信号扩展至高频带信号。
此外,所述采样率转换器,可将输入信号的采样率转换为语音信号编码器或音频信号编码器所要求的采样率。
此外,所述采样率转换器可包括:第一降采样器(down sampler),其将输入信号降采样(down sample)1/2;和第二降采样器,其将第一降采样器的输出信号降采样1/2。
此外,当输入信号在语音特征信号和音频特征信号之间变化时,比特流生成器可在比特流中存储与用于桢单位改变的补偿相关的信息。
此外,所述与用于桢单位改变的补偿相关的信息可包括:时间/频率转换体系与时间/频率转换大小中的至少一个。
根据本发明的另一个方面,提供了一种用于统合地解码语音信号和音频信号的解码设备,所述解码设备包括:比特流分析器,其分析输入比特流信号;语音信号解码器,当所述比特流信号与语音特征信号相关时,其使用语音解码模块将比特流信号进行解码;音频信号解码器,当所述比特流信号与音频特征信号相关时,其使用音频解码模块将比特流信号进行解码;信号补偿单元,当语音特征信号与音频特征信号之间的转换被执行时,其补偿输入比特流信号;采样率转换器,其转换比特流信号的采样率;频带扩展器,其使用解码的低频带信号生成高频带信号;立体声解码器,其使用立体声扩展参数生成立体声信号。
技术效果
根据示例性实施例,提供一种用于统合地编码和解码语音信号与音频信号的设备与方法,其可根据输入信号的特征有效地选择内部模块,从而在不同的比特率针对语音信号和音频信号提供完美的声音质量。
根据示例性实施例,提供一种统合地编码和解码语音信号和音频信号的设备和方法,其可在转换采样率之前扩展频带,从而将频带扩展为更宽的带。
附图说明
图1是示出根据本发明一个实施例的用于统合地编码语音信号和音频信号的编码设备的框图;
图2是示出图1的采样率转换器的一个例子的示图;
图3是示出根据本发明一个实施例的频带扩展器的开始频带(startfrequency band)和结束频带(end frequency band)的表;
图4是示出根据本发明一个实施例的基于比特率的每个模块的操作的表;
图5是示出根据本发明一个实施例的用于统合地解码语音信号和音频信号的解码设备的框图。
具体实施方式
现在将参照附图对本发明的实施例进行详细描述,所述实施例的示例在附图中被示出,其中相同的参考数字始终表示相同的元素。下面将参照数字描述实施例以对本发明进行说明。
图1是示出根据本发明一个实施例的用于统合地编码语音信号和音频信号的编码设备100的框图。
参照图1,编码设备100可包括输入信号分析器110、立体声编码器120、频带扩展器130、采样率转换器140、语音信号编码器150、音频信号编码器160、和比特流生成器170。
输入信号分析器110可分析输入信号的特征。具体来说,输入信号分析器110可分析输入信号的特征来把输入信号分离成语音特征信号和音频特征信号。在这种情况下,输入信号分析器110可使用输入信号的过零率ZCR(ZeroCrossing Rate)、相关性、帧单位的能量中的至少一个来分析输入信号。
立体声编码器120可将所述输入信号降混频(down mix降混频)为单声道信号(mono单声道signal),并从所述输入信号中提取立体声声音图像信息。所述立体声声音图像信息可包括:左声道与右声道间的相关性和左声道与右声道间的级别差异中的至少一个。
频带扩展器130可扩展所述输入信号的频带。所述频带扩展器130,可在采样率的转换之前将输入信号扩展至高频带信号。下文中,将参照图3的细节进一步描述频带扩展器130的操作。
图3是示出根据本发明一个实施例的频带扩展器130的开始频带和结束频带的表300。
参照表300,当单声道降混频的信号是音频特征信号时,频带扩展器130可根据比特率来提取信息以生成高频带信号。例如,当输入音频信号的采样率是48kHz时,语音特征信号的开始频带可固定在6kHz,并可将与音频特征信号的停止频带相同的值用于语音特征信号的停止频带。在这里,语音特征信号的开始频带,可根据在语音特征信号编码模块中使用的编码模块的设置具有各种值。此外,在频带扩展器中使用的停止频带可根据输入信号或设置比特率的采样率被设置为各种值。频带扩展器130可使用音调、块单位的能量值等信息。此外,与频带扩展相关的信息,随特征信号是用于语音还是用于音频而不同。当执行语音特征信号和音频特征信号之间的转换时,与频带扩展相关的信息可存储在比特流中。
再次参照图1,采样率转换器140可转换输入信号的采样率。所述过程可对应编码输入信号之前将输入信号预处理的过程。因此,要根据输入比特率改变核心频带(core band)的频带,采样率转换器140可将输入音频信号的采样率转换。在这种情况下,采样率转换可在扩展频带之后执行。通过这一点,频带可进一步被扩展到更宽的频带中,而不是被固定在在核心频带中使用的采样率。
下文中,将参照图2的细节进一步对采样率转换器140进行说明。
图2是示出图1的采样率转换器140的一个例子的示图。
第一降采样器210可将输入信号降采样(down sample)1/2。例如,当音频编码模块是基于高级音频编码AAC(advanced audio coding(AAC)-based)的编码模块时,所述第一降采样器210执行1/2降采样。
第二降采样器220可将第一降采样器210的输出信号降采样1/2。例如,当语音编码模块是基于自适应多速率宽带加AMR-WB+(Adaptive Multi-RateWideband Plus)的编码模块时,所述第二降采样器220执行所述第一降采样器210的输出信号的1/2降采样。
因此,当音频信号编码器160使用基于AAC的编码模块时,采样率转换器140可生成被1/2降采样的信号。当语音信号编码器150使用基于MR-WB+的编码模块时,采样率转换器140可执行1/4降采样。因此,采样率转换器140可在语音信号编码器150和音频信号编码器160之前被提供。通过这样,当语音信号编码模块处理的采样率不同于音频信号编码模块处理的采样率时,采样率可被采样率转换器140初步处理,随后被输入进语音信号编码模块或音频信号编码模块。
此外,采样率转换器140可将输入信号的采样率转换为语音信号编码器150或音频信号编码器160要求的采样率。
再次参照图1,当输入信号为语音特征信号时,语音信号编码器150可使用语音编码模块编码输入信号。当输入信号是语音特征信号时,语音特征信号编码模块可执行频带扩展未被执行的核心频带的编码。语音信号编码器150可使用基于CELP的语音编码模块。
当输入信号是音频特征信号时,音频信号编码器160可使用音频编码模块将输入信号进行编码。当输入信号是音频特征信号时,音频特征信号编码模块可执行频带扩展未被执行的核心频带的编码。
音频信号编码器160可基于时间/频率的音频编码模块。
比特流生成器170可使用语音信号编码器150的输出信号和音频信号编码器160的输出信号来生成比特流。当输入信号在语音特征信号和音频特征信号之间变化时,比特流生成器170在比特流中存储与用于桢单位改变的补偿相关的信息。所述用于桢单位改变的补偿相关的信息可包括:时间/频率转换体系与时间/频率转换大小中的至少一个。此外,解码器可使用与帧单位变化补偿相关的信息,执行语音特征信号的帧和音频特征信号的帧之间的转换。
下文中,将参照图4的细节,对根据目标比特率统合地编码语音信号和音频信号的编码设备100的操作进行描述。
图4是示出根据本发明一个实施例的基于比特率的每个模块的操作的表。
参照该表,当输入信号是单声道信号时,所有的立体声编码模块可被设置为关闭。当比特率被设置为12kbps或16kbps时,音频特征信号编码模块可被设置为关闭。将音频特征信号编码模块设置为关闭的理由在于,使用基于CELP的音频编码模块编码音频特征信号,与使用音频编码模块的编码音频特征信号相比,呈现增强的声音质量。因此,当比特率被设置在12kbps或16kbps时,可在设置音频编码模块、立体声编码模块和输入信号分析模块为关闭之后,只使用编码模块和频带扩展模块将输入单声道信号编码。
当比特率被设置在20kbps、24kbps或32kbps时,语音信号编码模块和音频信号编码模块可根据输入信号是语音特征信号还是音频特征信号被交替使用。具体来说,当作为输入信号分析模块的分析结果,输入信号是语音特征信号时,可使用语音编码模块将输入信号编码。当输入信号是音频特征信号时,输入信号可使用音频编码模块进行编码。
当比特率被设置在64Kbps时,由于足够数量的比特可用,所以基于时间/频率转换的音频编码模块的性能可得到加强。因此,当比特率被设置在64kbps时,可在将语音编码模块和输入信号分析模块设置为关闭之后,同时使用音频编码模块和频带扩展模块来编码输入信号。
当输入信号是立体声信号时,立体声编码模块可被进行操作。当在12kbps、16kbps或20kbps的比特率编码输入信号时,可在把音频编码模块和输入信号分析模块设置为关之后,使用立体声编码模块、频带扩展模块、语音编码模块来编码输入信号。立体声编码模块一般可使用小于4kbps的比特率。因此,当在20Kbps编码立体声输入信号时,需要将被降混频至16kbps的单声道信号进行编码。在该频带中,语音编码模块与音频编码模块相比呈现进一步增强的性能。因此,在把输入信号分析模块设置为关之后,可使用语音编码模块执行所有输入信号的编码。
当在24kbps或32kbps比特率编码输入立体声信号时,可根据输入信号分析模块的分析结果,使用语音编码模块来编码语音特征信号并使用音频编码模块来编码音频特征信号。
当在64kbps的比特率编码立体声信号时,由于大量比特可用,从而可只使用音频特征信号编码模块来编码输入信号。
例如,当使用基于AMR-WB+的语音编码器和基于高效高级编码版本2HE-AAC V2的音频编码器来构建编码设备100时,由于使用AMR-WB+的立体声模块和频带扩展模块的性能不完美,所以可使用HE-AAC V2的参数立体声P(Parametric Stereo)S模块和频带复制SBR(Spectral Band Replication)模块来执行立体声信号和频带扩展的处理。
由于基于CELP的AMR-WB+对12kbps或16kbps的单声道信号性能优良,所以可利用使用AMR-WB+的代数代码激励线性预测ACELP(AlgebraicCode Excited Linear Prediction)/变换编码激励TCX(Transform Coded Excitation)模块来进行核心频带的编码。HE-ACC V2的SBR模块可被利用于频带扩展。
当作为在20kbps,24kbps或32kbps输入信号的分析结果,输入信号是语音特征信号时,可利用使用AMR-WB+的ACEP模块和TCX模块来编码核心频带。当输入信号是音频特征信号时,可利用HE-AAC V2的AAC模式来编码核心频带,并利用HE-AAC V2的SBR执行频带扩展。
当比特率被设置在64kbps时,可仅利用HE-AAC V2的AAC模块来编码核心频带。
可利用HE-AAC V2的PS模块进行立体声编码用于立体声输入。此外,可根据模式,通过选择性地利用ARM-WB+的TCX模块和ACELP模块及HE-AAC V2的AAC模块来编码核心频带。
如上所述,可基于输入信号的特征,通过有效选择内部模块,针对不同比特率的语音信号和音频信号提供完美的声音质量。此外,通过在转换采样率之前扩展频带,频带可被进一步扩展至更宽的频带。
图5是示出根据本发明一个实施例的用于统合地解码语音信号和音频信号的解码设备500的框图。
参照图5,解码器500可包括:比特流分析器510、语音信号解码器520、音频信号解码器530、信号补偿单元540、采样率转换器550、频带扩展器560、立体声解码器570。
比特流分析器510可分析输入比特流信号。
当所述比特流信号与语音特征信号相关时,语音信号解码器520使用语音解码模块将比特流信号进行解码。
当所述比特流信号与音频特征信号相关时,音频信号解码器530使用音频解码模块将比特流信号进行解码。
当语音特征信号与音频特征信号之间的转换被执行时,信号补偿单元540补偿输入比特流信号。具体来说,当语音特征信号与音频特征信号之间的转换被执行时,信号补偿单元540可使用每个特征的转换信息顺利处理转换。
采样率转换器550可转换比特流信号的采样率。由此,采样率转换器550可将在核心频带中被转换并被使用的采样率,重新转换为原始采样率,由此来生成要在频带扩展模块或立体声编码模块中使用的信号。具体来说,采样率转换器550可通过将在核心频带中被使用的采样率重新转换成之前的采样率,来生成要在频带扩展模块或立体声编码模块中使用的信号。
频带扩展器560可使用解码的低频带信号生成高频带信号。
立体声解码器570可使用立体声扩展参数生成立体声信号。
虽然本发明一些实施例已被展示和描述,但是本发明不仅限于所描述的实施例。相反,本技术领域的技术人员应当明白,在不脱离本发明的原则和精神范围内,可对实施例进行改变,其范围由权利要求书及其等同物定义。

Claims (14)

1.一种用于统合地编码语音信号和音频信号的编码设备,所述编码设备包括:
输入信号分析器,其分析输入信号的特征;
立体声编码器,当所述输入信号是立体声信号时,其将所述输入信号降混频为单声道信号,并从所述输入信号中提取立体声声音图像信息;
频带扩展器,其扩展所述输入信号的频带;
采样率转换器,其针对频带扩展器的输出信号来转换采样率;
语音信号编码器,当所述输入信号是语音特征信号时,其使用语音编码模块将输入信号进行编码;
音频信号编码器,当所述输入信号是音频特征信号时,其使用音频编码模块将输入信号进行编码;
比特流生成器,其使用语音信号编码器的输出信号和音频信号编码器的输出信号,来生成比特流。
2.如权利要求1所述的编码设备,其中,所述输入信号分析器,使用输入信号的过零率ZCR、相关性、帧单位的能量中的至少一个来分析输入信号。
3.如权利要求1所述的编码设备,其中,所述立体声声音图像信息包括:左声道与右声道间的相关性和左声道与右声道间的级别差异中的至少一个。
4.如权利要求1所述的编码设备,其中,所述频带扩展器,在采样率的转换之前将输入信号扩展至高频带信号。
5.如权利要求1所述的编码设备,其中,所述采样率转换器,将输入信号的采样率转换为语音信号编码器或音频信号编码器所要求的采样率。
6.如权利要求1所述的编码设备,其中,所述采样率转换器包括:
第一降采样器,其将输入信号降采样1/2;和
第二降采样器,其将第一降采样器的输出信号降采样1/2。
7.如权利要求6所述的编码设备,其中,当所述音频编码模块是基于高级音频编码AAC的编码模块时,所述第一降采样器执行1/2降采样。
8.如权利要求6所述的编码设备,其中,当所述语音编码模块是基于自适应多速率宽带加AMR-WB+的编码模块时,所述第二降采样器执行所述第一降采样器的输出信号的1/2降采样。
9.如权利要求1所述的编码设备,其中,所述语音信号编码器使用基于代码激励线性预测CELP的语音编码模块。
10.如权利要求1所述的编码设备,其中,所述音频信号编码使用基于时间/频率的音频编码模块。
11.如权利要求1所述的编码装置,其中,当输入信号在语音特征信号和音频特征信号之间变化时,比特流生成器在比特流中存储与用于桢单位改变的补偿相关的信息。
12.如权利要求11所述的编码设备,其中,所述用于桢单位改变的补偿相关的信息包括:时间/频率转换体系与时间/频率转换大小中的至少一个。
13.一种用于统合地解码语音信号和音频信号的解码设备,所述解码设备包括:
比特流分析器,其分析输入比特流信号;
语音信号解码器,当所述比特流信号与语音特征信号相关时,其使用语音解码模块将比特流信号进行解码;
音频信号解码器,当所述比特流信号与音频特征信号相关时,其使用音频解码模块将比特流信号进行解码;
信号补偿单元,当语音特征信号与音频特征信号之间的转换被执行时,其补偿输入比特流信号;
采样率转换器,其转换比特流信号的采样率;
频带扩展器,其使用解码的低频带信号生成高频带信号;
立体声解码器,其使用立体声扩展参数生成立体声信号。
14.如权利要求13所述的解码设备,其中,所述采样率转换器,将在核心频带中被转换并被使用的采样率,重新转换为之前的采样率。
CN200980135678.8A 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的设备 Active CN102150204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310487746.5A CN103531203B (zh) 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20080068369 2008-07-14
KR10-2008-0068369 2008-07-14
KR10-2008-0134297 2008-12-26
KR20080134297 2008-12-26
KR1020090061608A KR101381513B1 (ko) 2008-07-14 2009-07-07 음성/음악 통합 신호의 부호화/복호화 장치
KR10-2009-0061608 2009-07-07
PCT/KR2009/003855 WO2010008176A1 (ko) 2008-07-14 2009-07-14 음성/음악 통합 신호의 부호화/복호화 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310487746.5A Division CN103531203B (zh) 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的方法

Publications (2)

Publication Number Publication Date
CN102150204A true CN102150204A (zh) 2011-08-10
CN102150204B CN102150204B (zh) 2015-03-11

Family

ID=41816651

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200980135678.8A Active CN102150204B (zh) 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的设备
CN201310487746.5A Active CN103531203B (zh) 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310487746.5A Active CN103531203B (zh) 2008-07-14 2009-07-14 编码和解码语音与音频统合信号的方法

Country Status (6)

Country Link
US (7) US8903720B2 (zh)
EP (2) EP2302624B1 (zh)
JP (3) JP2011527032A (zh)
KR (2) KR101381513B1 (zh)
CN (2) CN102150204B (zh)
WO (1) WO2010008176A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023577A (zh) * 2014-04-17 2015-11-04 腾讯科技(深圳)有限公司 混音处理方法、装置和系统
WO2018121386A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 立体声编码方法及立体声编码器
CN109863556A (zh) * 2016-08-23 2019-06-07 弗劳恩霍夫应用研究促进协会 用于使用补偿值来对音频信号进行编码的装置和方法
CN112599138A (zh) * 2020-12-08 2021-04-02 北京百瑞互联技术有限公司 一种lc3音频编码器的多pcm信号编码方法、装置及介质
CN113259059A (zh) * 2014-04-21 2021-08-13 三星电子株式会社 用于在无线通信系统中发射和接收语音数据的装置和方法
US11887614B2 (en) 2014-04-21 2024-01-30 Samsung Electronics Co., Ltd. Device and method for transmitting and receiving voice data in wireless communication system

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
JP5565405B2 (ja) * 2011-12-21 2014-08-06 ヤマハ株式会社 音響処理装置および音響処理方法
JP2014074782A (ja) * 2012-10-03 2014-04-24 Sony Corp 音声送信装置、音声送信方法、音声受信装置および音声受信方法
US9478224B2 (en) 2013-04-05 2016-10-25 Dolby International Ab Audio processing system
WO2015031505A1 (en) * 2013-08-28 2015-03-05 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
EP3561809B1 (en) 2013-09-12 2023-11-22 Dolby International AB Method for decoding and decoder.
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
ES2702455T3 (es) 2014-02-24 2019-03-01 Samsung Electronics Co Ltd Procedimiento y dispositivo de clasificación de señales, y procedimiento y dispositivo de codificación de audio que usan los mismos
CN107452391B (zh) * 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
WO2016108655A1 (ko) * 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
MX2020002972A (es) 2017-09-20 2020-07-22 Voiceage Corp Metodo y dispositivo para asignar un presupuesto de bits entre subtramas en un codec celp.
GB2607505A (en) * 2020-02-20 2022-12-07 Cirrus Logic Int Semiconductor Ltd Audio system with digital microphone
CN112509591B (zh) * 2020-12-04 2024-05-14 北京百瑞互联技术股份有限公司 一种音频编解码方法及系统
CN116325796A (zh) * 2020-12-07 2023-06-23 株式会社电装天 音频信号处理装置和方法
KR20220117019A (ko) 2021-02-16 2022-08-23 한국전자통신연구원 학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기
US11651778B2 (en) 2021-05-24 2023-05-16 Electronics And Telecommunications Research Institute Methods of encoding and decoding audio signal, and encoder and decoder for performing the methods
CN117907166B (zh) * 2024-03-19 2024-06-21 安徽省交通规划设计研究总院股份有限公司 基于声音处理的无砂混凝土集料粒径确定方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
JPH0738437A (ja) * 1993-07-19 1995-02-07 Sharp Corp コーデック装置
JPH0897726A (ja) 1994-09-28 1996-04-12 Victor Co Of Japan Ltd サブバンド帯域分割/合成方法およびその装置
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JP3017715B2 (ja) * 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
JP3211762B2 (ja) * 1997-12-12 2001-09-25 日本電気株式会社 音声及び音楽符号化方式
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
JP3327240B2 (ja) 1999-02-10 2002-09-24 日本電気株式会社 画像・音声符号化装置
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
CN1209744C (zh) * 2001-11-02 2005-07-06 松下电器产业株式会社 编码装置和解码装置
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
JP2005099243A (ja) 2003-09-24 2005-04-14 Konica Minolta Medical & Graphic Inc 銀塩光熱写真ドライイメージング材料及び画像形成方法
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
KR100614496B1 (ko) 2003-11-13 2006-08-22 한국전자통신연구원 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
ATE378677T1 (de) * 2004-03-12 2007-11-15 Nokia Corp Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
CN1947407A (zh) 2004-04-09 2007-04-11 日本电气株式会社 音频通信方法和装置
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JP2006325162A (ja) 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR20080097178A (ko) * 2006-01-18 2008-11-04 연세대학교 산학협력단 부호화/복호화 장치 및 방법
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
KR20070077652A (ko) 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
KR101393298B1 (ko) 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US20080114608A1 (en) * 2006-11-13 2008-05-15 Rene Bastien System and method for rating performance
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) * 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
GB0703795D0 (en) * 2007-02-27 2007-04-04 Sepura Ltd Speech encoding and decoding in communications systems
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US8566107B2 (en) * 2007-10-15 2013-10-22 Lg Electronics Inc. Multi-mode method and an apparatus for processing a signal
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
KR101381513B1 (ko) * 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023577A (zh) * 2014-04-17 2015-11-04 腾讯科技(深圳)有限公司 混音处理方法、装置和系统
CN105023577B (zh) * 2014-04-17 2019-07-05 腾讯科技(深圳)有限公司 混音处理方法、装置和系统
CN113259059B (zh) * 2014-04-21 2024-02-09 三星电子株式会社 用于在无线通信系统中发射和接收语音数据的装置和方法
US11887614B2 (en) 2014-04-21 2024-01-30 Samsung Electronics Co., Ltd. Device and method for transmitting and receiving voice data in wireless communication system
CN113259059A (zh) * 2014-04-21 2021-08-13 三星电子株式会社 用于在无线通信系统中发射和接收语音数据的装置和方法
US11935549B2 (en) 2016-08-23 2024-03-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding an audio signal using an output interface for outputting a parameter calculated from a compensation value
CN109863556A (zh) * 2016-08-23 2019-06-07 弗劳恩霍夫应用研究促进协会 用于使用补偿值来对音频信号进行编码的装置和方法
CN109863556B (zh) * 2016-08-23 2023-09-26 弗劳恩霍夫应用研究促进协会 用于使用补偿值来对音频信号进行编码的装置和方法
US11043225B2 (en) 2016-12-30 2021-06-22 Huawei Technologies Co., Ltd. Stereo encoding method and stereo encoder
US11527253B2 (en) 2016-12-30 2022-12-13 Huawei Technologies Co., Ltd. Stereo encoding method and stereo encoder
US10714102B2 (en) 2016-12-30 2020-07-14 Huawei Technologies Co., Ltd. Stereo encoding method and stereo encoder
US11790924B2 (en) 2016-12-30 2023-10-17 Huawei Technologies Co., Ltd. Stereo encoding method and stereo encoder
CN108269577B (zh) * 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
CN108269577A (zh) * 2016-12-30 2018-07-10 华为技术有限公司 立体声编码方法及立体声编码器
WO2018121386A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 立体声编码方法及立体声编码器
US12087312B2 (en) 2016-12-30 2024-09-10 Huawei Technologies Co., Ltd. Stereo encoding method and stereo encoder
CN112599138A (zh) * 2020-12-08 2021-04-02 北京百瑞互联技术有限公司 一种lc3音频编码器的多pcm信号编码方法、装置及介质
CN112599138B (zh) * 2020-12-08 2024-05-24 北京百瑞互联技术股份有限公司 一种lc3音频编码器的多pcm信号编码方法、装置及介质

Also Published As

Publication number Publication date
EP2302624A4 (en) 2012-10-31
JP2011527032A (ja) 2011-10-20
KR20100007739A (ko) 2010-01-22
US20150095023A1 (en) 2015-04-02
JP2013232007A (ja) 2013-11-14
US9818411B2 (en) 2017-11-14
JP2014139674A (ja) 2014-07-31
WO2010008176A1 (ko) 2010-01-21
US8903720B2 (en) 2014-12-02
US20180068667A1 (en) 2018-03-08
EP3493204A1 (en) 2019-06-05
US20110119055A1 (en) 2011-05-19
KR101565634B1 (ko) 2015-11-04
EP3493204B1 (en) 2023-11-01
US20250118310A1 (en) 2025-04-10
US20200349958A1 (en) 2020-11-05
CN103531203B (zh) 2018-04-20
CN102150204B (zh) 2015-03-11
US12205599B2 (en) 2025-01-21
US11705137B2 (en) 2023-07-18
KR101381513B1 (ko) 2014-04-07
JP6067601B2 (ja) 2017-01-25
US10403293B2 (en) 2019-09-03
US20240119948A1 (en) 2024-04-11
EP2302624B1 (en) 2018-12-26
EP2302624A1 (en) 2011-03-30
US10714103B2 (en) 2020-07-14
US20190385621A1 (en) 2019-12-19
CN103531203A (zh) 2014-01-22
KR20120089222A (ko) 2012-08-09

Similar Documents

Publication Publication Date Title
US12205599B2 (en) Apparatus for encoding and decoding of integrated speech and audio
JP5325293B2 (ja) 符号化されたオーディオ信号を復号化するための装置および方法
US8321210B2 (en) Audio encoding/decoding scheme having a switchable bypass
CN102113051B (zh) 音频编码器、解码器以及音频信号的编码、解码方法
CN102150024B (zh) 编码和解码统合的语音与音频信号的设备与方法
CN103548080B (zh) 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
MX2011000383A (es) Esquema de codificacion/decodificacion de audio a baja tasa de bits con pre-procesamiento comun.
CN102150205A (zh) 用于编码和解码统合的语音与音频的设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant