[go: up one dir, main page]

CN111477245A - 语音信号解码装置和语音信号编码装置 - Google Patents

语音信号解码装置和语音信号编码装置 Download PDF

Info

Publication number
CN111477245A
CN111477245A CN202010063428.6A CN202010063428A CN111477245A CN 111477245 A CN111477245 A CN 111477245A CN 202010063428 A CN202010063428 A CN 202010063428A CN 111477245 A CN111477245 A CN 111477245A
Authority
CN
China
Prior art keywords
frequency
spectrum
harmonic
unit
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010063428.6A
Other languages
English (en)
Other versions
CN111477245B (zh
Inventor
S.纳吉塞蒂
刘宗宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Institute For Applied Research Promotion
Original Assignee
Fraunhofer Institute For Applied Research Promotion
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Institute For Applied Research Promotion filed Critical Fraunhofer Institute For Applied Research Promotion
Priority to CN202010063428.6A priority Critical patent/CN111477245B/zh
Publication of CN111477245A publication Critical patent/CN111477245A/zh
Application granted granted Critical
Publication of CN111477245B publication Critical patent/CN111477245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

对于具有高次谐波的谐波结构的输入信号,以低比特率更高效地进行扩频,以获得更好的声音质量。本发明被引入对语音信号的编码和解码进行扩频的装置。在本发明中,新的扩频编码确定与输入信号的高频带信号之间的相关性最高的低频频谱部分,通过其能量调整来复制高频频谱,基于从合成低频频谱所估计的高次谐波频率,调整复制出的高频频谱的频谱峰值位置,从而维持低频频谱和复制出的高频频谱之间的谐波关系。

Description

语音信号解码装置和语音信号编码装置
本申请为以下专利申请的分案申请:申请日为2014年06月10日,申请号为201480031440.1,发明名称为“进行语音信号的频带扩展的装置及方法”。
技术领域
本发明涉及语音信号处理,特别涉及用于语音信号的带宽扩展的语音信号编码及解码处理。
背景技术
在通信中,为了更高效地使用网络资源,在音频编解码器中导入了以下方法,即在主观性质量所能够允许的范围内,以低比特率压缩语音信号。由此,在对语音信号进行编码时,需要提高压缩效率来克服比特率的限制。
BWE(bandwidth extension:带宽扩展)是为了高效地以低比特率压缩WB(wideband:宽带)或SWB(super-wideband:超宽带)的语音信号而广泛用于语音信号编码的技术。编码中的BWE使用解码后的低频带信号,以参数方式表达高频带信号。即,BWE搜索并确定语音信号的低频带信号中的与高频带信号的子带类似的部分,对确定该类似部分的参数进行编码并发送该参数,接收侧使用低频带信号能够重新合成高频带信号。利用低频带信号的类似部分而不直接对高频带信号进行编码,由此能够减少传输的参数信息量,从而能够提高压缩效率。
作为利用了BWE功能的语音信号编解码器之一,有G.718-SWB。G.718-SWB的适用对象为VoIP装置、视频会议设备、电话会议设备以及便携电话。
G.718-SWB的结构表示在图1和图2中(例如参照非专利文献1)。
在图1所示的编码装置侧,以32kHz被采样到的语音信号(以下称为输入信号),首先以16kHz被下采样(101)。由G.718核心编码单元对下采样后的信号进行编码(102)。在MDCT区域中进行SWB频带扩展。32kHz输入信号在MDCT区域中被转换(103),并经由单音性估计单元受到处理(104)。基于输入信号的估计出的单音性(105),将遗传(generic)模式(106)或正弦波(sinusoidal)模式(108)用于SWB的第一层编码。使用附加正弦波(additional sinusoid)对更高的SWB层进行编码(107及109)。
遗传模式用于输入帧的信号被视为非单音的情况。在遗传模式下,由G.718核心编码单元编码后的WB信号的MDCT系数(频谱)被用于SWB MDCT系数(频谱)的编码。SWB频带(7-14kHz)被分割为若干个子带,从被编码的标准化后的WB MDCT系数中,对于所有子带搜索相关性最高的部分。接着,对相关性最高的部分的增益进行比例计算,以能够重现SWB的子带的振幅级别(level),获得SWB信号的高频分量的参数表示(参数表达)。
正弦波模式编码用于被分类为单音的帧。在正弦波模式下,将正弦波分量的有限集合添加至SWB频谱中,由此生成SWB信号。
在图2所示的解码装置侧,G.718核心编解码器以16kHz采样率对WB信号进行解码(201)。在经过后处理之后(202),WB信号以32kHz采样率被上采样(203)。通过SWB频带扩展来重构SWB频率分量。SWB频带扩展主要在MDCT区域中进行。遗传模式(204)及正弦波模式(205)用于SWB的第一层的解码。使用附加正弦波模式对更高的SWB层进行解码(206和207)。重构后的SWB MDCT系数被转换到时域(208),在后处理(209)之后,与由G.718核心解码单元解码后的WB信号相加,重构时域的SWB输出信号。
现有技术文献
非专利文献
非专利文献1:ITU-T Recommendation G.718Amendment 2,New Annex B onsuperwideband scalable extension for ITU-T G.718and corrections to main bodyfixed-point C-code and description text,March 2010.
发明内容
发明要解决的问题
如G.718-SWB的结构所示,通过正弦波模式或遗传模式中的任一种模式进行输入信号的SWB频带扩展。
例如对于遗传编码的机制,通过从WB频谱中搜索相关性最高的部分来生成(获得)高频分量。通常,该方法类型特别在对于具有高次谐波的信号的性能方面存在问题。该方法完全未维持低频带的高次谐波分量(单音分量)和复制出的高频带的单音分量之间的谐波(高次谐波)关系。这成为致使听觉质量变差的不明确的频谱的原因。
因此,为了抑制由不明确的频谱或复制出的高频带信号的频谱(高频频谱)中的混乱生成的听觉噪音(或伪差),较为理想的是,维持低频带信号的频谱(低频频谱)和高频频谱之间的谐波关系。
为了解决该问题,G.718-SWB的结构包括正弦波模式。正弦波模式使用正弦波对重要的单音分量进行编码,因此维持了良好的谐波结构。然而,存在以下问题,即若根据人工的单音信号简单地对SWB分量进行编码,则作为结果所获得的声音质量未必足够好。
解决问题的方案
本发明的目的在于改善上述遗传模式所拥有的对于具有高次谐波(谐波)的信号的编码性能,本发明提供用于维持频谱的微细(fine)结构,并且维持低频频谱与复制出的高频频谱之间的单音分量的谐波结构的高效方法。首先,通过从WB频谱来估计高次谐波频率的值,由此,获得低频频谱的单音分量和高频频谱的单音分量之间的关系。其次,对在编码装置侧编码的低频频谱进行解码,根据索引信息,对与高频频谱的子带之间的相关性最高的部分进行能量级别调整之后,将其复制到高频带中,由此复制高频频谱。基于估计出的高次谐波频率的值,确定或调整复制出的高频频谱中的单音分量的频率。
低频频谱的单音分量和复制出的高频频谱的单音分量之间的谐波关系,仅在高次谐波频率的估计为准确的情况下得到维持。因此,为了提高估计精度,在估计高次谐波频率之前,对构成单音分量的频谱峰值进行修正。
发明的效果
根据本发明,特别地对于具有谐波结构的输入信号,能够准确地复制通过频带扩展所重构的高频频谱中的单音分量,从而能够以低比特率高效地获得良好的声音质量。
附图说明
图1是表示G.718-SWB编码装置的结构的图。
图2是表示G.718-SWB解码装置的结构的图。
图3是表示本发明实施方式1的编码装置的结构的方框图。
图4是表示本发明实施方式1的解码装置的结构的方框图。
图5是表示频谱峰值检测的修正方法的图。
图6是表示高次谐波频率调整方法的一例的图。
图7是表示高次谐波频率调整方法的其他例子的图。
图8是表示本发明实施方式2的编码装置的结构的方框图。
图9是表示本发明实施方式2的解码装置的结构的方框图。
图10是表示本发明实施方式3的编码装置的结构的方框图。
图11是表示本发明实施方式3的解码装置的结构的方框图。
图12是表示本发明实施方式4的解码装置的结构的方框图。
图13是表示对于合成出的低频频谱的高次谐波频率调整方法的一例的图。
图14是表示对合成出的低频频谱注入缺失的高次谐波的近似方法的一例的图。
具体实施方式
使用图3~图14将本发明的主要原理记载于该部分。本领域技术人员能够在不脱离本发明宗旨的范围内,变更或修正本发明。
(实施方式1)
本发明的编解码器的结构表示于图3和图4。
在图3所示的编码装置侧,采样后的输入信号首先被下采样(301)。下采样后的低频带的信号(低频信号)由核心编码单元进行编码(302)。核心编码参数被发送至复用单元(307)以形成比特流。另外,输入信号由时间-频率(T/F)转换单元(303)转换为高频带信号,该高频带信号(高频信号)被分割为多个子带。编码单元也可以是现有的窄带或宽带的音频或声音编解码器,可列举G.718作为一例。核心编码单元(302)不仅进行编码,还包括本地解码单元及时间-频率转换单元,进行本地解码,对解码后的信号(合成信号)进行时间-频率转换,向能量标准化单元(304)供应合成低频信号。标准化后的频域的合成低频信号以如下方式被用于频带扩展。首先,类似度搜索单元(305)在上述标准化后的低频合成数信号中,确定与输入信号的高频信号的各子带之间的相关性最高的部分,并向复用单元(307)发送作为搜索结果的索引信息。其次,估计该相关性最高的部分和输入信号的高频信号的各子带之间的比例因子信息(306),编码后的比例因子信息被发送到复用单元(307)。
最后,复用单元(307)将核心编码参数、索引信息及比例因子信息统一到比特流中。
在图4所示的解码装置中,解复用单元(401)对比特流进行解复用,获得核心编码参数、索引信息及比例因子信息。
核心解码单元使用核心编码参数,重构合成低频信号(402)。合成低频信号被上采样(403)并且还被用于频带扩展(410)。
以如下方式进行上述频带扩展。即,对合成低频信号进行能量标准化(404),将根据索引信息确定出的低频信号复制到高频带中(405),该索引信息确定与编码装置侧所导出的输入信号的高频信号的各子带之间的相关性最高的部分,根据比例因子信息进行能量级别调整,以使能量级别与输入信号的高频信号的能量级别相同(406)。
另外,从合成低频信号的频谱来估计高次谐波频率(407)。估计出的高次谐波频率用于调整高频信号的频谱中的单音分量的频率(408)。
重构后的高频信号从频域被转换到时域(409),与上采样后的合成低频信号相加而生成时域的输出信号。
以下说明高次谐波频率的估计方式的详细处理。
1)从合成低频信号(LF)的频谱中,选择用于估计高次谐波频率的部分。选择出的部分应具有鲜明的谐波结构,以使从选择出的部分所估计的高次谐波频率能够可靠。通常,对于所有高次谐波而言,在1-2kHz至截止频率附近会观察到鲜明的谐波结构。
2)将选择出的部分分割为接近于人的基频的宽度(100Hz~400Hz左右)的多个区块。
3)在各区块内搜索振幅最大的频谱(频谱峰值)及频谱峰值的频率(频谱峰值频率)。
4)为了避免错误或提高对于高次谐波频率的估计精度,对于确定出的频谱峰值实施后处理。
使用图5所示的频谱来说明后处理的一例。
基于合成低频信号的频谱计算出频谱峰值及频谱峰值频率。然而,振幅小且与相邻的频谱峰值之间的频谱峰值频率的间隔非常短的频谱峰值会被删除。由此,避免计算高次谐波频率的值时的估计错误。
1)计算确定出的频谱峰值频率的间隔。
2)基于确定出的频谱峰值频率的间隔来估计高次谐波频率。以下表示估计高次谐波频率的一个方法。
Spacingpeak(n)=Pospeak(n+1)-Pospeak(n),n∈[1,N-1]
Figure BDA0002375216850000061
其中
EstHarmonic为计算的高次谐波频率;
Spacingpeak为检测的峰值位置之间的频率间隔;
N为检测的峰值位置的数;
Pospeak为检测的峰值的位置。
还能够以如下所述的方法来估计高次谐波频率。
1)在合成低频信号(LF)的频谱中,选择以下的部分来估计高次谐波频率,该部分具有鲜明的谐波结构,能够确保所估计的高次谐波频率的可靠性。通常,对于所有高次谐波而言,在1-2kHz至截止频率附近会观察到清楚的谐波结构。
2)确定上述合成低频信号(频谱)的被选择出的部分中的具有最大振幅(绝对值)的频谱和其频率。
3)从该振幅最大的频谱的频谱频率,确定具有大致相等的频率间隔、且振幅的绝对值超过规定的阈值的频谱峰值的集合。能够采用例如所述被选择出的部分的频谱振幅的标准差的两倍的值作为规定的阈值。
4)计算上述频谱峰值频率的间隔。
5)基于上述频谱峰值频率的间隔来估计高次谐波频率。此外,即使在此情况下,也能使用式(1)的方法来估计高次谐波的频率。
然而,在比特率极低的情况下,有时合成低频信号的频谱内的高次谐波分量未充分地被编码。在此情况下,所确定的若干个频谱峰值有可能完全未对应于输入信号的高次谐波分量。因此,在计算高次谐波频率时,频谱峰值频率的间隔与平均值大不相同的情况下,更好是将其从该计算对象中排除。
另外,有时因用于编码的比特率的限制例如频谱峰值的振幅较小,未必能够对所有高次谐波分量进行编码(即,合成低频信号的频谱的若干个高次谐波分量缺失)。在此种情况下,可考虑在缺失的高次谐波部分提取出的频谱峰值频率的间隔为在具有良好的谐波结构的部分提取出的频谱峰值频率的间隔的两倍或数倍。在此情况下,将规定的范围中所含的频谱峰值频率的间隔的提取值的平均值作为高次谐波频率的估计值,该规定的范围包含最大频谱峰值频率的间隔。由此,能够适当地复制高频频谱。具体而言,包含以下的步骤。
1)确定频谱峰值频率的间隔的最小值及最大值。
Spacingpeak(n)=Pospeak(n+1)-Pospeak(n),n∈[1,N-1]
Spacingmin=min({Spacingpeak(n)});
Spacingmax=max({Spacingpeak(n)});…(2)
其中
Spacingpeak为检测的峰值位置之间的频率间隔;
Spacingmin为检测的峰值位置之间的最小频率间隔;
Spacingmax为检测的峰值位置之间的最大频率间隔;
N为检测的峰值位置的数;
Pospeak为检测的峰值的位置;
2)确定下一范围中的所有频谱峰值频率的间隔。
[k*Spacingmin,Spacingmax],k∈[1,2]
3)将在上述范围中确定的频谱峰值频率的间隔的平均值作为高次谐波频率的估计值。
其次,以下说明高次谐波频率调整方式的一例。
1)确定合成低频信号(LF)的频谱中的编码后的最后的频谱峰值、及其频谱峰值频率。
2)确定通过频带扩展而复制出的高频频谱内的频谱峰值和频谱峰值频率。
3)以合成低频信号频谱的频谱峰值中的最大频谱峰值频率为基准来调整频谱峰值频率,以使频谱峰值频率的间隔与高次谐波频率间隔的估计值相等。该处理表示于图6。如图6所示,首先,确定合成低频信号频谱中的最大频谱峰值频率、以及复制出的高频频谱内的频谱峰值。接着,将复制出的高频频谱内的具有最小频谱峰值频率的频谱峰值,移位至与合成低频信号频谱的最大频谱峰值频率具有EstHarmonic的间隔的频率。将复制出的高频频谱内的频谱峰值频率第二小的频谱峰值,移位至与上述移位后的最小频谱峰值频率具有EstHarmonic的间隔的频率。对于复制出的高频频谱内的所有频谱峰值的频谱峰值频率反复地进行该处理,直到如上所述的调整完成为止。
另外,还能采用如下所述的高次谐波频率调整方式。
1)确定合成低频信号(LF)频谱的具有最大频谱峰值频率的频谱峰值。
2)确定通过频带扩展而频带拓宽的高频(HF)频谱内的频谱峰值及频谱峰值频率。
3)以合成低频信号频谱的最大频谱峰值频率为基准,计算HF频谱中所能采用的频谱峰值频率。使通过频带扩展复制出的高频频谱内的各频谱峰值,向计算出的频谱峰值频率中的最接近各频谱峰值频率的频率移动。该处理表示于图7。如图7所示,首先提取合成低频频谱的具有最大频谱峰值频率的频谱峰值、及复制出的高频频谱内的频谱峰值。接着,计算复制出的高频频谱内所能采用的频谱峰值频率。将与合成低频信号频谱的最大频谱峰值频率具有EstHarmonic的间隔的频率,作为复制出的高频频谱内的频谱峰值所能第一采用的频谱峰值的频率。其次,将与上述能第一被采用的频谱峰值频率具有EstHarmonic的间隔的频率,作为能够第二被采用的频谱峰值的频率。只要能够在高频频谱内进行计算,则反复进行该处理。
然后,使在复制出的高频频谱中所提取的频谱峰值,移位至上述计算出的能采用的频谱峰值频率中的最接近频谱峰值频率的频率。
估计高次谐波的值EstHarmonic有时也不对应于整数的频率点。在此情况下,选择频谱峰值频率,以使其成为最接近基于EstHarmonic所导出的频率的频率点。
此外,还可以考虑利用前一帧的频谱来估计高次谐波频率的高次谐波频率估计方法、以及单音分量的频率调整方法,该单音分量的频率调整方法考虑了前一帧的频谱,以在调整单音分量时顺利地移帧。另外,还可以即使令单音分量的频率移位,仍维持原来频谱的能量级别的方式调整振幅。这些轻微的变更均包含于本发明的范围。
上述均为例示,本发明的构思并不限定于这些例示。本领域技术人员能够在不脱离本发明宗旨的范围内,变更或修正本发明。
[效果]
本发明的频带扩展方法使用与高频频谱之间的相关性最高的合成低频信号频谱来复制高频频谱,并且使频谱峰值向估计出的高次谐波频率移位。由此,能够维持频谱的精细结构、及低频带的频谱峰值和复制出的高频带的频谱峰值之间的谐波结构这两者。
(实施方式2)
本发明的实施方式2表示于图8和图9。
除了高次谐波频率估计单元(708,709)、高次谐波频率比较单元(710)以外,实施方式2的编码装置与实施方式1大致相同。
利用合成低频频谱(708)和输入信号的高频频谱(709)来分别估计高次谐波频率,基于两者的估计值的比较结果(710)发送标志信息。作为一例,能够以如下方式导出标志信息。
if
EstHarmonic_LF∈[EstHarmonic_HF-Threshold,EstHarmonic_HF+Threshold]
Flag=1
Otherwise
Flag=0…(3)
其中
EstHarmonic_LF为来自合成低频频谱的估计高次谐波频率;
EstHarmonic_HF为来自合成高频频谱的估计高次谐波频率;
Threshold为对于EstHarmonic_LF和EstHarmonic_HF的差分而预先设定的阈值;
Flag为表示是否要应用谐波调整的标志信号。
即,对从合成低频信号的频谱(合成低频频谱)所估计的高次谐波的频率EstHarmonic_LF、与从输入信号的高频频谱所估计的高次谐波频率EstHarmonic_HF进行比较,在两个值的差分足够小的情况下,认为根据合成低频频谱进行的估计足够准确,并设置表示可以用于调整高次谐波频率的标志(Flag=1)。另一方面,在两个值的差分不小的情况下,认为来自合成低频频谱的估计值不准确,并设置表示不应用于调整高次谐波频率的标志(Flag=0)。
在图9所示的解码装置侧,根据标志信息的值来决定是否对于复制出的高频频谱适用高次谐波频率调整(810)。即,解码装置在Flag=1的情况下进行高次谐波频率调整,在Flag=0的情况下不进行高次谐波频率调整。
[效果]
对于若干个信号而言,有时从合成低频频谱估计出的高次谐波频率与输入信号的高频频谱的高次谐波频率不同。特别是在比特率低的情况下,无法良好地维持低频频谱的谐波结构。通过发送标志信息,能够避免使用错误的高次谐波的频率估计值来调整单音分量。
(实施方式3)
本发明的实施方式3表示于图10及图11。
除了差分器(910)以外,实施方式3的编码装置与实施方式2大致相同。
利用合成低频频谱(908)和输入信号的高频频谱(909)来分别估计高次谐波频率。计算两个估计高次谐波频率的差分(Diff)(910),并向解码装置侧发送该差分(Diff)。
在图11所示的解码装置侧,将差分值(Diff)与来自合成低频频谱获得的高次谐波频率估计值相加(1010),新计算出的高次谐波频率的值被用于复制出的高频频谱中的高次谐波频率调整。
还可以直接向解码单元发送从输入信号的高频频谱估计出的高次谐波频率来代替差分值。接着,使用输入信号的高频频谱的高次谐波频率接收值进行高次谐波频率调整。由此,无需在解码装置侧从合成低频频谱来估计高次谐波频率。
[效果]
对于若干个信号而言,有时根据合成低频频谱估计出的高次谐波频率与输入信号的高频频谱的高次谐波频率不同,因此,通过发送差分值或从输入信号的高频频谱导出的高次谐波频率的值,接收侧即解码装置能够更高精度地对频带扩展后复制出的高频频谱的单音分量进行调整。
(实施方式4)
本发明的实施方式4表示于图12。
实施方式4的编码装置与其他的以往的编码装置或者实施方式1、2或3相同。
在图12所示的解码装置侧,从合成低频频谱来估计高次谐波频率(1103)。该高次谐波频率的估计值被用于低频频谱中的高次谐波注入(1104)。
特别是在能够利用的比特率较低的情况下,有时若干个低频频谱的高次谐波分量几乎未被编码,或完全未被编码。在此情况下,能够使用高次谐波频率的估计值来注入缺失的高次谐波分量。
将该内容表示于图13。在图13中,已知合成低频(LF)频谱内有高次谐波分量缺失。其频率能够使用高次谐波频率的估计值导出。另外,其振幅只要使用例如其他的现有的频谱峰值的振幅的平均值、或与频率轴上缺失的高次谐波分量接近的现有的频谱峰值的振幅的平均值即可。注入根据该频率及振幅生成的高次谐波分量以恢复缺失的高次谐波分量。
以下,说明注入缺失的高次谐波分量的其他方法。
1.使用编码后的LF频谱来估计高次谐波频率(1103)。
1.1使用在编码后的低频频谱内确定出的频谱峰值频率的间隔来估计高次谐波频率。
1.2由缺失的高次谐波部分导出的频谱峰值频率的间隔的值是在维持着良好谐波结构的部分导出的频谱峰值频率的间隔的值的两倍或数倍。这样的频谱峰值频率的间隔被分成不同种类的组,对于各个组估计平均的频谱峰值频率的间隔。以下说明其细节。
a.确定频谱峰值频率的间隔的值的最小值及最大值。
Spacingpeak(n)=Pospeak(n+1)-Pospeak(n),n∈[1,N-1]
Spacingmin=min({Spacingpeak(n)});
Spacingmax=max({Spacingpeak(n)});…(4)
其中
Spacingpeak为检测的峰值位置之间的频率间隔;
Spacingmin为检测的峰值位置之间的最小频率间隔;
Spacingmax为检测的峰值位置之间的最大频率间隔;
N为检测的峰值位置的数;
Pospeak为检测的峰值的位置。
b.确定下一范围中的所有间隔的值。
r1=[Spacingmin,k*Spacingmin)
r2=[k*Spacingmin,Spacingmax],1<k≤2
c.计算在上述范围中所确定的间隔的值的平均值作为高次谐波频率的估计值。
Figure BDA0002375216850000121
Figure BDA0002375216850000122
其中
EstHarmonicLF1、EstHarmonicLF2为估计谐波频率;
N1为属于r1的检测出的峰值位置的数;
N2为属于r2的检测出的峰值位置的数。
2.使用高次谐波频率的估计值来注入缺失的高次谐波分量。
2.1将选择出的LF频谱分割为若干个区域。
2.2通过使用区域信息及估计出的频率来确定缺失的高次谐波。
例如,将选择出的LF频谱分割为三个区域r1、r2、r3
基于区域信息,确定高次谐波并注入高次谐波。
根据对高次谐波的信号特性,高次谐波之间的谱隙在r1及r2的区域中为EstHarmonicLF1,在r3的区域中为EstHarmonicLF2。该信息能够用于扩展LF频谱。将该内容进一步表示于图14。在图14中,已知在LF频谱的区域r2中有缺失的高次谐波分量。其频率能够使用高次谐波频率的估计值EstHarmonicLF1导出。
同样地,EstHarmonicLF2用于追踪及注入区域r2中缺失的高次谐波。
另外,其振幅能够使用未缺失的所有高次谐波分量的振幅的平均值、或连接于缺失的高次谐波分量前后的高次谐波分量的振幅的平均值。或者,振幅还可以使用WB频谱中的具有最小振幅的频谱峰值。使用该频率及振幅生成的高次谐波分量被注入LF频谱以恢复缺失的高次谐波分量。
[效果]
对于若干个信号而言,有时未维持合成低频频谱。特别是在比特率低的情况下,若干个高次谐波分量有可能会缺失。在LF频谱中注入缺失的高次谐波分量,由此,不仅能够扩展LF,而且能够提高所重构的高次谐波的谐波特性。由此,能够抑制由高次谐波缺失造成的听觉上的影响,从而能够进一步提高声音质量。
2013年6月11日提出申请的特愿2013-122985的日本申请中所含的说明书、附图及说明书摘要的公开内容均被引用于本申请。
工业实用性
本发明的编码装置、解码装置以及编码/解码方法能适用于无线通信终端装置、移动通信系统中的基站装置、电话会议终端装置、视频会议终端装置及VOIP终端装置。

Claims (10)

1.语音信号解码装置,包括:
解复用单元,从由编码语音信号的编码装置发送的编码信息中,取出核心编码参数、索引信息以及比例因子信息;
核心解码单元,对所述核心编码参数进行解码,获得合成低频频谱;
频谱复制单元,基于所述索引信息,使用所述合成低频频谱复制高频子带频谱;以及
频谱包络调整单元,使用所述比例因子信息,调整复制出的所述高频子带频谱的振幅,
所述语音信号解码装置使用所述合成低频频谱和所述高频子带频谱生成输出信号,
所述语音信号解码装置还包括:
高次谐波频率估计单元,估计复制出的所述高频子带频谱中的高次谐波分量的频率;以及
高次谐波频率调整单元,用使用所述合成低频频谱所估计的高次谐波频率来调整高频频谱中的高次谐波分量的频率。
2.如权利要求1所述的语音信号解码装置,
所述高次谐波频率估计单元包括:
分割单元,将在所述合成低频频谱中预先选择出的部分分割为规定数的区块;
频谱峰值确定单元,求各区块中的具有最大振幅的频谱即频谱峰值和所述频谱峰值的频率;
间隔计算单元,计算确定出的所述频谱峰值的频率的间隔;以及
高次谐波频率计算单元,使用确定出的所述频谱峰值的频率的间隔,计算所述高次谐波频率。
3.如权利要求1所述的语音信号解码装置,
所述高次谐波频率估计单元包括:
频谱峰值确定单元,确定所述合成低频频谱的预先选择出的部分的振幅绝对值最大的频谱、和距所述频谱在频率轴上位于大致等间隔的位置且振幅绝对值为规定的阈值以上的频谱;
间隔计算单元,计算确定出的所述频谱峰值的频率的间隔;以及
高次谐波频率计算单元,使用确定出的所述频谱的频率的间隔,计算所述高次谐波频率。
4.如权利要求2所述的语音信号解码装置,
所述高次谐波频率调整单元包括:
低频频谱峰值确定单元,确定所述合成低频频谱的频谱峰值中的频率最大的频谱峰值的频率;
高频频谱峰值确定单元,确定复制出的所述高频子带频谱中的多个频谱峰值的频率;以及
调整单元,以所述合成低频频谱的频谱峰值中的频率最大的频谱峰值的频率为基准,调整所述多个频谱峰值的频率,以使所述多个频谱峰值的频率的间隔与估计出的所述高次谐波频率相等。
5.如权利要求2所述的语音信号解码装置,
所述高次谐波频率调整单元包括:
低频频谱峰值确定单元,确定所述合成低频频谱的频谱峰值中的频率最大的频谱峰值的频率;
高频频谱峰值确定单元,确定复制出的所述高频子带频谱中的多个频谱峰值的频率;
频谱峰值频率计算单元,计算将估计出的所述高次谐波频率的整数倍的频率与所述合成低频频谱的频谱峰值中的频率最大的频谱峰值的频率相加所得的频率,作为能采用的频谱峰值频率;以及
调整单元,将复制出的所述高频子带频谱内的所述多个频谱峰值的频率,向所述计算出的能采用的频谱峰值频率中的最接近的频率来调整。
6.语音信号解码装置,包括:
解复用单元,对由编码语音信号的编码装置复用并发送的核心编码参数、索引信息、比例因子信息以及标志信息进行解复用;
核心解码单元,将所述核心编码参数解码为时域的低频信号,并且将解码后的所述低频信号转换到频域来获得合成低频频谱;
频谱复制单元,从所述合成低频频谱,基于所述索引信息来重构高频子带频谱;
频谱包络调整单元,使用所述比例因子信息,调整复制出的所述高频子带频谱的振幅;
高次谐波频率估计单元,从所述合成低频频谱来估计高次谐波的频率;
高次谐波频率调整单元,基于估计出的所述高次谐波频率,调整根据所述合成低频频谱复制出的所述高频子带频谱中的单音分量的频率;以及
决定单元,基于所述标志信息,决定是否使所述高次谐波频率调整单元进行动作,
使用所述合成低频频谱和所述高频子带频谱,生成输出信号。
7.如权利要求1或权利要求6所述的语音信号解码装置,还包括:
缺失高次谐波分量确定单元,基于估计出的所述高次谐波的频率,确定所述合成低频频谱中缺失的高次谐波分量;以及
高次谐波注入单元,在所述合成低频频谱中注入缺失的所述高次谐波分量。
8.如权利要求7所述的语音信号解码装置,
所述高次谐波注入单元生成将未缺失的所有高次谐波分量的振幅的平均值或频率轴上的位于缺失的高次谐波分量前后的高次谐波分量的振幅的平均值为振幅的高次谐波分量。
9.语音信号编码装置,包括:
下采样单元,对输入语音信号即输入信号以低采样率进行下采样;
核心编码单元,将下采样后的所述信号编码为核心编码参数,输出所述核心编码参数,并且本地地对所述核心编码参数进行解码,转换为频域来获得合成低频频谱;
能量标准化单元,使所述合成低频频谱标准化;
时间-频率转换单元,将所述输入信号转换为频谱,并且将频率比所述合成低频频谱更高的频谱分割为多个子带即高频子带;
类似度搜索单元,对于各所述高频子带,从标准化后的所述合成低频频谱确定相关性最高的部分,输出确定结果作为索引信息;
比例因子估计单元,估计所述各高频子带与从所述合成低频频谱确定出的所述相关性最高的部分之间的能量的比例因子,并输出所述比例因子作为比例因子信息;
高次谐波频率估计单元,估计所述合成低频频谱的高次谐波的频率和所述转换后的输入信号的高次谐波的频率;以及
高次谐波频率比较单元,对所述两个高次谐波频率进行比较,判断是否应进行高次谐波的频率调整,并输出所述判断结果作为标志信息。
10.语音信号编码装置,包括:
下采样单元,对输入语音信号即输入信号以低采样率进行下采样;
核心编码单元,将下采样后的所述信号编码为核心编码参数,输出所述核心编码参数,并且本地地对所述核心编码参数进行解码,转换为频域来获得合成低频频谱;
时间-频率转换单元,将所述输入信号转换为频谱,并且将频率比所述合成低频频谱更高的频谱分割为多个子带即高频子带;
类似度搜索单元,对于各所述高频子带,从所述低频频谱确定相关性最高的部分,输出确定结果作为索引信息;
比例因子估计单元,估计各所述高频子带和从所述合成低频频谱确定出的所述相关性最高的部分之间的能量的比例因子,并输出所述比例因子作为比例因子信息;以及
高次谐波频率估计单元,估计并输出所述合成低频频谱的高次谐波的频率和转换后的所述输入信号的高次谐波的频率。
CN202010063428.6A 2013-06-11 2014-06-10 语音信号解码装置和方法、语音信号编码装置和方法 Active CN111477245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010063428.6A CN111477245B (zh) 2013-06-11 2014-06-10 语音信号解码装置和方法、语音信号编码装置和方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2013-122985 2013-06-11
JP2013122985 2013-06-11
PCT/JP2014/003103 WO2014199632A1 (ja) 2013-06-11 2014-06-10 音響信号の帯域幅拡張を行う装置及び方法
CN201480031440.1A CN105408957B (zh) 2013-06-11 2014-06-10 进行语音信号的频带扩展的装置及方法
CN202010063428.6A CN111477245B (zh) 2013-06-11 2014-06-10 语音信号解码装置和方法、语音信号编码装置和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480031440.1A Division CN105408957B (zh) 2013-06-11 2014-06-10 进行语音信号的频带扩展的装置及方法

Publications (2)

Publication Number Publication Date
CN111477245A true CN111477245A (zh) 2020-07-31
CN111477245B CN111477245B (zh) 2024-06-11

Family

ID=52021944

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010063428.6A Active CN111477245B (zh) 2013-06-11 2014-06-10 语音信号解码装置和方法、语音信号编码装置和方法
CN201480031440.1A Active CN105408957B (zh) 2013-06-11 2014-06-10 进行语音信号的频带扩展的装置及方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201480031440.1A Active CN105408957B (zh) 2013-06-11 2014-06-10 进行语音信号的频带扩展的装置及方法

Country Status (11)

Country Link
US (4) US9489959B2 (zh)
EP (2) EP3731226A1 (zh)
JP (4) JP6407150B2 (zh)
KR (1) KR102158896B1 (zh)
CN (2) CN111477245B (zh)
BR (2) BR122020016403B1 (zh)
ES (1) ES2836194T3 (zh)
MX (1) MX353240B (zh)
PT (1) PT3010018T (zh)
RU (2) RU2658892C2 (zh)
WO (1) WO2014199632A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
JP6407150B2 (ja) * 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI856342B (zh) 2015-03-13 2024-09-21 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
CN105280189B (zh) * 2015-09-16 2019-01-08 深圳广晟信源技术有限公司 带宽扩展编码和解码中高频生成的方法和装置
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10346126B2 (en) 2016-09-19 2019-07-09 Qualcomm Incorporated User preference selection for audio encoding
KR102721794B1 (ko) * 2016-11-18 2024-10-25 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
EP3435376B1 (en) 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
JP7214726B2 (ja) 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
WO2020041497A1 (en) * 2018-08-21 2020-02-27 2Hz, Inc. Speech enhancement and noise suppression systems and methods
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113808596B (zh) * 2020-05-30 2025-01-03 华为技术有限公司 一种音频编码方法和音频编码装置
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备
CN113362837B (zh) * 2021-07-28 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频信号处理方法、设备及存储介质
CN114550732B (zh) * 2022-04-15 2022-07-08 腾讯科技(深圳)有限公司 一种高频音频信号的编解码方法和相关装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1222997A (zh) * 1996-07-01 1999-07-14 松下电器产业株式会社 音频信号编码方法、解码方法,及音频信号编码装置、解码装置
CN1465137A (zh) * 2001-07-13 2003-12-31 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US20070011002A1 (en) * 2005-07-11 2007-01-11 Toru Chinen Signal encoding apparatus and method, signal decoding apparatus and method, programs and recording mediums
CN101471072A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 高频重建方法、编码模块和解码模块
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
CN101548318A (zh) * 2006-12-15 2009-09-30 松下电器产业株式会社 编码装置、解码装置以及其方法
US20100063802A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive Frequency Prediction
CN102334159A (zh) * 2009-02-26 2012-01-25 松下电器产业株式会社 编码装置、解码装置及其方法
US20130117029A1 (en) * 2011-05-25 2013-05-09 Huawei Technologies Co., Ltd. Signal classification method and device, and encoding and decoding methods and devices
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
EP2071565B1 (en) * 2003-09-16 2011-05-04 Panasonic Corporation Coding apparatus and decoding apparatus
KR20060090995A (ko) 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
CN101656076B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频编码装置、音频编码方法以及通信终端和基站装置
RU2387024C2 (ru) * 2004-11-05 2010-04-20 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
CN101896967A (zh) 2007-11-06 2010-11-24 诺基亚公司 编码器
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
EP2224433B1 (en) 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
MY180550A (en) 2009-01-16 2020-12-02 Dolby Int Ab Cross product enhanced harmonic transposition
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8898057B2 (en) 2009-10-23 2014-11-25 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus and methods thereof
JP5809066B2 (ja) * 2010-01-14 2015-11-10 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声符号化方法
SG178320A1 (en) * 2010-06-09 2012-03-29 Panasonic Corp Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus
EP3544009B1 (en) * 2010-07-19 2020-05-27 Dolby International AB Processing of audio signals during high frequency reconstruction
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
ES2949240T3 (es) * 2011-02-18 2023-09-26 Ntt Docomo Inc Codificador de voz y método de codificación de voz
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN103718240B (zh) * 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
JP2013122985A (ja) 2011-12-12 2013-06-20 Toshiba Corp 半導体記憶装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1222997A (zh) * 1996-07-01 1999-07-14 松下电器产业株式会社 音频信号编码方法、解码方法,及音频信号编码装置、解码装置
CN1465137A (zh) * 2001-07-13 2003-12-31 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US20070011002A1 (en) * 2005-07-11 2007-01-11 Toru Chinen Signal encoding apparatus and method, signal decoding apparatus and method, programs and recording mediums
CN101548318A (zh) * 2006-12-15 2009-09-30 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101471072A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 高频重建方法、编码模块和解码模块
US20100063802A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive Frequency Prediction
CN102334159A (zh) * 2009-02-26 2012-01-25 松下电器产业株式会社 编码装置、解码装置及其方法
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
US20130117029A1 (en) * 2011-05-25 2013-05-09 Huawei Technologies Co., Ltd. Signal classification method and device, and encoding and decoding methods and devices
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法

Also Published As

Publication number Publication date
RU2015151169A (ru) 2017-06-05
KR20160018497A (ko) 2016-02-17
RU2015151169A3 (zh) 2018-03-02
US20190122679A1 (en) 2019-04-25
BR122020016403B1 (pt) 2022-09-06
RU2018121035A3 (zh) 2019-03-05
RU2688247C2 (ru) 2019-05-21
PT3010018T (pt) 2020-11-13
US20160111103A1 (en) 2016-04-21
EP3010018B1 (en) 2020-08-12
JP2019008316A (ja) 2019-01-17
JP2019008317A (ja) 2019-01-17
BR112015029574B1 (pt) 2021-12-21
MX353240B (es) 2018-01-05
US20170323649A1 (en) 2017-11-09
US10157622B2 (en) 2018-12-18
KR102158896B1 (ko) 2020-09-22
CN111477245B (zh) 2024-06-11
WO2014199632A1 (ja) 2014-12-18
EP3010018A1 (en) 2016-04-20
JP7330934B2 (ja) 2023-08-22
JP6407150B2 (ja) 2018-10-17
ES2836194T3 (es) 2021-06-24
CN105408957A (zh) 2016-03-16
BR112015029574A2 (pt) 2017-07-25
JP6773737B2 (ja) 2020-10-21
CN105408957B (zh) 2020-02-21
US9489959B2 (en) 2016-11-08
EP3010018A4 (en) 2016-06-15
US9747908B2 (en) 2017-08-29
JPWO2014199632A1 (ja) 2017-02-23
US10522161B2 (en) 2019-12-31
MX2015016109A (es) 2016-10-26
US20170025130A1 (en) 2017-01-26
RU2018121035A (ru) 2019-03-05
JP2021002069A (ja) 2021-01-07
RU2658892C2 (ru) 2018-06-25
EP3731226A1 (en) 2020-10-28

Similar Documents

Publication Publication Date Title
CN105408957B (zh) 进行语音信号的频带扩展的装置及方法
JP6518361B2 (ja) オーディオ/音声符号化方法およびオーディオ/音声符号化装置
CN111179963B (zh) 用自适应频谱铺片选择的音频信号解码和编码设备及方法
JP5418930B2 (ja) 音声復号化方法および音声復号化器
KR101398189B1 (ko) 음성수신장치 및 음성수신방법
US9117461B2 (en) Coding device, decoding device, coding method, and decoding method for audio signals
EP2820647A1 (en) Phase coherence control for harmonic signals in perceptual audio codecs
KR20170024048A (ko) 독립적 잡음-충전을 사용하여 향상된 신호를 발생시키기 위한 장치 및 방법
MXPA06006497A (es) Metodo para el ocultamiento de errores en el dominio de frecuencia, mejorado.
KR102121642B1 (ko) 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
CN103165134B (zh) 音频信号高频参数编解码装置
Taleb et al. G. 719: The first ITU-T standard for high-quality conversational fullband audio coding
Jia et al. An embedded stereo speech and audio coding method based on principal component analysis
Liu et al. Blind bandwidth extension of audio signals based on harmonic mapping in phase space

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TG01 Patent term adjustment
TG01 Patent term adjustment