CN109036457B - 恢复音频信号的方法和装置 - Google Patents
恢复音频信号的方法和装置 Download PDFInfo
- Publication number
- CN109036457B CN109036457B CN201811053050.0A CN201811053050A CN109036457B CN 109036457 B CN109036457 B CN 109036457B CN 201811053050 A CN201811053050 A CN 201811053050A CN 109036457 B CN109036457 B CN 109036457B
- Authority
- CN
- China
- Prior art keywords
- frequency
- audio signal
- signal
- point
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本申请提供了一种恢复音频信号的方法和装置,属于音频技术领域。所述方法包括:每次缓存预设数目个采样点采样的音频信号后,通过FFT对采样得到的音频信号进行频谱分析,确定出音频信号被压缩时,滤去的频率点,然后基于该频率点之前的音频信号进行高频信号的恢复,然后再进行高频信号的相位的恢复。采用本申请,提供了一种恢复音频信号的方法。
Description
技术领域
本申请涉及音频技术领域,特别涉及一种恢复音频信号的方法和装置。
背景技术
在音频领域,为了节约音频数据传输资源,一般是先将音频数据进行低通滤波,滤去对人类听觉系统不敏感的高频信号,然后对低通滤波后的音频数据进行压缩,以提高压缩率,使减少音频数据的数据量。
随着计算机技术的发展,音频数字模拟转换器、耳机音响质量的提高,在音频数据被播放时,被滤去的高频信号带来的缺陷也越来越明显,所以急需提供一种恢复音频信号的方法。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种恢复音频信号的方法和装置。所述技术方案如下:
第一方面,提供了一种恢复音频信号的方法,所述方法包括:
缓存预设数目个采样点采样的音频信号;
对采样得到的音频信号进行快速傅氏变换算法FFT处理,得到FFT结果;
根据所述FFT结果,如果存在满足预设条件的第一频率点,则将所述预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定所述第一频率点所属的目标频率子带;其中,所述预设条件为所述第一频率点与第二频率点的频率之差小于第一预设数值,且所述第一频率点与所述第二频率点的功率之差大于第二预设数值,且频率大于所述第一频率点的频率的频率点的功率为零,所述第二频率点的频率小于所述第一频率点的频率;
根据所述目标频率子带的前一个频率子带的音频信号,对所述多个频率子带中所述目标频率子带以及所述目标频率子带之后的频率子带的音频信号进行恢复;
将所述多个频率子带中所述目标频率子带之前的频率子带的音频信号、所述目标频率子带的音频信号和所述多个频率子带中所述目标频率子带之后的频率子带的音频信号进行合成;
将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号,对所述高频信号进行相位恢复处理;
将相位恢复处理后的高频信号和所述低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
可选的,所述方法还包括:
根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带,将所述多个频率子带的音频信号的进行合成;
将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;
将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
可选的,所述将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号,包括:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号,其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
可选的,所述对所述高频信号进行相位恢复处理,包括:
将所述高频信号通过全通形态的BIQUAD IIR滤波,得到相位恢复处理后的高频信号。
可选的,所述方法还包括:
根据所述第一频率点的频率和采样率,确定所述BIQUAD IIR滤波的系数。
可选的,所述对采样得到的音频信号进行FFT处理,得到FFT结果之前,还包括:
对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;
所述对采样得到的音频信号进行FFT处理,得到FFT结果,包括:
对所述加窗处理后的音频信号进行FFT处理,得到FFT结果。
第二方面,提供了一种恢复音频信号的装置,所述装置包括:
缓存模块,用于缓存预设数目个采样点采样的音频信号;
傅氏变换模块,用于对采样得到的音频信号进行快速傅氏变换算法FFT处理,得到FFT结果;
转换模块,用于根据所述FFT结果,如果存在满足预设条件的第一频率点,则将所述预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号;
确定模块,用于确定所述第一频率点所属的目标频率子带;其中,所述预设条件为所述第一频率点与第二频率点的频率之差小于第一预设数值,且所述第一频率点与所述第二频率点的功率之差大于第二预设数值,且频率大于所述第一频率点的频率的频率点的功率为零,所述第二频率点的频率小于所述第一频率点的频率;
恢复模块,用于根据所述目标频率子带的前一个频率子带的音频信号,对所述多个频率子带中所述目标频率子带以及所述目标频率子带之后的频率子带的音频信号进行恢复;
合成模块,用于将所述多个频率子带中所述目标频率子带之前的频率子带的音频信号、所述目标频率子带的音频信号和所述多个频率子带中所述目标频率子带之后的频率子带的音频信号进行合成;
分离模块,用于将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号;
所述恢复模块,还用于对所述高频信号进行相位恢复处理;
叠加模块,用于将相位恢复处理后的高频信号和所述低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
可选的,所述转换模块,还用于根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带;
所述合成模块,还用于将所述多个频率子带的音频信号的进行合成;
所述分离模块,还用于将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;
所述叠加模块,还用于将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
可选的,所述分离模块,用于:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号,其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
可选的,所述恢复模块,用于:
将所述高频信号通过全通形态的BIQUAD IIR滤波,得到相位恢复处理后的高频信号。
可选的,所述确定模块,还用于:
根据所述第一频率点的频率和采样率,确定所述BIQUAD IIR滤波的系数。
可选的,所述装置还包括:,
加窗模块,用于在对采样得到的音频信号进行FFT处理得到FFT结果之前,对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;
所述傅氏变换模块,用于:
对所述加窗处理后的音频信号进行FFT处理,得到FFT结果。
本发明实施例提供的技术方案带来的有益效果至少包括:
本发明实施例中,在有损格式的音频中,每次缓存预设数目个采样点采样的音频信号后,可以对采样得到的音频信号进行FFT处理,得到FFT结果;根据FFT结果,如果存在满足预设条件的第一频率点,则将预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定包含第一频率点的目标频率子带,然后基于目标频率子带的前一个频率子带的音频信号,对多个频率子带中目标频率子带以及目标频率子带之后的频率子带的音频信号进行恢复,然后将目标频率子带之前的频率子带的音频信号、目标频率子带的音频信号和多个频率子带中目标频率子带之后的频率子带的音频信号进行合成,将合成后的音频信号,按照第一频率点进行分离,得到高频信号和低频信号,对高频信号进行相位恢复处理,将相位恢复处理后的高频信号和低频信号进行叠加,得到恢复高频信号后的采样的音频信号,这样,由于可以将采样的音频信号中的高频信号恢复出来,所以采样的音频信号也就被恢复出来,提供了一种恢复音频信号的方法。
附图说明
图1是本发明实施例提供的一种恢复音频信号的方法流程图;
图2是本发明实施例提供的一种滤掉的频率点的示意图;
图3是本发明实施例提供的一种恢复音频信号的装置的结构示意图;
图4是本发明实施例提供的一种恢复音频信号的装置的结构示意图;
图5是本发明实施例提供的一种终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种恢复音频信号的方法,该方法的执行主体可以是终端,终端可以是手机、电脑、平板电脑等。
终端中可以设置有处理器、存储器和收发器,处理器可以用于恢复音频信号的过程中的处理,存储器可以用于恢复音频信号的过程中需要的数据以及产生的数据,收发器可以用于接收以及发送数据。终端还可以包括屏幕等输入输出设备,屏幕可以是触控式屏幕,屏幕可以用于显示恢复完的音频信号等。
本实施例中以终端为手机为例进行方案的详细描述,其它情况与之类似,本实施例不再累述。
在进行实施前,首先介绍一下本发明实施例的应用场景:
在音频领域中,为了节约音频数据传输资源,一般是先将音频数据进行低通滤波,滤去对人类听觉系统不敏感的高频信号,然后对低通滤波后的音频数据进行压缩,以提高压缩率,使减少音频数据的数据量。随着计算机技术的发展,音频数字模拟转换器、耳机音响质量的提高,在音频数据被播放时,被滤去的高频信号带来的缺陷也越来越明显,所以基于此提供了将压缩后的音频信号中的高频信号进行恢复的方法。
本发明实施例中提供了一种恢复音频信号的方法,如图1所示,该方法的执行流程可以如下:
步骤101,缓存预设数目个采样点采样的音频信号。
其中,预设数目可以预设,并且存储至终端中,预设数目一般在2048~32768之间,且等于2的N次方(这是为了方便后续FFT算法的运算),N大于或等于11,且小于或等于15,例如,预设数目为8192。
在实施中,在终端下载完压缩音频后,可以对压缩音频的音频信号按照预设的采样率进行采样,每缓存预设数目个采样点采样的音频信号,作为一小块的音频信号进行后续处理。
需要说明的是,在本发明实施例中,每次缓存的采样点采样的音频信号的长度越长,恢复的质量越高,但是对硬件资源的要求也比较高,所以预设数目要选取合适。
还需要说明的是,上述的采样率可以是22.05KHz、44.1KHz等。采样方式可以PCM((Pulse Code Modulation,脉冲编码调制)采样。
步骤102,对采样得到的音频信号进行FFT处理,得到FFT结果。
在实施中,终端得到一小块的音频信号后,将这一小块的音频信号输入到FFT(Fast Fourier Transform Algorithm,快速傅氏变换算法)中,进行FFT处理,得到FFT结果。例如,缓存了8192个采样点(此处可以认为是实数采样点)采样得到的音频信号,得到的FFT结果的长度为(8192/2)+1=4097,即4097个复数。
需要说明的是,上述进行的FFT处理选择了RDFT(Real Discrete FourierTransform,实数离散傅立叶变换)算法进行,RDFT算法是FFT的一种类型,专门用于将时域的实数采样转换成频域的复数,N个实数经过RDFT后会得到(N/2)+1个复数,对每一个复数求模即可得到(N/2)+1个实数,即表示(N/2)+1个频率点的幅值,对幅值计算log10 (X),即可得到功率谱。
可选的,在进行FFT处理之前,还可以对音频信号进行加窗处理,相应的处理可以如下:
对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;对加窗处理后的音频信号进行FFT处理,得到FFT结果。
其中,加窗就是在傅里叶积分中,将原来的被积函数与特定的窗函数做积。考虑到通带平坦度和阻带衰减度,进行加窗处理的窗函数可以选择NUTTALL窗。
在实施中,终端可以获取预先存储的窗函数,使用该窗函数,对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号,然后可以对加窗处理后的音频信号输入到FFT中,进行FFT处理,得到FFT结果。
需要说明的是,在FFT中,实际上作了周期性延拓,这是因为终端处理的数据时有限时间段内的,而FFT中,要求的时间是从负无穷到正无穷的积分,因此需要做延拓,那么也会涉及到普泄露的问题,所以要对音频信号进行加窗处理,以修正普泄露的问题。
步骤103,根据FFT结果,如果存在满足预设条件的第一频率点,则将预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定第一频率点所属的目标频率子带。
其中,如图2所示,预设条件为第一频率点与第二频率点的频率之差小于第一预设数值,且第一频率点与第二频率点的功率之差大于第二预设数值,且频率大于第一频率点的频率的频率点的功率为零,第二频率点的频率小于第一频率点的频率。第一预设数值可以预设,并且存储在终端中,如可以是10Hz,第二预设数值可以预设,并且存储在终端中,如可以是6dB等。
在实施中,终端得到FFT结果后,FFT结果是频谱,可以根据频谱计算出功率谱(可以是每一个频率点对应的幅值的平方),在功率谱中,每个频率点对应一个功率,然后终端可以扫描功率谱,寻找功率断崖式的衰减点,也就是寻找满足预设条件的第一频率点,第二频率点的频率小于第一频率点的频率,第一频率点与第二频率点的频率之差小于第一预设数值,且第一频率点与第二频率点的功率之差大于第二预设数值,且频率大于第一频率点的频率的频率点的功率为零,第一频率点可以称为是断崖式的衰减点。
终端在找到第一频率点后,可以获取预设步骤101中的预设数目个采样点采样的音频信号,然后使用窗函数(窗函数可以是NUTTALL窗函数),对其进行加窗处理,在加窗处理后,使用预设的MDCT(Modified Discrete Cosine Transform,修正离散余弦变换)算法将加窗处理后的音频信号转换为等宽的频率子带的音频信号,在这些频率子带中,查找第一频率点所在的频带子带。
例如,FFT结果的长度为(8192/2)+1=4097,可以表示为SPEC[0,1……,4096],假设第一频率点为N,功率差SPEC[N-1]–SPEC[N]≥第二预设数值,且SPEC[N+1..4096]均为0。第一频率点的频率可以表示为N*(4097/(采样率/2)),单位为Hz。经过MDCT算法可以得到4096个频率子带,每个频率子带的宽度相等,且4096个子带均分(采样率/2)Hz。频率子带命名可以为SUBBAND[0..4095]。假设包含第一频率点的频率子带为N,即SUBBAND[N]频率子带的频率范围包含第一频率点的频率。
需要说明的是,上述使用MDCT算法得到频率子带,仅是一种举例的形式,还可以使用多相滤波器来得到频率子带。
还需要说明的是,上述第一频率点实际上是在进行压缩时,滤去的频率点中频率最小的频率点。
步骤104,根据目标频率子带的前一个频率子带的音频信号,对多个频率子带中目标频率子带以及目标频率子带之后的频率子带的音频信号进行恢复。
在实施中,在找到目标频率子带后,可以确定目标频率子带的前一个频率子带,也就是频率端点值低于目标频率子带的频率端点值且与目标频率子带的频率端点值的差值最小的频率子带,然后获取该频率子带的音频信号,对多个频率子带中目标频率子带以及目标频率子带之后的频率子带的音频信号进行恢复。
恢复过程可以是:
假设包含第一频率点的频率子带为N,可以使用SUBBAND[K]=SUBBAND[K-1]*(SQRT(2)/2),N≤K≤4095,SQRT表示开平方,可见第一频率子带的音频信号为SUBBAND[N]=SUBBAND[N-1]*(SQRT(2)/2),第一频率子带之后的第一个频率子带的音频信号为SUBBAND[N+1]=SUBBAND[N]*(SQRT(2)/2),可见第N个频率子带的音频信号使用第N-1频率子带的音频信号确定,第N+1个频率子带的音频信号使用第N个频率子带的音频信号确定,依次计算第N个频率子带以及之后的每个频率子带的音频信号,这样,就可以将目标频率子带以及目标频率子带之后的频率子带的音频信号恢复出来。
步骤105,将多个频率子带中目标频率子带之前的频率子带的音频信号、目标频率子带的音频信号和多个频率子带中目标频率子带之后的频率子带的音频信号进行合成。
在实施中,终端在恢复出目标频率子带的音频信号和目标频率子带之后的音频子带的音频信号后,可以将多个频率子带中目标频率子带之前的频率子带的音频信号、目标频率子带的音频信号和多个频率子带中目标频率子带之后的频率子带的音频信号输入到逆MDCT算法中(由于前面使用了MDCT算法等分频率子带,所以此处使用逆MDCT算法),得到合成后的音频信号,这合成后的音频信号中包括高频信号。
步骤106,将合成后的音频信号,按照第一频率点进行分离,得到高频信号和低频信号;对高频信号进行相位恢复处理。
其中,低频信号的频率小于第一频率点的频率,高频信号的频率大于或等于第一频率点的频率。
在实施中,终端可以将合成后的音频信号,按照第一频率点进行分离,得到频率高于第一频率点的频率的音频信号(可以称为是高频信号)和频率低于第一频率点的频率的音频信号(可以称为是低频信号)。
由于在步骤105中第N个频率子带的音频信号使用第N-1频率子带的音频信号确定,第N个频率子带的音频信号的相位与第N-1频率子带的音频信号的相位相同,所以还需要对高频信号的相位进行修正,所以可以对高频信号进行相位恢复处理,得到相位恢复处理后的高频信号。
可选的,可以通过滤波器分离高频信号和低频信号,相应的处理可以如下:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号。
其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
在实施中,终端可以将合成后的音频信号输入到预设的线性高通滤波算法中,以使高频信号通过,低频信号滤去,得到高频信号,并且可以将合成后的音频信号输入到预设的线性低通滤波算法中,以使低频信号通过,高频信号滤去,得到低频信号。
需要说明的是,上述线性高通滤波算法和线性低通滤波算法可以是使用窗函数方法设计的能实现FIR(Finite Impulse Response,有限脉冲响应)线性滤波器的功能的算法,窗函数可以选择NUTTALL窗,长度可以是步骤101中预设数目的八分之一减去一。
另外,在进行线性高通滤波时,终端还可以连接有线性高通滤波器和线性低通滤波器,将合成后的音频信号输入到线性高通滤波器,以使高频信号通过,低频信号滤去,得到高频信号,再返回给终端,并且可以将合成后的音频信号输入到预设的线性低通滤波器中,以使低频信号通过,高频信号滤去,得到低频信号,再返回给终端。
需要说明的是,上述线性高通滤波器和线性低通滤波器也可以是使用窗函数方法设计的FIR线性滤波器。
可选的,使用滤波方式对高频信号进行相位恢复处理,相应的处理可以如下:
将高频信号通过全通形态的BIQUAD IIR滤波,得到相位恢复处理后的高频信号。
在实施中,一般导线传输音频模拟信号的群延特性(即频率越高的音频信号,相位偏移越大),终端可以将高频信号输入到全通(ALLPASS)形态的BIQUAD(双二阶)IIR(Infinite Impulse Response,无限脉冲响应)滤波算法中,全通形态的BIQUAD IIR滤波算法可以对高频信号进行非线性相位偏移,得到相位恢复处理后的高频信号。
另外,在进行相位恢复处理时,终端还可以连接有全通形态的BIQUAD IIR滤波器,将高频信号传输给全通形态的BIQUAD IIR滤波器,使该BIQUAD IIR滤波器对高频信号进行非线性相位偏移,得到相位恢复处理后的高频信号,返回给终端。
可选的,对于不同的采样率,全通形态的BIQUAD IIR滤波算法有不同的系数,本发明实施例中,还提供了确定全全通形态的BIQUAD IIR滤波算法的系数(系数可以认为是非归一化系数)的处理:
根据第一频率点的频率和采样率,确定BIQUAD IIR滤波的系数。
其中,BIQUAD IIR滤波算法的非归一化系数一般有a0、a1、a2、b0、b1、b2,通过这几个系数可以决定该BIQUAD IIR滤波算法的频响曲线及增益。
在实施中,在计算过程,可以首先计算G=tan(PI*(F/FS)) (1)
在式(1)中,tan表示计算正切值,PI表示圆周率,F表示第一频率点的频率,FS表示采样率。
然后计算,K=1/(1+(G*SQRT(2))+G2) (2)
在式(2)中,SQRT表示开平方,G和式(1)中的G相等。
然后计算,B0=(1-(G*SQRT(2))+G2)*K (3)
在式(3)中,G和式(1)中的G相等,SQRT表示开平方,K和式(2)中的K相等。
然后计算,B1=2*(G2–1)*K (4)
在式(4)中,G和式(1)中的G相等,K和式(1)中的K相等。
然后将BI赋给A1,即A1=B1,然后将B0赋给A2,即A2=B0。
上述的a0、a1、a2、b0、b1、b2可以分别等于1、A1、A2、B0、B1、1
这样,就可以得到全通形态的BIQUAD IIR滤波算法的非归一化系数,在进行相位恢复时,可以使用这组系数。
需要说明的是,上述BIQUAD IIR滤波算法实现的功能与BIQUAD IIR滤波器实现的功能完全相同,BIQUAD IIR滤波器是一种常用的IIR滤波器。
步骤107,将相位恢复处理后的高频信号和低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
在实施中,终端可以将相位恢复处理后的高频信号和低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
可选的,在步骤103中,如果不存在第一频率点,可以进行如下处理:
根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带,将所述多个频率子带的音频信号的进行合成;将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
其中,第二频率点可以是预设的频率点,并且存储在终端中,也可以是基于上一次缓存预设数目个采样点采样的音频信号,确定出的第一频率点,例如,当前时第三次缓存预设数目个采样点采样的音频信号,可以获取基于第二次缓存预设数目个采样点采样的音频信号,确定出的第一频率点。
在实施中,终端得到FFT结果后,FFT结果是频谱,可以根据频谱计算出功率谱,在功率谱中,每个频率点对应一个功率,然后终端可以扫描功率谱,寻找功率断崖式的衰减点,也就是寻找满足预设条件的第一频率点,如果不存在满足预设条件的第一频率点,则可以将预设数目个采样点采样的音频信号输入到MDCT算法中,转换为等宽的多个频率子带的音频信号,由于不存在第一频率点,所以可以将等宽的多个频率子带的音频信号输入到逆MDCT算法中进行合成,得到合成后的音频信号。
然后将合成后的音频信号通过线性高通滤波,得到高频信号,高频信号的频率大于或等于第二频率点的频率,并且可以将合成后的音频信号通过线性低通滤波,得到低频信号,低频信号的频率小于第二频率点的频率。
然后可以将低频信号和高频信号进行叠加,也就得到采样的音频信号。
虽然本次不存在第一频率点,但是为了防止连续两次采样得到的音频信号出现突变,所以还是要先分离得到频率子带,然后进行合成等处理。
需要说明的是,上述过程中,对于一个压缩的音频,每次采样到预设数目个采样点的音频信号就进行上述步骤101至步骤107的处理,直到一个压缩的音频中已经全部被恢复出来。
还需要说明的是,本发明实施例中的音频可以是任意的音频格式,如MP3、AAC(Advanced Audio Coding,高级音频编码)、WMA(Windows Media Audio))等。另外,在本申请中可以通过调节步骤101中的预设数目,以调整一次处理的音频信号的数据量,以适用于各种计算能力的平台,对超低功耗的弱计算能力平台亦可适用。
本发明实施例中,在有损格式的音频中,每次缓存预设数目个采样点采样的音频信号后,可以对采样得到的音频信号进行FFT处理,得到FFT结果;根据FFT结果,如果存在满足预设条件的第一频率点,则将预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定包含第一频率点的目标频率子带,然后基于目标频率子带的前一个频率子带的音频信号,对多个频率子带中目标频率子带以及目标频率子带之后的频率子带的音频信号进行恢复,然后将目标频率子带之前的频率子带的音频信号、目标频率子带的音频信号和多个频率子带中目标频率子带之后的频率子带的音频信号进行合成,将合成后的音频信号,按照第一频率点进行分离,得到高频信号和低频信号,对高频信号进行相位恢复处理,将相位恢复处理后的高频信号和低频信号进行叠加,得到恢复高频信号后的采样的音频信号,这样,由于可以将采样的音频信号中的高频信号被恢复出来,所以采样的音频信号也就被恢复出来,提供了一种恢复音频信号的方法。
基于相同的技术构思,本发明实施例还提供了一种恢复音频的装置,如图3所示,该装置包括:
缓存模块310,用于缓存预设数目个采样点采样的音频信号;
傅氏变换模块320,用于对采样得到的音频信号进行快速傅氏变换算法FFT处理,得到FFT结果;
转换模块330,用于根据所述FFT结果,如果存在满足预设条件的第一频率点,则将所述预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号;
确定模块340,用于确定所述第一频率点所属的目标频率子带;其中,所述预设条件为所述第一频率点与第二频率点的频率之差小于第一预设数值,且所述第一频率点与所述第二频率点的功率之差大于第二预设数值,且频率大于所述第一频率点的频率的频率点的功率为零,所述第二频率点的频率小于所述第一频率点的频率;
恢复模块350,用于根据所述目标频率子带的前一个频率子带的音频信号,对所述多个频率子带中所述目标频率子带以及所述目标频率子带之后的频率子带的音频信号进行恢复;
合成模块360,用于将所述多个频率子带中所述目标频率子带之前的频率子带的音频信号、所述目标频率子带的音频信号和所述多个频率子带中所述目标频率子带之后的频率子带的音频信号进行合成;
分离模块370,用于将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号;
所述恢复模块350,还用于对所述高频信号进行相位恢复处理;
叠加模块380,用于将相位恢复处理后的高频信号和所述低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
可选的,所述转换模块330,还用于根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带;
所述合成模块360,还用于将所述多个频率子带的音频信号的进行合成;
所述分离模块370,还用于将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;
所述叠加模块380,还用于将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
可选的,所述分离模块370,用于:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号,其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
可选的,所述恢复模块350,用于:
将所述高频信号通过全通形态的BIQUAD IIR滤波,得到相位恢复处理后的高频信号。
可选的,所述确定模块340,还用于:
根据所述第一频率点的频率和采样率,确定所述BIQUAD IIR滤波的系数。
可选的,如图4所示,所述装置还包括:,
加窗模块390,用于在对采样得到的音频信号进行FFT处理得到FFT结果之前,对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;
所述傅氏变换模块320,用于:
对所述加窗处理后的音频信号进行FFT处理,得到FFT结果。
本发明实施例中,在有损格式的音频中,每次缓存预设数目个采样点采样的音频信号后,可以对采样得到的音频信号进行FFT处理,得到FFT结果;根据FFT结果,如果存在满足预设条件的第一频率点,则将预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定包含第一频率点的目标频率子带,然后基于目标频率子带的前一个频率子带的音频信号,对多个频率子带中目标频率子带以及目标频率子带之后的频率子带的音频信号进行恢复,然后将目标频率子带之前的频率子带的音频信号、目标频率子带的音频信号和多个频率子带中目标频率子带之后的频率子带的音频信号进行合成,将合成后的音频信号,按照第一频率点进行分离,得到高频信号和低频信号,对高频信号进行相位恢复处理,将相位恢复处理后的高频信号和低频信号进行叠加,得到恢复高频信号后的采样的音频信号,这样,由于可以将采样的音频信号中的高频信号被恢复出来,所以采样的音频信号也就被恢复出来,提供了一种恢复音频信号的方法。
需要说明的是:上述实施例提供的恢复音频信号的装置在恢复音频信号时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的恢复音频信号的装置与恢复音频信号的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5示出了本发明一个示例性实施例提供的终端500的结构框图。该终端500可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端500包括有:处理器501和存储器502。
处理器501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的恢复音频数据的方法。
在一些实施例中,终端500还可选包括有:外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地,外围设备包括:射频电路504、触摸显示屏505、摄像头506、音频电路507、定位组件508和电源509中的至少一种。
外围设备接口503可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中,处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上;在一些其他实施例中,处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时,显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时,显示屏505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏505可以为一个,设置终端500的前面板;在另一些实施例中,显示屏505可以为至少两个,分别设置在终端500的不同表面或呈折叠设计;在再一些实施例中,显示屏505可以是柔性显示屏,设置在终端500的弯曲表面上或折叠面上。甚至,显示屏505还可以设置成非矩形的不规则图形,也即异形屏。显示屏505可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件506用于采集图像或视频。可选地,摄像头组件506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器501进行处理,或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路507还可以包括耳机插孔。
定位组件508用于定位终端500的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件508可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源509用于为终端500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于:加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。
加速度传感器511可以检测以终端500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号,控制触摸显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器512可以检测终端500的机体方向及转动角度,陀螺仪传感器512可以与加速度传感器511协同采集用户对终端500的3D动作。处理器501根据陀螺仪传感器512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器513可以设置在终端500的侧边框和/或触摸显示屏505的下层。当压力传感器513设置在终端500的侧边框时,可以检测用户对终端500的握持信号,由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在触摸显示屏505的下层时,由处理器501根据用户对触摸显示屏505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器514用于采集用户的指纹,由处理器501根据指纹传感器514采集到的指纹识别用户的身份,或者,由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置终端500的正面、背面或侧面。当终端500上设置有物理按键或厂商Logo时,指纹传感器514可以与物理按键或厂商Logo集成在一起。
光学传感器515用于采集环境光强度。在一个实施例中,处理器501可以根据光学传感器515采集的环境光强度,控制触摸显示屏505的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏505的显示亮度;当环境光强度较低时,调低触摸显示屏505的显示亮度。在另一个实施例中,处理器501还可以根据光学传感器515采集的环境光强度,动态调整摄像头组件506的拍摄参数。
接近传感器516,也称距离传感器,通常设置在终端500的前面板。接近传感器516用于采集用户与终端500的正面之间的距离。在一个实施例中,当接近传感器516检测到用户与终端500的正面之间的距离逐渐变小时,由处理器501控制触摸显示屏505从亮屏状态切换为息屏状态;当接近传感器516检测到用户与终端500的正面之间的距离逐渐变大时,由处理器501控制触摸显示屏505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图5中示出的结构并不构成对终端500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种恢复音频信号的方法,其特征在于,所述方法包括:
缓存预设数目个采样点采样的音频信号,所述预设数目等于2的N次方;
对采样得到的音频信号进行快速傅氏变换算法FFT处理,得到FFT结果;
根据所述FFT结果,如果存在满足预设条件的第一频率点,则使用多相滤波器将所述预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,确定所述第一频率点所属的目标频率子带;其中,所述预设条件为所述第一频率点与第二频率点的频率之差小于第一预设数值,且所述第一频率点与所述第二频率点的功率之差大于第二预设数值,且频率大于所述第一频率点的频率的频率点的功率为零,所述第二频率点的频率小于所述第一频率点的频率,所述多个频率子带的数目大于或等于3,所述多个频率子带的数目等于二分之一所述预设数目;
根据第K-1个频率子带的音频信号,对第K个频率子带的音频信号进行恢复,其中,所述多个频率子带的数目为M-1,且第K-1个频率子带的频率小于第K个频率子带的频率,N≤K≤M-1,第N个频率子带为所述目标频率子带;
将所述多个频率子带中所述目标频率子带之前的频率子带的音频信号、所述目标频率子带的音频信号和所述多个频率子带中所述目标频率子带之后的频率子带的音频信号进行合成;
将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号,根据所述第一频率点的频率和所述采样的音频信号的采样率,确定全通形态的双二阶无限脉冲响应BIQUAD IIR滤波的非归一化系数,其中,所述非归一化系数是决定所述BIQUAD IIR滤波的算法的频响曲线和增益的系数;将所述高频信号通过所述BIQUAD IIR滤波进行非线性相位偏移,得到相位恢复处理后的高频信号;
将相位恢复处理后的高频信号和所述低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带,将所述多个频率子带的音频信号的进行合成;
将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;
将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
3.根据权利要求1所述的方法,其特征在于,所述将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号,包括:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号,其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
4.根据权利要求1所述的方法,其特征在于,所述对采样得到的音频信号进行FFT处理,得到FFT结果之前,还包括:
对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;
所述对采样得到的音频信号进行FFT处理,得到FFT结果,包括:
对所述加窗处理后的音频信号进行FFT处理,得到FFT结果。
5.一种恢复音频信号的装置,其特征在于,所述装置包括:
缓存模块,用于缓存预设数目个采样点采样的音频信号,所述预设数目等于2的N次方;
傅氏变换模块,用于对采样得到的音频信号进行快速傅氏变换算法FFT处理,得到FFT结果;
转换模块,用于根据所述FFT结果,如果存在满足预设条件的第一频率点,则使用多相滤波器将所述预设数目个采样点采样的音频信号转换为等宽的多个频率子带的音频信号,所述多个频率子带的数目大于或等于3,所述多个频率子带的数目等于二分之一所述预设数目;
确定模块,用于确定所述第一频率点所属的目标频率子带;其中,所述预设条件为所述第一频率点与第二频率点的频率之差小于第一预设数值,且所述第一频率点与所述第二频率点的功率之差大于第二预设数值,且频率大于所述第一频率点的频率的频率点的功率为零,所述第二频率点的频率小于所述第一频率点的频率;
恢复模块,用于根据第K-1个频率子带的音频信号,对第K个频率子带的音频信号进行恢复,其中,所述多个频率子带的数目为M-1,且第K-1个频率子带的频率小于第K个频率子带的频率,N≤K≤M-1,第N个频率子带为所述目标频率子带;
合成模块,用于将所述多个频率子带中所述目标频率子带之前的频率子带的音频信号、所述目标频率子带的音频信号和所述多个频率子带中所述目标频率子带之后的频率子带的音频信号进行合成;
分离模块,用于将合成后的音频信号,按照所述第一频率点进行分离,得到高频信号和低频信号;
所述确定模块,还用于根据所述第一频率点的频率和所述采样的音频信号的采样率,确定全通形态的双二阶无限脉冲响应BIQUAD IIR滤波的非归一化系数,其中,所述非归一化系数是决定所述BIQUAD IIR滤波的算法的频响曲线和增益的系数;
所述恢复模块,还用于将所述高频信号通过所述BIQUAD IIR滤波进行非线性相位偏移,得到相位恢复处理后的高频信号;
叠加模块,用于将相位恢复处理后的高频信号和所述低频信号进行叠加,得到恢复高频信号后的采样的音频信号。
6.根据权利要求5所述的装置,其特征在于,所述转换模块,还用于根据所述FFT结果,如果不存在所述第一频率点,则将所述预设数目个采样点采样的音频信号转换到等宽的多个频率子带;
所述合成模块,还用于将所述多个频率子带的音频信号的进行合成;
所述分离模块,还用于将所述多个频率子带的音频信号的进行合成得到的音频信号,按照预设的第二频率点进行分离,得到高频信号和低频信号;
所述叠加模块,还用于将按照预设的第二频率点进行分离得到高频信号和低频信号进行叠加,得到采样的音频信号。
7.根据权利要求5所述的装置,其特征在于,所述分离模块,用于:
将合成后的音频信号通过线性高通滤波,得到高频信号,并将所述合成后的音频信号通过线性低通滤波,得到低频信号,其中,通过线性高通滤波的信号的频率大于或等于所述第一频率点的频率,通过线性低通滤波的信号的频率小于所述第一频率点的频率。
8.根据权利要求5至7任一所述的装置,其特征在于,所述装置还包括:
加窗模块,用于在对采样得到的音频信号进行FFT处理得到FFT结果之前,对采样得到的音频信号进行加窗处理,得到加窗处理后的音频信号;
所述傅氏变换模块,用于:
对所述加窗处理后的音频信号进行FFT处理,得到FFT结果。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811053050.0A CN109036457B (zh) | 2018-09-10 | 2018-09-10 | 恢复音频信号的方法和装置 |
EP18923758.9A EP3644312B1 (en) | 2018-09-10 | 2018-11-27 | Method and apparatus for recovering audio signals |
PCT/CN2018/117766 WO2020052088A1 (zh) | 2018-09-10 | 2018-11-27 | 恢复音频信号的方法和装置 |
US16/627,079 US11315582B2 (en) | 2018-09-10 | 2018-11-27 | Method for recovering audio signals, terminal and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811053050.0A CN109036457B (zh) | 2018-09-10 | 2018-09-10 | 恢复音频信号的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109036457A CN109036457A (zh) | 2018-12-18 |
CN109036457B true CN109036457B (zh) | 2021-10-08 |
Family
ID=64621113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811053050.0A Active CN109036457B (zh) | 2018-09-10 | 2018-09-10 | 恢复音频信号的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11315582B2 (zh) |
EP (1) | EP3644312B1 (zh) |
CN (1) | CN109036457B (zh) |
WO (1) | WO2020052088A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107863095A (zh) | 2017-11-21 | 2018-03-30 | 广州酷狗计算机科技有限公司 | 音频信号处理方法、装置和存储介质 |
CN108156575B (zh) | 2017-12-26 | 2019-09-27 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
CN108156561B (zh) | 2017-12-26 | 2020-08-04 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
CN110797038B (zh) * | 2019-10-30 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 音频处理方法、装置、计算机设备及存储介质 |
RU2756934C1 (ru) * | 2020-11-17 | 2021-10-07 | Ордена Трудового Красного Знамени федеральное государственное образовательное бюджетное учреждение высшего профессионального образования Московский технический университет связи и информатики (МТУСИ) | Способ и устройство измерения спектра информационных акустических сигналов с компенсацией искажений |
CN113488068B (zh) * | 2021-07-19 | 2024-03-08 | 歌尔科技有限公司 | 音频异常检测方法、装置及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046964A (zh) * | 2007-04-13 | 2007-10-03 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
CN101221763A (zh) * | 2007-01-09 | 2008-07-16 | 上海杰得微电子有限公司 | 针对子带编码音频的三维声场合成方法 |
CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
CN101471072A (zh) * | 2007-12-27 | 2009-07-01 | 华为技术有限公司 | 高频重建方法、编码模块和解码模块 |
CN102523553A (zh) * | 2012-01-29 | 2012-06-27 | 昊迪移通(北京)技术有限公司 | 一种针对移动终端设备并基于声源内容的全息音频方法和装置 |
CN107533848A (zh) * | 2015-02-27 | 2018-01-02 | 高通股份有限公司 | 用于话音恢复的系统和方法 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3123286B2 (ja) * | 1993-02-18 | 2001-01-09 | ソニー株式会社 | ディジタル信号処理装置又は方法、及び記録媒体 |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
JP2002508616A (ja) | 1998-03-25 | 2002-03-19 | レイク テクノロジー リミティド | オーディオ信号処理方法および装置 |
US20020016698A1 (en) * | 2000-06-26 | 2002-02-07 | Toshimichi Tokuda | Device and method for audio frequency range expansion |
US20020159607A1 (en) | 2001-04-26 | 2002-10-31 | Ford Jeremy M. | Method for using source content information to automatically optimize audio signal |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
CN1219414C (zh) | 2002-07-23 | 2005-09-14 | 华南理工大学 | 两扬声器虚拟5.1通路环绕声的信号处理方法 |
TWI236307B (en) | 2002-08-23 | 2005-07-11 | Via Tech Inc | Method for realizing virtual multi-channel output by spectrum analysis |
CN1753312B (zh) * | 2005-10-14 | 2010-05-12 | 吕铁良 | 一种脉冲信号的直接数字合成装置及其方法 |
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
CN100588288C (zh) | 2005-12-09 | 2010-02-03 | 华南理工大学 | 双通路立体声信号模拟5.1通路环绕声的信号处理方法 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
JP2010503881A (ja) * | 2006-09-13 | 2010-02-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声・音響送信器及び受信器のための方法及び装置 |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8335331B2 (en) | 2008-01-18 | 2012-12-18 | Microsoft Corporation | Multichannel sound rendering via virtualization in a stereo loudspeaker system |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
US8538749B2 (en) * | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
MY180550A (en) * | 2009-01-16 | 2020-12-02 | Dolby Int Ab | Cross product enhanced harmonic transposition |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CN101902679B (zh) | 2009-05-31 | 2013-07-24 | 比亚迪股份有限公司 | 立体声音频信号模拟5.1声道音频信号的处理方法 |
CN101645268B (zh) | 2009-08-19 | 2012-03-14 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
CN101695151B (zh) | 2009-10-12 | 2011-12-21 | 清华大学 | 多声道音频信号变换为双声道音频信号的方法和设备 |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
CN102883245A (zh) | 2011-10-21 | 2013-01-16 | 郝立 | 3d幻音 |
CN102568470B (zh) | 2012-01-11 | 2013-12-25 | 广州酷狗计算机科技有限公司 | 一种音频文件音质识别方法及其系统 |
JP6046169B2 (ja) * | 2012-02-23 | 2016-12-14 | ドルビー・インターナショナル・アーベー | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
KR101897455B1 (ko) * | 2012-04-16 | 2018-10-04 | 삼성전자주식회사 | 음질 향상 장치 및 방법 |
CN103116882B (zh) * | 2013-03-07 | 2015-09-16 | 上海交通大学 | 高分辨率图像复原的坐标参数获取方法及系统 |
CN103237287B (zh) | 2013-03-29 | 2015-03-11 | 华南理工大学 | 具定制功能的5.1通路环绕声耳机重放信号处理方法 |
KR102340151B1 (ko) * | 2014-01-07 | 2021-12-17 | 하만인터내셔날인더스트리스인코포레이티드 | 신호 품질-기반 압축 오디오 신호 향상 및 보상 |
JP6371376B2 (ja) * | 2014-03-27 | 2018-08-08 | パイオニア株式会社 | 音響装置及び信号処理方法 |
CN104091601A (zh) * | 2014-07-10 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 音乐品质检测方法和装置 |
CN104103279A (zh) * | 2014-07-16 | 2014-10-15 | 腾讯科技(深圳)有限公司 | 音乐真实品质判断方法和系统 |
CN104581602B (zh) | 2014-10-27 | 2019-09-27 | 广州酷狗计算机科技有限公司 | 录音数据训练方法、多轨音频环绕方法及装置 |
KR102033603B1 (ko) * | 2014-11-07 | 2019-10-17 | 삼성전자주식회사 | 오디오 신호를 복원하는 방법 및 장치 |
CN104464725B (zh) | 2014-12-30 | 2017-09-05 | 福建凯米网络科技有限公司 | 一种唱歌模仿的方法与装置 |
CN104977582B (zh) * | 2015-06-10 | 2018-09-04 | 电子科技大学 | 一种实现扫描雷达方位超分辨成像的解卷积方法 |
JP6564135B2 (ja) * | 2015-09-22 | 2019-08-21 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ信号処理 |
CN107040862A (zh) | 2016-02-03 | 2017-08-11 | 腾讯科技(深圳)有限公司 | 音频处理方法及处理系统 |
US10123120B2 (en) | 2016-03-15 | 2018-11-06 | Bacch Laboratories, Inc. | Method and apparatus for providing 3D sound for surround sound configurations |
WO2017165968A1 (en) | 2016-03-29 | 2017-10-05 | Rising Sun Productions Limited | A system and method for creating three-dimensional binaural audio from stereo, mono and multichannel sound sources |
CN105788612B (zh) * | 2016-03-31 | 2019-11-05 | 广州酷狗计算机科技有限公司 | 一种检测音质的方法和装置 |
CN105869621B (zh) | 2016-05-20 | 2019-10-25 | 广州华多网络科技有限公司 | 音频合成装置及其音频合成的方法 |
CN105872253B (zh) | 2016-05-31 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 一种直播声音处理方法及移动终端 |
CN106652986B (zh) | 2016-12-08 | 2020-03-20 | 腾讯音乐娱乐(深圳)有限公司 | 一种歌曲音频拼接方法及设备 |
CN107863095A (zh) | 2017-11-21 | 2018-03-30 | 广州酷狗计算机科技有限公司 | 音频信号处理方法、装置和存储介质 |
CN108156575B (zh) | 2017-12-26 | 2019-09-27 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
CN108156561B (zh) | 2017-12-26 | 2020-08-04 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
-
2018
- 2018-09-10 CN CN201811053050.0A patent/CN109036457B/zh active Active
- 2018-11-27 WO PCT/CN2018/117766 patent/WO2020052088A1/zh unknown
- 2018-11-27 EP EP18923758.9A patent/EP3644312B1/en active Active
- 2018-11-27 US US16/627,079 patent/US11315582B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
CN101221763A (zh) * | 2007-01-09 | 2008-07-16 | 上海杰得微电子有限公司 | 针对子带编码音频的三维声场合成方法 |
CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
CN101046964A (zh) * | 2007-04-13 | 2007-10-03 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN101471072A (zh) * | 2007-12-27 | 2009-07-01 | 华为技术有限公司 | 高频重建方法、编码模块和解码模块 |
CN102523553A (zh) * | 2012-01-29 | 2012-06-27 | 昊迪移通(北京)技术有限公司 | 一种针对移动终端设备并基于声源内容的全息音频方法和装置 |
CN107533848A (zh) * | 2015-02-27 | 2018-01-02 | 高通股份有限公司 | 用于话音恢复的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3644312A4 (en) | 2020-09-09 |
EP3644312B1 (en) | 2023-10-11 |
US11315582B2 (en) | 2022-04-26 |
EP3644312A1 (en) | 2020-04-29 |
US20200265848A1 (en) | 2020-08-20 |
WO2020052088A1 (zh) | 2020-03-19 |
CN109036457A (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109036457B (zh) | 恢复音频信号的方法和装置 | |
CN113192527B (zh) | 用于消除回声的方法、装置、电子设备和存储介质 | |
CN108156561B (zh) | 音频信号的处理方法、装置及终端 | |
CN108281152B (zh) | 音频处理方法、装置及存储介质 | |
CN109003621B (zh) | 一种音频处理方法、装置及存储介质 | |
CN108335703B (zh) | 确定音频数据的重音位置的方法和装置 | |
CN109065068B (zh) | 音频处理方法、装置及存储介质 | |
CN109524016B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN109147757B (zh) | 歌声合成方法及装置 | |
CN112133332B (zh) | 播放音频的方法、装置及设备 | |
CN109243485B (zh) | 恢复高频信号的方法和装置 | |
CN111402913A (zh) | 降噪方法、装置、设备和存储介质 | |
CN111984222B (zh) | 调节音量的方法、装置、电子设备及可读存储介质 | |
WO2019237667A1 (zh) | 播放音频数据的方法和装置 | |
CN110797042B (zh) | 音频处理方法、装置及存储介质 | |
CN111508513B (zh) | 音频处理方法及装置、计算机存储介质 | |
CN109102811B (zh) | 音频指纹的生成方法、装置及存储介质 | |
CN109243479B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
CN108364660B (zh) | 重音识别方法、装置及计算机可读存储介质 | |
CN109360577B (zh) | 对音频进行处理的方法、装置存储介质 | |
CN109360582B (zh) | 音频处理方法、装置及存储介质 | |
CN113963707A (zh) | 音频处理方法、装置、设备和存储介质 | |
CN113990340B (zh) | 音频信号的处理方法、装置、终端及存储介质 | |
CN116471259A (zh) | 舒适噪声的生成方法、装置、设备及计算机可读存储介质 | |
CN108347672B (zh) | 播放音频的方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |