[go: up one dir, main page]

CN114584913B - Foa信号和双耳信号的获得方法、声场采集装置及处理装置 - Google Patents

Foa信号和双耳信号的获得方法、声场采集装置及处理装置 Download PDF

Info

Publication number
CN114584913B
CN114584913B CN202011373789.7A CN202011373789A CN114584913B CN 114584913 B CN114584913 B CN 114584913B CN 202011373789 A CN202011373789 A CN 202011373789A CN 114584913 B CN114584913 B CN 114584913B
Authority
CN
China
Prior art keywords
sound field
signal
auricle
foa
deflection angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011373789.7A
Other languages
English (en)
Other versions
CN114584913A (zh
Inventor
李江
彭世强
周建同
王喆
李海婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202011373789.7A priority Critical patent/CN114584913B/zh
Publication of CN114584913A publication Critical patent/CN114584913A/zh
Application granted granted Critical
Publication of CN114584913B publication Critical patent/CN114584913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

本申请提供一种FOA信号和双耳信号的获得方法、声场采集装置及处理装置。本申请FOA信号和双耳信号的获得方法,包括:位于第一耳廓内的第一声场采集装置采集以获得第一FOA信号,第一耳廓为用户的左耳廓或右耳廓。第一声场采集装置将第一耳廓内的FOA信号传输给处理装置。处理装置获得多个HRTF系数,该多个HRTF系数均是以第一耳廓为中心获得的。处理装置根据第一耳廓内的FOA信号和多个HRTF系数获得对应于第一耳廓的声场信号。双耳信号包括对应于左耳廓的声场信号和对应于右耳廓的声场信号。本申请使得获得的FOA信号包含了耳廓对声场影响,更接近于真实环境下人耳听音时耳廓位置的真实声场,还在声音渲染过程中实现模拟多通道环绕声效果。

Description

FOA信号和双耳信号的获得方法、声场采集装置及处理装置
技术领域
本申请涉及音频处理技术,尤其涉及一种FOA信号和双耳信号的获得方法、声场采集装置及处理装置。
背景技术
随着高性能计算机和信号处理技术的飞速发展,虚拟现实(augmented reality,AR)或增强现实(virtual reality,VR)等技术受到越来越多的关注。一个具有沉浸感的AR或VR系统,不仅需要震撼的视觉效果,还需要逼真的听觉效果配合,视听的融合能大大提升用户的体验感。因此3D音频处理技术因其很好的沉浸感,成为AR或VR系统中的音频处理的核心技术。
3D声场经采集后通过耳机或扬声器等回放,其中采集方式可以包括双耳录音(binaural recording)、声场录音(sound field recording)等方式。但是双耳录音只能记录耳廓处的声压,无法记录声场,而声场录音不能很好的适应于人体(例如耳廓)的影响,从而影响了3D声场的还原效果。
发明内容
本申请提供一种FOA信号和双耳信号的获得方法、声场采集装置及处理装置,使得获得的FOA信号包含了耳廓对声场影响,更接近于真实环境下人耳听音时耳廓位置的真实声场,还在声音渲染过程中实现模拟多通道环绕声效果。
第一方面,本申请提供一种FOA信号和双耳信号的获得方法,包括:位于第一耳廓内的第一声场采集装置采集以获得第一一阶双音学FOA信号,所述第一耳廓为用户的左耳廓或右耳廓。第一声场采集装置将第一耳廓内的FOA信号传输给处理装置。处理装置获得多个HRTF系数,该多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且该多个HRTF系数均是以第一耳廓为中心获得的。处理装置根据第一耳廓内的FOA信号和多个HRTF系数获得对应于第一耳廓的声场信号。双耳信号包括对应于所述左耳廓的声场信号和对应于所述右耳廓的声场信号。
本申请中FOA信号可以是指用户的左耳廓内的FOA信号,也可以是指用户的右耳廓内的FOA信号,可以采用相同的方法分别获得上述两种FOA信号。以下以获得左耳廓的FOA信号为例进行描述,右耳廓的FOA信号的获得方法与此相同,不再赘述。
本申请中双耳信号包括对应于左耳廓的声场信号和对应于右耳廓的声场信号,也可以采用相同的方法分别获得对应于左耳廓的声场信号和对应于右耳廓的声场信号。以下以获得对应于左耳廓的声场信号为例进行描述,对应于右耳廓的声场信号的获得方法与此相同,不再赘述。应当理解,双耳信号是基于左右耳的,因此为获得双耳信号需要同步获得对应于左耳廓的声场信号和对应于右耳廓的声场信号。
本申请可以采用以下两种方法获得左耳廓内的FOA信号:
(1)当位于左耳廓内的左耳声场采集装置为FOA声场采集装置时,左耳声场采集设备直接采集以获得左耳廓内的FOA信号。
如图2a所示,左耳声场采集装置与左耳耳机通过连接件连接,当用户带上左耳耳机时,左耳声场采集装置随着左耳耳机一起处于用户的左耳廓内,因此左耳声场采集装置可以直接对周围的声音信号进行采集,获得左耳廓内的FOA信号。如此一来左耳声场采集装置采集到的FOA信号就包含了左耳廓对声场影响,更接近于真实环境下人的左耳听音时左耳廓位置的真实声场。图5a为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5a所示,左耳廓内的FOA信号包括四个分量Wl、Xl、Yl和Zl,其中,Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量。
在一种可能的实现方式中,由于用户在佩戴左耳耳机时,基于左耳耳机的佩戴方式,左耳声场采集装置获得的左耳廓内的FOA信号的Xl、Yl和Zl三个分量的方向并不一定每次都能如图5a所示的标准佩戴时的方向,很可能在水平方向和/或俯仰方向上发生角度偏转。图5b为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5b所示,左耳声场采集装置在水平方向上,从标准佩戴时的方向(对应于Xl和Yl)发生水平角度偏转(对应于Xl’和Yl’),其偏转角度为θ。图5c为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5c所示,左耳声场采集装置在俯仰方向上,从标准佩戴时的方向(对应于Xl和Zl)发生俯仰角度偏转(对应于Xl’和Zl’),其偏转角度为
Figure SMS_1
因此如果直接使用角度偏转时的左耳声场采集装置获得的FOA信号,可能会导致收录的声场与实际的声场不一致的情况。
左耳声场采集装置可以通过重力传感器(重力传感器可以设置于左耳声场采集装置或者左耳耳机上)获得左耳声场采集装置的偏转角度,该偏转角度包括水平偏转角度和/或俯仰偏转角度。当左耳声场采集装置的偏转角度满足第一设定条件时,左耳声场采集装置根据偏转角度对左耳声场采集装置获得的信号进行偏转校正,以获得左耳廓内的FOA信号。或者,当左耳声场采集装置的偏转角度不满足第一设定条件时,左耳声场采集装置将获得的信号作为左耳廓内的FOA信号。
可选的,本申请可以仅根据左耳声场采集装置的偏转角度对左耳声场采集装置获得的信号进行偏转校正,此时第一设定条件可以是左耳声场采集装置的偏转角度大于0,第二设定条件可以是左耳声场采集装置的偏转角度等于0。若确定要进行偏转校正,则左耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号,例如,根据水平偏转角度和/或俯仰偏转角度计算偏转校正矩阵,然后根据偏转校正矩阵和Xl’Yl’Zl’方向下的FOA信号计算以获得XlYlZl方向下的FOA信号(即为左耳廓内的FOA信号)。
可选的,本申请也可以根据左耳声场采集装置的偏转角度和右耳声场采集装置的偏转角度分别对左耳声场采集装置获得的信号和右耳声场采集装置获得的信号进行偏转校正,此时第一设定条件可以是左耳声场采集装置的水平偏转角度和右耳声场采集装置的水平偏转角度不相等,和/或,左耳声场采集装置的俯仰偏转角度和右耳声场采集装置的俯仰偏转角度不相等,第二设定条件可以是左耳声场采集装置的水平偏转角度和右耳声场采集装置的水平偏转角度相等,且,左耳声场采集装置的俯仰偏转角度和右耳声场采集装置的俯仰偏转角度相等。若确定要进行偏转校正,则左耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号,右耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号。
(2)当位于左耳廓内的左耳声场采集装置包括具有特定拓扑结构的多个麦克风时,左耳声场采集装置中的多个麦克风获得多路信号,获得多路信号与FOA信号之间的第一转换矩阵,根据多路信号和第一转换矩阵获得左耳廓内的FOA信号。
如图2b所示,左耳声场采集装置设置于左耳耳机上,当用户带上左耳耳机时,左耳声场采集装置随着左耳耳机一起处于用户的左耳廓内。此时该多个麦克风的收声一侧朝向左耳耳机的朝向外界的外壳上,而在该外壳上开孔以使得多个麦克风可以采集外界声音信号,因此通过多个麦克风可以采集到该多个麦克风各自朝向上的信号(多路信号)。图6为本申请第i个麦克风的一个示例性的示意图,如图6所示,左耳声场采集装置包括M(通常M≥4)个麦克风,1≤i≤M,左耳声场采集装置中的第i个麦克风的极坐标表示为
Figure SMS_2
其中,l表示左,dli表示左耳声场采集装置中的第i个麦克风与中心位置(即左耳廓对应的极坐标系的原点Ol)的距离,θli表示左耳声场采集装置中的第i个麦克风的方位角,
Figure SMS_3
表示左耳声场采集装置中的第i个麦克风的俯仰角。因此,左耳声场采集装置中的第i个麦克风采集的信号Sli和左耳廓内的FOA信号(Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量)有以下关系:
Figure SMS_4
进而可以得到左耳廓内的FOA信号向多个麦克风采集的多路信号转换的第二转换矩阵FMl为:
Figure SMS_5
计算上述第二转换矩阵的逆矩阵,即为多个麦克风采集的多路信号向左耳廓内的FOA信号转换的第一转换矩阵MFl:MFl=FMl-1
最后根据上述第二转换矩阵MFl和多路信号Sli(i=1~M)获得左耳廓内的FOA信号(包括Wl、Xl、Yl和Zl四个分量)为:
Figure SMS_6
以上通过位于用户的左耳廓内或右耳廓内的声场采集设备获得左耳廓内的FOA信号或右耳廓内的FOA信号,一方面可以记录双耳耳廓位置的声场,另一方面可以记录耳廓的影响,以便于获得更好的声场还原效果。
处理装置可以通过与声场采集装置之间的总线接收左耳廓内的FOA信号,也可以通过与声场采集装置之间的有线链路或无线链路接收左耳廓内的FOA信号。本申请对此不做具体限定。
本实施例中的多个HRTF系数均是以左耳廓为中心获得的,即上述麦克风的位置被模拟设置于左耳廓的位置。由于预先设定了多个虚拟扬声器的方位,因此不需要获得所有可能存在声源的地方,只需要获得与多个虚拟扬声器的方位对应的HRTF系数即可。虚拟扬声器是为了在声音渲染过程中能够模拟多通道环绕声效果而虚拟的扬声器,如果将虚拟扬声器信号通过与虚拟扬声器配置相同的扬声器系统播放出来即可获得多通道环绕声效果。
在一种可能的实现方式中,处理装置可以根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得多个HRTF系数,该第一HRTF系数集合中的HRTF系数均是以左耳廓为中心获得的。
如上所述,可以预先测量获得空间内的所有方位到左耳廓的HRTF系数,就能得到一组包含所有方位对应的HRTF系数的集合。需要说明的是,前述所有方位仅作为一种示例,但并不构成限定,即预先测量的方位的范围可以是指所有方位,也可使是指某朝向上的所有方位,还可以是指全朝向上的部分方位,本申请对此不做具体限定。
多个虚拟扬声器信号的方位已经预先设定,因此结合一组包含所有方位对应的HRTF系数的集合,从中找到与多个虚拟扬声器信号的方位分别对应的HRTF系数。
在一种可能的实现方式中,处理装置可以先根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,该第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的,然后对多个中间HRTF系数分别进行旋转处理以获得多个HRTF系数。
与上述实现方式的区别在于,在获得一组包含所有方位对应的HRTF系数的集合时,是获得空间内的所有方位到用户的头部中心的HRTF系数,即是以用户的头部中心为中心获得HRTF系数。同样的,前述所有方位仅作为一种示例,但并不构成限定,即预先测量的方位的范围可以是指所有方位,也可使是指某朝向上的所有方位,还可以是指全朝向上的部分方位,本申请对此不做具体限定。
多个虚拟扬声器信号的方位已经预先设定,因此结合一组包含所有方位对应的HRTF系数的集合,从中找到与多个虚拟扬声器信号的方位分别对应的以用户的头部中心为中心的HRTF系数。
图7为本申请HRTF系数的一个示例性的示意图,如图7所示,获得以用户的头部中心为中心的HRTF系数后,对该HRTF系数进行顺时针(+γ)旋转处理得到左耳廓的HRTF系数,对该HRTF系数进行逆时针(-γ)旋转处理得到右耳廓的HRTF系数。
处理装置可以根据左耳廓内的FOA信号获得多个虚拟扬声器信号,然后根据多个虚拟扬声器信号和多个HRTF系数获得对应于左耳廓的声场信号。
可选的,可以根据以下公式获得对应于左耳廓的第j个虚拟扬声器信号:
Figure SMS_7
其中,Plj表示对应于左耳廓的第j个虚拟扬声器信号,l表示左,1≤j≤L,L表示多个虚拟扬声器信号的总个数,Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量,
Figure SMS_8
表示对应于左耳廓的第j个虚拟扬声器信号的俯仰角,θlj表示对应于左耳廓的第j个虚拟扬声器信号的方位角。
可选的,可以根据以下公式获得对应于左耳廓的声场信号:
Figure SMS_9
其中,Yl表示对应于第一耳廓的声场信号,l表示左,L表示多个虚拟扬声器信号的总个数,Plj表示对应于左耳廓的第j个虚拟扬声器信号,HRTFlj表示与第j个虚拟扬声器信号对应、且以左耳廓为中心获得的HRTF系数。
本实施例,采集获得左耳廓内的FOA信号和右耳廓内的FOA信号,如此一来该两种FOA信号就包含了耳廓对声场影响,更接近于真实环境下人耳听音时耳廓位置的真实声场。另外,为了在声音渲染过程中能够模拟多通道环绕声效果而虚拟了多个虚拟扬声器,获得该多个虚拟扬声器信号和该多个虚拟扬声器信号对应的多个HRTF信号,该HRTF信号是以左耳廓或右耳廓为中心获得的,进而根据多个虚拟扬声器信号和多个HRTF系数将采集获得的双耳廓内的FOA信号转换为双耳廓的声场信号,如果将虚拟扬声器信号通过与虚拟扬声器配置相同的扬声器系统播放出来即可获得多通道环绕声效果。
第二方面,本申请提供一种声场采集装置,包括:采集模块,用于通过位于第一耳廓内的第一声场采集装置采集以获得第一一阶双音学FOA信号,所述第一耳廓为用户的左耳廓或右耳廓。
在一种可能的实现方式中,所述第一声场采集装置与第一耳机连接;或者,所述第一声场采集装置设置于所述第一耳机中。
在一种可能的实现方式中,所述采集模块,还用于通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一FOA信号;或者,当所述第一声场采集装置的偏转角度不满足所述第一设定条件时,将所述第一声场采集装置获得的信号作为所述第一FOA信号;其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等。
在一种可能的实现方式中,所述重力传感器设置于所述第一声场采集装置中;或者,所述重力传感器设置于第一耳机中。
在一种可能的实现方式中,所述采集模块,具体用于根据所述第一声场采集装置的偏转角度获得所述第一声场采集装置的偏转校正矩阵;根据所述第一声场采集装置获得的信号和所述偏转校正矩阵获得所述第一FOA信号。
在一种可能的实现方式中,当所述第一声场采集装置为FOA声场采集装置时,所述采集模块,具体用于所述FOA声场采集装置直接采集以获得所述第一FOA信号。
在一种可能的实现方式中,当所述第一声场采集装置包括具有特定拓扑结构的多个麦克风时,所述采集模块,具体用于通过所述多个麦克风获得多路信号;获得所述多路信号与FOA信号之间的第一转换矩阵;根据所述多路信号和所述第一转换矩阵获得所述第一FOA信号。
在一种可能的实现方式中,所述采集模块,具体用于获得所述多个麦克风各自的极坐标;根据所述多个麦克风各自的极坐标获得FOA信号和所述多路信号之间的第二转换矩阵;将所述第二矩阵的逆矩阵确定为所述第一转换矩阵。
第三方面,本申请提供一种处理装置,包括:获得模块,用于获得第一一阶双音学FOA信号,所述第一FOA信号是位于第一耳廓内的第一声场采集装置采集获得的,第一耳廓为用户的左耳廓或右耳廓;获得多个头部相关传输函数HRTF系数,所述多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且所述多个HRTF系数均是以所述第一耳廓为中心获得的;处理模块,用于根据所述第一FOA信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号;其中,所述双耳信号包括对应于所述左耳廓的声场信号和对应于所述右耳廓的声场信号。
在一种可能的实现方式中,所述获得模块,具体用于根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得所述多个HRTF系数,所述第一HRTF系数集合中的HRTF系数均是以所述第一耳廓为中心获得的。
在一种可能的实现方式中,所述获得模块,具体用于根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,所述第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的;对所述多个中间HRTF系数分别进行旋转处理以获得所述多个HRTF系数。
在一种可能的实现方式中,所述处理模块,具体用于根据所述第一FOA信号获得所述多个虚拟扬声器信号;根据所述多个虚拟扬声器信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号。
在一种可能的实现方式中,所述处理模块,具体用于根据以下公式获得第j个虚拟扬声器信号:
Figure SMS_10
其中,Pij表示所述第j个虚拟扬声器信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Wi表示所述第一FOA信号的环境分量,Xi表示所述第一FOA信号的X轴方向分量,Yi表示所述第一FOA信号的Y轴方向分量,Zi表示所述第一FOA信号的Z轴方向分量,
Figure SMS_11
表示第j个虚拟扬声器信号的俯仰角,θij表示第j个虚拟扬声器信号的方位角。
在一种可能的实现方式中,所述处理模块,具体用于根据以下公式获得对应于所述第一耳廓的声场信号:
Figure SMS_12
其中,Yi表示所述对应于所述第一耳廓的声场信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Pij表示第j个虚拟扬声器信号,HRTFij表示与所述第j个虚拟扬声器信号对应、且以所述第一耳廓为中心获得的HRTF系数。
第四方面,本申请提供一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中任一项所述的方法。
第五方面,本申请提供一种计算机可读存储介质,其特征在于,包括计算机程序,所述计算机程序在计算机上被执行时,使得所述计算机执行上述第一方面中任一项所述的方法。
第六方面,本申请提供一种计算机程序,其特征在于,当所述计算机程序被计算机执行时,用于执行上述第一方面中任一项所述的方法。
附图说明
图1为本申请双耳信号的获得系统的一个示例性的结构图;
图2a为本申请声场采集装置的一种示例性的结构图;
图2b为本申请声场采集装置的一种示例性的结构图;
图3为本申请电子设备的一个示意性的结构图;
图4为本申请双耳信号的获得方法的一个示例性的流程图;
图5a为本申请左耳廓内的FOA信号的一个示例性的示意图;
图5b为本申请左耳廓内的FOA信号的一个示例性的示意图;
图5c为本申请左耳廓内的FOA信号的一个示例性的示意图;
图6为本申请第i个麦克风的一个示例性的示意图;
图7为本申请HRTF系数的一个示例性的示意图;
图8为本申请声场采集装置的一个示例性的结构示意图;
图9为本申请处理装置的一个示例性的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书实施例和权利要求书及附图中的术语“第一”、“第二”等仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
图1为本申请双耳信号的获得系统的一个示例性的结构图,如图1所示,该系统包括声场采集装置和处理装置,其中,声场采集装置与入耳式耳机相关联。需要说明的是,本申请对耳机并不仅限定于是入耳式耳机,还可以是半入耳式耳机,只要用户佩戴上耳机后该耳机处于用户的耳廓内均可用于实现本申请的方案。为便于描述,下文统一称作入耳式耳机;处理装置可以是电子设备,例如手机、平板电脑或计算机等终端设备,又例如智能眼镜、入耳式耳机等可穿戴设备,处理装置也可以是处理芯片,该处理芯片可以设置于前述电子设备中。需要说明的是,本申请对处理装置的具体实现形式不做具体限定。
如果声场采集装置和处理装置设置于同一设备中,例如声场采集装置和处理装置均是入耳式耳机中的部件,则二者之间可以通过设备内部的总线进行指令或数据传输;如果声场采集装置和处理装置设置于不同设备中,例如声场采集装置与入耳式耳机连接,处理装置设置于手机中,则二者之间可以创建有线链路或无线链路以进行指令或数据传输。
在一种可能的实现方式中,声场采集装置可以是一阶双音学(firs-orderambisonics,FOA)声场采集装置,FOA声场采集装置可以直接对周围的声音信号进行采集,以获得FOA信号。例如,FOA声场采集装置由朝向正面左上(front left up,FLU)、正面右下(front right down,FRD)、背面左下(back left down,BLD)以及背面右上(back rightup,BRU)的4路麦克风构成,通过该4路麦克风采集获得FOA信号;或者,FOA声场采集装置由朝向正面左下(front left down,FLD)、正面右上(front right up,FRU)、背面左上(backleft up,BLU)以及背面右下(back right down,BRD)的4路麦克风构成,通过该4路麦克风采集获得FOA信号。图2a为本申请声场采集装置的一种示例性的结构图,如图2a所示,入耳式耳机包括左耳耳机和右耳耳机,相应的,声场采集装置也包括左耳声场采集装置和右耳声场采集装置。左耳声场采集装置通过连接件与左耳耳机连接,右耳声场采集装置通过连接件与右耳耳机连接。基于入耳式耳机的特性,用户在佩戴上上述入耳式耳机时,左耳声场采集装置可以位于左耳廓内,右耳声场采集装置可以位于右耳廓内。
在一种可能的实现方式中,声场采集装置可以具有特定拓扑结构的多个麦克风,多个麦克风可以分别采集多路信号,进而根据该多路信号获得FOA信号。图2b为本申请声场采集装置的一种示例性的结构图,如图2b所示,入耳式耳机包括左耳耳机和右耳耳机,相应的,声场采集装置也包括左耳声场采集装置和右耳声场采集装置。左耳声场采集装置设置于左耳耳机上,多个麦克风的收声一侧朝向左耳耳机的朝向外界的外壳上,而在该外壳上开孔以使得多个麦克风可以采集外界声音信号。右耳声场采集装置的结构与左耳声场采集装置的结构相同。基于入耳式耳机的特性,用户在佩戴上上述入耳式耳机时,左耳声场采集装置可以位于左耳耳廓内,右耳声场采集装置可以位于右耳耳廓内。
图3为本申请电子设备的一个示意性的结构图,图3示出了电子设备为手机时的结构图。
如图3,手机300可以包括处理器310,外部存储器接口320,内部存储器321,通用串行总线(universal serial bus,USB)接口330,充电管理模块340,电源管理模块341,电池342,天线1,天线2,移动通信模块350,无线通信模块360,音频模块370,扬声器370A,受话器370B,麦克风370C,耳机接口370D,传感器模块380,按键390,马达391,指示器392,摄像头393,显示屏394,以及用户标识模块(subscriber identification module,SIM)卡接口395等。其中传感器模块380可以包括压力传感器380A,陀螺仪传感器380B,气压传感器380C,磁传感器380D,加速度传感器380E,距离传感器380F,接近光传感器380G,指纹传感器380H,温度传感器380J,触摸传感器380K,环境光传感器380L,骨传导传感器380M等。
可以理解的是,本发明实施例示意的结构并不构成对手机300的具体限定。在本申请另一些实施例中,手机300可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器310可以包括一个或多个处理单元,例如:处理器310可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器310中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器310中的存储器为高速缓冲存储器。该存储器可以保存处理器310刚用过或循环使用的指令或数据。如果处理器310需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器310的等待时间,因而提高了系统的效率。
在一些实施例中,处理器310可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器310可以包含多组I2C总线。处理器310可以通过不同的I2C总线接口分别耦合触摸传感器380K,充电器,闪光灯,摄像头393等。例如:处理器310可以通过I2C接口耦合触摸传感器380K,使处理器310与触摸传感器380K通过I2C总线接口通信,实现手机300的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器310可以包含多组I2S总线。处理器310可以通过I2S总线与音频模块370耦合,实现处理器310与音频模块370之间的通信。在一些实施例中,音频模块370可以通过I2S接口向无线通信模块360传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块370与无线通信模块360可以通过PCM总线接口耦合。在一些实施例中,音频模块370也可以通过PCM接口向无线通信模块360传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器310与无线通信模块360。例如:处理器310通过UART接口与无线通信模块360中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块370可以通过UART接口向无线通信模块360传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器310与显示屏394,摄像头393等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器310和摄像头393通过CSI接口通信,实现手机300的拍摄功能。处理器310和显示屏394通过DSI接口通信,实现手机300的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器310与摄像头393,显示屏394,无线通信模块360,音频模块370,传感器模块380等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口330是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口330可以用于连接充电器为手机300充电,也可以用于手机300与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他手机,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对手机300的结构限定。在本申请另一些实施例中,手机300也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块340用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块340可以通过USB接口330接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块340可以通过手机300的无线充电线圈接收无线充电输入。充电管理模块340为电池342充电的同时,还可以通过电源管理模块341为手机供电。
电源管理模块341用于连接电池342,充电管理模块340与处理器310。电源管理模块341接收电池342和/或充电管理模块340的输入,为处理器310,内部存储器321,显示屏394,摄像头393,和无线通信模块360等供电。电源管理模块341还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块341也可以设置于处理器310中。在另一些实施例中,电源管理模块341和充电管理模块340也可以设置于同一个器件中。
手机300的无线通信功能可以通过天线1,天线2,移动通信模块350,无线通信模块360,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。手机300中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块350可以提供应用在手机300上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块350可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,LNA)等。移动通信模块350可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块350还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块350的至少部分功能模块可以被设置于处理器310中。在一些实施例中,移动通信模块350的至少部分功能模块可以与处理器310的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器370A,受话器370B等)输出声音信号,或通过显示屏394显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器310,与移动通信模块350或其他功能模块设置在同一个器件中。
无线通信模块360可以提供应用在手机300上的包括无线局域网(wireless localarea networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequencymodulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块360可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块360经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器310。无线通信模块360还可以从处理器310接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,手机300的天线1和移动通信模块350耦合,天线2和无线通信模块360耦合,使得手机300可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(code divisionmultiple access,CDMA),宽带码分多址(wideband code division multiple access,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(globalnavigation satellite system,GLONASS),北斗卫星导航系统(beidou navigationsatellite system,BDS),准天顶卫星系统(quasi-zenith satellite system,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
手机300通过GPU,显示屏394,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏394和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器310可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏394用于显示图像,视频等。显示屏394包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,手机300可以包括1个或N个显示屏394,N为大于1的正整数。
手机300可以通过ISP,摄像头393,视频编解码器,GPU,显示屏394以及应用处理器等实现拍摄功能。
ISP用于处理摄像头393反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头393中。
摄像头393用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,手机300可以包括1个或N个摄像头393,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当手机300在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。手机300可以支持一种或多种视频编解码器。这样,手机300可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现手机300的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口320可以用于连接外部存储卡,例如Micro SD卡,实现扩展手机300的存储能力。外部存储卡通过外部存储器接口320与处理器310通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器321可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器321可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储手机300使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器321可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器310通过运行存储在内部存储器321的指令,和/或存储在设置于处理器中的存储器的指令,执行手机300的各种功能应用以及数据处理。
手机300可以通过音频模块370,扬声器370A,受话器370B,麦克风370C,耳机接口370D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块370用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块370还可以用于对音频信号编码和解码。在一些实施例中,音频模块370可以设置于处理器310中,或将音频模块370的部分功能模块设置于处理器310中。
扬声器370A,也称“喇叭”,用于将音频电信号转换为声音信号。手机300可以通过扬声器370A收听音乐,或收听免提通话。
受话器370B,也称“听筒”,用于将音频电信号转换成声音信号。当手机300接听电话或语音信息时,可以通过将受话器370B靠近人耳接听语音。
麦克风370C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风370C发声,将声音信号输入到麦克风370C。手机300可以设置至少一个麦克风370C。在另一些实施例中,手机300可以设置两个麦克风370C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,手机300还可以设置三个,四个或更多麦克风370C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口370D用于连接有线耳机。耳机接口370D可以是USB接口330,也可以是3.5mm的开放移动手机平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器380A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器380A可以设置于显示屏394。压力传感器380A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。
陀螺仪传感器380B可以用于确定手机300的运动姿态。
气压传感器380C用于测量气压。
磁传感器380D包括霍尔传感器。
加速度传感器380E可检测手机300在各个方向上(一般为三轴)加速度的大小。
距离传感器380F,用于测量距离。
接近光传感器380G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。
环境光传感器380L用于感知环境光亮度。
指纹传感器380H用于采集指纹。
温度传感器380J用于检测温度。
触摸传感器380K,也称“触控器件”。触摸传感器380K可以设置于显示屏394,由触摸传感器380K与显示屏394组成触摸屏,也称“触控屏”。触摸传感器380K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏394提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器380K也可以设置于手机300的表面,与显示屏394所处的位置不同。
骨传导传感器380M可以获得振动信号。
按键390包括开机键,音量键等。按键390可以是机械按键。也可以是触摸式按键。手机300可以接收按键输入,产生与手机300的用户设置以及功能控制有关的键信号输入。
马达391可以产生振动提示。马达391可以用于来电振动提示,也可以用于触摸振动反馈。
指示器392可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口395用于连接SIM卡。SIM卡可以通过插入SIM卡接口395,或从SIM卡接口395拔出,实现和手机300的接触和分离。手机300可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口395可以支持Nano SIM卡,Micro SIM卡,SIM卡等。手机300通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,手机300采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在手机300中,不能和手机300分离。
可以理解的是,本发明实施例示意的结构并不构成对电子设备的具体限定。在本申请另一些实施例中,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
图4为本申请双耳信号的获得方法的一个示例性的流程图,如图4所示,过程400可由图1中的声场采集装置+处理装置执行,声场采集装置和处理装置可以设置于同一设备中,例如声场采集装置和处理装置均是耳机中的部件(例如如图2b所示),二者之间可以通过设备内部的总线进行指令或数据传输;声场采集装置和处理装置也可以设置于不同设备中,例如声场采集装置与入耳式耳机连接(例如如图2a所示),处理装置设置于手机(例如如图3所示)中,二者之间可以创建有线链路或无线链路以进行指令或数据传输。过程400描述为一系列的步骤或操作,应当理解的是,过程400可以以各种顺序执行和/或同时发生,不限于图4所示的执行顺序。
本申请中FOA信号可以是指用户的左耳廓内的FOA信号,也可以是指用户的右耳廓内的FOA信号,可以采用相同的方法分别获得上述两种FOA信号。以下以获得左耳廓的FOA信号为例进行描述,右耳廓的FOA信号的获得方法与此相同,不再赘述。
本申请中双耳信号包括对应于左耳廓的声场信号和对应于右耳廓的声场信号,也可以采用相同的方法分别获得对应于左耳廓的声场信号和对应于右耳廓的声场信号。以下以获得对应于左耳廓的声场信号为例进行描述,对应于右耳廓的声场信号的获得方法与此相同,不再赘述。应当理解,双耳信号是基于左右耳的,因此为获得双耳信号需要同步获得对应于左耳廓的声场信号和对应于右耳廓的声场信号。
步骤401、位于左耳廓内的左耳声场采集装置采集以获得左耳廓内的FOA信号。
本申请可以采用以下两种方法获得左耳廓内的FOA信号:
(1)当位于左耳廓内的左耳声场采集装置为FOA声场采集装置时,左耳声场采集设备直接采集以获得左耳廓内的FOA信号。
如图2a所示,左耳声场采集装置与左耳耳机通过连接件连接,当用户带上左耳耳机时,左耳声场采集装置随着左耳耳机一起处于用户的左耳廓内,因此左耳声场采集装置可以直接对周围的声音信号进行采集,获得左耳廓内的FOA信号。如此一来左耳声场采集装置采集到的FOA信号就包含了左耳廓对声场影响,更接近于真实环境下人的左耳听音时左耳廓位置的真实声场。图5a为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5a所示,左耳廓内的FOA信号包括四个分量Wl、Xl、Yl和Zl,其中,Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量。
在一种可能的实现方式中,由于用户在佩戴左耳耳机时,基于左耳耳机的佩戴方式,左耳声场采集装置获得的左耳廓内的FOA信号的Xl、Yl和Zl三个分量的方向并不一定每次都能如图5a所示的标准佩戴时的方向,很可能在水平方向和/或俯仰方向上发生角度偏转。图5b为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5b所示,左耳声场采集装置在水平方向上,从标准佩戴时的方向(对应于Xl和Yl)发生水平角度偏转(对应于Xl’和Yl’),其偏转角度为θ。图5c为本申请左耳廓内的FOA信号的一个示例性的示意图,如图5c所示,左耳声场采集装置在俯仰方向上,从标准佩戴时的方向(对应于Xl和Zl)发生俯仰角度偏转(对应于Xl’和Zl’),其偏转角度为
Figure SMS_13
因此如果直接使用角度偏转时的左耳声场采集装置获得的FOA信号,可能会导致收录的声场与实际的声场不一致的情况。
左耳声场采集装置可以通过重力传感器(重力传感器可以设置于左耳声场采集装置或者左耳耳机上)获得左耳声场采集装置的偏转角度,该偏转角度包括水平偏转角度和/或俯仰偏转角度。当左耳声场采集装置的偏转角度满足第一设定条件时,左耳声场采集装置根据偏转角度对左耳声场采集装置获得的信号进行偏转校正,以获得左耳廓内的FOA信号。或者,当左耳声场采集装置的偏转角度不满足第一设定条件时,左耳声场采集装置将获得的信号作为左耳廓内的FOA信号。
可选的,本申请可以仅根据左耳声场采集装置的偏转角度对左耳声场采集装置获得的信号进行偏转校正,此时第一设定条件可以是左耳声场采集装置的偏转角度大于0。若确定要进行偏转校正,则左耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号,例如,根据水平偏转角度和/或俯仰偏转角度计算偏转校正矩阵,然后根据偏转校正矩阵和Xl’Yl’Zl’方向下的FOA信号计算以获得XlYlZl方向下的FOA信号(即为左耳廓内的FOA信号)。
例如,假设左耳声场采集装置的水平偏转角度为θ,俯仰偏转角度为
Figure SMS_14
θ和/或
Figure SMS_15
大于0,根据水平偏转角度θ和俯仰偏转角度
Figure SMS_16
计算偏转校正矩阵R:
Figure SMS_17
根据偏转校正矩阵R和Xl’Yl’Zl’方向下的FOA信号计算以获得XlYlZl方向下的FOA信号,可以是:
[Xl Yl Zl]=R·[Xl’ Yl’ Zl’]
其中,·表示向量之间的点积。
可选的,本申请也可以根据左耳声场采集装置的偏转角度和右耳声场采集装置的偏转角度分别对左耳声场采集装置获得的信号和右耳声场采集装置获得的信号进行偏转校正,此时第一设定条件可以是左耳声场采集装置的水平偏转角度和右耳声场采集装置的水平偏转角度不相等,和/或,左耳声场采集装置的俯仰偏转角度和右耳声场采集装置的俯仰偏转角度不相等,第二设定条件可以是左耳声场采集装置的水平偏转角度和右耳声场采集装置的水平偏转角度相等,且,左耳声场采集装置的俯仰偏转角度和右耳声场采集装置的俯仰偏转角度相等。若确定要进行偏转校正,则左耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号,右耳声场采集装置将Xl’Yl’Zl’方向下的FOA信号转换成XlYlZl方向下的FOA信号。
例如,假设左耳声场采集装置的水平偏转角度为θL、俯仰偏转角度为
Figure SMS_18
右耳声场采集装置的水平偏转角度为θR、俯仰偏转角度为
Figure SMS_19
(a)当θL=θR
Figure SMS_20
时,左耳声场采集装置可以直接采集以获得左耳廓内的FOA信号,右耳声场采集装置可以直接采集以获得右耳廓内的FOA信号。
(b)当θL=θR
Figure SMS_21
时,可以根据左耳声场采集装置的俯仰偏转角度
Figure SMS_22
和右耳声场采集装置的俯仰偏转角度
Figure SMS_23
同时对左耳廓内的FOA信号和右耳廓内的FOA信号进行俯仰方向的偏转校正:
左耳廓内的FOA信号的俯仰方向校正矩阵RVL,满足:
Figure SMS_24
右耳廓内的FOA信号的俯仰方向校正矩阵RVR,满足:
Figure SMS_25
根据Xl’L Yl’L Zl’L方向下的左耳廓内的FOA信号以及左耳廓内的FOA信号的俯仰方向校正矩阵RVL,获得偏转校正后的左耳廓内的FOA信号,满足:
[XlL YlL ZlL]=RVL·[Xl’L Yl’L Zl’L]
根据Xl’R Yl’R Zl’R方向下的右耳廓内的FOA信号以及右耳廓内的FOA信号的俯仰方向校正矩阵RVR,获得偏转校正后的右耳廓内的FOA信号,满足:
[XlR YlR ZlR]=RVR·[Xl’R Yl’R Zl’R]
可选的,可以以左耳廓内的FOA信号为基准仅对右耳廓内的FOA信号进行俯仰方向的偏转校正,右耳廓内的FOA信号的俯仰方向校正矩阵RVR,满足:
Figure SMS_26
可选的,可以以右耳廓内的FOA信号为基准仅对左耳廓内的FOA信号进行俯仰方向的偏转校正,左耳廓内的FOA信号的俯仰方向校正矩阵RVL,满足:
Figure SMS_27
(c)当θL≠θR
Figure SMS_28
时,可以根据左耳声场采集装置的水平偏转角度θL和右耳声场采集装置的水平偏转角度θR,同时对左耳廓内的FOA信号和右耳廓内的FOA信号进行水平方向的偏转校正:
左耳廓内的FOA信号的水平方向校正矩阵RHL,满足:
RHL=[cosθL sinθL 1]
右耳廓内的FOA信号的水平方向校正矩阵RHR,满足:
RHR=[cosθR sinθR 1]
根据Xl’L Yl’L Zl’L方向下的左耳廓内的FOA信号以及左耳廓内的FOA信号的水平方向校正矩阵RHL,获得偏转校正后的左耳廓内的FOA信号,满足:
[XlL YlL ZlL]=RHL·[Xl’L Yl’L Zl’L]
根据Xl’R Yl’R Zl’R方向下的右耳廓内的FOA信号以及右耳廓内的FOA信号的水平方向校正矩阵RHR,获得偏转校正后的右耳廓内的FOA信号,满足:
[XlR YlR ZlR]=RHR·[Xl’R Yl’R Zl’R]
可选的,可以以左耳廓内的FOA信号为基准仅对右耳廓内的FOA信号进行水平方向的偏转校正,右耳廓内的FOA信号的水平方向校正矩阵RHR,满足:
RHR=[cos(θRL)sin(θRL)1]
可选的,可以以右耳廓内的FOA信号为基准仅对左耳廓内的FOA信号进行水平方向的偏转校正,左耳廓内的FOA信号的水平方向校正矩阵RHL,满足:
RHL=[cos(θLR)sin(θLR)1]
(d)当θL≠θR
Figure SMS_29
时,可以根据左耳声场采集装置的水平偏转角度θL、右耳声场采集装置的水平偏转角度θR、左耳声场采集装置的俯仰偏转角度
Figure SMS_30
以及右耳声场采集装置的俯仰偏转角度
Figure SMS_31
同时对左耳廓内的FOA信号和右耳廓内的FOA信号进行俯仰方向的偏转校正:
左耳廓内的FOA信号的校正矩阵RL,满足:
Figure SMS_32
根据Xl’L Yl’L Zl’L方向下的左耳廓内的FOA信号进行偏转校正计算,以获得XlLYlL ZlL方向下的左耳廓内的FOA信号,可以是:
[XlL YlL ZlL]=RL·[Xl’L Yl’L Zl’L]
右耳廓内的FOA信号的校正矩阵RR,满足:
Figure SMS_33
根据Xl’R Yl’R Zl’R方向下的右耳廓内的FOA信号进行偏转校正计算,以获得XlRYlR ZlR方向下的右耳廓内的FOA信号,可以是:
[XlR YlR ZlR]=RR·[Xl’R Yl’R Zl’R]
可选的,可以以左耳廓内的FOA信号为基准仅对右耳廓内的FOA信号进行偏转校正,右耳廓内的FOA信号的校正矩阵RR,满足:
Figure SMS_34
可选的,可以以右耳廓内的FOA信号为基准仅对左耳廓内的FOA信号进行偏转校正,左耳廓内的FOA信号的校正矩阵RL,满足:
Figure SMS_35
(2)当位于左耳廓内的左耳声场采集装置包括具有特定拓扑结构的多个麦克风时,左耳声场采集装置中的多个麦克风获得多路信号,获得多路信号与FOA信号之间的第一转换矩阵,根据多路信号和第一转换矩阵获得左耳廓内的FOA信号。
如图2b所示,左耳声场采集装置设置于左耳耳机上,当用户带上左耳耳机时,左耳声场采集装置随着左耳耳机一起处于用户的左耳廓内。此时该多个麦克风的收声一侧朝向左耳耳机的朝向外界的外壳上,而在该外壳上开孔以使得多个麦克风可以采集外界声音信号,因此通过多个麦克风可以采集到该多个麦克风各自朝向上的信号(多路信号)。图6为本申请第i个麦克风的一个示例性的示意图,如图6所示,左耳声场采集装置包括M(通常M≥4)个麦克风,1≤i≤M,左耳声场采集装置中的第i个麦克风的极坐标表示为
Figure SMS_36
其中,l表示左,dli表示左耳声场采集装置中的第i个麦克风与中心位置(即左耳廓对应的极坐标系的原点Ol)的距离,θli表示左耳声场采集装置中的第i个麦克风的方位角,
Figure SMS_37
表示左耳声场采集装置中的第i个麦克风的俯仰角。因此,左耳声场采集装置中的第i个麦克风采集的信号Sli和左耳廓内的FOA信号(Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量)有以下关系:
Figure SMS_38
进而可以得到左耳廓内的FOA信号向多个麦克风采集的多路信号转换的第二转换矩阵FMl为:
Figure SMS_39
计算上述第二转换矩阵的逆矩阵,即为多个麦克风采集的多路信号向左耳廓内的FOA信号转换的第一转换矩阵MFl:MFl=FMl-1
最后根据上述第二转换矩阵MFl和多路信号Sli(i=1~M)获得左耳廓内的FOA信号(包括Wl、Xl、Yl和Zl四个分量)为:
Figure SMS_40
以上通过位于用户的左耳廓内或右耳廓内的声场采集设备获得左耳廓内的FOA信号或右耳廓内的FOA信号,一方面可以记录双耳耳廓位置的声场,另一方面可以记录耳廓的影响,以便于获得更好的声场还原效果。
步骤402、左耳声场采集装置将左耳廓内的FOA信号传输给处理装置。
处理装置可以通过与声场采集装置之间的总线接收左耳廓内的FOA信号,也可以通过与声场采集装置之间的有线链路或无线链路接收左耳廓内的FOA信号。本申请对此不做具体限定。
步骤403、获得多个HRTF系数,该多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且该多个HRTF系数均是以左耳廓为中心获得的。
头部相关传输函数(head related transfer function,HRTF)是一种音效定位算法,从空间任意一点传到人耳(鼓膜前)的信号都可以用一个滤波系统来描述,音源+滤波器得到的就是双耳鼓膜前的声音信号。通常我们不必关心声音是如何传递到双耳的,只需关心音源和双耳信号的差别。如果获得描述空间信息的滤波器(传递函数),即HRTF,就能还原来自空间这个方位的声音信号。如果获得空间内的所有方位到双耳的HRTF系数,就能得到一个滤波矩阵,从而还原来自整个空间方位的声音信号。要获得HRTF系数,通常可以先制作一个头部模型并安装一支麦克风到耳膜的位置,然后从固定的位置发出一些声音,分析从麦克风中得到声音以获得被头部模型所改变的具体数据,接着设计一个音频过滤器来模仿该改变效果。如果需要模仿某个位置所发出的声音的时候就使用上述过滤器来模仿即可。过滤器的回应被认为是一个HRTF系数,可以针对每个可能存在声源的地方测量以获得一个HRTF系数。
本实施例中的多个HRTF系数均是以左耳廓为中心获得的,即上述麦克风的位置被模拟设置于左耳廓的位置。由于预先设定了多个虚拟扬声器的方位,因此不需要获得所有可能存在声源的地方,只需要获得与多个虚拟扬声器的方位对应的HRTF系数即可。虚拟扬声器是为了在声音渲染过程中能够模拟多通道环绕声效果而虚拟的扬声器,如果将虚拟扬声器信号通过与虚拟扬声器配置相同的扬声器系统播放出来即可获得多通道环绕声效果。
在一种可能的实现方式中,处理装置可以根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得多个HRTF系数,该第一HRTF系数集合中的HRTF系数均是以左耳廓为中心获得的。
如上所述,可以预先测量获得空间内的所有方位到左耳廓的HRTF系数,就能得到一组包含所有方位对应的HRTF系数的集合。需要说明的是,前述所有方位仅作为一种示例,但并不构成限定,即预先测量的方位的范围可以是指所有方位,也可使是指某朝向上的所有方位,还可以是指全朝向上的部分方位,本申请对此不做具体限定。
多个虚拟扬声器信号的方位已经预先设定,因此结合一组包含所有方位对应的HRTF系数的集合,从中找到与多个虚拟扬声器信号的方位分别对应的HRTF系数。
在一种可能的实现方式中,处理装置可以先根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,该第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的,然后对多个中间HRTF系数分别进行旋转处理以获得多个HRTF系数。
与上述实现方式的区别在于,在获得一组包含所有方位对应的HRTF系数的集合时,是获得空间内的所有方位到用户的头部中心的HRTF系数,即是以用户的头部中心为中心获得HRTF系数。同样的,前述所有方位仅作为一种示例,但并不构成限定,即预先测量的方位的范围可以是指所有方位,也可使是指某朝向上的所有方位,还可以是指全朝向上的部分方位,本申请对此不做具体限定。
多个虚拟扬声器信号的方位已经预先设定,因此结合一组包含所有方位对应的HRTF系数的集合,从中找到与多个虚拟扬声器信号的方位分别对应的以用户的头部中心为中心的HRTF系数。
图7为本申请HRTF系数的一个示例性的示意图,如图7所示,获得以用户的头部中心为中心的HRTF系数后,对该HRTF系数进行顺时针(+γ)旋转处理得到左耳廓的HRTF系数,对该HRTF系数进行逆时针(-γ)旋转处理得到右耳廓的HRTF系数。
步骤404、根据左耳廓内的FOA信号和多个HRTF系数获得对应于左耳廓的声场信号。
处理装置可以根据左耳廓内的FOA信号获得多个虚拟扬声器信号,然后根据多个虚拟扬声器信号和多个HRTF系数获得对应于左耳廓的声场信号。
可选的,可以根据以下公式获得对应于左耳廓的第j个虚拟扬声器信号:
Figure SMS_41
其中,Plj表示对应于左耳廓的第j个虚拟扬声器信号,l表示左,1≤j≤L,L表示多个虚拟扬声器信号的总个数,Wl表示左耳廓内的FOA信号的环境分量,Xl表示左耳廓内的FOA信号的X轴方向分量,Yl表示左耳廓内的FOA信号的Y轴方向分量,Zl表示左耳廓内的FOA信号的Z轴方向分量,
Figure SMS_42
表示对应于左耳廓的第j个虚拟扬声器信号的俯仰角,θlj表示对应于左耳廓的第j个虚拟扬声器信号的方位角。
可选的,可以根据以下公式获得对应于左耳廓的声场信号:
Figure SMS_43
其中,Yl表示对应于第一耳廓的声场信号,l表示左,L表示多个虚拟扬声器信号的总个数,Plj表示对应于左耳廓的第j个虚拟扬声器信号,HRTFlj表示与第j个虚拟扬声器信号对应、且以左耳廓为中心获得的HRTF系数。
本实施例,采集获得左耳廓内的FOA信号和右耳廓内的FOA信号,如此一来该两种FOA信号就包含了耳廓对声场影响,更接近于真实环境下人耳听音时耳廓位置的真实声场。另外,为了在声音渲染过程中能够模拟多通道环绕声效果而虚拟了多个虚拟扬声器,获得该多个虚拟扬声器信号和该多个虚拟扬声器信号对应的多个HRTF信号,该HRTF信号是以左耳廓或右耳廓为中心获得的,进而根据多个虚拟扬声器信号和多个HRTF系数将采集获得的双耳廓内的FOA信号转换为双耳廓的声场信号,如果将虚拟扬声器信号通过与虚拟扬声器配置相同的扬声器系统播放出来即可获得多通道环绕声效果。
图8为本申请声场采集装置的一个示例性的结构示意图,如图8所示,本实施例的装置可以应用于图2a和2b所示的耳机或图3所示的手机。该包括:采集模块801。
采集模块801,用于通过位于第一耳廓内的第一声场采集装置采集以获得第一一阶双音学FOA信号,所述第一耳廓为用户的左耳廓或右耳廓。
在一种可能的实现方式中,所述第一声场采集装置与第一耳机连接;或者,所述第一声场采集装置设置于所述第一耳机中;所述第一耳机佩戴于所述第一耳廓内。
在一种可能的实现方式中,所述采集模块801,还用于通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一FOA信号;或者,当所述第一声场采集装置的偏转角度不满足所述第一设定条件时,将所述第一声场采集装置获得的信号作为所述第一FOA信号;其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等。
在一种可能的实现方式中,所述重力传感器设置于所述第一声场采集装置中;或者,所述重力传感器设置于第一耳机中。
在一种可能的实现方式中,所述采集模块801,具体用于根据所述第一声场采集装置的偏转角度获得所述第一声场采集装置的偏转校正矩阵;根据所述第一声场采集装置获得的信号和所述偏转校正矩阵获得所述第一FOA信号。
在一种可能的实现方式中,当所述第一声场采集装置为FOA声场采集装置时,所述采集模块801,具体用于所述FOA声场采集装置直接采集以获得所述第一FOA信号。
在一种可能的实现方式中,当所述第一声场采集装置包括具有特定拓扑结构的多个麦克风时,所述采集模块801,具体用于通过所述多个麦克风获得多路信号;获得所述多路信号与FOA信号之间的第一转换矩阵;根据所述多路信号和所述第一转换矩阵获得所述第一FOA信号。
在一种可能的实现方式中,所述采集模块801,具体用于获得所述多个麦克风各自的极坐标;根据所述多个麦克风各自的极坐标获得FOA信号和所述多路信号之间的第二转换矩阵;将所述第二矩阵的逆矩阵确定为所述第一转换矩阵。
本实施例的装置,可以用于执行图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图9为本申请处理装置的一个示例性的结构示意图,如图9所示,本实施例的装置可以应用于图3所示的手机。该装置可以包括:获得模块901和处理模块902。其中,
获得模块901,用于获得第一一阶双音学FOA信号,所述第一FOA信号是位于第一耳廓内的第一声场采集装置采集获得的,第一耳廓为用户的左耳廓或右耳廓;获得多个头部相关传输函数HRTF系数,所述多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且所述多个HRTF系数均是以所述第一耳廓为中心获得的;处理模块902,用于根据所述第一FOA信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号;其中,所述双耳信号包括对应于所述左耳廓的声场信号和对应于所述右耳廓的声场信号。
在一种可能的实现方式中,所述获得模块901,具体用于根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得所述多个HRTF系数,所述第一HRTF系数集合中的HRTF系数均是以所述第一耳廓为中心获得的。
在一种可能的实现方式中,所述获得模块901,具体用于根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,所述第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的;对所述多个中间HRTF系数分别进行旋转处理以获得所述多个HRTF系数。
在一种可能的实现方式中,所述处理模块902,具体用于根据所述第一FOA信号获得所述多个虚拟扬声器信号;根据所述多个虚拟扬声器信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号。
在一种可能的实现方式中,所述处理模块902,具体用于根据以下公式获得第j个虚拟扬声器信号:
Figure SMS_44
其中,Pij表示所述第j个虚拟扬声器信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Wi表示所述第一FOA信号的环境分量,Xi表示所述第一FOA信号的X轴方向分量,Yi表示所述第一FOA信号的Y轴方向分量,Zi表示所述第一FOA信号的Z轴方向分量,
Figure SMS_45
表示第j个虚拟扬声器信号的俯仰角,θij表示第j个虚拟扬声器信号的方位角。
在一种可能的实现方式中,所述处理模块902,具体用于根据以下公式获得对应于所述第一耳廓的声场信号:
Figure SMS_46
其中,Yi表示所述对应于所述第一耳廓的声场信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Pij表示第j个虚拟扬声器信号,HRTFij表示与所述第j个虚拟扬声器信号对应、且以所述第一耳廓为中心获得的HRTF系数。
本实施例的装置,可以用于执行图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。处理器可以是通用处理器、数字信号处理器(digital signalprocessor,DSP)、特定应用集成电路(application-specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。本申请实施例公开的方法的步骤可以直接体现为硬件编码处理器执行完成,或者用编码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
上述各实施例中提及的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (20)

1.一种FOA信号的获得方法,其特征在于,包括:
位于第一耳廓内的第一声场采集装置采集以获得第一一阶双音学FOA信号,所述第一耳廓为用户的左耳廓或右耳廓;
其中,所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号之前,还包括:
通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;
所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号,包括:
当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一一阶双音学FOA信号;
其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等。
2.根据权利要求1所述的方法,其特征在于,所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号之前,还包括:
当所述第一声场采集装置的偏转角度不满足所述第一设定条件时,将所述第一声场采集装置获得的信号作为所述第一一阶双音学FOA信号。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一一阶双音学FOA信号,包括:
根据所述第一声场采集装置的偏转角度获得所述第一声场采集装置的偏转校正矩阵;
根据所述第一声场采集装置获得的信号和所述偏转校正矩阵获得所述第一一阶双音学FOA信号。
4.根据权利要求1所述的方法,其特征在于,当所述第一声场采集装置为FOA声场采集装置时,所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号,包括:
所述FOA声场采集装置直接采集以获得所述第一一阶双音学FOA信号;
当所述第一声场采集装置包括具有特定拓扑结构的多个麦克风时,所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号,包括:
所述多个麦克风获得多路信号;
获得所述多路信号与FOA信号之间的第一转换矩阵;
根据所述多路信号和所述第一转换矩阵获得所述第一一阶双音学FOA信号。
5.根据权利要求4所述的方法,其特征在于,所述获得所述多路信号与FOA信号之间的第一转换矩阵,包括:
获得所述多个麦克风各自的极坐标;
根据所述多个麦克风各自的极坐标获得FOA信号和所述多路信号之间的第二转换矩阵;
将所述第二转换矩阵的逆矩阵确定为所述第一转换矩阵。
6.一种双耳信号的获得方法,其特征在于,包括:
获得第一一阶双音学FOA信号,所述第一一阶双音学FOA信号是位于第一耳廓内的第一声场采集装置采集获得的,第一耳廓为用户的左耳廓或右耳廓;
其中,获得第一一阶双音学FOA信号之前,还包括:
通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;
所述位于第一耳廓内的第一声场采集装置获得第一一阶双音学FOA信号,包括:
当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一一阶双音学FOA信号;
其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等;
获得多个头部相关传输函数HRTF系数,所述多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且所述多个HRTF系数均是以所述第一耳廓为中心获得的;
将所述第一一阶双音学FOA信号和所述多个HRTF系数进行卷积处理,以获得对应于所述第一耳廓的声场信号;
其中,所述双耳信号包括对应于所述左耳廓的声场信号和对应于所述右耳廓的声场信号。
7.根据权利要求6所述的方法,其特征在于,所述获得多个头部相关传输函数HRTF系数,包括:
根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得所述多个HRTF系数,所述第一HRTF系数集合中的HRTF系数均是以所述第一耳廓为中心获得的;
所述获得多个头部相关传输函数HRTF系数,包括:
根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,所述第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的;
对所述多个中间HRTF系数分别进行旋转处理以获得所述多个HRTF系数。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一一阶双音学FOA信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号,包括:
根据所述第一一阶双音学FOA信号获得所述多个虚拟扬声器信号;
根据所述多个虚拟扬声器信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一一阶双音学FOA信号获得所述多个虚拟扬声器信号,包括:
根据以下公式获得第j个虚拟扬声器信号:
Figure FDA0004101497140000031
其中,Pij表示所述第j个虚拟扬声器信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Wi表示所述第一一阶双音学FOA信号的环境分量,Xi表示所述第一一阶双音学FOA信号的X轴方向分量,Yi表示所述第一一阶双音学FOA信号的Y轴方向分量,Zi表示所述第一一阶双音学FOA信号的Z轴方向分量,
Figure FDA0004101497140000033
表示第j个虚拟扬声器信号的俯仰角,θij表示第j个虚拟扬声器信号的方位角。
10.根据权利要求8或9所述的方法,其特征在于,所述根据所述多个虚拟扬声器信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号,包括:
根据以下公式获得对应于所述第一耳廓的声场信号:
Figure FDA0004101497140000032
其中,Yi表示所述对应于所述第一耳廓的声场信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Pij表示第j个虚拟扬声器信号,HRTFij表示与所述第j个虚拟扬声器信号对应、且以所述第一耳廓为中心获得的HRTF系数。
11.一种声场采集装置,其特征在于,包括:
采集模块,用于通过位于第一耳廓内的第一声场采集装置采集以获得第一一阶双音学FOA信号,所述第一耳廓为用户的左耳廓或右耳廓;
所述采集模块,还用于通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一一阶双音学FOA信号;其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等。
12.根据权利要求11所述的装置,其特征在于,所述采集模块,还用于当所述第一声场采集装置的偏转角度不满足所述第一设定条件时,将所述第一声场采集装置获得的信号作为所述第一一阶双音学FOA信号。
13.根据权利要求12所述的装置,其特征在于,所述采集模块,具体用于根据所述第一声场采集装置的偏转角度获得所述第一声场采集装置的偏转校正矩阵;根据所述第一声场采集装置获得的信号和所述偏转校正矩阵获得所述第一一阶双音学FOA信号。
14.根据权利要求11所述的装置,其特征在于,当所述第一声场采集装置为FOA声场采集装置时,所述采集模块,具体用于所述FOA声场采集装置直接采集以获得所述第一一阶双音学FOA信号;
当所述第一声场采集装置包括具有特定拓扑结构的多个麦克风时,所述采集模块,具体用于通过所述多个麦克风获得多路信号;获得所述多路信号与FOA信号之间的第一转换矩阵;根据所述多路信号和所述第一转换矩阵获得所述第一一阶双音学FOA信号。
15.根据权利要求14所述的装置,其特征在于,所述采集模块,具体用于获得所述多个麦克风各自的极坐标;根据所述多个麦克风各自的极坐标获得FOA信号和所述多路信号之间的第二转换矩阵;将所述第二转换矩阵的逆矩阵确定为所述第一转换矩阵。
16.一种处理装置,其特征在于,包括:
获得模块,用于获得第一一阶双音学FOA信号,所述第一一阶双音学FOA信号是位于第一耳廓内的第一声场采集装置采集获得的,第一耳廓为用户的左耳廓或右耳廓;在获得第一一阶双音学FOA信号之前,通过重力传感器获得所述第一声场采集装置的偏转角度,所述偏转角度包括水平偏转角度和/或俯仰偏转角度;当所述第一声场采集装置的偏转角度满足第一设定条件时,根据所述偏转角度对所述第一声场采集装置获得的信号进行偏转校正,以获得所述第一一阶双音学FOA信号;其中,所述第一设定条件为所述第一声场采集装置的偏转角度大于0;或者,当所述第一声场采集装置包括位于左耳廓内的第一声场采集装置和位于右耳廓内的第一声场采集装置时,所述第一设定条件为所述位于左耳廓内的第一声场采集装置的偏转角度和所述位于右耳廓内的第一声场采集装置的偏转角度不相等;获得多个头部相关传输函数HRTF系数,所述多个HRTF系数和预先设定的多个虚拟扬声器的方位对应,且所述多个HRTF系数均是以所述第一耳廓为中心获得的;
处理模块,用于将所述第一一阶双音学FOA信号和所述多个HRTF系数进行卷积处理,以获得对应于所述第一耳廓的声场信号;
其中,双耳信号包括对应于所述左耳廓的声场信号和对应于所述右耳廓的声场信号。
17.根据权利要求16所述的装置,其特征在于,所述获得模块,具体用于根据预先设定的多个虚拟扬声器的方位从第一HRTF系数集合获得所述多个HRTF系数,所述第一HRTF系数集合中的HRTF系数均是以所述第一耳廓为中心获得的;
所述获得模块,具体用于根据预先设定的多个虚拟扬声器的方位从第二HRTF系数集合获得多个中间HRTF系数,所述第二HRTF系数集合中的HRTF系数均是以用户的头部中心为中心获得的;对所述多个中间HRTF系数分别进行旋转处理以获得所述多个HRTF系数。
18.根据权利要求17所述的装置,其特征在于,所述处理模块,具体用于根据所述第一一阶双音学FOA信号获得所述多个虚拟扬声器信号;根据所述多个虚拟扬声器信号和所述多个HRTF系数获得对应于所述第一耳廓的声场信号。
19.根据权利要求18所述的装置,其特征在于,所述处理模块,具体用于根据以下公式获得第j个虚拟扬声器信号:
Figure FDA0004101497140000041
其中,Pij表示所述第j个虚拟扬声器信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Wi表示所述第一一阶双音学FOA信号的环境分量,Xi表示所述第一一阶双音学FOA信号的X轴方向分量,Yi表示所述第一一阶双音学FOA信号的Y轴方向分量,Zi表示所述第一一阶双音学FOA信号的Z轴方向分量,
Figure FDA0004101497140000042
表示第j个虚拟扬声器信号的俯仰角,θij表示第j个虚拟扬声器信号的方位角。
20.根据权利要求18或19所述的装置,其特征在于,所述处理模块,具体用于根据以下公式获得对应于所述第一耳廓的声场信号:
Figure FDA0004101497140000051
其中,Yi表示所述对应于所述第一耳廓的声场信号,i用于表示所述第一耳廓,L表示所述多个虚拟扬声器信号的总个数,Pij表示第j个虚拟扬声器信号,HRTFij表示与所述第j个虚拟扬声器信号对应、且以所述第一耳廓为中心获得的HRTF系数。
CN202011373789.7A 2020-11-30 2020-11-30 Foa信号和双耳信号的获得方法、声场采集装置及处理装置 Active CN114584913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011373789.7A CN114584913B (zh) 2020-11-30 2020-11-30 Foa信号和双耳信号的获得方法、声场采集装置及处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011373789.7A CN114584913B (zh) 2020-11-30 2020-11-30 Foa信号和双耳信号的获得方法、声场采集装置及处理装置

Publications (2)

Publication Number Publication Date
CN114584913A CN114584913A (zh) 2022-06-03
CN114584913B true CN114584913B (zh) 2023-05-16

Family

ID=81767655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011373789.7A Active CN114584913B (zh) 2020-11-30 2020-11-30 Foa信号和双耳信号的获得方法、声场采集装置及处理装置

Country Status (1)

Country Link
CN (1) CN114584913B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117812523A (zh) * 2022-09-23 2024-04-02 荣耀终端有限公司 一种录音信号的生成方法、装置、系统和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658250A (zh) * 2017-02-06 2017-05-10 张德明 一种双耳录音装置
CN110856094A (zh) * 2018-08-20 2020-02-28 华为技术有限公司 音频处理方法和装置
CN111149155A (zh) * 2017-07-14 2020-05-12 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经增强的声场描述或经修改的声场描述的概念

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10492018B1 (en) * 2016-10-11 2019-11-26 Google Llc Symmetric binaural rendering for high-order ambisonics
WO2020221431A1 (en) * 2019-04-30 2020-11-05 Huawei Technologies Co., Ltd. Device and method for rendering a binaural audio signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658250A (zh) * 2017-02-06 2017-05-10 张德明 一种双耳录音装置
CN111149155A (zh) * 2017-07-14 2020-05-12 弗劳恩霍夫应用研究促进协会 使用多点声场描述生成经增强的声场描述或经修改的声场描述的概念
CN110856094A (zh) * 2018-08-20 2020-02-28 华为技术有限公司 音频处理方法和装置

Also Published As

Publication number Publication date
CN114584913A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN110458902B (zh) 3d光照估计方法及电子设备
CN113496708B (zh) 拾音方法、装置和电子设备
CN114143696B (zh) 音箱位置调节方法、音频渲染方法和装置
WO2020056684A1 (zh) 通过转发模式连接的多tws耳机实现自动翻译的方法及装置
CN114157945B (zh) 一种数据处理方法及相关装置
CN110069236A (zh) 一种头戴电子设备及其音频输出控制方法
CN115641867B (zh) 语音处理方法和终端设备
CN114724055A (zh) 视频切换方法、装置、存储介质及设备
CN113129916B (zh) 一种音频采集方法、系统及相关装置
US20250039599A1 (en) Wearable device, sound pickup method, and apparatus
CN114257920B (zh) 一种音频播放方法、系统和电子设备
CN114584913B (zh) Foa信号和双耳信号的获得方法、声场采集装置及处理装置
CN116055983B (zh) 一种音频信号处理方法及电子设备
CN114120950B (zh) 一种人声屏蔽方法和电子设备
CN113542984B (zh) 立体声实现系统、方法、电子设备及存储介质
WO2023024036A1 (zh) 一种人物三维模型的重建方法及装置
CN116801152A (zh) 头戴设备及音频信息处理方法
CN115762108A (zh) 遥控方法、遥控设备和被控制设备
CN115801987A (zh) 一种视频插帧方法及装置
WO2024159885A1 (zh) 空间音频渲染方法和装置
WO2023071730A1 (zh) 声纹注册方法及电子设备
CN111626929B (zh) 深度图像的生成方法及装置、计算机可读介质和电子设备
WO2025092283A1 (zh) 一种音频处理方法、芯片及电子设备
CN116774836A (zh) 一种气流产生方法、装置及电子设备
WO2024046182A1 (zh) 一种音频播放方法、系统及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant