CN102890936A - 一种音频处理方法、终端设备及系统 - Google Patents
一种音频处理方法、终端设备及系统 Download PDFInfo
- Publication number
- CN102890936A CN102890936A CN2011102019278A CN201110201927A CN102890936A CN 102890936 A CN102890936 A CN 102890936A CN 2011102019278 A CN2011102019278 A CN 2011102019278A CN 201110201927 A CN201110201927 A CN 201110201927A CN 102890936 A CN102890936 A CN 102890936A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency
- terminal device
- voice
- independently
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 230000005540 biological transmission Effects 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims description 36
- 230000001755 vocal effect Effects 0.000 claims description 26
- 238000000926 separation method Methods 0.000 claims description 25
- 238000012880 independent component analysis Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 6
- 108091006146 Channels Proteins 0.000 description 109
- 238000010586 diagram Methods 0.000 description 21
- 239000000203 mixture Substances 0.000 description 14
- 238000012546 transfer Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请实施例公开了一种音频处理方法,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:所述第一终端设备接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;至少将分离出的一个所述独立的音频信息通过一个音频通道输出。应用本申请实施例,通过在终端设备上设置至少两个音频通道,以及对混音音频进行分离,可以实现将一个独立的音频信息通过一个音频通道进行输出播放,由此可以增加单个音频信息的清晰度,便于用户进行分辨。
Description
技术领域
本申请涉及语音通信技术领域,特别是涉及一种音频处理方法、终端设备及系统。
背景技术
现有电话会议系统中,包括多个具有麦克的终端设备,这些终端设备接入通信网络中,比如PSTN(Public Switched Telephone Network,公共交换电话网),IP(Internet Protocol,互联网协议)网络等。以三方电话会议为例,其中一方终端设备只需要提供两条线路就可以把其它两个终端设备联系在一起,实现三方通话。目前最常见的方式是交换机提供三方通话功能,或者运营商提供多方电话会议桥接服务,使得身处不同地方的人能够克服地理位置或距离上困难,同时连接到会议系统中一起说话讨论,彼此能听到对方说话,就好像在同一个屋子里开会一样。
但是,发明人在对现有技术的研究过程中发现,对于一方终端设备侧的用户来说,当多个人同时参与会议时,多个语音信息将进行混音后,通过连接线路在终端上进行统一播放,经常有听不清楚的情形,尤其是多个人同时说话的时候,一方面是由于电话线路有信号不好或者干扰等原因,另一方面是发言者距离麦克风的距离不同导致拾入的信号强弱不齐,加上多个人的声音同时响起,要让对方听清楚非常困难,为了解决这个问题,电话会议系统中,会议主持人经常会让单个人发言,但这显然降低了效率。与现场会议不同,现场会议中每个人除了通过识别不同人的音调和音质以外还可以通过声音发出的方位判断所要获取的声音信息,而对于电话会议,所有语音信息统一混音后,接收到该混音信息的终端通过扬声器对其进行统一播放,因此难以听清其中声音较小的语音信息,如果将混音放大,则只能将所有声音同一放大,因此仍然难以分辨单个语音信息。
发明内容
本申请实施例提供了一种音频处理方法、终端设备及系统,以解决现有技术中难以分辨混音音频中的单个语音信息,导致收听方分辨效果不佳的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种音频处理方法,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:
接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
所述对混音音频进行分离包括:
获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;
根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。
所述对混音音频进行分离后还包括:
判断分离出的每个独立的音频信息是否为噪音;
根据判断结果,将为噪音的音频信息进行过滤。
还包括:
将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
还包括:
获取所述混音音频的平均音量;
根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
还包括:
对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;
分配用于输出与所述声纹特征对应的音频信息的音频通道。
一种终端设备,所述终端设备作为第一终端设备,与至少一个第二终端设备连通,所述第一终端设备具有至少两个音频通道,所述第一终端设备包括:
接收单元,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
输出单元,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
所述分离单元包括:
矩阵获取单元,用于获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;
音频分离单元,用于根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。
还包括:
判断单元,用于判断分离出的每个独立的音频信息是否为噪音;
过滤单元,用于根据所述判断单元的判断结果,将为噪音的音频信息进行过滤。
还包括:
播放单元,用于将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
还包括:
获取单元,用于获取所述混音音频的平均音量;
调整单元,用于根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
还包括:
检测单元,用于对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;
分配单元,用于分配用于输出与所述声纹特征对应的音频信息的音频通道。
一种音频处理系统,包括:第一终端设备和与所述第一终端设备连接的至少一个第二终端设备,所述第一终端设备具有至少两个音频通道,
所述第一终端设备,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息,对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息,至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
由上述实施例可以看出,本申请实施例中第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息,对混音音频进行分离,获得混音音频中的至少一个独立的音频信息,至少将分离出的一个独立的音频信息通过一个音频通道输出。应用本申请实施例,通过在终端设备上设置至少两个音频通道,以及对混音音频进行分离,可以实现将一个独立的音频信息通过一个独立的音频通道进行输出播放,由此可以增加单个音频信息的清晰度,便于用户进行分辨;进一步,根据分离出的独立音频信息,可以对其进行音量大小的调节,满足用户对不同音频信息的收听需求;并且,虽然传输通道上设置了多个音频通道,但是无需为每个音频通道配置扬声器,而是采用时分复用方式共用扬声器,在保证独立音频信息可以清晰播放的同时,节约了硬件成本。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请音频处理方法的第一实施例流程图;
图2A为本申请音频处理方法的第二实施例流程图;
图2B为图2A中一种混音音频分离的应用场景示意图;
图3为本申请音频处理方法的第三实施例流程图;
图4为本申请音频处理方法实施例的一种应用场景示意图;
图5为本申请终端设备的第一实施例框图;
图6为本申请终端设备的第二实施例框图;
图7为本申请终端设备的第三实施例框图;
图8为本申请终端设备的第四实施例框图;
图9为本申请终端设备的第五实施例框图;
图10为本申请语音处理系统的实施例框图。
具体实施方式
本发明如下实施例提供了一种音频处理方法、终端设备及系统。本发明实施例中的第一终端设备与至少一个第二终端设备连通,该第一终端设备具有至少两个音频通道。
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
参见图1,为本申请音频处理方法的第一实施例流程图:
步骤101:第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息。
其中,第一终端设备作为音频接收端,可以通过PSTN网络或者IP网络等与至少一个第二终端设备连通。第一终端设备与至少一个第二终端之间连通的情况包括:当第一终端设备连通一个第二终端设备时,该第二终端设备上可以设置一个麦克风,通过该一个麦克风接收多个用户的语音音频;或者,当第一终端设备连通一个第二终端设备时,该第二终端上可以设置多个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,每一个第二终端设备上可以分别设置一个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,有的第二设备上设置多个麦克风,可以接收多个用户的语音音频,有的第二终端上设置一个麦克风,可以接收一个用户的语音音频。
第一终端设备上与网络交换机之间通过一条传输通道连通,该传输通道可以具体为语音传输通道,无论连接多少第二终端设备,这些第二终端设备传输的多个语音音频通过网络交换机进行混合,生成一路混音音频,该混音音频通过该一条语音传输通道传输到该第一终端设备。对应前述第一终端设备与至少一个第二终端之间连通的情况,第一终端设备接收到的混音音频可以包括:一个第二终端设备侧同时有多个人说话,所获得的混音音频;或者,多个第二终端设备侧的每一个第二终端设备都有一个人说话,所获得的混音音频;或者多个第二终端设备侧,有的第二终端设备有一个人说话,有的第二终端设备有多个人说话,由此获得的混音音频。
步骤102:对混音音频进行分离,获得混音音频中的至少一个独立的音频信息。
具体的,可以获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵,根据所述分离矩阵,通过快速ICA(IndependentComponent Analysis,独立成分分析)算法从所述混音音频中分离出独立的音频信息。
本实施例中,对混音音频进行分离后,可以对分离出的每一个独立的音频信息打上唯一识别该音频信息的标记,通过将该标记与第一终端设备上的某个特定的音频通道进行匹配,由该音频通道对该音频信息进行输出。
步骤103:至少将分离出的一个独立的音频信息通过一个音频通道输出。
在分离出多个音频信息的时候,可以根据第一终端设备上所具有音频通道的数量对音频信息进行输出,但至少保证有一个独立的音频信息可以通过一个音频通道单独输出播放。
当分离出的音频信息的数量小于音频通道的数量的时候,可以根据用户需要选择与音频通道数量一致或者小于音频通道数量的音频信息进行播放;或者,也可以采用时分复用的方式使多个音频信息通过一个音频通道进行输出,例如,当一个音频通道在播放完一个音频信息的空闲时刻,通过该音频通道播放另一个音频信息。
另外,音频通道输出的音频信息通过与该音频通道相连的扬声器进行播放,通常可以为每个音频通道配置一个扬声器,但是处于节约成本的考虑,可以配置少于音频通道数量的扬声器,此时分离出的多个独立的音频信息也可以采用时分复用的方式通过少于音频通道数量的扬声器进行播放。需要说明的是,本实施例中采用的时分复用的方式,一般是指当一个发言者结束一小段说话段落后,其所用的扬声器可以被另外一个发言者使用,而不是两个发言者同时使用一个扬声器。
参见图2A,为本申请音频处理方法的第二实施例流程图,该实施例示出了对混音音频进行分离和过滤的详细处理过程:
步骤201:第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息。
其中,第一终端设备作为音频接收端,可以通过PSTN网络或者IP网络等与至少一个第二终端设备连通。第一终端设备与至少一个第二终端之间连通的情况包括:当第一终端设备连通一个第二终端设备时,该第二终端设备上可以设置一个麦克风,通过该一个麦克风接收多个用户的语音音频;或者,当第一终端设备连通一个第二终端设备时,该第二终端上可以设置多个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,每一个第二终端设备上可以分别设置一个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,有的第二设备上设置多个麦克风,可以接收多个用户的语音音频,有的第二终端上设置一个麦克风,可以接收一个用户的语音音频。
第一终端设备上与网络交换机之间通过一条传输通道连通,该传输通道可以具体为语音传输通道,无论连接多少第二终端设备,这些第二终端设备传输的多个语音音频通过网络交换机进行混合,生成一路混音音频,该混音音频通过该一条语音传输通道传输到该第一终端设备。对应前述第一终端设备与至少一个第二终端之间连通的情况,第一终端设备接收到的混音音频可以包括:一个第二终端设备侧同时有多个人说话,所获得的混音音频;或者,多个第二终端设备侧的每一个第二终端设备都有一个人说话,所获得的混音音频;或者多个第二终端设备侧,有的第二终端设备有一个人说话,有的第二终端设备有多个人说话,由此获得的混音音频。
步骤202:对混音音频进行分离,获得混音音频中的至少一个独立的音频信息。
为了详细描述本实施例中的混音音频分离过程,下面结合图2B所示的应用场景进行描述如下:
假设在一个会议场景中,v1和v2为两个独立的二维语音音频输入信号,m1和m2为两个独立的麦克风,每个麦克风收到的两路语音音频输入信号二维随机观测信号。在这个实际的场景中,v1的声音不仅会传到m1,也会传到m2,但是这两个语音音频输入信号之间存在细微的区别,同样的差别也发生在v2同时传输到m1和m2的情况。
首先,可以在会议开始前通过事先的学习训练,得到一个合适的H矩阵。即两个发言人可以分别进行自我介绍,相当于先后输入了v1和v2,然后系统提取每个说话人的音频特征,具体可以使用几秒长度平稳语音来进行训练,然后根据MFCC Mel(Mel Frequency Cepstrum Coefficient,频率倒谱系数)提取v1和v2的特征向量,然后用ICA的方式合并v1和v2得到矩阵H,H为2×2阶满秩混合矩阵。
其次,在采用Fast ICA算法进行混音音频分离时,假设已经去掉了音频信号的均值,则ICA的线性混合模型可以表示为:m=Hv=h1v1+h1v1+h2v1+h2v2,其中,h为v的特征向量,m为每个麦克风接收到的v1和v2的混音音频;
则需要估计分离矩阵W,使得m通过W后的输出为源信号的估计值y,即:y(t)=Wm(t)=WHv(t)=Gv(t),其中G为全局矩阵,如果通过学习得到G=I,那么y(t)=v(t),也就是说通过算法估计计算出来的信号y,可以还原出原始的声音v。
除了上述示出的采用Fast ICA算法进行混音音频分离外,作为一个特例,可以简单地将m1,m2中各个语音的到达时间作为提取特征,比如v1到达m1的距离短,时间短,因此可以根据这个特征,在m1中提取出v1;简单来说,就是在系统中分别比较v1,v2到达m1,m2的时间,然后进行相减的计算。具体地,类似于根据多个mic阵列消除噪音的原理,就是m1获得相同语音分量的时间比m2早,那么可以将m2中收取的声音作为m1的噪音,对其进行去除,由此可以简单地得到v1和v2的分离信号。
步骤203:判断分离出的每个独立的音频信息是否为噪音。
作为噪音的音频信息具有特定的音频特征,将这些音频特征作为噪音特征进行保存,对于分离出的每个独立的音频信息,分别与保存的噪音特征进行比对,当匹配时,则确定音频信息为噪音。
步骤204:根据判断结果,将为噪音的音频信息进行过滤。
步骤205:至少将分离出的一个独立的音频信息通过一个音频通道输出。
在分离出多个音频信息的时候,可以根据第一终端设备上所具有音频通道的数量对音频信息进行输出,但至少保证有一个独立的音频信息可以通过一个音频通道单独输出播放。
当分离出的音频信息的数量小于音频通道的数量的时候,可以根据用户需要选择与音频通道数量一致或者小于音频通道数量的音频信息进行播放;或者,也可以采用时分复用的方式使多个音频信息通过一个音频通道进行输出,例如,当一个音频通道在播放完一个音频信息的空闲时刻,通过该音频通道播放另一个音频信息。
步骤206:通过与该音频通道相连的扬声器播放该独立的音频信息。
音频通道输出的音频信息通过与该音频通道相连的扬声器进行播放,通常可以为每个音频通道配置一个扬声器,但是处于节约成本的考虑,可以配置少于音频通道数量的扬声器,此时分离出的多个独立的音频信息也可以采用时分复用的方式通过少于音频通道数量的扬声器进行播放。需要说明的是,本实施例中采用的时分复用的方式,一般是指当一个发言者结束一小段说话段落后,其所用的扬声器可以被另外一个发言者使用,而不是两个发言者同时使用一个扬声器。
参见图3,为本申请音频处理方法的第三实施例流程图,该实施例是出了对分离出的独立音频信息分配音频通道并进行音量调整的过程:
步骤301:第一终端设备接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息。
其中,第一终端设备作为音频接收端,可以通过PSTN网络或者IP网络等与至少一个第二终端设备连通。第一终端设备与至少一个第二终端之间连通的情况包括:当第一终端设备连通一个第二终端设备时,该第二终端设备上可以设置一个麦克风,通过该一个麦克风接收多个用户的语音音频;或者,当第一终端设备连通一个第二终端设备时,该第二终端上可以设置多个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,每一个第二终端设备上可以分别设置一个麦克风,每个麦克风接收一个用户的语音音频;或者,当第一终端设备连通多个第二终端设备时,有的第二设备上设置多个麦克风,可以接收多个用户的语音音频,有的第二终端上设置一个麦克风,可以接收一个用户的语音音频。
第一终端设备上与网络交换机之间通过一条传输通道连通,该传输通道可以具体为语音传输通道,无论连接多少第二终端设备,这些第二终端设备传输的多个语音音频通过网络交换机进行混合,生成一路混音音频,该混音音频通过该一条语音传输通道传输到该第一终端设备。对应前述第一终端设备与至少一个第二终端之间连通的情况,第一终端设备接收到的混音音频可以包括:一个第二终端设备侧同时有多个人说话,所获得的混音音频;或者,多个第二终端设备侧的每一个第二终端设备都有一个人说话,所获得的混音音频;或者多个第二终端设备侧,有的第二终端设备有一个人说话,有的第二终端设备有多个人说话,由此获得的混音音频。
步骤302:获取混音音频的平均音量,并记录该平均音量。
步骤303:对混音音频进行分离,获得混音音频中的至少一个独立的音频信息。
具体的,可以获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵,根据所述分离矩阵,通过快速ICA算法从混音音频中分离出独立的音频信息。
其中,当应用在会议场景时,可以在进行会议前进行语音训练,将提取的语音的声纹特征通过网络发送到音频接收端,然后在音频接收端根据语音的声纹特征从混音音频中分离出独立的音频信息;另外,也可以由各个音频接收端在会议开始前收集各个发言人的声纹特征,然后进行保存,然后在音频接收端根据语音的声纹特征从混音音频中分离出独立的音频信息。在提取语音的声纹特征时,可以对语音进行分析获得的特征包括频谱、倒频谱、共振峰、基音、反射系数等。
步骤304:对分离出的一个独立的音频信息进行声纹检测,获得声纹特征。
步骤305:分配用于输出与该声纹特征对应的音频信息的音频通道。
步骤306:根据记录的平均音量调整通过所分配的音频通道输出的一个独立的音频信息的音量大小。
步骤307:通过与该音频通道相连的扬声器播放该独立的音频信息。
音频通道输出的音频信息通过与该音频通道相连的扬声器进行播放,通常可以为每个音频通道配置一个扬声器,但是处于节约成本的考虑,可以配置少于音频通道数量的扬声器,此时分离出的多个独立的音频信息也可以采用时分复用的方式通过少于音频通道数量的扬声器进行播放。需要说明的是,本实施例中采用的时分复用的方式,一般是指当一个发言者结束一小段说话段落后,其所用的扬声器可以被另外一个发言者使用,而不是两个发言者同时使用一个扬声器。
参见图4,为本申请音频处理方法实施例的一种应用场景示意图:
其中,终端设备1为音频接收端,终端设备2和终端设备3为音频发送端,上述三个终端设备可以通过图4中示出的PSTN网络交换机相连,另外,也可以通过IP网络相连。每个终端设备与PSTN网络交换机之间相连的传输通道为一条,因此当有多个语音音频需要传输时,该传输通道仅能传输多个语音音频的混音。
假设终端设备2上有两个麦克风,分别为麦克风1和麦克风2,终端设备3上有一个麦克风,为麦克风3,此时用户间通过三个终端设备进行电话会议。其中,用户1和用户2在终端设备2上,分别使用麦克风1和麦克风2输入语音,用户3在终端设备3上使用麦克风3输入语音,上述三个语音传输到PSTN网的交换机后,该交换机将三个语音进行混合后,通过终端设备1与该PSTN交换机之间的传输通道将混音音频传输到终端设备1。
终端设备1接收到混音音频后,可以采用前述实施例中示出的音频处理方法对混音音频进行分离。假设终端设备1上预先设置了两个音频通道,如图4所示,每一个音频通道连接一个扬声器,图4中共示出两个扬声器,分别为扬声器1和扬声器2。对于分离出对应三个用户的三个独立的语音音频,可以选择性的进行播放,例如,可以通过扬声器1输出用户1的语音音频,通过扬声器2输出用户3的语音音频,对于用户2的语音音频可以选择不输出,或者在用户1和用户3的语音音频输出完毕后,再单独输出,对此本申请实施例不进行限制,只要保证可以通过一个音频通道对应的一个扬声器输出并播放一个独立的语音音频即可。
图4中,对于每个扬声器输出的语音音频的音量大小可以单独进行调节;另外,也可以仅设置一个扬声器,通过时分复用的方式输出独立的语音音频,以节省硬件成本。
与本申请音频处理方法的实施例相对应,本申请还提供了终端设备和引用处理系统的实施例。其中,终端设备实施例中的终端设备均作为第一终端设备进行描述,该第一终端设备与至少一个第二终端设备连通,该第一终端设备具有至少两个音频通道。
参见图5,为本申请终端设备的第一实施例框图:
该终端设备包括:接收单元510、分离单元520和输出单元530。
其中,接收单元510,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元520,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
输出单元530,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
参见图6,为本申请终端设备的第二实施例框图:
该终端设备包括:接收单元610、分离单元620、判断单元630、过滤单元640和输出单元650。
其中,接收单元610,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元620,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
判断单元630,用于判断分离出的每个独立的音频信息是否为噪音;
过滤单元640,用于根据所述判断单元的判断结果,将为噪音的音频信息进行过滤;
输出单元650,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
参见图7,为本申请终端设备的第三实施例框图:
该终端设备包括:接收单元710、分离单元720、输出单元730和播放单元740。
接收单元710,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元720,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
输出单元730,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出;
播放单元740,用于将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
参见图8,为本申请终端设备的第四实施例框图:
该终端设备包括:接收单元810、获取单元820、分离单元830、输出单元840和调整单元850。
接收单元810,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
获取单元820,用于获取所述混音音频的平均音量;
分离单元830,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
输出单元840,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出;
调整单元850,用于根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
参见图9,为本申请终端设备的第五实施例框图:
该终端设备包括:接收单元910、分离单元920、检测单元930、分配单元940和输出单元950。
其中,接收单元910,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元920,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
检测单元930,用于对所述分离出的一个独立的音频信息进行声纹检测,获得声纹特征;
分配单元940,用于分配用于输出与所述声纹特征对应的音频信息的音频通道;
输出单元950,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
上述图5至图9示出的终端设备实施例中,分离单元可以包括(图5至图9中未具体示出):
矩阵获取单元,用于获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;
音频分离单元,用于根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。
参见图10,为本申请音频处理系统的实施例框图:
该音频处理系统包括:第一终端设备1010和与所述第一终端设备连接的至少一个第二终端设备1020,所述第一终端设备具有至少两个音频通道。为了示例方便,图10中仅示出两个第二终端设备1020。
其中,所述第一终端设备1010,用于接收所述至少一个第二终端设备1020通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息,对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息,至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
进一步,所述第一终端设备1010,还用于判断分离出的每个独立的音频信息是否为噪音,根据判断结果,将为噪音的音频信息进行过滤。
进一步,所述第一终端设备1010,还用于将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
进一步,所述第一终端设备1010,还用于获取所述混音音频的平均音量,根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
进一步,所述第一终端设备1010,还用于对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征,分配用于输出与所述声纹特征对应的音频信息的音频通道。
通过对以上实施方式的描述可知,本申请实施例中第一终端设备接收至少一个第二终端设备通过一条传输通道传输的混音音频,该混音音频中包含混合在一起的至少两个音频信息,对混音音频进行分离,获得混音音频中的至少一个独立的音频信息,至少将分离出的一个独立的音频信息通过一个音频通道输出。应用本申请实施例,通过在终端设备上设置至少两个音频通道,以及对混音音频进行分离,可以实现将一个独立的音频信息通过一个音频通道进行输出播放,由于多个音频通道的输出扬声器物理位置上分开,使得用户还可以获取音频来自不同的方位的信息,由此可以增加单个音频信息的清晰度,便于用户进行分辨;进一步,根据分离出的独立音频信息,可以对其进行音量大小的调节,满足用户对不同音频信息的收听需求;并且,虽然传输通道上设置了多个音频通道,但是无需为每个音频通道配置扬声器,而是采用时分复用方式共用扬声器,在保证独立音频信息可以清晰播放的同时,节约了硬件成本。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种音频处理方法,其特征在于,应用于具有至少两个音频通道的第一终端设备中,所述第一终端设备与至少一个第二终端设备连通,所述方法包括:
接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
2.根据权利要求1所述的方法,其特征在于,所述对混音音频进行分离包括:
获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;
根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。
3.根据权利要求1所述的方法,其特征在于,所述对混音音频进行分离后还包括:
判断分离出的每个独立的音频信息是否为噪音;
根据判断结果,将为噪音的音频信息进行过滤。
4.根据权利要求1所述的方法,其特征在于,还包括:
将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
5.根据权利要求1所述的方法,其特征在于,还包括:
获取所述混音音频的平均音量;
根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
6.根据权利要求1所述的方法,其特征在于,还包括:
对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;
分配用于输出与所述声纹特征对应的音频信息的音频通道。
7.一种终端设备,其特征在于,所述终端设备作为第一终端设备,与至少一个第二终端设备连通,所述第一终端设备具有至少两个音频通道,所述第一终端设备包括:
接收单元,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息;
分离单元,用于对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息;
输出单元,用于至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
8.根据权利要求7所述的终端设备,其特征在于,所述分离单元包括:
矩阵获取单元,用于获取预先设置的分离矩阵,所述分离矩阵为由每个音频信息的特征向量组成的矩阵;
音频分离单元,用于根据所述分离矩阵,通过快速独立成分分析算法ICA从所述混音音频中分离出独立的音频信息。
9.根据权利要求7所述的终端设备,其特征在于,还包括:
判断单元,用于判断分离出的每个独立的音频信息是否为噪音;
过滤单元,用于根据所述判断单元的判断结果,将为噪音的音频信息进行过滤。
10.根据权利要求7所述的终端设备,其特征在于,还包括:
播放单元,用于将分离出的多个独立的音频信息采用时分复用的方式通过少于所述音频通道数量的扬声器进行播放。
11.根据权利要求7所述的终端设备,其特征在于,还包括:
获取单元,用于获取所述混音音频的平均音量;
调整单元,用于根据所述平均音量调整通过所述一个音频通道输出的所述分离出的一个独立的音频信息的音量大小。
12.根据权利要求7所述的终端设备,其特征在于,还包括:
检测单元,用于对所述分离出的一个所述独立的音频信息进行声纹检测,获得声纹特征;
分配单元,用于分配用于输出与所述声纹特征对应的音频信息的音频通道。
13.一种音频处理系统,其特征在于,包括:第一终端设备和与所述第一终端设备连接的至少一个第二终端设备,所述第一终端设备具有至少两个音频通道,
所述第一终端设备,用于接收所述至少一个第二终端设备通过一条传输通道传输的混音音频,所述混音音频中包含混合在一起的至少两个音频信息,对所述混音音频进行分离,获得所述混音音频中的至少一个独立的音频信息,至少将分离出的一个所述独立的音频信息通过一个音频通道输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102019278A CN102890936A (zh) | 2011-07-19 | 2011-07-19 | 一种音频处理方法、终端设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102019278A CN102890936A (zh) | 2011-07-19 | 2011-07-19 | 一种音频处理方法、终端设备及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102890936A true CN102890936A (zh) | 2013-01-23 |
Family
ID=47534422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102019278A Pending CN102890936A (zh) | 2011-07-19 | 2011-07-19 | 一种音频处理方法、终端设备及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102890936A (zh) |
Cited By (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
CN104269174A (zh) * | 2014-10-24 | 2015-01-07 | 百度在线网络技术(北京)有限公司 | 一种音频信号的处理方法及装置 |
CN104468991A (zh) * | 2014-11-24 | 2015-03-25 | 广东欧珀移动通信有限公司 | 一种移动终端及其音频收发方法 |
CN104900236A (zh) * | 2014-03-04 | 2015-09-09 | 杜比实验室特许公司 | 音频信号处理 |
WO2015180430A1 (zh) * | 2014-05-29 | 2015-12-03 | 广东美的制冷设备有限公司 | 语音控制方法和系统 |
CN105225661A (zh) * | 2014-05-29 | 2016-01-06 | 美的集团股份有限公司 | 语音控制方法和系统 |
CN105869627A (zh) * | 2016-04-28 | 2016-08-17 | 成都之达科技有限公司 | 基于车联网的语音处理方法 |
CN106328165A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
CN106502623A (zh) * | 2016-12-01 | 2017-03-15 | 北京小米移动软件有限公司 | 音频输出装置及方法 |
CN107171816A (zh) * | 2017-06-21 | 2017-09-15 | 歌尔科技有限公司 | 电话会议中的数据处理方法及装置 |
CN107491284A (zh) * | 2016-06-10 | 2017-12-19 | 苹果公司 | 提供自动化状态报告的数字助理 |
CN108174236A (zh) * | 2017-12-22 | 2018-06-15 | 维沃移动通信有限公司 | 一种媒体文件处理方法、服务器及移动终端 |
CN108292508A (zh) * | 2015-12-02 | 2018-07-17 | 日本电信电话株式会社 | 空间相关矩阵估计装置、空间相关矩阵估计方法和空间相关矩阵估计程序 |
CN109920445A (zh) * | 2019-03-04 | 2019-06-21 | 北京佳讯飞鸿电气股份有限公司 | 一种混音方法、装置及设备 |
CN111009256A (zh) * | 2019-12-17 | 2020-04-14 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
CN111081257A (zh) * | 2018-10-19 | 2020-04-28 | 珠海格力电器股份有限公司 | 一种语音采集方法、装置、设备及存储介质 |
CN111263252A (zh) * | 2018-11-30 | 2020-06-09 | 上海哔哩哔哩科技有限公司 | 一种用于直播的连麦消音方法、系统和存储介质 |
CN111276146A (zh) * | 2020-03-27 | 2020-06-12 | 上海乂学教育科技有限公司 | 基于语音识别的教学实训系统 |
CN111540370A (zh) * | 2020-04-21 | 2020-08-14 | 闻泰通讯股份有限公司 | 音频处理方法、装置、计算机设备及计算机可读存储介质 |
CN112562718A (zh) * | 2020-11-30 | 2021-03-26 | 重庆电子工程职业学院 | 基于topk多路音源有效信号筛选系统及方法 |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
CN117746880A (zh) * | 2024-02-20 | 2024-03-22 | 江苏鑫埭信息科技有限公司 | 远程会议通信智能降噪方法及系统 |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US12073147B2 (en) | 2013-06-09 | 2024-08-27 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US12080287B2 (en) | 2018-06-01 | 2024-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US12165635B2 (en) | 2010-01-18 | 2024-12-10 | Apple Inc. | Intelligent automated assistant |
US12197817B2 (en) | 2016-06-11 | 2025-01-14 | Apple Inc. | Intelligent device arbitration and control |
US12204932B2 (en) | 2015-09-08 | 2025-01-21 | Apple Inc. | Distributed personal assistant |
US12211502B2 (en) | 2018-03-26 | 2025-01-28 | Apple Inc. | Natural assistant interaction |
US12223282B2 (en) | 2016-06-09 | 2025-02-11 | Apple Inc. | Intelligent automated assistant in a home environment |
US12254887B2 (en) | 2017-05-16 | 2025-03-18 | Apple Inc. | Far-field extension of digital assistant services for providing a notification of an event to a user |
US12260234B2 (en) | 2017-01-09 | 2025-03-25 | Apple Inc. | Application integration with a digital assistant |
US12277954B2 (en) | 2024-04-16 | 2025-04-15 | Apple Inc. | Voice trigger for a digital assistant |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004098125A1 (fr) * | 2003-04-28 | 2004-11-11 | Sheng An Wang | Systeme de conference multimedia distribue fonde sur web ip |
CN1622566A (zh) * | 2003-11-26 | 2005-06-01 | 乐金电子(中国)研究开发中心有限公司 | 便携终端的混合语音信号分离装置及方法 |
CN101622669A (zh) * | 2007-02-26 | 2010-01-06 | 高通股份有限公司 | 用于信号分离的系统、方法及设备 |
CN101847415A (zh) * | 2009-03-23 | 2010-09-29 | 冲电气工业株式会社 | 混音装置、方法和程序以及音频会议系统 |
CN101855867A (zh) * | 2007-11-08 | 2010-10-06 | 雅马哈株式会社 | 话音通信设备 |
-
2011
- 2011-07-19 CN CN2011102019278A patent/CN102890936A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004098125A1 (fr) * | 2003-04-28 | 2004-11-11 | Sheng An Wang | Systeme de conference multimedia distribue fonde sur web ip |
CN1622566A (zh) * | 2003-11-26 | 2005-06-01 | 乐金电子(中国)研究开发中心有限公司 | 便携终端的混合语音信号分离装置及方法 |
CN101622669A (zh) * | 2007-02-26 | 2010-01-06 | 高通股份有限公司 | 用于信号分离的系统、方法及设备 |
CN101855867A (zh) * | 2007-11-08 | 2010-10-06 | 雅马哈株式会社 | 话音通信设备 |
CN101847415A (zh) * | 2009-03-23 | 2010-09-29 | 冲电气工业株式会社 | 混音装置、方法和程序以及音频会议系统 |
Cited By (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US12165635B2 (en) | 2010-01-18 | 2024-12-10 | Apple Inc. | Intelligent automated assistant |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US12009007B2 (en) | 2013-02-07 | 2024-06-11 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US12073147B2 (en) | 2013-06-09 | 2024-08-27 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
CN104900236B (zh) * | 2014-03-04 | 2020-06-02 | 杜比实验室特许公司 | 音频信号处理 |
CN104900236A (zh) * | 2014-03-04 | 2015-09-09 | 杜比实验室特许公司 | 音频信号处理 |
CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
CN105280184A (zh) * | 2014-05-29 | 2016-01-27 | 广东美的制冷设备有限公司 | 语音控制方法和系统 |
CN105225661B (zh) * | 2014-05-29 | 2019-06-28 | 美的集团股份有限公司 | 语音控制方法和系统 |
CN105225661A (zh) * | 2014-05-29 | 2016-01-06 | 美的集团股份有限公司 | 语音控制方法和系统 |
WO2015180430A1 (zh) * | 2014-05-29 | 2015-12-03 | 广东美的制冷设备有限公司 | 语音控制方法和系统 |
US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US12067990B2 (en) | 2014-05-30 | 2024-08-20 | Apple Inc. | Intelligent assistant for home automation |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US12200297B2 (en) | 2014-06-30 | 2025-01-14 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN104269174B (zh) * | 2014-10-24 | 2018-02-09 | 北京音之邦文化科技有限公司 | 一种音频信号的处理方法及装置 |
CN104269174A (zh) * | 2014-10-24 | 2015-01-07 | 百度在线网络技术(北京)有限公司 | 一种音频信号的处理方法及装置 |
CN104468991A (zh) * | 2014-11-24 | 2015-03-25 | 广东欧珀移动通信有限公司 | 一种移动终端及其音频收发方法 |
US12236952B2 (en) | 2015-03-08 | 2025-02-25 | Apple Inc. | Virtual assistant activation |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US12154016B2 (en) | 2015-05-15 | 2024-11-26 | Apple Inc. | Virtual assistant in a communication session |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
CN106328165A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种机器人自身音源消除系统 |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US12204932B2 (en) | 2015-09-08 | 2025-01-21 | Apple Inc. | Distributed personal assistant |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
CN108292508A (zh) * | 2015-12-02 | 2018-07-17 | 日本电信电话株式会社 | 空间相关矩阵估计装置、空间相关矩阵估计方法和空间相关矩阵估计程序 |
CN108292508B (zh) * | 2015-12-02 | 2021-11-23 | 日本电信电话株式会社 | 空间相关矩阵估计装置、空间相关矩阵估计方法和记录介质 |
CN105869627A (zh) * | 2016-04-28 | 2016-08-17 | 成都之达科技有限公司 | 基于车联网的语音处理方法 |
US12223282B2 (en) | 2016-06-09 | 2025-02-11 | Apple Inc. | Intelligent automated assistant in a home environment |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US12175977B2 (en) | 2016-06-10 | 2024-12-24 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
CN107491284A (zh) * | 2016-06-10 | 2017-12-19 | 苹果公司 | 提供自动化状态报告的数字助理 |
US12197817B2 (en) | 2016-06-11 | 2025-01-14 | Apple Inc. | Intelligent device arbitration and control |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
CN106502623A (zh) * | 2016-12-01 | 2017-03-15 | 北京小米移动软件有限公司 | 音频输出装置及方法 |
US12260234B2 (en) | 2017-01-09 | 2025-03-25 | Apple Inc. | Application integration with a digital assistant |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US12254887B2 (en) | 2017-05-16 | 2025-03-18 | Apple Inc. | Far-field extension of digital assistant services for providing a notification of an event to a user |
CN107171816A (zh) * | 2017-06-21 | 2017-09-15 | 歌尔科技有限公司 | 电话会议中的数据处理方法及装置 |
CN108174236A (zh) * | 2017-12-22 | 2018-06-15 | 维沃移动通信有限公司 | 一种媒体文件处理方法、服务器及移动终端 |
US12211502B2 (en) | 2018-03-26 | 2025-01-28 | Apple Inc. | Natural assistant interaction |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US12061752B2 (en) | 2018-06-01 | 2024-08-13 | Apple Inc. | Attention aware virtual assistant dismissal |
US12080287B2 (en) | 2018-06-01 | 2024-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
CN111081257A (zh) * | 2018-10-19 | 2020-04-28 | 珠海格力电器股份有限公司 | 一种语音采集方法、装置、设备及存储介质 |
CN111263252A (zh) * | 2018-11-30 | 2020-06-09 | 上海哔哩哔哩科技有限公司 | 一种用于直播的连麦消音方法、系统和存储介质 |
CN111263252B (zh) * | 2018-11-30 | 2021-11-30 | 上海哔哩哔哩科技有限公司 | 一种用于直播的连麦消音方法、系统和存储介质 |
CN109920445A (zh) * | 2019-03-04 | 2019-06-21 | 北京佳讯飞鸿电气股份有限公司 | 一种混音方法、装置及设备 |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US12136419B2 (en) | 2019-03-18 | 2024-11-05 | Apple Inc. | Multimodality in digital assistant systems |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US12154571B2 (en) | 2019-05-06 | 2024-11-26 | Apple Inc. | Spoken notifications |
US12216894B2 (en) | 2019-05-06 | 2025-02-04 | Apple Inc. | User configurable task triggers |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN111009256A (zh) * | 2019-12-17 | 2020-04-14 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
US11284190B2 (en) | 2019-12-17 | 2022-03-22 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Method and device for processing audio signal with frequency-domain estimation, and non-transitory computer-readable storage medium |
CN111276146A (zh) * | 2020-03-27 | 2020-06-12 | 上海乂学教育科技有限公司 | 基于语音识别的教学实训系统 |
CN111540370A (zh) * | 2020-04-21 | 2020-08-14 | 闻泰通讯股份有限公司 | 音频处理方法、装置、计算机设备及计算机可读存储介质 |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US12197712B2 (en) | 2020-05-11 | 2025-01-14 | Apple Inc. | Providing relevant data items based on context |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US12219314B2 (en) | 2020-07-21 | 2025-02-04 | Apple Inc. | User identification using headphones |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
CN112562718A (zh) * | 2020-11-30 | 2021-03-26 | 重庆电子工程职业学院 | 基于topk多路音源有效信号筛选系统及方法 |
CN117746880B (zh) * | 2024-02-20 | 2024-05-14 | 江苏鑫埭信息科技有限公司 | 远程会议通信智能降噪方法及系统 |
CN117746880A (zh) * | 2024-02-20 | 2024-03-22 | 江苏鑫埭信息科技有限公司 | 远程会议通信智能降噪方法及系统 |
US12277954B2 (en) | 2024-04-16 | 2025-04-15 | Apple Inc. | Voice trigger for a digital assistant |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102890936A (zh) | 一种音频处理方法、终端设备及系统 | |
US5991385A (en) | Enhanced audio teleconferencing with sound field effect | |
CN103733602A (zh) | 用于静音与源相关联的音频的系统和方法 | |
CN1946107B (zh) | 交互式电话训练器和练习器 | |
US20070263823A1 (en) | Automatic participant placement in conferencing | |
JP3483086B2 (ja) | 音声電話会議装置 | |
US20080273476A1 (en) | Device Method and System For Teleconferencing | |
CN105190752B (zh) | 音频传输通道质量评定 | |
WO2007059437A2 (en) | Method and apparatus for improving listener differentiation of talkers during a conference call | |
EP2064900B1 (fr) | Procede de transfert d'un flux audio entre plusieurs terminaux | |
CN114979545A (zh) | 多终端的通话方法和存储介质及电子设备 | |
CN1578542B (zh) | 多点通信的会议单元和方法 | |
US7433716B2 (en) | Communication apparatus | |
CN110662204B (zh) | 一种基于蓝牙的音乐及语音传输操作方法 | |
US20080155102A1 (en) | Method and system for managing a communication session | |
US8526589B2 (en) | Multi-channel telephony | |
JP2004072354A (ja) | 音声会議システム | |
CN116015993A (zh) | 一种音频信号处理方法及终端 | |
CN205921750U (zh) | 一种声像定位跟踪圆桌会议系统 | |
TW587384B (en) | Phone receiver sharing device and system and method applying such device for multi-party communication | |
CN107566340B (zh) | 一种会议辅助通信方法及其存储介质、装置 | |
JP6392161B2 (ja) | 音声会議システム、音声会議装置、その方法及びプログラム | |
US10419851B2 (en) | Retaining binaural cues when mixing microphone signals | |
US20100272249A1 (en) | Spatial Presentation of Audio at a Telecommunications Terminal | |
JPH04150652A (ja) | 会議通話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130123 |