CN115580678A - 一种数据处理方法、装置和设备 - Google Patents
一种数据处理方法、装置和设备 Download PDFInfo
- Publication number
- CN115580678A CN115580678A CN202211210253.2A CN202211210253A CN115580678A CN 115580678 A CN115580678 A CN 115580678A CN 202211210253 A CN202211210253 A CN 202211210253A CN 115580678 A CN115580678 A CN 115580678A
- Authority
- CN
- China
- Prior art keywords
- audio information
- information
- input audio
- input
- environmental
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 17
- 230000007613 environmental effect Effects 0.000 claims abstract description 87
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000009467 reduction Effects 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6058—Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/724094—Interfacing with a device worn on the user's body to provide access to telephonic functionalities, e.g. accepting a call, reading or composing a message
- H04M1/724097—Worn on the head
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Environmental & Geological Engineering (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、设备,该方法包括:获得来自目标对象的输入音频信息和环境音频信息;如果环境音频信息满足第一条件,输入音频信息满足第二条件,生成提示信息;输出提示信息,提示信息用于提示调整输入音频信息。
Description
技术领域
本申请涉及一种数据处理方法、装置和设备。
背景技术
用户在通过音频采集设备采集音频数据时,若音频采集设备处于安静的环境中,用户较高的说话音量将会对其他人造成影响;若音频采集设备处于嘈杂的环境中,用户较低的说话音量将难以保证采集的音频数据的质量。
发明内容
有鉴于此,本申请实施例提供一种数据处理方法、装置和设备。
本申请技术方案是这样实现的:
本申请实施例提供一种数据处理方法,包括:
获得来自目标对象的输入音频信息和环境音频信息;
如果环境音频信息满足第一条件,输入音频信息满足第二条件,生成提示信息;
输出提示信息,提示信息用于提示调整输入音频信息。
本申请实施例提供一种数据处理装置,包括:
第一获取模块,用于获得来自目标对象的输入音频信息和环境音频信息;
生成模块,用于如果所述环境音频信息满足第一条件,所述输入音频信息满足第二条件,生成提示信息;
输出模块,用于输出提示信息,所述提示信息用于提示调整所述输入音频信息。
本申请实施例提供一种数据处理设备,包括:
存储器,用于存储可执行数据处理指令;
处理器,用于执行存储器中存储的可执行数据处理指令时,实现本申请实施例提供的数据处理方法。
本申请实施例提供一种计算机可读存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令配置为执行上述数据处理方法的步骤。
附图说明
图1为本申请实施例提供的一种数据处理方法的流程示意图;
图2为本申请实施例提供的一种通话音量过大的处理方法的流程示意图;
图3为本申请实施例提供的一种音频采集装置的示意图;
图4为本申请实施例提供的一种通话音量过大的处理过程示意图;
图5为本申请实施例提供的一种环境音量和通话音量对比的示意图;
图6为本申请实施例提供的一种数据处理装置的组成结构示意图;
图7为本申请实施例提供的一种数据处理设备的组成结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例\另一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例\另一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
相关技术中,在基于音频采集设备进行音频采集,例如用户佩戴耳机进行通话的场景,由于耳机对外界声音的屏蔽,用户听到自身说话声音会变小,这时会无意识的增大自身说话的声音,当耳机佩戴者处于较为安静的环境时,较高的说话音量会对其他人造成影响;当耳机佩戴者处于嘈杂环境时较低的音量将会降低通话质量。
基于相关技术中存在的问题,本申请实施例提供一种数据处理方法,如图1所示,为本申请实施例提供的一种数据处理方法的流程示意图,该方法包括以下步骤:
S101、获得来自目标对象的输入音频信息和环境音频信息。
需要说明的是,目标对象可以是当前说话的用户,输入音频信息可以包括用户的语音信息,音频信息可以包括音量、音调、频率等。环境音频信息可以是用户所处环境中的噪音信息,例如用户所处环境中其他用户的语音信息、其他设备或物体发出的声音信息等。
在一些实施例中,可以通过音频采集设备,例如麦克风等,对目标对象的语音信息进行收集,从而获得输入音频信息,同时,也可以利用音频采集设备对应目标对象所处环境中的噪音信息进行采集,获得环境音频信息。
在一些实施例中,可以使用不同的音频采集设备分别获取输入音频信息和环境音频信息,示例性地,对于设置有定向麦克风和拾噪麦克风的手机,定向麦克风可以设置在手机正面的下方,拾噪麦克风可以设置在手机背面的上方,可以使用定向麦克风采集对当前用户的声音信息进行采集,获得输入音频信息,同时使用拾噪麦克风对当前用户所处环境中的噪音信息进行采集,获得环境音频信息。
在另一些实施例中,也可以使用相同的音频采集设备获取输入音频信息和环境音频信息,例如,采用同一麦克风对当前用户的声音信息,以及当前用户所处环境中的噪音信息进行采集,获得混合音频信息,之后可以根据当前用户的声纹信息,对该混合音频信息进行分离处理,从而获得输入音频信息和环境音频信息。
S102、如果环境音频信息满足第一条件,输入音频信息满足第二条件,生成提示信息。
在一些实施例中,音频信息可以包括音量,对应地,第一条件可以是第一预设音量值,第二条件可以是第二预设音量值,第一预设音量值和第二预设音量值可以均为预先设定的音量值。第一预设音量值和第二预设音量值可以相同,也可以不同,例如,第一预设音量值和第二预设音量值可以均为60分贝;或者第一预设音量值为60分贝,第二预设音量值为70分贝。环境音频信息满足第一条件可以是环境音频信息对应的音量值小于第一预设音量值,输入音频信息满足第二条件可以是输入音频信息对应的音量值大于或等于第二预设音量值。
在一些实施例中,若环境音频信息满足第一条件,且输入音频信息满足第二条件,则可以生成提示信息,该提示信息可以由音频采集设备内置的处理器生成,也可以由音频采集设备所在电子设备中的处理器生成。
S103、输出提示信息,提示信息用于提示调整输入音频信息。
在一些实施例中,在生成了提示信息之后,可以将该提示信息进行输出,例如可以通过显示屏显示的方式输出,也可以通过语音播报的方式进行输出。该输出的提示信息可以提示调整输入音频信息,例如,若当前环境音频信息对应的音量过大,用户说话的声音较小,则可以提示用户提高音量,从而提高输入音频信息的音量,保证输入音频信息的质量;若当前环境音频信息对应的音量过小,用户说话的声音较大,则可以提示用户降低音量,从而降低输入音频信息的音量,避免对其他人造成影响。
本申请实施例中,首先,获得来自目标对象的输入音频信息和环境音频信息;然后,如果确定环境音频信息满足第一条件,输入音频信息满足第二条件,则生成提示信息;最后,输出该提示信息。如此,通过在确定输入音频信息满足第一条件,且环境音频信息满足第二条件时,生成并输出提示信息,使得用户可以根据该提示信息适当调整自身的输入音频信息,在避免对其他人造成影响的同时,提高输入音频信息的质量。
在本申请的一些实施例中,在获得来自目标对象的输入音频信息和环境音频信息之后,可以执行下述步骤S201至步骤S202,以下对各个步骤进行说明。
S201、获得与环境音频信息对应的音频参数。
在一些实施例中,与环境音频信息对应的音频参数可以包括环境音频信息的音量、音调、频率、振幅、相位等,在获得了环境音频信息之后,可以对环境音频信息进行分析处理,从而获得环境音频信息对应的各类音频参数。
S202、基于音频参数对输入音频信息进行降噪处理。
在一些实施例中,对输入音频信息进行降噪处理可以是对输入音频信息中的噪音信息进行滤波或去除,以提高输入音频信息的质量。在一些实施例中,由于环境音频信息存在于用户或输入音频信息的音频采集设备周围,因此输入音频信息中的噪音信息主要包括环境音频信息,在对输入音频信息进行降噪处理的过程中,可以获取环境音频信息对应的参数,根据环境音频信息对应的音频参数对输入音频信息中的进行降噪处理。
在本申请的一些实施例中,音频采集参数可以包括频率,该频率可以通过对环境音频信息进行频谱分析获得。基于此,基于音频参数对输入音频信息进行降噪处理,即步骤S202可以通过下述步骤S2021A至步骤S2026A来实现,以下对各个步骤进行说明。
S2021A、如果环境音频信息不满足第一条件,获取环境音频信息的频率。
在一些实施例中,环境音频信息不满足第一条件可以是环境音频信息对应的音量值大于或等于第一预设音量值,示例性地,第一预设音量值可以为60分贝,则环境音频信息对应的音量值可以是60分贝,也可以是大于60分贝的任意分贝数值。在实际中,若环境音频信息对应的音量值大于或等于第一预设音量值,则认为用户当前所处的环境嘈杂,环境音频信息即为噪音信息,此时可以对获取的环境音频信息进行分析处理,获得该环境音频信的频率。
S2022A、基于环境音频信息的频率,确定输入音频信息中是否存在与环境音频信息频率满足相同条件的音频信息。
在一些实施例中,环境音频信息的频率的单位为赫兹(HZ),环境音频信息的频率可以是环境音频信息对应的频率范围,满足相同条件可以是输入音频信息中的部分音频信息的频率范围和环境音频信息的频率范围完全相同,也可以是输入音频信息中的部分音频信息的频率范围和环境音频信息的频率范围处于预设误差范围内。
示例性地,频率范围完全相同可以是输入音频信息中的部分音频信息的频率范围和环境音频信息的频率范围均为[1,4]HZ;若频率对应的预设误差范围为±0.5HZ,则频率范围处于预设误差范围内可以是环境音频信息的频率范围为[1,4]HZ,输入音频信息中的部分音频信息的频率范围可以为[0.5,3.5]HZ,[0.5,4]HZ,[1,3.5]HZ,[1,4]HZ等。
在一些实施例中,在获得了环境音频信息的频率之后,可以获取输入音频信息的频率,并将环境音频信息的频率和输入音频信息的频率进行对比分析,如果输入音频信息中存在与环境音频信息频率满足相同条件的音频信息,则执行步骤S2023A至步骤S2024A;如果输入音频信息中不存在与环境音频信息频率满足相同条件的音频信息,则执行步骤S2025A至步骤S2026A。
S2023A、对输入音频信息进行滤波处理,获得滤波处理后的输入音频信息。
在一些实施例中,若输入音频信息中存在与环境音频信息频率满足相同条件的音频信息,则可以确定输入音频信息中包括了噪音信息,则需要对输入音频信息进行滤波处理。在实际中,噪音信息对应信号的频率通常处于高频段,通过对输入音频信息进行频谱分析,可以确定输入音频信息对应的高频段信息,并将高频段信息对应的频率与环境音频信息的频率进行对比,确定出与环境音频信息的频率相同的音频信息,之后将与环境音频信息的频率相同的音频信息从输入音频信息中删除,从而获得滤波处理后的输入音频信息。
S2024A、将滤波处理后的输入音频信息确定为目标音频信息,发送目标音频信息。
需要说明的是,由于目标音频信息是滤波处理后的输入音频信息,因此,目标音频信息可以是不包括噪音信息,或噪音信息较少的音频信息。在一些实施例中,在获得了目标音频信息之后,可以发送该音频信息。
示例性地,在一些实施例中,若输入音频信息为当前用户通过聊天软件,如微信、扣扣等语音聊天功能录入的一段话,则目标音频信息可以通过聊天软件发送至对方用户,并在对方的聊天软件的聊天界面显示;若输入音频信息为即时通话场景中当前用户的通话设备采集的当前用户所说的话,则目标音频信息可以通过当前用户的通话设备发送至对话用户的通话设备。
S2025A、将输入音频信息确定为目标音频信息。
在一些实施例中,若输入音频信息中不存在与环境音频信息频率满足相同条件的音频信息,即说明输入音频信息中不包括噪音信号,此种情况下便不需要对输入音频信息进行滤波处理,而直接将输入音频信息作为目标音频信息。
S2026A、发送目标音频信息。
在一些实施例中,在确定了目标音频信息之后,便可以将目标音频信息发送出去,例如通过当前用户的聊天软件发送至对方的聊天软件界面,或者通过当前用户的通话设备发送至对方通话者的通话设备等。
在本申请的一些实施例中,音频参数还可以包括相位,通过对环境音频信息进行分析处理可以获得环境音频信息对应的相位。基于此,基于音频参数对输入音频信息进行降噪处理,即步骤S202可以通过下述步骤S2021B至步骤S2023B来实现,以下对各个步骤进行说明。
S2021B、如果环境音频信息不满足第一条件,获得环境音频信息的相位。
在一些实施例中,环境音频信息不满足第一条件可以是环境音频信息对应的音量值大于或等于第一预设音量值,若环境音频信息不满足第一条件,则认为环境音频信息为噪音信息,需要对噪音信息进行去除。在实现时,可以通过对环境音频信息对应的音频信号进行分析,获得环境音频信息的相位。
S2022B、基于环境音频信息,生成与环境音频信息相位相反的第一音频信息。
在一些实施例中,在获得了环境音频信息的相位之后,可以生成与环境音频信息相位相反的音频信息,即第一音频信息,第一音频信息与环境音频信息的相位相反,其余音频参数,例如频率、振幅等均相同。
S2023B、输出第一音频信息,以降低输入音频信息中的噪音信息。
在一些实施例中,在获得了第一音频信息之后,可以将第一音频信息输出,例如,通过音频输出设备将第一音频信息输出,该音频输出设备可以是麦克风、音响等。
可以理解的是,在本申请实施例中,通过获得与环境音频信息相位相反的第一音频信息,并将第一音频信息输出,使得输出后的第一音频信息可以和环境音频信息相互抵消,从而降低输入音频信息中的噪音信息。同时,对于即时通话场景,若当前用户佩戴耳机进行通话,也可以降低当前用户耳机中的噪音信息。
在本申请的一些实施例中,音频参数还可以包括第一信号,第一信号可以是对环境音频信息对应音频信号进行模数转换后获得的数字信号。基于此,基于音频参数对输入音频信息进行降噪处理,还可以通过步骤S2021C至步骤S2023C来实现,以下对各个步骤进行说明。
S2021C、如果环境音频信息不满足第一条件,基于环境音频信息获得第一信号,获得第一信号的相位。
在一些实施例中,环境音频信息不满足第一条件可以是环境音频信息对应的音量值大于或等于第一预设音量值,第一预设音量值可以是60分贝,70分贝等。第一信号可以通过对环境音频信息对应音频信号进行模数转换后获得,在实际中,环境音频信息对应的音频信号为连续的模拟信号,通过模数转换处理,例如通过模数转换器可以将环境音频信息对应的音频信息转换为对应的数字信号,即第一信号。之后,可以对第一信号进行时频分析,获得第一信号的相位。
S2022C、基于第一信号,生成与第一信号相位相反的第二信号。
在一些实施例中,第二信号可以通过对第一信号进行变换获得,在实际中可以将第一信号进行时频转换,获得与第一信号对应的第一频域信号,之后基于第一频域信号获得与第一频域信号相位相反的第二频域信号,再通过时频转换将第二频域信号转换为对应的时域信号,即第二信号。
S2023C、对第一信号和第二信号进行叠加处理,以降低输入音频信息中的噪音信息。
在一些实施例中,在获得了第二信号之后,可以对第一信号和第二信号进行叠加处理,在实现时,可以通过音频采集设备内部的处理器对第一信号和第二信号进行叠加处理,或者通过音频采集设备所在的电子设备中的处理器对第一信号和第二信号进行叠加处理。当然,此处对第一信号和第二信号进行叠加处理的设备和触发场景仅仅是示例性说明,本申请对此不作限定。
可以理解的是,在本申请实施例中,通过基于环境音频信息获得第一信号,并基于第一信号获得与第一信号相位相反的第二信号,并对第一信号和第二信号进行叠加处理,从而将环境音频信息对应的第一信号进行抵消,实现对输入音频信息的噪音信息的去除。此外,对于戴耳机通话的场景,第一信号和第二信号的叠加处理可以发生在耳机的内部,从而降低当前通话者在佩戴耳机后听到的噪音。
在本申请的一些实施例中,在获得来自目标对象的输入音频信息和环境音频信息,即步骤S101之后,还可以执行下述步骤S301至步骤S302,以下对各个步骤进行说明。
S301、如果环境音频信息满足第一条件,且输入音频信息不满足第二条件,对输入音频信息进行放大处理,获得放大处理后的输入音频信息。
在一些实施例中,环境音频信息满足第一条件可以是环境音频信息对应的音量值小于第一预设音量阈值,输入音频信息不满足第二条件可以是输入音频信息对应的音量值小于或等于第二预设音量阈值,其中,第一预设音量值和第二预设音量值可以相同,例如均为60分贝,也可以不同,例如第一预设音量值为50分贝,第二预设音量值为60分贝。
在一些实施例中,如果环境音频信息满足第一条件,则说明当前用户所处的环境较为安静,输入音频信息不满足第二条件,则说明用户说话的声音音量较低,不会对其他人造成影响,但是输入音频信息的音量较低,为了提高输入音频信息的质量,此时则可以对输入音频信息进行放大处理,例如对输入音频信的音量、音调等进行放大,从而获得放大处理后的输入音频信息。
示例性地,在对输入音频信息进行放大处理时,可以先获得输入音频信息的音量值,基于该音量值对输入音频信息进行放大,使得放大处理之后的输入音频信息的音量值大于放大处理之前的音频信息的音量值。在实际中,可以使得放大处理之后的输入音频信息的音量值大于第二预设音量阈值,小于或等于第三预设音量阈值即可,例如,若第二预设音量阈值为60分贝,第二预设音量阈值为90分贝,则放大处理后的输入音频信息的音量值可以为60分贝、65分贝、70分贝等。
S302、将放大后的输入音频信息确定为目标音频信息,发送目标音频信息。
在一些实施例中,目标音频信息为质量较好的音频信息,可以直接进行发送或输出。在获得了目标音频信息之后,当前通话者可以将该目标音频信息通发送至对方通话者,或者当前用户将该目标音频信息通过聊天软件发送至对方用户的聊天界面,或者当前用户将该目标音频信息通过音频输出设备进行播放。
在本申请的一些实施例中,获得来自目标对象的输入音频信息和环境音频信息,即步骤S101可以通过下述步骤S1011A和步骤S1011B的其中之一来实现,以下对步骤S1011A和步骤S1011B分别进行说明。
S1011A、基于第一音频采集模块采集自目标对象的输入音频信息,基于第二音频采集模块采集环境音频信息。
在一些实施例中,第一音频采集模块和第二音频采集模块可以是不同的采集模块,第一音频采集模块和第二音频采集模块可以设置于同一电子设备上,例如,第一音频采集模块和第二音频采集模块均设置在手机上,则第一音频采集模块可以是定向麦克风,第二音频采集模块可以是拾噪麦克风,定向麦克风可以设置在手机正面的下方,拾噪麦克风可以设置于手机背面的上方。
在另一些实施例中,第一音频采集模块和第二音频采集模块也可以设置于不同的电子设备上,例如,第一音频采集模可以块设置于手机上,第二音频采集模块可以设置于耳机中。
S1011B、基于第三音频采集模块采集参考音频信息,基于预设声纹信息对参考音频信息进行分离处理,获得来自目标对象的输入音频信息和环境音频信息。
在一些实施例中,第三音频采集模块可以是同时能对输入音频信和环境音频信息进行采集的音频采集设备,例如麦克风等。参考音频信息中包括了输入音频信息和环境音频信息,预设声纹信息可以是预先获得的输入音频信息对应用户的声纹信息,在实际中,不同用户的声纹信息不同,用户的声纹信息可以表示用户的身份信息,预设声纹信息可以是用户在第一次使用音频采集设备时,音频采集设备获取到用户的音频信息,并对该音频信息进行分析处理后得到的,预设声纹信息可以存储在音频采集设备中的预设存储区域中。
在一些实施例中,在通过第三音频采集模块采集到参考音频信息之后,可以基于预设声纹信息对参考音频信息进行分离处理,在分离处理时,可以获取参考音频信息中的声纹信息,将该参考音频信息中的声纹信息与预设的声纹信息进行对比,确定参考音频信息中与预设声纹信息相同的音频信息为输入音频信息,从而将参考音频信息中的输入音频信息和环境音频信息进行区分,获得来自目标对象的输入音频信息和环境音频信息。
本申请实施例中,首先,获得来自目标对象的输入音频信息和环境音频信息;然后,如果确定环境音频信息满足第一条件,输入音频信息满足第二条件,则生成提示信息;最后,输出该提示信息。如此,通过在确定输入音频信息满足第一条件,且环境音频信息满足第二条件时,生成并输出提示信息,使得用户可以根据该提示信息适当调整自身的输入音频信息,在避免对其他人造成影响的同时,提高输入音频信息的质量。
下面,对申请实施例在实际应用场景中的实现过程进行介绍。
在一些实施例中,如图2所示,为本申请实施例提供的一种通话音量过大的处理方法的流程示意图,该方法可以通过下述步骤S401至步骤S403来实现,以下对各个步骤进行说明。
S401、获取环境音量,以及当前通话者的通话音量。
需要说明的是,环境音量(相当于其他实施例中的环境音频信息)可以是当前通话者所处环境中所产生的声音信息的音量,当前通话者所处环境中所产生的声音信息可以包括除当前通话者的其他人发出的声音信息,以及其他物体发出的声音信息,例如车辆的鸣笛声、音频播放器播放的音乐、敲击建筑材料的声音等。当前通话者的通话音量(相当于其他实施例中的环境音频信息)可以是当前通话者在与对方通话者进行通话时说话的声音的音量。
在一些实施例中,可以通过如图3所示的拾噪麦克风(MIC-1)采集环境音量,以及图3中所示的定向麦克风(MIC-2)采集当前通话者的通话音量。在实际中,若用户通过手机进行通话时,拾噪麦克风(相当于其他实施例中的第二音频采集模块)可以设置于手机正面的下方,例如设置在手机正面的正下方,以使得通话者在进行说话时,便于收集通话者的声音信息,其中,手机正面为手机屏幕所在的一面;定向麦克风(相当于其他实施例中的第一音频采集模块)可以设置于手机背面的上方,例如设置在手机背面的正上方,以在通话者进行通话时,便于收集手机通话者周围环境中的声音信息,其中,手机背面可以是与手机屏幕相对的一面。
在实际中,拾噪麦克风和定向麦克风的收音范围不同,由于通话者所处环境中的声音信息来源范围较广,而通话者的声音信息来源范围窄,因此,拾噪麦克风的开合角较大,收音范围广,可以采集到环境中的音量;定向麦克风的开合角较小,收音范围窄,能采集到靠近定向麦克风的通话者的说话音量。
S402、确定环境音量对应的音量值小于第一预设音量值,且通话音量对应的音量值大于或等于第二预设音量值,生成提示信息。
需要说明的是,第一预设音量值和第二预设音量值可以均为预先设定的音量值,第一预设音量值和第二预设音量值可以相同,也可以不同,例如第一预设音量值和第二预设音量值均为60分贝,或者第一预设音量值为60分贝,第二预设音量值为65分贝。
在一些实施例中,若环境音量对应的音量值小于第一预设音量值(相当于其他实施例中的“环境音频信息满足第一条件”),则可以确定当前通话者所处的环境为安静或正常工作环境,此时可以触发扰民检测,触发扰民检测可以确定当前通话者说话的音量是否对当前通话者周围的其他人造成干扰。若确定当前通话者的通话音量对应的音量值大于或等于第二预设音量值(相当于其他实施例中的“输入音频信息满足第二条件”),则说明当前通话者的说话音量较大,会对周围其他人造成干扰,此种情况下则可以生成提示信息,在实现时,提示信息可以由通话设备生成,可以是语音,也可以是文字等。
在另一些实施例中,若环境音量对应的音量值大于或等于第一预设音量值(相当于其他实施例中的“环境音频信息不满足第一条件”),则可以确定当前通话者所处的环境嘈杂,此时可以不用触发扰民检测,即无需判断当前通话者的说话声音是否对周围其他人造成干扰。在实际中,若判断当前通话者所处的环境嘈杂时,定向麦克风采集的声音信息可能包括了当前通话者所处环境中的声音信息,此时可以对定向麦克风进行降噪。在对定向麦克风进行降噪时,可以先获得拾噪麦克风采集到的环境音量的频率(相当于其他实施例中的“获取环境音频信息的频率”),然后确定定向麦克风采集的通话音量中是否存在与环境音量的频率相同的部分音量(相当于其他实施例中的“确定输入音频信息中是否存在与环境音频信息频率满足相同条件的音频信息”),在确定存在与环境音量的频率相同的部分音量时,将该部分音量从通话音量中滤除(相当于其他实施例中的“对输入音频信息进行滤波处理”),从而降低通话音量中的噪音。
在一些实施例中,若当前通话者佩戴耳机进行通话,且当前通话者所处的环境嘈杂时,耳机中可能会存在环境噪音,影响当前通话者听到的语音信息的清晰度,从而也会增大自身的说话音量,在此情况下,可以对耳机进行降噪。在一种实现方式中,可以通过耳机的音频输出模块播放一个与环境音量相位相反的音量(相当于其他实施例中的第一音频信息),从而与环境音量相互抵消,降低耳机中的环境噪声;在另一种实现方式中,也可以将环境音量转化为对应的第一数字信号(相当于其他实施例中的第一信号),生成一个第一数字信号相位相反的第二数字信号(相当于其他实施例中的第二信号),并将第一数字信号和第二数字信号进行叠加,从而降低耳机中的环境噪音。
S403、输出提示信息,以提示当前通话者降低自身的通话音量。
在一些实施例中,对于戴耳机通话的场景,若当前通话者所处环境的中环境音量小于第一预设音量值,则说明当前通话者处在安静的环境中,而由于耳机对外界声音的隔离作用,当前通话者可能无法听到周围的声音信息,此情况下若当前通话者的通话音量大于或等于第二预设音量值,则会对周围其他人造成干扰。因此,通过输出提示信息可以告知当前通话者自身的说话音量过高,以使得当前通话者降低自身的音量。在实际中,提示信息可以以文字的形式在通话者使用的手机显示界面中显示,也可以以语音播报的形式,通过耳机或手机进行提示。
在一些实施例中,如图4所示,为本申请实施例提供的一种通话音量过大的处理过程示意图,以下以图4为例,对可以通过如图4为例对本申请实施例提供的通话音量过大的处理流程进行说明。
首先,执行步骤S1,检测环境音量。在实现时,可以通过拾噪麦克风对当前通话者周围的环境音量进行检测。然后,执行步骤S2,判断环境音的音量值是否小于第一预设音量值。若是,则执行步骤S3,触发扰民检测,并检测通话音量。在实际中,可以通过定向麦克风对通话音量进行检测;若否,则不触发扰民检测。在获得了通话音量之后,可以执行步骤S4,确定通话音量的音量值是否大于获得等于第二预设音量值。若是,则执行步骤S5,输出扰民提示信息;若否,则说明当前通话者的通话音量不会对其他人造成干扰,不输出扰民提示信息。
示例性地,如图5所示为本申请实施例提供的一种环境音量和通话音量的对比示意图。如图5所示,横坐标表示音量值,单位为分贝(DB);纵坐标表示时间,单位为秒(S)。若第一预设音量值和第二预设音量值均为60分贝,在TA点到TB点之间,环境音量的音量值小于或等于60分贝,而通话音量的音量值大于60分贝,此时间段内便可以生成提示信息,当前通话者接收到提示信息,在TB点之后,便降低了自身的通话音量,从而使得通话音量的音量值小于60分贝。
可以理解的是,在本申请实施例中,通过拾噪麦克风检测环境音量,判断当前通话者是否处于安静的环境中。如果确定当前通话者处于安静的环境中,则触发扰民提示检测,并利用定向麦克风检测当前通话者的通话音量,如果通话音量的音量值大于或等于预设的音量值,则判定为扰民,并输出扰民提示信息,以提示当前通话者降低自身的通话音量,从而避免了对他人造成干扰。
本申请还提供一种数据处理装置,图6为本申请实施例提供的一种数据处理装置的组成结构示意图,如图6所示,数据处理装置500包括:
第一获取模块501,用于获得来自目标对象的输入音频信息和环境音频信息;
生成模块502,用于如果所述环境音频信息满足第一条件,所述输入音频信息满足第二条件,生成提示信息;
输出模块503,用于输出提示信息,所述提示信息用于提示调整所述输入音频信息。
在一些实施例中,所述数据处理装置500还包括:
第二获取模块,用于获得与所述环境音频信息对应的音频参数;
降噪处理模块,用于基于所述音频参数对所述输入音频信息进行降噪处理。
在一些实施例中,所述音频参数包括频率;所述降噪处理模块包括:
第一获取子模块,用于如果所述环境音频信息不满足所述第一条件,获取所述环境音频信息的频率;
第一确定子模块,用于基于所述环境音频信息的频率,确定所述输入音频信息中是否存在与所述环境音频信息频率满足相同条件的音频信息;
滤波处理子模块,用于如果所述输入音频信息中存在与所述环境音频信息频率满足相同条件的音频信息,对所述输入音频信息进行滤波处理,获得滤波处理后的输入音频信息;
第一发送子模块,用于将所述滤波处理后的输入音频信息确定为目标音频信息,发送所述目标音频信息。
在一些实施例中,降噪处理模块还包括:
第二确定子模块,用于如果所述输入音频信息中不存在与所述环境音频信息频率满足相同条件的音频信息,将所述输入音频信息确定为所述目标音频信息;
第二发送子模块,用于发送所述目标音频信息。
在一些实施例中,所述音频参数包括相位;所述降噪处理模块还包括:
第二获取模块,用于如果所述环境音频信息不满足所述第一条件,获得所述环境音频信息的相位;
第一生成子模块,用于基于所述环境音频信息,生成与所述环境音频信息相位相反的第一音频信息;
输出子模块,用于输出所述第一音频信息,以降低所述输入音频信息中的噪音信息。
在一些实施例中,所述音频参数包括第一信号;所述降噪处理模块还包括:
第三获取子模块,用于如果所述环境音频信息不满足所述第一条件,基于所述环境音频信息获得第一信号,获得所述第一信号的相位;
第二生成子模块,用于基于所述第一信号,生成与所述第一信号相位相反的第二信号;
叠加处理子模块,用于对所述第一信号和所述第二信号进行叠加处理,以降低所述输入音频信息中的噪音信息。
在一些实施例中,所述数据处理装置500还包括:
放大处理模块,用于如果所述环境音频信息满足所述第一条件,且所述输入音频信息不满足所述第二条件,对所述输入音频信息进行放大处理,获得放大处理后的输入音频信息;
发送模块,用于将所述放大后的输入音频信息确定为目标音频信息,发送所述目标音频信息。
在一些实施例中,所述第一获取模块501包括:
采集子模块,用于基于第一音频采集模块采集所述自目标对象的输入音频信息,基于第二音频采集模块采集所述环境音频信息;
分离处理子模块,用于基于第三音频采集模块采集参考音频信息,基于预设声纹信息对所述参考音频信息进行分离处理,获得所述来自目标对象的输入音频信息和环境音频信息。
需要说明的是,本申请实施例数据处理装置的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的数据处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关方案做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read OnlyMemory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
相应地,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的数据处理方法。
本申请实施例还提供一种数据处理设备。图7为本申请实施例提供的一种数据处理设备的组成结构示意图,如图7所示,所述数据处理设备600包括:存储器601、处理器602、通信接口603和通信总线604。其中,存储器601,用于存储可执行数据处理指令;处理器602,用于执行存储器中存储的可执行数据处理指令时,以实现以上述实施例提供的数据处理方法。
以上数据处理设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请数据处理设备和存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括至少一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术对象可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一个产品执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术对象在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种数据处理方法,包括:
获得来自目标对象的输入音频信息和环境音频信息;
如果所述环境音频信息满足第一条件,所述输入音频信息满足第二条件,生成提示信息;
输出提示信息,所述提示信息用于提示调整所述输入音频信息。
2.根据权利要求1所述的方法,还包括:
获得与所述环境音频信息对应的音频参数;
基于所述音频参数对所述输入音频信息进行降噪处理。
3.根据权利要求2所述的方法,所述音频参数包括频率;所述基于所述音频参数对所述输入音频信息进行降噪处理,包括:
如果所述环境音频信息不满足所述第一条件,获取所述环境音频信息的频率;
基于所述环境音频信息的频率,确定所述输入音频信息中是否存在与所述环境音频信息频率满足相同条件的音频信息;
如果所述输入音频信息中存在与所述环境音频信息频率满足相同条件的音频信息,对所述输入音频信息进行滤波处理,获得滤波处理后的输入音频信息;
将所述滤波处理后的输入音频信息确定为目标音频信息,发送所述目标音频信息。
4.根据权利要求3所述的方法,还包括:
如果所述输入音频信息中不存在与所述环境音频信息频率满足相同条件的音频信息,将所述输入音频信息确定为所述目标音频信息;
发送所述目标音频信息。
5.根据权利要求2所述的方法,所述音频参数包括相位;所述基于所述音频参数对所述输入音频信息进行降噪处理,包括:
如果所述环境音频信息不满足所述第一条件,获得所述环境音频信息的相位;
基于所述环境音频信息,生成与所述环境音频信息相位相反的第一音频信息;
输出所述第一音频信息,以降低所述输入音频信息中的噪音信息。
6.根据权利要求2所述的方法,所述音频参数包括第一信号;所述基于所述音频参数对所述输入音频信息进行降噪处理,还包括:
如果所述环境音频信息不满足所述第一条件,基于所述环境音频信息获得第一信号,获得所述第一信号的相位;
基于所述第一信号,生成与所述第一信号相位相反的第二信号;
对所述第一信号和所述第二信号进行叠加处理,以降低所述输入音频信息中的噪音信息。
7.根据权利要求1所述的方法,还包括:
如果所述环境音频信息满足所述第一条件,且所述输入音频信息不满足所述第二条件,对所述输入音频信息进行放大处理,获得放大处理后的输入音频信息;
将所述放大后的输入音频信息确定为目标音频信息,发送所述目标音频信息。
8.根据权利要求1所述的方法,所述获得来自目标对象的输入音频信息和环境音频信息,包括以下至少之一:
基于第一音频采集模块采集所述自目标对象的输入音频信息,基于第二音频采集模块采集所述环境音频信息;
基于第三音频采集模块采集参考音频信息,基于预设声纹信息对所述参考音频信息进行分离处理,获得所述来自目标对象的输入音频信息和环境音频信息。
9.一种数据处理装置,包括:
第一获取模块,用于获得来自目标对象的输入音频信息和环境音频信息;
生成模块,用于如果所述环境音频信息满足第一条件,所述输入音频信息满足第二条件,生成提示信息;
输出模块,用于输出提示信息,所述提示信息用于提示调整所述输入音频信息。
10.一种数据处理设备,包括:
存储器,用于存储可执行数据处理指令;
处理器,用于执行所述存储器中存储的可执行数据处理指令,实现权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211210253.2A CN115580678A (zh) | 2022-09-30 | 2022-09-30 | 一种数据处理方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211210253.2A CN115580678A (zh) | 2022-09-30 | 2022-09-30 | 一种数据处理方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115580678A true CN115580678A (zh) | 2023-01-06 |
Family
ID=84583755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211210253.2A Pending CN115580678A (zh) | 2022-09-30 | 2022-09-30 | 一种数据处理方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115580678A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107978320A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话调整方法、装置、设备及介质 |
CN111754969A (zh) * | 2020-07-06 | 2020-10-09 | 歌尔科技有限公司 | 一种降噪方法、装置、电子设备和降噪系统 |
CN114710730A (zh) * | 2022-04-29 | 2022-07-05 | Oppo广东移动通信有限公司 | 音量提示方法、装置、耳机及存储介质 |
-
2022
- 2022-09-30 CN CN202211210253.2A patent/CN115580678A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107978320A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话调整方法、装置、设备及介质 |
CN111754969A (zh) * | 2020-07-06 | 2020-10-09 | 歌尔科技有限公司 | 一种降噪方法、装置、电子设备和降噪系统 |
CN114710730A (zh) * | 2022-04-29 | 2022-07-05 | Oppo广东移动通信有限公司 | 音量提示方法、装置、耳机及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8972251B2 (en) | Generating a masking signal on an electronic device | |
US8611554B2 (en) | Hearing assistance apparatus | |
US20120101819A1 (en) | System and a method for providing sound signals | |
JP5644359B2 (ja) | 音声処理装置 | |
JP5929786B2 (ja) | 信号処理装置、信号処理方法及び記憶媒体 | |
US10510361B2 (en) | Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user | |
EP3777114B1 (en) | Dynamically adjustable sidetone generation | |
CN111683319A (zh) | 一种通话拾音降噪方法及耳机、存储介质 | |
JPH09503889A (ja) | 音声相殺式送話システム | |
US11589173B2 (en) | Hearing aid comprising a record and replay function | |
JP2014174255A5 (zh) | ||
CN109218879A (zh) | 头戴式耳机、用于头戴式耳机的方法以及计算机可读介质 | |
CN107370898B (zh) | 铃音播放方法、终端及其存储介质 | |
EP4354898A1 (en) | Ear-mounted device and reproduction method | |
CN109040473B (zh) | 终端音量调节方法、系统和手机 | |
CN113038315A (zh) | 一种语音信号处理方法及装置 | |
CN117939378A (zh) | 一种助听器及自回声消除方法、设备、存储介质 | |
CN115580678A (zh) | 一种数据处理方法、装置和设备 | |
CN115866474A (zh) | 无线耳机的透传降噪控制方法、系统及无线耳机 | |
CN115668370A (zh) | 听力设备自带的语音检测器 | |
EP4456561A1 (en) | Ear-mounted device and reproduction method | |
JP2012194295A (ja) | 音声出力システム | |
CN119400147A (zh) | 基于侧音的降噪方法、主动降噪耳机和存储介质 | |
CN115190212A (zh) | 基于耳机设备的通话降噪方法、装置、耳机设备以及介质 | |
CN118870277A (zh) | 具有主动降噪的助听方法、头戴式设备和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |