CN116709112A - 音频数据处理方法、系统、数据处理设备及存储介质 - Google Patents
音频数据处理方法、系统、数据处理设备及存储介质 Download PDFInfo
- Publication number
- CN116709112A CN116709112A CN202210173756.0A CN202210173756A CN116709112A CN 116709112 A CN116709112 A CN 116709112A CN 202210173756 A CN202210173756 A CN 202210173756A CN 116709112 A CN116709112 A CN 116709112A
- Authority
- CN
- China
- Prior art keywords
- audio data
- audio
- channels
- data
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 104
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims description 47
- 238000004590 computer program Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 12
- 230000009467 reduction Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请实施例提供一种音频数据处理方法、系统、数据处理设备及存储介质,该音频数据处理方法包括:数据处理设备通过音频总线从音频处理器获取N通道的音频数据;从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,目标应用为数据处理设备安装的至少两个应用中的任意一个。本申请实施例可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量。
Description
技术领域
本申请涉及音频技术领域,具体涉及一种音频数据处理方法、系统、数据处理设备及存储介质。
背景技术
在汽车智能化、网联化的趋势下,时间更长、频率更高、层次更深的人机交互正在成为汽车行业重要的发展主题,智能语音是汽车智能座舱非常重要的人机交互方式之一。智能语音是指第一应用,它开机后一直运行,它是智能座舱的重要交互入口,包括语音识别、唤醒、定位等功能。为了提高语音识别成功率,要进行降噪处理,普通录音是指第二应用自带的语音功能,普通录音不需要降噪,因此,智能语音和普通语音需要的音频数据的通道数不同。
为了保证智能语音和普通录音二者互不干扰。第一应用和第二应用分别从不同的音频总线读取音频数据。比如,第一应用从第一音频总线读取需要的通道数的音频数据,第二应用从第二音频总线读取需要的通道数的音频数据,二者可以在互不干扰的情况下同时工作。目前的智能语音和普通录音同时工作需要各自独立的音频总线,需要最少2组音频总线才可以实现,需要的音频总线较多。
发明内容
本申请实施例提供一种音频数据处理方法、系统、数据处理设备及存储介质,可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量。
本申请实施例的第一方面提供了一种音频数据处理方法,所述方法应用于数据处理设备,所述方法包括:
所述数据处理设备通过音频总线从音频处理器获取N通道的音频数据;N为大于或等于2的整数;
从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
本申请实施例的第二方面提供了一种音频处理系统,包括:音频处理器、音频总线和数据处理设备,所述音频处理器与所述数据处理设备通过所述音频总线连接;
所述数据处理设备,用于通过所述音频总线从所述音频处理器获取N通道的音频数据;N为大于或等于2的整数;
所述数据处理设备,还用于从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
本申请实施例的第三方面提供了一种数据处理设备,包括:
获取单元,用于通过音频总线从音频处理器获取N通道的音频数据;N为大于或等于2的整数;
筛选单元,用于从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
本申请实施例的第四方面提供了一种数据处理设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面中的步骤指令。
本申请实施例的第五方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
本申请实施例的第六方面提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
本申请实施例中,数据处理设备通过音频总线从音频处理器获取N通道的音频数据;N为大于或等于2的整数;从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,目标应用为数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。本申请实施例中,至少两个应用中的每个应用所需要的音频数据,都可以从一条音频总线获取的N通道的音频数据中进行筛选,只需要一组音频总线,即可实现至少两个应用的音频数据的获取需求,可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种音频处理系统的结构示意图;
图2是本申请实施例提供的一种音频数据处理方法的流程示意图;
图3是本申请实施例提供的一种1个通道需求数据处理示意图;
图4是本申请实施例提供的一种数据流走向的示意图;
图5是本申请实施例提供的一种2个通道需求数据处理示意图;
图6为本申请实施例提供的一种数据处理设备的结构示意图;
图7是本申请实施例提供的另一种数据处理设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
请参阅图1,图1是本申请实施例提供的一种音频处理系统的结构示意图。如图1所示,该音频处理系统100可以包括:音频处理器10、音频总线20和数据处理设备30。所述音频处理器10与所述数据处理设备30通过所述音频总线20连接,所述数据处理设备30安装有至少两个应用;
所述数据处理设备30,用于通过所述音频总线20从所述音频处理器10获取N通道的音频数据;N为大于或等于2的整数;
所述数据处理设备30,还用于从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
数据处理设备30可以是车机的组成部分。比如,可以是车机上具有数据处理功能的模块,具体的,数据处理设备30可以是系统级芯片(system on chip,SOC)。音频处理器10、音频总线20和数据处理设备30可以集成于同一设备中,也可以是单独存在。
本申请实施例中,该至少两个应用可以包括第一应用(比如,智能语音应用)和第二应用(比如,普通录音应用)。数据处理设备30开机后,第一应用可以一直运行,第一应用可以是智能座舱的重要交互入口,包括语音识别、唤醒、定位等功能。为了提高语音识别成功率,要进行降噪处理,第一应用为智能语音应用时,第一应用中负责语音识别的功能需要至少2通道的音频数据,该2通道中包含1通道麦克风(mic)音频数据和2通道参考信号数据。举例来说,如果车内安装有1个麦克风(该麦克风可以安装在驾驶位附近),则N=2,N通道的音频数据包括1通道的麦克风音频数据和1通道的参考音频数据(比如,一个左通道的参考音频数据)。从所述N通道的音频数据中筛选出所述第一应用所需的a个通道的音频数据,具体可以包括:从所述N通道的音频数据中筛选出所述第一应用所需的2个通道的音频数据。如果车内安装有2个麦克风(该2个麦克风可以分别安装主驾驶位附近和副驾驶位附近),则N=4,N通道的音频数据包括2通道的麦克风音频数据和2通道的参考音频数据(包括一个左通道的参考音频数据和一个右通道的参考音频数据)。从所述N通道的音频数据中筛选出所述第一应用所需的a个通道的音频数据,具体可以包括:从所述N通道的音频数据中筛选出所述第一应用所需的4个通道的音频数据。如果车内安装有4个麦克风(该4个麦克风可以分别安装主驾驶位附近和副驾驶位附近、第二排的左边座位附近、第二排的右边座位附近),则N=6,N通道的音频数据包括4通道的麦克风音频数据和2通道的参考音频数据(包括一个左通道的参考音频数据和一个右通道的参考音频数据)。从所述N通道的音频数据中筛选出所述第一应用所需的a个通道的音频数据,具体可以包括:从所述N通道的音频数据中筛选出所述第一应用所需的4个通道的音频数据(2通道的麦克风音频数据和2通道的参考音频数据)或6个通道的音频数据。如果车内安装有6个麦克风(该6个麦克风可以分别安装主驾驶位附近和副驾驶位附近、第二排的左边座位附近、第二排的右边座位附近、第三排的左边座位附近、第三排的右边座位附近),则N=8,N通道的音频数据包括6通道的麦克风音频数据和2通道的参考音频数据(包括一个左通道的参考音频数据和一个右通道的参考音频数据)。从所述N通道的音频数据中筛选出所述第一应用所需的a个通道的音频数据,具体可以包括:从所述N通道的音频数据中筛选出所述第一应用所需的4个通道的音频数据(2通道的麦克风音频数据和2通道的参考音频数据)或6个通道的音频数据(4通道的麦克风音频数据和2通道的参考音频数据)或8个通道的音频数据。
普通录音应用,可以包括地图应用(百度地图、腾讯地图)、音乐应用、聊天应用等第二应用自带的语音功能。第二应用可以采集b个通道的麦克风(mic)音频数据。
第一应用作为人机交互入口之一,数据处理设备30开机就启动,可以不断的获取麦克风(mic)语音数据,可以监控用户语音输入。第二应用在用户有需要(比如,用户需要语音控制地图应用进行导航时)的时候启动。为达到良好的人机交互体验,需要在智能语音工作时,同时可以使用例如百度地图智能语音、QQ语音、微信语音等应用功能,也需要这个时候第二应用的智能语音能正常工作,能准确识别用户语音的指令。
音频处理器10可以从麦克风获取麦克风采集的音频数据,还可以从正在工作的具有音频播放功能的应用(比如,音乐应用)获取参考音频数据。音频处理器10对获取的数据进行处理后,可以得到N通道的音频数据,可以通过音频总线20将N通道的音频数据传输至数据处理设备30。数据处理设备30可以根据第一应用的需求和第二应用的需求从N通道的音频数据中选择需要的音频数据进行处理。
对于第一应用为智能语音应用而言,由于第一应用需要考虑语音识别的成功率,需要进行降噪。例如,在车载环境内会同时存在音乐信号和发音源信号,会同时传输进到麦克风(mic),在语音识别时,需要把音乐信号给屏蔽掉,即为回声消除,该例子的回声消除以音乐信号作为参考信号,抑制环境噪音并增强有效的语音信号,回声消除需要数据处理设备中具有降噪功能的语音处理模块进行处理。至少2通道因为至少1通道的麦克风(mic)+至少1通道参考(比如,可以是音乐噪声)。
对于第二应用是普通录音应用(也可以是小程序)而言,其本身只需要获取麦克风(mic)信号,不需要获取参考信号,一般情况下是1或者是2个通道需求,且本身没有相关的降噪处理模块,没有降噪处理需求。
音频总线20可以是具有传输音频数据的通信总线。比如,内置集成电路音频总线(Inter IC Sound,I2S),也可以称为集成电路内置音频总线。
本申请实施例中,至少两个应用中的每个应用所需要的音频数据,都可以从一条音频总线获取的N通道的音频数据中进行筛选,只需要一组音频总线,即可实现至少两个应用的音频数据的获取需求,可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量。
可选的,如图1所示,该音频处理系统100还可以包括M个麦克风(如图1所示的41、42、...4M);
所述音频处理器10,用于从所述M个麦克风获取M路麦克风原始数据,从参考音频通道获取P路原始参考数据;
所述音频处理器10,还用于对所述M路麦克风原始数据进行处理,得到M通道的麦克风音频数据,对所述P路原始参考数据进行处理,得到P通道的参考音频数据;所述N通道的音频数据包括所述M通道的麦克风音频数据和所述P通道的参考音频数据;N为M与P之和,M为大于或等于1的整数,P为大于或等于1的整数。需要说明的是,图1中为了方便理解,以M大于或等于3为例。
本申请实施例中,参考音频通道可以是具有音频播放功能的应用(比如,音乐应用)与音频处理器10建立的音频传输通道。具有音频播放功能的应用可以安装在数据处理设备30上。
音频处理器10从M个麦克风获取M路麦克风原始数据后,可以对M路麦克风原始数据进行处理,类似的,音频处理器10参考音频通道获取P路原始参考数据后,可以对P路原始参考数据进行处理,得到P通道的参考音频数据。举例来说,音频处理器10可以是音频数字信号处理器(Audio Digital Signal Processing,ADSP),音频数字信号处理器可以对原始音频数据进行编解码、模数转换、封装等处理,处理后的音频数据可以方便第一应用和第二应用做进一步的处理。
以下的方法实施例可以应用于图1所示的音频处理系统。
请参阅图2,图2是本申请实施例提供的一种音频数据处理方法的流程示意图。如图2所示,该方法包括如下步骤。
201,数据处理设备通过音频总线从音频处理器获取N通道的音频数据。
其中,N为大于或等于2的整数。
本申请实施例中,数据处理设备通过音频总线从音频处理器获取N通道的音频数据,可以提供给至少两个应用(比如,第一应用和第二应用)使用。
可选的,所述N通道的音频数据包括M通道的麦克风音频数据和P通道的参考音频数据;N为M与P之和,M为大于或等于1的整数,P为大于或等于1的整数。
第一应用是智能语音应用时,第一应用为了提高语音识别成功率,要进行降噪处理,第一应用在对N通道的音频数据进行处理时,可以依据P通道的参考音频数据对M通道的麦克风音频数据进行降噪处理,从而过滤掉麦克风采集的语音中的噪音(比如,音乐声),从而提高第一应用的语音识别成功率。
其中,P可以等于1或2,当P=1,M=1时,P通道的参考音频数据可以包括左通道的参考音频数据或者右通道的参考音频数据,M通道的麦克风音频数据可以包括设置在主驾驶位附近的麦克风采集的音频数据或者设置在副驾驶位附近的麦克风采集的音频数据。举例来说,若主驾驶位位于车辆的前排左边,则参考音频数据可以包括左通道的参考音频数据,麦克风音频数据可以包括设置在主驾驶位附近的麦克风采集的音频数据。若主驾驶位位于车辆的前排右侧,则参考音频数据可以包括右通道的参考音频数据,麦克风音频数据可以包括设置在主驾驶位附近的麦克风采集的音频数据。
当P=2,M=2时,P通道的参考音频数据可以包括左通道的参考音频数据和右通道的参考音频数据,M通道的麦克风音频数据可以包括设置在主驾驶位附近的麦克风采集的音频数据和设置在副驾驶位附近的麦克风采集的音频数据。
当P=2,M=4时,P通道的参考音频数据可以包括左通道的参考音频数据和右通道的参考音频数据,M通道的麦克风音频数据可以包括设置在主驾驶位附近的麦克风采集的音频数据、设置在副驾驶位附近的麦克风采集的音频数据、设置在第二排左边座位附近的麦克风采集的音频数据和设置在第二排右边座位附近的麦克风采集的音频数据。
其中,当P=2,M=6、8等时,可以参照上述实施例,此处不再赘述。
可选的,数据处理设备通过音频总线从音频处理器获取N通道的音频数据,具体可以包括如下步骤:
(11)数据处理设备通过所述音频总线接收所述音频处理器输出的K个音频数据帧,所述K个音频数据帧中的每一帧均包括N个通道的帧数据,K为正整数;
(12)数据处理设备将所述K个音频数据帧按照接收时间顺序放入音频缓存,得到所述N通道的音频数据。
本申请实施例中,音频处理器可以按照设定的采样频率和采样位数从M个麦克风采集原始音频数据,与此同时,音频处理器还可以按照设定的采样频率和采样位数从正在工作的具有音频播放功能的应用(比如,音乐应用)获取参考音频数据。音频处理器可以对采集的原始音频数据和参考音频数据进行编解码、模数转换、封装等处理,得到K个音频数据帧(frames)。
数据处理设备通过所述音频总线接收所述音频处理器输出的K个音频数据帧后,可以将所述K个音频数据帧按照接收时间顺序放入所述音频缓存,得到N通道的音频数据。
K个音频数据帧中的每一帧均包括N个通道的帧数据。具体的,K个音频数据帧中的每一帧均包括N个通道的帧数据。所述K个音频数据帧的每一帧包括的N个通道的帧数据组成所述N通道的音频数据。所述N通道的音频数据中每一个通道的音频数据都包括K个音频数据帧中的对应的通道的帧数据的组合。
202,从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据。
其中,目标应用为数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
在一个可能的实施例中,a=N,目标应用是智能语音应用时,为了提高语音识别成功率,目标应用可能需要尽可能多的音频数据,对于数据处理设备从音频总线获取的N通道的音频数据,第一应用可以不用进行筛选,而是都用来进行处理。
在另一个可能的实施例中,a<N,目标应用是普通录音应用时,为了降低语音处理的复杂度,目标应用可以从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据。
本申请实施例中,N通道的音频数据可以包括麦克风通道的音频数据和参考通道的音频数据。目标应用如果没有降噪处理需求(比如,目标应用是普通录音应用),则不需要获取参考通道的音频数据,只需要获取麦克风通道的音频数据。可以从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据。比如,在目标应用需要获取一个通道的音频数据时,需要从N通道的音频数据中筛选出一个麦克风通道的音频数据。在目标应用需要获取至少两个通道的音频数据时,需要从N通道的音频数据中筛选出至少两个麦克风通道的音频数据。
示例性的,有些目标应用仅支持单通道的音频数据的处理,车内也仅安装有1个麦克风,则目标应用需要从该麦克风通道获取音频数据,此时,可以从N通道的音频数据中筛选麦克风通道的音频数据。
示例性的,有些目标应用仅支持单通道的音频数据的处理,车内安装有2个或者2个以上的麦克风,则目标应用需要从该2个或者2个以上的麦克风通道获取的音频数据中筛选需要的通道的音频数据。
示例性的,有些目标应用支持双通道的音频数据的处理,车内安装有2个或者2个以上的麦克风,则目标应用需要从该2个或者2个以上的麦克风通道获取的音频数据中筛选需要的通道的音频数据。
目标应用获取a个通道的音频数据后,可以对该a个通道的音频数据进行后续处理。举例来说,对于地图应用而言,其语音识别功能被唤醒后,用户可以发出语音信号(比如,地名),地图应用通过图2的方法获取到一个通道的音频数据或者至少两个通道的音频数据后,可以进行语音识别处理,可以生成对应的搜索词,可以搜索对应的地点,并生成导航路线。
可选的,所述N通道的音频数据封装于K个音频数据帧中,所述K个音频数据帧存储在音频缓存中,所述K个音频数据帧中每个音频数据帧均包含N个通道的帧数据,K为正整数。
本申请实施例中,数据处理设备通过音频总线从音频处理器获取的N通道的音频数据可以存储在音频缓存中。数据处理设备可以通过音频总线从音频处理器获取K个音频数据帧,所述K个音频数据帧中的每一帧均包括N个通道的帧数据,K为正整数。
可选的,步骤202中,从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,具体可以包括如下步骤:
(21)创建第一缓存,所述第一缓存与所述音频缓存的容量比值大于或等于a/N;
(22)分别从所述K个音频数据帧中的每个音频数据帧包含的N个通道的帧数据中筛选出a个通道的帧数据,得到每个音频数据帧对应的第一筛选数据帧;其中,每个第一筛选数据帧均包含从对应音频数据帧中筛选出的a个通道的帧数据;
(23)将每个第一筛选数据帧按照所述每个第一筛选数据帧所对应的音频数据帧的接收时间顺序放入所述第一缓存,得到所述目标应用所需的a个通道的音频数据。
本申请实施例中,从N通道的音频数据中筛选出a个通道的音频数据,可以通过创建线程和缓存的方式来实现。创建的线程和缓存可以通过Java代码来实现。
创建的缓存的大小可以基于需要筛选的通道数来确定,一般而言,通道数越多,缓存的大小越大。在确定筛选的通道数为a个时,可以选择创建的第一缓存的大小为:第一缓存与音频缓存的容量比值大于或等于a/N。还可以根据通道数与缓存大小的对应关系(通道数与缓存大小可以成正相关关系,具体可以是正比例关系)确定第一缓存的大小。将筛选出来的a个通道的音频数据放入第一缓存,可以便于后续目标应用从第一缓存中获取该音频数据。第一缓存可以是先进先出(First Input First Output,FIFO)的缓存(buffer)。筛选出来的a个通道的音频数据按照K个音频数据帧的接收时间顺序放入所述第一缓存可以保证目标应用可以按照时间顺序从第一缓存获取音频数据,避免出现目标应用获取的音频数据在时间顺序上被打乱,从而提高目标应用对音频数据的处理效果。
可选的,从所述每个音频数据帧中筛选出a个通道的帧数据均为相同的a个通道的帧数据。
本申请实施例中,N通道的音频数据中,每一个通道都可以包括K帧数据。下面以a=1,N=4,M=2,P=2为例进行说明。请参阅图3,图3是本申请实施例提供的一种1个通道需求数据处理示意图。如图3所示,K帧数据中,每一帧都包括左通道的麦克风音频数据(MIC_L)、右通道的麦克风音频数据(MIC_R)、左通道的参考音频数据(REF_L)和右通道的参考音频数据(REF_R)。将K帧数据中的每一帧的左通道的麦克风音频数据筛选出来,得到K帧数据包含的左通道的麦克风音频数据。其中,筛选出来的数据,按照第一帧到第K帧的时间顺序进行排列,按照时间顺序进入先进先出的第一缓存。当目标应用需要对K帧的中的左通道的麦克风音频数据进行处理时,也按照先进先出的策略从第一缓存中取数据。
可选的,步骤202中,从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,具体可以包括如下步骤:
若a等于1,从所述M通道的麦克风音频数据中筛选出第一通道的音频数据,所述第一通道为所述M通道中的一个。
本申请实施例中,读函数可以是java中的read函数,可以连续的读取音频数据流。
请参阅图4,图4是本申请实施例提供的一种数据流走向的示意图。如图4所示,数据处理设备可以包括音频平台层、音频硬件抽象层和内核层。
本申请实施例中,音频平台层可以是audioflinger,audioflinger作为安卓音频框架(android audio framework)层,可以通过创建的线程(如图4中的第一线程/第二线程)不断从audiohal获取数据,audioflinger也可以有控制逻辑、重采样等功能。
音频硬件抽象层可以是audiohal,audiohal可以执行读函数(第一读函数/第二读函数),从内核层读取音频数据。
内核层可以是kernel层,kernel层可以存储通过I2S总线从音频处理器采用DMA的方式获取的音频数据。
其中,至少两个应用可以包括第一应用和第二应用,目标应用可以是第一应用或第二应用。第一应用(比如,智能语音APP)和第二应用(比如,普通录音APP),可以通过安卓(Android)原生audioflinger层获取音频数据。audioflinger层创建了对应线程,可以循环从audiohal层获取音频数据,并存放到对应的FIFO buffer里面,提供给应用获取。audiohal层的read函数可以通过tinyalsa模块(Android音频处理框架层),从kernel层获取数据,本申请实施例的智能语音APP和普通录音APP都是从同一个I2S总线获取数据。
本申请实施例可以通过一组I2S总线和音频处理器(比如,外置ADSP)连接,外置ADSP内部可以把2通道mic数据(MIC_L和MIC_R)和2通道的参考信号,一共4通道数据,通过DMA传输给I2S1,第一应用(比如,智能语音APP)和第二应用(比如,普通录音APP)的数据都从I2S1硬件获得,第一应用可以获取到全部4个通道数据,第二应用可以通过本申请实施例的方法获得1或者2通道mic数据。
下面结合图3和图4,详细说明目标应用需要获取一个通道的音频数据的情况(a=1时)。
当目标应用有1个通道数据需求时,目标应用(比如,普通录音APP)可以向音频平台层(audioflinger)申请1个通道采集需求,audioflinger会创建线程,循环向音频硬件抽象层(audiohal)获取数据,并提供大小为size1的第一缓存。可以向内核层(kernel)获取和智能语音相同的通道数4通道,采用4*size1的缓存向内kernel采集,获取到4通道数据,再从中筛选出1个通道,填充到audioflinger的第一缓存里,提供给目标应用。
从图3可以看出,有K个音频数据帧(frames),音频硬件抽象层(audiohal)从内核层(kernel)获取到的数据有4*size1大小,也是K个frames。在软件实现时,可以遍历K个frames中所有的音频块,通过排列顺序筛选出MIC_L数据,每个frames只保留MIC_L数据,并把所有的MIC_L数据填充到第一缓存,提供给audioflinger层,普通录音APP从audioflinger层获取到对应的数据。
本申请实施例中,N通道的音频数据中,每一个通道都可以包括K帧数据。下面以a=2,N=4,M=2,P=2为例进行说明。请参阅图5,图5是本申请实施例提供的一种2个通道需求数据处理示意图。如图5所示,K帧数据中,每一帧都包括左通道的麦克风音频数据(MIC_L)、右通道的麦克风音频数据(MIC_R)、左通道的参考音频数据(REF_L)和右通道的参考音频数据(REF_R)。将K帧数据中的每一帧的左通道的麦克风音频数据和右通道的麦克风音频数据筛选出来,得到K帧数据包含的左通道的麦克风音频数据和右通道的麦克风音频数据。其中,筛选出来的数据,按照第一帧到第K帧的时间顺序进行排列,按照时间顺序进入先进先出的第一缓存。当目标应用需要对K帧的中的左通道的麦克风音频数据和右通道的麦克风音频数据进行处理时,也按照先进先出的策略从第一缓存中取数据。
可选的,步骤202中,从N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,具体可以包括如下步骤:
若a等于2,从所述M通道的麦克风音频数据中筛选出第二通道的音频数据和第三通道的音频数据,所述第二通道为所述M通道中的一个,所述第三通道为所述M通道中除所述第二通道的一个。
本申请实施例中,读函数可以是java中的read函数,可以连续的读取音频数据流。
其中,所述第二通道和所述第三通道可以为所述M通道中不同麦克风方位对应的通道。比如,第二通道是设置在车内左侧的麦克风,对应的通道为左通道;第三通道是设置在车内右侧的麦克风,对应的通道为右通道。
下面结合图5和图4,详细说明目标应用需要获取2个通道的音频数据的情况。
当目标应用有2个通道数据需求时,目标应用(比如,普通录音APP)可以向音频平台层(audioflinger)申请2个通道采集需求,audioflinger会创建线程,循环向音频硬件抽象层(audiohal)获取数据,并提供大小为2*size1的第一缓存。可以向内核层(kernel)获取和智能语音相同的通道数4通道,采用4*size1的缓存向内kernel采集,获取到4通道数据,再从中筛选出2个通道,填充到audioflinger的第一缓存里,提供给目标应用。
从图5可以看出,有K个音频数据帧(frames),音频硬件抽象层(audiohal)从内核层(kernel)获取到的数据有4*size1大小,也是K个frames。在软件实现时,可以遍历K个frames中所有的音频块,通过排列顺序筛选出MIC_L数据和MIC_R数据,每个frames只保留MIC_L数据和MIC_R数据,并把所有的MIC_L数据和MIC_R数据填充到第一缓存,提供给audioflinger层,普通录音APP从audioflinger层获取到对应的数据。
本申请实施例中,只需要一组音频总线,即可实现目标应用和目标应用的音频数据的获取需求,可以在目标应用与目标应用的情况下降低所需的音频总线的数量,从而降低所需的音频总线的数量。
上述从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,数据处理设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对数据处理设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图6,图6为本申请实施例提供的一种数据处理设备的结构示意图,该数据处理设备600可以包括获取单元601和筛选单元602,其中:
获取单元601,用于通过音频总线从音频处理器获取N通道的音频数据;N为大于或等于2的整数;
筛选单元602,用于从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
可选的,所述N通道的音频数据包括M通道的麦克风音频数据和P通道的参考音频数据;N为M与P之和,M为大于或等于1的整数,P为大于或等于1的整数。
可选的,所述N通道的音频数据封装于K个音频数据帧中,所述K个音频数据帧存储在音频缓存中,所述K个音频数据帧中每个音频数据帧均包含N个通道的帧数据,K为正整数。
可选的,所述从所述N通道的音频数据中筛选出所述目标应用所需的a个通道的音频数据,包括:
创建第一缓存,所述第一缓存与所述音频缓存的容量比值大于或等于a/N;分别从所述K个音频数据帧中的每个音频数据帧包含的N个通道的帧数据中筛选出a个通道的帧数据,得到每个音频数据帧对应的第一筛选数据帧;其中,每个第一筛选数据帧均包含从对应音频数据帧中筛选出的a个通道的帧数据;将每个第一筛选数据帧按照所述每个第一筛选数据帧所对应的音频数据帧的接收时间顺序放入所述第一缓存,得到所述目标应用所需的a个通道的音频数据。
可选的从所述每个音频数据帧中筛选出a个通道的帧数据均为相同的a个通道的帧数据。
可选的,所述筛选单元602从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,包括:
若a等于1,则从所述M通道的麦克风音频数据中筛选出第一通道的音频数据,所述第一通道为所述M通道中的一个;
若a等于2,则从所述M通道的麦克风音频数据中筛选出第二通道的音频数据和第三通道的音频数据,所述第二通道为所述M通道中的一个,所述第三通道为所述M通道中除所述第二通道的一个。
可选的,所述第二通道和所述第三通道为所述M通道中不同麦克风方位对应的通道。
可选的,所述获取单元601通过所述音频总线从所述音频处理器获取N通道的音频数据,包括:通过所述音频总线接收所述音频处理器输出的K个音频数据帧;将所述K个音频数据帧按照接收时间顺序放入所述音频缓存,得到所述N通道的音频数据。
其中,本申请实施例中的获取单元601可以是数据处理设备中的音频总线,筛选单元602可以是数据处理设备中的处理器。
本申请实施例中,只需要一组音频总线,即可实现至少两个应用的音频数据的获取需求,可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量,从而降低所需的音频总线的数量。
请参阅图7,图7是本申请实施例提供的另一种数据处理设备的结构示意图,如图7所示,该数据处理设备700包括处理器701和存储器702,处理器701、存储器702可以通过通信总线703相互连接。通信总线703可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。通信总线703可以分为地址总线、数据总线、控制总线等,比如,对于数据总线,可以包括音频总线,具体可以是I2S总线。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。存储器702用于存储计算机程序,计算机程序包括程序指令,处理器701被配置用于调用程序指令,上述程序包括用于执行图2中包含的方法中的部分或全部步骤。
处理器701可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
存储器702可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
此外,该数据处理设备700还可以包括通信接口(比如,USB接口、麦克风接口等)、天线等通用部件,在此不再详述。
本申请实施例中,只需要一组音频总线,即可实现至少两个应用的音频数据的获取需求,可以在至少两个应用同时有音频数据获取需求的情况下降低所需的音频总线的数量。
本申请实施例还提供一种计算机可读存储介质,其中,该计算机可读存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种音频数据处理方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种音频数据处理方法,其特征在于,所述方法应用于数据处理设备,所述方法包括:
所述数据处理设备通过音频总线从音频处理器获取N通道的音频数据;N为大于或等于2的整数;
从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
2.根据权利要求1所述的方法,其特征在于,所述N通道的音频数据封装于K个音频数据帧中,所述K个音频数据帧存储在音频缓存中,所述K个音频数据帧中每个音频数据帧均包含N个通道的帧数据,K为正整数。
3.根据权利要求2所述的方法,其特征在于,所述从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,包括:
创建第一缓存,所述第一缓存与所述音频缓存的容量比值大于或等于a/N;
分别从所述K个音频数据帧中的每个音频数据帧包含的N个通道的帧数据中筛选出a个通道的帧数据,得到每个音频数据帧对应的第一筛选数据帧;其中,每个第一筛选数据帧均包含从对应音频数据帧中筛选出的a个通道的帧数据;
将每个第一筛选数据帧按照所述每个第一筛选数据帧所对应的音频数据帧的接收时间顺序放入所述第一缓存,得到所述目标应用所需的a个通道的音频数据。
4.根据权利要求3所述的方法,其特征在于,从所述每个音频数据帧中筛选出a个通道的帧数据均为相同的a个通道的帧数据。
5.根据权利要求1所述的方法,其特征在于,所述N通道的音频数据包括M通道的麦克风音频数据和P通道的参考音频数据;N为M与P之和,M为大于或等于1的整数,P为大于或等于1的整数。
6.根据权利要求5所述的方法,其特征在于,所述从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,包括:
若a等于1,则从所述M通道的麦克风音频数据中筛选出第一通道的音频数据,所述第一通道为所述M通道中的一个;
若a等于2,则从所述M通道的麦克风音频数据中筛选出第二通道的音频数据和第三通道的音频数据,所述第二通道为所述M通道中的一个,所述第三通道为所述M通道中除所述第二通道的一个。
7.根据权利要求6所述的方法,其特征在于,所述第二通道和所述第三通道为所述M通道中不同麦克风方位对应的通道。
8.根据权利要求2所述的方法,其特征在于,所述数据处理设备通过所述音频总线从所述音频处理器获取N通道的音频数据,包括:
通过所述音频总线接收所述音频处理器输出的K个音频数据帧;
将所述K个音频数据帧按照接收时间顺序放入所述音频缓存,得到所述N通道的音频数据。
9.一种音频处理系统,其特征在于,包括:音频处理器、音频总线和数据处理设备,所述音频处理器与所述数据处理设备通过所述音频总线连接;
所述数据处理设备,用于通过所述音频总线从所述音频处理器获取N通道的音频数据;N为大于或等于2的整数;
所述数据处理设备,还用于从所述N通道的音频数据中筛选出目标应用所需的a个通道的音频数据,所述目标应用为所述数据处理设备安装的至少两个应用中的任意一个,a为小于或等于N的正整数。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括M个麦克风;
所述音频处理器,用于从所述M个麦克风获取M路麦克风原始数据,从参考音频通道获取P路原始参考数据;
所述音频处理器,还用于对所述M路麦克风原始数据进行处理,得到M通道的麦克风音频数据,对所述P路原始参考数据进行处理,得到P通道的参考音频数据;所述N通道的音频数据包括所述M通道的麦克风音频数据和所述P通道的参考音频数据;N为M与P之和,M为大于或等于1的整数,P为大于或等于1的整数。
11.一种数据处理设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1~8任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1~8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210173756.0A CN116709112B (zh) | 2022-02-24 | 2022-02-24 | 音频数据处理方法、系统、数据处理设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210173756.0A CN116709112B (zh) | 2022-02-24 | 2022-02-24 | 音频数据处理方法、系统、数据处理设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116709112A true CN116709112A (zh) | 2023-09-05 |
CN116709112B CN116709112B (zh) | 2024-10-29 |
Family
ID=87839776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210173756.0A Active CN116709112B (zh) | 2022-02-24 | 2022-02-24 | 音频数据处理方法、系统、数据处理设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116709112B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117472321A (zh) * | 2023-12-28 | 2024-01-30 | 广东朝歌智慧互联科技有限公司 | 音频处理方法、装置、存储介质及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005323111A (ja) * | 2004-05-07 | 2005-11-17 | Canon Inc | 情報処理装置及びその制御方法 |
CN202384000U (zh) * | 2011-12-20 | 2012-08-15 | 上海博泰悦臻电子设备制造有限公司 | 语音处理装置、车载终端设备 |
CN107111474A (zh) * | 2014-11-14 | 2017-08-29 | 高通股份有限公司 | 多通道音频对准方案 |
WO2018058989A1 (zh) * | 2016-09-30 | 2018-04-05 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
CN208509122U (zh) * | 2018-06-27 | 2019-02-15 | 科大讯飞股份有限公司 | 用于会议系统的音频处理主机以及会议系统 |
CN109416624A (zh) * | 2016-06-27 | 2019-03-01 | 高通股份有限公司 | 用于使用分布式通用串行总线(usb)主机驱动器的系统和方法 |
CN111341303A (zh) * | 2018-12-19 | 2020-06-26 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN111883158A (zh) * | 2020-07-30 | 2020-11-03 | 广州小鹏车联网科技有限公司 | 一种回声消除方法和装置 |
CN113658588A (zh) * | 2018-09-29 | 2021-11-16 | 百度在线网络技术(北京)有限公司 | 多音区语音识别方法、装置及存储介质 |
-
2022
- 2022-02-24 CN CN202210173756.0A patent/CN116709112B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005323111A (ja) * | 2004-05-07 | 2005-11-17 | Canon Inc | 情報処理装置及びその制御方法 |
CN202384000U (zh) * | 2011-12-20 | 2012-08-15 | 上海博泰悦臻电子设备制造有限公司 | 语音处理装置、车载终端设备 |
CN107111474A (zh) * | 2014-11-14 | 2017-08-29 | 高通股份有限公司 | 多通道音频对准方案 |
CN109416624A (zh) * | 2016-06-27 | 2019-03-01 | 高通股份有限公司 | 用于使用分布式通用串行总线(usb)主机驱动器的系统和方法 |
WO2018058989A1 (zh) * | 2016-09-30 | 2018-04-05 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
CN208509122U (zh) * | 2018-06-27 | 2019-02-15 | 科大讯飞股份有限公司 | 用于会议系统的音频处理主机以及会议系统 |
CN113658588A (zh) * | 2018-09-29 | 2021-11-16 | 百度在线网络技术(北京)有限公司 | 多音区语音识别方法、装置及存储介质 |
CN111341303A (zh) * | 2018-12-19 | 2020-06-26 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN111883158A (zh) * | 2020-07-30 | 2020-11-03 | 广州小鹏车联网科技有限公司 | 一种回声消除方法和装置 |
Non-Patent Citations (2)
Title |
---|
徐静: "一种汽车网络系统车载终端的设计与实现", 《合肥学院学报(自然科学版)》, 30 April 2008 (2008-04-30) * |
王婷;毛敏: "基于ADSP的I~2S总线应用", 《中国科技信息》, 1 January 2007 (2007-01-01) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117472321A (zh) * | 2023-12-28 | 2024-01-30 | 广东朝歌智慧互联科技有限公司 | 音频处理方法、装置、存储介质及电子设备 |
CN117472321B (zh) * | 2023-12-28 | 2024-09-17 | 广东朝歌智慧互联科技有限公司 | 音频处理方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116709112B (zh) | 2024-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11074924B2 (en) | Speech recognition method, device, apparatus and computer-readable storage medium | |
JP7433000B2 (ja) | 音声インタラクション方法、端末機器及びコンピュータ読み取り可能な記憶媒体 | |
JP6811755B2 (ja) | 読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体、プログラム | |
JP6848147B2 (ja) | 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム | |
US11587560B2 (en) | Voice interaction method, device, apparatus and server | |
US8174529B2 (en) | Graphics processing unit and information processing apparatus | |
CN111506291B (zh) | 音频数据采集方法、装置、计算机设备及存储介质 | |
CN111402868A (zh) | 语音识别方法、装置、电子设备及计算机可读存储介质 | |
CN106325804A (zh) | 音频处理方法及系统 | |
EP4044178A2 (en) | Method and apparatus of performing voice wake-up in multiple speech zones, method and apparatus of performing speech recognition in multiple speech zones, device, and storage medium | |
US10529331B2 (en) | Suppressing key phrase detection in generated audio using self-trigger detector | |
CN116709112B (zh) | 音频数据处理方法、系统、数据处理设备及存储介质 | |
CN109243457B (zh) | 基于语音的控制方法、装置、设备及存储介质 | |
CN110310655B (zh) | 麦克风信号处理方法、装置、设备及存储介质 | |
CN118737111A (zh) | 语音处理方法、设备、车辆、存储介质和程序产品 | |
CN114786116A (zh) | 会议一体机的声音处理方法、会议一体机以及存储介质 | |
JP2022095689A5 (zh) | ||
KR20220056833A (ko) | 소리 데이터 노이즈 캔슬링 방법, 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램 | |
CN118899005A (zh) | 一种音频信号处理方法、装置、计算机设备及存储介质 | |
US6748472B2 (en) | Method and system for an interrupt accelerator that reduces the number of interrupts for a digital signal processor | |
KR101402869B1 (ko) | 중앙 오디오 허브에서 오디오 신호들을 처리하기 위한 방법 및 시스템 | |
CN110534110A (zh) | 一种机器人及提高其语音交互识别率的方法、装置和电路 | |
CN115148191A (zh) | 语音处理方法及服务器 | |
CN115223582B (zh) | 一种音频的噪声处理方法、系统、电子装置及介质 | |
CN111899738A (zh) | 对话生成方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |