CN105469656A

CN105469656A - 一种口语学习系统及该系统的运作方法

Info

Publication number: CN105469656A
Application number: CN201510821973.6A
Authority: CN
Inventors: 于拾全; 卫亚东; 田学红
Original assignee: Dongguan Fandou Information Technology Co ltd
Current assignee: Dongguan Fandou Information Technology Co ltd
Priority date: 2015-11-23
Filing date: 2015-11-23
Publication date: 2016-04-06

Abstract

本发明涉及一种口语学习系统，包括：用于音频文件解码的音频解码模块，用于自动计算寻找音频中语音断点的语音中断点搜索模块，用于播放和回放音频数据的音频播放模块，用于自适应地录制用户的语音的自适应录音模块，以及用于回放录音的录音回放模块，音频解码模块与语音中断点搜索模块连接，语音中断点搜索模块与音频播放模块连接。该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。

Description

一种口语学习系统及该系统的运作方法

技术领域

本发明涉及一种口语学习系统，以及该系统的运作方法。

背景技术

英语口语的学习需要通过反复的听和说的训练，才能提高学习效率。而目前人们对于购买或下载的英语音频文件，一般都是使用单向的音频播放器，用户只能训练自己听的能力，不能及时的训练自己说的能力。

有鉴于此，确有必要提供一种系统可以让用户利用常用的音频文件或网络音频实现听、说、确认的综合训练，以提高学习效率。

发明内容

本发明为了解决上述问题而提供的一种口语学习系统，包括：用于音频文件解码的音频解码模块，用于自动计算寻找音频中语音断点的语音中断点搜索模块，用于播放和回放音频数据的音频播放模块，用于自适应地录制用户的语音的自适应录音模块，以及用于回放录音的录音回放模块，所述音频解码模块与所述语音中断点搜索模块连接，所述语音中断点搜索模块与所述音频播放模块连接。

优选地，所述音频解码模块支持MP3或MVA等音频文件或在线音频流的解码。

优选地，所述音频解码模块支持每次读取任意长度的解码数据。

优选地，所述自适应录音模块具有支持语音降噪处理的降噪模块。

优选地，所述自适应录音模块将语音保存至一个录音文件MicFile中，所述录音回放模块可以自动触发所述录音文件MicFile。

本发明还提供一种上述语学习系统的运作方法，所述运作方法包括：

步骤1、音频解码模块对音频文件解码；

步骤2、语音中断点搜索模块自动计算寻找音频中的语音中断点；

步骤3、音频播放模块播放和回放音频数据；

步骤4、自适应录音模块自适应地录制用户的语音；

步骤5、录音回放模块回放用户的录音。

优选地，在所述步骤2中，所述语音中断点搜索模块基于整个音频数据缓存或基于部分数据流自动计算寻找解码后的数据流里面的语音中断点。

优选地，在所述步骤2中，所述语音中断点搜索模块使用能量门限语音断点检测算法。

优选地，在所述步骤4中，如果持续体格第一时间长度T1内没有出现有效语音，则自动结束录制；如果第一时间长度T1内出现有效语音，则进入静音段判断，如果持续一个第二时间长度T2出现静音段，则自动结束录制。

优选地，在所述步骤5之后，还包括以下步骤：

步骤6、所述音频解码模块和语音中断点搜索模块进行后续的数据解码和断点检测。

本发明的有益效果在于：该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。只要基于普通的音频文件或网络音频流就可以实现收听、复述、确认的逐句循环训练，另外支持单句重复播放功能，可以显著提高口语的学习效率。

附图说明

图1为本发明实施例提供的学习系统框架示意图。

具体实施方式

下面结合附图对本发明作进一步阐述：

本发明提供一种口语学习系统。该口语学习系统的输入对象为音频文件，其中主要是语音为主，不包括持续的背景音乐。

如图1所示，该口语学习系统包括音频解码模块，用于音频文件的解码；语音中断点搜索模块，用于自动计算寻找音频中的语音中断点；音频播放模块，用于播放和回放音频数据；自适应录音模块，用于自适应地录制用户的语音；录音回放模块，用于回放用户的录音。

音频解码模块与语音中断点搜索模块连接，将解码后的解码数据流传输至语音中断点搜索模块。语音中断点搜索模块与音频播放模块连接，将语音片段的数据传递给音频播放模块。

本发明还提供上述口语学习系统的运作方法，包括以下步骤：

步骤1、音频解码模块对音频文件解码；

步骤3、音频播放模块播放和回放音频数据；

步骤4、自适应录音模块自适应地录制用户的语音；

步骤5、录音回放模块回放用户的录音。

音频解码模块支持MP3或MVA等音频文件的解码处理，也支持在线音频流的解码，并支持每次读取任意长度的解码数据。针对不同的平台，可以选择合适的缓存大小，每次读取合适长度的解码数据PcmData。

语音中断点搜索模块可以基于整个音频数据缓存，也可以基于部分数据流自动计算寻找解码后的数据流里面的语音中断点，使用算法包括但不限于常用的能量门限语音断点检测等算法。如：基于前面得到的解码数据PcmData，以20ms或40ms帧为单位进行语音能量和过零率的计算，然后通过滑窗和门限判决，判断是否存在语音中断点。如果存在语音中断点，则记录断点信息，并在音频播放模块播放语音片段后启动录音模块。如果不存在语音中断点，则直接把数据传递给音频播放模块播放语音。

语音播放模块接收到前面的数据后直接播放，如果没有数据则自动停止播放。语音播放模块可以播放前面语音中断点搜索模块输出的语音片段数据；也可以重复播放某个指定的语音片段。

自适应录音模块可以自适应控制录音时间长度把用户语音输入录制保存为音频文件，同时自适应录音模块具有降噪模块，支持语音降噪处理。其中自适应控制时长的算法包括但不限于语音端点检测、自适应静音段长度控制等。自适应录音模块收到启动指令后，启动录音处理，自适应录音模块缓存麦克风设备输出的数据MicData，保存到一个录音文件MicFile中，同时对数据MicData进行断点检测。如果持续第一时间长度T1内没有出现有效语音则自动结束录制。如果第一时间长度T1内出现有效语音，则进入静音段判断，如果持续第二时间长度T2出现静音段，则自动结束录制。录音接收后，自动启动录音回放模块。

录音回放模块可以自动触发播放用户的录音文件MicFile，用于用户对自己复述语音的自我确认。录音回放模块收到指令后开始播放录音文件MicFile，播放完毕后，包括以下步骤：通知音频解码模块和语音中断点搜索模块进行后续的数据解码和断点检测。

期间如果用户输入指令，则通知音频解码模块从前面保存的中断点位置开始解码数据。

该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。只要基于普通的音频文件或网络音频流就可以实现收听、复述、确认的逐句循环训练，另外支持单句重复播放功能，可以显著提高口语的学习效率。

以上所述实施例，只是本发明的较佳实例，并非来限制本发明的实施范围，故凡依本发明申请专利范围所述的构造、特征及原理所做的等效变化或修饰，均应包括于本发明专利申请范围内。

Claims

1.一种口语学习系统，其特征在于，所述口语学习系统包括：用于音频文件解码的音频解码模块，用于自动计算寻找音频中语音断点的语音中断点搜索模块，用于播放和回放音频数据的音频播放模块，用于自适应地录制用户的语音的自适应录音模块，以及用于回放录音的录音回放模块，

所述音频解码模块与所述语音中断点搜索模块连接，所述语音中断点搜索模块与所述音频播放模块连接。

2.如权利要求1所述的口语学习系统，其特征在于，所述音频解码模块支持MP3或MVA等音频文件或在线音频流的解码。

3.如权利要求1所述的口语学习系统，其特征在于，所述音频解码模块支持每次读取任意长度的解码数据。

4.如权利要求1或2或3所述的口语学习系统，其特征在于，所述自适应录音模块具有支持语音降噪处理的降噪模块。

5.如权利要求4所述的口语学习系统，其特征在于，所述自适应录音模块将语音保存至一个录音文件MicFile中，所述录音回放模块可以自动触发所述录音文件MicFile。

6.一种如权利要求1-5所述的任一口语学习系统的运作方法，其特征在于，所述运作方法包括：

步骤1、音频解码模块对音频文件解码；

步骤3、音频播放模块播放和回放音频数据；

步骤4、自适应录音模块自适应地录制用户的语音；

步骤5、录音回放模块回放用户的录音。

7.如权利要求6所述的运作方法，其特征在于，在所述步骤2中，所述语音中断点搜索模块基于整个音频数据缓存或基于部分数据流自动计算寻找解码后的数据流里面的语音中断点。

8.如权利要求6所述的运作方法，其特征在于，在所述步骤2中，所述语音中断点搜索模块使用能量门限语音断点检测算法。

9.如权利要求6所述的运作方法，其特征在于，在所述步骤4中，如果持续体格第一时间长度T1内没有出现有效语音，则自动结束录制；如果第一时间长度T1内出现有效语音，则进入静音段判断，如果持续一个第二时间长度T2出现静音段，则自动结束录制。

10.如权利要求6所述的运作方法，其特征在于，在所述步骤5之后，还包括以下步骤：