[go: up one dir, main page]

CN105469656A - 一种口语学习系统及该系统的运作方法 - Google Patents

一种口语学习系统及该系统的运作方法 Download PDF

Info

Publication number
CN105469656A
CN105469656A CN201510821973.6A CN201510821973A CN105469656A CN 105469656 A CN105469656 A CN 105469656A CN 201510821973 A CN201510821973 A CN 201510821973A CN 105469656 A CN105469656 A CN 105469656A
Authority
CN
China
Prior art keywords
module
audio
recording
voice
learning system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510821973.6A
Other languages
English (en)
Inventor
于拾全
卫亚东
田学红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Fandou Information Technology Co ltd
Original Assignee
Dongguan Fandou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Fandou Information Technology Co ltd filed Critical Dongguan Fandou Information Technology Co ltd
Priority to CN201510821973.6A priority Critical patent/CN105469656A/zh
Publication of CN105469656A publication Critical patent/CN105469656A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及一种口语学习系统,包括:用于音频文件解码的音频解码模块,用于自动计算寻找音频中语音断点的语音中断点搜索模块,用于播放和回放音频数据的音频播放模块,用于自适应地录制用户的语音的自适应录音模块,以及用于回放录音的录音回放模块,音频解码模块与语音中断点搜索模块连接,语音中断点搜索模块与音频播放模块连接。该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。

Description

一种口语学习系统及该系统的运作方法
技术领域
本发明涉及一种口语学习系统,以及该系统的运作方法。
背景技术
英语口语的学习需要通过反复的听和说的训练,才能提高学习效率。而目前人们对于购买或下载的英语音频文件,一般都是使用单向的音频播放器,用户只能训练自己听的能力,不能及时的训练自己说的能力。
有鉴于此,确有必要提供一种系统可以让用户利用常用的音频文件或网络音频实现听、说、确认的综合训练,以提高学习效率。
发明内容
本发明为了解决上述问题而提供的一种口语学习系统,包括:用于音频文件解码的音频解码模块,用于自动计算寻找音频中语音断点的语音中断点搜索模块,用于播放和回放音频数据的音频播放模块,用于自适应地录制用户的语音的自适应录音模块,以及用于回放录音的录音回放模块,所述音频解码模块与所述语音中断点搜索模块连接,所述语音中断点搜索模块与所述音频播放模块连接。
优选地,所述音频解码模块支持MP3或MVA等音频文件或在线音频流的解码。
优选地,所述音频解码模块支持每次读取任意长度的解码数据。
优选地,所述自适应录音模块具有支持语音降噪处理的降噪模块。
优选地,所述自适应录音模块将语音保存至一个录音文件MicFile中,所述录音回放模块可以自动触发所述录音文件MicFile。
本发明还提供一种上述语学习系统的运作方法,所述运作方法包括:
步骤1、音频解码模块对音频文件解码;
步骤2、语音中断点搜索模块自动计算寻找音频中的语音中断点;
步骤3、音频播放模块播放和回放音频数据;
步骤4、自适应录音模块自适应地录制用户的语音;
步骤5、录音回放模块回放用户的录音。
优选地,在所述步骤2中,所述语音中断点搜索模块基于整个音频数据缓存或基于部分数据流自动计算寻找解码后的数据流里面的语音中断点。
优选地,在所述步骤2中,所述语音中断点搜索模块使用能量门限语音断点检测算法。
优选地,在所述步骤4中,如果持续体格第一时间长度T1内没有出现有效语音,则自动结束录制;如果第一时间长度T1内出现有效语音,则进入静音段判断,如果持续一个第二时间长度T2出现静音段,则自动结束录制。
优选地,在所述步骤5之后,还包括以下步骤:
步骤6、所述音频解码模块和语音中断点搜索模块进行后续的数据解码和断点检测。
本发明的有益效果在于:该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。只要基于普通的音频文件或网络音频流就可以实现收听、复述、确认的逐句循环训练,另外支持单句重复播放功能,可以显著提高口语的学习效率。
附图说明
图1为本发明实施例提供的学习系统框架示意图。
具体实施方式
下面结合附图对本发明作进一步阐述:
本发明提供一种口语学习系统。该口语学习系统的输入对象为音频文件,其中主要是语音为主,不包括持续的背景音乐。
如图1所示,该口语学习系统包括音频解码模块,用于音频文件的解码;语音中断点搜索模块,用于自动计算寻找音频中的语音中断点;音频播放模块,用于播放和回放音频数据;自适应录音模块,用于自适应地录制用户的语音;录音回放模块,用于回放用户的录音。
音频解码模块与语音中断点搜索模块连接,将解码后的解码数据流传输至语音中断点搜索模块。语音中断点搜索模块与音频播放模块连接,将语音片段的数据传递给音频播放模块。
本发明还提供上述口语学习系统的运作方法,包括以下步骤:
步骤1、音频解码模块对音频文件解码;
步骤2、语音中断点搜索模块自动计算寻找音频中的语音中断点;
步骤3、音频播放模块播放和回放音频数据;
步骤4、自适应录音模块自适应地录制用户的语音;
步骤5、录音回放模块回放用户的录音。
音频解码模块支持MP3或MVA等音频文件的解码处理,也支持在线音频流的解码,并支持每次读取任意长度的解码数据。针对不同的平台,可以选择合适的缓存大小,每次读取合适长度的解码数据PcmData。
语音中断点搜索模块可以基于整个音频数据缓存,也可以基于部分数据流自动计算寻找解码后的数据流里面的语音中断点,使用算法包括但不限于常用的能量门限语音断点检测等算法。如:基于前面得到的解码数据PcmData,以20ms或40ms帧为单位进行语音能量和过零率的计算,然后通过滑窗和门限判决,判断是否存在语音中断点。如果存在语音中断点,则记录断点信息,并在音频播放模块播放语音片段后启动录音模块。如果不存在语音中断点,则直接把数据传递给音频播放模块播放语音。
语音播放模块接收到前面的数据后直接播放,如果没有数据则自动停止播放。语音播放模块可以播放前面语音中断点搜索模块输出的语音片段数据;也可以重复播放某个指定的语音片段。
自适应录音模块可以自适应控制录音时间长度把用户语音输入录制保存为音频文件,同时自适应录音模块具有降噪模块,支持语音降噪处理。其中自适应控制时长的算法包括但不限于语音端点检测、自适应静音段长度控制等。自适应录音模块收到启动指令后,启动录音处理,自适应录音模块缓存麦克风设备输出的数据MicData,保存到一个录音文件MicFile中,同时对数据MicData进行断点检测。如果持续第一时间长度T1内没有出现有效语音则自动结束录制。如果第一时间长度T1内出现有效语音,则进入静音段判断,如果持续第二时间长度T2出现静音段,则自动结束录制。录音接收后,自动启动录音回放模块。
录音回放模块可以自动触发播放用户的录音文件MicFile,用于用户对自己复述语音的自我确认。录音回放模块收到指令后开始播放录音文件MicFile,播放完毕后,包括以下步骤:通知音频解码模块和语音中断点搜索模块进行后续的数据解码和断点检测。
期间如果用户输入指令,则通知音频解码模块从前面保存的中断点位置开始解码数据。
该口语学习系统有效地解决了英语学习中同时交互式训练听和说的能力的问题。只要基于普通的音频文件或网络音频流就可以实现收听、复述、确认的逐句循环训练,另外支持单句重复播放功能,可以显著提高口语的学习效率。
以上所述实施例,只是本发明的较佳实例,并非来限制本发明的实施范围,故凡依本发明申请专利范围所述的构造、特征及原理所做的等效变化或修饰,均应包括于本发明专利申请范围内。

Claims (10)

1.一种口语学习系统,其特征在于,所述口语学习系统包括:用于音频文件解码的音频解码模块,用于自动计算寻找音频中语音断点的语音中断点搜索模块,用于播放和回放音频数据的音频播放模块,用于自适应地录制用户的语音的自适应录音模块,以及用于回放录音的录音回放模块,
所述音频解码模块与所述语音中断点搜索模块连接,所述语音中断点搜索模块与所述音频播放模块连接。
2.如权利要求1所述的口语学习系统,其特征在于,所述音频解码模块支持MP3或MVA等音频文件或在线音频流的解码。
3.如权利要求1所述的口语学习系统,其特征在于,所述音频解码模块支持每次读取任意长度的解码数据。
4.如权利要求1或2或3所述的口语学习系统,其特征在于,所述自适应录音模块具有支持语音降噪处理的降噪模块。
5.如权利要求4所述的口语学习系统,其特征在于,所述自适应录音模块将语音保存至一个录音文件MicFile中,所述录音回放模块可以自动触发所述录音文件MicFile。
6.一种如权利要求1-5所述的任一口语学习系统的运作方法,其特征在于,所述运作方法包括:
步骤1、音频解码模块对音频文件解码;
步骤2、语音中断点搜索模块自动计算寻找音频中的语音中断点;
步骤3、音频播放模块播放和回放音频数据;
步骤4、自适应录音模块自适应地录制用户的语音;
步骤5、录音回放模块回放用户的录音。
7.如权利要求6所述的运作方法,其特征在于,在所述步骤2中,所述语音中断点搜索模块基于整个音频数据缓存或基于部分数据流自动计算寻找解码后的数据流里面的语音中断点。
8.如权利要求6所述的运作方法,其特征在于,在所述步骤2中,所述语音中断点搜索模块使用能量门限语音断点检测算法。
9.如权利要求6所述的运作方法,其特征在于,在所述步骤4中,如果持续体格第一时间长度T1内没有出现有效语音,则自动结束录制;如果第一时间长度T1内出现有效语音,则进入静音段判断,如果持续一个第二时间长度T2出现静音段,则自动结束录制。
10.如权利要求6所述的运作方法,其特征在于,在所述步骤5之后,还包括以下步骤:
步骤6、所述音频解码模块和语音中断点搜索模块进行后续的数据解码和断点检测。
CN201510821973.6A 2015-11-23 2015-11-23 一种口语学习系统及该系统的运作方法 Pending CN105469656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510821973.6A CN105469656A (zh) 2015-11-23 2015-11-23 一种口语学习系统及该系统的运作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510821973.6A CN105469656A (zh) 2015-11-23 2015-11-23 一种口语学习系统及该系统的运作方法

Publications (1)

Publication Number Publication Date
CN105469656A true CN105469656A (zh) 2016-04-06

Family

ID=55607296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510821973.6A Pending CN105469656A (zh) 2015-11-23 2015-11-23 一种口语学习系统及该系统的运作方法

Country Status (1)

Country Link
CN (1) CN105469656A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2333049Y (zh) * 1998-06-09 1999-08-11 刘兆有 智能型外语学习机
KR100470736B1 (ko) * 2002-08-08 2005-03-10 인벤텍 코오포레이션 무작위 테스트, 새도우잉 및 즉시 번역 기능을 갖는 언어 듣기 말하기 훈련 시스템 및 방법
CN1624685A (zh) * 2003-12-02 2005-06-08 英业达股份有限公司 段落式语言学习系统及其方法
CN1787070A (zh) * 2005-12-09 2006-06-14 北京凌声芯语音科技有限公司 用于语言学习机的片上系统
KR20070092604A (ko) * 2006-03-10 2007-09-13 김태훈 영어 소리의 기억증진을 통한 듣기,말하기,쓰기 방법
CN201465325U (zh) * 2009-05-11 2010-05-12 刘正江 多模式自识别完整语义句子学习机
KR20100072627A (ko) * 2008-12-22 2010-07-01 심명은 음성의 높낮이 보정에 의한 언어교육방법
JP2011085641A (ja) * 2009-10-13 2011-04-28 Power Shift Inc 語学学習支援システム及び語学学習支援方法
CN103413550A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 一种人机交互式语言学习系统和方法
CN105006179A (zh) * 2015-05-29 2015-10-28 广东小天才科技有限公司 语音输入的内容跟读方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2333049Y (zh) * 1998-06-09 1999-08-11 刘兆有 智能型外语学习机
KR100470736B1 (ko) * 2002-08-08 2005-03-10 인벤텍 코오포레이션 무작위 테스트, 새도우잉 및 즉시 번역 기능을 갖는 언어 듣기 말하기 훈련 시스템 및 방법
CN1624685A (zh) * 2003-12-02 2005-06-08 英业达股份有限公司 段落式语言学习系统及其方法
CN1787070A (zh) * 2005-12-09 2006-06-14 北京凌声芯语音科技有限公司 用于语言学习机的片上系统
KR20070092604A (ko) * 2006-03-10 2007-09-13 김태훈 영어 소리의 기억증진을 통한 듣기,말하기,쓰기 방법
KR20100072627A (ko) * 2008-12-22 2010-07-01 심명은 음성의 높낮이 보정에 의한 언어교육방법
CN201465325U (zh) * 2009-05-11 2010-05-12 刘正江 多模式自识别完整语义句子学习机
JP2011085641A (ja) * 2009-10-13 2011-04-28 Power Shift Inc 語学学習支援システム及び語学学習支援方法
CN103413550A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 一种人机交互式语言学习系统和方法
CN105006179A (zh) * 2015-05-29 2015-10-28 广东小天才科技有限公司 语音输入的内容跟读方法和装置

Similar Documents

Publication Publication Date Title
JP6740504B1 (ja) 発話分類器
CN104464723B (zh) 一种语音交互方法及系统
TWI659409B (zh) 一種語音端點檢測方法及語音辨識方法
CN108010515B (zh) 一种语音端点检测和唤醒方法及装置
RU2439716C2 (ru) Детектирование автоответчика путем распознавания речи
CN103943105A (zh) 一种语音交互方法及系统
CN110148402A (zh) 语音处理方法、装置、计算机设备及存储介质
WO2017084360A1 (zh) 一种用于语音识别方法及系统
WO2017012511A1 (zh) 语音控制方法、装置及投影仪设备
WO2012055113A1 (zh) 录音结束点检测方法及系统
US20130066630A1 (en) Audio transcription generator and editor
JP5051882B2 (ja) 音声対話装置、音声対話方法及びロボット装置
KR20160005050A (ko) 키워드 검출을 위한 적응적 오디오 프레임 프로세싱
JP2017021125A5 (ja) 音声対話装置および音声対話方法
CN104021789A (zh) 一种利用短时时频值的自适应端点检测方法
JP2014240940A (ja) 書き起こし支援装置、方法、及びプログラム
WO2016063879A1 (ja) 音声合成装置および方法
US20210118464A1 (en) Method and apparatus for emotion recognition from speech
US20130246061A1 (en) Automatic realtime speech impairment correction
WO2023116243A1 (zh) 数据转换方法及计算机存储介质
WO2016027909A1 (ja) データ構造、音声対話装置及び電子機器
JP5223843B2 (ja) 情報処理装置およびプログラム
KR102197387B1 (ko) 자연어 대화체 음성 인식 방법 및 장치
CN105469656A (zh) 一种口语学习系统及该系统的运作方法
JP6526602B2 (ja) 音声認識装置、その方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160406