JP2006178334A - 語学学習システム - Google Patents
語学学習システム Download PDFInfo
- Publication number
- JP2006178334A JP2006178334A JP2004373815A JP2004373815A JP2006178334A JP 2006178334 A JP2006178334 A JP 2006178334A JP 2004373815 A JP2004373815 A JP 2004373815A JP 2004373815 A JP2004373815 A JP 2004373815A JP 2006178334 A JP2006178334 A JP 2006178334A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- database
- extracted
- language learning
- approximation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000013075 data extraction Methods 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 19
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/04—Electrically-operated educational appliances with audible presentation of the material to be studied
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
【解決手段】 本発明は、話者の音声から抽出した特徴量と、その話者の音声データとを対応付けて記録したデータベースと、学習者の音声を取得する音声取得手段と、前記音声取得手段が取得した音声から、前記学習者の音声の特徴量を抽出する特徴量抽出手段と、前記データベースに記録された特徴量と、前記特徴量抽出手段により抽出された特徴量との差を示す近似度指数を算出する近似度算出手段と、前記データベースから、前記近似度算出手段により算出された近似度指数が第1の条件を満足する特徴量と対応付けられた音声データを抽出する音声データ抽出手段と、前記音声データ抽出手段により抽出された音声データに従って音声を出力する再生手段とを有する語学学習システムを提供する。
【選択図】 図1
Description
別の好ましい態様において、この語学学習システムは、前記抽出手段により抽出された音声データの話速を変換する話速変換手段をさらに有し、前記再生手段が、前記話速変換手段により話速変換された音声データに従って音声を出力してもよい。
さらに別の好ましい態様において、この語学学習システムは、模範音声を記憶する記憶手段と、前記模範音声と、前記音声取得手段により取得された学習者の音声を比較し、両者の近似度を数値化する比較手段と、前記比較手段により得られた近似度が第2の条件を満たしている場合、前記取得手段により取得された学習者の音声を、前記特徴量抽出手段により抽出された特徴量と対応付けて前記データベースに追加するデータベース更新手段とをさらに有してもよい。
<1.構成>
図1は、本発明の第1実施形態に係る語学学習システム1の機能構成を示すブロック図である。記憶部11は、話者の音声から抽出した特徴量と、その話者による音声の音声データとを対応付けて記録したデータベースDB1を記憶している。入力部12は、学習者(ユーザ)の音声を取得し、ユーザ音声データとして出力する。特徴抽出部13は、学習者の音声から特徴量を抽出する。音声データ抽出部14は、特徴抽出部13により抽出された特徴量と、データベースDB1に記録されている特徴量とを比較し、あらかじめ決められた条件を満足するものを抽出する。音声データ抽出部14はさらに、抽出された特徴量に対応付けられている音声データを抽出する。再生部15は、音声データ抽出部14により抽出された音声データを再生する。
続いて、本実施形態に係る語学学習システム1の動作について説明する。ここでは、まず例文の音声を再生する動作について説明した後に、データベースDB1の内容を更新する動作について説明する。語学学習システム1において、CPU101がHDD104に記憶された語学学習プログラムを実行することにより図1に示される機能を有する。また、学習者(ユーザ)は、語学学習プログラムの開始時等にキーボード109を操作して自分を特定する識別子であるユーザIDを入力する。CPU101は、入力されたユーザIDを現在システムを使用している学習者のユーザIDとしてRAM102に記憶する。
図4は、語学学習システム1の動作を示すフローチャートである。語学学習プログラムを実行すると、語学学習システム1のCPU101は、模範音声データベースDB2を検索して利用可能な例文のリストを作成する。CPU101は、このリストに基づいて、ディスプレイ105上に例文の選択を促すメッセージを表示する。ユーザはディスプレイ105上に表示されたメッセージに従い、リストにある例文から1の例文を選択する。CPU101は選択された例文の音声を再生する(ステップS101)。具体的には、CPU101は例文の模範音声データを模範音声データベースDB2から読み出し、読み出した模範音声データを音声処理部107に出力する。音声処理部107は入力された模範音声データをデジタル/アナログ変換してアナログ音声信号としてスピーカ108に出力する。こうしてスピーカ108から模範音声が再生される。
再生される。ここで、音声データは特徴量のマッチングにより抽出されたものであるので、再生された音声は、学習者の音声と特徴が似た音声となっている。したがって、学習者は、自分とはまったく異なる声の特徴を有する話者(アナウンサー、ネイティブスピーカー等)により発せられた音声を聞くだけでは真似をすることが困難であった例文であっても、自分とよく似た声の特徴を有する話者により発せられた音声であれば、真似すべき発音をより正しく理解することができ、学習効率を向上させることができる
続いて、データベースDB1の更新動作について説明する。
図5は、語学学習システム1におけるデータベースDB1の更新動作を示すフローチャートである。まず、上述のステップS101〜S102の処理により、模範音声の再生およびユーザ音声の入力が行われる。続いてCPU101は、模範音声とユーザ音声の比較処理を行う(ステップS201)。具体的には次のとおりである。CPU101は、模範音声データが示す波形をあらかじめ決められた時間(フレーム)ごとに分割する。また、CPU101は、ユーザ音声データが示す波形についてもフレームごとに分割する。CPU101は、フレームに分解された模範音声データが示す波形およびユーザ音声信号が示す波形をフーリエ変換して得られた振幅スペクトルの対数を求め、それをフーリエ逆変換してフレームごとのスペクトル包絡を得る。
本発明は上述の実施形態に限定されるものではなく、種々の変形実施が可能である。
<3−1.変形例1>
上述の実施形態において、ステップS104で抽出した音声データをRAM102に記憶した後、CPU101は、音声データに対して話速変換処理を行ってもよい。具体的には次のとおりである。RAM102は、話速変換処理の前後における話速比率を指定する変数aをあらかじめ記憶している。CPU101は、抽出した音声データに対して、音声の時間(音声データの先頭から末尾までの再生に要する時間)をa倍する処理を行う。a>1の場合は話速変換処理により音声の長さが伸びる。すなわち、話速は遅くなる。逆に、a<1の場合は話速変換処理により音声の長さは縮む。すなわち、話速は速くなる。本実施形態において、変数aの初期値として1より大きい値が設定されている。したがって、模範音声が再生され、続いてユーザ音声が入力された後、ユーザ音声と似た音声で再生される例文は、模範音声よりもゆっくりと再生される。したがって、学習者は、真似すべき発音(目標とすべき発音)をより明確に認識することができる。
上述の実施形態では、ステップS104において、学習者(ユーザ)の音声から抽出した特徴量と最も近似する特徴量と対応付けられた音声データを抽出したが、音声データを抽出する条件は学習者の音声の特徴量と最も近似するものに限定されない。例えば、データベースDB1において、例文の音声データと対応付けてその音声の発話レベル(模範音声との近似度を示す指数。発話レベルの高いものはより模範音声に近似している)を記録しておき、この発話レベルを音声データ選択の条件に組み込んでもよい。具体的な条件としては例えば、発話レベルがある一定レベル以上のもののなかから、特徴量が最も近似するものを抽出するという条件でもよい。あるいは、特徴量の近似度がある値以上のもののなかから、発話レベルが最も高いものを抽出するという条件でもよい。発話レベルは、例えばステップS201における近似度指数の算出と同様に行えばよい。
また、システムの構成は、上述の実施形態で説明したものに限定されない。語学学習システム1がネットワークを介してサーバ装置に接続されており、上述の語学学習システムの機能のうち一部を、サーバ装置に担わせてもよい。
さらに、上述の実施形態においては、CPU101が語学学習プログラムを実行することにより語学学習システムとしての機能がソフトウェア的に実現されたが、図1に示される機能構成要素に相当する電子回路等を用い、ハードウェア的にシステムを実現してもよい。
上述の実施形態においては、話者の音声の特徴量として第1〜第3フォルマントのフォルマント周波数を用いる態様について説明したが、音声の特徴量はフォルマント周波数に限定されるものではない。スペクトログラム等、他の音声解析方法に基づいて算出した特徴量であってもよい。
Claims (4)
- 話者の音声から抽出した特徴量と、その話者の1または複数の音声データとを対応付けたデータを複数の話者について記録したデータベースと、
学習者の音声を取得する音声取得手段と、
前記音声取得手段が取得した音声から、前記学習者の音声の特徴量を抽出する特徴量抽出手段と、
前記データベースに記録された複数の話者の特徴量と、前記特徴量抽出手段により抽出された特徴量との差を示す近似度指数を話者毎に算出する近似度算出手段と、
前記データベースから、前記近似度算出手段により算出された近似度指数が第1の条件を満足する特徴量と対応付けられた1の音声データを抽出する音声データ抽出手段と、
前記音声データ抽出手段により抽出された1の音声データに従って音声を出力する再生手段と
を有する語学学習システム。 - 前記第1の条件が、近似度が最も高いものを抽出するという条件であることを特徴とする請求項1に記載の語学学習システム。
- 前記抽出手段により抽出された音声データの話速を変換する話速変換手段をさらに有し、
前記再生手段が、前記話速変換手段により話速変換された音声データに従って音声を出力する
ことを特徴とする請求項1に記載の語学学習システム。 - 模範音声を記憶する記憶手段と、
前記模範音声と、前記音声取得手段により取得された学習者の音声を比較し、両者の近似度を数値化する比較手段と、
前記比較手段により得られた近似度が第2の条件を満たしている場合、前記取得手段により取得された学習者の音声を、前記特徴量抽出手段により抽出された特徴量と対応付けて前記データベースに追加するデータベース更新手段と
をさらに有する請求項1に記載の語学学習システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004373815A JP2006178334A (ja) | 2004-12-24 | 2004-12-24 | 語学学習システム |
CN200510132618A CN100585663C (zh) | 2004-12-24 | 2005-12-23 | 语言学习系统 |
KR1020050128485A KR100659212B1 (ko) | 2004-12-24 | 2005-12-23 | 어학 학습 시스템 및 어학 학습용의 음성 데이터 제공 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004373815A JP2006178334A (ja) | 2004-12-24 | 2004-12-24 | 語学学習システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006178334A true JP2006178334A (ja) | 2006-07-06 |
Family
ID=36732492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004373815A Pending JP2006178334A (ja) | 2004-12-24 | 2004-12-24 | 語学学習システム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2006178334A (ja) |
KR (1) | KR100659212B1 (ja) |
CN (1) | CN100585663C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006184813A (ja) * | 2004-12-28 | 2006-07-13 | Advanced Telecommunication Research Institute International | 外国語学習装置 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630448B (zh) * | 2008-07-15 | 2011-07-27 | 上海启态网络科技有限公司 | 语言学习客户端及系统 |
KR101228909B1 (ko) * | 2009-09-10 | 2013-02-01 | 최종근 | 전자 사전 단말기에서 어휘에 대한 소리를 제공하는 방법 및 그 전자 사전 단말기 |
KR101141793B1 (ko) * | 2011-08-22 | 2012-05-04 | 광주대학교산학협력단 | 음 높이 가변 어학학습시스템 |
CN102760434A (zh) * | 2012-07-09 | 2012-10-31 | 华为终端有限公司 | 一种声纹特征模型更新方法及终端 |
CN104485115B (zh) * | 2014-12-04 | 2019-05-03 | 上海流利说信息技术有限公司 | 发音评价设备、方法和系统 |
JP6613560B2 (ja) * | 2014-12-12 | 2019-12-04 | カシオ計算機株式会社 | 電子機器、学習支援方法およびプログラム |
CN105933635A (zh) * | 2016-05-04 | 2016-09-07 | 王磊 | 一种对音频或视频内容附加标签的方法 |
CN110556095B (zh) * | 2018-05-30 | 2023-06-23 | 卡西欧计算机株式会社 | 学习装置、机器人、学习支援系统、学习装置控制方法以及存储介质 |
KR102416041B1 (ko) * | 2021-11-23 | 2022-07-01 | 진기석 | 다국어 동시 학습 시스템 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6449081A (en) * | 1987-08-19 | 1989-02-23 | Chuo Hatsujo Kk | Pronunciation training apparatus |
JPH03273280A (ja) * | 1990-03-22 | 1991-12-04 | Nec Corp | 発声練習用音声合成方式 |
JP2000056785A (ja) * | 1998-08-10 | 2000-02-25 | Yamaha Corp | 似顔絵出力装置およびカラオケ装置 |
JP2001051580A (ja) * | 1999-08-06 | 2001-02-23 | Nyuuton:Kk | 音声学習装置 |
JP2002244547A (ja) * | 2001-02-19 | 2002-08-30 | Nippon Hoso Kyokai <Nhk> | 発話学習システムのコンピュータプログラムおよびこのプログラムと協働するサーバ装置 |
JP2004093915A (ja) * | 2002-08-30 | 2004-03-25 | Casio Comput Co Ltd | サーバ装置、情報端末装置、学習支援装置及びプログラム |
JP2004264621A (ja) * | 2003-03-03 | 2004-09-24 | Fujitsu Ltd | 教材提示方法,教材提供システム及び教材提供プログラム |
-
2004
- 2004-12-24 JP JP2004373815A patent/JP2006178334A/ja active Pending
-
2005
- 2005-12-23 KR KR1020050128485A patent/KR100659212B1/ko not_active Expired - Fee Related
- 2005-12-23 CN CN200510132618A patent/CN100585663C/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6449081A (en) * | 1987-08-19 | 1989-02-23 | Chuo Hatsujo Kk | Pronunciation training apparatus |
JPH03273280A (ja) * | 1990-03-22 | 1991-12-04 | Nec Corp | 発声練習用音声合成方式 |
JP2000056785A (ja) * | 1998-08-10 | 2000-02-25 | Yamaha Corp | 似顔絵出力装置およびカラオケ装置 |
JP2001051580A (ja) * | 1999-08-06 | 2001-02-23 | Nyuuton:Kk | 音声学習装置 |
JP2002244547A (ja) * | 2001-02-19 | 2002-08-30 | Nippon Hoso Kyokai <Nhk> | 発話学習システムのコンピュータプログラムおよびこのプログラムと協働するサーバ装置 |
JP2004093915A (ja) * | 2002-08-30 | 2004-03-25 | Casio Comput Co Ltd | サーバ装置、情報端末装置、学習支援装置及びプログラム |
JP2004264621A (ja) * | 2003-03-03 | 2004-09-24 | Fujitsu Ltd | 教材提示方法,教材提供システム及び教材提供プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006184813A (ja) * | 2004-12-28 | 2006-07-13 | Advanced Telecommunication Research Institute International | 外国語学習装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20060073502A (ko) | 2006-06-28 |
KR100659212B1 (ko) | 2006-12-20 |
CN100585663C (zh) | 2010-01-27 |
CN1794315A (zh) | 2006-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
CN110148427B (zh) | 音频处理方法、装置、系统、存储介质、终端及服务器 | |
CN106898340B (zh) | 一种歌曲的合成方法及终端 | |
US6182044B1 (en) | System and methods for analyzing and critiquing a vocal performance | |
CN110675886B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
US20190130894A1 (en) | Text-based insertion and replacement in audio narration | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
CN108831437A (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
CN108053814B (zh) | 一种模拟用户歌声的语音合成系统及方法 | |
CN110310621A (zh) | 歌唱合成方法、装置、设备以及计算机可读存储介质 | |
CN112992109B (zh) | 辅助歌唱系统、辅助歌唱方法及其非瞬时计算机可读取记录媒体 | |
CN112420015B (zh) | 一种音频合成方法、装置、设备及计算机可读存储介质 | |
JP5598516B2 (ja) | カラオケ用音声合成システム,及びパラメータ抽出装置 | |
KR100659212B1 (ko) | 어학 학습 시스템 및 어학 학습용의 음성 데이터 제공 방법 | |
CN112908308A (zh) | 一种音频处理方法、装置、设备及介质 | |
US7308407B2 (en) | Method and system for generating natural sounding concatenative synthetic speech | |
CN112750422B (zh) | 一种歌声合成方法、装置及设备 | |
JP2006139162A (ja) | 語学学習装置 | |
CN113421544B (zh) | 歌声合成方法、装置、计算机设备及存储介质 | |
CN112164387B (zh) | 音频合成方法、装置及电子设备和计算机可读存储介质 | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
CN114842858A (zh) | 一种音频处理方法、装置、电子设备及存储介质 | |
CN114566191A (zh) | 录音的修音方法及相关装置 | |
CN114038481A (zh) | 一种歌词时间戳生成方法、装置、设备及介质 | |
KR20050041749A (ko) | 방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101019 |