以下、図面を参照して本発明の実施の形態について説明する。
(第1実施形態)
図1は本発明の音声表示出力制御装置(画像表示制御装置)の実施形態に係る携帯機器10の電子回路の構成を示すブロック図である。
この携帯機器(PDA:personal digital assistants)10は、各種の記録媒体に記録されたプログラム、又は、通信伝送されたプログラムを読み込んで、その読み込んだプログラムによって動作が制御されるコンピュータによって構成され、その電子回路には、CPU(central processing unit)11が備えられる。
CPU11は、メモリ12内のFLASHメモリ12Aに予め記憶されたPDA制御プログラム、あるいはROMカードなどの外部記録媒体13から記録媒体読取部14を介して前記メモリ12に読み込まれたPDA制御プログラム、あるいはインターネットなどの通信ネットワークN上の他のコンピュータ端末(30)から電送制御部15を介して前記メモリ12に読み込まれたPDA制御プログラムに応じて、回路各部の動作を制御するもので、前記メモリ12に記憶されたPDA制御プログラムは、スイッチやキーからなる入力部17aおよびマウスやタブレットからなる座標入力装置17bからのユーザ操作に応じた入力信号、あるいは電送制御部15に受信される通信ネットワークN上の他のコンピュータ端末(30)からの通信信号、あるいはBluetooth(R)による近距離無線接続や有線接続による通信部16を介して受信される外部の通信機器(PC:personal computer)20からの通信信号に応じて起動される。
前記CPU11には、前記メモリ12、記録媒体読取部14、電送制御部15、通信部16、入力部17a、座標入力装置17bが接続される他に、LCDからなる表示部18、マイクを備え音声を入力する音声入力部19a、左右チャンネルのスピーカL,Rを備え音声を出力するステレオ音声出力部19bなどが接続される。
また、CPU11には、処理時間計時用のタイマが内蔵される。
この携帯機器10のメモリ12は、FLASHメモリ(EEP−ROM)12A、RAM12Bを備えて構成される。
FLASHメモリ(EEP−ROM)12Aには、当該携帯機器10の全体の動作を司るシステムプログラムや電送制御部15を介して通信ネットワークN上の各コンピュータ端末(30)とデータ通信するためのネット通信プログラム、通信部16を介して外部の通信機器(PC)20とデータ通信するための外部機器通信プログラムが記憶される他に、スケジュール管理プログラムやアドレス管理プログラム、そして辞書の見出語検索や検索見出語に対応する音声・テキスト・顔画像(含む口型合成画像)などの各種データの同期再生、および当該顔画像(キャラクタ)の種類設定、および見出語アクセントの出題テストを行うための辞書処理プログラム12aなど、種々のPDA制御プログラムが記憶される。
また、FLASHメモリ(EEP−ROM)12Aにはさらに、辞書データベース12b(図2参照)、辞書音声データ12c、キャラクタ画像データ12d(図3参照)、音声別口(型)画像データ12e(図4参照)、および辞書タイムコードファイル12f(図5・図6参照)が記憶される。
辞書データベース12bとしては、英和辞書、和英辞書、国語辞書など、各種の辞書のデータが記憶されると共に、図2に示すように、辞書内の全ての見出語についてそれぞれその見出語No、音声・テキスト・画像の同期再生を簡単に行うためのタイムコードファイルのNoと格納先アドレス、画像再生ウインドウを設定するためのHTMLファイルのNoと格納先アドレス、テキストファイルのNoと格納先アドレス、テキストの各文字,発音記号,口型番号を対応付けたテキスト口同期ファイルのNoと格納先アドレス、音声データであるサウンドファイルのNoと格納先アドレス、辞書内容のデータ番号と格納先アドレスが、それぞれリンク付けられて記憶される。
なお、各実施形態において、明細書上で記載される発音記号については、正式な発音記号の入力が困難なため類似の文字を代用し、正式な発音記号については図面上にて記載する。
図2は前記携帯機器10のメモリ12に記憶される辞書データベース12bのうち1つの見出語「low」についての同期再生用リンクデータを示す図であり、同図(A)は各ファイルNoと格納先アドレスを示すテーブル、同図(B)は当該テキストファイルNoに従い格納されているテキストデータ「low」を示す図、同図(C)はテキスト口同期ファイルNoに従い格納されているテキストの文字,発音記号,口型番号を示す図である。
辞書音声データ12cとしては、前記辞書データベース12bにおける各見出語毎の発音のための音声データがそのサウンドファイルNoとアドレスに対応付けられて記憶される。
図3は前記携帯機器10のメモリ12に記憶され、辞書の見出語検索における発音口型画像の同期表示のためにユーザ設定により選択的に使用されるキャラクタ画像データ12dを示す図である。
キャラクタ画像データ12dとしては、本実施形態の場合、3種類のキャラクタ画像(顔画像)No1〜No3が用意され、個々のキャラクタ画像No1,No2,No3には、その口型画像の合成矩形領域を対角する2点の座標として指定するための口画像エリアデータ(X1,Y1,X2,Y2)が対応付けられて記憶される。
なお、この3種類のキャラクタ画像(顔画像)No1〜No3には、それぞれさらに、辞書検索された見出語のアクセントのタイミングで発音の強調を表現するためのアクセント顔画像No1′〜No3′(図12(C)(2),図13(B)(2)参照)が記憶され、さらには、米語または英語の発音音声が指定された場合の米語用キャラクタ画像No1US〜No3US(図15参照)や英語用キャラクタ画像No1UK〜No3UK(図16参照)、およびそのアクセント顔画像No1US′〜No3US′(図15(B)(2)参照)やNo1UK′〜No3UK′(図16(B)(2)参照)が記憶される。
図4は前記携帯機器10のメモリ12に記憶され、辞書の見出語検索における発音口型画像の同期表示のためにキャラクタ画像(12d:No1〜No3)の口画像エリア(X1,Y1,X2,Y2)に合成表示される音声別口画像データ12eを示す図である。
音声別口(型)画像データ12eとしては、前記辞書データベース12bに記憶された全ての見出し語の発音に要する各発音記号に対応付けた口型画像12e1,12e2,…がそれぞれその口番号No.nに対応付けられて記憶される。
また、前記携帯機器10のメモリ12に記憶される辞書タイムコードファイル12fは、辞書検索された見出語に対応する音声・テキスト・顔画像(含む口型合成画像)の同期再生を行うための指令ファイル(図5参照)であり、全ての見出語毎ではなく、文字数と発音記号数およびその発音タイミングが同じである複数の見出語毎に用意され、所定のアルゴリズムにより圧縮・暗号化されている。
図5は前記携帯機器10のメモリ12に格納された辞書タイムコードファイル12fにおける見出語「low」に対応付けられたファイルNo23のタイムコードファイル12f23(12i)を示す図である。
タイムコードファイル12fnには、予めヘッダ情報Hとして記述設定される一定時間間隔の基準処理単位時間(例えば25ms)で各種データ(音声・テキスト・画像)を同期再生するコマンド処理を行うためのタイムコードが記述配列されるもので、この各タイムコードは、命令を指示するコマンドコードと、当該コマンドに関わるデータ内容(テキストファイル/サウンドファイル/イメージファイルなど)を対応付けするための参照番号や指定数値からなるパラメータデータとの組み合わせにより構成される。
例えば図5で示す見出語「low」のタイムコードファイル12f23によるファイル再生時間は、予め設定された基準処理単位時間が25msである場合、40ステップのタイムコードからなる再生処理を経て1秒間となる。
図6は前記携帯機器10の辞書タイムコードファイル12fn(図5参照)にて記述される各種コマンドのコマンドコードとそのパラメータデータに基づき解析処理される命令内容を対応付けて示す図である。
タイムコードファイル12fnに使用されるコマンドとしては、標準コマンドと拡張コマンドがあり、標準コマンドには、LT(i番目テキストロード).VD(i番目テキスト文節表示).BL(文字カウンタリセット・i番目文節ブロック指定).HN(ハイライト無し・文字カウンタカウントアップ).HL(i番目文字までハイライト・文字カウント).LS(1行スクロール・文字カウンタカウントアップ).DH(i番目HTMLファイル表示).DI(i番目イメージファイル表示).PS(i番目サウンドファイルプレイ).CS(クリアオールファイル).PP(基本タイムi秒間停止).FN(処理終了).NP(無効)の各コマンドがある。
また、メモリ12内のRAM12Bには、辞書データベース12bの検索処理に伴う見出語がその見出語番号に従い読み出されて記憶される検索見出語メモリ12g、検索された見出語に対応する意味内容などの辞書データが前記辞書データベース12bからその辞書データ番号に従い読み出されて記憶される見出語対応辞書データメモリ12h、検索された見出語に対応した音声・テキスト・画像の同期再生を行うためのタイムコードファイル12fn(図5参照)が前記辞書データベース12b内のタイムコードファイルNoに従い辞書タイムコードファイル12fの中から読み出され伸張・復号化されて記憶される再生タイムコードファイルメモリ12iが用意される。
さらに、このメモリ12内のRAM12Bには、見出語検索画面G2上でテキスト・画像の同期再生用ウインドウW1,W2(図12・図13参照)を設定するためのHTMLファイルが、前記辞書データベース12bからHTMLファイルNoに従い読み出されて記憶される同期用HTMLファイルメモリ12j、検索見出語のテキストデータが前記辞書データベース12bからそのテキストファイルNoに従い読み出されて記憶される同期用テキストファイルメモリ12k、検索見出語の発音音声データが前記辞書データベース12b内のサウンドファイルNoに従い前記辞書音声データ12cの中から読み出されて記憶される同期用サウンドファイルメモリ12m、検索見出語の発音画像表示用としてユーザ設定されたキャラクタ画像が前記キャラクタ画像データ12d(図3参照)の中から読み出されて記憶される同期用イメージファイルメモリ12n、この同期用イメージファイルメモリ12nに記憶されたキャラクタ画像における口型画像の合成領域を示す口画像エリアデータ(X1,Y1;X2,Y2)が記憶される口画像エリアメモリ12p、そして、前記タイムコードファイルメモリ12iに記憶された検索見出語に対応するタイムコードファイル12fnに従い音声・テキストに同期再生すべきキャラクタ画像と口型画像とが展開合成されて記憶される画像展開バッファ12qなどが用意される。
すなわち、この携帯機器(PDA)10のFLASHメモリ12Aに記憶されている辞書処理プログラム12aを起動させて検索された見出語が「low」であり、これに対応して辞書タイムコードファイル12f内から読み出されて再生タイムコードファイルメモリ12iに記憶されたタイムコードファイル12fが、例えば図5で示したタイムコードファイル12f23であり、設定処理単位時間毎のコマンド処理に伴い3番目のコマンドコード“DI”およびパラメータデータ“00”が読み込まれた場合には、このコマンド“DI”はi番目のイメージファイル表示命令であるため、パラメータデータi=00からリンク付けられる同期用イメージファイル12nに記憶されたキャラクタ画像12dnが読み出されて表示される。
また、設定処理単位時間毎のコマンド処理に伴い4番目のコマンドコード“PS”およびパラメータデータ“00”が読み込まれた場合には、このコマンド“PS”はi番目のサウンドファイル再生命令であるため、パラメータデータi=00からリンク付けられる同期用サウンドファイル12mに記憶された音声データ12cnが読み出されて出力される。
また、設定処理単位時間毎のコマンド処理に伴い6番目のコマンドコード“VD”およびパラメータデータ“00”が読み込まれた場合には、このコマンド“VD”はi番目のテキスト文節表示命令であるため、パラメータデータi=00に従い、テキストの0番目の文節(この場合は、同期用テキストファイルメモリ12kに記憶された検索見出語のテキストファイル「low」が表示される。
さらに、設定処理単位時間毎のコマンド処理に伴い9番目のコマンドコード“NP”およびパラメータデータ“00”が読み込まれた場合には、このコマンド“NP”は無効命令であるため、現状のファイル出力状態が維持される。
なお、この図5で示したファイル内容のタイムコードファイル12f23(12i)に基づいた検索見出語に対応する発音音声・テキスト・画像(口型画像)の同期再生についての詳細な動作は、後述にて改めて説明する。
次に、前記構成の携帯機器10による各種の動作について説明する。
図7は前記携帯機器10の辞書処理プログラム12aに従ったメイン処理を示すフローチャートである。
図8は前記携帯機器10のメイン処理に伴う見出語同期再生処理を示すフローチャートである。
図9は前記携帯機器10の見出語同期再生処理に伴う各見出語文字のハイライト表示に応じて割り込みで実行されるテキスト対応口表示処理を示すフローチャートである。
図10は前記携帯機器10のメイン処理内のキャラクタ設定処理に伴う同期再生用キャラクタ画像の設定表示状態を示す図である。
入力部17aの「設定」キー17a1およびカーソルキー17a2の操作によりキャラクタ画像の設定モードに切り替えられると(ステップS1→S2)、FLASHメモリ12Aに記憶されている例えば3種類のキャラクタ画像データ12d1(No1),12d2(No2),12d3(No3)[図3参照]が読み出され、図10に示すように、キャラクタ画像の一覧選択画面G1として表示部18に表示される(ステップS3)。
このキャラクタ画像の一覧選択画面G1において、カーソルキー17a3の操作により各キャラクタ画像の選択フレームXが移動操作されてユーザ所望のキャラクタ画像(例えば12d3(No3))が選択されると共に、「訳/決定(音声)」キー17a4による決定操作により当該キャラクタ画像の選択が検知されると(ステップS4)、この選択検知されたキャラクタ画像12dnが読み出され、RAM12B内の同期用イメージファイルメモリ12nに転送格納される(ステップS5)。また、この選択検知されたキャラクタ画像12dnの口型画像の合成領域を示す口画像エリアデータ(X1,Y1;X2,Y2)も読み出され、RAM12B内の口画像エリアメモリ12pに転送格納される(ステップS6)。
これにより、見出語検索に伴い、当該見出語の発音音声に同期表示させるべき口型画像合成対象のキャラクタ画像が選択設定される。
図11は前記携帯機器10のメイン処理内の見出語検索処理に伴う検索見出語表示画面G2を示す図である。
辞書データベース12bに記憶されている例えば英和辞書の辞書データに基づいて見出語検索を行うのに、入力部17aの「英和」キー17a5の操作により英和辞書の検索モードに設定した後に、検索対象の見出語(例えば「low」)を入力すると(ステップS7→S8)、当該入力された見出語と一致及び一致文字を先頭に含む複数の見出語が前記英和辞書の辞書データから検索されて読み出され、検索見出語の一覧(図示せず)として表示部18に表示される(ステップS9)。
この検索見出語の一覧画面において、ユーザ入力した検索対象の見出語と一致する見出語(この場合「low」)がカーソルキーにより選択指示されて「訳/決定(音声)」キー17a4が操作されると(ステップS10)、当該選択検知された見出語「low」がRAM12B内の見出語メモリ12gに記憶されると共に、この見出語「low」に対応する発音/品詞/意味内容などの辞書データが読み出されてRAM12B内の見出語対応辞書データメモリ12hに記憶され、図11に示すように、検索見出語表示画面G2として表示部18に表示される(ステップS11)。
ここで、前記検索表示された見出語「low」について、その発音音声を出力させるのと同時に、当該見出語の文字,発音記号と発音の口型画像を同期表示させるために、「訳/決定(音声)」キー17a4が操作されると(ステップS12)、図8における同期再生処理に移行される(ステップSA)。
図12は前記携帯機器10の見出語検索処理における同期再生処理に伴いキャラクタ画像No3の設定状態において検索見出語表示画面G2上にウインドウ表示される見出語文字表示ウインドウW1および発音口型表示ウインドウW2の表示状態を示す図であり、同図(A)は検索見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(B)は発音音声の出力に同期した見出語文字表示ウインドウW1およびアクセント未対応の発音口型表示ウインドウW2の変化状態を示す図、同図(C)は発音音声の出力に同期した見出語文字表示ウインドウW1およびアクセント対応の発音口型表示ウインドウW2の変化状態を示す図である。
前記検索見出語表示画面G2が表示されている状態での「訳/決定(音声)」キー17a4の操作に伴い、図8における同期再生処理(ステップSA)が起動されると、RAM12B内の各ワークエリアのクリア処理などのイニシャライズ処理が行われ(ステップA1)、まず、辞書データベース12bに記憶されている今回の検索見出語「low」についての同期再生用リンクデータ(図2参照)に基づき、見出語検索画面G2上でテキスト・画像の同期再生用ウインドウW1,W2(図12参照)を設定するためのHTMLファイルがそのHTMLファイルNo3に従い読み出され同期用HTMLファイルメモリ12jに書き込まれる。また、検索見出語のテキストデータ「low(発音記号付)」がそのテキストファイルNo4222に従い読み出され同期用テキストファイルメモリ12kに書き込まれる。また、検索見出語の発音音声データがそのサウンドファイルNo4222に従い読み出され同期用サウンドファイルメモリ12mに書き込まれる(ステップA2)。
なお、検索見出語の発音画像表示用としてユーザ設定されたキャラクタ画像(この場合、12d3(No3))は、前記キャラクタ設定処理に伴うステップS5に従って、既にキャラクタ画像データ12d(図3参照)の中から読み出されて同期用イメージファイルメモリ12nに書き込まれ、さらに当該キャラクタ画像12d3(No3)における発音口型画像合成エリアである口画像エリアデータ(X1,Y1;X2,Y2)も前記キャラクタ設定処理に伴うステップS6に従って、既に口画像エリアメモリ12pに書き込まれている。
すると、FLASHメモリ12A内に辞書タイムコードファイル12fとして記憶されている各種見出語対応の暗号化された音声・テキスト・画像の同期再生用タイムコードファイル12fnの中から、今回の検索見出語「low」に対応するタイムコードファイル12f23(図5参照)が、前記同期再生用リンクデータ(図2参照)に記述されたタイムコードファイルNo23に従い解読復号化されて読み出され、RAM12B内のタイムコードファイルメモリ12iに転送されて格納される(ステップA3)。
こうして、前記検索見出語「low」に対応する発音音声・テキスト・発音口型画像の同期再生用の各種ファイルのRAM12Bへの読み込み設定、およびこれらのファイルを同期再生するためのタイムコードファイル12f23のRAM12Bへの転送設定が完了すると、タイムコードファイルメモリ12iに格納されたタイムコードファイル(CASファイル)12f23(図5参照)のCPU11による処理単位時間(例えば25ms)が当該タイムコードファイル12f23のヘッダ情報Hとして設定される(ステップA4)。
そして、前記タイムコードファイルメモリ12iに格納されたタイムコードファイル12f23の先頭に読み出しポインタがセットされると共に、各同期用ファイルメモリ12j,12k,12m,12nに書き込まれた各種ファイルの先頭に読み出しポインタがセットされ(ステップA5)、当該各同期ファイルの再生処理タイミングを計時するためのタイマがスタートされる(ステップA6)。
このステップA6において、処理タイマがスタートされると、前記ステップA4にて設定された今回のタイムコードファイル12f23に応じた処理単位時間(25ms)毎に、前記ステップA5にて設定された読み出しポインタの初期位置の当該タイムコードファイル12f23(図5参照)のコマンドコードおよびそのパラメータデータが読み出される(ステップA7)。
そして、前記タイムコードファイル12f23(図5参照)から読み出されたコマンドコードが、“FN”か否か判断され(ステップA8)、“FN”と判断された場合には、その時点で当該同期再生処理の停止処理が指示実行される(ステップA8→A9)。
一方、前記タイムコードファイル12f23(図5参照)から読み出されたコマンドコードが、“FN”ではないと判断された場合には、当該コマンドコードの内容(図6参照)に対応する処理が実行される(ステップA10)。
そして、前記タイマによる計時時間が次の処理単位時間(25ms)に到達したと判断された場合には、RAM12Bに格納されたタイムコードファイル12f23(図5参照)に対する読み出しポインタが次の位置に移動セットされ(ステップA11→A12)、前記ステップA7における当該読み出しポインタの位置のタイムコードファイル12f23(図5参照)のコマンドコードおよびそのパラメータデータ読み出しからの処理が繰り返される(ステップA12→A7〜A10)。
ここで、図5で示す検索見出語「low」のタイムコードファイル12f23に基づいた、発音音声・テキスト・発音口型画像ファイルの同期再生出力動作について詳細に説明する。
すなわち、このタイムコードファイル12f23は、そのヘッダHに予め記述設定された(基準)処理単位時間(例えば25ms)毎にコマンド処理が実行されるもので、まず、タイムコードファイル12f23(図5参照)の第1コマンドコード“CS”(クリアオールファイル)およびそのパラメータデータ“00”が読み出されると、全ファイルの出力をクリアする指示が行われ、テキスト・音声・画像ファイルの出力がクリアされる(ステップA10)。
第2コマンドコード“DH”(i番目HTMLファイル表示)およびそのパラメータデータ“00”が読み出されると、当該コマンドコードDHと共に読み出されたパラメータデータ(i=0)に応じて、RAM12B内の同期用HTMLファイルメモリ12jからHTMLデータの見出語テキスト・画像フレームデータが読み出され、図12(A)に示すように、表示部18に対する見出語検索画面G2上でのテキスト・画像の同期再生用ウインドウW1,W2が設定される(ステップA10)。
第3コマンドコード“DI”(i番目イメージファイル表示)およびそのパラメータデータ“00”が読み出されると、当該コマンドコードDIと共に読み出されたパラメータデータ(i=0)に応じて、RAM12B内の同期用イメージファイルメモリ12nから前記キャラクタ設定処理(ステップS2〜S6)にて設定記憶されたキャラクタ画像12d(この場合No3)が読み出され、図12(A)に示すように、前記見出語検索画面G2上でHTMLファイルで設定された画像の同期再生用ウインドウW2に表示される(ステップA10)。
第4コマンドコード“PS”(i番目サウンドファイルプレイ)およびそのパラメータデータ“00”が読み出されると、当該コマンドコードPSと共に読み出されたパラメータデータ(i=0)に応じて、RAM12B内の同期用サウンドファイルメモリ12mから前記ステップA2にて設定記憶された検索見出語「low」に対応する発音音声データが読み出され、ステレオ音声出力部19bからの音声出力が開始される(ステップA10)。
第5コマンドコード“LT”(i番目テキストロード)およびそのパラメータデータ“00”が読み出されると、当該コマンドコードLTと共に読み出されたパラメータデータ(i=0)に応じて、RAM12B内の同期用テキストファイルメモリ12kに前記ステップA2にて設定記憶された検索見出語「low」に対応する1文節のテキストデータ「l」「o」「w」(含む発音記号)が指定される(ステップA10)。
第6コマンドコード“VD”(i番目テキスト文節表示)およびそのパラメータデータ“00”が読み出されると、当該コマンドコードVDと共に読み出されたパラメータデータ(i=0)に応じて、前記第5コマンドコード“LT”に従い指定された1文節のテキストデータ「l」「o」「w」(含む発音記号)が読み出され、図12(A)に示すように、前記見出語検索画面G2上のテキスト同期再生用ウインドウW1に表示される(ステップA10)。
第7コマンドコード“BL”(文字カウンタリセット・i番目文節ブロック指定)およびそのパラメータデータ“00”が読み出されると、前記テキスト同期再生用ウインドウW1で表示中の検索見出語「low」の文字カウンタがリセットされる(ステップA10)。
そして、第8コマンドコード“HL”(i番目文字までハイライト・文字カウント)およびそのパラメータデータ“01”が読み出されると、当該コマンドコードHLと共に読み出されたパラメータデータ(i=1)に応じて、図12(A)に示すように、テキスト同期再生用ウインドウW1に表示されている検索見出語「low」(含む発音記号)のうち1番目の文字「l」およびこれに対応する発音記号まで、色替え表示,反転表示,下線表示などによるハイライト(識別)表示HLが行われ、文字カウンタが同2番目の文字およびこれに対応する発音記号までカウントアップされる(ステップA10)。
このタイムコードファイル12f23による検索見出語「low」の各文字およびこれに対応する発音記号に対するハイライト(識別)表示に際しては、図9におけるテキスト対応口表示処理の割り込みが行われる。
すなわち、今回ハイライト(識別)表示HLされた検索見出語「low」の文字「l」が検知されると(ステップB1)、この検知文字「l」に対応する発音口型画像が、辞書データベース12b内のテキスト口同期ファイル(図2(C)参照)により示されるテキスト「l」に対応する口番号「36」に従い、音声別口画像データ12e(図4参照)の中から発音口型画像12e2(No36)として読み出される(ステップB2)。そして、このハイライト(識別)表示された検索見出語「low」の文字「l」に対する発音口型画像12e2(No36)は、図12(A)(図12(B)(1))に示すように、見出語検索画面G2上の画像同期再生用ウインドウW2に表示されているキャラクタ画像12d(No3)の口画像合成領域に対して、RAM12B内の口画像エリアメモリ12pに記憶されている口画像エリア(X1,Y1;X2,Y2)に従い合成されて表示される(ステップB3)。
ここで、前記テキスト口同期ファイル(図2(C)参照)により示される今回のハイライト(識別)表示テキスト「l」の発音記号に対するアクセントマークの有無が判断される(ステップB4)。このハイライト(識別)表示テキスト「l」の発音記号[l]の場合にはアクセントマーク無しと判断されるので、キャラクタ画像12d(No3)はその通常の顔画像のままの表示が維持される(ステップB4→B5)。
なお、ここでアクセントマーク有りと判断された場合には、前記キャラクタ画像12d(No3)は、発音強調表現用のアクセント顔画像No3′(図12(C)(2)参照)に変更表示される(ステップB4→B6)。
そして、前記第4コマンドコード“PS”に応じてステレオ音声出力部19bから出力開始されている検索見出語「low」に対応する発音音声データの出力タイミングと、本タイムコードファイル12f23による処理単位時間(25ms)に応じた検索見出語「low」の1文字毎の識別表示タイミングとは、予め対応付けされて当該タイムコードファイル12f23が作成されているので、当該検索見出語「low」の1文字目「l」の識別表示とその発音口型画像12e(No36)の同期合成表示の際には、これに対応する発音記号を読み上げるところの発音音声が同期出力されることになる。
これにより、検索見出語「low」の第1文字目「l」の識別表示、その発音口型画像12e3(No36)の設定キャラクタ画像12d(No3)への合成表示、ならびにその発音音声の出力が同期して行われる。
そして、第9コマンドコード“NP”が読み出されると、現在の検索見出語「low」に対応するキャラクタ画像およびテキストデータの同期表示画面および発音音声データの同期出力状態が維持される。
この後、第12コマンドコード“HL”、第35コマンドコード“HL”に従い、図12(C)(2)、図12(C)(3)に示すように、テキスト同期再生用ウインドウW1では、検索見出語のテキストデータ「low」とその発音記号が、順次、2番目の文字「o」と発音記号[o]、3番目の文字「w」と発音記号[u]というように、ハイライト(識別)表示HLされて行く(ステップA10)。そして、これと共に、画像同期再生用ウインドウW2では、前記図9におけるテキスト対応の口表示処理に応じて、設定キャラクタ画像12d(No3)の口画像エリア(X1,Y1;X2,Y2)に合成すべき発音口型画像も、前記テキスト口同期ファイル(図2(C)参照)に従い、口番号9に対応する発音口型画像12e(No9)、口番号8に対応する発音口型画像12e(No8)として音声別口画像12eの中から読み出され、順次合成されて同期表示される(ステップB1〜B3)。
さらに、前記第4コマンドコード“PS”に応じてステレオ音声出力部19bから出力されている検索見出語「low」の発音音声データも、同テキスト「low」とその発音記号のハイライト(識別)表示部分を読み上げるところの音声が順次同期出力される。
なお、前記検索見出語「low」の各文字「l」「o」「w」毎のハイライト(識別)表示HLに同期させたテキスト対応口表示処理による各発音口型画像12e(No36)→12e(No9)→12e(No8)の設定キャラクタ画像12d(No3)に対する合成切り替え表示(ステップB1〜B5)に際し、図12(B)(2)で示したように、2番目の文字「o」とその発音記号のハイライト(識別)表示HLに伴い発音口型画像12e(No9)を合成表示させるときには、当該ハイライト(識別)表示テキスト「o」の発音記号にはアクセントマーク有りと判断されるので、図12(C)(2)で示したように、このときのキャラクタ画像12d(No3)は、発音強調表現用のアクセント顔画像No3′に変更されて表示される(ステップB4→B6)。
つまり、図12で示した検索見出語「Low」のアクセント文字「o」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(No9)の切り替え合成表示に際しては、当該口型画像12e(No9)の合成先である図12(B)(2)で示した通常の設定キャラクタ(顔)画像12d(No3)が、図12(C)(2)で示した例えば頭部の発汗や口元の皺によって強く発音している状態を表現するアクセント対応の顔画像12d(No3′)に変更表示されるので、ユーザは検索見出語「Low」の発音音声とその発声タイミングおよび各文字「L」「o」「w」とその発音記号の対応部分、さらには各発音口型画像12e(No36→No9→No8)を、そのそれぞれの同期再生により容易に学習できるばかりでなく、アクセントに応じて発声強調するタイミングをリアルに学習できるようになる。
図13は前記携帯機器10の見出語検索処理における同期再生処理に伴いキャラクタ画像No1の設定状態において検索見出語表示画面G2上にウインドウ表示される見出語文字表示ウインドウW1および発音口型表示ウインドウW2の表示状態を示す図であり、同図(A)は検索見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(B)は発音音声の出力に同期した見出語文字表示ウインドウW1および発音口型表示ウインドウW2の変化状態を示す図である。
すなわち、前記図7のステップS1〜S6によるキャラクタ設定処理において、予め記憶された3種類のキャラクタ画像データ12d(No1),12d(No2),12c(No3)[図3参照]の中からアニメ調のキャラクタ画像12d(No1)が選択設定された状態で、前記ステップS7〜SAと同様に検索対象の見出語「low」についての見出語検索処理および同期再生処理、そして図9におけるテキスト対応口表示処理が行われた場合には、図13(A)および図13(B)に示すように、検索見出語表示画面G2に対する見出語文字表示ウインドウW1には、検索見出語「low」およびその発音記号の発音音声出力に同期させたハイライト(識別)表示HLが順次行われる。これに伴い、発音口型表示ウインドウW2には、前記キャラクタ設定処理(ステップS1〜S6)において設定されたアニメ調のキャラクタ画像12d(No1)を基本の顔画像として、前記発音音声出力およびテキスト(含む発音記号)のハイライト表示HLに同期させた各発音口型画像12e(No36→No9→No8)が順次切り替え合成されて表示される。
そして、図13(B)(2)で示したように、検索見出語「low」の2番目の文字「o」とその発音記号のハイライト(識別)表示HLに伴い発音口型画像12e(No9)を合成表示させるときには、当該ハイライト(識別)表示テキスト「o」の発音記号にはアクセントマーク有りと判断されるので、このときのアニメ調キャラクタ画像12d(No1)は、発音強調表現用のアクセント顔画像No1′に変更されて表示される(ステップB4→B6)。
つまり、図13で示したアニメ調のキャラクタ画像12d(No1)を選択設定した場合の、検索見出語「Low」のアクセント文字「o」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(No9)の切り替え合成表示に際しても、当該口型画像12e(No9)の合成先である通常のアニメ調キャラクタ(顔)画像12d(No1)が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の顔画像12d(No1′)に変更表示されるので、ユーザは検索見出語「Low」の発音音声とその発声タイミングおよび各文字「L」「o」「w」とその発音記号の対応部分、さらには各発音口型画像12e(No36→No9→No8)を、そのそれぞれの同期再生により容易に学習できるばかりでなく、アクセントに応じて発声強調するタイミングをリアルに学習できるようになる。
なお、前記図11〜図13を参照して説明した見出語検索に伴うテキスト・発音音声・発音口型画像の同期再生処理では、辞書データベース12bとして予め記憶される英和辞書データの内容が、米国系1国の発音にのみ対応する内容である場合について説明したが、例えば、次の図14〜図16を参照して説明するように、辞書データベース12bとして予め記憶される英和辞書データの内容が、米国系および英国系の2国の発音に対応する内容を有する場合に、米国系または英国系の何れか1国の発音形態を指定して見出語検索に伴うテキスト・発音音声・発音口型画像の同期再生処理を行うようにしてもよい。
図14は前記携帯機器10のメイン処理内の見出語検索処理に伴い米国/英国の2国の発音形態を収録した英和辞書を利用した場合の検索見出語表示画面G2を示す図である。
辞書データベース12bに記憶されている例えば米国/英国の2国の発音形態を収録した英和辞書の辞書データに基づいて見出語検索を行うのに、入力部17aの「英和」キー17a5の操作により英和辞書の検索モードに設定した後に、検索対象の見出語(例えば「laugh」)を入力すると(ステップS7→S8)、当該入力された見出語と一致及び一致文字を先頭に含む複数の見出語が前記英和辞書の辞書データから検索されて読み出され、検索見出語の一覧(図示せず)として表示部18に表示される(ステップS9)。
この検索見出語の一覧画面において、ユーザ入力した検索対象の見出語と一致する見出語(この場合「laugh」)がカーソルキーにより選択指示されて「訳/決定(音声)」キー17a4が操作されると(ステップS10)、当該選択検知された見出語「laugh」がRAM12B内の見出語メモリ12gに記憶されると共に、この見出語「laugh」に対応する米国/英国の2国の発音/品詞/意味内容などの辞書データが読み出されてRAM12B内の見出語対応辞書データメモリ12hに記憶され、図14に示すように、検索見出語表示画面G2として表示部18に表示される(ステップS11)。
ここで、前記検索表示された見出語「laugh」について、その米国式発音[laef]または英国式発音[la:f]の何れか一方の発音音声を選択的に出力させるのと同時に、これに対応した見出語の文字,発音記号と発音の口型画像を同期表示させるために、検索見出語表示画面G2上の辞書データに表示されている米国方言または英国方言の識別子[米]または[英]の何れかが指定されると共に(ステップS11a)、「訳/決定(音声)」キー17a4が操作されると(ステップS12)、図8における同期再生処理に移行される(ステップSA)。
図15は前記携帯機器10の見出語検索処理における同期再生処理に伴い米国式発音[米]を指定した場合に検索見出語表示画面G2上にウインドウ表示される見出語文字表示ウインドウW1および発音口型表示ウインドウW2の表示状態を示す図であり、同図(A)は検索見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(B)は米国式発音音声の出力に同期した見出語文字表示ウインドウW1および発音口型表示ウインドウW2の変化状態を示す図である。
すなわち、前記検索見出語表示画面G2上の辞書データに表示されている米国方言または英国方言の識別子[米]または[英]の何れかが指定されて、図8における同期再生処理に移行されると、当該同期再生処理のステップA2では、例えば米国方言識別子[米]が指定された場合は、キャラクタ設定処理(ステップS2〜S6)において予め設定されたアニメ調キャラクタ画像12d(No1)に対応して米語用キャラクタ画像12d(No1US)が読み出され、RAM12B内の同期用イメージファイルメモリ12nに転送される。またこれと共に、辞書データベース12bに記憶されている今回の検索見出語「laugh」についての同期再生用リンクデータ(図2参照)に基づき、見出語検索画面G2上でテキスト・画像の同期再生用ウインドウW1,W2(図15参照)を設定するためのHTMLファイルがそのHTMLファイルNoに従い読み出され同期用HTMLファイルメモリ12jに書き込まれる。また、検索見出語のテキストデータ「laugh(米国方言発音記号付)」がそのテキストファイルNoに従い読み出され同期用テキストファイルメモリ12kに書き込まれる。また、検索見出語の米国方言の発音音声データがそのサウンドファイルNoに従い読み出され同期用サウンドファイルメモリ12mに書き込まれる(ステップA2)。
すると、FLASHメモリ12A内に辞書タイムコードファイル12fとして記憶されている各種見出語対応の暗号化された音声・テキスト・画像の同期再生用タイムコードファイル12fnの中から、今回の検索見出語「laugh」に対応するタイムコードファイル12fn(図5参照)が、前記同期再生用リンクデータ(図2参照)に記述されたタイムコードファイルNoに従い解読復号化されて読み出され、RAM12B内のタイムコードファイルメモリ12iに転送されて格納される(ステップA3)。
そして、前記検索見出語「laugh」に対応するタイムコードファイル12fnに従った発音音声・見出語文字・発音口型画像の同期再生処理が、既に説明した検索見出語「low」の場合と同様に、ステップA7〜A12による各コマンドコードに応じた再生処理および図9におけるテキスト対応口表示処理により開始されると、検索見出語表示画面G2上のテキスト同期再生用ウインドウW1には、検索見出語「laugh」と共に米国方言の発音記号が表示され、また、画像同期再生用ウインドウW2には、設定されたアニメ調キャラクタ画像で例えば米国旗Fを持っているデザインの米語用キャラクタ画像12d(No1US)が口型画像合成の対象画像として表示される。
これにより、検索見出語「laugh」の米国方言の発音音声出力に同期して、図15(B)(1)〜(3)に示すように、テキスト同期再生用ウインドウW1では、当該検索見出語「laugh」およびその発音記号の先頭文字からのハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、前記米語用キャラクタ画像12d(No1US)をベースとして、その口画像エリア(X1,Y1;X2,Y2)に対し、各発音記号の口番号に対応した発音口型画像12e(Non1→Non2→Non3)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示される。
そして、この場合にも前記同様のテキスト対応口表示処理に従って、検索見出語「Laugh」のアクセント文字「au」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(Non2)の切り替え合成表示に際し、当該口型画像12e(Non2)の合成先である米語用キャラクタ(顔)画像12d(No1US)が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の顔画像12d(No1US′)に変更表示されるので、ユーザは検索見出語「Laugh」の米国方言の発音音声とその発声タイミングおよび各文字「L」「au」「gh」とその発音記号の対応部分、さらには各発音口型画像12e(Non1→Non2→Non3)を、そのそれぞれの同期再生により容易に学習できるばかりでなく、米国方言アクセントに応じて発声強調するタイミングをリアルに学習できるようになる。
図16は前記携帯機器10の見出語検索処理における同期再生処理に伴い英国式発音[英]を指定した場合に検索見出語表示画面G2上にウインドウ表示される見出語文字表示ウインドウW1および発音口型表示ウインドウW2の表示状態を示す図であり、同図(A)は検索見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(B)は英国式発音音声の出力に同期した見出語文字表示ウインドウW1および発音口型表示ウインドウW2の変化状態を示す図である。
すなわち、前記図14で示した検索見出語表示画面G2上の辞書データに表示されている米国方言または英国方言の識別子[米]または[英]のうち、例えば英国方言識別子[英]が指定されて(ステップS11a)、図8における同期再生処理(ステップSA)に移行されると、当該同期再生処理のステップA2では、キャラクタ設定処理(ステップS2〜S6)において予め設定されたアニメ調キャラクタ画像12d(No1)に対応して英語用キャラクタ画像12d(No1UK)が読み出され、RAM12B内の同期用イメージファイルメモリ12nに転送される。またこれと共に、辞書データベース12bに記憶されている今回の検索見出語「laugh」についての同期再生用リンクデータ(図2参照)に基づき、見出語検索画面G2上でテキスト・画像の同期再生用ウインドウW1,W2(図16参照)を設定するためのHTMLファイルがそのHTMLファイルNoに従い読み出され同期用HTMLファイルメモリ12jに書き込まれる。また、検索見出語のテキストデータ「laugh(英国方言発音記号付)」がそのテキストファイルNoに従い読み出され同期用テキストファイルメモリ12kに書き込まれる。また、検索見出語の英国方言の発音音声データがそのサウンドファイルNoに従い読み出され同期用サウンドファイルメモリ12mに書き込まれる(ステップA2)。
すると、FLASHメモリ12A内に辞書タイムコードファイル12fとして記憶されている各種見出語対応の暗号化された音声・テキスト・画像の同期再生用タイムコードファイル12fnの中から、今回の検索見出語「laugh」に対応するタイムコードファイル12fn(図5参照)が、前記同期再生用リンクデータ(図2参照)に記述されたタイムコードファイルNoに従い解読復号化されて読み出され、RAM12B内のタイムコードファイルメモリ12iに転送されて格納される(ステップA3)。
そして、前記検索見出語「laugh」に対応するタイムコードファイル12fnに従った発音音声・見出語文字・発音口型画像の同期再生処理が、既に説明した検索見出語「low」の場合と同様に、ステップA7〜A12による各コマンドコードに応じた再生処理および図9におけるテキスト対応口表示処理により開始されると、検索見出語表示画面G2上のテキスト同期再生用ウインドウW1には、検索見出語「laugh」と共に英国方言の発音記号が表示され、また、画像同期再生用ウインドウW2には、設定されたアニメ調キャラクタ画像で例えば英国帽M1をかぶりステッキM2を持っているデザインの英語用キャラクタ画像12d(No1UK)が口型画像合成の対象画像として表示される。
これにより、検索見出語「laugh」の英国方言の発音音声出力に同期して、図16(B)(1)〜(3)に示すように、テキスト同期再生用ウインドウW1では、当該検索見出語「laugh」およびその発音記号の先頭文字からのハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、前記英語用キャラクタ画像12d(No1UK)をベースとして、その口画像エリア(X1,Y1;X2,Y2)に対し、各発音記号の口番号に対応した発音口型画像12e(Non1→Non2→Non3)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示される。
そして、この場合にも前記同様のテキスト対応口表示処理に従って、検索見出語「Laugh」のアクセント文字「au」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(Non2)の切り替え合成表示に際し、当該口型画像12e(Non2)の合成先である英語用キャラクタ(顔)画像12d(No1UK)が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の顔画像12d(No1UK′)に変更表示されるので、ユーザは検索見出語「Laugh」の英国方言の発音音声とその発声タイミングおよび各文字「L」「au」「gh」とその発音記号の対応部分、さらには各発音口型画像12e(Non1→Non2→Non3)を、そのそれぞれの同期再生により容易に学習できるばかりでなく、英国方言のアクセントに応じて発声強調するタイミングをリアルに学習できるようになる。
次に、前記構成の携帯機器10のメイン処理に伴い、例えば英単語アクセントの正解/不正解を当てるテストを行うことができるアクセントテスト処理について説明する。
図17は前記携帯機器10のアクセントテスト処理に伴い不正解を選択した場合の操作表示状態を示す図であり、同図(A)はアクセントテスト出題表示画面G3を示す図、同図(B)は出題対象の見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(C)は誤りアクセントの発音音声の出力に同期した見出語文字表示ウインドウW1および発音口型表示ウインドウW2の変化状態を示す図である。
図18は前記携帯機器10のアクセントテスト処理に伴い正解を選択した場合の操作表示状態を示す図であり、同図(A)はアクセントテスト出題表示画面G3を示す図、同図(B)は出題対象の見出語表示画面G2に対する見出語文字表示ウインドウW1および発音口型表示ウインドウW2の設定表示状態を示す図、同図(C)は正解アクセントの発音音声の出力に同期した見出語文字表示ウインドウW1および発音口型表示ウインドウW2の変化状態を示す図である。
すなわち、入力部17aにおける「アクセントテスト」キー17a6が操作されアクセントテストモードに設定されると(ステップS13)、辞書データベース12cに予め記憶されている辞書データの中からランダムに見出単語が選択され(ステップS14)、図17(A)に示すように、ランダム選択された単語「low」について「o」部分にアクセントのある正しいアクセントの発音記号と「u」部分にアクセントのある誤ったアクセントの発音記号とを選択項目Et/Efとして出題したアクセントテスト出題表示画面G3が表示部18に表示される(ステップS15)。
このアクセントテスト出題表示画面G3において、カーソルキー17a2の操作により選択フレームXを移動させ、例えば誤ったアクセントの発音記号のある選択項目Efが選択検知されると(ステップS16)、前記キャラクタ設定処理(ステップS2〜S6)において予め発音口型画像の合成先として選択設定されていたキャラクタ画像およびその関連画像(この場合はアニメ調キャラクタ画像12d(No1)およびそのアクセント対応画像(No1′))が、例えば黄色の通常色から青色のキャラクタ画像(No1BL)(No1BL′)に変更設定される(ステップS17→S18)。
またこれと共に、出題単語「low」に対応して辞書音声データ12cの中から読み出される発音音声データが、前記ユーザ選択された誤ったアクセントの発音記号に応じた音声データに補正される(ステップS19)。
すると、出題単語「low」がRAM12B内の見出語メモリ12gに記憶されると共に、この見出語「low」に対応する発音/品詞/意味内容などの辞書データが読み出されてRAM12B内の見出語対応辞書データメモリ12hに記憶され、図17(B)に示すように、出題単語に対応した検索見出語表示画面G2として表示部18に表示される(ステップS20)。
ここで、前記ユーザにより選択したアクセントの出題単語「low」について、その発音音声を出力させるのと同時に、当該見出単語の文字,発音記号と発音の口型画像を同期表示させるために、「訳/決定(音声)」キー17a4が操作されると(ステップS21)、図8における同期再生処理に移行される(ステップSA)。
すると、同期再生処理のステップA2では、前記誤ったアクセントのユーザ選択に応じて青色に変更されたアニメ調キャラクタ画像12d(No1BL)が読み出され、RAM12B内の同期用イメージファイルメモリ12nに転送される。またこれと共に、辞書データベース12bに記憶されている今回の出題単語「low」についての同期再生用リンクデータ(図2参照)に基づき、検索見出語表示画面G2上でテキスト・画像の同期再生用ウインドウW1,W2(図17(B)参照)を設定するためのHTMLファイルがそのHTMLファイルNoに従い読み出され同期用HTMLファイルメモリ12jに書き込まれる。また、出題単語のテキストデータ「low(誤り発音記号付)」が読み出され同期用テキストファイルメモリ12kに書き込まれる。また、出題単語の誤りアクセントに応じて補正した発音音声データが読み出され同期用サウンドファイルメモリ12mに書き込まれる(ステップA2)。
すると、FLASHメモリ12A内に辞書タイムコードファイル12fとして記憶されている各種見出語対応の暗号化された音声・テキスト・画像の同期再生用タイムコードファイル12fnの中から、今回の出題単語「low」に対応するタイムコードファイル12fn(図5参照)が、前記同期再生用リンクデータ(図2参照)に記述されたタイムコードファイルNoに従い解読復号化されて読み出され、RAM12B内のタイムコードファイルメモリ12iに転送されて格納される(ステップA3)。
そして、前記出題単語「low」に対応するタイムコードファイル12fnに従った誤りアクセントの発音音声・見出語文字・発音口型画像の同期再生処理が、既に説明した検索見出語「low」の場合と同様に、ステップA7〜A12による各コマンドコードに応じた再生処理および図9におけるテキスト対応口表示処理により開始される。すると、図17(B)に示すように、検索見出語表示画面G2上のテキスト同期再生用ウインドウW1(Ef)には、出題単語「low」と共にユーザ選択による誤ったアクセントの発音記号が表示され、また、画像同期再生用ウインドウW2には、誤りアクセントのユーザ選択により青色変更されたアニメ調キャラクタ画像12d(No1BL)が口型画像合成の対象画像として表示される。
これにより、出題単語「low」に対応する誤ったアクセントの発音音声出力に同期して、図17(C)(1)〜(3)に示すように、テキスト同期再生用ウインドウW1(Ef)では、当該出題単語「low」およびその誤った発音記号の先頭文字からのハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、前記誤ったアクセントの選択により青色変更されたアニメ調キャラクタ画像12d(No1BL)をベースとして、その口画像エリア(X1,Y1;X2,Y2)に対し、各発音記号の口番号に対応した発音口型画像12e(No36→No9→No8)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示される。
そして、この場合にも前記同様のテキスト対応口表示処理に従って、見出単語「Low」の誤ったアクセント文字「u」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(No8)の切り替え合成表示に際し、当該口型画像12e(No8)の合成先である青色変更されたアニメ調キャラクタ(顔)画像12d(No1BL)が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の青色顔画像12d(No1BL′)に変更表示されるので、ユーザは出題単語「Low」の誤ったアクセントの発音音声とその誤った発声タイミングおよび各対応する発音口型画像12e(No36→No9→No8)を、誤ったアクセントによるものとして明確に学習できるようになる。
一方、図18(A)に示すように、アクセントテスト出題表示画面G3において、カーソルキー17a2の操作により選択フレームXを移動させ、例えば正しいアクセントの発音記号のある選択項目Etが選択検知されると(ステップS16)、前記キャラクタ画像12d(No1)の青色変更処理(ステップS18)や誤りアクセントに応じた発音音声の補正処理(ステップS19)が行われることなく、図8における同期再生処理に移行される(ステップS17→SA)。
すると、前記図13を参照して前述した、アニメ調キャラクタ画像12e(No1)が設定されている状態での検索見出語「low」に対応する発音音声・テキスト・発音口型画像の同期再生処理と同様にして、図18(B)に示すように、検索見出語表示画面G2上のテキスト同期再生用ウインドウW1(Et)には、出題単語「low」と共にユーザ選択による正しいアクセントの発音記号が表示され、また、画像同期再生用ウインドウW2には、予め設定された通りの通常色のアニメ調キャラクタ画像12d(No1)が口型画像合成の対象画像として表示される。
これにより、出題単語「low」に対応する正しいアクセントの発音音声出力に同期して、図18(C)(1)〜(3)に示すように、テキスト同期再生用ウインドウW1(Et)では、当該出題単語「low」およびその正しい発音記号の先頭文字からのハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、予め設定された通りの通常色のアニメ調キャラクタ画像12d(No1)をベースとして、その口画像エリア(X1,Y1;X2,Y2)に対し、各発音記号の口番号に対応した発音口型画像12e(No36→No9→No8)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示される。
そして、この場合にも前記同様のテキスト対応口表示処理に従って、見出単語「Low」の正しいアクセント文字「o」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(No9)の切り替え合成表示に際し、当該口型画像12e(No9)の合成先であるアニメ調キャラクタ(顔)画像12d(No1)が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の顔画像12d(No1′)に変更表示されるので、ユーザは出題単語「Low」の正しいアクセントの発音音声とその正しい発声タイミングおよび各対応する発音口型画像12e(No36→No9→No8)を明確に学習できるようになる。
したがって、前記構成の第1実施形態の携帯機器10による見出語検索に伴う発音音声・テキスト・発音口型画像の同期再生機能によれば、検索対象の見出語「low」を入力して当該検索見出語に対応する辞書データを検索し、検索見出語表示画面G2として表示させた状態で、「訳/決定(音声)」キー17a4を操作すると、当該検索見出語「low」のタイムコードファイル12f23に従い、ステレオ音声出力部19bから出力される発音音声に同期して、テキスト同期再生用ウインドウW1において、検索見出語「low」およびその発音記号のハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、予め設定されたキャラクタ画像12d(No3)をベースとして、その口画像エリア(X1,Y1;X2,Y2)に対し、各発音記号の口番号に対応した発音口型画像12e(No36→No9→No8)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示される。
しかも、前記検索見出語「Low」のアクセント文字「o」に対する発音音声の出力と同期したハイライト(識別)表示HL、発音口型画像12e(No9)の切り替え合成表示に際しては、当該口型画像12e(No9)の合成先であるキャラクタ(顔)画像12d(No3)が、例えば頭部の発汗や口元の動揺によって強く発音している状態を表現するアクセント対応の顔画像12d(No3′)に変更表示されるので、ユーザは検索見出語「Low」の発音音声とその発声タイミングおよび各文字「L」「o」「w」とその発音記号の対応部分、さらには各発音口型画像12e(No36→No9→No8)を、そのそれぞれの同期再生により容易に学習できるばかりでなく、アクセントに応じて発声強調するタイミングをリアルに学習できるようになる。
さらに、前記構成の第1実施形態の携帯機器10による見出語検索に伴う発音音声・テキスト・発音口型画像の同期再生機能によれば、例えば米国方言と英国方言の発音記号を有する辞書データベース12bに基づき見出語検索を行った際に、図15または図16で示したように、米音[米]または英音[英]を指定して「訳/決定(音声)」キー17a4を操作すると、指定された米音または英音の発音音声に同期して、テキスト同期再生用ウインドウW1において、検索見出語「laugh」およびその米音または英音発音記号のハイライト(識別)表示HLが順次なされると共に、画像同期再生用ウインドウW2では、予め設定されたキャラクタ画像12d(No1)が米音表現用(No1US)または英音表現用(No1UK)としてベース表示され、その口画像エリア(X1,Y1;X2,Y2)に対し、米音または英音の各発音記号の口番号に対応した発音口型画像12e(Non1→Non2→Non3)が音声別口画像データ12eの中から読み出され順次切り替え合成されて表示されるので、検索見出語に対応する米国方言の発音音声およびその発音記号・発音口型と英国方言の発音音声およびその発音記号・発音口型とを明確に区別して学習できるようになる。
また、前記構成の第1実施形態の携帯機器10による見出語検索に伴う発音音声・テキスト・発音口型画像の同期再生機能によれば、辞書データベース12bに収録される各見出単語には、正しいアクセントの発音記号と共に誤ったアクセントの発音記号を有し、図17および図18で示すように、「アクセントテスト」キー17a6が操作されると、ランダム選択された見出単語「low」が正しいアクセントの発音記号および誤ったアクセントの発音記号と共にアクセントテスト出題表示画面G3として表示される。そして、正しいアクセントの発音記号が選択された場合には、その正しい発音音声出力に同期して通常の設定キャラクタ画像12d(No1)をベースとした各発音口型画像12e(No36→No9→No8)の切り替え合成表示が行われ、誤ったアクセントの発音記号が選択された場合には、その誤った発音音声出力に同期して青色変更されたキャラクタ画像12d(No1BL)をベースとした各発音口型画像12e(No36→No9→No8)の切り替え合成表示が行われ、しかも正誤何れのアクセント部分の同期再生時にも、前記口型画像合成ベースとしてのキャラクタ画像12e(No1)(No1BL)がアクセント対応のキャラクタ画像12e(No1′)(No1BL′)に変更表示されるので、各種単語の正しいアクセントの発音と、誤ったアクセントの発音とを、そのそれぞれに応じた音声・テキスト・画像の同期再生により明確に学習できるようになる。
なお、前記第1実施形態では、検索見出語に対応する発音音声・テキスト(発音記号付き)・発音口型画像の同期生再処理を、タイムコードファイル12fに従った同期再生処理による発音音声出力に同期させたテキスト文字の順次ハイライト(識別)表示、および当該1文字ずつの順次識別表示に伴い割り込みで実行されるテキスト対応口表示処理による識別表示文字対応の発音記号に応じた発音口型画像の切り替え合成表示により行う構成としたが、次の第2実施形態おいて説明するように、アクセント記号付きの発音記号を含む各種の発音記号とそのそれぞれの発音音声データおよび発音顔画像を予め対応付けて複数組み記憶させ、再生すべき見出語の文字を先頭から順番に強調表示させるのに伴い、順次その強調表示文字の発音記号に対応付けられた発音音声データの出力および顔画像データの表示を行う構成としてもよい。
(第2実施形態)
図19は前記携帯機器10の第2実施形態の見出語同期再生処理を示すフローチャートである。
すなわち、この第2実施形態の携帯機器10では、アクセント記号付きの発音記号を含む各種の発音記号と、そのそれぞれの発音音声データ、および当該各種の発音記号に応じた発音音声データに対応して異なる形態の口部分や表情からなる発音顔画像を、予めメモリ12内に複数組み記憶させる。
そして、例えば辞書データベース12bとして予め記憶される英和辞書を対象に、任意の見出語「low」が入力されて検索され、前記図11で示したように、検索見出語表示画面G2として表示された状態で、その発音音声および発音顔画像の同期再生を行わせるべく「訳/決定(音声)」キー17a4が操作されると、図19に示す第2実施形態の同期再生処理が開始される。
この第2実施形態の同期再生処理が開始されると、前記図12または図13で示すように、まず、検索見出語表示画面G2上にテキスト同期再生用ウインドウW1が開かれ検索見出語「low」の各文字と発音記号がその発音順に先頭から強調識別表示HLされる(ステップC1)。そして、この強調識別表示HLされた見出文字の発音記号が読み出されて(ステップC2)、アクセント記号付きであるか否か判断される(ステップC3)。
ここで、図12(B)(1)または図13(B)(1)で示すように、今回強調表示HLされた見出単語「low」における文字「l」の発音記号がアクセント記号無しである場合には、前記メモリ12に予め記憶された当該発音記号に対応するアクセント無しの発音音声データが読み出されてステレオ音声出力部19bから出力されるのと共に(ステップC3→C4)、これに対応付けられたアクセント無しの発音顔画像が読み出されて画像同期再生用ウインドウW2に表示される(ステップC5)。
すると、現在出力中の検索見出語「low」の次の文字「o」が読み出され(ステップC6→C7)、再び前記ステップC1からの処理に戻り、図12(B)(2)または図13(B)(2)で示すように、その発音記号と共に強調識別表示HLされる(ステップC1)。
そして、今回強調表示HLされた見出単語「low」における文字「o」の発音記号がアクセント記号有りであると判断された場合には(ステップC2,C3)、前記メモリ12に予め記憶された当該発音記号に対応するアクセント有りの発音音声データが読み出されてステレオ音声出力部19bから出力されるのと共に(ステップC3→C8)、図12(C)(2)または図13(B)(2)で示すように、これに対応付けられた例えば頭部の発汗や身体の動揺によってアクセント有り表現する発音顔画像が読み出されて画像同期再生用ウインドウW2に表示される(ステップC9)。
したがって、この第2実施形態の携帯機器10による場合でも、検索見出語「Low」のアクセント文字「o」をハイライト(識別)表示HLしたことに伴う、発音音声の出力および発音顔画像の表示に際しては、そのアクセント付きの発音記号に基づき当該発音顔画像が、例えば頭部の発汗や身体の動揺によって強く発音している状態を表現するアクセント対応の顔画像として表示されるので、ユーザは検索見出語「Low」の各文字「L」「o」「w」と発音音声、さらには各発音顔画像を、そのそれぞれの対応出力により容易に学習できるばかりでなく、アクセントに応じて発声強調する部分をリアルに学習できるようになる。
なお、この第2実施形態において、前記メモリ12に予め記憶されたアクセント記号付きの発音記号を含む各種の発音記号と、そのそれぞれの発音音声データ、および当該各種の発音記号に応じた発音音声データに対応して異なる形態の口部分や表情からなる発音顔画像について、アクセント付き発音記号に対応付けられた発音音声の出力はアクセント無し発音記号に対応付けられた発音音声より大きく設定され、また、アクセント付き発音記号に対応付けられた発音顔画像の口部分の開き具合はアクセント無し発音記号に対応付けられた発音顔画像の口部分の開き具合より大きく設定される。さらに、この顔画像における表情は、アクセント付き発音記号に対応付けられた発音顔画像の表情の方が、アクセント無し発音記号に対応付けられた発音顔画像の表情よりも強調されて設定される。
なお、前記第2実施形態では、アクセント記号付きの発音記号を含む各種の発音記号と、そのそれぞれの発音音声データ、および当該各種の発音記号に応じた発音音声データに対応して異なる形態の口部分や表情からなる発音顔画像を予め記憶し、検索見出語の各文字をその発音順に強調表示すると共に、その発音記号に対応付けられた発音音声を読み出して出力し、また同発音記号に対応付けられ発音顔画像を読み出して表示する構成としたが、次の第3実施形態において説明するように、辞書データベース12bにある各見出語のそれぞれに対応して当該見出し語の発音音声と発音顔画像とを予め組み合わせて記憶させ、検索見出語の文字表示に伴いその発音音声および発音顔画像を読み出して出力し、この際の発音音声信号のピークレベルを検出してアクセント部分を判断し、前記発音顔画像の口や表情の形態を異なる表示形態に変更制御する構成としてもよい。
(第3実施形態)
図20は前記携帯機器10の第3実施形態の見出語同期再生処理を示すフローチャートである。
すなわち、この第3実施形態の携帯機器10では、辞書データベース12bの各辞書データにある各見出語のそれぞれに対応して当該見出し語の発音音声と発音顔画像とを予め組み合わせて記憶させる。
そして、例えば辞書データベース12bとして予め記憶される英和辞書を対象に、任意の見出語「low」が入力されて検索され、前記図11で示したように、検索見出語表示画面G2として表示された状態で、その発音音声および発音顔画像の同期再生を行わせるべく「訳/決定(音声)」キー17a4が操作されると、図20に示す第3実施形態の同期再生処理が開始される。
この第3実施形態の同期再生処理が開始されると、前記図12または図13で示すように、まず、検索見出語表示画面G2上にテキスト同期再生用ウインドウW1が開かれ検索見出語「low」の各文字がその発音順に先頭から強調識別表示HLされる(ステップD1)。そして、この強調識別表示HLされた見出文字に対応する部分の発音音声データが読み出され(ステップD2)、ステレオ音声出力部19bから出力される(ステップD3)。
ここで、例えば今回強調表示HLされた見出単語「low」における文字「l」に対応する部分の発音音声データの信号(波形)レベルが一定値以上の音声信号レベル(アクセント部分)か否か判断されるもので(ステップD4)、一定音声信号レベル以上ではない、つまりアクセント部分ではないと判断された場合には、当該検索見出語に対応付けられて記憶された発音顔画像が読み出されてそのまま画像同期再生用ウインドウW2に表示される(ステップD5)。
すると、現在出力中の検索見出語「low」の次の文字「o」が読み出され(ステップD6→D7)、再び前記ステップD1からの処理に戻り、強調識別表示HLされる(ステップD1)。
すると、今回強調識別表示HLされた見出文字「o」に対応する部分の発音音声データが読み出され(ステップD2)、ステレオ音声出力部19bから出力されると共に(ステップD3)、当該強調表示HLされた単語文字「o」に対応する部分の発音音声データの信号(波形)レベルが一定値以上の音声信号レベル(アクセント部分)か否か判断される(ステップD4)。
ここで、一定音声信号レベル以上である、つまりアクセント部分であると判断された場合には、当該検索見出語に対応付けられて記憶された発音顔画像が読み出されると共に、当該顔画像はその口部分の開き具合が大きくまたその表情が強い顔画像に変更制御(例えば図12(B)(2)→図12(C)(2))され、画像同期再生用ウインドウW2に表示される(ステップD4→D8)。
なお、前記発音音声の音声信号波形レベルが一定値以上と判断されてアクセント部分であると判断された場合には、強調表示されている検索見出語の対応文字をさらに表示色の変更や付加あるいは文字フォントの変更などにより、アクセント部分の文字であることを示す形態に変更制御して表示させる構成としてもよい。
したがって、この第3実施形態の携帯機器10による場合でも、検索見出語「Low」のアクセント文字「o」をハイライト(識別)表示HLしたことに伴う、発音音声の出力および発音顔画像の表示に際しては、そのときの発音音声信号レベルが一定値以上であることに基づき当該発音顔画像が、例えば口部分の開き具合が大きくまたその表情が強いアクセント対応の顔画像に変更制御されて表示されるので、ユーザは検索見出語「Low」の各文字「L」「o」「w」とその発音音声、さらには発音顔画像を、そのそれぞれの対応出力により容易に学習できるばかりでなく、アクセントに応じて発声強調する部分をリアルに学習できるようになる。
なお、前記各実施形態における検索見出語の各文字(テキスト)・発音音声・発音顔画像(含む発音口型画像)の同期再生機能の説明では、当該見出語のアクセントが1箇所に存在する場合について説明したが、検索見出語のアクセントが第1アクセントと第2アクセントの2箇所に存在する場合には、各アクセント部分に対応して表示するアクセント対応の発音顔画像(含む発音口型画像)を、第1アクセントの場合と第2アクセントの場合とで、例えば口の開き具合の大小や表情の強弱などによって異なる形態にして表示させる構成としてもよい。
なお、前記各実施形態において記載した携帯機器10による各処理の手法、すなわち、図7のフローチャートに示す第1実施形態での辞書処理プログラム12aに従ったメイン処理、図8のフローチャートに示す前記メイン処理に伴う見出語同期再生処理、図9のフローチャートに示す前記見出語同期再生処理に伴う各見出語文字のハイライト表示に応じて割り込みで実行されるテキスト対応口表示処理、図19のフローチャートに示す第2実施形態での見出語同期再生処理、図20のフローチャートに示す第3実施形態での見出語同期再生処理などの各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード、DATA・CARD等)、磁気ディスク(フロッピディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記録媒体13に格納して配布することができる。そして、通信ネットワーク(インターネット)Nとの通信機能を備えた種々のコンピュータ端末は、この外部記録媒体13に記憶されたプログラムを記録媒体読取部14によってメモリ12に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明した検索見出語に対応する各文字(テキスト)・発音音声・発音顔画像(含む発音口型画像)の同期再生機能を実現し、前述した手法による同様の処理を実行することができる。
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(インターネット)N上を伝送させることができ、この通信ネットワーク(インターネット)Nに接続されたコンピュータ端末から前記のプログラムデータを取り込み、前述した検索見出語に対応する各文字(テキスト)・発音音声・発音顔画像(含む発音口型画像)の同期再生機能を実現することもできる。
なお、本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。