JP5259050B2 - 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム - Google Patents
音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム Download PDFInfo
- Publication number
- JP5259050B2 JP5259050B2 JP2005100133A JP2005100133A JP5259050B2 JP 5259050 B2 JP5259050 B2 JP 5259050B2 JP 2005100133 A JP2005100133 A JP 2005100133A JP 2005100133 A JP2005100133 A JP 2005100133A JP 5259050 B2 JP5259050 B2 JP 5259050B2
- Authority
- JP
- Japan
- Prior art keywords
- display
- speech
- unit
- voice
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
この携帯電話機は、複数のキー操作部と、キー操作部の1あるいは複数のキー操作に従い電話機が備えた複数の機能のうち、キー操作に対応する機能に関して設定を行う制御部と、キー操作に連動して設定される機能名を音声出力する音声合成部とを有する。
そして、その描画情報は、文字列が細かく分割されて通知されるため、そのまま読み上げエンジンに通知することができない。
また、文字列が通知される順番は、必ず表示される上部から通知されるわけではないことから、仮に通知される順序で読み上げを行うと、適切な文章とならない。
すなわち、描画のスタイルによっては同じ行の文字列であっても、座標値がずれて通知されるため、同一行の文字列として扱うことができない。
すなわち、リンク箇所を音声で明確に通知することができず、リンクから遷移中であることを容易に認識することが困難である。
携帯電話機10は、可動機構を有する、いわゆる折り畳み式携帯電話機であって、図2(a)は開かれた状態(開状態)での正面図を、(b)は閉じられた状態(閉状態)での正面図を、(c)は開状態での側面図を、(d)は閉状態での側面図を、それぞれ示している。
また、本実施形態に係る携帯電話機10は、通常の携帯電話機の機能に加えて、音声読み上げ機能を有し、たとえばブラウザから描画要求として通知される文字列を読み上げの文字列情報として扱い、ブラウザに手を加えずに通常のブラウザと同等の表示が可能となるように構成されている。
携帯電話機10は、取得したWeb情報に基づいて、文字列や絵記号や画像などの表示すべき表示オブジェクトと、表示オブジェクトを提供するサーバ30上で運営されているコンテンツにて規定されるスタイル等の表示規定を抽出し、表示オブジェクトと表示規定を対応付けて記憶部に格納しておき、抽出したスタイル等の表示規定に準じて表示オブジェクトを表示する。なお、表示規定には、表示座標(X,Y)、ゴシック体などのフォントタイプやアンダーラインなどの付加的表示などを指示する表示形式(スタイル)、あるいは表示サイズを含んでいる。
そして、携帯電話機10は、取得したWeb情報の表示状態において、読み上げのために音声読み上げ機能(音声合成部)の起動が要求されると、記憶部に格納される表示方法を規定するスタイルなどの表示規定を参照して表示オブジェクトから抽出される文字列を音声合成部により音声に変換する機能を有する。
ここで、所定の表示規定は、操作部により選択指示されている表示オブジェクトである(つまり、カーソルのあてられている)ことを示す選択位置表示規定を含む。また、所定の表示規定は、表示オブジェクトにリンク先が対応付けられていることを示すリンク先表示規定を含む。
そして、携帯電話機10は、リンク先の対応付けられた表示オブジェクトが操作部により選択指示または決定指示されると、この表示オブジェクトに含まれる文字列を第3の音声にて音声変換する機能を有する。
また、携帯電話機10は、リンク先の対応付けられた表示オブジェクトが操作部により決定指示されると、通信部によりリンク先へのアクセスがなされた後に、決定指示された表示オブジェクトに含まれる文字列を音声変換する機能を有する。
さらに、携帯電話機10は、操作部により決定指示がなされると、選択位置表示規定にて規定される表示オブジェクトに含まれる文字列を音声変換する機能を有する。
携帯電話機10は、複数の表示形式それぞれについて表示座標に対する補正値を格納しておき、表示オブジェクトのソートは、表示オブジェクトごとの表示形式に応じて補正値にて補正した上で行う機能を有する。
携帯電話機10は、複数の表示サイズそれぞれについて表示座標に対する補正値を格納しておき、表示オブジェクトのソートは、表示オブジェクトごとの表示サイズに応じて補正値にて補正した上で行う機能を有する。
携帯電話機10は、取得したWeb情報の表示状態において音声読み上げ機能(音声合成部)の起動が要求されると、記憶部に格納される複数の表示オブジェクトの中からカーソルの位置する表示を行うための表示形式の対応付けられる表示オブジェクトを検索し、検索された表示オブジェクトの有する文字列について、音声に変換する機能を有する。
また、図2(a)に示すように、携帯電話機10の本体ケース100は、第1の筐体としてのキー入力側本体ケース101と、第2の筐体としての表示側本体ケース102とが、図示しない可動機構により連結されて、開閉状態を形成するように構成される。
通信処理部11は、送受信アンテナ111を含んで構成され、電波を利用した無線通信で行うために、制御部19で処理された音声情報、電子メール等を変調して送受信アンテナ111により図示しない基地局、通信ネットワーク20を介してサーバ30に送信する。
また、通信処理部11は、基地局から無線により送信され、送受信アンテナ111で受信した電子メールや音声情報等の各種情報を復調して制御部19に出力する。
通信処理部11は、無線通信ネットワーク20に接続されるサーバ30から取得したWeb情報(取得情報)を制御部19に出力する。
なお、本実施形態においては、送受信アンテナ111は、キー入力側本体ケース101または表示側本体ケース102に内蔵されている。
メモリ12は、後述する読み上げ機能に必要なテキスト列を含む音声読み上げデータベースを記憶する。このデータベースでは、読み上げのためのテキスト列について、前後の接続関係が文章として成立するように、体系的に整理されている。
メモリ12は、音声読み上げ機能の制御テーブル、重み付けテーブルを記憶する。
メモリ12は、表示部が表示するメニューの項目毎に、「標準テキスト」、「短縮テキスト」および「説明テキスト」を記憶する。
メモリ12には、制御部19においてWeb情報により抽出される表示オブジェクトと、表示オブジェクトを提供するサーバにて規定される、表示部16,15への表示方法を規定する表示規定とが対応付けられた形態で格納される。上述したように、この表示規定には、キー操作部13により選択指示される表示オブジェクトであることを示す選択位置表示規定、表示オブジェクトにリンク先が対応付けられていることを示すリンク先表示規定を含む。
また、メモリ12には、制御部19により複数の表示形式それぞれについて表示座標に対する補正値が格納される。
また、メモリ12には、制御部19により複数の表示サイズそれぞれについて表示座標に対する補正値が格納される。
また、キー操作部13の操作により、メモリ12に記憶される音声読み上げ機能の制御テーブルの各項目の読み上げするか否か(ON/OFF)を制御部19を通して設定可能である。
キー操作部13の操作により、ユーザは表示部16,15に表示される文字情報に含まれる表示オブジェクトの選択指示と決定指示とを行うことが可能である。
ダイヤル入力部14に対する操作により、ユーザは、音声の出力音量やサブ表示部15およびメイン表示部16に表示する文字サイズを変更することが可能となる。
また、図2(c)および(d)から明らかなように、閉状態と開状態のダイヤル入力部14を比較すると、上下2方向の操作方向が物理的に逆転することになるが、本実施形態においては、ユーザにとって違和感が生じないように、ユーザから見た操作方向と操作に対する作用(たとえば、上述した音量変更や表示フォントサイズ(表示する文字サイズ)の変更)が常に一致するように、制御部19により制御される。
メイン表示部16は、液晶表示装置(LCD)等の表示デバイスを有し、図2(a)に示すように、開状態においてユーザに視認される。
サブ表示部15およびメイン表示部16は、それぞれ閉状態および開状態において、制御部19の制御の下、受信した電子メールのテキストやメモリ12に格納された様々なテキストデータを表示する。
また、サブ表示部15およびメイン表示部16は、それぞれ閉状態および開状態において、制御部19の制御の下、取得したWeb情報をメモリ12に格納された表示規定(表示座標、表示形式、または/および表示サイズ)に従った形態で表示する。
音声合成処理部17は、マイクロフォン172により収音した音声に対して所定の処理を行って制御部19に供給する。また、音声合成処理部17は、制御部19により供給された音声情報に対して所定の処理を行ってスピーカ171から出力させる。
また、図2(a),(b)に示すように、スピーカ171は、受話スピーカ171aおよびリンガスピーカ171bの2箇所の音声出力部を含み、読み上げ機能の処理結果である音声を出力する。
さらに、音声合成処理部17は、読み上げエンジンとして音声合成回路を有し、読み上げを行う際に、制御部19においてメモリ12から読み出され抽出されたテキストデータを音声データに変換して、音声出力部である受話スピーカ171aまたはリンガスピーカ171bにより音声合成して音声出力させる。
音声合成処理部17は、制御部19の制御の下、音声変換する際に、たとえばリンク先あり、カーソル位置表示などの所定の表示規定の場合には第1の音声で音声変換し、所定の表示規定で無い場合には第2の音声で音声変換し、リンク先の対応付けられた表示オブジェクトがキー操作部13により選択指示または決定指示されると、この表示オブジェクトに含まれる文字列を第3の音声にて音声変換する。
本実施形態における携帯電話機10は、読み上げ機能を有し、押下式ボタン18aが押下(操作)されると、たとえば閉状態にリンガスピーカ171aにより音声出力し、開状態では受話スピーカ171aより音声出力するように制御部19により制御
制御部19は、取得したWeb情報をメイン表示部16あるいはサブ表示部15に表示している表示状態において、たとえば読み上げキー操作部18の操作により音声合成処理部17の起動が要求されると、メモリ12に格納される表示規定を参照して表示オブジェクトから抽出される文字列を音声合成処理部17により音声に変換させる。
また、制御部19は、リンク先の対応付けられた表示オブジェクトがキー操作部13により選択指示または決定指示されると、この表示オブジェクトに含まれる文字列を第3の音声にて音声変換するように音声合成処理部17を制御する。
このように、本実施形態の制御部19は、描画スタイルに応じて読み上げの声質、スピード、イントネーション等を変更し、また、選択可能オブジェクトの遷移時に、読み上げの声質、スピード、イントネーションを変更するように音声合成処理部17を制御する機能を有する。
制御部19は、リンク先の対応付けられた表示オブジェクトがキー操作部13により決定指示されると、通信部によりリンク先へのアクセスがなされた後に、決定指示された表示オブジェクトに含まれる文字列を音声変換するように音声合成処理部17を制御する。また、制御部19は、キー操作部13により決定指示がなされると、選択位置表示規定にて規定される表示オブジェクトに含まれる文字列を音声変換するように音声合成処理部17を制御する。
制御部19は、メモリ12に複数の表示形式それぞれについて表示座標に対する補正値を格納する。そして、制御部19は、表示オブジェクトのソートは、表示オブジェクトごとの表示形式に応じてメモリ12に格納した補正値にて補正した上で行う。制御部19は、メモリ12に、複数の表示サイズそれぞれについて表示座標に対する補正値を格納する。そして、制御部19は、表示オブジェクトのソートは、表示オブジェクトごとの表示サイズに応じて前記補正値にて補正した上で行う。
図4は、特定スタイルでの表示画像のイメージを示す図である。
図5は、通知された情報、現在の文字サイズ、およびスタイル(リンク)の補正値の一例を示す図である。
図6は、文字列のソーティング前の蓄積管理情報と文言の格納領域における格納例を示す図である。
図7は、文字列ソーティング後の蓄積管理情報と文言の格納領域における格納例を示す図である。
図8は、読み上げ要求のイメージ例を示す図である。
次に、取得した情報のうち、スタイル情報がオブジェクトの選択中であるか否かの判別を行う(ST4)。
ステップST4において、選択中ではないと判別すると、取得した文字列をたとえばメモリ12に格納(バッファリング)する(ST5)。
次に、取得したスタイルが補正対象スタイルであるか否かの判別を行う(ST6)。
ステップST6において、補正対象スタイルであると判別すると、座標値を補正(ST7)してステップST8の処理に移行し、補正対象スタイルではないと判別すると、ステップST7の補正処理を経ることなくステップST8の処理に移行する。
そして、ステップST8においては、座標が描画画面であるか否かの判別を行う。
描画画面でない場合は、文字列を破棄して(ST9)、ステップST10の処理に移行し、描画画面である場合には、ステップST9の処理を経ることなくステップST10の処理に移行する。
ステップST10においては、描画処理が終了したか否かの判別を行い、終了していない場合には、ステップST2からの処理に移行する。
そして、ステップST10において、描画終了したと判別すると、文字列のソーティング処理を行い(ST11)、同一スタイルの文字列を渡す(ST12)。
そして、ステップST4において、スタイルの選択中であると判別すると、該当オブジェクトの音声読み上げを行い(ST13)、文字列のバッファをクリアする(ST14)。
そして、各要部ステップにおいては、具体的には以下に示すような処理が行われる。
たとえば図4に示すように、特定スタイルでの描画では座標位置がずれるため、表示形式(スタイル)と文字サイズに応じて座標位置を補正する。
"りんご"など特別な表示オブジェクト(リンク)の座標位置を補正する。描画要求にてリンクのスタイルが通知されたら、座標補正するためのデータベースから現在の文字サイズに応じた補正値を決定し補正する。
たとえば、図5に示すように、通知された"りんご"の情報が、座標値のXが0、Yが5、スタイルが「リンク」、文字数が「3」であり、現在の文字サイズ設定値が「文字サイズ標準」であり、スタイル(リンク)の補正値として、文字サイズ小が「Y−3」、文字サイズ標準が「Y−5」、文字サイズ大「Y−8」の場合を例とすると、次のように座標位置を補正する。
上記の情報を基に、座標値を補正する。スタイル(リンク)で文字サイズ標準であるため、"りんご"の3文字のY座標を−5加算し、座標値を(X:0、Y:0)とする。
なお、座標値は補正処理後の値を用いる。
図6に文字列のソーティング前の蓄積管理情報と文言の格納領域における格納例を示し、図7に文字列ソーティング後の格納例を示す。
これの例では、文字列ソーティング前の文言は、図6に示すように、「果物:」、「100円」、「2個」、「みかん」、「200円」、「メロン」、「300円」、「いちご」、「400円」、「りんご」の順であるものが、文字列ソーティング後は、図7に示すように、「果物:」、「りんご」、「100円」、「2個」、「みかん」、「200円」、「メロン」、「300円」、「いちご」、「400円」の順となっている。
図4の画面イメージを例にすると、リンクの文字列を標準と異なる音声(設定した音声)を読み上げる。
図4の画面イメージを例にすると、"りんご"の文字列を標準と異なる音声で読み上げる。
たとえば、図8に示すように、1行ずつ文字列が通知されたとしても、改行などを無視して同じ読み上げ方法で読み上げることが可能である。
また、同一座標で通知された文字列は、先に通知された文字列を有効とする。
たとえば、ラジオボタンなど文字列を有しないオブジェクトについては、遷移、決定した時点で、処理部内部の文字列をエンジンである制御部に受け渡すことで読み上げを実現する。
ブラウザから通知される文字種(リンク文字)によって判定する。
ブラウザではリンクを認識した場合、リンク文字(イタリック、青色、アンダーライン)などリンクに条件を付けて描画を行う。
リンクにカーソル遷移したとき、リンクに指定されている文字列を全て取得し、リンクから次画面に遷移した後リンクの文字列を読み上げることで、タイトル読み上げ効果を演出可能である。
リンク押下による遷移は、リンク遷移先情報(URLto)が通知されたときにリンク先を判定する。
リンクを押下し次画面へ遷移する場合、次画面の描画が始まるまでの間は、別途メモリ12に記憶しておいた次画面遷移中であることを示す文字列を読み上げ、ユーザにリンク中である旨を読み上げで通知する。
リンクの文字列を読み上げ中にリンク押下で画面遷移を行った場合でも、リンクの文字列をすべて読み上げることを可能にする。
<a href=http://kyocera.jp title=京セラ>ジャンプする</a>
1.リンク指定タグ(aタグ)の中にリンク先を記述する。
2.Titleはソフトキー対応の領域に表示する(ガイド部分に表示する)。
3.“ジャンプする”の部分が実際のリンク文字列になる。
[リンク画面表示時]
“ジャンプする”をリンク文字スタイルで座標X,Yに書け。
[リンクにカーソル遷移したとき]
座標X,Yの色を反転しろ。
ガイド部分に”京セラ“を書け。
[リンク押下されたとき]
URLを通知するので遷移しろ。
ブラウザがリンク部分の文字列の”ジャンプする”を取得した場合は、「青色の文字、イタリック文字でアンダーラインを付けて座標X,Yに表示」とリンクのための表示設定を行う。
読み上げキー18を押下した場合、画面の先頭から最後までの読み上げを行う。画面描画の際に用いた文字列の描画情報をメモリに格納しておき、文字列の座標をソートして座標の上位(画面上部)から順に読み上げを行う。リンク文字の”ジャンプする”は「青色の文字、イタリック文字でアンダーラインを付けて座標X,Yに表示」という指定があるため、この指定された文字列をリンクと判断し、読み上げエンジンに対し声種別を変更して読み上げを行う。
リンクが連続して表示されている場合は、声種別の設定を継続して読み上げを行うが、リンク文字列から通常のテキストが表示された場合は声種別を元に戻す。
声は反転された契機を元にリンクにカーソルが遷移したとして扱い、声種別を変更して読み上げる。画面全体を描画後に、「特定座標の色を反転させろ」という命令はリンクにカーソル遷移した場合のみのため、読み上げ中の文字列を破棄して優先的にカーソル遷移しリンク文字列を読み上げる。
ユーザが方向キーを操作すると、制御部19は表示部16の画面上のカーソルを押下された方向に応じて移動させる。このときに、リンク文字列である“ジャンプする”の上にカーソルがあてられると、先に述べたような表示色の反転処理を行う。すなわち、制御部19のブラウザ機能としては、Web情報として取得した表示規定に対し、表示部16の描画としては色の反転処理という表示規定を付加した上で描画更新を行う。この表示規定に色の反転処理が加えたときにtitle“京セラ”という文字列も取得し、ガイド領域の特に決定キーSFTK2に対応させた箇所に表示させる。
通信開始時にタイマにより計時し、一定時間経過後も新規画面が描画されない場合は、「接続中です」なども読み上げを可能にする。
リンク押下時に、リンク元のtitle“京セラ”をメモリに記憶しておき、新規画面の描画が完了したら、新規画面の文字列の読み上げに先んじて”京セラ”を読み上げることにより、タイトルの効果を出す。
この読み上げ機能は、全て制御部19の制御部のもとで処理され、デバイスレイヤ191にブラウザ192を含み、さらに、バッファ193、スピーチインタフェース194、音声エンジン部195を有する。音声エンジン部195は、音声合成処理部17の機能を含んで構成される。
1.サーバ30よりHTML(読み上げ対象)を取得する。
2.ブラウザ192がHTML中の文字の描画をデバイスレイヤ191に要求する。デバイスレイヤ191はこれをバッファ193に蓄積する。
3.ブラウザ192から描画完了をデバイスレイヤ191に通知する。
これを契機にスピーチインタフェース194に蓄積した文言の読み上げを要求する。
4.音声エンジン部195で文字列を音声に変換し、読み上げを行う。
この場合の標記例は次の通りである。
<addr title="addr link click">html</addr>
このように、表示規定の例は多数存在する。もちろん他にも電話番号の対応付けられたものや、メールアドレス等もリンク付けがあれば表示規定に通常とは異なる規定が加わる。
1.画面更新完了の通知、
2.X,Y座標によるソート、
の手順である。
以下、各手順について説明する。
ブラウザ192は、文字列通知命令により、何度も描画要求を行う。そこで、画面の描画が終わったという通知をブラウザから検出する必要がある。
これには、ブラウザ192から発行されるWML形式が変更されたことを示す通知関数を検知し、その後の画面更新が終わったという通知関数を検知することにより実現する。
描画される文字列は、ブラウザから文字列通知命令によりデバイスレイヤに通知される。図12に示すように、表示部16のピクト領域を除いた一番上の左上を基底として(0,0)、上から順に描画される文字列が通知される。
しかし、テキストによりリンク先が指定してある文字列が含まれており、かつそのリンクにカーソルが当たっている場合、文字列通知命令はその文字列のみ、一番最後に描画要求を行う。
その状態を図13(A),(B)に示す。
図14(A)〜(C)に、ソートアルゴリズムを示す。
この例では、Y座標で昇順にソートする。ただし、Yの値が同じであった場合、X座標の値を昇順で比較する。Xの値も同じであった場合は、描画要求が先にあった方を優先する。
このソート処理の結果、読み上げ文字列は、「ABCDEFGHIJKLMNOPQRSTUVWXYZ」となる。
図15は、ページ全体を読み上げる際の基本シーケンスを示す図である。
描画開始命令が呼ばれた直後の描画から、描画完了の描画終了命令が呼ばれる前までの描画を全画面描画とみなす。
この場合、文字列、描画座標、フォーカス有リンク/ノーマルをバッファ193に蓄積し描画する。
描画完了がデバイスレイヤ191に通知されると、所定時間、たとえば1秒待って座標でソートを行い、ソートバッファに蓄積する。
そして、デバイスレイヤ191は声指定する。ノーマルの場合は設定の声とし、フォーカス有リンクの場合は設定と異なる(逆)の声とする。たとえば、設定が男声なら女声とする。
デバイスレイヤ191は、スピーチインタフェース194に対して、同一声種別の文言をまとめて読み上げ要求する。デバイスレイヤ191はソートバッファに文言がある間この要求処理を、読み上げ完了の通知を受けるまで繰り返す。
図16は、行方向スクロール時の読み上げシーケンスを示す図である。
スクロール開始命令が呼ばれた後の描画から、描画終了命令が呼ばれるまでの描画をスクロール描画とみなす。
また、スクロール開始命令が、プラス(+)の値でコールされれば下方向のスクロール、マイナス(-)の値でコールされれば上方向のスクロールと判定する。
既に描画した行の移動のための描画の場合にはバッファに蓄積せず、新しく現れた行の描画の場合には読み上げるために、バッファに蓄積する。
そして、デバイスレイヤ191は、スピーチインタフェース194に対して、同一声種別の文言をまとめて読み上げ要求する。デバイスレイヤ191はソートバッファに文言がある間この要求処理を、読み上げ完了の通知を受けるまで繰り返す。
また、通知された文字列のスタイルに応じて座標値を補正し、通知された順序ではなく、座標によりソーティング後の読み上げを行い、また、描画スタイルに応じて読み上げの声質、スピード、イントネーション等を変更し、また、選択可能オブジェクトの遷移時に、読み上げの声質、スピード、イントネーションを変更し、また、点滅など同じ文字列が通知されても一度しか読み上げないように構成したことから、以下の効果を得ることができる。
描画要求を用いた読み上げのため、ブラウザに手を加えることなく、実現可能であり、その結果、通常のブラウザと同等の表示が可能となる。
同じ声質で読み上げる場合、いくつかに、分割して通知された文字列をまとめて読み上げることにより、読み上げが途切れることを防止でき、また、熟語が正しく読まれる確率が高まる。
また、読み上げ中は、新規に表示された文字列をバッファリングすることから、読み上げ終了後にバッファリングされている文字列を読み上げることができ、これにより、読み上げの中断を防止することができる。
また、別画面が表示されたときは読み上げを中断することができ、画面と読み上げの同調を図ることができる。
また、選択可能なオブジェクトにカーソル遷移した場合は読み上げを中断して該当オブジェクトを読み上げることができ、これにより、選択されたタイミングを逃すことなく読み上げが可能である。
また、表示エリアから一部はみだしている文字列については、座標値にて読み上げ対象範囲を決定することができ、重複した読み上げを防止することができる。
キャッシュ表示など文字列が通知されない場合は、再描画要求にて再度文字列の通知を行うことができ、文字列を入手して再度描画されても同じ画面が表示されるので、ちらつきが発生しない。
また、文字列を有しないオブジェクトをスタイルで判定することにより、特定の文字列を与え読み上げることが可能である。
100…本体ケース
101…キー入力側本体ケース
102…表示側本体ケース
11…通信処理部
111…送受信アンテナ
12…メモリ
13…キー操作部
14…ダイヤル入力部
15…サブ表示部
16…メイン表示部
17…音声合成処理部
171…スピーカ
172…マイクロフォン
18…読み上げキー操作部
19…制御部
191…デバイスレイヤ
192…ブラウザ
193…バッファ
194…スピーチインタフェース
195…音声エンジン部
20…無線通信ネットワーク
30…サーバ
Claims (5)
- リンク先が対応付けられているリンク付き表示オブジェクトを含む複数の表示オブジェクト、およびカーソルを表示する表示部と、
文字列を音声に変換する音声合成部と、
前記複数の表示オブジェクトのうち、いずれかの表示オブジェクトを選択指示または決定指示する操作部と、
前記表示部に表示中の前記リンク付き表示オブジェクトが前記操作部により選択された状態で決定指示されると、当該リンク付き表示オブジェクトに対応付けられるリンク先へのアクセスを行うとともに、当該リンク付き表示オブジェクトに含まれる文字列を第1の音声により音声変換させる第1の音声変換処理を実行するように前記音声合成部を制御する制御部と、を備え、
前記音声合成部は、前記表示部に表示中の前記複数の表示オブジェクトそれぞれに含まれる文字列を前記第1の音声と異なる第2の音声により順に音声変換させる第2の音声変換処理を行い、
前記制御部は、前記第2の音声変換処理の実行中に、前記リンク付き表示オブジェクトが前記操作部により選択指示されると、当該実行中の音声変換を止めるように前記音声合成部を制御するとともに、
前記制御部は、前記第2の音声変換処理の実行が、前記リンク付き表示オブジェクトが前記操作部により選択指示されたことにより停止されたとき、当該リンク付き表示オブジェクトに含まれる文字列を第3の音声により音声変換させる
ことを特徴とする音声合成機能付き文字情報表示装置。 - 前記制御部は、前記第1の音声変換処理は、前記リンク先のアクセスにより前記表示部の表示が次画面に遷移してから実行するように前記音声合成部を制御する
ことを特徴とする請求項1に記載の音声合成機能付き文字情報表示装置。 - 前記制御部は、前記第2の音声変換処理の実行中に、前記表示部に表示中の前記複数の表示オブジェクトを有する文書についてのページスクロールが前記操作部により行われた際には、当該実行中の音声変換を止め、前記文書についての行スクロールが前記操作部により行われた際には当該実行中の音声変換を止めないように前記音声合成を制御する
ことを特徴とする請求項1または2に記載の音声合成機能付き文字情報表示装置。 - 前記制御部は、前記表示部に前記複数の表示オブジェクトを表示しているものの、当該表示がキャッシュによる表示である場合には、前記複数の表示オブジェクトを再び描画要求する
ことを特徴とする請求項1から3のいずれか一項に記載の音声合成機能付き文字情報表示装置。 - リンク先が対応付けられているリンク付き表示オブジェクトを含む複数の表示オブジェクト、およびカーソルを表示する表示部と、文字列を音声に変換する音声合成部と、前記複数の表示オブジェクトのうち、いずれかの表示オブジェクトを選択指示または決定指示する操作部と、前記表示部に表示中の前記リンク付き表示オブジェクトが前記操作部により選択された状態で決定指示されると、当該リンク付き表示オブジェクトに対応付けられるリンク先へのアクセスを行うとともに、当該リンク付き表示オブジェクトに含まれる文字列を第1の音声により音声変換させる第1の音声変換処理を実行するように前記音声合成部を制御する制御部と、を備える音声合成機能付き文字情報表示装置の制御方法であって、
前記音声合成部が、前記表示部に表示中の前記複数の表示オブジェクトそれぞれに含まれる文字列を前記第1の音声と異なる第2の音声により順に音声変換させる第2の音声変換処理を行うステップと、
前記制御部が、前記第2の音声変換処理の実行中に、前記リンク付き表示オブジェクトが前記操作部により選択指示されると、当該実行中の音声変換を止めるように前記音声合成部を制御するとともに、
前記制御部が、前記第2の音声変換処理の実行が、前記リンク付き表示オブジェクトが前記操作部により選択指示されたことにより停止されたとき、当該リンク付き表示オブジェクトに含まれる文字列を第3の音声により音声変換させるステップと、を備える
ことを特徴とする音声合成機能付き文字情報表示装置の制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005100133A JP5259050B2 (ja) | 2005-03-30 | 2005-03-30 | 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム |
US11/393,330 US7885814B2 (en) | 2005-03-30 | 2006-03-30 | Text information display apparatus equipped with speech synthesis function, speech synthesis method of same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005100133A JP5259050B2 (ja) | 2005-03-30 | 2005-03-30 | 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011234732A Division JP5220912B2 (ja) | 2011-10-26 | 2011-10-26 | 音声合成機能付き文字情報表示装置およびその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006276800A JP2006276800A (ja) | 2006-10-12 |
JP5259050B2 true JP5259050B2 (ja) | 2013-08-07 |
Family
ID=37071667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005100133A Expired - Fee Related JP5259050B2 (ja) | 2005-03-30 | 2005-03-30 | 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7885814B2 (ja) |
JP (1) | JP5259050B2 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004227468A (ja) * | 2003-01-27 | 2004-08-12 | Canon Inc | 情報提供装置、情報提供方法 |
JP4743686B2 (ja) * | 2005-01-19 | 2011-08-10 | 京セラ株式会社 | 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム |
US11128745B1 (en) * | 2006-03-27 | 2021-09-21 | Jeffrey D. Mullen | Systems and methods for cellular and landline text-to-audio and audio-to-text conversion |
WO2007138944A1 (ja) * | 2006-05-26 | 2007-12-06 | Nec Corporation | 情報付与システム、情報付与方法、情報付与プログラム及び情報付与プログラム記録媒体 |
KR100699050B1 (ko) * | 2006-06-30 | 2007-03-28 | 삼성전자주식회사 | 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법 |
TWI341956B (en) * | 2007-05-30 | 2011-05-11 | Delta Electronics Inc | Projection apparatus with function of speech indication and control method thereof for use in the apparatus |
JP5062670B2 (ja) * | 2007-06-26 | 2012-10-31 | 京セラ株式会社 | 電子機器 |
US8635069B2 (en) | 2007-08-16 | 2014-01-21 | Crimson Corporation | Scripting support for data identifiers, voice recognition and speech in a telnet session |
CA2731918C (en) * | 2008-09-03 | 2015-11-24 | Flextronics Ap, Llc | Systems and methods for connecting and operating portable gps enabled devices in automobiles |
US20110054880A1 (en) * | 2009-09-02 | 2011-03-03 | Apple Inc. | External Content Transformation |
JP5414458B2 (ja) * | 2009-10-28 | 2014-02-12 | 京セラ株式会社 | 音声合成機能付き文字情報表示装置、およびその音声合成方法 |
US20110184738A1 (en) * | 2010-01-25 | 2011-07-28 | Kalisky Dror | Navigation and orientation tools for speech synthesis |
JPWO2011111321A1 (ja) * | 2010-03-11 | 2013-06-27 | パナソニック株式会社 | 音声読み上げ装置および音声読み上げ方法 |
US8600447B2 (en) * | 2010-03-30 | 2013-12-03 | Flextronics Ap, Llc | Menu icons with descriptive audio |
JP5464078B2 (ja) | 2010-06-30 | 2014-04-09 | 株式会社デンソー | 音声認識端末 |
JP5721177B2 (ja) * | 2011-07-29 | 2015-05-20 | Necプラットフォームズ株式会社 | Ip電話システム、ip電話装置、およびコンテンツ同期方法 |
JP2013072903A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 合成辞書作成装置および合成辞書作成方法 |
US8856007B1 (en) * | 2012-10-09 | 2014-10-07 | Google Inc. | Use text to speech techniques to improve understanding when announcing search results |
WO2015128960A1 (ja) * | 2014-02-26 | 2015-09-03 | 三菱電機株式会社 | 車載制御装置および車載制御方法 |
US10033797B1 (en) | 2014-08-20 | 2018-07-24 | Ivanti, Inc. | Terminal emulation over HTML |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
CN106251869B (zh) * | 2016-09-22 | 2020-07-24 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
US11170757B2 (en) * | 2016-09-30 | 2021-11-09 | T-Mobile Usa, Inc. | Systems and methods for improved call handling |
US11393451B1 (en) * | 2017-03-29 | 2022-07-19 | Amazon Technologies, Inc. | Linked content in voice user interface |
CN111654658B (zh) * | 2020-06-17 | 2022-04-15 | 平安科技(深圳)有限公司 | 音视频通话的处理方法、系统、编解码器及存储装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3408332B2 (ja) * | 1994-09-12 | 2003-05-19 | 富士通株式会社 | ハイパーテキスト読上装置 |
US5899975A (en) * | 1997-04-03 | 1999-05-04 | Sun Microsystems, Inc. | Style sheets for speech-based presentation of web pages |
JPH11252216A (ja) | 1998-02-27 | 1999-09-17 | Kyocera Corp | 電話機 |
JP2000187493A (ja) * | 1998-12-22 | 2000-07-04 | Sumitomo Electric Ind Ltd | 音声出力装置および車載用コンピュータ |
JP3603008B2 (ja) * | 2000-05-31 | 2004-12-15 | シャープ株式会社 | 音声合成処理装置 |
FI115868B (fi) * | 2000-06-30 | 2005-07-29 | Nokia Corp | Puhesynteesi |
JP3714159B2 (ja) * | 2000-11-30 | 2005-11-09 | 日本電気株式会社 | ブラウザ搭載装置 |
JP2002312157A (ja) * | 2001-04-13 | 2002-10-25 | Yoshito Suzuki | 音声ガイダンスモニタソフトウェア |
US6810378B2 (en) * | 2001-08-22 | 2004-10-26 | Lucent Technologies Inc. | Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech |
US20040054535A1 (en) * | 2001-10-22 | 2004-03-18 | Mackie Andrew William | System and method of processing structured text for text-to-speech synthesis |
US7483832B2 (en) * | 2001-12-10 | 2009-01-27 | At&T Intellectual Property I, L.P. | Method and system for customizing voice translation of text to speech |
JP2004185055A (ja) | 2002-11-29 | 2004-07-02 | Kyocera Corp | 電子メールシステム及び通信端末 |
US8826137B2 (en) * | 2003-08-14 | 2014-09-02 | Freedom Scientific, Inc. | Screen reader having concurrent communication of non-textual information |
JP2005115476A (ja) * | 2003-10-03 | 2005-04-28 | Canon Inc | 情報出力装置、リンク報知方法、プログラム、及び記憶媒体 |
US20060090138A1 (en) * | 2004-10-19 | 2006-04-27 | Steve Wang | Method and apparatus for providing DHTML accessibility |
-
2005
- 2005-03-30 JP JP2005100133A patent/JP5259050B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-30 US US11/393,330 patent/US7885814B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7885814B2 (en) | 2011-02-08 |
US20060224386A1 (en) | 2006-10-05 |
JP2006276800A (ja) | 2006-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5259050B2 (ja) | 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム | |
US8515760B2 (en) | Mobile terminal and text-to-speech method of same | |
US6956591B2 (en) | Smooth scrolling with highlighted navigation and marking of page changes | |
US20080182599A1 (en) | Method and apparatus for user input | |
US9535511B2 (en) | Character input device | |
JP5196912B2 (ja) | 携帯電子機器 | |
JP4241423B2 (ja) | 文章作成装置 | |
US9928084B2 (en) | Electronic device and method for activating application | |
JP5220912B2 (ja) | 音声合成機能付き文字情報表示装置およびその制御方法 | |
JP2002202935A (ja) | サーバ装置 | |
US20100318696A1 (en) | Input for keyboards in devices | |
JP5468923B2 (ja) | 携帯端末装置 | |
KR100568495B1 (ko) | 휴대용 전자 장치 및 휴대용 전자 장치의 제어 방법 | |
JP4583875B2 (ja) | 電子機器および電子機器の音声読み上げ制御方法 | |
JP5414458B2 (ja) | 音声合成機能付き文字情報表示装置、およびその音声合成方法 | |
JP2010257403A (ja) | 入力文字変換装置 | |
JP2014106769A (ja) | 電子機器及び制御プログラム並びに表示制御方法 | |
JP5340034B2 (ja) | 文字入力装置、文字表示システム及び文字変換方法 | |
JP5248051B2 (ja) | 電子機器 | |
JP2008011478A (ja) | 電子機器及びプログラム | |
JP5062670B2 (ja) | 電子機器 | |
JP5098814B2 (ja) | 文字入力装置、文字入力方法及びプログラム | |
JP5186080B2 (ja) | 携帯端末機 | |
WO2011037230A1 (ja) | 電子機器及びアプリケーションの起動方法 | |
JP5352417B2 (ja) | 電子機器及びアプリケーションの起動方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111026 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111104 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20111228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130424 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5259050 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |