JPH10149195A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH10149195A JPH10149195A JP8322240A JP32224096A JPH10149195A JP H10149195 A JPH10149195 A JP H10149195A JP 8322240 A JP8322240 A JP 8322240A JP 32224096 A JP32224096 A JP 32224096A JP H10149195 A JPH10149195 A JP H10149195A
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- speech
- reading
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 ディスプレイを用いずとも、構造化された情
報を使用者にとってわかりやすい仕方で提示することが
可能であって、使用者が音声の利点を生かした形で情報
を取得することの可能な音声合成装置を提供する。 【解決手段】 構造化された情報(文書)100を音声合
成の対象として取り扱うことが可能となっており、音声
合成の対象となる構造化された情報100から例えば所
定のページのテキスト(文字列)を読み込む読取部1と、
読取部1で読取られた所定ページのテキスト(文字列)が
格納される読み上げバッファ2と、読み上げバッファ2
に格納された所定ページのテキスト(文字列)に対して音
声合成処理を行なう音声合成部3と、音声合成処理され
た結果を音声で出力する(読み上げる)出力部(例えばス
ピーカ)4とを有している。
報を使用者にとってわかりやすい仕方で提示することが
可能であって、使用者が音声の利点を生かした形で情報
を取得することの可能な音声合成装置を提供する。 【解決手段】 構造化された情報(文書)100を音声合
成の対象として取り扱うことが可能となっており、音声
合成の対象となる構造化された情報100から例えば所
定のページのテキスト(文字列)を読み込む読取部1と、
読取部1で読取られた所定ページのテキスト(文字列)が
格納される読み上げバッファ2と、読み上げバッファ2
に格納された所定ページのテキスト(文字列)に対して音
声合成処理を行なう音声合成部3と、音声合成処理され
た結果を音声で出力する(読み上げる)出力部(例えばス
ピーカ)4とを有している。
Description
【0001】
【発明の属する技術分野】本発明は、音声合成装置に関
する。
する。
【0002】
【従来の技術】音声合成装置は、所定のテキスト(文書)
情報を音声に変換して使用者に伝えるための装置であ
る。音声で情報を伝えることは、ディスプレイのような
比較的大きな表示装置を必要としないという利点がある
が、その反面、情報を順に音に変えて出力するだけなの
で、情報が大量のものである場合、大量の情報を一度に
提示できないという欠点がある。
情報を音声に変換して使用者に伝えるための装置であ
る。音声で情報を伝えることは、ディスプレイのような
比較的大きな表示装置を必要としないという利点がある
が、その反面、情報を順に音に変えて出力するだけなの
で、情報が大量のものである場合、大量の情報を一度に
提示できないという欠点がある。
【0003】このような問題は、マニュアルのような大
量の情報をもった文書をディスプレイに表示するような
場合にも存在し、大量の情報をもった文書をディスプレ
イに表示する場合におけるこのような問題を解決するた
めに、近年、文書(テキスト)を構造化することが着目さ
れており、既にWINDOWSなどのヘルプでは、構造
化された文書の形態が用いられている。
量の情報をもった文書をディスプレイに表示するような
場合にも存在し、大量の情報をもった文書をディスプレ
イに表示する場合におけるこのような問題を解決するた
めに、近年、文書(テキスト)を構造化することが着目さ
れており、既にWINDOWSなどのヘルプでは、構造
化された文書の形態が用いられている。
【0004】
【発明が解決しようとする課題】しかしながら、従来で
は、音声合成装置として、ディスプレイを用いることな
しに、これらの構造化された情報を使用者にとってわか
りやすい仕方で提示することはできなかった。
は、音声合成装置として、ディスプレイを用いることな
しに、これらの構造化された情報を使用者にとってわか
りやすい仕方で提示することはできなかった。
【0005】本発明は、ディスプレイを用いずとも、構
造化された情報を使用者にとってわかりやすい仕方で提
示することが可能であって、使用者が音声の利点を生か
した形で情報を取得することの可能な音声合成装置を提
供することを目的としている。
造化された情報を使用者にとってわかりやすい仕方で提
示することが可能であって、使用者が音声の利点を生か
した形で情報を取得することの可能な音声合成装置を提
供することを目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、構造化された情報を操作者
の指示によって読み取る読取手段と、読取手段で読み取
った構造化された情報を音声合成処理の対象とし、読み
取られた構造化された情報を音声合成し、合成音声を出
力する音声合成手段とを備えていることを特徴としてい
る。
に、請求項1記載の発明は、構造化された情報を操作者
の指示によって読み取る読取手段と、読取手段で読み取
った構造化された情報を音声合成処理の対象とし、読み
取られた構造化された情報を音声合成し、合成音声を出
力する音声合成手段とを備えていることを特徴としてい
る。
【0007】また、請求項2記載の発明は、請求項1記
載の音声合成装置において、前記構造化された情報とし
て、予め用意された機器等の操作マニュアル情報を音声
合成処理の対象とすることを特徴としている。
載の音声合成装置において、前記構造化された情報とし
て、予め用意された機器等の操作マニュアル情報を音声
合成処理の対象とすることを特徴としている。
【0008】また、請求項3記載の発明は、請求項1記
載の音声合成装置において、前記構造化された情報とし
て、ネットワーク上に公開された構造化文書を音声合成
処理の対象とすることを特徴としている。
載の音声合成装置において、前記構造化された情報とし
て、ネットワーク上に公開された構造化文書を音声合成
処理の対象とすることを特徴としている。
【0009】また、請求項4記載の発明は、請求項1記
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に、関連する情報をもつ部分が記述
されている場合に、関連する情報をもつ部分について
は、前記音声合成手段は、これを合成音声で出力する前
に、所定の信号音を出力することを特徴としている。
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に、関連する情報をもつ部分が記述
されている場合に、関連する情報をもつ部分について
は、前記音声合成手段は、これを合成音声で出力する前
に、所定の信号音を出力することを特徴としている。
【0010】また、請求項5記載の発明は、請求項1記
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に、関連する情報をもつ部分が記述
されている場合に、関連する情報をもつ部分について
は、音声合成手段は、他の部分と音声の特徴を変えて出
力することを特徴としている。
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に、関連する情報をもつ部分が記述
されている場合に、関連する情報をもつ部分について
は、音声合成手段は、他の部分と音声の特徴を変えて出
力することを特徴としている。
【0011】また、請求項6記載の発明は、請求項1記
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に関連する情報をもつ部分が記述さ
れている場合に、関連する情報をもつ部分を記憶する記
憶手段をさらに有し、前記読取手段は、操作者からの指
示によって、前記記憶手段に記憶されている関連する情
報をもつ部分の情報の読み取りを行ない、この場合、前
記音声合成手段は、現在読み上げ中の情報の音声合成処
理を中断して、前記関連する情報についての音声合成処
理を開始することを特徴としている。
載の音声合成装置において、前記読取手段で読み取った
構造化された情報中に関連する情報をもつ部分が記述さ
れている場合に、関連する情報をもつ部分を記憶する記
憶手段をさらに有し、前記読取手段は、操作者からの指
示によって、前記記憶手段に記憶されている関連する情
報をもつ部分の情報の読み取りを行ない、この場合、前
記音声合成手段は、現在読み上げ中の情報の音声合成処
理を中断して、前記関連する情報についての音声合成処
理を開始することを特徴としている。
【0012】また、請求項7記載の発明は、請求項6記
載の音声合成装置において、前記操作者からの指示は、
所定のボタンをボタン操作させることによってなされる
か、または、所定の単語を発声させてこれを音声認識す
ることによってなされることを特徴としている。
載の音声合成装置において、前記操作者からの指示は、
所定のボタンをボタン操作させることによってなされる
か、または、所定の単語を発声させてこれを音声認識す
ることによってなされることを特徴としている。
【0013】また、請求項8記載の発明は、請求項1記
載の音声合成装置において、該音声合成装置は、構造化
された情報の各部分について、読み上げた回数を記録す
る機能をさらに有し、合成音声を出力する際に、読み上
げ回数に応じて合成音声の出力順序を変えて出力するこ
とを特徴としている。
載の音声合成装置において、該音声合成装置は、構造化
された情報の各部分について、読み上げた回数を記録す
る機能をさらに有し、合成音声を出力する際に、読み上
げ回数に応じて合成音声の出力順序を変えて出力するこ
とを特徴としている。
【0014】また、請求項9記載の発明は、請求項3記
載の音声合成装置において、構造化された情報中にイメ
ージデータが存在する場合、該イメージデータに対し
て、文字認識を行ない、その結果の認識文字列をも音声
合成の対象とすることを特徴としている。
載の音声合成装置において、構造化された情報中にイメ
ージデータが存在する場合、該イメージデータに対し
て、文字認識を行ない、その結果の認識文字列をも音声
合成の対象とすることを特徴としている。
【0015】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る音声合成装置の
構成例を示す図である。図1を参照すると、この音声合
成装置は、構造化された情報(文書)100を音声合成の
対象として取り扱うことが可能となっており、音声合成
の対象となる構造化された情報100から例えば所定の
ページのテキスト(文字列)を読み込む読取部1と、読取
部1で読取られた所定ページのテキスト(文字列)が格納
される読み上げバッファ2と、読み上げバッファ2に格
納された所定ページのテキスト(文字列)に対して音声合
成処理を行なう音声合成部3と、音声合成処理された結
果を音声で出力する(読み上げる)出力部(例えばスピー
カ)4とを有している。
基づいて説明する。図1は本発明に係る音声合成装置の
構成例を示す図である。図1を参照すると、この音声合
成装置は、構造化された情報(文書)100を音声合成の
対象として取り扱うことが可能となっており、音声合成
の対象となる構造化された情報100から例えば所定の
ページのテキスト(文字列)を読み込む読取部1と、読取
部1で読取られた所定ページのテキスト(文字列)が格納
される読み上げバッファ2と、読み上げバッファ2に格
納された所定ページのテキスト(文字列)に対して音声合
成処理を行なう音声合成部3と、音声合成処理された結
果を音声で出力する(読み上げる)出力部(例えばスピー
カ)4とを有している。
【0016】ここで、図1の例では、音声合成部3は、
入力文字列を発音記号列に変換する言語解析部11と、
発音記号列から音声波形を生成する波形生成部12とに
よって構成されている。
入力文字列を発音記号列に変換する言語解析部11と、
発音記号列から音声波形を生成する波形生成部12とに
よって構成されている。
【0017】また、構造化された情報100は、例えば
図2に示すようなものとして構成されている。すなわ
ち、図2の例では、構造化された情報100は、情報が
各項目ごとに分類され、それぞれページ単位のテキスト
で構成されている(ページ単位で内容が記述されてい
る)。そして、あるページのテキスト内において関連す
る内容が他ページにあるような場合には、その他ページ
を検索することができるように、あるページのテキスト
内には、他ページのページ番号を付記可能となってい
る。具体的には、テキスト内に他ページへのリンクを表
わす記号“[](PAGE21)”などを付記することができる
ようになっている。
図2に示すようなものとして構成されている。すなわ
ち、図2の例では、構造化された情報100は、情報が
各項目ごとに分類され、それぞれページ単位のテキスト
で構成されている(ページ単位で内容が記述されてい
る)。そして、あるページのテキスト内において関連す
る内容が他ページにあるような場合には、その他ページ
を検索することができるように、あるページのテキスト
内には、他ページのページ番号を付記可能となってい
る。具体的には、テキスト内に他ページへのリンクを表
わす記号“[](PAGE21)”などを付記することができる
ようになっている。
【0018】このような構造化された情報100を対象
とするとき、音声合成部3の言語解析部11,波形生成
部12は、ほぼ従来の音声合成装置と同じ動作を行なう
が、言語解析部11では、入力テキストに対する前処理
として他ページへのリンクを表わす記号“[](PAGE 2
1)”などを取り去り、これの代わりに、例えば特殊な記
号を挿入するようになっている。これにより、言語解析
部11では、特殊な記号を含んだ入力文字列を処理して
発音記号列を生成するが、この場合、特殊な記号には読
みの代わりにリンクを表わす記述,例えば“〈P21〉”
などを与えて、発音記号列を生成し、また、波形生成部
12では、発音記号列から音声波形を生成し、出力部4
から出力させるが、リンクを表わす記述,例えば“〈P2
1〉”などを処理する際には、これを使用者の注意を喚
起する所定の信号音に変えて出力するようになってい
る。
とするとき、音声合成部3の言語解析部11,波形生成
部12は、ほぼ従来の音声合成装置と同じ動作を行なう
が、言語解析部11では、入力テキストに対する前処理
として他ページへのリンクを表わす記号“[](PAGE 2
1)”などを取り去り、これの代わりに、例えば特殊な記
号を挿入するようになっている。これにより、言語解析
部11では、特殊な記号を含んだ入力文字列を処理して
発音記号列を生成するが、この場合、特殊な記号には読
みの代わりにリンクを表わす記述,例えば“〈P21〉”
などを与えて、発音記号列を生成し、また、波形生成部
12では、発音記号列から音声波形を生成し、出力部4
から出力させるが、リンクを表わす記述,例えば“〈P2
1〉”などを処理する際には、これを使用者の注意を喚
起する所定の信号音に変えて出力するようになってい
る。
【0019】具体的に、読取部1で読み取られた構造化
された情報中に、関連する情報をもつ部分が記述されて
いる場合に、関連する情報をもつ部分については、音声
合成部3は、これを合成音声で出力する前に、所定の信
号音,例えばビープ音を出力して、使用者の注意を喚起
するようになっている。
された情報中に、関連する情報をもつ部分が記述されて
いる場合に、関連する情報をもつ部分については、音声
合成部3は、これを合成音声で出力する前に、所定の信
号音,例えばビープ音を出力して、使用者の注意を喚起
するようになっている。
【0020】また、図1の音声合成装置には、このとき
のリンクの内容,例えばページ番号が格納されるリンク
バッファ5と、リンクバッファ5に格納されたリンクの
内容(例えばページ番号)を読み出し、このリンクの内容
に対応した新しいページの読み上げを開始させる指示を
読取部1などに与える開始指示部6とがさらに設けられ
ており、読取部1は、開始指示部6から開始指示がある
ときには、音声合成部3による音声合成処理(読み上げ)
に同期してリンクバッファ5に格納されているページ番
号に対応した新しいページの読み取りを開始するように
なっている。
のリンクの内容,例えばページ番号が格納されるリンク
バッファ5と、リンクバッファ5に格納されたリンクの
内容(例えばページ番号)を読み出し、このリンクの内容
に対応した新しいページの読み上げを開始させる指示を
読取部1などに与える開始指示部6とがさらに設けられ
ており、読取部1は、開始指示部6から開始指示がある
ときには、音声合成部3による音声合成処理(読み上げ)
に同期してリンクバッファ5に格納されているページ番
号に対応した新しいページの読み取りを開始するように
なっている。
【0021】すなわち、図1の音声合成装置では、読取
部1で読み取られた構造化された情報中に関連する情報
をもつ部分が記述されている場合に、関連する情報をも
つ部分を記憶する記憶手段(リンクバッファ)5をさらに
有し、読取部1は、操作者からの指示によって、記憶手
段(リンクバッファ)5に記憶されている関連する情報を
もつ部分の情報の読み取りを行ない、この場合、音声合
成部3は、現在読み上げ中の情報の音声合成処理を中断
して、前記関連する情報についての音声合成処理を開始
するようになっている。
部1で読み取られた構造化された情報中に関連する情報
をもつ部分が記述されている場合に、関連する情報をも
つ部分を記憶する記憶手段(リンクバッファ)5をさらに
有し、読取部1は、操作者からの指示によって、記憶手
段(リンクバッファ)5に記憶されている関連する情報を
もつ部分の情報の読み取りを行ない、この場合、音声合
成部3は、現在読み上げ中の情報の音声合成処理を中断
して、前記関連する情報についての音声合成処理を開始
するようになっている。
【0022】図1のような構成の音声合成装置では、使
用者は、当初、図2のような構造化された情報100の
うち、必要な部分のページ番号を例えばキーボードなど
によって入力指定する。このようにして入力指定された
ページ番号は、例えばリンクバッファ5に格納される。
次いで、使用者は、開始指示部6から開始指示を与え
る。これにより、読取部1では、リンクバッファ5に格
納されたページ番号を読み出し、構造化された情報10
0からこのページ番号に対応したページを読み取り、読
み上げバッファ2に格納する。
用者は、当初、図2のような構造化された情報100の
うち、必要な部分のページ番号を例えばキーボードなど
によって入力指定する。このようにして入力指定された
ページ番号は、例えばリンクバッファ5に格納される。
次いで、使用者は、開始指示部6から開始指示を与え
る。これにより、読取部1では、リンクバッファ5に格
納されたページ番号を読み出し、構造化された情報10
0からこのページ番号に対応したページを読み取り、読
み上げバッファ2に格納する。
【0023】また、開始指示部6からの上記所定の指示
によって、音声合成部3は、読み上げバッファ2に格納
されたページの内容に対して音声合成処理を行なう。す
なわち、言語解析部11では、入力テキストに対する前
処理として、読み取ったページの内容に他ページへのリ
ンクを表わす記号“[](PAGE 21)”などがあるか否か
を調べ、これらがあるときには、これらを取り去り、こ
れの代わりに、例えば特殊な記号を挿入する。
によって、音声合成部3は、読み上げバッファ2に格納
されたページの内容に対して音声合成処理を行なう。す
なわち、言語解析部11では、入力テキストに対する前
処理として、読み取ったページの内容に他ページへのリ
ンクを表わす記号“[](PAGE 21)”などがあるか否か
を調べ、これらがあるときには、これらを取り去り、こ
れの代わりに、例えば特殊な記号を挿入する。
【0024】これにより、言語解析部11では、特殊な
記号を含んだ入力文字列を処理して発音記号列を生成す
るが、この場合、特殊な記号には読みの代わりにリンク
を表わす記述,例えば“〈P99〉”などを与えて、発音
記号列を生成する。なお、発音記号列を生成する際に、
言語解析部11は、このときのリンクの内容,例えばペ
ージ番号をリンクバッファ5に格納する。
記号を含んだ入力文字列を処理して発音記号列を生成す
るが、この場合、特殊な記号には読みの代わりにリンク
を表わす記述,例えば“〈P99〉”などを与えて、発音
記号列を生成する。なお、発音記号列を生成する際に、
言語解析部11は、このときのリンクの内容,例えばペ
ージ番号をリンクバッファ5に格納する。
【0025】また、波形生成部12では、発音記号列か
ら音声波形を生成し、出力部4から出力させるが、リン
クを表わす記述を処理する際には、これを合成音声で出
力する前に、所定の信号音,例えばビープ音を出力し
て、使用者の注意を喚起するようになっている。
ら音声波形を生成し、出力部4から出力させるが、リン
クを表わす記述を処理する際には、これを合成音声で出
力する前に、所定の信号音,例えばビープ音を出力し
て、使用者の注意を喚起するようになっている。
【0026】使用者は、上記出力部4からの使用者の注
意を喚起する所定の信号音,例えばビープ音を聞いて、
この関連する内容を聞きたいときには、開始指示部6か
ら所定の指示を与える。これにより、読取部1は、リン
クバッファ5に格納されたリンクの内容(例えばページ
番号)を読み出し、構造化された情報100からこのペ
ージ番号に対応した新しいページを取得して読み上げバ
ッファ2に書き込む。また、開始指示部6からの上記所
定の指示によって、音声合成部3は、読み上げバッファ
2の内容に対して音声合成処理を行なう。
意を喚起する所定の信号音,例えばビープ音を聞いて、
この関連する内容を聞きたいときには、開始指示部6か
ら所定の指示を与える。これにより、読取部1は、リン
クバッファ5に格納されたリンクの内容(例えばページ
番号)を読み出し、構造化された情報100からこのペ
ージ番号に対応した新しいページを取得して読み上げバ
ッファ2に書き込む。また、開始指示部6からの上記所
定の指示によって、音声合成部3は、読み上げバッファ
2の内容に対して音声合成処理を行なう。
【0027】このようにして、読取部1で読み取られた
構造化された情報中に関連する情報をもつ部分が記述さ
れている場合に、関連する情報をもつ部分を記憶手段
(リンクバッファ)5に記憶し、読取部1は、操作者から
の指示によって、記憶手段(リンクバッファ)5に記憶さ
れている関連する情報をもつ部分の情報の読み取りを行
ない、この場合、音声合成部3は、現在読み上げ中の情
報の音声合成処理を中断して、前記関連する情報につい
ての音声合成処理を開始する。
構造化された情報中に関連する情報をもつ部分が記述さ
れている場合に、関連する情報をもつ部分を記憶手段
(リンクバッファ)5に記憶し、読取部1は、操作者から
の指示によって、記憶手段(リンクバッファ)5に記憶さ
れている関連する情報をもつ部分の情報の読み取りを行
ない、この場合、音声合成部3は、現在読み上げ中の情
報の音声合成処理を中断して、前記関連する情報につい
ての音声合成処理を開始する。
【0028】図3は音声合成部3における音声合成処理
動作の具体例を説明するための図である。図3の例で
は、図2の構造化された情報100のうち、所定のペー
ジのテキストTXが入力したときに、言語解析部11で
は、このテキストTXを解析して、発音記号列VXに変
換し、波形生成部12では、これを音声波形信号WXに
変換する。この際、言語解析部11では、入力文に対す
る前処理として他ページへのリンクを表わす記号“[]
(PAGE 99)”などを取り去り、これの代わりに、例えば
特殊な記号を挿入する。具体的に、図3の例では、言語
解析部11は、入力テキスト中のリンクを表わす記号
を、2種類の特殊な記号に置き換える。すなわち、リン
ク範囲の始まりを表わす特殊記号とリンク範囲の終わり
を表わす特殊記号とに置き換える。
動作の具体例を説明するための図である。図3の例で
は、図2の構造化された情報100のうち、所定のペー
ジのテキストTXが入力したときに、言語解析部11で
は、このテキストTXを解析して、発音記号列VXに変
換し、波形生成部12では、これを音声波形信号WXに
変換する。この際、言語解析部11では、入力文に対す
る前処理として他ページへのリンクを表わす記号“[]
(PAGE 99)”などを取り去り、これの代わりに、例えば
特殊な記号を挿入する。具体的に、図3の例では、言語
解析部11は、入力テキスト中のリンクを表わす記号
を、2種類の特殊な記号に置き換える。すなわち、リン
ク範囲の始まりを表わす特殊記号とリンク範囲の終わり
を表わす特殊記号とに置き換える。
【0029】これにより、言語解析部11では、特殊な
記号を含んだ入力文字列を処理して発音記号列を生成す
るが、この場合、特殊な記号には読みの代わりにリンク
を表わす記述,例えば“〈P99〉”などを与えて、発音
記号列VXを生成する。
記号を含んだ入力文字列を処理して発音記号列を生成す
るが、この場合、特殊な記号には読みの代わりにリンク
を表わす記述,例えば“〈P99〉”などを与えて、発音
記号列VXを生成する。
【0030】次いで、波形生成部12では、発音記号列
VXから音声波形信号WXを生成し、出力部4から出力
させる。このように音声波形信号WXを生成するとき、
図3の例では、リンクを表わす記述に対して“BEE
P”を与え、ビープ音に変えて出力させる。
VXから音声波形信号WXを生成し、出力部4から出力
させる。このように音声波形信号WXを生成するとき、
図3の例では、リンクを表わす記述に対して“BEE
P”を与え、ビープ音に変えて出力させる。
【0031】なお、上述の例では、読み取られた構造化
された情報中に、関連する情報をもつ部分が記述されて
いる場合に、関連する情報をもつ部分については、音声
合成部3は、これを合成音声で出力する前に、所定の信
号音を出力するようにしているが、関連する情報をもつ
部分については、音声合成部3は、他の部分と音声の特
徴を変えて(例えば、ゆっくりとした読み方で)、合成音
声を出力して、使用者の注意を喚起することもできる。
された情報中に、関連する情報をもつ部分が記述されて
いる場合に、関連する情報をもつ部分については、音声
合成部3は、これを合成音声で出力する前に、所定の信
号音を出力するようにしているが、関連する情報をもつ
部分については、音声合成部3は、他の部分と音声の特
徴を変えて(例えば、ゆっくりとした読み方で)、合成音
声を出力して、使用者の注意を喚起することもできる。
【0032】図4は音声合成処理の他の例を示す図であ
る。具体的に、図4の例では、言語解析部11は、入力
テキストTX中のリンクを表わす記号を、リンク範囲の
始まりを表わす特殊記号とリンク範囲の終わりを表わす
特殊記号とに置き換えて発音記号列VXに変換する。
る。具体的に、図4の例では、言語解析部11は、入力
テキストTX中のリンクを表わす記号を、リンク範囲の
始まりを表わす特殊記号とリンク範囲の終わりを表わす
特殊記号とに置き換えて発音記号列VXに変換する。
【0033】より具体的に、図4の例では、言語解析部
11は、発音記号列を生成する際に、例えば、リンク範
囲の始まりを表わす特殊記号を、リンクの記述と特殊な
読み方(例えばゆっくり読む)との指定に置き換え、リン
ク範囲の終わりを表わす特殊記号を特殊な読み方の終了
(あるいは通常の読み方指定)に置き換える。これによっ
て、リンクの与えられた範囲の部分を他の部分とは異な
る特殊な読み方,例えば、ゆっくりとした読み方によっ
て使用者に伝えることができる。なお、この場合にも、
リンクの記述は、図3の場合と同様に、リンクバッファ
5に書き込まれる。
11は、発音記号列を生成する際に、例えば、リンク範
囲の始まりを表わす特殊記号を、リンクの記述と特殊な
読み方(例えばゆっくり読む)との指定に置き換え、リン
ク範囲の終わりを表わす特殊記号を特殊な読み方の終了
(あるいは通常の読み方指定)に置き換える。これによっ
て、リンクの与えられた範囲の部分を他の部分とは異な
る特殊な読み方,例えば、ゆっくりとした読み方によっ
て使用者に伝えることができる。なお、この場合にも、
リンクの記述は、図3の場合と同様に、リンクバッファ
5に書き込まれる。
【0034】また、上述の説明では、開始指示部6につ
いて明示しなかったが、開始指示部6としては、所定の
ボタン(ヘルプボタン)を用いることができる。この場
合、所定のボタンは、音声合成装置自体に設けられてい
ても良いが、音声合成装置自体には設けられておらず、
音声合成装置が適用される装置などに設けられていても
良い。
いて明示しなかったが、開始指示部6としては、所定の
ボタン(ヘルプボタン)を用いることができる。この場
合、所定のボタンは、音声合成装置自体に設けられてい
ても良いが、音声合成装置自体には設けられておらず、
音声合成装置が適用される装置などに設けられていても
良い。
【0035】図5は本発明の音声合成装置が適用された
(組み込まれた)ビデオ装置の外観図であり、このビデオ
装置には、ヘルプボタン61と音声出力用のスピーカ6
2と設けられている。このビデオ装置では、ヘルプボタ
ン61が操作されることで、音声合成装置の読取部1,
音声合成部3に開始信号を与えることができる。
(組み込まれた)ビデオ装置の外観図であり、このビデオ
装置には、ヘルプボタン61と音声出力用のスピーカ6
2と設けられている。このビデオ装置では、ヘルプボタ
ン61が操作されることで、音声合成装置の読取部1,
音声合成部3に開始信号を与えることができる。
【0036】また、開始指示部6としては、所定のボタ
ンを用いるかわりに、例えば図6に示すように、所定の
対象語を認識する音声認識部6を用いることもできる。
この場合、音声認識部6は、極く単純な機能をもつもの
で良く、特定の語,例えば「チェック」という語のみを
音声認識する機能があれば良い。この場合も、音声認識
部6は、音声合成装置自体に設けられていても良いが、
音声合成装置自体には設けられておらず、音声合成装置
が適用される装置などに設けられていても良い。
ンを用いるかわりに、例えば図6に示すように、所定の
対象語を認識する音声認識部6を用いることもできる。
この場合、音声認識部6は、極く単純な機能をもつもの
で良く、特定の語,例えば「チェック」という語のみを
音声認識する機能があれば良い。この場合も、音声認識
部6は、音声合成装置自体に設けられていても良いが、
音声合成装置自体には設けられておらず、音声合成装置
が適用される装置などに設けられていても良い。
【0037】図7は図6の音声合成装置が適用された
(組み込まれた)ビデオ装置の外観図であり、このビデオ
装置には、音声認識用の音声を入力させるためのマイク
63と音声出力用のスピーカ62と設けられている。こ
のビデオ装置では、操作者は、マイク63に特定の語を
発声することで、音声認識部6が対象語を認識し、音声
合成装置の読取部1,音声合成部3に開始信号を与える
ことができる。
(組み込まれた)ビデオ装置の外観図であり、このビデオ
装置には、音声認識用の音声を入力させるためのマイク
63と音声出力用のスピーカ62と設けられている。こ
のビデオ装置では、操作者は、マイク63に特定の語を
発声することで、音声認識部6が対象語を認識し、音声
合成装置の読取部1,音声合成部3に開始信号を与える
ことができる。
【0038】また、本発明では、構造化された情報10
0として、予め用意された機器等の操作マニュアル情報
などを音声合成処理の対象とすることもできるし、ある
いは、ネットワーク上に公開された構造化文書を音声合
成処理の対象とすることも可能である。
0として、予め用意された機器等の操作マニュアル情報
などを音声合成処理の対象とすることもできるし、ある
いは、ネットワーク上に公開された構造化文書を音声合
成処理の対象とすることも可能である。
【0039】図8は、音声合成処理の対象としてネット
ワーク(例えばインターネット)上の構造化情報(構造化
文書)を取り扱うことの可能な音声合成装置の構成例を
示す図である。図8の例では、図1の音声合成装置の読
取部1として、ネットワーク(例えばインターネット)の
構造化文書(例えばホームページ上のHTML文書デー
タ)を読み込むネットワーク文書読込部(例えば、ブラウ
ザ(閲覧ソフト))15と、ネットワーク文書読込部15
に読み込み指示を与える読込制御部16と、ネットワー
ク文書読込部15で読込んだネットワーク文書(例えば
HTML文書データ)を合成文章に変換する変換部(HT
ML→合成文章コンバータ)17とが設けられている。
ワーク(例えばインターネット)上の構造化情報(構造化
文書)を取り扱うことの可能な音声合成装置の構成例を
示す図である。図8の例では、図1の音声合成装置の読
取部1として、ネットワーク(例えばインターネット)の
構造化文書(例えばホームページ上のHTML文書デー
タ)を読み込むネットワーク文書読込部(例えば、ブラウ
ザ(閲覧ソフト))15と、ネットワーク文書読込部15
に読み込み指示を与える読込制御部16と、ネットワー
ク文書読込部15で読込んだネットワーク文書(例えば
HTML文書データ)を合成文章に変換する変換部(HT
ML→合成文章コンバータ)17とが設けられている。
【0040】ここで、ネットワークには、ネットワーク
文書読込部(例えばブラウザ)15を通して接続するよう
になっている。また、ネットワーク文書読込部(ブラウ
ザ)15から読み込まれた文書(ページ)の情報は、変換
部(HTML→合成文章コンバータ)17を通して読み上
げバッファ2に書き込まれるようになっている。
文書読込部(例えばブラウザ)15を通して接続するよう
になっている。また、ネットワーク文書読込部(ブラウ
ザ)15から読み込まれた文書(ページ)の情報は、変換
部(HTML→合成文章コンバータ)17を通して読み上
げバッファ2に書き込まれるようになっている。
【0041】図9はネットワーク上の構造化文書とし
て、インターネットのホームページ上のHTML文書デ
ータを音声合成処理の対象とする場合の例を示す図であ
る。図9を参照すると、HTML文書D1は、ブラウザ
15によって読み込まれた後、HTML→合成文章コン
バータ17によって音声合成用の文章D2に変換され
る。
て、インターネットのホームページ上のHTML文書デ
ータを音声合成処理の対象とする場合の例を示す図であ
る。図9を参照すると、HTML文書D1は、ブラウザ
15によって読み込まれた後、HTML→合成文章コン
バータ17によって音声合成用の文章D2に変換され
る。
【0042】HTML→合成文章コンバータ17は、動
作の一例として、例えば、読み込まれたHTML文書D
1の中から、「〈IMG SRC=“・・・”ALT=
“・・・”〉」と記述された部分に対し、ALTの記述
があれば、これを音声合成用の文章に変換して出力し、
ALTの記述がなければ、IMG SRCに記述された
ファイルを文字認識の対象とし、その結果の認識文字列
を音声合成用の文章として出力するようになっている。
すなわち、構造化された情報中のイメージデータに対し
て、文字認識を行ない、その結果の認識文字列をも音声
合成の対象とするようになっている。また、〈〉で囲ま
れていないテキスト部分はそのまま音声合成用の文章と
して出力するようになっている。
作の一例として、例えば、読み込まれたHTML文書D
1の中から、「〈IMG SRC=“・・・”ALT=
“・・・”〉」と記述された部分に対し、ALTの記述
があれば、これを音声合成用の文章に変換して出力し、
ALTの記述がなければ、IMG SRCに記述された
ファイルを文字認識の対象とし、その結果の認識文字列
を音声合成用の文章として出力するようになっている。
すなわち、構造化された情報中のイメージデータに対し
て、文字認識を行ない、その結果の認識文字列をも音声
合成の対象とするようになっている。また、〈〉で囲ま
れていないテキスト部分はそのまま音声合成用の文章と
して出力するようになっている。
【0043】このようにして出力された音声合成用の文
章D2において、“〈A HREF=“・・・”〉〜
〈/A〉で囲まれている部分があれば、この部分には他
のページへのリンクが存在するので、そのリンク情報も
出力する。このようにして、HTML→合成文章コンバ
ータ17は、HTML文書データD1を、図4で音声合
成部の入力文書として用いたものと内容は違うが書式と
しては同じ形式の文書D1に最終的に変換して、読み上
げバッファ2に格納する。
章D2において、“〈A HREF=“・・・”〉〜
〈/A〉で囲まれている部分があれば、この部分には他
のページへのリンクが存在するので、そのリンク情報も
出力する。このようにして、HTML→合成文章コンバ
ータ17は、HTML文書データD1を、図4で音声合
成部の入力文書として用いたものと内容は違うが書式と
しては同じ形式の文書D1に最終的に変換して、読み上
げバッファ2に格納する。
【0044】そして、文書D1が読み上げバッファ2に
格納された後の処理動作は、図3あるいは図4と同様に
して行なわれる。このようにして、音声合成処理の対象
としてネットワーク(例えばインターネット)上の構造化
情報(構造化文書)を取り扱うことが可能となる。
格納された後の処理動作は、図3あるいは図4と同様に
して行なわれる。このようにして、音声合成処理の対象
としてネットワーク(例えばインターネット)上の構造化
情報(構造化文書)を取り扱うことが可能となる。
【0045】また、本発明の音声合成装置において、該
音声合成装置は、構造化された情報の各部分について、
読み上げた回数を記録する機能をさらに有し、合成音声
を出力する際に、読み上げ回数に応じて合成音声の出力
順序を変えて出力する機能をさらに有していても良い。
具体的には、この音声合成装置に、図10に示すよう
に、構造化された情報100の各ページについて、これ
を読み込んだ回数を記録するための領域(図ではCOUNTで
示された領域)と、マニュアルのリンク情報を入れ替え
ても良いか否かを表わすフラグ(図ではSORT OKで示され
たフラグ)とをもたせて、管理を行なうこともできる。
この場合、あるページがリンク入れ替え可能である場
合、それぞれのリンク先のページの読み込まれた回数が
参照され、回数の多いリンクが先になるように並べ替え
ることができる。
音声合成装置は、構造化された情報の各部分について、
読み上げた回数を記録する機能をさらに有し、合成音声
を出力する際に、読み上げ回数に応じて合成音声の出力
順序を変えて出力する機能をさらに有していても良い。
具体的には、この音声合成装置に、図10に示すよう
に、構造化された情報100の各ページについて、これ
を読み込んだ回数を記録するための領域(図ではCOUNTで
示された領域)と、マニュアルのリンク情報を入れ替え
ても良いか否かを表わすフラグ(図ではSORT OKで示され
たフラグ)とをもたせて、管理を行なうこともできる。
この場合、あるページがリンク入れ替え可能である場
合、それぞれのリンク先のページの読み込まれた回数が
参照され、回数の多いリンクが先になるように並べ替え
ることができる。
【0046】このように、本発明では、大量の情報を音
声として人間に提供する必要がある場面全般に適用可能
であるが、特にディスプレイ出力をもたない機器のガイ
ダンスに有効である。また、近年、盛んになってきたW
WW(ワールドワイドウェブ)などのネットワーク上に公
開された構造化文書をディスプレイ出力を利用せずに扱
う際、非常に有効である。
声として人間に提供する必要がある場面全般に適用可能
であるが、特にディスプレイ出力をもたない機器のガイ
ダンスに有効である。また、近年、盛んになってきたW
WW(ワールドワイドウェブ)などのネットワーク上に公
開された構造化文書をディスプレイ出力を利用せずに扱
う際、非常に有効である。
【0047】図11は図1,図6あるいは図8の音声合
成装置のハードウェア構成例を示す図である。図11を
参照すると、この音声合成装置は、例えばパーソナルコ
ンピュータ等で実現され、全体を制御するCPU21
と、CPU21の制御プログラム等が記憶されているR
OM22と、CPU21のワークエリア等として使用さ
れるRAM23と、操作部24と、合成音声を出力する
出力装置(例えば、スピーカ)26とを有している。
成装置のハードウェア構成例を示す図である。図11を
参照すると、この音声合成装置は、例えばパーソナルコ
ンピュータ等で実現され、全体を制御するCPU21
と、CPU21の制御プログラム等が記憶されているR
OM22と、CPU21のワークエリア等として使用さ
れるRAM23と、操作部24と、合成音声を出力する
出力装置(例えば、スピーカ)26とを有している。
【0048】ここで、操作部24,出力装置26は、例
えば図1,図8の開始指示部6,出力部4にそれぞれ対
応している。また、RAM23には、図1,図6,図8
の読み上げバッファ2,リンクバッファ5としての機能
をもたせることができる。また、CPU21は、例えば
図1,図6の読取部1,音声合成部3の機能、図8のネ
ットワーク文書読込部15,読込制御部16,変換部1
7,音声合成部3の機能を有している。
えば図1,図8の開始指示部6,出力部4にそれぞれ対
応している。また、RAM23には、図1,図6,図8
の読み上げバッファ2,リンクバッファ5としての機能
をもたせることができる。また、CPU21は、例えば
図1,図6の読取部1,音声合成部3の機能、図8のネ
ットワーク文書読込部15,読込制御部16,変換部1
7,音声合成部3の機能を有している。
【0049】なお、CPU21におけるこれらの機能
は、例えばソフトウェアパッケージ(具体的には、CD
−ROM等の情報記録媒体)の形で提供することがで
き、このため、図11の例では、情報記録媒体30がセ
ットさせるとき、これを駆動する媒体駆動装置31が設
けられている。
は、例えばソフトウェアパッケージ(具体的には、CD
−ROM等の情報記録媒体)の形で提供することがで
き、このため、図11の例では、情報記録媒体30がセ
ットさせるとき、これを駆動する媒体駆動装置31が設
けられている。
【0050】換言すれば、本発明の音声合成装置は、汎
用の計算機システムにCD−ROM等の情報記録媒体に
記録されたプログラムを読み込ませて、この汎用計算機
システムのマイクロプロセッサに音声合成処理を実行さ
せる装置構成においても実施することが可能である。こ
の場合、本発明の音声合成処理を実行するためのプログ
ラム(すなわち、ハードウェアシステムで用いられるプ
ログラム)は、媒体に記録された状態で提供される。プ
ログラムなどが記録される情報記録媒体としては、CD
−ROMに限られるものではなく、ROM,RAM,フ
レキシブルディスク,メモリカード等が用いられても良
い。媒体に記録されたプログラムは、ハードウェアシス
テムに組み込まれている記憶装置、例えばハードディス
ク装置にインストールされることにより、このプログラ
ムを実行して、上述した各機能を実現する音声合成装置
の構築に寄与する。
用の計算機システムにCD−ROM等の情報記録媒体に
記録されたプログラムを読み込ませて、この汎用計算機
システムのマイクロプロセッサに音声合成処理を実行さ
せる装置構成においても実施することが可能である。こ
の場合、本発明の音声合成処理を実行するためのプログ
ラム(すなわち、ハードウェアシステムで用いられるプ
ログラム)は、媒体に記録された状態で提供される。プ
ログラムなどが記録される情報記録媒体としては、CD
−ROMに限られるものではなく、ROM,RAM,フ
レキシブルディスク,メモリカード等が用いられても良
い。媒体に記録されたプログラムは、ハードウェアシス
テムに組み込まれている記憶装置、例えばハードディス
ク装置にインストールされることにより、このプログラ
ムを実行して、上述した各機能を実現する音声合成装置
の構築に寄与する。
【0051】また、本発明の上述した各機能を実現する
ためのプログラムは、媒体の形で提供されるのみなら
ず、通信によって(例えばサーバによって)提供されるも
のであっても良い。
ためのプログラムは、媒体の形で提供されるのみなら
ず、通信によって(例えばサーバによって)提供されるも
のであっても良い。
【0052】
【発明の効果】以上に説明したように、請求項1記載の
発明によれば、構造化された情報を操作者の指示によっ
て読み取る読取手段と、読取手段で読み取った構造化さ
れた情報を音声合成処理の対象とし、読み取られた構造
化された情報を音声合成し、合成音声を出力する音声合
成手段とを備えており、操作者の指示によって、構造化
された情報の一部を合成音声で出力するようになってい
るので、大量の文章の中から必要な部分だけを音声で得
ることが可能になり、ディスプレイを用いずとも、構造
化された情報を使用者にとってわかりやすい仕方で提示
することが可能であって、使用者が音声の利点を生かし
た形で情報を取得することが可能となる。特に、ディス
プレイを標準でもたない小型の端末での利用、また視覚
障害者の利用を考えるとき、この効果は大きい。
発明によれば、構造化された情報を操作者の指示によっ
て読み取る読取手段と、読取手段で読み取った構造化さ
れた情報を音声合成処理の対象とし、読み取られた構造
化された情報を音声合成し、合成音声を出力する音声合
成手段とを備えており、操作者の指示によって、構造化
された情報の一部を合成音声で出力するようになってい
るので、大量の文章の中から必要な部分だけを音声で得
ることが可能になり、ディスプレイを用いずとも、構造
化された情報を使用者にとってわかりやすい仕方で提示
することが可能であって、使用者が音声の利点を生かし
た形で情報を取得することが可能となる。特に、ディス
プレイを標準でもたない小型の端末での利用、また視覚
障害者の利用を考えるとき、この効果は大きい。
【0053】また、請求項2記載の発明によれば、請求
項1記載の音声合成装置において、前記構造化された情
報として、予め用意された機器等の操作マニュアル情報
を音声合成処理の対象としており、これにより、特に記
述が大規模になりがちな操作マニュアル情報について
も、必要な情報をすばやく入手できるようになる。ま
た、このような操作マニュアル情報は、従来、装置本体
とは別の冊子形式であったため、紛失の危険が常に伴っ
ていたが、機器組み込みのマニュアルにすることによ
り、紛失の危険がなくなる。
項1記載の音声合成装置において、前記構造化された情
報として、予め用意された機器等の操作マニュアル情報
を音声合成処理の対象としており、これにより、特に記
述が大規模になりがちな操作マニュアル情報について
も、必要な情報をすばやく入手できるようになる。ま
た、このような操作マニュアル情報は、従来、装置本体
とは別の冊子形式であったため、紛失の危険が常に伴っ
ていたが、機器組み込みのマニュアルにすることによ
り、紛失の危険がなくなる。
【0054】また、請求項3記載の発明によれば、請求
項1記載の音声合成装置において、前記構造化された情
報として、ネットワーク上に公開された構造化文書を音
声合成処理の対象としており、従って、例えばホームペ
ージ上のHTML文書を、音声で読み上げることができ
る。
項1記載の音声合成装置において、前記構造化された情
報として、ネットワーク上に公開された構造化文書を音
声合成処理の対象としており、従って、例えばホームペ
ージ上のHTML文書を、音声で読み上げることができ
る。
【0055】また、請求項4記載の発明によれば、請求
項1記載の音声合成装置において、前記読取手段で読み
取られた構造化された情報中に、関連する情報をもつ部
分が記述されている場合に、関連する情報をもつ部分に
ついては、前記音声合成手段は、これを合成音声で出力
する前に、所定の信号音を出力するので、関連する情報
をもつ部分について、その部分を音声出力する前に、そ
の存在を信号音によって使用者に知らせることができ
る。
項1記載の音声合成装置において、前記読取手段で読み
取られた構造化された情報中に、関連する情報をもつ部
分が記述されている場合に、関連する情報をもつ部分に
ついては、前記音声合成手段は、これを合成音声で出力
する前に、所定の信号音を出力するので、関連する情報
をもつ部分について、その部分を音声出力する前に、そ
の存在を信号音によって使用者に知らせることができ
る。
【0056】また、請求項5記載の発明によれば、請求
項1記載の音声合成装置において、前記読取手段で読み
取られた構造化された情報中に、関連する情報をもつ部
分が記述されている場合に、関連する情報をもつ部分に
ついては、音声合成手段は、他の部分と音声の特徴を変
えて出力するので、関連する情報をもつ部分について、
音声の特徴を変えて使用者に知らせることができる。
項1記載の音声合成装置において、前記読取手段で読み
取られた構造化された情報中に、関連する情報をもつ部
分が記述されている場合に、関連する情報をもつ部分に
ついては、音声合成手段は、他の部分と音声の特徴を変
えて出力するので、関連する情報をもつ部分について、
音声の特徴を変えて使用者に知らせることができる。
【0057】また、請求項6,請求項7記載の発明によ
れば、請求項1記載の音声合成装置において、前記読取
手段で読み取られた構造化された情報中に関連する情報
をもつ部分が記述されている場合に、関連する情報をも
つ部分を記憶する記憶手段をさらに有し、前記読取手段
は、操作者からの指示によって、前記記憶手段に記憶さ
れている関連する情報をもつ部分の情報の読み取りを行
ない、この場合、前記音声合成手段は、現在読み上げ中
の情報の音声合成処理を中断して、前記関連する情報に
ついての音声合成処理を開始するので、構造化した情報
のうち、使用者の必要な情報を、簡単で確実な操作によ
って、音声で出力させることができる。
れば、請求項1記載の音声合成装置において、前記読取
手段で読み取られた構造化された情報中に関連する情報
をもつ部分が記述されている場合に、関連する情報をも
つ部分を記憶する記憶手段をさらに有し、前記読取手段
は、操作者からの指示によって、前記記憶手段に記憶さ
れている関連する情報をもつ部分の情報の読み取りを行
ない、この場合、前記音声合成手段は、現在読み上げ中
の情報の音声合成処理を中断して、前記関連する情報に
ついての音声合成処理を開始するので、構造化した情報
のうち、使用者の必要な情報を、簡単で確実な操作によ
って、音声で出力させることができる。
【0058】また、請求項8記載の発明によれば、請求
項1記載の音声合成装置において、該音声合成装置は、
構造化された情報の各部分について、読み上げた回数を
記録する機能をさらに有し、合成音声を出力する際に、
読み上げ回数に応じて合成音声の出力順序を変えて出力
するので、頻繁に参照される情報を、より早く取り出
し、これを音声出力させることが可能になる。
項1記載の音声合成装置において、該音声合成装置は、
構造化された情報の各部分について、読み上げた回数を
記録する機能をさらに有し、合成音声を出力する際に、
読み上げ回数に応じて合成音声の出力順序を変えて出力
するので、頻繁に参照される情報を、より早く取り出
し、これを音声出力させることが可能になる。
【0059】また、請求項9記載の発明によれば、請求
項3記載の音声合成装置において、構造化された情報中
のイメージデータに対して、文字認識を行ない、その結
果の認識文字列をも音声合成の対象とするので、音声合
成されることを想定していない一般のネットワーク上の
構造化文書から、多くの情報を音声で出力させることが
できる。
項3記載の音声合成装置において、構造化された情報中
のイメージデータに対して、文字認識を行ない、その結
果の認識文字列をも音声合成の対象とするので、音声合
成されることを想定していない一般のネットワーク上の
構造化文書から、多くの情報を音声で出力させることが
できる。
【図1】本発明に係る音声合成装置の構成例を示す図で
ある。
ある。
【図2】構造化された情報の一例を示す図である。
【図3】図1の音声合成装置の音声合成処理動作の具体
例を説明するための図である。
例を説明するための図である。
【図4】図1の音声合成装置の音声合成処理動作の他の
具体例を説明するための図である。
具体例を説明するための図である。
【図5】図1の音声合成装置が適用されたビデオ装置の
外観を示す図である。
外観を示す図である。
【図6】図1の音声合成装置の具体例を示す図である。
【図7】図6の音声合成装置が適用されたビデオ装置の
外観を示す図である。
外観を示す図である。
【図8】図1の音声合成装置の他の具体例を示す図であ
る。
る。
【図9】ネットワーク上の構造化文書として、インター
ネットのホームページ上のHTML文書データを音声合
成処理の対象とする場合の例を示す図である。
ネットのホームページ上のHTML文書データを音声合
成処理の対象とする場合の例を示す図である。
【図10】図1の音声合成装置の音声合成処理動作の具
体例を説明するための図である。
体例を説明するための図である。
【図11】図1,図6あるいは図8の音声合成装置のハ
ードウェア構成例を示す図である。
ードウェア構成例を示す図である。
1 読取部 2 読み上げバッファ 3 音声合成部 4 出力部 5 リンクバッファ 6 開始指示部 11 言語解析部 12 波形生成部 61 ヘルプボタン 62 スピーカ 63 マイク 15 ネットワーク文書読込部 16 読込制御部 17 変換部 100 構造化された情報
Claims (9)
- 【請求項1】 構造化された情報を操作者の指示によっ
て読み取る読取手段と、読取手段で読み取った構造化さ
れた情報を音声合成処理の対象とし、読み取られた構造
化された情報を音声合成し、合成音声を出力する音声合
成手段とを備えていることを特徴とする音声合成装置。 - 【請求項2】 請求項1記載の音声合成装置において、
前記構造化された情報として、予め用意された機器等の
操作マニュアル情報を音声合成処理の対象とすることを
特徴とする音声合成装置。 - 【請求項3】 請求項1記載の音声合成装置において、
前記構造化された情報として、ネットワーク上に公開さ
れた構造化文書を音声合成処理の対象とすることを特徴
とする音声合成装置。 - 【請求項4】 請求項1記載の音声合成装置において、
前記読取手段で読み取った構造化された情報中に、関連
する情報をもつ部分が記述されている場合に、関連する
情報をもつ部分については、前記音声合成手段は、これ
を合成音声で出力する前に、所定の信号音を出力するこ
とを特徴とする音声合成装置。 - 【請求項5】 請求項1記載の音声合成装置において、
前記読取手段で読み取った構造化された情報中に、関連
する情報をもつ部分が記述されている場合に、関連する
情報をもつ部分については、音声合成手段は、他の部分
と音声の特徴を変えて出力することを特徴とする音声合
成装置。 - 【請求項6】 請求項1記載の音声合成装置において、
前記読取手段で読み取った構造化された情報中に関連す
る情報をもつ部分が記述されている場合に、関連する情
報をもつ部分を記憶する記憶手段をさらに有し、前記読
取手段は、操作者からの指示によって、前記記憶手段に
記憶されている関連する情報をもつ部分の情報の読み取
りを行ない、この場合、前記音声合成手段は、現在読み
上げ中の情報の音声合成処理を中断して、前記関連する
情報についての音声合成処理を開始することを特徴とす
る音声合成装置。 - 【請求項7】 請求項6記載の音声合成装置において、
前記操作者からの指示は、所定のボタンをボタン操作さ
せることによってなされるか、または、所定の単語を発
声させてこれを音声認識することによってなされること
を特徴とする音声合成装置。 - 【請求項8】 請求項1記載の音声合成装置において、
該音声合成装置は、構造化された情報の各部分につい
て、読み上げた回数を記録する機能をさらに有し、合成
音声を出力する際に、読み上げ回数に応じて合成音声の
出力順序を変えて出力することを特徴とする音声合成装
置。 - 【請求項9】 請求項3記載の音声合成装置において、
構造化された情報中にイメージデータが存在する場合、
該イメージデータに対して、文字認識を行ない、その結
果の認識文字列をも音声合成の対象とすることを特徴と
する音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8322240A JPH10149195A (ja) | 1996-11-18 | 1996-11-18 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8322240A JPH10149195A (ja) | 1996-11-18 | 1996-11-18 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10149195A true JPH10149195A (ja) | 1998-06-02 |
Family
ID=18141488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8322240A Pending JPH10149195A (ja) | 1996-11-18 | 1996-11-18 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10149195A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001061941A1 (fr) * | 2000-02-21 | 2001-08-23 | Ntt Docomo, Inc. | Procede, systeme et serveur de diffusion de l'information, systeme de reseau de communications mobile et service de communication permettant de mettre ledit procede en oeuvre |
-
1996
- 1996-11-18 JP JP8322240A patent/JPH10149195A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001061941A1 (fr) * | 2000-02-21 | 2001-08-23 | Ntt Docomo, Inc. | Procede, systeme et serveur de diffusion de l'information, systeme de reseau de communications mobile et service de communication permettant de mettre ledit procede en oeuvre |
KR100425378B1 (ko) * | 2000-02-21 | 2004-04-01 | 가부시키가이샤 엔.티.티.도코모 | 정보 분배 방법, 정보 분배 시스템, 정보 분배 서버, 이동통신망 시스템 및 통신 서비스 제공 방법 |
CN1311667C (zh) * | 2000-02-21 | 2007-04-18 | 株式会社Ntt都科摩 | 信息分配方法和信息分配系统 |
US7346042B2 (en) | 2000-02-21 | 2008-03-18 | Ntt Docomo, Inc. | Information distributing method, information distributing system, information distributing server, mobile communication network system and communication service providing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5572625A (en) | Method for generating audio renderings of digitized works having highly technical content | |
AU2004200684A1 (en) | Presentation of data based on user input | |
WO1999060474A1 (fr) | Dispositif de lecture a haute voix, procede de commande de lecture a haute voix et support d'enregistrement | |
JP2003295882A (ja) | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム | |
KR101015149B1 (ko) | 말하는 전자책 | |
JPH10124293A (ja) | 音声指令可能なコンピュータとそれ用の媒体 | |
Amoli et al. | Chromium Navigator Extension: Voice-Activated Assist for Disabled | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JPH10149195A (ja) | 音声合成装置 | |
KR20000030906A (ko) | 음성 인식과 음성 합성을 이용한 컴퓨터에서의 명령 실행방법 및 어플리케이션 프로그램에서의 선택된 텍스트를음성으로 변환하여 출력하기 위한 방법 | |
JPH10274999A (ja) | 文書読み上げ装置 | |
Godwin-Jones | Speech technologies for language learning | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP3467764B2 (ja) | 音声合成装置 | |
JP3916947B2 (ja) | 音声認識機能付き表示装置 | |
KR20020048357A (ko) | 오디오 플레이어에서의 텍스트/음성 변환 및 자동 음성인식 구현 방법 및 장치 | |
JP2009086597A (ja) | テキスト音声変換サービスシステム及び方法 | |
JP2000214874A (ja) | 音声合成装置及びその方法、コンピュ―タ可読メモリ | |
CN1243284A (zh) | 将超媒体文件转换为语音的方法 | |
Soni et al. | Text Summarization and Multilingual Text to Audio Translation using Deep Learning Models | |
Narayanaswami et al. | An online prototype speech-enabled information access tool using Java Speech Application Programming Interface | |
KR20010017323A (ko) | 어학 학습 기능을 갖는 웹 브라이징 장치 및 방법 | |
JPS58154900A (ja) | 文章音声変換装置 | |
JP2003196306A (ja) | 画像検索装置及びその方法、プログラム | |
JP2002175176A (ja) | 情報提示装置および提示方法 |