JP2002132282A - 電子テキスト読み上げ装置 - Google Patents
電子テキスト読み上げ装置Info
- Publication number
- JP2002132282A JP2002132282A JP2000320134A JP2000320134A JP2002132282A JP 2002132282 A JP2002132282 A JP 2002132282A JP 2000320134 A JP2000320134 A JP 2000320134A JP 2000320134 A JP2000320134 A JP 2000320134A JP 2002132282 A JP2002132282 A JP 2002132282A
- Authority
- JP
- Japan
- Prior art keywords
- control code
- text
- unit
- electronic text
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003780 insertion Methods 0.000 claims abstract description 43
- 230000037431 insertion Effects 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 34
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 33
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 33
- 230000008859 change Effects 0.000 claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 29
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 58
- 230000000694 effects Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 7
- 230000008520 organization Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 244000241872 Lycium chinense Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Abstract
(57)【要約】
【課題】 テキスト中の空行や記号行の意図を違和感無
く利用者に伝えることのできる電子テキスト読み上げ装
置を実現する。 【解決手段】 空行/記号行抽出部101は、テキスト
中から空行や記号行を抽出する。対応表104には予め
空行や記号行に対応した制御コードが記憶されている。
制御コード挿入部102は、対応表104を参照して、
空行/記号行抽出部101で抽出された空行や記号行に
対して制御コードを付与する。音声合成部103は、制
御コード挿入部102で付与された制御コードに基づ
き、その位置での読み上げ方の変更や特殊音の発声の一
方または両方を行う。
く利用者に伝えることのできる電子テキスト読み上げ装
置を実現する。 【解決手段】 空行/記号行抽出部101は、テキスト
中から空行や記号行を抽出する。対応表104には予め
空行や記号行に対応した制御コードが記憶されている。
制御コード挿入部102は、対応表104を参照して、
空行/記号行抽出部101で抽出された空行や記号行に
対して制御コードを付与する。音声合成部103は、制
御コード挿入部102で付与された制御コードに基づ
き、その位置での読み上げ方の変更や特殊音の発声の一
方または両方を行う。
Description
【0001】
【発明の属する技術分野】本発明は、テキストを音声合
成により読み上げる電子テキスト読み上げ装置に関す
る。
成により読み上げる電子テキスト読み上げ装置に関す
る。
【0002】
【従来の技術】従来より、表示用のテキストを音声合成
で読み上げ、音声情報として出力するシステムが存在す
る。例えば、このようなシステムとして、特開平5−2
60082号公報に開示されているように、電子メール
のテキストを読み上げる場合、電子メールの送信元に応
じて声質を変化させるといったものがあった。また、特
開平7−203392号公報に記載されているように、
文字放送の文字データを音声合成によって読み上げる技
術があった。
で読み上げ、音声情報として出力するシステムが存在す
る。例えば、このようなシステムとして、特開平5−2
60082号公報に開示されているように、電子メール
のテキストを読み上げる場合、電子メールの送信元に応
じて声質を変化させるといったものがあった。また、特
開平7−203392号公報に記載されているように、
文字放送の文字データを音声合成によって読み上げる技
術があった。
【0003】また、特開平10−133853号公報に
開示されているように、電子メールから読み上げ不要な
部分を削除し、分かり易い表現に書き換えてから読み上
げを行うものがあった。更に、特開平7−200554
号公報に開示されているように、記号などの特殊文字が
存在した場合は、その記号の種類に応じて効果音で表現
する技術があった。また、特開平11−305987号
公報に開示されているように、URLなどの英語文字列
を英語仮名変換により仮名に変換して読み上げを行う技
術があった。
開示されているように、電子メールから読み上げ不要な
部分を削除し、分かり易い表現に書き換えてから読み上
げを行うものがあった。更に、特開平7−200554
号公報に開示されているように、記号などの特殊文字が
存在した場合は、その記号の種類に応じて効果音で表現
する技術があった。また、特開平11−305987号
公報に開示されているように、URLなどの英語文字列
を英語仮名変換により仮名に変換して読み上げを行う技
術があった。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
ような従来の技術は以下のような問題があった。 [問題点1]特開平10−133853号公報に開示さ
れて技術では、空行があった場合その空行を削除するこ
とによって聞き易い音声合成を可能にしている。しかし
ながら、書き手は段落の終わりや話題の変化を意図して
空行を挿入していることが多いにもかかわらず、この情
報が欠落してしまうという問題があった。音声情報を聞
く側にとっても話題が突然変わるようなことがあると内
容理解の妨げになるので、この問題は重要である。ま
た、特開平7−200554号公報に開示されている技
術では、記号を効果音で表すが、後述する図7に示すよ
うに“−”などの記号を多く並べることによって話題の
変化を表す場合がある。この場合、効果音を連続して何
度もならすことになり、読み上げを聞く利用者にとって
負担であった。
ような従来の技術は以下のような問題があった。 [問題点1]特開平10−133853号公報に開示さ
れて技術では、空行があった場合その空行を削除するこ
とによって聞き易い音声合成を可能にしている。しかし
ながら、書き手は段落の終わりや話題の変化を意図して
空行を挿入していることが多いにもかかわらず、この情
報が欠落してしまうという問題があった。音声情報を聞
く側にとっても話題が突然変わるようなことがあると内
容理解の妨げになるので、この問題は重要である。ま
た、特開平7−200554号公報に開示されている技
術では、記号を効果音で表すが、後述する図7に示すよ
うに“−”などの記号を多く並べることによって話題の
変化を表す場合がある。この場合、効果音を連続して何
度もならすことになり、読み上げを聞く利用者にとって
負担であった。
【0005】[問題点2]特開平11−305987号
公報に開示されている技術では、英語仮名変換によりU
RLなどの英語文字列を読み上げるようにしている。し
かしながら、読み上げ内容を聞き取って再度計算機に入
力する場合には、これらの文字列は正確でなければなら
ないにもかかわらず、英語仮名変換は“ji”と“z
i”を共に「じ」と読み上げるなど、正確な文字列とし
て表現することは不可能な場合があり、却って利用者が
混乱する原因にもなっていた。また、読み上げ内容を聞
き取って再度計算機に入力しない場合には、URLなど
の文字列は特に重要ではないので、利用者にとって興味
のない文字列の読み上げを聞くことは時間の無駄であ
り、また、負担でもあった。
公報に開示されている技術では、英語仮名変換によりU
RLなどの英語文字列を読み上げるようにしている。し
かしながら、読み上げ内容を聞き取って再度計算機に入
力する場合には、これらの文字列は正確でなければなら
ないにもかかわらず、英語仮名変換は“ji”と“z
i”を共に「じ」と読み上げるなど、正確な文字列とし
て表現することは不可能な場合があり、却って利用者が
混乱する原因にもなっていた。また、読み上げ内容を聞
き取って再度計算機に入力しない場合には、URLなど
の文字列は特に重要ではないので、利用者にとって興味
のない文字列の読み上げを聞くことは時間の無駄であ
り、また、負担でもあった。
【0006】[問題点3]音声情報は重要な部分を聞き
漏らすともう一度その部分を聞き直す必要がある。しか
しながら、聞き直すにはそのための手順が必要であり、
これが利用者に負担となっていた。
漏らすともう一度その部分を聞き直す必要がある。しか
しながら、聞き直すにはそのための手順が必要であり、
これが利用者に負担となっていた。
【0007】[問題点4]音声情報では、読みだけでは
どのような漢字で書かれているのか分からない場合があ
る。特に、機械が漢字の読み方を間違えた場合には本来
の意味が聞き手になかなか伝わらないという問題があっ
た。
どのような漢字で書かれているのか分からない場合があ
る。特に、機械が漢字の読み方を間違えた場合には本来
の意味が聞き手になかなか伝わらないという問題があっ
た。
【0008】
【課題を解決するための手段】本発明は、前述の課題を
解決するため次の構成を採用する。 〈構成1〉テキスト中から空行または記号行のうち少な
くとも一方を抽出する空行/記号行抽出部と、空行/記
号行抽出部で抽出した空行または記号行に対して予め設
定された制御コードを付与する制御コード挿入部と、制
御コード挿入部で付与された制御コードに基づき、その
位置での読み上げ方の変更または特殊音の発声の少なく
とも一方を行う音声合成部とを備えたことを特徴とする
電子テキスト読み上げ装置。
解決するため次の構成を採用する。 〈構成1〉テキスト中から空行または記号行のうち少な
くとも一方を抽出する空行/記号行抽出部と、空行/記
号行抽出部で抽出した空行または記号行に対して予め設
定された制御コードを付与する制御コード挿入部と、制
御コード挿入部で付与された制御コードに基づき、その
位置での読み上げ方の変更または特殊音の発声の少なく
とも一方を行う音声合成部とを備えたことを特徴とする
電子テキスト読み上げ装置。
【0009】〈構成2〉構成1に記載の電子テキスト読
み上げ装置において、記号行の抽出する基準として、行
全体の文字数と行中の記号が占める割合を利用する空行
/記号行抽出部を備えたことを特徴とする電子テキスト
読み上げ装置。
み上げ装置において、記号行の抽出する基準として、行
全体の文字数と行中の記号が占める割合を利用する空行
/記号行抽出部を備えたことを特徴とする電子テキスト
読み上げ装置。
【0010】〈構成3〉構成1または2に記載の電子テ
キスト読み上げ装置において、音声合成部は、記号行中
に存在する記号以外の文字を読み上げるよう構成された
ことを特徴とする電子テキスト読み上げ装置。
キスト読み上げ装置において、音声合成部は、記号行中
に存在する記号以外の文字を読み上げるよう構成された
ことを特徴とする電子テキスト読み上げ装置。
【0011】〈構成4〉構成1〜3のいずれかに記載の
電子テキスト読み上げ装置において、テキスト中から計
算機が直接理解する特殊文字列を抽出する特殊文字列抽
出部と、特殊文字列抽出部で抽出した特殊文字列に対し
て予め設定された制御コードを付与する制御コード挿入
部と、制御コード挿入部で付与された制御コードに基づ
き、特殊文字列の種類に応じた特殊音を発声する音声合
成部とを備えたことを特徴とする電子テキスト読み上げ
装置。
電子テキスト読み上げ装置において、テキスト中から計
算機が直接理解する特殊文字列を抽出する特殊文字列抽
出部と、特殊文字列抽出部で抽出した特殊文字列に対し
て予め設定された制御コードを付与する制御コード挿入
部と、制御コード挿入部で付与された制御コードに基づ
き、特殊文字列の種類に応じた特殊音を発声する音声合
成部とを備えたことを特徴とする電子テキスト読み上げ
装置。
【0012】〈構成5〉構成1〜4のいずれかに記載の
電子テキスト読み上げ装置において、テキスト中から重
要部分を抽出する要約処理部と、要約処理部で抽出した
重要部分に対して予め設定された制御コードを付与する
制御コード挿入部と、制御コード挿入部で付与された制
御コードに基づき、重要部分に応じた特殊音の発声また
は読み上げ方の変更のうち少なくとも一方を行う音声合
成部とを備えたことを特徴とする電子テキスト読み上げ
装置。
電子テキスト読み上げ装置において、テキスト中から重
要部分を抽出する要約処理部と、要約処理部で抽出した
重要部分に対して予め設定された制御コードを付与する
制御コード挿入部と、制御コード挿入部で付与された制
御コードに基づき、重要部分に応じた特殊音の発声また
は読み上げ方の変更のうち少なくとも一方を行う音声合
成部とを備えたことを特徴とする電子テキスト読み上げ
装置。
【0013】〈構成6〉構成5に記載の電子テキスト読
み上げ装置において、音声合成部は、重要部分を繰り返
し読み上げるよう構成されたことを特徴とする電子テキ
スト読み上げ装置。
み上げ装置において、音声合成部は、重要部分を繰り返
し読み上げるよう構成されたことを特徴とする電子テキ
スト読み上げ装置。
【0014】〈構成7〉構成1〜6のいずれかに記載の
電子テキスト読み上げ装置において、テキスト中から固
有名詞を抽出する固有名詞抽出部と、固有名詞抽出部で
抽出した固有名詞の位置に対して予め設定された制御コ
ードを付与する制御コード挿入部と、制御コード挿入部
で付与された制御コードに基づき、固有名詞に応じた特
殊音の発声または読み上げ方の変更のうち少なくとも一
方を行う音声合成部とを備えたことを特徴とする電子テ
キスト読み上げ装置。
電子テキスト読み上げ装置において、テキスト中から固
有名詞を抽出する固有名詞抽出部と、固有名詞抽出部で
抽出した固有名詞の位置に対して予め設定された制御コ
ードを付与する制御コード挿入部と、制御コード挿入部
で付与された制御コードに基づき、固有名詞に応じた特
殊音の発声または読み上げ方の変更のうち少なくとも一
方を行う音声合成部とを備えたことを特徴とする電子テ
キスト読み上げ装置。
【0015】〈構成8〉構成7に記載の電子テキスト読
み上げ装置において、漢字の説明フレーズを作成する説
明フレーズ作成部と、固有名詞に漢字が含まれる場合
は、説明フレーズ作成部で作成した漢字の説明フレーズ
を用いて固有名詞に対応した表記説明文を作成する制御
コード挿入部と、制御コード挿入部で作成された表記説
明文に基づき、固有名詞抽出部で抽出した固有名詞の読
み上げの後に表記説明文を読み上げる音声合成部とを備
えたことを特徴とする電子テキスト読み上げ装置。
み上げ装置において、漢字の説明フレーズを作成する説
明フレーズ作成部と、固有名詞に漢字が含まれる場合
は、説明フレーズ作成部で作成した漢字の説明フレーズ
を用いて固有名詞に対応した表記説明文を作成する制御
コード挿入部と、制御コード挿入部で作成された表記説
明文に基づき、固有名詞抽出部で抽出した固有名詞の読
み上げの後に表記説明文を読み上げる音声合成部とを備
えたことを特徴とする電子テキスト読み上げ装置。
【0016】〈構成9〉構成1〜8のいずれかに記載の
電子テキスト読み上げ装置において、内部状態と、読み
上げ方の変更または特殊音の発声を表す制御コードとの
対応を示す対応表を備え、制御コード挿入部は、対応表
に基づいて制御コードを付与するよう構成されたことを
特徴とする電子テキスト読み上げ装置。
電子テキスト読み上げ装置において、内部状態と、読み
上げ方の変更または特殊音の発声を表す制御コードとの
対応を示す対応表を備え、制御コード挿入部は、対応表
に基づいて制御コードを付与するよう構成されたことを
特徴とする電子テキスト読み上げ装置。
【0017】〈構成10〉構成1〜9のいずれかに記載
の電子テキスト読み上げ装置において、読み上げ方の変
更は、音量の変更、読み上げ速度の変更、男性音声と女
性音声の変更、音質変更のうち少なくとも一つを含むこ
とを特徴とする電子テキスト読み上げ装置。
の電子テキスト読み上げ装置において、読み上げ方の変
更は、音量の変更、読み上げ速度の変更、男性音声と女
性音声の変更、音質変更のうち少なくとも一つを含むこ
とを特徴とする電子テキスト読み上げ装置。
【0018】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて詳細に説明する。 《具体例1》図1は、本発明の電子テキスト読み上げ装
置の具体例1を示す構成図である。図示の装置は、空行
/記号行抽出部101、制御コード挿入部102、音声
合成部103、対応表104からなる。
例を用いて詳細に説明する。 《具体例1》図1は、本発明の電子テキスト読み上げ装
置の具体例1を示す構成図である。図示の装置は、空行
/記号行抽出部101、制御コード挿入部102、音声
合成部103、対応表104からなる。
【0019】空行/記号行抽出部101は、入力テキス
トから空行と記号行とを抽出する機能部である。制御コ
ード挿入部102は、対応表104に従ってテキストに
制御コードを挿入する機能部である。音声合成部103
は、テキストを読み込んで音声を合成する機能部であ
り、制御コードの指定により、音量の変更、読み上げ速
度の変更、男性音声と女性音声の変更、音質の変更、効
果音(特殊音)の発声、指定サンプリング音声の再生な
どを行う。対応表104は、空行/記号行の種別を示す
タグと音声合成部103への制御コード、即ち、内部状
態と読み上げ方の変更や効果音の発声といったことを示
す制御コードとの対応を示すテーブルデータである。
尚、本発明の電子テキスト読み上げ装置は、例えばパー
ソナルコンピュータからなり、具体例1の空行/記号行
抽出部101〜音声合成部103は、それぞれの処理に
対応した機能のソフトウェアと、このソフトウェアを実
行するためのプロセッサやメモリ等のハードウェアとか
ら実現されている。
トから空行と記号行とを抽出する機能部である。制御コ
ード挿入部102は、対応表104に従ってテキストに
制御コードを挿入する機能部である。音声合成部103
は、テキストを読み込んで音声を合成する機能部であ
り、制御コードの指定により、音量の変更、読み上げ速
度の変更、男性音声と女性音声の変更、音質の変更、効
果音(特殊音)の発声、指定サンプリング音声の再生な
どを行う。対応表104は、空行/記号行の種別を示す
タグと音声合成部103への制御コード、即ち、内部状
態と読み上げ方の変更や効果音の発声といったことを示
す制御コードとの対応を示すテーブルデータである。
尚、本発明の電子テキスト読み上げ装置は、例えばパー
ソナルコンピュータからなり、具体例1の空行/記号行
抽出部101〜音声合成部103は、それぞれの処理に
対応した機能のソフトウェアと、このソフトウェアを実
行するためのプロセッサやメモリ等のハードウェアとか
ら実現されている。
【0020】〈動作〉以下、具体例1の動作について説
明する。先ず、空行/記号行抽出部101は、入力テキ
ストから空行および記号行を抽出する。抽出した空行ま
たは記号行に空白文字または記号がある場合はそれらを
削除し、抽出した空行または記号行の種類に応じたタグ
を挿入する。
明する。先ず、空行/記号行抽出部101は、入力テキ
ストから空行および記号行を抽出する。抽出した空行ま
たは記号行に空白文字または記号がある場合はそれらを
削除し、抽出した空行または記号行の種類に応じたタグ
を挿入する。
【0021】図2は、空行または記号行の判断基準と挿
入タグの一例を示す説明図である。例えば、空行/記号
行抽出部101の判断基準として、空白文字+改行のみ
の行は「空行A」と判断して、タグ<空行A>を挿入す
る。また、空行Aが二つ以上連続した場合は「空行B」
と判断してタグ<空行B>を挿入するといった処理を行
う。このような処理を行うとテキストは次のようにな
る。
入タグの一例を示す説明図である。例えば、空行/記号
行抽出部101の判断基準として、空白文字+改行のみ
の行は「空行A」と判断して、タグ<空行A>を挿入す
る。また、空行Aが二つ以上連続した場合は「空行B」
と判断してタグ<空行B>を挿入するといった処理を行
う。このような処理を行うとテキストは次のようにな
る。
【0022】図3および図4は、それぞれテキストの一
例およびそのテキストを処理した場合の説明図である。
図7および図8は、それぞれテキストの他の例およびそ
のテキストを処理した場合の説明図である。
例およびそのテキストを処理した場合の説明図である。
図7および図8は、それぞれテキストの他の例およびそ
のテキストを処理した場合の説明図である。
【0023】例えば、図3に示すテキストを処理した場
合、図4に示すように<空行A>や<空行B>のタグが本来
の空行の部分に挿入されている。また、図7に示すよう
な記号行も含むテキストを処理した場合は、図8に示す
ように、<空行A>や<記号行A>といったタグが本来の空
行の部分や記号行の部分に挿入されている。尚、図8に
示すように、“新製品情報”や“イベント”といった記
号行中に位置する記号以外の文字はそのまま残されてい
る。
合、図4に示すように<空行A>や<空行B>のタグが本来
の空行の部分に挿入されている。また、図7に示すよう
な記号行も含むテキストを処理した場合は、図8に示す
ように、<空行A>や<記号行A>といったタグが本来の空
行の部分や記号行の部分に挿入されている。尚、図8に
示すように、“新製品情報”や“イベント”といった記
号行中に位置する記号以外の文字はそのまま残されてい
る。
【0024】次に、制御コード挿入部102は、対応表
104を参照して空行/記号行抽出部101で挿入した
タグを音声合成部103への制御コードに置き換える。
図5は、タグと制御コードと効果との対応を示す説明図
である。例えば、制御コード挿入部102は、<空行A>
のタグが挿入されていると、制御コード<ポーズ>を、ま
た、<空行B>のタグの場合は<チャイム1>を付与する。
次に、音声合成部103は、制御コード挿入部102に
よってタグが挿入されたテキストの音声合成処理を行
う。音声合成部103における制御コードと処理内容と
が図5のように設定されている場合、その処理内容は次
の通りとなる。
104を参照して空行/記号行抽出部101で挿入した
タグを音声合成部103への制御コードに置き換える。
図5は、タグと制御コードと効果との対応を示す説明図
である。例えば、制御コード挿入部102は、<空行A>
のタグが挿入されていると、制御コード<ポーズ>を、ま
た、<空行B>のタグの場合は<チャイム1>を付与する。
次に、音声合成部103は、制御コード挿入部102に
よってタグが挿入されたテキストの音声合成処理を行
う。音声合成部103における制御コードと処理内容と
が図5のように設定されている場合、その処理内容は次
の通りとなる。
【0025】図6および図9は、それぞれ図4のテキス
トおよび図8のテキストを処理した結果の説明図であ
る。図示のように、それぞれのテキストで付与されてい
る制御コードに応じた処理を行う。例えば制御コードが
<ポーズ>であった場合は、ポーズ(短い無音状態)を挿
入し、<チャイム1>であった場合は、チャイム1に対応
したチャイム音を挿入する。また、<記号行A>であった
場合、声質の男女を変更する。例えば、記号行Aより以
前が声質:男性であった場合は、声質:女性とする。こ
のように音声合成部103は、制御コード挿入部102
で挿入された制御コードに従って、ポーズを入れたり効
果音を入れながらテキストの読み上げを行う。尚、図5
の効果の例は制御コードによって得られる効果を分かり
易くするために付けたものであり、実際の対応表104
には必ずしもなくても構わない。
トおよび図8のテキストを処理した結果の説明図であ
る。図示のように、それぞれのテキストで付与されてい
る制御コードに応じた処理を行う。例えば制御コードが
<ポーズ>であった場合は、ポーズ(短い無音状態)を挿
入し、<チャイム1>であった場合は、チャイム1に対応
したチャイム音を挿入する。また、<記号行A>であった
場合、声質の男女を変更する。例えば、記号行Aより以
前が声質:男性であった場合は、声質:女性とする。こ
のように音声合成部103は、制御コード挿入部102
で挿入された制御コードに従って、ポーズを入れたり効
果音を入れながらテキストの読み上げを行う。尚、図5
の効果の例は制御コードによって得られる効果を分かり
易くするために付けたものであり、実際の対応表104
には必ずしもなくても構わない。
【0026】〈効果〉以上のように、具体例1によれ
ば、テキスト中の空行や記号行をポーズや効果音で表現
するようにしたので次のような効果がある。 ●テキストに記述された文字の情報だけでなく、文章が
空行によって大きく隔てられているといった状態や、文
章が連続した記号で分離されているといった、テキスト
全体の構造情報を読み上げ内容に反映させることができ
る。 ●空行や記号だけからなる行などがあった場合は、適切
に効果音を入れたり読み上げの声質を変化させたりでき
る。これにより、読み上げ音声を聞いている利用者は話
題の変化を察知することができ、内容理解が容易にな
る。 ●対応表104の内容を変えることによって簡単に様々
な設定が可能である。
ば、テキスト中の空行や記号行をポーズや効果音で表現
するようにしたので次のような効果がある。 ●テキストに記述された文字の情報だけでなく、文章が
空行によって大きく隔てられているといった状態や、文
章が連続した記号で分離されているといった、テキスト
全体の構造情報を読み上げ内容に反映させることができ
る。 ●空行や記号だけからなる行などがあった場合は、適切
に効果音を入れたり読み上げの声質を変化させたりでき
る。これにより、読み上げ音声を聞いている利用者は話
題の変化を察知することができ、内容理解が容易にな
る。 ●対応表104の内容を変えることによって簡単に様々
な設定が可能である。
【0027】《具体例2》具体例2は、URL等の計算
機が直接理解できる文字列に関しては予め登録してお
き、このような文字列がテキスト中に存在した場合は、
その代わりに効果音を発声するようにしたものである。
機が直接理解できる文字列に関しては予め登録してお
き、このような文字列がテキスト中に存在した場合は、
その代わりに効果音を発声するようにしたものである。
【0028】〈構成〉図10は、具体例2の構成図であ
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、特殊文字列抽出部201からな
る。ここで、特殊文字列抽出部201以外は具体例1と
同様であるため、対応する部分に同一符号を付してその
説明を省略する。
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、特殊文字列抽出部201からな
る。ここで、特殊文字列抽出部201以外は具体例1と
同様であるため、対応する部分に同一符号を付してその
説明を省略する。
【0029】特殊文字列抽出部201は、テキストから
電子メールアドレス、URL(Uniform Resource Locat
or)、ファイルパスといった計算機用の特殊な文字列
(以下、特殊文字列と呼ぶ)を抽出する機能部である。
尚、特殊文字列抽出部201は、その処理に対応した機
能のソフトウェアと、このソフトウェアを実行するため
のプロセッサやメモリ等のハードウェアとから実現され
ている。
電子メールアドレス、URL(Uniform Resource Locat
or)、ファイルパスといった計算機用の特殊な文字列
(以下、特殊文字列と呼ぶ)を抽出する機能部である。
尚、特殊文字列抽出部201は、その処理に対応した機
能のソフトウェアと、このソフトウェアを実行するため
のプロセッサやメモリ等のハードウェアとから実現され
ている。
【0030】〈動作〉以下、具体例2の動作を説明す
る。先ず、特殊文字列抽出部201は、入力テキストか
ら電子メールアドレス、URL、ファイルパス等の特殊
文字列を抽出する。そして、抽出した特殊文字列に代え
て特殊文字列の種類を表すタグを挿入する。
る。先ず、特殊文字列抽出部201は、入力テキストか
ら電子メールアドレス、URL、ファイルパス等の特殊
文字列を抽出する。そして、抽出した特殊文字列に代え
て特殊文字列の種類を表すタグを挿入する。
【0031】特殊文字列は計算機が直接理解する文字列
であり、これらの特殊文字列は用途によってそのシンタ
ックスが決められている。例えば、電子メールアドレス
のシンタックスは、RFC822(STANDARD FOR THE FORMAT O
F ARPA INTERNET TEXT MESSAGES)、URLのシンタック
スはRFC1738(Uniform Resource Locators)というインタ
ーネット規約集に詳細に規定されている。このため、こ
のシンタックスの特徴を使って該当する文字列を抽出す
る機構を作成することは容易である。
であり、これらの特殊文字列は用途によってそのシンタ
ックスが決められている。例えば、電子メールアドレス
のシンタックスは、RFC822(STANDARD FOR THE FORMAT O
F ARPA INTERNET TEXT MESSAGES)、URLのシンタック
スはRFC1738(Uniform Resource Locators)というインタ
ーネット規約集に詳細に規定されている。このため、こ
のシンタックスの特徴を使って該当する文字列を抽出す
る機構を作成することは容易である。
【0032】図11は、特殊文字列とタグの例を示す説
明図である。例えば、特殊文字列が電子メールアドレス
の場合はタグとして<アドレス>を、特殊文字列がURL
の場合は<URL>を、特殊文字列がファイルパスの場合は<
ファイル>を付与する。このような処理を行うと入力テ
キストは次のようになる。
明図である。例えば、特殊文字列が電子メールアドレス
の場合はタグとして<アドレス>を、特殊文字列がURL
の場合は<URL>を、特殊文字列がファイルパスの場合は<
ファイル>を付与する。このような処理を行うと入力テ
キストは次のようになる。
【0033】図12は、入力テキストの一例を示す説明
図である。図13は、処理後の説明図である。図示のよ
うに、入力テキスト中の特殊文字列“http://www.tohto
-u.ac.jp/shima/”は、タグ<URL>に変更されている。
図である。図13は、処理後の説明図である。図示のよ
うに、入力テキスト中の特殊文字列“http://www.tohto
-u.ac.jp/shima/”は、タグ<URL>に変更されている。
【0034】次に、制御コード挿入部102は、対応表
104を参照して特殊文字列抽出部201で挿入したタ
グを音声合成部103の制御コードに置き換える。図1
4は、対応表104の内容を示す説明図である。図示の
ように、タグが<URL>であった場合、制御コードとして<
チャイム2>を付与する。図15は、制御コード付与後
のテキストの説明図である。音声合成部103は、この
制御コードに従って、効果音を入れながらテキストの読
み上げを行う。
104を参照して特殊文字列抽出部201で挿入したタ
グを音声合成部103の制御コードに置き換える。図1
4は、対応表104の内容を示す説明図である。図示の
ように、タグが<URL>であった場合、制御コードとして<
チャイム2>を付与する。図15は、制御コード付与後
のテキストの説明図である。音声合成部103は、この
制御コードに従って、効果音を入れながらテキストの読
み上げを行う。
【0035】〈効果〉以上のように具体例2によれば、
URL等の特殊文字列は、その種類を識別可能な効果音
としてテキスト読み上げを行うようにしたので、次のよ
うな効果がある。
URL等の特殊文字列は、その種類を識別可能な効果音
としてテキスト読み上げを行うようにしたので、次のよ
うな効果がある。
【0036】●特殊文字列の読み上げを回避できるた
め、利用者は無意味な読み上げ音声を聞かずに済む。 ●特殊文字列の読み上げに代えて効果音を入れるように
したため、読み上げを聞く利用者はこの部分に何らかの
特殊文字列が存在していることを知ることができる。 ●特殊文字列の種類によって効果音の種類を変えること
ができるため、読み上げを聞く利用者は特殊文字列の種
類を知ることができる。 ●対応表104の内容を変えることによって簡単に様々
な設定を行うことができる。
め、利用者は無意味な読み上げ音声を聞かずに済む。 ●特殊文字列の読み上げに代えて効果音を入れるように
したため、読み上げを聞く利用者はこの部分に何らかの
特殊文字列が存在していることを知ることができる。 ●特殊文字列の種類によって効果音の種類を変えること
ができるため、読み上げを聞く利用者は特殊文字列の種
類を知ることができる。 ●対応表104の内容を変えることによって簡単に様々
な設定を行うことができる。
【0037】《具体例3》具体例3は、テキスト中の要
約部分をゆっくり読み上げたり、繰り返したりすること
で、重要部分を利用者に知らせるようにしたものであ
る。
約部分をゆっくり読み上げたり、繰り返したりすること
で、重要部分を利用者に知らせるようにしたものであ
る。
【0038】〈構成〉図16は、具体例3の構成図であ
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、要約処理部301からなる。こ
こで、要約処理部301以外の構成は具体例1、2と同
様であるため、対応する部分に同一符号を付してその説
明を省略する。
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、要約処理部301からなる。こ
こで、要約処理部301以外の構成は具体例1、2と同
様であるため、対応する部分に同一符号を付してその説
明を省略する。
【0039】要約処理部301は、入力テキストを要約
し重要部分の抽出を行う機能部である。尚、この要約処
理は、入力テキストをパラグラフに分割し、引用行を含
まないパラグラフのうち、本文の最初に近いものを重要
部分として抽出するものであるが、その処理方法の詳細
については動作の項で説明する。また、要約処理部30
1は、その処理に対応した機能のソフトウェアと、この
ソフトウェアを実行するためのプロセッサやメモリ等の
ハードウェアとから実現されている。
し重要部分の抽出を行う機能部である。尚、この要約処
理は、入力テキストをパラグラフに分割し、引用行を含
まないパラグラフのうち、本文の最初に近いものを重要
部分として抽出するものであるが、その処理方法の詳細
については動作の項で説明する。また、要約処理部30
1は、その処理に対応した機能のソフトウェアと、この
ソフトウェアを実行するためのプロセッサやメモリ等の
ハードウェアとから実現されている。
【0040】〈動作〉次に具体例3の動作について説明
する。先ず、要約処理部301は、入力テキストを要約
し、重要部分を抽出する。要約の方法には様々な方法が
考えられるが、ここでは以下の手順に従って処理するも
のとする。尚、これ以外の方法で要約を行っても構わな
い。
する。先ず、要約処理部301は、入力テキストを要約
し、重要部分を抽出する。要約の方法には様々な方法が
考えられるが、ここでは以下の手順に従って処理するも
のとする。尚、これ以外の方法で要約を行っても構わな
い。
【0041】1.処理対象となるテキストをパラグラフ
に分割する。テキストの空行を区切り記号とすることで
分割することができる。 2.文字を含む行が2行以上あり、かつ、引用行を含ま
ないパラグラフのうち本文の最初に最も近いものを探索
する。引用行とは行頭が「>」で始まる行と定義する。 3.上記2項の処理で探索されたパラグラフを要約と
し、要約部分となるパラグラフの前後に要約を示すタグ
を挿入する。ここでは、要約の始まりに「<abstract
>」、終わりに「</abstract>」を挿入する。
に分割する。テキストの空行を区切り記号とすることで
分割することができる。 2.文字を含む行が2行以上あり、かつ、引用行を含ま
ないパラグラフのうち本文の最初に最も近いものを探索
する。引用行とは行頭が「>」で始まる行と定義する。 3.上記2項の処理で探索されたパラグラフを要約と
し、要約部分となるパラグラフの前後に要約を示すタグ
を挿入する。ここでは、要約の始まりに「<abstract
>」、終わりに「</abstract>」を挿入する。
【0042】このような要約処理の一例を具体例2の図
12で示した例を用いて説明する。図17は、図12の
テキストに対して要約処理を行った場合の説明図であ
る。上記3項の手順によって、“明日、東都大学の嶋翔
一教授が…準備しておいて下さい”が要約として抽出さ
れ、その前後に<abstract>と、</abstract>が挿入され
ている。次に、制御コード挿入部102は、対応表10
4を参照して要約処理部301で挿入したタグを音声合
成部103への制御コードに置き換える。
12で示した例を用いて説明する。図17は、図12の
テキストに対して要約処理を行った場合の説明図であ
る。上記3項の手順によって、“明日、東都大学の嶋翔
一教授が…準備しておいて下さい”が要約として抽出さ
れ、その前後に<abstract>と、</abstract>が挿入され
ている。次に、制御コード挿入部102は、対応表10
4を参照して要約処理部301で挿入したタグを音声合
成部103への制御コードに置き換える。
【0043】図18は、対応表104の内容説明図であ
る。図19は、対応表104が図18の場合に図17の
テキストを処理した場合の説明図である。この場合、<a
bstract>には、<チャイム3><発話速度:低速>の制御コ
ードが付与され、また、</abstract>には<発話速度:標
準>の制御コードが付与される。従って、制御コード挿
入部102での処理結果は図19に示す通りとなる。
る。図19は、対応表104が図18の場合に図17の
テキストを処理した場合の説明図である。この場合、<a
bstract>には、<チャイム3><発話速度:低速>の制御コ
ードが付与され、また、</abstract>には<発話速度:標
準>の制御コードが付与される。従って、制御コード挿
入部102での処理結果は図19に示す通りとなる。
【0044】次に、音声合成部103は付与された制御
コードに従ってテキストの読み上げを行う。例えば、制
御コードが<チャイム3><発話速度:低速>であった部分
は、チャイム3を鳴らし、ゆっくりと読み上げる動作を
行う。また、制御コードが<発話速度:標準>であった部
分以降は読み上げ速度を普通の速度に戻す。
コードに従ってテキストの読み上げを行う。例えば、制
御コードが<チャイム3><発話速度:低速>であった部分
は、チャイム3を鳴らし、ゆっくりと読み上げる動作を
行う。また、制御コードが<発話速度:標準>であった部
分以降は読み上げ速度を普通の速度に戻す。
【0045】次に、読み上げ方法の他の例を説明する。
図20は、対応表104の他の例の内容説明図である。
図21は、対応表104が図20の場合に図17のテキ
ストを処理した場合の説明図である。この例は、対応表
104で、<abstract>には、特に制御コードは付与され
ず、</abstract>で<再生:繰り返しの案内>と<要約>の
制御コードが付与されるよう設定されている。尚、<要
約>が指定される場合は、要約処理部301が抽出した
「要約部分」を挿入する。また、<再生:繰り返しの案
内>は、音声合成部103への制御コードの一つで、例
えば「重要部分なので繰り返します。」というサンプリ
ング音声の再生命令などを意味する。従って、制御コー
ド挿入部102での処理結果は図21に示す通りとな
る。
図20は、対応表104の他の例の内容説明図である。
図21は、対応表104が図20の場合に図17のテキ
ストを処理した場合の説明図である。この例は、対応表
104で、<abstract>には、特に制御コードは付与され
ず、</abstract>で<再生:繰り返しの案内>と<要約>の
制御コードが付与されるよう設定されている。尚、<要
約>が指定される場合は、要約処理部301が抽出した
「要約部分」を挿入する。また、<再生:繰り返しの案
内>は、音声合成部103への制御コードの一つで、例
えば「重要部分なので繰り返します。」というサンプリ
ング音声の再生命令などを意味する。従って、制御コー
ド挿入部102での処理結果は図21に示す通りとな
る。
【0046】次に、音声合成部103は付与された制御
コードに従ってテキストの読み上げを行う。例えば、制
御コードが<再生:繰り返しの案内>と<要約>であった部
分では、繰り返しの案内を行った後、要約の読み上げを
行う。
コードに従ってテキストの読み上げを行う。例えば、制
御コードが<再生:繰り返しの案内>と<要約>であった部
分では、繰り返しの案内を行った後、要約の読み上げを
行う。
【0047】〈効果〉以上のように具体例3によれば、
入力テキストの要約部分を識別できるよう音声による読
み上げを行うようにしたので次のような効果がある。 ●重要部分の読み上げの前に効果音を鳴らして利用者に
合図するように指定することにより、読み上げを聞く利
用者の注意を喚起し、重要部分の聞き漏らしを防止でき
る。 ●重要部分を繰り返して読み上げるように指定すること
により、重要部分の聞き漏らしを防止できる。 ●重要部分をゆっくり読み上げるように指定することに
より、重要部分の聞き漏らしを防止できる。 ●対応表104の内容を変えることによって上記三つの
効果を組み合わせて利用することができる。 ●対応表104の内容を変えることによって簡単に様々
な設定を行うことができる。
入力テキストの要約部分を識別できるよう音声による読
み上げを行うようにしたので次のような効果がある。 ●重要部分の読み上げの前に効果音を鳴らして利用者に
合図するように指定することにより、読み上げを聞く利
用者の注意を喚起し、重要部分の聞き漏らしを防止でき
る。 ●重要部分を繰り返して読み上げるように指定すること
により、重要部分の聞き漏らしを防止できる。 ●重要部分をゆっくり読み上げるように指定することに
より、重要部分の聞き漏らしを防止できる。 ●対応表104の内容を変えることによって上記三つの
効果を組み合わせて利用することができる。 ●対応表104の内容を変えることによって簡単に様々
な設定を行うことができる。
【0048】《具体例4》具体例4は、テキスト中の固
有名詞の部分は読み上げのパラメータを変化させて他の
部分とは識別できるようにしたものである。
有名詞の部分は読み上げのパラメータを変化させて他の
部分とは識別できるようにしたものである。
【0049】〈構成〉図22は、具体例4の構成図であ
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、固有名詞抽出部401からな
る。ここで、固有名詞抽出部401以外の構成は具体例
1〜3と同様であるため、対応する部分に同一符号を付
してその説明を省略する。
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、固有名詞抽出部401からな
る。ここで、固有名詞抽出部401以外の構成は具体例
1〜3と同様であるため、対応する部分に同一符号を付
してその説明を省略する。
【0050】固有名詞抽出部401は、入力テキストか
ら、人名、組織名、地名といった固有名詞を抽出する機
能部である。この抽出方法としては、例えば、人名接辞
等に基づいて行うが、その抽出方法の詳細については動
作の項で説明する。尚、固有名詞抽出部401は、その
処理に対応した機能のソフトウェアと、このソフトウェ
アを実行するためのプロセッサやメモリ等のハードウェ
アとから実現されている。
ら、人名、組織名、地名といった固有名詞を抽出する機
能部である。この抽出方法としては、例えば、人名接辞
等に基づいて行うが、その抽出方法の詳細については動
作の項で説明する。尚、固有名詞抽出部401は、その
処理に対応した機能のソフトウェアと、このソフトウェ
アを実行するためのプロセッサやメモリ等のハードウェ
アとから実現されている。
【0051】〈動作〉次に具体例4の動作について説明
する。先ず、固有名詞抽出部401は、入力テキストか
ら固有名詞を抽出する。この方法としては、例えば、電
子情報通信学会、信学技報 NLC98-21,“固有名詞抽出
における日本語と英語の比較”に記載された方法などを
用いることができる。即ち、人名や地名のリストを用意
すると共に、人名接辞リストや組織名接辞リスト、地名
接辞リストといったリストを用意し、これらのリストと
入力テキストを照合し、また、人名リストと人名接辞リ
ストに一致した場合は、人名+人名接辞と認識するとい
った分割・統合規則により、人名や地名等の固有名詞を
抽出する。
する。先ず、固有名詞抽出部401は、入力テキストか
ら固有名詞を抽出する。この方法としては、例えば、電
子情報通信学会、信学技報 NLC98-21,“固有名詞抽出
における日本語と英語の比較”に記載された方法などを
用いることができる。即ち、人名や地名のリストを用意
すると共に、人名接辞リストや組織名接辞リスト、地名
接辞リストといったリストを用意し、これらのリストと
入力テキストを照合し、また、人名リストと人名接辞リ
ストに一致した場合は、人名+人名接辞と認識するとい
った分割・統合規則により、人名や地名等の固有名詞を
抽出する。
【0052】抽出した固有名詞は、人名、組織名、地名
などの種類に応じたタグを挿入して分離する。図23
は、固有名詞の種類とタグの例を示す説明図である。図
中の、<ps>は人名接辞であり、人名の後に続く「さ
ん」、「被告」、「社長」などを指す。図示のように、
「今朝、越田社長が来られた」という文から固有名詞を
抽出すると、「越田」が人名として得られる。しかし、
「越田社長」をひとまとめにして扱いたい場合もある。
このような場合に人名接辞を利用することができる。
などの種類に応じたタグを挿入して分離する。図23
は、固有名詞の種類とタグの例を示す説明図である。図
中の、<ps>は人名接辞であり、人名の後に続く「さ
ん」、「被告」、「社長」などを指す。図示のように、
「今朝、越田社長が来られた」という文から固有名詞を
抽出すると、「越田」が人名として得られる。しかし、
「越田社長」をひとまとめにして扱いたい場合もある。
このような場合に人名接辞を利用することができる。
【0053】図24は、図12のテキストに対して固有
名詞抽出処理を行った場合の説明図である。上記の固有
名詞抽出処理によって、“東都大学”が組織名として認
識されて<o東都大学>として分離され、また、“嶋翔
一”は人名と認識されて<p嶋翔一>に、“教授”は人名
接辞として<ps教授>に分離されている。
名詞抽出処理を行った場合の説明図である。上記の固有
名詞抽出処理によって、“東都大学”が組織名として認
識されて<o東都大学>として分離され、また、“嶋翔
一”は人名と認識されて<p嶋翔一>に、“教授”は人名
接辞として<ps教授>に分離されている。
【0054】次に、制御コード挿入部102は、対応表
104を参照して固有名詞抽出部401で挿入したタグ
を音声合成部103への制御コードに置き換える。図2
5は、対応表104の一例を示す説明図である。図26
は、対応表104が図25の場合に図24のテキストに
対して制御コードを付与した場合の説明図である。この
例では、対応表104において、人名である<p>や組織
名である<o>のタグに対して、制御コードとして<発話速
度:低速>が設定されているため、“東都大学”と“嶋
翔一”とに<発話速度:低速>が設定されている。
104を参照して固有名詞抽出部401で挿入したタグ
を音声合成部103への制御コードに置き換える。図2
5は、対応表104の一例を示す説明図である。図26
は、対応表104が図25の場合に図24のテキストに
対して制御コードを付与した場合の説明図である。この
例では、対応表104において、人名である<p>や組織
名である<o>のタグに対して、制御コードとして<発話速
度:低速>が設定されているため、“東都大学”と“嶋
翔一”とに<発話速度:低速>が設定されている。
【0055】次に、音声合成部103は付与された制御
コードに従って、効果音を入れたり読み上げ方のパラメ
ータ(声質、発話速度、音量、音の高さなど)を変化さ
せながらテキストの読み上げを行う。この例では、制御
コードが<発話速度:低速>であった部分は、ゆっくりと
読み上げる動作を行う。また、制御コードが<発話速
度:標準>であった部分以降は読み上げ速度を普通の速
度に戻す。
コードに従って、効果音を入れたり読み上げ方のパラメ
ータ(声質、発話速度、音量、音の高さなど)を変化さ
せながらテキストの読み上げを行う。この例では、制御
コードが<発話速度:低速>であった部分は、ゆっくりと
読み上げる動作を行う。また、制御コードが<発話速
度:標準>であった部分以降は読み上げ速度を普通の速
度に戻す。
【0056】〈効果〉以上のように、具体例4によれ
ば、固有名詞の部分を読み上げのパラメータを変化させ
ながらテキストの読み上げを行うようにしたので、次の
ような効果がある。 ●人名や地名などの重要情報をゆっくりと読み上げるよ
うに指定することにより、これらの重要情報の聞き漏ら
しを防止できる。 ●対応表104の内容を変えることによって、固有名詞
の種類(人名、組織名、地名など)毎に違う設定ができ
る。 ●対応表104の内容を変えることによって、簡単に様
々な設定ができる。
ば、固有名詞の部分を読み上げのパラメータを変化させ
ながらテキストの読み上げを行うようにしたので、次の
ような効果がある。 ●人名や地名などの重要情報をゆっくりと読み上げるよ
うに指定することにより、これらの重要情報の聞き漏ら
しを防止できる。 ●対応表104の内容を変えることによって、固有名詞
の種類(人名、組織名、地名など)毎に違う設定ができ
る。 ●対応表104の内容を変えることによって、簡単に様
々な設定ができる。
【0057】《具体例5》具体例5は、テキスト中の固
有名詞の漢字に対してその表記説明を行うようにしたも
のである。
有名詞の漢字に対してその表記説明を行うようにしたも
のである。
【0058】〈構成〉図27は、具体例5の構成図であ
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、固有名詞抽出部401、説明フ
レーズ作成部501からなる。ここで、説明フレーズ作
成部501以外の構成は具体例1〜4と同様であるた
め、対応する部分に同一符号を付してその説明を省略す
る。
る。図の装置は、制御コード挿入部102、音声合成部
103、対応表104、固有名詞抽出部401、説明フ
レーズ作成部501からなる。ここで、説明フレーズ作
成部501以外の構成は具体例1〜4と同様であるた
め、対応する部分に同一符号を付してその説明を省略す
る。
【0059】説明フレーズ作成部501は、一つの漢字
が入力されるとその漢字の説明フレーズを作成する機能
部である。尚、説明フレーズ作成部501は、その処理
に対応した機能のソフトウェアと、このソフトウェアを
実行するためのプロセッサやメモリ等のハードウェアと
から実現されている。
が入力されるとその漢字の説明フレーズを作成する機能
部である。尚、説明フレーズ作成部501は、その処理
に対応した機能のソフトウェアと、このソフトウェアを
実行するためのプロセッサやメモリ等のハードウェアと
から実現されている。
【0060】〈動作〉以下、動作について説明する。先
ず、固有名詞抽出部401は、入力テキストから固有名
詞を抽出する。この動作については具体例4と同様であ
るため、ここでの説明は省略する。制御コード挿入部1
02は、対応表104を参照して固有名詞抽出部401
で挿入したタグを音声合成部103への制御コードに置
き換える。
ず、固有名詞抽出部401は、入力テキストから固有名
詞を抽出する。この動作については具体例4と同様であ
るため、ここでの説明は省略する。制御コード挿入部1
02は、対応表104を参照して固有名詞抽出部401
で挿入したタグを音声合成部103への制御コードに置
き換える。
【0061】図28は、対応表104の一例を示す説明
図である。この例では、<p><ps>には制御コードとし
て、<再生:表記説明の案内>や<声質:女性><表記説明>
<声質:標準>が付与される。そして、対応表104で<
表記説明>が指定された場合、説明フレーズ作成部50
1は、該当する固有名詞の文字列を次のようなテンプレ
ートに当てはめて表記説明文を作成し挿入する。
図である。この例では、<p><ps>には制御コードとし
て、<再生:表記説明の案内>や<声質:女性><表記説明>
<声質:標準>が付与される。そして、対応表104で<
表記説明>が指定された場合、説明フレーズ作成部50
1は、該当する固有名詞の文字列を次のようなテンプレ
ートに当てはめて表記説明文を作成し挿入する。
【0062】図29は、表記説明文とフレーズとの関係
を示す説明図である。図示のような漢字説明フレーズ
は、該当漢字1文字を使って説明フレーズ作成部501
が作成する。このフレーズの作成方法としては、例えば
特開平9−237096号公報に記載された方法等を用
いて作成することができる。即ち、漢字1文字をキーと
して、熟語辞書を参照し、得られた熟語に基づいて説明
フレーズを作成したり、漢字のへんや旁といったパーツ
情報に基づいてフレーズを生成する方法である。
を示す説明図である。図示のような漢字説明フレーズ
は、該当漢字1文字を使って説明フレーズ作成部501
が作成する。このフレーズの作成方法としては、例えば
特開平9−237096号公報に記載された方法等を用
いて作成することができる。即ち、漢字1文字をキーと
して、熟語辞書を参照し、得られた熟語に基づいて説明
フレーズを作成したり、漢字のへんや旁といったパーツ
情報に基づいてフレーズを生成する方法である。
【0063】例えば「クコの実」という固有名詞の表記
説明文は、「実」の漢字の説明フレーズとして説明フレ
ーズ作成部501が「果実の実」を出力したとすると、
表記説明としては次の通りとなる。図30は、表記説明
の一例を示す説明図である。
説明文は、「実」の漢字の説明フレーズとして説明フレ
ーズ作成部501が「果実の実」を出力したとすると、
表記説明としては次の通りとなる。図30は、表記説明
の一例を示す説明図である。
【0064】また、図28に示した<再生:表記説明の
案内>は、音声合成部103への制御コードの一つで、
例えば、「表記の説明をします」というサンプリング音
声の再生命令などを意味する。
案内>は、音声合成部103への制御コードの一つで、
例えば、「表記の説明をします」というサンプリング音
声の再生命令などを意味する。
【0065】図31は、説明フレーズ作成部501の入
力と出力との関係を示す説明図である。図32は、対応
表104が図28の場合で、かつ、説明フレーズ作成部
501が図31に示すように構成されている場合に、図
12のテキストを処理した結果の説明図である。
力と出力との関係を示す説明図である。図32は、対応
表104が図28の場合で、かつ、説明フレーズ作成部
501が図31に示すように構成されている場合に、図
12のテキストを処理した結果の説明図である。
【0066】図31に示すように、説明フレーズ作成部
501において、例えば、漢字「嶋」は「山へんに鳥」
といったようにへんと旁の説明を行う。従って、処理結
果としては、図32のように、固有名詞「嶋翔一」で
は、「嶋翔一の表記は、山へんに鳥、羊に羽、一十百千
の一です」といった説明となる。
501において、例えば、漢字「嶋」は「山へんに鳥」
といったようにへんと旁の説明を行う。従って、処理結
果としては、図32のように、固有名詞「嶋翔一」で
は、「嶋翔一の表記は、山へんに鳥、羊に羽、一十百千
の一です」といった説明となる。
【0067】次に、音声合成部103は付与された制御
コードに従って、効果音を入れたり読み上げのパラメー
タ(声質、発話速度、音量、音の高さなど)を変化させ
ながらテキストの読み上げを行う。この例では、制御コ
ードが<再生:表記説明の案内>であった部分は、「表記
の説明をします」といったサンプリング音声の再生を行
う。また、制御コードが<声質:女性>であった部分以降
は読み上げの声質を女性の声とし、<声質:標準>以降は
通常の声質に戻す。
コードに従って、効果音を入れたり読み上げのパラメー
タ(声質、発話速度、音量、音の高さなど)を変化させ
ながらテキストの読み上げを行う。この例では、制御コ
ードが<再生:表記説明の案内>であった部分は、「表記
の説明をします」といったサンプリング音声の再生を行
う。また、制御コードが<声質:女性>であった部分以降
は読み上げの声質を女性の声とし、<声質:標準>以降は
通常の声質に戻す。
【0068】〈効果〉以上のように、具体例5によれ
ば、テキスト中の漢字に対してどのような漢字かを説明
するようにしたので、次のような効果がある。 ●使われている漢字やひらがなとカタカナの違いなど
の、音で聞いただけでは分からない内容も知ることがで
きるので、人名なども正しく知ることができる。 ●機械が読み方を間違えた場合でも内容を正しく理解す
ることができる。 ●対応表104の内容を変えることによって、簡単に様
々な設定ができる。
ば、テキスト中の漢字に対してどのような漢字かを説明
するようにしたので、次のような効果がある。 ●使われている漢字やひらがなとカタカナの違いなど
の、音で聞いただけでは分からない内容も知ることがで
きるので、人名なども正しく知ることができる。 ●機械が読み方を間違えた場合でも内容を正しく理解す
ることができる。 ●対応表104の内容を変えることによって、簡単に様
々な設定ができる。
【0069】《利用形態》 ●具体例1において、空行を単独の空行と2回以上連続
した空行で分類したが、これに限定されるものではな
い。例えば、2回までと3回以上で分けてもよいし、3
種類以上に分類してもよい。 ●具体例3において、繰り返しのための重要部分挿入位
置は重要部分の終了位置としたが、これに限定されるも
のではない。例えば、テキストの最後でもよいし、重要
部分内で一文毎に繰り返すようにしてもよい。 ●具体例5において、表記の説明文は該当する固有名詞
の読み上げの直後で行うとしたが、これに限定されるも
のではない。例えば、該当する固有名詞の属する段落の
最後でもよいし、テキストの最後であってもよい。 ●上記具体例1〜5において、電子メールなどのテキス
トだけでなく、例えば文字放送の文字データを対象とし
てもよい。 ●上記具体例1〜5を任意に組み合わせてもよい。即
ち、いずれか二つの具体例を組み合わせるだけでなく、
三つ以上の具体例を組み合わせてもよい。
した空行で分類したが、これに限定されるものではな
い。例えば、2回までと3回以上で分けてもよいし、3
種類以上に分類してもよい。 ●具体例3において、繰り返しのための重要部分挿入位
置は重要部分の終了位置としたが、これに限定されるも
のではない。例えば、テキストの最後でもよいし、重要
部分内で一文毎に繰り返すようにしてもよい。 ●具体例5において、表記の説明文は該当する固有名詞
の読み上げの直後で行うとしたが、これに限定されるも
のではない。例えば、該当する固有名詞の属する段落の
最後でもよいし、テキストの最後であってもよい。 ●上記具体例1〜5において、電子メールなどのテキス
トだけでなく、例えば文字放送の文字データを対象とし
てもよい。 ●上記具体例1〜5を任意に組み合わせてもよい。即
ち、いずれか二つの具体例を組み合わせるだけでなく、
三つ以上の具体例を組み合わせてもよい。
【図1】本発明の電子テキスト読み上げ装置の具体例1
を示す構成図である。
を示す構成図である。
【図2】空行または記号行の判断基準と挿入タグの一例
を示す説明図である。
を示す説明図である。
【図3】テキストの一例の説明図である。
【図4】図3のテキストを処理した場合の説明図であ
る。
る。
【図5】タグと制御コードと効果との対応を示す説明図
である。
である。
【図6】図4のテキストを処理した結果の説明図であ
る。
る。
【図7】テキストの他の例の説明図である。
【図8】図7のテキストを処理した場合の説明図であ
る。
る。
【図9】図8のテキストを処理した結果の説明図であ
る。
る。
【図10】具体例2の構成図である。
【図11】特殊文字列とタグの例を示す説明図である。
【図12】入力テキストの一例を示す説明図である。
【図13】入力テキストの処理後の説明図である。
【図14】対応表の内容を示す説明図である。
【図15】制御コード付与後のテキストの説明図であ
る。
る。
【図16】具体例3の構成図である。
【図17】図12のテキストに対して要約処理を行った
場合の説明図である。
場合の説明図である。
【図18】対応表の内容説明図である。
【図19】対応表が図18の場合に図17のテキストを
処理した場合の説明図である。
処理した場合の説明図である。
【図20】対応表の他の例の内容説明図である。
【図21】対応表が図20の場合に図17のテキストを
処理した場合の説明図である。
処理した場合の説明図である。
【図22】具体例4の構成図である。
【図23】固有名詞の種類とタグの例を示す説明図であ
る。
る。
【図24】図12のテキストに対して固有名詞抽出処理
を行った場合の説明図である。
を行った場合の説明図である。
【図25】対応表の一例を示す説明図である。
【図26】対応表が図25の場合に図24のテキストに
対して制御コードを付与した場合の説明図である。
対して制御コードを付与した場合の説明図である。
【図27】具体例5の構成図である。
【図28】対応表の一例を示す説明図である。
【図29】表記説明文とフレーズとの関係を示す説明図
である。
である。
【図30】表記説明の一例を示す説明図である。
【図31】説明フレーズ作成部の入力と出力との関係を
示す説明図である。
示す説明図である。
【図32】対応表が図28の場合で、かつ、説明フレー
ズ作成部が図31に示すように構成されている場合に、
図12のテキストを処理した結果の説明図である。
ズ作成部が図31に示すように構成されている場合に、
図12のテキストを処理した結果の説明図である。
101 空行/記号行抽出部 102 制御コード挿入部 103 音声合成部 104 対応表 201 特殊文字列抽出部 301 要約処理部 401 固有名詞抽出部 501 説明フレーズ作成部
Claims (10)
- 【請求項1】 テキスト中から空行または記号行のうち
少なくとも一方を抽出する空行/記号行抽出部と、 前記空行/記号行抽出部で抽出した空行または記号行に
対して予め設定された制御コードを付与する制御コード
挿入部と、 前記制御コード挿入部で付与された制御コードに基づ
き、その位置での読み上げ方の変更または特殊音の発声
の少なくとも一方を行う音声合成部とを備えたことを特
徴とする電子テキスト読み上げ装置。 - 【請求項2】 請求項1に記載の電子テキスト読み上げ
装置において、 記号行の抽出する基準として、行全体の文字数と行中の
記号が占める割合を利用する空行/記号行抽出部を備え
たことを特徴とする電子テキスト読み上げ装置。 - 【請求項3】 請求項1または2に記載の電子テキスト
読み上げ装置において、 音声合成部は、記号行中に存在する記号以外の文字を読
み上げるよう構成されたことを特徴とする電子テキスト
読み上げ装置。 - 【請求項4】 請求項1〜3のいずれかに記載の電子テ
キスト読み上げ装置において、 テキスト中から計算機が直接理解する特殊文字列を抽出
する特殊文字列抽出部と、 前記特殊文字列抽出部で抽出した特殊文字列に対して予
め設定された制御コードを付与する制御コード挿入部
と、 前記制御コード挿入部で付与された制御コードに基づ
き、特殊文字列の種類に応じた特殊音を発声する音声合
成部とを備えたことを特徴とする電子テキスト読み上げ
装置。 - 【請求項5】 請求項1〜4のいずれかに記載の電子テ
キスト読み上げ装置において、 テキスト中から重要部分を抽出する要約処理部と、 前記要約処理部で抽出した重要部分に対して予め設定さ
れた制御コードを付与する制御コード挿入部と、 前記制御コード挿入部で付与された制御コードに基づ
き、重要部分に応じた特殊音の発声または読み上げ方の
変更のうち少なくとも一方を行う音声合成部とを備えた
ことを特徴とする電子テキスト読み上げ装置。 - 【請求項6】 請求項5に記載の電子テキスト読み上げ
装置において、 音声合成部は、重要部分を繰り返し読み上げるよう構成
されたことを特徴とする電子テキスト読み上げ装置。 - 【請求項7】 請求項1〜6のいずれかに記載の電子テ
キスト読み上げ装置において、 テキスト中から固有名詞を抽出する固有名詞抽出部と、 前記固有名詞抽出部で抽出した固有名詞の位置に対して
予め設定された制御コードを付与する制御コード挿入部
と、 前記制御コード挿入部で付与された制御コードに基づ
き、固有名詞に応じた特殊音の発声または読み上げ方の
変更のうち少なくとも一方を行う音声合成部とを備えた
ことを特徴とする電子テキスト読み上げ装置。 - 【請求項8】 請求項7に記載の電子テキスト読み上げ
装置において、 漢字の説明フレーズを作成する説明フレーズ作成部と、 固有名詞に漢字が含まれる場合は、前記説明フレーズ作
成部で作成した当該漢字の説明フレーズを用いて前記固
有名詞に対応した表記説明文を作成する制御コード挿入
部と、 前記制御コード挿入部で作成された表記説明文に基づ
き、固有名詞抽出部で抽出した固有名詞の読み上げの後
に前記表記説明文を読み上げる音声合成部とを備えたこ
とを特徴とする電子テキスト読み上げ装置。 - 【請求項9】 請求項1〜8のいずれかに記載の電子テ
キスト読み上げ装置において、 内部状態と、読み上げ方の変更または特殊音の発声を表
す制御コードとの対応を示す対応表を備え、 制御コード挿入部は、前記対応表に基づいて制御コード
を付与するよう構成されたことを特徴とする電子テキス
ト読み上げ装置。 - 【請求項10】 請求項1〜9のいずれかに記載の電子
テキスト読み上げ装置において、 読み上げ方の変更は、音量の変更、読み上げ速度の変
更、男性音声と女性音声の変更、音質変更のうち少なく
とも一つを含むことを特徴とする電子テキスト読み上げ
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000320134A JP2002132282A (ja) | 2000-10-20 | 2000-10-20 | 電子テキスト読み上げ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000320134A JP2002132282A (ja) | 2000-10-20 | 2000-10-20 | 電子テキスト読み上げ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002132282A true JP2002132282A (ja) | 2002-05-09 |
Family
ID=18798466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000320134A Pending JP2002132282A (ja) | 2000-10-20 | 2000-10-20 | 電子テキスト読み上げ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002132282A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006098695A (ja) * | 2004-09-29 | 2006-04-13 | Clarion Co Ltd | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
US7230177B2 (en) | 2002-11-19 | 2007-06-12 | Yamaha Corporation | Interchange format of voice data in music file |
JPWO2008114453A1 (ja) * | 2007-03-20 | 2010-07-01 | 富士通株式会社 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
JP5104762B2 (ja) * | 2006-10-23 | 2012-12-19 | 日本電気株式会社 | コンテンツ要約システムと方法とプログラム |
WO2014069220A1 (ja) * | 2012-10-31 | 2014-05-08 | Necカシオモバイルコミュニケーションズ株式会社 | 再生装置、設定装置、再生方法およびプログラム |
WO2022065603A1 (ko) * | 2020-09-25 | 2022-03-31 | 주식회사 딥브레인에이아이 | 텍스트 기반의 음성 합성 방법 및 장치 |
WO2022249362A1 (ja) * | 2021-05-26 | 2022-12-01 | 株式会社KPMG Ignition Tokyo | テキストを合成音声に変換する音声合成 |
-
2000
- 2000-10-20 JP JP2000320134A patent/JP2002132282A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7230177B2 (en) | 2002-11-19 | 2007-06-12 | Yamaha Corporation | Interchange format of voice data in music file |
JP2006098695A (ja) * | 2004-09-29 | 2006-04-13 | Clarion Co Ltd | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
JP4684609B2 (ja) * | 2004-09-29 | 2011-05-18 | クラリオン株式会社 | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
JP5104762B2 (ja) * | 2006-10-23 | 2012-12-19 | 日本電気株式会社 | コンテンツ要約システムと方法とプログラム |
JPWO2008114453A1 (ja) * | 2007-03-20 | 2010-07-01 | 富士通株式会社 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
JP4930584B2 (ja) * | 2007-03-20 | 2012-05-16 | 富士通株式会社 | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
WO2014069220A1 (ja) * | 2012-10-31 | 2014-05-08 | Necカシオモバイルコミュニケーションズ株式会社 | 再生装置、設定装置、再生方法およびプログラム |
CN104756181A (zh) * | 2012-10-31 | 2015-07-01 | Nec卡西欧移动通信株式会社 | 回放装置、设置装置、回放方法及程序 |
JPWO2014069220A1 (ja) * | 2012-10-31 | 2016-09-08 | 日本電気株式会社 | 再生装置、設定装置、再生方法およびプログラム |
US9728201B2 (en) | 2012-10-31 | 2017-08-08 | Nec Corporation | Playback apparatus, setting apparatus, playback method, and program |
CN104756181B (zh) * | 2012-10-31 | 2017-10-27 | 日本电气株式会社 | 回放装置、设置装置、回放方法及程序 |
WO2022065603A1 (ko) * | 2020-09-25 | 2022-03-31 | 주식회사 딥브레인에이아이 | 텍스트 기반의 음성 합성 방법 및 장치 |
US12080270B2 (en) | 2020-09-25 | 2024-09-03 | Deepbrain Ai Inc. | Method and apparatus for text-based speech synthesis |
WO2022249362A1 (ja) * | 2021-05-26 | 2022-12-01 | 株式会社KPMG Ignition Tokyo | テキストを合成音声に変換する音声合成 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7062437B2 (en) | Audio renderings for expressing non-audio nuances | |
US6442524B1 (en) | Analyzing inflectional morphology in a spoken language translation system | |
WO2000045376A1 (en) | A method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
WO2000045377A1 (en) | A method and apparatus for performing spoken language translation | |
WO2000045290A9 (en) | A method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
WO2000045374A9 (en) | A method and portable apparatus for performing spoken language translation | |
CN100547654C (zh) | 语音合成装置 | |
CN115249480A (zh) | 基于北斗短报文的语音文字的转换方法及相关装置 | |
JP3270356B2 (ja) | 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP2002132282A (ja) | 電子テキスト読み上げ装置 | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JPH10171485A (ja) | 音声合成装置 | |
JP3366253B2 (ja) | 音声合成装置 | |
Campbell | On the structure of spoken language | |
JP3589972B2 (ja) | 音声合成装置 | |
JP3668583B2 (ja) | 音声合成装置及びその方法 | |
CN114822489A (zh) | 文本转写方法和文本转写装置 | |
JP2005181840A (ja) | 音声合成装置及び音声合成プログラム | |
Dessai et al. | Development of Konkani TTS system using concatenative synthesis | |
JP4056647B2 (ja) | 波形接続型音声合成装置および方法 | |
JPH11250063A (ja) | 検索装置及び検索方法 | |
Caroro et al. | A Text-To-Speech using Rule-based and Data-driven Prosody Techniques with Concatenative Synthesis of the Philippines’ Bisaya Dialect | |
KR100959494B1 (ko) | 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Prathibha et al. | Web-enabled Speech Synthesizer for Tamil |