[go: up one dir, main page]

JP2002312157A - 音声ガイダンスモニタソフトウェア - Google Patents

音声ガイダンスモニタソフトウェア

Info

Publication number
JP2002312157A
JP2002312157A JP2001151701A JP2001151701A JP2002312157A JP 2002312157 A JP2002312157 A JP 2002312157A JP 2001151701 A JP2001151701 A JP 2001151701A JP 2001151701 A JP2001151701 A JP 2001151701A JP 2002312157 A JP2002312157 A JP 2002312157A
Authority
JP
Japan
Prior art keywords
voice
voice guidance
tag
guidance
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001151701A
Other languages
English (en)
Inventor
Yoshito Suzuki
芳人 鈴木
Masayoshi Kawashima
正義 河島
Toshio Yokobori
敏男 横堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001151701A priority Critical patent/JP2002312157A/ja
Publication of JP2002312157A publication Critical patent/JP2002312157A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【目的】 ホームページや電子メールに音声によるガイ
ダンス機能を付加し、高齢者や視覚障害者にも迷わずに
安心してホームページ閲覧が可能な音声ガイダンスモニ
タソフトウェアを提供する。 【構成】 Webサーバ(100)より、音声ガイダン
ス付きタグ(20)を含むHTMLファイル(104)
を、インターネット(101)を介してクライアント端
末(102)にダウンロードする。HTMLファイル
(104)を受け取ったクライアント端末(102)で
は、音声ガイダンスモニタソフトウェア(10)により
音声ガイダンス付きタグ(20)を解釈し、音声ガイダ
ンス付きタグ(20)に含まれるガイダンス文(23)
をクライアント端末(102)に搭載された音声合成エ
ンジン(30)に渡たす。音声合成エンジン(30)に
渡たされたガイダンス文(23)は、言語辞書(31)
により音声解析され、音声解析後、波形辞書(32)に
より音声ファイル(33)に変換される。音声ファイル
(33)はクライアント端末(102)のスピーカ(1
03)から、合成音(105)として出力される.

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クライアント/サ
ーバ構成のCSS(クライアントサーバシステム)、と
りわけインターネットやイントラネットを利用したコン
テンツサービスにおいて、ホームページや電子メールに
音声ガイダンスを付加できる音声ガイダンスモニタソフ
トウェアに関するものである。
【0002】
【従来の技術】音声ガイダンス機能は、WAVやMID
などの形式の音声ファイルを添付することにより、ネッ
トスケープナビゲータなどのブラウザでも実現可能であ
る。この技術は、ガイダンス情報をはじめから音声形式
にして添付し、そのまま再生することが前提であり、音
声ファイルのデータ量が大きくなり、ダウンロードに時
間がかかることや、そのデータを保存するための大きな
メモリ容量を必要とするなどの欠点がある。これらを解
決するため、ガイダンス情報をテキスト形式でHTML
ファイルや電子メール本文の中に記述できるタグを設
け、クライアント端末のメモリ上に常駐するソフトウェ
アでタグを解釈して、テキスト形式のガイダンス情報
を、クライアント端末のスピーカから、合成音として出
力できるようにする。
【0003】
【発明が解決しようとする課題】ホームページの内容が
豊富になるに従い、決められたスペースに多くの情報を
詰め込むため、記述が細かくなったり、イメージ情報を
多く使って見栄えのするホームページが氾濫するように
なった。このようなホームページに慣れ親しんだ若者な
ら、快適に閲覧できるが、子供や高齢者では、情報の多
さに戸惑いを感じ、好みの情報までなかなかたどり着け
ないというのが実情であり、子供や高齢者にも迷わずに
安心してホームページを閲覧したり、電子メールを行っ
たりできるようにするかという問題がある。
【0004】また、インターネットの広がりにより、パ
ソコンだけでなく携帯電話や携帯端末機、さらには家庭
の固定電話でもコンテンツサービスが行われるようにな
った。これらの機器では、パソコンとは反対に、表示画
面が小さいので短いテキストによる簡単な説明しかなさ
れない。インターネットなどの情報技術を熟知していな
い人々には、これらの機器は簡単には使いこなせないと
いう問題が残る。
【0005】本発明は、上記の点に鑑みなされたもの
で、ホームページや電子メールに音声によるガイダンス
機能を付加し、子供や高齢者にも迷わずに安心してホー
ムページ閲覧や電子メールの交換が可能となる、クライ
アント端末のメモリ上に常駐する音声ガイダンスモニタ
ソフトウェアを提供することを目的とする。
【0006】
【課題を解決するための手段】前記課題を解決し目的を
達成するために、本発明の音声ガイダンスモニタソフト
ウェアは下記に示す如く構成されていることを特徴とし
ている。なお、下記以外の本発明の特徴ある構成につい
ては実施形態の中で明らかにする。
【0007】本発明の音声ガイダンスモニタソフトウェ
アは、クライアントサーバシステムにおいて、サーバか
ら送信される、音声によるガイダンス機能を可能にす
る、音声ガイダンス付きタグを含むテキストファイルに
対して、クライアント端末のメモリ上に常駐し、音声ガ
イダンス付きタグと開始タグに含まれる属性を、認識し
解釈できる手段と、前記属性に従い、音声ガンダンス付
きタグの開始タグと終了タグに挟まれたガイダンス文
を、音声ファイルに変換するため音声合成エンジンへ転
送する手段と、を備えたことを特徴としている。
【0008】
【発明の実施の形態】図1は本発明が適用されるシステ
ム構成図である。図1において、Webサーバ100よ
り、音声ガイダンス付きタグ20を含むHTMLファイ
ル104を、インターネット101を介してクライアン
ト端末102にダウンロードする。HTMLファイル1
04を受け取ったクライアント端末102では、音声ガ
イダンスモニタソフトウェア10により音声ガイダンス
付きタグ20を解釈し、音声ガイダンス付きタグ20に
含まれるガイダンス文23をクライアント端末102に
搭載された音声合成エンジン30に渡たす。音声合成エ
ンジン30に渡たされたガイダンス文23は、言語辞書
31により音声解析され、音声解析後、波形辞書32に
より音声ファイル33に変換される。音声ファイル33
はクライアント端末102のスピーカ103から、合成
音105として出力される。
【0009】図2は音声ガイダンス付きタグ20の要素
21および属性22の例である。要素21および属性2
2を「<」、「>」でくくる。属性22は指定しなくて
もよい。また、空白で区切り、複数個指定してもよい。
ガイダンス文23の文字コード24はSHIFT−JI
Sなどを用いる。ガイダンス文23の最大長は論理上の
制限を設けないが、音声合成エンジン30やハードウェ
ア環境により影響を受けることが考えられる。
【0010】図3は本発明の一実施例の音声ガイダンス
モニタソフトウェア10による音声ガイダンス付きタグ
20の解釈動作のフローチャートである。音声ガイダン
スモニタソフトウェア10は、HTMLファイル104
の音声ガイダンス付きタグ20を検出すると、属性22
を解釈しガイダンス文23の処理の仕方を設定する。そ
して、音声合成プログラム35が属性22の設定に従
い、ガイダンス文23を音声合成エンジン30の決めら
れた手順に従い、音声ファイル33に変換しスピーカ1
03から合成音105を出力する。
【0011】図4は音声合成プログラム35が音声合成
エンジン30の手順に従いガイダンス文23を音声ファ
イル33に変換するまでの手順を示したものである。ガ
イダンス文23は属性22の設定ファイル25と音声合
成エンジン30の言語処理ライブラリ36に従い、言語
処理変換プログラム37で音声解析され、表音文字列フ
ァイル38に変換される。さらに、この表音文字列ファ
イル38は属性22の設定ファイル25と音声合成エン
ジン30の波形処理ライブラリ40に従い、波形処理変
換プログラム39で音声ファイル33に変換される。音
声ファイル33の再生方法は、クライアント端末102
のOSの機能に依存する。
【0012】図5は本発明の一実施例の音声ガイダンス
モニタソフトウェア10による記述および音声ガイダン
スされる例である。オープニングガイダンスとして音声
ガイダンス付きタグ20が単独で使用される場合であ
る。オープニングガイダンスとして複数記述すれば、連
続して発声させることも可能である。
【0013】図6は本発明の一実施例の音声ガイダンス
付きタグ20そのものの機能を、ANCHORタグ(<
A>)の属性として使うときの記述および音声ガイダン
スされる例である。ANCHORタグによるリンクが選
択されたときGUIDで指定されたテキストが発声され
る。
【0014】図7は本発明の一実施例の音声ガイダンス
付きタグ20のVOL属性41を指定したときの記述お
よび音声ガイダンスされる例である。発声のボリューム
を指定する。未指定の場合、初期値が適用される。ハー
ドウェアによるボリュームスイッチとの連動はしない。
【0015】図8は本発明の一実施例の音声ガイダンス
付きタグ20のSPEED属性42を指定したときの記
述および音声ガイダンスされる例である。読み上げのス
ピードを指定する。未指定の場合、初期値が適用され
る。
【0016】図9は本発明の一実施例の音声ガイダンス
付きタグ20のVTYPE属性43を指定したときの記
述および音声ガイダンスされる例である。男声、女声な
どの声質を指定する。未指定の場合、初期値が適用され
る。
【0017】図10は本発明の一実施例の音声ガイダン
ス付きタグ20のPITCH属性44を指定したときの
記述および音声ガイダンスされる例である。声の高さを
指定する。未指定の場合、初期値が適用される。
【0018】図11は本発明の一実施例の音声ガイダン
ス付きタグ20のTONE属性45を指定したときの記
述および音声ガイダンスされる例である。高域強調を行
うかどうかを指定する。未指定の場合、初期値が適用さ
れる。
【0019】図12は本発明の一実施例の音声ガイダン
ス付きタグ20のSIGN属性46を指定したときの記
述および音声ガイダンスされる例である。記号読みモー
ドを指定する。未指定の場合、初期値が適用される。
【0020】図13は本発明の一実施例の音声ガイダン
ス付きタグ20のDISP属性47を指定したときの記
述および音声ガイダンスされる例である。ガイダンス文
23を表示するかどうかを指定する。未指定の場合、初
期値が適用される。
【0021】図14は本発明の一実施例の音声ガイダン
ス付きタグ20のNUM属性48を指定したときの記述
および音声ガイダンスされる例である。数字の読み方を
指定する。未指定の場合、初期値が適用される。
【0022】図15は本発明の一実施例の音声ガイダン
ス付きタグ20のMODE属性49を指定したときの記
述および音声ガイダンスされる例である。文書コマンド
モードを指定する。未指定の場合、初期値が適用され
る。特殊な発音の指示、及びデフォルトの発音の矯正が
可能である。
【0023】図16は本発明の一実施例の音声ガイダン
ス付きタグ20のREPEAT属性50を指定したとき
の記述および音声ガイダンスされる例である。ガイダン
ス読み上げの繰り返し回数を指定する。未指定の場合、
繰り返しは行われない。
【0024】図17は本発明の一実施例の音声ガイダン
ス付きタグ20のSILENT属性51を指定したとき
の記述および音声ガイダンスされる例である。ガイダン
ス発声までの待ち時間(秒)の設定を行う。未指定の場
合、待ち時間はなくて即座に発声される。
【0025】図18は本発明の一実施例の音声ガイダン
ス付きタグ20のECHO属性52を指定したときの記
述および音声ガイダンスされる例である。ガイダンスへ
の見出しの設定を行う。未指定の場合、オープニングガ
イダンスと解釈される。ECHO属性52を指定するこ
とで、クリッカブルなガイダンスとして機能させること
が可能である。見出しをクリック(又はカーソル移動と
選択)することにより、ユーザは任意のタイミングでガ
イダンスを聞くことができる。
【0026】
【発明の効果】本発明の音声ガイダンスモニタソフトウ
ェアおよび音声ガイダンス付きタグ拡張の利点として、
以下のような点が挙げられる。音声ガイダンス実現を、
音声ファイルを添付する代わりに、テキスト形式のファ
イルの追加で行えるため、音声ファイルを添付したホー
ムページよりもコンパクトなホームページを作成でき
る。また、コンテンツの提供者は、既製のHTMLファ
イルに音声ガイダンス付きタグを追加するだけで容易に
音声ガイダンス機能を実現できるようになる。また、複
雑なホームページでも、音声ガイダンス機能により閲覧
の仕方を丁寧に説明できるので、子供や高齢者では、迷
わずに安心してホームページの閲覧や電子メールの交換
ができるようになる。さらに、インターネットの広がり
により、パソコンだけでなく携帯電話や携帯端末機、さ
らには家庭の固定電話でもコンテンツサービスが行われ
るようになったが、これらの機器では、パソコンとは反
対に、表示画面が小さいので短いテキストによる簡単な
説明しかなされないため、インターネットなどの情報技
術を熟知してない人々には、これらの機器は簡単には使
いこなせなかったが、音声ガイダンス機能を使って表示
画面で不足している説明を補うことで、安心して使える
ようになる。
【図面の簡単な説明】
【図1】本発明に係わるシステム構成図である。
【図2】本発明に係わる音声ガイダンス付きタグの要素
および属性の例である。
【図3】本発明の一実施例の音声ガイダンス付きブラウ
ザによる音声ガイダンス付きタグの解釈動作のフローチ
ャートである。
【図4】本発明の一実施例の音声合成プログラムが音声
合成エンジンの手順に従いガイダンス文を音声ファイル
に変換するまでの手順を示した図である。
【図5】本発明の一実施例の音声ガイダンス付きブラウ
ザによる記述および音声ガイダンスされる例である。
【図6】本発明の一実施例の音声ガイダンス付きタグそ
のものの機能を、ANCHORタグ(<A>)の属性と
して使うときの記述および音声ガイダンスされる例であ
る。
【図7】本発明の一実施例の音声ガイダンス付きタグの
VOL属性を指定したときの記述および音声ガイダンス
される例である。
【図8】本発明の一実施例の音声ガイダンス付きタグの
SPEED属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図9】本発明の一実施例の音声ガイダンス付きタグの
VTYPE属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図10】本発明の一実施例の音声ガイダンス付きタグ
のPITCH属性を指定したときの記述および音声ガイ
ダンスされる例である。
【図11】本発明の一実施例の音声ガイダンス付きタグ
のTONE属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図12】本発明の一実施例の音声ガイダンス付きタグ
のSIGN属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図13】本発明の一実施例の音声ガイダンス付きタグ
のDISP属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図14】本発明の一実施例の音声ガイダンス付きタグ
のNUM属性を指定したときの記述および音声ガイダン
スされる例である。
【図15】本発明の一実施例の音声ガイダンス付きタグ
のMODE属性を指定したときの記述および音声ガイダ
ンスされる例である。
【図16】本発明の一実施例の音声ガイダンス付きタグ
のREPEAT属性を指定したときの記述および音声ガ
イダンスされる例である。
【図17】本発明の一実施例の音声ガイダンス付きタグ
のSILENT属性を指定したときの記述および音声ガ
イダンスされる例である。
【図18】本発明の一実施例の音声ガイダンス付きタグ
のECHO属性を指定したときの記述および音声ガイダ
ンスされる例である。
【符号の説明】
10・・・音声ガイダンス付きブラウザ 20・・・音声ガイダンス付きタグ 21・・・要素 22・・・属性 23・・・ガイダンス文 24・・・文字コード 25・・・設定ファイル 30・・・音声合成エンジン 31・・・言語辞書 32・・・波形辞書 33・・・音声ファイル 35・・・音声合成プログラム 36・・・言語処理ライブラリ 37・・・言語処理変換プログラム 38・・・表音文字列ファイル 39・・・波形処理変換プログラム 40・・・波形処理ライブラリ 41・・・VOL属性 42・・・SPEED属性 43・・・VTYPE属性 44・・・PITCH属性 45・・・TONE属性 46・・・SIGN属性 47・・・DISP属性 48・・・NUM属性 49・・・MODE属性 50・・・REPEAT属性 51・・・SILENT属性 52・・・ECHO属性 100・・・Webサーバ 101・・・インターネット 102・・・クライアント端末 103・・・スピーカ 104・・・HTMLファイル 105・・・合成音

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】クライアントサーバシステムにおいて、サ
    ーバから送信される、音声によるガイダンス機能を可能
    にする、音声ガイダンス付きタグを含むテキストファイ
    ルに対して、クライアント端末のメモリ上に常駐し、音
    声ガイダンス付きタグと開始タグに含まれる属性を、認
    識し解釈できる手段と、 前記属性に従い、音声ガンダンス付きタグの開始タグと
    終了タグに挟まれたガイダンス文を、音声ファイルに変
    換するため音声合成エンジンへ転送する手段と、 を備えたことを特徴とする音声ガイダンスモニタソフト
    ウェア。
  2. 【請求項2】前記クライアントサーバシステムがインタ
    ーネットやイントラネットであることを特徴とする請求
    項1に記載の音声ガイダンスモニタソフトウェア。
  3. 【請求項3】前記クライアントサーバシステムが電子メ
    ールシステムであることを特徴とする請求項1に記載の
    音声ガイダンスモニタソフトウェア。
  4. 【請求項4】前記属性のうち、ボリューム、読み上げス
    ピード、声質、声の高さなど、予めクライアント端末の
    設定ファイルに保存されているユーザ設定属性を、前記
    設定ファイルから読んでくる手段と、前記ユーザ設定属
    性と、開始タグに含まれる属性を合わせて解釈できる手
    段を備えたことを特徴とする請求項1に記載の音声ガイ
    ダンスモニタソフトウェア。
JP2001151701A 2001-04-13 2001-04-13 音声ガイダンスモニタソフトウェア Pending JP2002312157A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001151701A JP2002312157A (ja) 2001-04-13 2001-04-13 音声ガイダンスモニタソフトウェア

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001151701A JP2002312157A (ja) 2001-04-13 2001-04-13 音声ガイダンスモニタソフトウェア

Publications (1)

Publication Number Publication Date
JP2002312157A true JP2002312157A (ja) 2002-10-25

Family

ID=18996494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001151701A Pending JP2002312157A (ja) 2001-04-13 2001-04-13 音声ガイダンスモニタソフトウェア

Country Status (1)

Country Link
JP (1) JP2002312157A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006276800A (ja) * 2005-03-30 2006-10-12 Kyocera Corp 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
JP2011095382A (ja) * 2009-10-28 2011-05-12 Kyocera Corp 音声合成機能付き文字情報表示装置、およびその音声合成方法
WO2015056836A1 (ko) * 2013-10-17 2015-04-23 인포뱅크 주식회사 애플리케이션 처리 단말 장치, 방법 및 기록매체
WO2023062816A1 (ja) * 2021-10-15 2023-04-20 パイオニア株式会社 コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006276800A (ja) * 2005-03-30 2006-10-12 Kyocera Corp 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
US7885814B2 (en) 2005-03-30 2011-02-08 Kyocera Corporation Text information display apparatus equipped with speech synthesis function, speech synthesis method of same
JP2011095382A (ja) * 2009-10-28 2011-05-12 Kyocera Corp 音声合成機能付き文字情報表示装置、およびその音声合成方法
WO2015056836A1 (ko) * 2013-10-17 2015-04-23 인포뱅크 주식회사 애플리케이션 처리 단말 장치, 방법 및 기록매체
WO2023062816A1 (ja) * 2021-10-15 2023-04-20 パイオニア株式会社 コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体

Similar Documents

Publication Publication Date Title
JP4225703B2 (ja) 情報アクセス方法、情報アクセスシステムおよびプログラム
US8781840B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
RU2352979C2 (ru) Синхронное понимание семантических объектов для высокоинтерактивного интерфейса
US8555151B2 (en) Method and apparatus for coupling a visual browser to a voice browser
US6188985B1 (en) Wireless voice-activated device for control of a processor-based host system
US20040153323A1 (en) Method and system for voice activating web pages
US20110029876A1 (en) Clickless navigation toolbar for clickless text-to-speech enabled browser
JP3864197B2 (ja) 音声クライアント端末装置
JP2001014319A (ja) ハイパーテキストアクセス装置
JPH10240493A (ja) Javaへ音声認識能力を加えるシステムと方法
JP7200533B2 (ja) 情報処理装置およびプログラム
JP4467226B2 (ja) ウェブ対応音声認識用サーバの方法および記録媒体
JP2002312157A (ja) 音声ガイダンスモニタソフトウェア
JP2003067177A (ja) ウェブ対応認識アーキテクチャを有するシステムおよびその方法
JP2002169750A (ja) ブラウザ搭載装置
Liu et al. Improving Web access for visually impaired users
JP2002244965A (ja) 音声ガイダンス付きブラウザ
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
JP2020204683A (ja) 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム
JPH09258785A (ja) 情報処理方法および情報処理装置
JP2009086597A (ja) テキスト音声変換サービスシステム及び方法
Narayanaswami et al. An online prototype speech-enabled information access tool using Java Speech Application Programming Interface
Enden Java speech API
Raggett et al. Voice Browsers
TW389861B (en) Method for real-time voice and text paging over Internet