JP2000285063A - 情報処理装置および情報処理方法、並びに媒体 - Google Patents
情報処理装置および情報処理方法、並びに媒体Info
- Publication number
- JP2000285063A JP2000285063A JP11092862A JP9286299A JP2000285063A JP 2000285063 A JP2000285063 A JP 2000285063A JP 11092862 A JP11092862 A JP 11092862A JP 9286299 A JP9286299 A JP 9286299A JP 2000285063 A JP2000285063 A JP 2000285063A
- Authority
- JP
- Japan
- Prior art keywords
- text data
- server
- voice
- receiving
- transmitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000010365 information processing Effects 0.000 title claims description 36
- 238000003672 processing method Methods 0.000 title claims description 12
- 238000000034 method Methods 0.000 claims description 35
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 238000003786 synthesis reaction Methods 0.000 claims description 23
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Abstract
(57)【要約】
【課題】 キーボードの操作に熟練していなくても、容
易に、チャットを楽しむことができるようにする。 【解決手段】 チャットクライアントであるパソコン1
では、入力された音声が音声認識され、その音声認識結
果としてのテキストデータが、チャットサーバであるサ
ーバ2に送信される。また、パソコン1では、サーバ2
から送信されてくるテキストデータが受信され、そのテ
キストデータに基づいて、音声合成が行われる。そし
て、そのテキストデータに対応する音声(合成音)が出
力される。
易に、チャットを楽しむことができるようにする。 【解決手段】 チャットクライアントであるパソコン1
では、入力された音声が音声認識され、その音声認識結
果としてのテキストデータが、チャットサーバであるサ
ーバ2に送信される。また、パソコン1では、サーバ2
から送信されてくるテキストデータが受信され、そのテ
キストデータに基づいて、音声合成が行われる。そし
て、そのテキストデータに対応する音声(合成音)が出
力される。
Description
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び情報処理方法、並びに媒体に関し、特に、例えば、キ
ーボード等の操作に熟練していなくても、チャットを楽
しむことができるようにする情報処理装置および情報処
理方法、並びに媒体に関する。
び情報処理方法、並びに媒体に関し、特に、例えば、キ
ーボード等の操作に熟練していなくても、チャットを楽
しむことができるようにする情報処理装置および情報処
理方法、並びに媒体に関する。
【0002】
【従来の技術】例えば、遠隔地にいる多数のユーザどう
しが、容易にコミュニケーションを図るためのツールと
しては、例えば、チャットシステムがある。チャットシ
ステムにおいては、サーバにログインしているあるクラ
イアントから送信されてくるテキストデータが、サーバ
で受信され、他のログインしているクライアントに送信
されるようになっており、これにより、遠隔地にいる多
数のユーザどうしが、容易にコミュニケーションを図る
ことができるようになっている。
しが、容易にコミュニケーションを図るためのツールと
しては、例えば、チャットシステムがある。チャットシ
ステムにおいては、サーバにログインしているあるクラ
イアントから送信されてくるテキストデータが、サーバ
で受信され、他のログインしているクライアントに送信
されるようになっており、これにより、遠隔地にいる多
数のユーザどうしが、容易にコミュニケーションを図る
ことができるようになっている。
【0003】ここで、従来においては、ある1のサーバ
においては、そのサーバに接続しているユーザどうしの
間でしかチャットを行うことができなかったが、最近急
速に普及してきたインターネットでは、IRC(Intern
et Relay Chat)方式と呼ばれるチャット方式によっ
て、IRCサーバと呼ばれるサーバのいずれかに接続す
れば、そのサーバとリンクしているサーバと接続してい
るクライアントとも、チャットを行うことができる。な
お、IRCについては、IETF(Internet Engineeri
ng Task Force)のRFC(Request For Comments)1
459に規定されている。
においては、そのサーバに接続しているユーザどうしの
間でしかチャットを行うことができなかったが、最近急
速に普及してきたインターネットでは、IRC(Intern
et Relay Chat)方式と呼ばれるチャット方式によっ
て、IRCサーバと呼ばれるサーバのいずれかに接続す
れば、そのサーバとリンクしているサーバと接続してい
るクライアントとも、チャットを行うことができる。な
お、IRCについては、IETF(Internet Engineeri
ng Task Force)のRFC(Request For Comments)1
459に規定されている。
【0004】
【発明が解決しようとする課題】ところで、チャットシ
ステムでは、サーバとクライアントとの間で、テキスト
データがリアルタイムで送受信されるが、従来において
は、チャットを行うためには、ユーザは、キーボードを
操作して、テキストデータを入力しなければならない。
従って、キーボードの操作に熟練していないユーザは、
チャットを楽しむことが困難であった。また、キーボー
ドから入力した平仮名は、仮名漢字変換システム(フロ
ントエンドプロセッサ)によって漢字混じりの文章にし
なければ読みにくく、従って、仮名漢字変換システムの
操作にも熟練する必要があった。
ステムでは、サーバとクライアントとの間で、テキスト
データがリアルタイムで送受信されるが、従来において
は、チャットを行うためには、ユーザは、キーボードを
操作して、テキストデータを入力しなければならない。
従って、キーボードの操作に熟練していないユーザは、
チャットを楽しむことが困難であった。また、キーボー
ドから入力した平仮名は、仮名漢字変換システム(フロ
ントエンドプロセッサ)によって漢字混じりの文章にし
なければ読みにくく、従って、仮名漢字変換システムの
操作にも熟練する必要があった。
【0005】そこで、キーボードを操作することなく、
遠隔地にいる多数のユーザどうしがコミュニケーション
を図ることのできるツールとして、例えば、特開平6−
274596号公報に開示されているような、多数の端
末間で音声データのやりとりを行うシステムがある。
遠隔地にいる多数のユーザどうしがコミュニケーション
を図ることのできるツールとして、例えば、特開平6−
274596号公報に開示されているような、多数の端
末間で音声データのやりとりを行うシステムがある。
【0006】しかしながら、特開平6−274596号
公報に開示されているシステムでは、音声データをその
まま送信するため、データ量が多く、広帯域の伝送路が
必要となる。また、特開平6−274596号公報に
は、音声データを圧縮して送信することが開示されてい
るが、高圧縮の場合には、音質が低下し、低圧縮の場合
には、広帯域の伝送路が必要となる。
公報に開示されているシステムでは、音声データをその
まま送信するため、データ量が多く、広帯域の伝送路が
必要となる。また、特開平6−274596号公報に
は、音声データを圧縮して送信することが開示されてい
るが、高圧縮の場合には、音質が低下し、低圧縮の場合
には、広帯域の伝送路が必要となる。
【0007】本発明は、このような状況に鑑みてなされ
たものであり、狭帯域の伝送路であっても、ユーザどう
しが、容易にコミュニケーションを図ることができるよ
うにするものである。
たものであり、狭帯域の伝送路であっても、ユーザどう
しが、容易にコミュニケーションを図ることができるよ
うにするものである。
【0008】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、入力された音声を音声認識し、その音声認識
結果を、テキストデータで出力する音声認識手段と、音
声認識結果としてのテキストデータを、サーバに送信す
る送信手段とを含むことを特徴とする。
理装置は、入力された音声を音声認識し、その音声認識
結果を、テキストデータで出力する音声認識手段と、音
声認識結果としてのテキストデータを、サーバに送信す
る送信手段とを含むことを特徴とする。
【0009】請求項5に記載の情報処理方法は、入力さ
れた音声を音声認識し、その音声認識結果を、テキスト
データで出力する音声認識ステップと、音声認識結果と
してのテキストデータを、サーバに送信する送信ステッ
プとを含むことを特徴とする。
れた音声を音声認識し、その音声認識結果を、テキスト
データで出力する音声認識ステップと、音声認識結果と
してのテキストデータを、サーバに送信する送信ステッ
プとを含むことを特徴とする。
【0010】請求項6に記載の媒体が情報処理装置に実
行させるプログラムは、入力された音声を音声認識し、
その音声認識結果を、テキストデータで出力する音声認
識ステップと、音声認識結果としてのテキストデータ
を、サーバに送信する送信ステップとを含むことを特徴
とする。
行させるプログラムは、入力された音声を音声認識し、
その音声認識結果を、テキストデータで出力する音声認
識ステップと、音声認識結果としてのテキストデータ
を、サーバに送信する送信ステップとを含むことを特徴
とする。
【0011】請求項7に記載の情報処理装置は、サーバ
から送信されてくるテキストデータを受信する受信手段
と、サーバからのテキストデータに基づいて、音声合成
を行い、そのテキストデータに対応する合成音を出力す
る音声合成手段とを含むことを特徴とする。
から送信されてくるテキストデータを受信する受信手段
と、サーバからのテキストデータに基づいて、音声合成
を行い、そのテキストデータに対応する合成音を出力す
る音声合成手段とを含むことを特徴とする。
【0012】請求項9に記載の情報処理方法は、サーバ
から送信されてくるテキストデータを受信する受信ステ
ップと、サーバからのテキストデータに基づいて、音声
合成を行い、そのテキストデータに対応する合成音を出
力する音声合成ステップとを含むことを特徴とする。
から送信されてくるテキストデータを受信する受信ステ
ップと、サーバからのテキストデータに基づいて、音声
合成を行い、そのテキストデータに対応する合成音を出
力する音声合成ステップとを含むことを特徴とする。
【0013】請求項10に記載の媒体が情報処理装置に
実行させるプログラムは、サーバから送信されてくるテ
キストデータを受信する受信ステップと、サーバからの
テキストデータに基づいて、音声合成を行い、そのテキ
ストデータに対応する合成音を出力する音声合成ステッ
プとを含むことを特徴とする。
実行させるプログラムは、サーバから送信されてくるテ
キストデータを受信する受信ステップと、サーバからの
テキストデータに基づいて、音声合成を行い、そのテキ
ストデータに対応する合成音を出力する音声合成ステッ
プとを含むことを特徴とする。
【0014】請求項1に記載の情報処理装置および請求
項5に記載の情報処理方法、並びに請求項6に記載の媒
体においては、入力された音声が音声認識され、その音
声認識結果が、テキストデータで出力される。そして、
その音声認識結果としてのテキストデータが、サーバに
送信される。
項5に記載の情報処理方法、並びに請求項6に記載の媒
体においては、入力された音声が音声認識され、その音
声認識結果が、テキストデータで出力される。そして、
その音声認識結果としてのテキストデータが、サーバに
送信される。
【0015】請求項7に記載の情報処理装置および請求
項9に記載の情報処理方法、並びに請求項10に記載の
媒体においては、サーバから送信されてくるテキストデ
ータが受信され、そのサーバからのテキストデータに基
づいて、音声合成が行われ、そのテキストデータに対応
する合成音が出力される。
項9に記載の情報処理方法、並びに請求項10に記載の
媒体においては、サーバから送信されてくるテキストデ
ータが受信され、そのサーバからのテキストデータに基
づいて、音声合成が行われ、そのテキストデータに対応
する合成音が出力される。
【0016】
【発明の実施の形態】図1は、本発明を適用したチャッ
トシステムの一実施の形態の構成例を示している。
トシステムの一実施の形態の構成例を示している。
【0017】図1の実施の形態においては、3台のパー
ソナルコンピュータ(パソコン)1−1乃至1−3、並
びに2台のチャットサーバ2−1および2−2が、例え
ば、インターネット等の通信ネットワーク3を介して相
互に接続されている。
ソナルコンピュータ(パソコン)1−1乃至1−3、並
びに2台のチャットサーバ2−1および2−2が、例え
ば、インターネット等の通信ネットワーク3を介して相
互に接続されている。
【0018】そして、サーバ2−1および2−2は、ユ
ーザがチャットを行う場としてのチャット空間を提供す
るためのチャットサーバプログラムが格納されたHD
(HardDisk)27(図3)を有し、そのプログラムを実
行することで、パソコンどうしでチャットを行うための
制御を行うチャットサーバとして機能するようになって
いる。即ち、サーバ2−1および2−2(サーバ2−1
および2−2を区別する必要がない場合は、以下、適
宜、サーバ2と記述する)は、通信ネットワーク3を介
して接続されているパソコン1−1乃至1−3に、その
ユーザがチャットを行うためのチャット環境を提供する
ようになっている。なお、ここでは、サーバ2−1およ
び2−2は、例えば、IRC方式によるチャット環境を
提供するようになっており、従って、サーバ2−1に接
続したユーザどうし、サーバ2−2に接続したユーザど
うしの他、サーバ2−1の接続したユーザと、サーバ2
−2に接続したユーザとの間でも、チャットを行うこと
ができるようになっている。
ーザがチャットを行う場としてのチャット空間を提供す
るためのチャットサーバプログラムが格納されたHD
(HardDisk)27(図3)を有し、そのプログラムを実
行することで、パソコンどうしでチャットを行うための
制御を行うチャットサーバとして機能するようになって
いる。即ち、サーバ2−1および2−2(サーバ2−1
および2−2を区別する必要がない場合は、以下、適
宜、サーバ2と記述する)は、通信ネットワーク3を介
して接続されているパソコン1−1乃至1−3に、その
ユーザがチャットを行うためのチャット環境を提供する
ようになっている。なお、ここでは、サーバ2−1およ
び2−2は、例えば、IRC方式によるチャット環境を
提供するようになっており、従って、サーバ2−1に接
続したユーザどうし、サーバ2−2に接続したユーザど
うしの他、サーバ2−1の接続したユーザと、サーバ2
−2に接続したユーザとの間でも、チャットを行うこと
ができるようになっている。
【0019】一方、パソコン1−1乃至1−3(パソコ
ン1−1乃至1−3を区別する必要がない場合は、以
下、適宜、パソコン1と記述する)は、サーバ2−1や
2−2が提供するチャット空間を、他のパソコンとの間
で共有しながらチャットを行うためのチャットクライア
ントプログラムを記憶しており、このチャットクライア
ントプログラムと、サーバ2−1や2−2におけるチャ
ットサーバプログラムの実行によって、パソコン1で
は、チャットを行うためのチャット空間が表示される。
ン1−1乃至1−3を区別する必要がない場合は、以
下、適宜、パソコン1と記述する)は、サーバ2−1や
2−2が提供するチャット空間を、他のパソコンとの間
で共有しながらチャットを行うためのチャットクライア
ントプログラムを記憶しており、このチャットクライア
ントプログラムと、サーバ2−1や2−2におけるチャ
ットサーバプログラムの実行によって、パソコン1で
は、チャットを行うためのチャット空間が表示される。
【0020】そして、パソコン1−1乃至1−3が、す
べてサーバ2に接続している場合において、そのうち
の、例えば、パソコン1−1からテキストデータが入力
され、通信ネットワーク3を介して、サーバ2に送信さ
れると、サーバ2では、そのテキストデータが受信さ
れ、他のパソコン1−2および1−3に送信される。ま
た、パソコン1−2や1−3において入力されたテキス
トデータも、同様にして、他のパソコンに送信される。
べてサーバ2に接続している場合において、そのうち
の、例えば、パソコン1−1からテキストデータが入力
され、通信ネットワーク3を介して、サーバ2に送信さ
れると、サーバ2では、そのテキストデータが受信さ
れ、他のパソコン1−2および1−3に送信される。ま
た、パソコン1−2や1−3において入力されたテキス
トデータも、同様にして、他のパソコンに送信される。
【0021】以上のようにして、パソコン1−1乃至1
−3それぞれの間では、サーバ2を介して、チャットが
行われる。
−3それぞれの間では、サーバ2を介して、チャットが
行われる。
【0022】次に、図2は、図1のパソコン1のハード
ウェア構成例を示している。
ウェア構成例を示している。
【0023】通信I/F(Interface)11は、例え
ば、モデムや、ターミナルアダプタ、ネットワークカー
ド等でなり、通信ネットワーク3を介しての通信制御を
行うようになっている。ROM(Read Only Memory)1
2は、例えば、BIOS(Basic Input Output Syste
m)のプログラムなどを記憶している。CPU(Central
Processing Unit)13は、HD17に記憶されている
チャットクライアントプログラムや、音声処理プログラ
ム等のアプリケーションプログラムを、RAM(Random
Access Memory)14上に展開して実行することで、チ
ャットや音声認識、音声合成等のための処理を行うよう
になっている。RAM14は、CPU13の動作上必要
なプログラムやデータを一時記憶するようになってい
る。
ば、モデムや、ターミナルアダプタ、ネットワークカー
ド等でなり、通信ネットワーク3を介しての通信制御を
行うようになっている。ROM(Read Only Memory)1
2は、例えば、BIOS(Basic Input Output Syste
m)のプログラムなどを記憶している。CPU(Central
Processing Unit)13は、HD17に記憶されている
チャットクライアントプログラムや、音声処理プログラ
ム等のアプリケーションプログラムを、RAM(Random
Access Memory)14上に展開して実行することで、チ
ャットや音声認識、音声合成等のための処理を行うよう
になっている。RAM14は、CPU13の動作上必要
なプログラムやデータを一時記憶するようになってい
る。
【0024】入力部15は、例えば、キーボードや、マ
ウス、マイク(マイクロフォン)等で構成され、必要な
コマンドやデータを入力するときに用いられる。出力部
16は、例えば、ディスプレイやスピーカ、ヘッドフォ
ン等で構成され、CPU13の制御の下、所定の情報を
表示したり、音声で出力するようになっている。HD1
7は、上述したようなアプリケーションプログラムの
他、例えば、Windows95や98(商標)、Linux等のOS
(Operating System)のプログラム等を記憶している。
ウス、マイク(マイクロフォン)等で構成され、必要な
コマンドやデータを入力するときに用いられる。出力部
16は、例えば、ディスプレイやスピーカ、ヘッドフォ
ン等で構成され、CPU13の制御の下、所定の情報を
表示したり、音声で出力するようになっている。HD1
7は、上述したようなアプリケーションプログラムの
他、例えば、Windows95や98(商標)、Linux等のOS
(Operating System)のプログラム等を記憶している。
【0025】以上のように構成されるパソコン1では、
CPU13において、HD17に記憶されたOSのプロ
グラムが、RAM14に展開されて実行される。さら
に、CPU13において、OSのプログラムの制御の
下、HD17に記憶されたアプリケーションプログラム
が実行されることで、上述したようなチャットのための
処理や、後述する音声認識、音声合成その他の処理が行
われる。
CPU13において、HD17に記憶されたOSのプロ
グラムが、RAM14に展開されて実行される。さら
に、CPU13において、OSのプログラムの制御の
下、HD17に記憶されたアプリケーションプログラム
が実行されることで、上述したようなチャットのための
処理や、後述する音声認識、音声合成その他の処理が行
われる。
【0026】次に、図3は、図1のサーバ2のハードウ
ェア構成例を示している。
ェア構成例を示している。
【0027】図3に示すように、サーバ2は、パソコン
1を構成する通信I/F11乃至HD17とそれぞれ同
様の通信I/F21乃至HD27から構成されている。
但し、HD17には、チャットサーバプログラム等の、
サーバ2がチャットサーバとして機能するためのプログ
ラムが記憶されている。
1を構成する通信I/F11乃至HD17とそれぞれ同
様の通信I/F21乃至HD27から構成されている。
但し、HD17には、チャットサーバプログラム等の、
サーバ2がチャットサーバとして機能するためのプログ
ラムが記憶されている。
【0028】以上のように構成されるサーバ2でも、C
PU23において、HD27に記憶されたアプリケーシ
ョンプログラムが実行されることで、パソコンどうしで
チャットを行うのに必要な処理が行われる。
PU23において、HD27に記憶されたアプリケーシ
ョンプログラムが実行されることで、パソコンどうしで
チャットを行うのに必要な処理が行われる。
【0029】次に、図4を参照して、パソコン1におい
てチャットクライアントプログラムが実行され、サーバ
2においてチャットサーバプログラムが実行されること
により行われる処理について説明する。
てチャットクライアントプログラムが実行され、サーバ
2においてチャットサーバプログラムが実行されること
により行われる処理について説明する。
【0030】なお、図4において、パソコン1を構成す
るブロックは、パソコン1でチャットクライアントプロ
グラムが実行されることにより実現される機能的なブロ
ックであり、サーバ2を構成するブロックも、サーバ2
でチャットサーバプログラムが実行されることにより実
現される機能的なブロックである。
るブロックは、パソコン1でチャットクライアントプロ
グラムが実行されることにより実現される機能的なブロ
ックであり、サーバ2を構成するブロックも、サーバ2
でチャットサーバプログラムが実行されることにより実
現される機能的なブロックである。
【0031】また、図4では、パソコン1は、チャット
通信部31およびチャット処理部32で構成されている
が、パソコン1−i(本実施の形態では、i=1,2,
3)を構成するチャット通信部31とチャット処理部3
2を、それぞれチャット通信部31−iとチャット処理
部32−iと記述するものとする。
通信部31およびチャット処理部32で構成されている
が、パソコン1−i(本実施の形態では、i=1,2,
3)を構成するチャット通信部31とチャット処理部3
2を、それぞれチャット通信部31−iとチャット処理
部32−iと記述するものとする。
【0032】いま、パソコン1−1と1−2が、通信ネ
ットワーク3を介して、サーバ2に接続しており、この
パソコン1−1と1−2との間でチャットが行われると
すると、例えば、パソコン1−1のユーザが、入力部1
5を構成するキーボードを操作することにより、テキス
トを入力すると、そのテキストデータは、チャット処理
部32−1に供給される。チャット処理部32−1で
は、入力されたテキストデータに対して、所定の処理が
施され、即ち、例えば、IRC方式でチャットが行われ
る場合には、テキストデータが、7ビット可視ASCI
I文字列のデータに変換され、チャット通信部31−1
に供給される。チャット通信部31−1では、チャット
処理部32−1からのテキストデータが、通信ネットワ
ーク3を介して、サーバ2に送信される。
ットワーク3を介して、サーバ2に接続しており、この
パソコン1−1と1−2との間でチャットが行われると
すると、例えば、パソコン1−1のユーザが、入力部1
5を構成するキーボードを操作することにより、テキス
トを入力すると、そのテキストデータは、チャット処理
部32−1に供給される。チャット処理部32−1で
は、入力されたテキストデータに対して、所定の処理が
施され、即ち、例えば、IRC方式でチャットが行われ
る場合には、テキストデータが、7ビット可視ASCI
I文字列のデータに変換され、チャット通信部31−1
に供給される。チャット通信部31−1では、チャット
処理部32−1からのテキストデータが、通信ネットワ
ーク3を介して、サーバ2に送信される。
【0033】サーバ2では、チャットサーバ機能部41
において、チャット通信部31−1からのテキストデー
タが受信され、通信ネットワーク3を介して、パソコン
1−1以外の、いま接続している他のパソコン(チャッ
トクライアント)に送信される。即ち、図4の実施の形
態では、サーバ2に接続している、パソコン1−1以外
のパソコンは、パソコン1−2であり、従って、チャッ
トサーバ機能部41では、チャット通信部31−1から
のテキストデータは、通信ネットワーク3を介して、パ
ソコン1−2に送信される。
において、チャット通信部31−1からのテキストデー
タが受信され、通信ネットワーク3を介して、パソコン
1−1以外の、いま接続している他のパソコン(チャッ
トクライアント)に送信される。即ち、図4の実施の形
態では、サーバ2に接続している、パソコン1−1以外
のパソコンは、パソコン1−2であり、従って、チャッ
トサーバ機能部41では、チャット通信部31−1から
のテキストデータは、通信ネットワーク3を介して、パ
ソコン1−2に送信される。
【0034】パソコン1−2では、チャット通信部31
−2において、チャットサーバ機能部41からのテキス
トデータが受信され、チャット処理部32−2に供給さ
れる。チャット処理部32−2では、チャット通信部3
1−2からのテキストデータに必要な処理が施され、そ
の出力部16に供給されて表示される。
−2において、チャットサーバ機能部41からのテキス
トデータが受信され、チャット処理部32−2に供給さ
れる。チャット処理部32−2では、チャット通信部3
1−2からのテキストデータに必要な処理が施され、そ
の出力部16に供給されて表示される。
【0035】一方、パソコン1−2のユーザが、入力部
15を構成するキーボードを操作することにより、テキ
ストを入力すると、そのテキストデータは、上述の場合
とは逆のルートで、パソコン1−1に送信される。
15を構成するキーボードを操作することにより、テキ
ストを入力すると、そのテキストデータは、上述の場合
とは逆のルートで、パソコン1−1に送信される。
【0036】即ち、パソコン1−2では、入力されたテ
キストデータが、チャット処理部32−2およびチャッ
ト通信部31−1、並びに通信ネットワーク3を介し
て、サーバ2に送信される。サーバ2では、チャットサ
ーバ機能部41において、パソコン1−2からのテキス
トデータが受信され、通信ネットワーク3を介して、パ
ソコン1−2以外の、いま接続している他のパソコン
(チャットクライアント)、即ち、図4の実施の形態で
は、パソコン1−1に送信される。パソコン1−1で
は、チャット通信部31−1において、チャットサーバ
機能部41からのテキストデータが受信され、チャット
処理部32−1に供給される。チャット処理部32−1
では、チャット通信部31−1からのテキストデータに
必要な処理が施され、その出力部16に供給されて表示
される。
キストデータが、チャット処理部32−2およびチャッ
ト通信部31−1、並びに通信ネットワーク3を介し
て、サーバ2に送信される。サーバ2では、チャットサ
ーバ機能部41において、パソコン1−2からのテキス
トデータが受信され、通信ネットワーク3を介して、パ
ソコン1−2以外の、いま接続している他のパソコン
(チャットクライアント)、即ち、図4の実施の形態で
は、パソコン1−1に送信される。パソコン1−1で
は、チャット通信部31−1において、チャットサーバ
機能部41からのテキストデータが受信され、チャット
処理部32−1に供給される。チャット処理部32−1
では、チャット通信部31−1からのテキストデータに
必要な処理が施され、その出力部16に供給されて表示
される。
【0037】以上のように、パソコン1において、チャ
ットクライアントプログラムが実行されるだけでは、ユ
ーザは、チャットの内容であるテキストを、キーボード
を操作して入力する必要があり、面倒である。
ットクライアントプログラムが実行されるだけでは、ユ
ーザは、チャットの内容であるテキストを、キーボード
を操作して入力する必要があり、面倒である。
【0038】そこで、図5は、パソコン1のHD17に
記憶されているチャットクライアントプログラムの他、
音声処理プログラムも実行されることにより実現される
パソコン1の機能的構成例を示している。
記憶されているチャットクライアントプログラムの他、
音声処理プログラムも実行されることにより実現される
パソコン1の機能的構成例を示している。
【0039】図5において、音声入力装置51は、図2
の入力部15に相当し、マイク等で構成される。そし
て、音声入力装置51は、そこに入力される音声を、電
気信号としての音声信号とし、さらに、A/D変換し
て、ディジタルの音声データとして音声認識装置52に
供給するようになっている。音声認識装置52は、音声
入力装置51からの音声データを、例えばHMM(Hidd
en Markou Models)法等の所定の音声認識アルゴリズム
にしたがって音声認識し、その音声認識結果を、テキス
トデータで出力するようになっている。この音声認識結
果としてのテキストデータは、図4に示したパソコン1
を構成するチャット通信部31およびチャット処理部3
2に相当するチャットクライアント機能部30に供給さ
れるようになっている。
の入力部15に相当し、マイク等で構成される。そし
て、音声入力装置51は、そこに入力される音声を、電
気信号としての音声信号とし、さらに、A/D変換し
て、ディジタルの音声データとして音声認識装置52に
供給するようになっている。音声認識装置52は、音声
入力装置51からの音声データを、例えばHMM(Hidd
en Markou Models)法等の所定の音声認識アルゴリズム
にしたがって音声認識し、その音声認識結果を、テキス
トデータで出力するようになっている。この音声認識結
果としてのテキストデータは、図4に示したパソコン1
を構成するチャット通信部31およびチャット処理部3
2に相当するチャットクライアント機能部30に供給さ
れるようになっている。
【0040】なお、音声認識装置52では、音声認識結
果としてのテキストデータに対して、必要に応じて、仮
名漢字変換処理が施されて出力されるようになってい
る。
果としてのテキストデータに対して、必要に応じて、仮
名漢字変換処理が施されて出力されるようになってい
る。
【0041】音声読み上げ装置53には、チャットクラ
イアント機能部30から、サーバ2から送信されてくる
他のパソコンからのテキストデータが供給されるように
なっている。そして、音声読み上げ装置53は、チャッ
トクライアント機能部30からのテキストデータに基づ
いて音声合成を行い、そのテキストデータに対応する、
例えば、WAV形式やAU形式の合成音のデータを生成
して、音声出力装置54に供給するようになっている。
音声出力装置54は、図2の出力部16に相当し、スピ
ーカ等で構成される。そして、音声出力装置54は、音
声読み上げ装置53からの合成音のデータにしたがい、
サーバ2からのテキストデータを読み上げる合成音を出
力するようになっている。
イアント機能部30から、サーバ2から送信されてくる
他のパソコンからのテキストデータが供給されるように
なっている。そして、音声読み上げ装置53は、チャッ
トクライアント機能部30からのテキストデータに基づ
いて音声合成を行い、そのテキストデータに対応する、
例えば、WAV形式やAU形式の合成音のデータを生成
して、音声出力装置54に供給するようになっている。
音声出力装置54は、図2の出力部16に相当し、スピ
ーカ等で構成される。そして、音声出力装置54は、音
声読み上げ装置53からの合成音のデータにしたがい、
サーバ2からのテキストデータを読み上げる合成音を出
力するようになっている。
【0042】次に、図6を参照して、図5のように構成
されるパソコン1の動作について説明する。
されるパソコン1の動作について説明する。
【0043】パソコン1において、ユーザが、例えば、
「こんにちは」等の発話を行うと(図6)、その音声
は、音声入力装置(マイク)51に入力され、電気信号
としての音声データとされる。この音声データは、音声
認識装置52に供給され、そこで音声認識される。さら
に、音声認識装置52では、その音声認識結果が、テキ
ストデータに変換され、必要に応じて、仮名漢字変換さ
れた後、チャットクライアント機能部30に供給され
る。チャットクライアント機能部30では、図4で説明
したように、音声認識装置52からのテキストデータ
が、通信ネットワーク3を介して、サーバ2に送信され
る。即ち、以上のようにして、ユーザの発話「こんにち
は」は、テキストデータとされ、サーバ2に送信され
る。
「こんにちは」等の発話を行うと(図6)、その音声
は、音声入力装置(マイク)51に入力され、電気信号
としての音声データとされる。この音声データは、音声
認識装置52に供給され、そこで音声認識される。さら
に、音声認識装置52では、その音声認識結果が、テキ
ストデータに変換され、必要に応じて、仮名漢字変換さ
れた後、チャットクライアント機能部30に供給され
る。チャットクライアント機能部30では、図4で説明
したように、音声認識装置52からのテキストデータ
が、通信ネットワーク3を介して、サーバ2に送信され
る。即ち、以上のようにして、ユーザの発話「こんにち
は」は、テキストデータとされ、サーバ2に送信され
る。
【0044】一方、サーバ2から通信ネットワーク3を
介して送信されてくるテキストデータは、チャットクラ
イアント機能部30において、図4で説明したようにし
て受信され、音声読み上げ装置53に供給される。音声
読み上げ装置53では、チャットクライアント機能部3
0からのテキストデータに対応する合成音が生成され、
音声出力装置54に供給される。音声出力装置54で
は、音声読み上げ装置53からの合成音が出力される。
即ち、例えば、サーバ2から「今日はいい天気ですね」
等のテキストデータが送信されてきた場合には、音声出
力装置54では、その合成音「今日はいい天気ですね」
が出力される(図6)。
介して送信されてくるテキストデータは、チャットクラ
イアント機能部30において、図4で説明したようにし
て受信され、音声読み上げ装置53に供給される。音声
読み上げ装置53では、チャットクライアント機能部3
0からのテキストデータに対応する合成音が生成され、
音声出力装置54に供給される。音声出力装置54で
は、音声読み上げ装置53からの合成音が出力される。
即ち、例えば、サーバ2から「今日はいい天気ですね」
等のテキストデータが送信されてきた場合には、音声出
力装置54では、その合成音「今日はいい天気ですね」
が出力される(図6)。
【0045】次に、図7および図8を参照して、パソコ
ン1においてチャットクライアントプログラムおよび音
声処理プログラムが実行されることにより表示される画
面について説明する。
ン1においてチャットクライアントプログラムおよび音
声処理プログラムが実行されることにより表示される画
面について説明する。
【0046】パソコン1において、チャットクライアン
トプログラムが実行されると、出力部16では、図7お
よび図8に示すようなチャット用のウインドウ61が表
示される。
トプログラムが実行されると、出力部16では、図7お
よび図8に示すようなチャット用のウインドウ61が表
示される。
【0047】なお、ここでは、例えば、パソコン1−1
と1−2との間でチャットが行われるものとし、パソコ
ン1−1のユーザを、ユーザAとするとともに、パソコ
ン1−2のユーザを、ユーザBとする。また、パソコン
1−1または1−2それぞれの出力部16に表示される
ウインドウ61を、ウインドウ61−1または61−2
と記述する。
と1−2との間でチャットが行われるものとし、パソコ
ン1−1のユーザを、ユーザAとするとともに、パソコ
ン1−2のユーザを、ユーザBとする。また、パソコン
1−1または1−2それぞれの出力部16に表示される
ウインドウ61を、ウインドウ61−1または61−2
と記述する。
【0048】ウインドウ61は、図7および図8に示す
ように、ユーザどうしの間で行われたチャットの内容が
表示されるチャット文字表示エリア62と、ユーザが入
力した最新のテキストが表示されるテキスト入力フィー
ルド63から構成される。なお、ウインドウ61−1を
構成するチャット文字表示エリア62またはテキスト入
力フィールド63を、以下、適宜、チャット文字表示エ
リア62−1またはテキスト入力フィールド63−1と
それぞれ記述するとともに(図7)、ウインドウ61−
2を構成するチャット文字表示エリア62またはテキス
ト入力フィールド63を、以下、適宜、チャット文字表
示エリア62−2またはテキスト入力フィールド63−
2とそれぞれ記述する(図8)。
ように、ユーザどうしの間で行われたチャットの内容が
表示されるチャット文字表示エリア62と、ユーザが入
力した最新のテキストが表示されるテキスト入力フィー
ルド63から構成される。なお、ウインドウ61−1を
構成するチャット文字表示エリア62またはテキスト入
力フィールド63を、以下、適宜、チャット文字表示エ
リア62−1またはテキスト入力フィールド63−1と
それぞれ記述するとともに(図7)、ウインドウ61−
2を構成するチャット文字表示エリア62またはテキス
ト入力フィールド63を、以下、適宜、チャット文字表
示エリア62−2またはテキスト入力フィールド63−
2とそれぞれ記述する(図8)。
【0049】いま、ユーザAが、例えば、「今日はいい
天気ですね」を発話すると、パソコン1−1において、
その音声は音声認識され、仮名漢字変換される。この仮
名漢字変換結果は、図7に示すように、テキスト入力フ
ィールド63−1に表示され、その後、通信ネットワー
ク3を介して、サーバ2に送信される。
天気ですね」を発話すると、パソコン1−1において、
その音声は音声認識され、仮名漢字変換される。この仮
名漢字変換結果は、図7に示すように、テキスト入力フ
ィールド63−1に表示され、その後、通信ネットワー
ク3を介して、サーバ2に送信される。
【0050】サーバ2では、パソコン1−1からのテキ
ストデータ「今日はいい天気ですね」が受信され、通信
ネットワーク3を介して、パソコン1−2に送信され
る。パソコン1−2では、パソコン1−1からのテキス
トデータ「今日はいい天気ですね」が、図8に示すよう
に、その出力部16に表示されたウインドウ61−2の
チャット文字表示エリア62−2に表示される。さら
に、パソコン1−2では、例えば、テキスト音声合成が
行われることにより、テキストデータ「今日はいい天気
ですね」に対応する合成音が生成されて出力される。
ストデータ「今日はいい天気ですね」が受信され、通信
ネットワーク3を介して、パソコン1−2に送信され
る。パソコン1−2では、パソコン1−1からのテキス
トデータ「今日はいい天気ですね」が、図8に示すよう
に、その出力部16に表示されたウインドウ61−2の
チャット文字表示エリア62−2に表示される。さら
に、パソコン1−2では、例えば、テキスト音声合成が
行われることにより、テキストデータ「今日はいい天気
ですね」に対応する合成音が生成されて出力される。
【0051】以上のように、入力された音声が音声認識
され、その音声認識結果としてのテキストデータが、通
信ネットワーク3を介して、サーバ2に送信されるの
で、ユーザは、キーボードの操作に熟練していなくて
も、容易に、チャットを楽しむことができる。
され、その音声認識結果としてのテキストデータが、通
信ネットワーク3を介して、サーバ2に送信されるの
で、ユーザは、キーボードの操作に熟練していなくて
も、容易に、チャットを楽しむことができる。
【0052】また、通信ネットワーク3を介して、パソ
コン1とサーバ2との間でやりとりされるのはテキスト
データであるため、従来のチャットシステムをそのまま
利用することができる。従って、パソコン1との間でチ
ャットを行うチャットクライアントが、上述したような
音声認識や音声合成を行うための音声処理プログラムを
有していなくても、パソコン1との間でチャットを行う
ことができる。そして、この場合でも、パソコン1にお
いては、音声でテキストデータを入力し、かつ送信され
てきたテキストデータを、合成音で出力することができ
る。
コン1とサーバ2との間でやりとりされるのはテキスト
データであるため、従来のチャットシステムをそのまま
利用することができる。従って、パソコン1との間でチ
ャットを行うチャットクライアントが、上述したような
音声認識や音声合成を行うための音声処理プログラムを
有していなくても、パソコン1との間でチャットを行う
ことができる。そして、この場合でも、パソコン1にお
いては、音声でテキストデータを入力し、かつ送信され
てきたテキストデータを、合成音で出力することができ
る。
【0053】さらに、音声データではなく、テキストデ
ータがやりとりされるため、その伝送は、狭帯域で行う
ことができる。
ータがやりとりされるため、その伝送は、狭帯域で行う
ことができる。
【0054】また、サーバ2から送信されてくるテキス
トデータに対応する合成音を生成して出力するようにし
たので、ユーザは、出力部16の表示を見なくてもチャ
ットを行うことができる。即ち、ディスプレイがなくて
も、チャットを行うことができる。
トデータに対応する合成音を生成して出力するようにし
たので、ユーザは、出力部16の表示を見なくてもチャ
ットを行うことができる。即ち、ディスプレイがなくて
も、チャットを行うことができる。
【0055】従って、チャットクライアントとしては、
極端には、テキストを入力するためのキーや、テキスト
を表示するためのディスプレイが必要がなく、音声を入
力するためのマイクと、音声を出力するためのスピーカ
があれば良いから、携帯電話機等の携帯端末を、チャッ
トクライアントとして用いることも、容易に可能とな
る。
極端には、テキストを入力するためのキーや、テキスト
を表示するためのディスプレイが必要がなく、音声を入
力するためのマイクと、音声を出力するためのスピーカ
があれば良いから、携帯電話機等の携帯端末を、チャッ
トクライアントとして用いることも、容易に可能とな
る。
【0056】なお、テキスト音声合成を行う場合には、
その合成の基本単位となる音素データや音節データが必
要となるが、これは、HD17にあらかじめ記憶されて
いるものとする。但し、音素データや音声データは、通
信ネットワーク3を介してダウンロードするようにして
も良い。
その合成の基本単位となる音素データや音節データが必
要となるが、これは、HD17にあらかじめ記憶されて
いるものとする。但し、音素データや音声データは、通
信ネットワーク3を介してダウンロードするようにして
も良い。
【0057】また、音声合成は、テキスト音声合成によ
る他、例えば、録音編集方式(あらかじめ発話された単
語や文節を蓄積しておいて接続する方式)によって行う
ことも可能である。
る他、例えば、録音編集方式(あらかじめ発話された単
語や文節を蓄積しておいて接続する方式)によって行う
ことも可能である。
【0058】次に、図9のフローチャートを参照して、
チャットクライアントとしての図2に示したパソコン1
の動作について、さらに説明する。
チャットクライアントとしての図2に示したパソコン1
の動作について、さらに説明する。
【0059】ユーザが、入力部15を、チャットクライ
アントプログラムを実行するように操作すると、CPU
13において、HD17に記憶されたチャットクライア
ントプログラムが、RAM14にロードされて実行され
る。
アントプログラムを実行するように操作すると、CPU
13において、HD17に記憶されたチャットクライア
ントプログラムが、RAM14にロードされて実行され
る。
【0060】これにより、CPU13では、図7および
図8に示したようなチャット用のウインドウ61が表示
され、さらに、ステップS1において、サーバ2との接
続を確立し、ログインするための処理が行われる。そし
て、サーバ2へのログインが完了すると、ステップS2
に進み、ユーザが発話を行ったかどうかが判定される。
ステップS2において、ユーザが発話を行っていないと
判定された場合、即ち、入力部15に音声が入力されて
いない場合、ステップS3乃至S6をスキップして、ス
テップS7に進む。
図8に示したようなチャット用のウインドウ61が表示
され、さらに、ステップS1において、サーバ2との接
続を確立し、ログインするための処理が行われる。そし
て、サーバ2へのログインが完了すると、ステップS2
に進み、ユーザが発話を行ったかどうかが判定される。
ステップS2において、ユーザが発話を行っていないと
判定された場合、即ち、入力部15に音声が入力されて
いない場合、ステップS3乃至S6をスキップして、ス
テップS7に進む。
【0061】また、ステップS2において、ユーザが発
話を行ったと判定された場合、即ち、入力部15に音声
が入力された場合、ステップS3に進み、その音声が音
声認識される。
話を行ったと判定された場合、即ち、入力部15に音声
が入力された場合、ステップS3に進み、その音声が音
声認識される。
【0062】即ち、ステップS3では、CPU13にお
いて、HD17に記憶された音声処理プログラムが、R
AM14にロードされて実行されることにより、ユーザ
の発話が音声認識される。さらに、ステップS3では、
その音声認識結果がテキストデータに変換され、仮名漢
字変換される。そして、その仮名漢字変換結果が、ウイ
ンドウ61のテキスト入力フィールド63に表示され、
音声処理プログラムが、RAM14からアンロードされ
る。
いて、HD17に記憶された音声処理プログラムが、R
AM14にロードされて実行されることにより、ユーザ
の発話が音声認識される。さらに、ステップS3では、
その音声認識結果がテキストデータに変換され、仮名漢
字変換される。そして、その仮名漢字変換結果が、ウイ
ンドウ61のテキスト入力フィールド63に表示され、
音声処理プログラムが、RAM14からアンロードされ
る。
【0063】ユーザは、テキスト入力フィールド63に
表示された音声認識結果(を仮名漢字変換したもの)を
見て、誤りがあれば、その誤りを、例えば、入力部15
のキーボード等を操作することにより訂正する。この場
合、ステップS4において、入力部15の操作にしたが
って、テキスト入力フィールド63に表示された音声認
識結果が訂正される。
表示された音声認識結果(を仮名漢字変換したもの)を
見て、誤りがあれば、その誤りを、例えば、入力部15
のキーボード等を操作することにより訂正する。この場
合、ステップS4において、入力部15の操作にしたが
って、テキスト入力フィールド63に表示された音声認
識結果が訂正される。
【0064】なお、テキスト入力フィールド63に表示
された音声認識結果の訂正は、入力部15のキーボード
を操作するのではなく、音声入力によって行うようにす
ることも可能である。
された音声認識結果の訂正は、入力部15のキーボード
を操作するのではなく、音声入力によって行うようにす
ることも可能である。
【0065】その後、ステップS5に進み、テキスト入
力フィールド63に表示された音声認識結果としてのテ
キストデータを、サーバ2に送信するかどうかが判定さ
れる。ステップS5において、テキスト入力フィールド
63に表示されたテキストデータを送信しないと判定さ
れた場合、即ち、例えば、テキストデータを送信するよ
うに、入力部15が操作されなかった場合、ステップS
6をスキップして、ステップS7に進む。
力フィールド63に表示された音声認識結果としてのテ
キストデータを、サーバ2に送信するかどうかが判定さ
れる。ステップS5において、テキスト入力フィールド
63に表示されたテキストデータを送信しないと判定さ
れた場合、即ち、例えば、テキストデータを送信するよ
うに、入力部15が操作されなかった場合、ステップS
6をスキップして、ステップS7に進む。
【0066】また、ステップS5において、テキスト入
力フィールド63に表示されたテキストデータを送信す
ると判定された場合、即ち、例えば、テキストデータを
送信するように、入力部15が操作された場合、ステッ
プS6に進み、CPU13は、通信I/F11を制御す
ることにより、テキスト入力フィールド63に表示され
たテキストデータを、通信ネットワーク3を介して、サ
ーバ2に送信させ、ステップS7に進む。
力フィールド63に表示されたテキストデータを送信す
ると判定された場合、即ち、例えば、テキストデータを
送信するように、入力部15が操作された場合、ステッ
プS6に進み、CPU13は、通信I/F11を制御す
ることにより、テキスト入力フィールド63に表示され
たテキストデータを、通信ネットワーク3を介して、サ
ーバ2に送信させ、ステップS7に進む。
【0067】この場合、サーバ2では、パソコン1から
のテキストデータが受信され、他のチャットクライアン
トに送信される。これにより、そのチャットクライアン
トでは、パソコン1からのテキストデータが表示され、
あるいは、パソコン1と同様に、音声処理プログラムが
インストールされているチャットクライアントでは、パ
ソコン1からのテキストデータに対応する合成音が出力
される。
のテキストデータが受信され、他のチャットクライアン
トに送信される。これにより、そのチャットクライアン
トでは、パソコン1からのテキストデータが表示され、
あるいは、パソコン1と同様に、音声処理プログラムが
インストールされているチャットクライアントでは、パ
ソコン1からのテキストデータに対応する合成音が出力
される。
【0068】ステップS7では、サーバ2からテキスト
データが送信されてきたかどうかが判定され、送信され
てきていないと判定された場合、即ち、通信I/F11
で、サーバ2からのテキストデータが受信されていない
場合、ステップS8およびS9をスキップして、ステッ
プS10に進む。
データが送信されてきたかどうかが判定され、送信され
てきていないと判定された場合、即ち、通信I/F11
で、サーバ2からのテキストデータが受信されていない
場合、ステップS8およびS9をスキップして、ステッ
プS10に進む。
【0069】また、ステップS7において、サーバ2か
らテキストデータが送信されてきたと判定された場合、
即ち、通信I/F11で、サーバ2からのテキストデー
タが受信された場合、ステップS8に進み、そのテキス
トデータに必要な処理が施され、ウインドウ61のチャ
ット文字表示エリア62に表示される。そして、ステッ
プS9に進み、CPU13において、HD17に記憶さ
れた音声処理プログラムが、RAM14にロードされて
実行されることにより、チャット文字表示エリア62に
表示されたテキストデータに対応する合成音が生成され
て出力される。
らテキストデータが送信されてきたと判定された場合、
即ち、通信I/F11で、サーバ2からのテキストデー
タが受信された場合、ステップS8に進み、そのテキス
トデータに必要な処理が施され、ウインドウ61のチャ
ット文字表示エリア62に表示される。そして、ステッ
プS9に進み、CPU13において、HD17に記憶さ
れた音声処理プログラムが、RAM14にロードされて
実行されることにより、チャット文字表示エリア62に
表示されたテキストデータに対応する合成音が生成され
て出力される。
【0070】そして、音声処理プログラムが、RAM1
4からアンロードされ、ステップS10に進み、ログア
ウトするかどうかが判定される。ステップS10におい
て、ログアウトしないと判定された場合、即ち、例え
ば、入力部15が、ログアウトするように操作されてい
ない場合、ステップS2に戻り、以下、同様の処理が繰
り返される。
4からアンロードされ、ステップS10に進み、ログア
ウトするかどうかが判定される。ステップS10におい
て、ログアウトしないと判定された場合、即ち、例え
ば、入力部15が、ログアウトするように操作されてい
ない場合、ステップS2に戻り、以下、同様の処理が繰
り返される。
【0071】また、ステップS10において、ログアウ
トすると判定された場合、即ち、例えば、入力部15が
ログアウトするように操作された場合、サーバ2からロ
グアウトし、さらに、サーバ2との接続を切断して、処
理を終了する。
トすると判定された場合、即ち、例えば、入力部15が
ログアウトするように操作された場合、サーバ2からロ
グアウトし、さらに、サーバ2との接続を切断して、処
理を終了する。
【0072】なお、上述の場合においては、必要に応じ
て、音声処理プログラムを、ロード/アンロードするよ
うにしたが、音声処理プログラムは、チャットクライア
ントプログラムが実行されている間、RAM14に常駐
させておくようにすることも可能である。
て、音声処理プログラムを、ロード/アンロードするよ
うにしたが、音声処理プログラムは、チャットクライア
ントプログラムが実行されている間、RAM14に常駐
させておくようにすることも可能である。
【0073】次に、上述の場合には、パソコン1におい
て、サーバ2から送信されてくるテキストデータに対応
した合成音を生成するようにしたが、サーバ2から送信
されてくるテキストデータは、合成音に変換する他、例
えば、FAX(ファクシミリ)のデータに変換し、FA
Xに送信するようにすることが可能である。また、サー
バ2から送信されてくるテキストデータは保存しておく
ようにすることも可能である。
て、サーバ2から送信されてくるテキストデータに対応
した合成音を生成するようにしたが、サーバ2から送信
されてくるテキストデータは、合成音に変換する他、例
えば、FAX(ファクシミリ)のデータに変換し、FA
Xに送信するようにすることが可能である。また、サー
バ2から送信されてくるテキストデータは保存しておく
ようにすることも可能である。
【0074】そこで、図10のフローチャートを参照し
て、そのようなパソコン1の処理について説明する。
て、そのようなパソコン1の処理について説明する。
【0075】この場合、ステップS21において、図9
のステップS1における場合と同様に、サーバ2との接
続を確立し、ログインするための処理が行われる。そし
て、ステップS22に進み、サーバ2からテキストデー
タが送信されてきたかどうかが判定され、送信されてき
ていないと判定された場合、即ち、通信I/F11で、
サーバ2からのテキストデータが受信されていない場
合、ステップS23乃至27をスキップして、ステップ
S28に進む。
のステップS1における場合と同様に、サーバ2との接
続を確立し、ログインするための処理が行われる。そし
て、ステップS22に進み、サーバ2からテキストデー
タが送信されてきたかどうかが判定され、送信されてき
ていないと判定された場合、即ち、通信I/F11で、
サーバ2からのテキストデータが受信されていない場
合、ステップS23乃至27をスキップして、ステップ
S28に進む。
【0076】また、ステップS22において、サーバ2
からテキストデータが送信されてきたと判定された場
合、即ち、通信I/F11で、サーバ2からのテキスト
データが受信された場合、ステップS23に進み、その
テキストデータに必要な処理が施され、ステップS24
に進む。
からテキストデータが送信されてきたと判定された場
合、即ち、通信I/F11で、サーバ2からのテキスト
データが受信された場合、ステップS23に進み、その
テキストデータに必要な処理が施され、ステップS24
に進む。
【0077】ステップS24では、サーバ2からのテキ
ストデータを、FAXに送信するかどうかが判定され
る。ステップS24において、サーバ2からのテキスト
データを、FAXに送信すると判定された場合、即ち、
パソコン1において、テキストデータを、FAXに送信
することと、そのFAX番号が設定されている場合、ス
テップS25に進み、サーバ2からのテキストデータ
が、FAX用のデータに変換され、設定されているFA
X番号に送信されて、ステップS28に進む。
ストデータを、FAXに送信するかどうかが判定され
る。ステップS24において、サーバ2からのテキスト
データを、FAXに送信すると判定された場合、即ち、
パソコン1において、テキストデータを、FAXに送信
することと、そのFAX番号が設定されている場合、ス
テップS25に進み、サーバ2からのテキストデータ
が、FAX用のデータに変換され、設定されているFA
X番号に送信されて、ステップS28に進む。
【0078】また、ステップS24において、サーバ2
からのテキストデータを、FAXに送信しないと判定さ
れた場合、ステップS26に進み、そのテキストデータ
を保存しておくように、パソコン1が設定されているか
どうかが判定される。ステップS26において、サーバ
2からのテキストデータを保存しておくように設定され
ていないと判定された場合、ステップS27をスキップ
して、ステップS28に進む。
からのテキストデータを、FAXに送信しないと判定さ
れた場合、ステップS26に進み、そのテキストデータ
を保存しておくように、パソコン1が設定されているか
どうかが判定される。ステップS26において、サーバ
2からのテキストデータを保存しておくように設定され
ていないと判定された場合、ステップS27をスキップ
して、ステップS28に進む。
【0079】一方、ステップS26において、サーバ2
からのテキストデータを保存しておくように設定されて
いると判定された場合、ステップS27に進み、そのテ
キストデータが、HD17に記憶され、ステップS28
に進む。
からのテキストデータを保存しておくように設定されて
いると判定された場合、ステップS27に進み、そのテ
キストデータが、HD17に記憶され、ステップS28
に進む。
【0080】ステップS28では、図9のステップS1
0における場合と同様に、ログアウトするかどうかが判
定され、ログアウトしないと判定された場合、ステップ
S22に戻り、以下、同様の処理が繰り返される。
0における場合と同様に、ログアウトするかどうかが判
定され、ログアウトしないと判定された場合、ステップ
S22に戻り、以下、同様の処理が繰り返される。
【0081】また、ステップS28において、ログアウ
トすると判定された場合、サーバ2からログアウトし、
さらに、サーバ2との接続を切断して、処理を終了す
る。
トすると判定された場合、サーバ2からログアウトし、
さらに、サーバ2との接続を切断して、処理を終了す
る。
【0082】ここで、パソコン1において、音声で入力
されたテキストデータを、FAXのデータに変換するよ
うにすれば、用紙に文字等を描くことなく、FAX送信
を行うことが可能となる。また、パソコン1において、
FAXのデータを受信して、OCR(Optical Characte
r Reader)等で、文字認識を行い、その文字認識結果を
対象に音声合成を行うようにすれば、ファックスされて
きた内容を見ることなく、その内容を把握することが可
能となる。さらに、例えば、留守番電話機能を有する電
話機、あるいは携帯電話機の留守番電話機能を司るセン
タにおいて、音声によるメッセージを音声認識し、テキ
ストデータに変換して記憶しておくようにすれば、音声
データを記憶する場合に比較して、記憶容量が少なくて
済み、コストの削減を図ることが可能となる。
されたテキストデータを、FAXのデータに変換するよ
うにすれば、用紙に文字等を描くことなく、FAX送信
を行うことが可能となる。また、パソコン1において、
FAXのデータを受信して、OCR(Optical Characte
r Reader)等で、文字認識を行い、その文字認識結果を
対象に音声合成を行うようにすれば、ファックスされて
きた内容を見ることなく、その内容を把握することが可
能となる。さらに、例えば、留守番電話機能を有する電
話機、あるいは携帯電話機の留守番電話機能を司るセン
タにおいて、音声によるメッセージを音声認識し、テキ
ストデータに変換して記憶しておくようにすれば、音声
データを記憶する場合に比較して、記憶容量が少なくて
済み、コストの削減を図ることが可能となる。
【0083】なお、本実施の形態では、チャットサーバ
およびチャットクライアントを、ソフトウェアで実現す
るようにしたが、チャットサーバやチャットクライアン
トは、それ専用のハードウェアで実現することも可能で
ある。
およびチャットクライアントを、ソフトウェアで実現す
るようにしたが、チャットサーバやチャットクライアン
トは、それ専用のハードウェアで実現することも可能で
ある。
【0084】また、上述したチャットクライアントプロ
グラムや音声処理プログラム等のアプリケーションプロ
グラムを、コンピュータにインストールして実行させる
場合には、そのアプリケーションプログラムは、HD1
7や、フロッピーディスク、CD−ROM(Compact Di
sc - ROM),DVD(Digtal Versatile Disc)等のパ
ッケージメディアや、プログラムが一時的若しくは永続
的に格納される半導体メモリ等に記録して提供したり、
LAN(Local Area Network)や、インターネット、デ
ィジタル衛星回線等の有線/無線の通信ネットワーク
3、およびそのような通信ネットワーク3を介してのデ
ータの転送若しくは受信を行うルータやモデム等の通信
I/F11を介して提供したりすることが可能であり、
本明細書における媒体とは、そのようなものを含む広義
の概念を意味する。
グラムや音声処理プログラム等のアプリケーションプロ
グラムを、コンピュータにインストールして実行させる
場合には、そのアプリケーションプログラムは、HD1
7や、フロッピーディスク、CD−ROM(Compact Di
sc - ROM),DVD(Digtal Versatile Disc)等のパ
ッケージメディアや、プログラムが一時的若しくは永続
的に格納される半導体メモリ等に記録して提供したり、
LAN(Local Area Network)や、インターネット、デ
ィジタル衛星回線等の有線/無線の通信ネットワーク
3、およびそのような通信ネットワーク3を介してのデ
ータの転送若しくは受信を行うルータやモデム等の通信
I/F11を介して提供したりすることが可能であり、
本明細書における媒体とは、そのようなものを含む広義
の概念を意味する。
【0085】
【発明の効果】請求項1に記載の情報処理装置および請
求項5に記載の情報処理方法、並びに請求項6に記載の
媒体によれば、入力された音声が音声認識され、その音
声認識結果が、テキストデータで出力される。そして、
その音声認識結果としてのテキストデータが、サーバに
送信される。従って、例えば、チャットを、容易に行う
ことが可能となる。
求項5に記載の情報処理方法、並びに請求項6に記載の
媒体によれば、入力された音声が音声認識され、その音
声認識結果が、テキストデータで出力される。そして、
その音声認識結果としてのテキストデータが、サーバに
送信される。従って、例えば、チャットを、容易に行う
ことが可能となる。
【0086】請求項7に記載の情報処理装置および請求
項9に記載の情報処理方法、並びに請求項10に記載の
媒体によれば、サーバから送信されてくるテキストデー
タが受信され、そのサーバからのテキストデータに基づ
いて、音声合成が行われ、そのテキストデータに対応す
る合成音が出力される。従って、例えば、チャットを、
画面表示を見なくても行うことが可能となる。
項9に記載の情報処理方法、並びに請求項10に記載の
媒体によれば、サーバから送信されてくるテキストデー
タが受信され、そのサーバからのテキストデータに基づ
いて、音声合成が行われ、そのテキストデータに対応す
る合成音が出力される。従って、例えば、チャットを、
画面表示を見なくても行うことが可能となる。
【図1】本発明を適用したチャットシステムの一実施の
形態の構成例を示す図である。
形態の構成例を示す図である。
【図2】図1のパソコン1のハードウェア構成例を示す
ブロック図である。
ブロック図である。
【図3】図1のサーバ2のハードウェア構成例を示すブ
ロック図である。
ロック図である。
【図4】図1のチャットシステムの動作を説明するため
の図である。
の図である。
【図5】図1のパソコン1の機能的構成例を示すブロッ
ク図である。
ク図である。
【図6】図5のパソコン1の動作を説明するための図で
ある。
ある。
【図7】チャットクライアントとしてのパソコン1の表
示画面を示す図である。
示画面を示す図である。
【図8】チャットクライアントとしてのパソコン1の表
示画面を示す図である。
示画面を示す図である。
【図9】図1のパソコン1の動作を説明するためのフロ
ーチャートである。
ーチャートである。
【図10】図1のパソコン1の動作を説明するためのフ
ローチャートである。
ローチャートである。
1−1乃至1−3 パソコン, 2−1,2−2 サー
バ, 3 通信ネットワーク, 11 通信I/F,
12 ROM, 13 CPU, 14 RAM, 1
5 入力部, 16 出力部, 17 HD, 21
通信I/F,22 ROM, 23 CPU, 24
RAM, 25 入力部, 26 出力部, 27 H
D, 30 チャットクライアント機能部, 31−
1,31−2 チャット通信部, 32−1,32−2
チャット処理部, 41 チャットサーバ機能部,
51 音声入力装置, 52 音声認識装置, 53
音声読み上げ装置, 54 音声出力装置, 61−
1,61−2 ウインドウ,62−1,62−2 チャ
ット文字表示エリア, 63−1, 63−2 テキス
ト入力フィールド
バ, 3 通信ネットワーク, 11 通信I/F,
12 ROM, 13 CPU, 14 RAM, 1
5 入力部, 16 出力部, 17 HD, 21
通信I/F,22 ROM, 23 CPU, 24
RAM, 25 入力部, 26 出力部, 27 H
D, 30 チャットクライアント機能部, 31−
1,31−2 チャット通信部, 32−1,32−2
チャット処理部, 41 チャットサーバ機能部,
51 音声入力装置, 52 音声認識装置, 53
音声読み上げ装置, 54 音声出力装置, 61−
1,61−2 ウインドウ,62−1,62−2 チャ
ット文字表示エリア, 63−1, 63−2 テキス
ト入力フィールド
Claims (10)
- 【請求項1】 クライアントから送信されてきたテキス
トデータを受信し、そのテキストデータを、1以上の他
のクライアントに送信するサーバに対して、テキストデ
ータを送信するとともに、前記サーバからのテキストデ
ータを受信する情報処理装置であって、 入力された音声を音声認識し、その音声認識結果を、テ
キストデータで出力する音声認識手段と、 前記音声認識結果としてのテキストデータを、前記サー
バに送信する送信手段と、 前記サーバから送信されてくるテキストデータを受信す
る受信手段と、 前記サーバからのテキストデータを出力する出力手段と
を含むことを特徴とする情報処理装置。 - 【請求項2】 前記サーバからのテキストデータに基づ
いて、音声合成を行い、そのテキストデータに対応する
合成音を出力する音声合成手段をさらに含み、 前記出力手段は、前記テキストデータに対応する合成音
を出力するむことを特徴とする請求項1に記載の情報処
理装置。 - 【請求項3】 前記音声認識結果としてのテキストデー
タを訂正する訂正手段をさらに含むことを特徴とする請
求項1に記載の情報処理装置。 - 【請求項4】 前記テキストデータを表示させる表示手
段をさらに含むことを特徴とする請求項1に記載の情報
処理装置。 - 【請求項5】 クライアントから送信されてきたテキス
トデータを受信し、そのテキストデータを、1以上の他
のクライアントに送信するサーバに対して、テキストデ
ータを送信するとともに、前記サーバからのテキストデ
ータを受信する情報処理方法であって、 入力された音声を音声認識し、その音声認識結果を、テ
キストデータで出力する音声認識ステップと、 前記音声認識結果としてのテキストデータを、前記サー
バに送信する送信ステップと、 前記サーバから送信されてくるテキストデータを受信す
る受信ステップと、 前記サーバからのテキストデータを出力する出力ステッ
プとを含むことを特徴とする情報処理方法。 - 【請求項6】 クライアントから送信されてきたテキス
トデータを受信し、そのテキストデータを、1以上の他
のクライアントに送信するサーバに対して、テキストデ
ータを送信するとともに、前記サーバからのテキストデ
ータを受信する処理を情報処理装置に行わせるためのプ
ログラムを、前記情報処理装置に実行させる媒体であっ
て、 入力された音声を音声認識し、その音声認識結果を、テ
キストデータで出力する音声認識ステップと、 前記音声認識結果としてのテキストデータを、前記サー
バに送信する送信ステップと、 前記サーバから送信されてくるテキストデータを受信す
る受信ステップと、 前記サーバからのテキストデータを出力する出力ステッ
プとを含むことを特徴とするプログラムを、前記情報処
理装置に実行させる媒体。 - 【請求項7】 クライアントから送信されてきたテキス
トデータを受信し、そのテキストデータを、1以上の他
のクライアントに送信するサーバに対して、テキストデ
ータを送信するとともに、前記サーバからのテキストデ
ータを受信する情報処理装置であって、 前記テキストデータを入力する入力手段と、 入力された前記テキストデータを、前記サーバに送信す
る送信手段と、 前記サーバから送信されてくるテキストデータを受信す
る受信手段と、 前記サーバからのテキストデータに基づいて、音声合成
を行い、そのテキストデータに対応する合成音を出力す
る音声合成手段とを含むことを特徴とする情報処理装
置。 - 【請求項8】 前記テキストデータを表示する表示手段
をさらに含むことを特徴とする請求項7に記載の情報処
理装置。 - 【請求項9】 クライアントから送信されてきたテキス
トデータを受信し、そのテキストデータを、1以上の他
のクライアントに送信するサーバに対して、テキストデ
ータを送信するとともに、前記サーバからのテキストデ
ータを受信する情報処理方法であって、 前記テキストデータを入力する入力ステップと、 入力された前記テキストデータを、前記サーバに送信す
る送信ステップと、 前記サーバから送信されてくるテキストデータを受信す
る受信ステップと、 前記サーバからのテキストデータに基づいて、音声合成
を行い、そのテキストデータに対応する合成音を出力す
る音声合成ステップとを含むことを特徴とする情報処理
方法。 - 【請求項10】 クライアントから送信されてきたテキ
ストデータを受信し、そのテキストデータを、1以上の
他のクライアントに送信するサーバに対して、テキスト
データを送信するとともに、前記サーバからのテキスト
データを受信する処理を、情報処理装置に行わせるため
のプログラムを、前記情報処理装置に実行させる媒体で
あって、 前記テキストデータを入力する入力ステップと、 入力された前記テキストデータを、前記サーバに送信す
る送信ステップと、 前記サーバから送信されてくるテキストデータを受信す
る受信ステップと、 前記サーバからのテキストデータに基づいて、音声合成
を行い、そのテキストデータに対応する合成音を出力す
る音声合成ステップとを含むことを特徴とするプログラ
ムを、前記情報処理装置に実行させる媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11092862A JP2000285063A (ja) | 1999-03-31 | 1999-03-31 | 情報処理装置および情報処理方法、並びに媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11092862A JP2000285063A (ja) | 1999-03-31 | 1999-03-31 | 情報処理装置および情報処理方法、並びに媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000285063A true JP2000285063A (ja) | 2000-10-13 |
Family
ID=14066249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11092862A Withdrawn JP2000285063A (ja) | 1999-03-31 | 1999-03-31 | 情報処理装置および情報処理方法、並びに媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000285063A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297370A (ja) * | 2001-03-30 | 2002-10-11 | Daiwa House Ind Co Ltd | 情報通信システム,情報通信装置,情報通信方法,プログラム並びにデータ記録媒体 |
JP2004185088A (ja) * | 2002-11-29 | 2004-07-02 | Fujitsu Ltd | マルチチャネル会話システム |
JP2006323827A (ja) * | 2005-04-18 | 2006-11-30 | Ricoh Co Ltd | 音楽フォント出力装置、フォントデータベース及び言語入力フロントエンドプロセッサ |
JP2006528804A (ja) * | 2003-07-24 | 2006-12-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 電話ユーザがインスタント・メッセージングベースの会議に参加できるようにするための方法、システム、およびコンピュータ・プログラム(テレチャット・システムを使用する拡張会議サービスへのアクセス) |
JP2014006648A (ja) * | 2012-06-22 | 2014-01-16 | Sharp Corp | 情報処理装置、通信システム、通信方法、およびプログラム |
JP2018060568A (ja) * | 2007-08-16 | 2018-04-12 | クリムソン コーポレイション | 音声を利用できるテルネットインターフェイス |
WO2020153251A1 (ja) * | 2019-01-22 | 2020-07-30 | 株式会社ソニー・インタラクティブエンタテインメント | ボイスチャット装置、ボイスチャット方法及びプログラム |
US10873621B1 (en) | 2014-08-20 | 2020-12-22 | Ivanti, Inc. | Terminal emulation over html |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
-
1999
- 1999-03-31 JP JP11092862A patent/JP2000285063A/ja not_active Withdrawn
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297370A (ja) * | 2001-03-30 | 2002-10-11 | Daiwa House Ind Co Ltd | 情報通信システム,情報通信装置,情報通信方法,プログラム並びにデータ記録媒体 |
JP2004185088A (ja) * | 2002-11-29 | 2004-07-02 | Fujitsu Ltd | マルチチャネル会話システム |
JP2006528804A (ja) * | 2003-07-24 | 2006-12-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 電話ユーザがインスタント・メッセージングベースの会議に参加できるようにするための方法、システム、およびコンピュータ・プログラム(テレチャット・システムを使用する拡張会議サービスへのアクセス) |
JP2006323827A (ja) * | 2005-04-18 | 2006-11-30 | Ricoh Co Ltd | 音楽フォント出力装置、フォントデータベース及び言語入力フロントエンドプロセッサ |
JP2018060568A (ja) * | 2007-08-16 | 2018-04-12 | クリムソン コーポレイション | 音声を利用できるテルネットインターフェイス |
US10938886B2 (en) | 2007-08-16 | 2021-03-02 | Ivanti, Inc. | Scripting support for data identifiers, voice recognition and speech in a telnet session |
JP2014006648A (ja) * | 2012-06-22 | 2014-01-16 | Sharp Corp | 情報処理装置、通信システム、通信方法、およびプログラム |
US10873621B1 (en) | 2014-08-20 | 2020-12-22 | Ivanti, Inc. | Terminal emulation over html |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
WO2020153251A1 (ja) * | 2019-01-22 | 2020-07-30 | 株式会社ソニー・インタラクティブエンタテインメント | ボイスチャット装置、ボイスチャット方法及びプログラム |
CN113302682A (zh) * | 2019-01-22 | 2021-08-24 | 索尼互动娱乐股份有限公司 | 语音聊天装置、语音聊天方法和程序 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6216013B1 (en) | Communication system with handset for distributed processing | |
JP4849894B2 (ja) | 自動スピーチ認識サービス提供方法及びシステム並びに媒体 | |
US8868425B2 (en) | System and method for providing network coordinated conversational services | |
US6173250B1 (en) | Apparatus and method for speech-text-transmit communication over data networks | |
CA2345660C (en) | System and method for providing network coordinated conversational services | |
JP3728177B2 (ja) | 音声処理システム、装置、方法及び記憶媒体 | |
US20020138274A1 (en) | Server based adaption of acoustic models for client-based speech systems | |
WO2001099096A1 (fr) | Systeme de communication a entree vocale, terminal d'utilisateur et systeme central | |
JP2002528804A (ja) | サービスアプリケーションに対するユーザインタフェースの音声制御 | |
US20040189791A1 (en) | Videophone device and data transmitting/receiving method applied thereto | |
EP1727128B1 (en) | Client-server based speech recognition | |
JP2000285063A (ja) | 情報処理装置および情報処理方法、並びに媒体 | |
US7478046B2 (en) | Server-client type speech recognition apparatus and method | |
JP5046589B2 (ja) | 電話システムと通話補助方法とプログラム | |
GB2420674A (en) | Communicating instant messages from one type to another | |
JP6610610B2 (ja) | 音声入出力装置、無線接続方法、音声対話システム | |
US20030220794A1 (en) | Speech processing system | |
US8073930B2 (en) | Screen reader remote access system | |
Maes et al. | Conversational networking: conversational protocols for transport, coding, and control. | |
JP4845249B2 (ja) | 車両内の通信システムと車両外の中央計算機との間の情報を無線伝達するための方法 | |
JP2021081527A (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
JP2002300259A (ja) | 音声通話装置の評価試験方法及びシステム | |
JP2000259632A (ja) | 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体 | |
JP2000215118A (ja) | 音声によるeメ―ル送信方法とその装置 | |
KR20000033518A (ko) | 네트워크를 이용한 음성 언어 번역 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060606 |