[go: up one dir, main page]

JP2010166324A - 携帯端末、音声合成方法、及び音声合成用プログラム - Google Patents

携帯端末、音声合成方法、及び音声合成用プログラム Download PDF

Info

Publication number
JP2010166324A
JP2010166324A JP2009006810A JP2009006810A JP2010166324A JP 2010166324 A JP2010166324 A JP 2010166324A JP 2009006810 A JP2009006810 A JP 2009006810A JP 2009006810 A JP2009006810 A JP 2009006810A JP 2010166324 A JP2010166324 A JP 2010166324A
Authority
JP
Japan
Prior art keywords
voice
keyword
speech
signal
function unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2009006810A
Other languages
English (en)
Inventor
Yuichi Kameshige
祐一 亀重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009006810A priority Critical patent/JP2010166324A/ja
Publication of JP2010166324A publication Critical patent/JP2010166324A/ja
Ceased legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】音声通信可能な携帯端末において、特定のキーワードに基づいた音声合成の切換、生の音声へのフィルタリング、特定キーワードの自動登録を行う。
【解決手段】音声合成手段の前段に音声分析手段と音声変換手段を有する。音声合成手段は、受信音声をタレント等の特定の人を真似た合成音に変換する。また、受信音声の発信元が音声合成の切り替え相手かどうか判断する。また、受話の音声の感情を分析する。変換手段は、キーワードデータベースに予め登録された特定のキーワードの音声を認識すると、音声合成を中止して受話音そのままの音声を出力する。また、キーワードがNGワードとして登録されていた場合、相手に対し、決められたNGワードを通知する。また、受話の音声の感情が怒り等の特定の感情であるとの結果を得たら、音声合成を中止して元の音声にフィルタをかけた音声を出力する処理を行う。
【選択図】図1

Description

本発明は、携帯端末に関し、特に音声を出力する携帯端末に関する。
現在、携帯電話事業者(キャリア)の収益においては、データパケットの比率が増加し、音声の比率が減少している。
そこで、携帯電話オペレータ各社は、ユニークなアプリケーション(アプリケーションソフトウェア)を持った携帯端末や、サービスを提供する事により、シェアの伸張と共に音声の収益率アップを図っている。
しかし、従来の携帯電話は、音声合成機能は備えていても、特定のキーワードに基づいた音声合成の切換、生の音声へのフィルタリング、特定キーワードの自動登録は不可能であった。
なお、関連する技術として、特開平10−097267号公報(特許文献1)に声質変換方法および装置が開示されている。この関連技術では、利用者(ユーザ)の好みに合致する方向に音質が変換されるように、分析合成方式等を用いて、入力された音声の声質変換を行い、声質の異なる音声を合成し、良好な音声、所望の音質の合成音声、種々の声質の合成音声を出力することを目的としている。
特開平10−097267号公報
本発明の目的は、音声を分析し合成や変換を行う携帯端末を提供することである。
本発明の携帯端末は、音声分析手段と、変換手段と、音声合成手段とを具備する。音声分析手段は、音声通信の相手の識別情報が音声合成対象として登録されているか判断し、識別情報が音声合成対象として登録されている場合、音声通信に関する音声信号のスペクトラムを分析し、音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断する。変換手段は、音声が音声パターンに該当する音声である場合、音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力する。また、変換手段は、音声が音声パターンに該当する音声でない場合、音声信号に含まれるキーワードがNGワードに該当するか判断し、キーワードがNGワードに該当する場合、音声信号の発信元に対し、キーワードがNGワードである旨を通知する。音声合成手段は、音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力する。なお、音声通信の例として、電話による通話、テレビ放送やラジオ放送の受信、ストリーミングデータの受信、記憶装置等からの音声データの取得及び再生等が考えられる。また、音声信号の発信元は、音声信号が外部からの受信信号である場合は送信元の相手を示し、音声信号が外部への送信信号である場合は携帯端末のユーザを示す。但し、実際には、これらの例に限定されない。
本発明の音声合成方法では、音声通信の相手の識別情報が音声合成対象として登録されているか判断する。また、識別情報が音声合成対象として登録されている場合、音声通信に関する音声信号のスペクトラムを分析し、音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断する。また、音声が音声パターンに該当する音声である場合、音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力する。また、音声が音声パターンに該当する音声でない場合、音声信号に含まれるキーワードがNGワードに該当するか判断し、キーワードがNGワードに該当する場合、音声信号の発信元に対し、キーワードがNGワードである旨を通知する。また、音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力する。
本発明の音声合成用プログラムは、音声通信の相手の識別情報が音声合成対象として登録されているか判断するステップと、識別情報が音声合成対象として登録されている場合、音声通信に関する音声信号のスペクトラムを分析し、音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断するステップと、音声が音声パターンに該当する音声である場合、音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力するステップと、音声が音声パターンに該当する音声でない場合、音声信号に含まれるキーワードがNGワードに該当するか判断し、キーワードがNGワードに該当する場合、音声信号の発信元に対し、キーワードがNGワードである旨を通知するステップと、音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力するステップとをコンピュータに実行させるためのプログラムである。
電話機能を始めとする音声通信機能の利用価値を向上する。
本発明の第1及び第2実施形態における携帯端末の構成例を示すブロック図である。 本発明の第1実施形態における携帯端末の動作を示すフローチャートである。 本発明の第2実施形態における携帯端末の動作を示すフローチャートである。 本発明の第3及び第4実施形態における携帯端末の構成例を示すブロック図である。 本発明の第3実施形態における携帯端末の動作を示すフローチャートである。 本発明の第4実施形態における携帯端末の動作を示すフローチャートである。
<第1実施形態>
以下に、本発明の第1実施形態について添付図面を参照して説明する。
図1を参照すると、本発明の携帯端末は、アンテナ部11と、受信部12と、音声分析機能部13と、変換機能部14と、音声合成機能部15と、音声出力部16と、音声入力部17と、送信部18と、電話番号帳21と、キーワードデータベース22と、音声データベース23を備える。
ここでは、携帯端末の例として、携帯電話機を想定している。但し、実際には、携帯端末は、PC(パソコン)、モバイルノートPC、シンクライアント端末、カーナビ(カーナビゲーションシステム)、携帯音楽プレーヤー、携帯ゲーム機、家庭用ゲーム機、双方向テレビ、デジタルチューナー、デジタルレコーダー、情報家電(information home appliance)、OA(Office Automation)機器等でも良い。本質的には、本発明の携帯端末は、音声を出力可能な電子機器であれば良い。
アンテナ部11は、信号を電波で送信したり受信したりする。ここでは、携帯端末の通信方式として、無線通信を想定しているが、実際には、有線通信でも良い。
受信部12は、アンテナ部11で受信した外部からの信号を音声信号に変換する。ここでは、受信部12は、アンテナ部11が受信した高周波信号を復調してベースバンド信号に変換する。なお、ベースバンド信号とは、変復調をするシステムにおける変調前の信号及び復調後の情報信号(音声、映像、デジタルデータ等)を示す。ここでは、ベースバンド信号は、音声信号である。
音声分析機能部13は、電話を掛けて来た相手の電話番号等の識別情報が電話番号帳21に音声合成対象番号として登録されているかを判断する。また、音声分析機能部13は、音声信号のスペクトラムを分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断する。例えば、音声分析機能部13は、携帯端末の外部又は内部に記憶された特定の感情を示す音声パターンを参照して、音声信号に基づく音声パターンが、特定の感情を示す音声パターンと適合するかを判断する。但し、実際には、これらの例に限定されない。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
変換機能部14は、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に従い、特定のキーワードを示すキーワードデータを出力する。ここでは、変換機能部14は、電話を掛けて来た相手からの音声信号に含まれるキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、その相手に対し、送信部18を介して、予め決められたNGワードや、NGワードである旨の通知を送信する。例えば、変換機能部14は、音声信号に含まれていた「○○」というキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、相手に対し、送信部18を介して、「○○はNGワードです」という旨の通知を送信する。なお、変換機能部14は、音声信号に含まれるキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、NGワードの部分の音声を、無音又はビープ音に変換するようにしても良い。また、変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、所定の音声の合成を行う。本発明の携帯端末では、音声合成機能部15の前段に音声分析機能部13と変換機能部14を配置している。
音声出力部16は、受け取った音声信号に基づいて、音声出力を行う。
音声入力部17は、ユーザ又はアプリケーションによる音声入力に基づいて、音声信号を発生する。
送信部18は、音声信号を変換し、アンテナ部11を介して、変換後の信号を外部に送信する。ここでは、受信部12は、音声信号であるベースバンド信号を変調して高周波信号に変換し、アンテナ部11を介して、高周波信号を外部に送信する。
電話番号帳21は、電話を掛けて来た相手の電話番号等の識別情報を格納する。ここでは、電話番号帳21は、電話を掛けて来た相手のうち、音声合成の対象とする相手の電話番号等の識別情報を格納する。なお、電話番号は例示に過ぎず、実際には、電話を掛けて来た相手を特定できる識別情報であれば良い。また、電話番号帳21は、携帯端末自体が有する通常の電話番号帳とは別に設けられていても良い。
キーワードデータベース22は、特定のキーワードを示すキーワードデータを格納する。ここでは、キーワードデータベース22には、特定の会話のセンテンスやNGワードが登録されている。特定のキーワードの登録については、受話の操作者が変換機能部14を操作するためのボタンを押下した際、音声分析機能部13がそのボタンの押下時から所定時間前までの音声を分析して特定のキーワードを検出し、検出されたキーワードを示すキーワードデータをキーワードデータベース22に自動的に登録する。この場合、音声分析機能部13は、そのボタンの押下時から所定時間前までの音声を、一時的に記憶している。なお、変換機能部14は、操作者の操作に応じて、特定のキーワードデータをWEBサイト等からダウンロードして、キーワードデータベース22に登録するようにしても良い。このとき、変換機能部14は、キーワードデータベース22自体をWEBサイト等からダウンロードするようにしても良い。
音声データベース23は、所定の音声データを格納する。ここでは、音声データベース23には、特定の人物の音声に似た音声データが格納されているものとする。特定の人物の例として、タレント(芸能人)や、その他の著名人、ユーザの家族、知人等が考えられる。但し、実際には、これらの例に限定されない。なお、音声合成機能部15は、操作者の操作に応じて、所定の音声データをWEBサイト等からダウンロードして、音声データベース23に登録する。このとき、音声合成機能部15は、音声データベース23自体をWEBサイト等からダウンロードするようにしても良い。
アンテナ部11が利用する通信回線の例として、携帯電話網、WiMAX、3G(第3世代携帯電話)、インターネット、LAN(Local Area Network)、無線LAN(Wireless LAN)、ケーブルテレビ(CATV)回線、固定電話網、専用線(lease line)、IrDA(Infrared Data Association)、Bluetooth(登録商標)、シリアル通信回線等が考えられる。但し、実際には、これらの例に限定されない。
受信部12及び送信部18の例として、NIC(Network Interface Card)等のネットワークアダプタや、接続口(コネクタ)等の通信ポート等が考えられる。但し、実際には、これらの例に限定されない。
音声分析機能部13、変換機能部14、及び音声合成機能部15の例として、CPU(Central Processing Unit)やマイクロプロセッサ(microprocessor)等の処理装置、又は同様の機能を有する半導体集積回路(Integrated Circuit(IC))等が考えられる。なお、音声分析機能部13、変換機能部14、及び音声合成機能部15は、各々の機能を携帯端末に実行させるためのプログラム(音声認識ソフトウェア、音声合成ソフトウェア等)でも良い。但し、実際には、これらの例に限定されない。
また、変換機能部14は、ユーザ操作等の外部入力を受け付けるための入力装置や、ユーザ通知を行うための出力装置と連携するようにしても良い。入力装置の例として、キーボードやキーパッド、画面上のキーパッド、タッチパネル(touch panel)、タブレット(tablet)等が考えられる。或いは、入力装置は、外部の入力装置や記憶装置から情報を取得するためのインターフェース(I/F:interface)でも良い。また、出力装置の例として、LCD(液晶ディスプレイ)やPDP(プラズマディスプレイ)、有機ELディスプレイ(organic electroluminescence display)等の表示装置、又は、表示内容を壁やスクリーンに投影するプロジェクタ等の映写装置、表示内容を用紙等に印刷するプリンタ等の印刷装置等が考えられる。或いは、出力装置は、外部の表示装置や記憶装置に情報を出力するためのインターフェースでも良い。但し、実際には、これらの例に限定されない。
音声出力部16の例として、スピーカー、イヤホン、又はヘッドホン等が考えられる。音声出力部16は、ディスプレイ等の表示装置と一体化していても良い。但し、実際には、これらの例に限定されない。
音声入力部17の例として、マイク等の集音器、文字音声変換ソフトウェア、人工音声ソフトウェア、電子楽器等が考えられる。また、音声入力部17は、携帯端末の内部や外部の記憶装置に格納された音声データを取得するためのインタフェース(Interface(I/F))でも良い。但し、実際には、これらの例に限定されない。
電話番号帳21、キーワードデータベース22、及び音声データベース23の例として、メモリ等の半導体記憶装置、ハードディスク等の外部記憶装置(ストレージ)、又は、記憶媒体(メディア)等が考えられる。なお、電話番号帳21、キーワードデータベース22、及び音声データベース23は、携帯端末の本体に内蔵された記憶装置に限らず、周辺機器(外付けHDD等)や外部のサーバ(ストレージサーバ等)に設置された記憶装置、或いは、NAS(Network Attached Storage)でも良い。但し、実際には、これらの例に限定されない。
図2を参照して、本発明の携帯端末の動作について説明する。
(1)ステップS101
アンテナ部11は、相手が電話を掛けて来た場合、高周波信号を受信する。
(2)ステップS102
受信部12は、受信された高周波信号を復調し、ベースバンド信号に変換して音声分析機能部13に送る。このとき、受信部12は、ベースバンド信号と共に、電話を掛けて来た相手の電話番号を示す情報信号を音声分析機能部13に送る。ここでは、ベースバンド信号は、音声信号である。なお、ベースバンド信号は、電話を掛けて来た相手の電話番号を示すデジタルデータを含んでいても良い。
(3)ステップS103
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録されているかを判断する。なお、電話番号は例示に過ぎず、実際には、電話を掛けて来た相手を特定できる識別情報であれば良い。
(4)ステップS104
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号でない場合、直接、音声出力部16に音声信号を送る。音声出力部16は、当該音声信号に基づいて、音声出力を行う。このとき、音声分析機能部13は、変換機能部14及び音声合成機能部15に対して動作しないように通知した上で、変換機能部14及び音声合成機能部15を介して音声出力部16に音声信号を送るようにしても良い。
(5)ステップS105
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号である場合、音声合成ONと認識し、変換機能部14を動作させる。例えば、音声分析機能部13は、音声合成ONと認識した場合、OFF状態の変換機能部14を起動させる。或いは、音声分析機能部13から変換機能部14への通知を禁止状態から許可状態に変更する。すなわち、音声分析機能部13は、音声合成ONと認識した場合、当該相手との電話中、変換機能部14への音声信号の提供を可能にする。
(6)ステップS106
音声分析機能部13は、音声信号のスペクトラムを分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断する。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、音声分析機能部13は、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
(7)ステップS107
変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。ここでは、変換機能部14は、音声出力部16に対して、元の音声にフィルタをかけた後の音声信号を送る。音声出力部16は、元の音声にフィルタをかけた音声を出力する。このとき、変換機能部14は、音声合成機能部15に対し、音声信号と、元の音声にフィルタをかける旨の通知(フィルタリング依頼)を送り、音声合成機能部15で元の音声にフィルタをかけ、音声合成機能部15から音声出力部16に元の音声にフィルタをかけた後の音声信号を送るようにしても良い。
(8)ステップS108
変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声でなければ、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれているかどうか判断する。このとき、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれていない場合、音声合成機能部15に音声信号を送る。
(9)ステップS109
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、音声合成機能部15に対して、音声合成を中止又は禁止し、元の音声を音声出力部16に出力する旨の通知を送る。このとき、音声合成機能部15は、音声信号のうち、特定のキーワードに該当する部分の音声を無音又はビープ音に変換して音声出力部16に送り、他の部分を元の音声で音声出力部16に送る。音声出力部16は、当該音声信号に基づいて、音声出力を行う。
(10)ステップS110
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該キーワードデータに基づいて、予め決められたNGワードを送信部18に出力する。送信部18は、アンテナ部11を介して、電話を掛けて来た相手に、予め決められたNGワードを送信する。例えば、変換機能部14は、キーワードデータに基づいて、特定のキーワードがNGワードである旨を、送信部18を介して、電話を掛けて来た相手に通知する。このとき、変換機能部14は、NGワードの部分の音声を、無音又はビープ音に変換するようにしても良い。なお、変換機能部14は、特定のキーワードがNGワードである旨を、電話を掛けて来た相手に通知しない場合、特定のキーワードを送信部18に出力しなくても良い。
(11)ステップS111
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、特定の人物に似た音声の合成を行う。ここでは、音声合成機能部15は、受け取った音声信号に基づく音声の全体に対して、特定の人物に似た音声の合成を行う。
(12)ステップS112
音声合成機能部15は、音声合成された音声信号を音声出力部16に送る。音声出力部16は、音声合成された音声信号に基づいて、スピーカー等から合成音を出力する。
(13)ステップS113
音声分析機能部13は、高周波信号の受信が終了するまで、継続的に受話の音声の感情を分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるとの結果を得たら、現在の合成音の出力を中止して元の音声にフィルタをかけた音声を出力する処理に切り替える。音声分析機能部13は、通話が終了したら、一連の処理を終了する。
本発明の携帯端末は、テレビやラジオ、カーナビ、無線通信対応の携帯音楽プレーヤーのように、受信専用の音声再生装置でも良い。すなわち、本発明の携帯端末は、音声入力部17や、送信部18を備えていなくても良い。この場合、本発明の携帯端末は、外部に対して、NGワード等の通知を行わない。
本発明の携帯端末では、音声データベース23に、タレント等の特定の人物の音声データを登録して置けば、受信音声を、その特定の人物を真似た合成音で聞く事ができる。
音声合成の切り替え相手の選択は、予め電話番号帳21に相手を登録しておく事により、又は通話途中でもスイッチを押す事で相手を登録する事により、音声合成をON、OFFする事ができる。
キーワードデータベース22に予め登録された特定のキーワードの音声を認識すると、音声合成を中止して受話音そのままの音声を出力することもできる。
また、キーワードがNGワードとして登録されていた場合は、相手に対して、決められたNGワードや、NGワードである旨の通知を出力する事もできる。
また、受話の音声の感情を分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるとの結果を得たら、特定の人物の音声に真似た合成音を中止して元の音声にフィルタをかけた音声を出力する処理を行う事ができる。
特定のキーワードの登録は、受話の操作者がボタンを押すとその所定時間前の音声を分析してキーワードデータベース22に自動的に登録する事ができる。
この携帯端末を使用すれば、特定の相手から掛かって来た着信音を好みのタレントとそっくりな音声に合成し、あたかもタレントと会話をしている雰囲気を作り出す事ができる。
また、キーワードデータベース22と組合せる事により、相手の感情や、直接音声で言って貰いたくないNGワードを会話から遠ざける事ができる。
ここでは、携帯端末による電話(通話)における音声変換を例に説明しているが、実際には、テレビ機能やラジオ機能等を使用した際(放送視聴時)における音声変換、或いは、記憶装置や記憶媒体等に記憶されている音声データを再生した際(音声再生時)における音声変換も可能である。
<第2実施形態>
以下に、本発明の第2実施形態について説明する。
第1実施形態では、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、音声合成を中止又は禁止し、NGワードを通知しているが、本実施形態では、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合に、音声合成を行うようにする。
本実施形態における携帯端末の構成については、基本的に第1実施形態と同じである。すなわち、本実施形態における携帯端末の構成は、図1に示す通りである。
図3を参照して、本実施形態における携帯端末の動作について説明する。
(1)ステップS201
アンテナ部11は、相手が電話を掛けて来た場合、高周波信号を受信する。
(2)ステップS202
受信部12は、受信された高周波信号を復調し、ベースバンド信号に変換して音声分析機能部13に送る。このとき、受信部12は、ベースバンド信号と共に、電話を掛けて来た相手の電話番号を示す情報信号を音声分析機能部13に送る。ここでは、ベースバンド信号は、音声信号である。なお、ベースバンド信号は、電話を掛けて来た相手の電話番号を示すデジタルデータを含んでいても良い。
(3)ステップS203
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録されているかを判断する。なお、電話番号は例示に過ぎず、実際には、電話を掛けて来た相手を特定できる識別情報であれば良い。
(4)ステップS204
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号でない場合、直接、音声出力部16に音声信号を送る。音声出力部16は、当該音声信号に基づいて、音声出力を行う。このとき、音声分析機能部13は、変換機能部14及び音声合成機能部15に対して動作しないように通知した上で、変換機能部14及び音声合成機能部15を介して音声出力部16に音声信号を送るようにしても良い。
(5)ステップS205
音声分析機能部13は、電話を掛けて来た相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号である場合、音声合成ONと認識し、変換機能部14を動作させる。例えば、音声分析機能部13は、音声合成ONと認識した場合、OFF状態の変換機能部14を起動させる。或いは、音声分析機能部13から変換機能部14への通知を禁止状態から許可状態に変更する。すなわち、音声分析機能部13は、音声合成ONと認識した場合、当該相手との電話中、変換機能部14への音声信号の提供を可能にする。
(6)ステップS206
音声分析機能部13は、音声信号のスペクトラムを分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断する。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、音声分析機能部13は、音声信号に基づく音声が怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
(7)ステップS207
変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。ここでは、変換機能部14は、音声出力部16に対して、元の音声にフィルタをかけた後の音声信号を送る。音声出力部16は、元の音声にフィルタをかけた音声を出力する。このとき、変換機能部14は、音声合成機能部15に対し、音声信号と、元の音声にフィルタをかける旨の通知(フィルタリング依頼)を送り、音声合成機能部15で元の音声にフィルタをかけ、音声合成機能部15から音声出力部16に元の音声にフィルタをかけた後の音声信号を送るようにしても良い。
(8)ステップS208
変換機能部14は、音声信号に基づく音声が怒り等の特定の感情を示す音声でなければ、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれているかどうか判断する。このとき、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該音声信号を音声合成機能部15に出力する。なお、変換機能部14は、音声信号のうち特定のキーワードに該当する部分のみ音声合成機能部15に出力し、他の部分を音声出力部16に出力するようにしても良い。また、変換機能部14は、当該キーワードデータを音声合成機能部15に出力するようにしても良い。
(9)ステップS209
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれていない場合、音声合成機能部15に対して、音声合成を中止又は禁止し、元の音声を音声出力部16に出力する旨の通知を送る。音声出力部16は、当該音声信号に基づいて、元の音声を出力する。
(10)ステップS210
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該キーワードデータに基づいて、特定のキーワードを送信部18に出力する。送信部18は、アンテナ部11を介して、電話を掛けて来た相手に、特定のキーワードを送信する。例えば、変換機能部14は、キーワードデータに基づいて、特定のキーワードに対して音声合成を行う旨を、送信部18を介して、電話を掛けて来た相手に通知する。なお、変換機能部14は、特定のキーワードに対して音声合成を行う旨を、電話を掛けて来た相手に通知しない場合、特定のキーワードを送信部18に出力しなくても良い。
(11)ステップS211
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、特定の人物に似た音声の合成を行う。ここでは、音声合成機能部15は、受け取った音声信号に基づく音声の全体に対して、特定の人物に似た音声の合成を行う。なお、音声合成機能部15は、変換機能部14からキーワードデータを受け取り、キーワードデータに基づいて、受け取った音声信号に基づく音声に含まれる特定のキーワードの音声のみ、特定の人物に似た音声の合成を行うようにしても良い。例えば、音声合成機能部15は、キーワードデータが特定の人物の著名な発言を示している場合、受け取った音声信号に基づく音声にこの著名な発言と同じ内容が含まれていれば、その発言の箇所のみ、特定の人物に似た音声での合成を行う。
(12)ステップS212
音声合成機能部15は、音声合成された音声信号を音声出力部16に送る。音声出力部16は、音声合成された音声信号に基づいて、スピーカー等から合成音を出力する。
(13)ステップS213
音声分析機能部13は、高周波信号の受信が終了するまで、継続的に受話の音声の感情を分析し、音声信号に基づく音声が怒り等の特定の感情を示す音声であるとの結果を得たら、現在の合成音の出力を中止して元の音声にフィルタをかけた音声を出力する処理に切り替える。音声分析機能部13は、通話が終了したら、一連の処理を終了する。
これにより、本発明の携帯端末は、通話や音声再生の際に、ユーザの知人の口癖や、著名人の有名な台詞(セリフ)が使用された場合、その本人(当人)の声色で再生する事ができる。このとき、声色の音声データ(音源)については、当人の使用許諾を得ているものとする。使用許諾を得る方法として、対価の支払い等が考えられる。声色の音声データ(音源)の入手方法としては、許可を受けた上での当人からの録音や、所定のWebサイトからのダウンロード等が考えられる。
<第3実施形態>
以下に、本発明の第3実施形態について説明する。
本実施形態では、第1実施形態とは逆に、携帯端末のユーザが音声入力した音声を合成し、合成音を外部に送信するようにする。
図4を参照すると、本実施形態における携帯端末は、アンテナ部11と、受信部12と、音声分析機能部13と、変換機能部14と、音声合成機能部15と、音声出力部16と、音声入力部17と、送信部18と、電話番号帳21と、キーワードデータベース22と、音声データベース23を備える。
アンテナ部11、受信部12、音声分析機能部13、変換機能部14、音声合成機能部15、音声出力部16、音声入力部17、送信部18、電話番号帳21、キーワードデータベース22、及び音声データベース23については、基本的に第1実施形態と同じである。
本実施形態では、音声分析機能部13は、電話を掛ける相手の電話番号等の識別情報が電話番号帳21に音声合成対象番号として登録されているかを判断する。また、音声分析機能部13は、音声入力部17に入力された音声に基づく音声信号についても分析を行う。すなわち、音声分析機能部13は、送話又は受話の少なくとも一方の音声信号のスペクトラムを分析し、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるかどうか判断する。ここでは、受信部12から受け取った音声信号、及び音声入力部17に入力された音声に基づく音声信号の両方のスペクトラムを分析し、分析された音声信号のうち少なくとも一方の音声信号が怒り等の特定の感情を示す音声信号であるかどうか判断する。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、音声分析機能部13は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
変換機能部14は、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に従い、特定のキーワードを示すキーワードデータを出力する。ここでは、変換機能部14は、音声入力部17から受け取った音声信号に含まれるキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、音声出力部16に対して、予め決められたNGワードや、NGワードである旨の通知を送る。例えば、変換機能部14は、ユーザにより音声入力された音声信号に含まれていた「○○」というキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、音声出力部16を介して、ユーザに対し、「○○はNGワードです」という旨を通知する。なお、変換機能部14は、音声信号に含まれるキーワードがNGワードとしてキーワードデータベース22に登録されていた場合、NGワードの部分の音声を、無音又はビープ音に変換するようにしても良い。また、変換機能部14は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、所定の音声の合成を行う。本発明の携帯端末では、音声合成機能部15の前段に音声分析機能部13と変換機能部14を配置している。
電話番号帳21は、電話を掛ける相手の電話番号等の識別情報を格納する。ここでは、電話番号帳21は、電話を掛ける相手のうち、音声合成の対象とする相手の電話番号等の識別情報を格納する。なお、電話番号は例示に過ぎず、実際には、電話を掛ける相手を特定できる識別情報であれば良い。また、電話番号帳21は、携帯端末自体が有する通常の電話番号帳とは別に設けられていても良い。
図5を参照して、本実施形態における携帯端末の動作について説明する。
(1)ステップS301
音声入力部17は、所定の相手に電話を掛ける際、音声入力に応じて、音声信号を発生する。ここでは、音声入力部17は、ユーザ又はアプリケーションによる音声入力に応じて、音声信号を生成し、その音声信号を音声分析機能部13に送る。このとき、音声分析機能部13は、音声信号と、電話を掛ける相手の電話番号を受け取る。例えば、音声分析機能部13は、ユーザにより入力された電話番号を受け取った後、音声入力部17から音声信号を受け取るようにしても良い。
(2)ステップS302
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録されているかを判断する。なお、電話番号は例示に過ぎず、実際には、電話を掛ける相手を特定できる識別情報であれば良い。
(3)ステップS303
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号でない場合、直接、送信部18に音声信号を送る。このとき、音声分析機能部13は、変換機能部14に対して動作しないように通知した上で、変換機能部14を介して送信部18に音声信号を送るようにしても良い。送信部18は、受け取った音声信号を変調して高周波信号に変換し、アンテナ部11を介して、電話を掛ける相手に対し、その高周波信号を送信する。
(4)ステップS304
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号である場合、音声合成ONと認識し、変換機能部14を動作させる。例えば、音声分析機能部13は、音声合成ONと認識した場合、OFF状態の変換機能部14を起動させる。或いは、音声分析機能部13から変換機能部14への通知を禁止状態から許可状態に変更する。すなわち、音声分析機能部13は、音声合成ONと認識した場合、当該相手との電話中、変換機能部14への音声信号の提供を可能にする。
(5)ステップS305
アンテナ部11は、相手が電話に出た場合、相手からの高周波信号を受信する。
(6)ステップS306
受信部12は、受信された高周波信号を復調し、ベースバンド信号に変換して音声分析機能部13に送る。このとき、受信部12は、ベースバンド信号と共に、電話を掛けて来た相手の電話番号を示す情報信号を音声分析機能部13に送る。ここでは、ベースバンド信号は、音声信号である。なお、ベースバンド信号は、電話を掛けて来た相手の電話番号を示すデジタルデータを含んでいても良い。
(7)ステップS307
音声分析機能部13は、送話又は受話の少なくとも一方の音声信号のスペクトラムを分析し、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるかどうか判断する。すなわち、音声分析機能部13は、受信部12から受け取った音声信号(相手側からの音声信号)と、音声入力部16から受け取った音声信号(ユーザ側からの音声信号)のうち、少なくとも一方の音声信号が怒り等の特定の感情を示す音声信号であるかどうか判断する。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、音声分析機能部13は、怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
(8)ステップS308
変換機能部14は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。ここでは、変換機能部14は、送信部18に対して、元の音声にフィルタをかけた後の音声信号を送る。送信部18は、元の音声にフィルタをかけた音声を出力する。このとき、変換機能部14は、音声合成機能部15に対し、音声信号と、元の音声にフィルタをかける旨の通知(フィルタリング依頼)を送り、音声合成機能部15で元の音声にフィルタをかけ、音声合成機能部15から送信部18に元の音声にフィルタをかけた後の音声信号を送るようにしても良い。
(9)ステップS309
変換機能部14は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声でなければ、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれているかどうか判断する。このとき、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれていない場合、音声合成機能部15に音声信号を送る。
(10)ステップS310
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、音声合成機能部15に対して、音声合成を中止又は禁止し、元の音声を送信部18に出力する旨の通知を送る。このとき、音声合成機能部15は、音声信号のうち、特定のキーワードに該当する部分の音声を無音又はビープ音に変換して送信部18に送り、他の部分を元の音声で送信部18に送る。送信部18は、受け取った音声信号を変調して高周波信号に変換し、アンテナ部11を介して、電話を掛ける相手に対し、その高周波信号を送信する。
(11)ステップS311
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該キーワードデータに基づいて、特定のキーワードを音声出力部16に出力する。音声出力部16は、特定のキーワードを出力する。例えば、変換機能部14は、キーワードデータに基づいて、特定のキーワードがNGワードである旨を、音声出力部16を介して、ユーザに通知する。このとき、変換機能部14は、NGワードの部分の音声を、無音又はビープ音に変換するようにしても良い。なお、変換機能部14は、特定のキーワードがNGワードである旨を、ユーザに通知しない場合、特定のキーワードを音声出力部16に出力しなくても良い。
(12)ステップS312
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、特定の人物に似た音声の合成を行う。ここでは、音声合成機能部15は、受け取った音声信号に基づく音声の全体に対して、特定の人物に似た音声の合成を行う。
(13)ステップS313
音声合成機能部15は、音声合成された音声信号を送信部18に送る。送信部18は、受け取った音声信号を変調して高周波信号に変換し、アンテナ部11を介して、電話を掛ける相手に対し、その高周波信号を送信する。
(14)ステップS314
音声分析機能部13は、高周波信号の送信が終了するまで、継続的に、送話又は受話の少なくとも一方の音声の感情を分析し、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるとの結果を得たら、現在の合成音の出力を中止して元の音声にフィルタをかけた音声を出力する処理に切り替える。音声分析機能部13は、通話が終了したら、一連の処理を終了する。
本実施形態における携帯端末では、デコメ(デコレーションメール)(登録商標)における顔文字や絵文字のように、声色や台詞を「素材」として、音声をデコレーション(装飾)する事ができる。
<第4実施形態>
以下に、本発明の第4実施形態について説明する。
第3実施形態では、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、音声合成を中止又は禁止し、ユーザにNGワードを通知しているが、本実施形態では、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合に、音声合成を行うようにする。
本実施形態における携帯端末の構成については、基本的に第3実施形態と同じである。すなわち、本実施形態における携帯端末の構成は、図4に示す通りである。
図6を参照して、本実施形態における携帯端末の動作について説明する。
(1)ステップS401
音声入力部17は、所定の相手に電話を掛ける際、音声入力に応じて、音声信号を発生する。ここでは、音声入力部17は、ユーザ又はアプリケーションによる音声入力に応じて、音声信号を生成し、その音声信号を音声分析機能部13に送る。このとき、音声分析機能部13は、音声信号と、電話を掛ける相手(通話相手)の電話番号を受け取る。例えば、音声分析機能部13は、ユーザにより入力された電話番号を受け取った後、音声入力部17から音声信号を受け取るようにしても良い。
(2)ステップS402
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録されているかを判断する。なお、電話番号は例示に過ぎず、実際には、電話を掛ける相手を特定できる識別情報であれば良い。
(3)ステップS403
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号でない場合、直接、送信部18に音声信号を送る。このとき、音声分析機能部13は、変換機能部14に対して動作しないように通知した上で、変換機能部14を介して送信部18に音声信号を送るようにしても良い。送信部18は、受け取った音声信号を変調して高周波信号に変換し、アンテナ部11を介して、電話を掛ける相手に対し、その高周波信号を送信する。
(4)ステップS404
音声分析機能部13は、電話を掛ける相手の電話番号が電話番号帳21に音声合成対象番号として登録された番号である場合、音声合成ONと認識し、変換機能部14を動作させる。例えば、音声分析機能部13は、音声合成ONと認識した場合、OFF状態の変換機能部14を起動させる。或いは、音声分析機能部13から変換機能部14への通知を禁止状態から許可状態に変更する。すなわち、音声分析機能部13は、音声合成ONと認識した場合、当該相手との電話中、変換機能部14への音声信号の提供を可能にする。
(5)ステップS405
アンテナ部11は、相手が電話に出た場合、相手からの高周波信号を受信する。
(6)ステップS406
受信部12は、受信された高周波信号を復調し、ベースバンド信号に変換して音声分析機能部13に送る。このとき、受信部12は、ベースバンド信号と共に、電話を掛けて来た相手の電話番号を示す情報信号を音声分析機能部13に送る。ここでは、ベースバンド信号は、音声信号である。なお、ベースバンド信号は、電話を掛けて来た相手の電話番号を示すデジタルデータを含んでいても良い。
(7)ステップS407
音声分析機能部13は、送話又は受話の少なくとも一方の音声信号のスペクトラムを分析し、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるかどうか判断する。すなわち、音声分析機能部13は、受信部12から受け取った音声信号(相手側からの音声信号)と、音声入力部16から受け取った音声信号(ユーザ側からの音声信号)のうち、少なくとも一方の音声信号が怒り等の特定の感情を示す音声信号であるかどうか判断する。その後、音声分析機能部13は、変換機能部14に音声信号を送る。このとき、音声分析機能部13は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、特定の感情を示す音声である旨を、或いは、元の音声にフィルタをかける旨の指示を、変換機能部14に通知する。なお、音声分析機能部13は、怒り等の特定の感情を示す音声であるかどうか判断しない場合、無条件で変換機能部14に音声信号を送る。
(8)ステップS408
変換機能部14は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であれば、元の音声にフィルタをかけた音声を出力する処理(フィルタリング)を行う。ここでは、変換機能部14は、送信部18に対して、元の音声にフィルタをかけた後の音声信号を送る。送信部18は、元の音声にフィルタをかけた音声を出力する。このとき、変換機能部14は、音声合成機能部15に対し、音声信号と、元の音声にフィルタをかける旨の通知(フィルタリング依頼)を送り、音声合成機能部15で元の音声にフィルタをかけ、音声合成機能部15から送信部18に元の音声にフィルタをかけた後の音声信号を送るようにしても良い。
(9)ステップS409
変換機能部14は、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声でなければ、キーワードデータベース22を参照して、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれているかどうか判断する。このとき、変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該音声信号を音声合成機能部15に出力する。なお、変換機能部14は、音声信号のうち特定のキーワードに該当する部分のみ音声合成機能部15に出力し、他の部分を送信部18に出力するようにしても良い。また、変換機能部14は、当該キーワードデータを音声合成機能部15に出力するようにしても良い。
(10)ステップS410
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれていない場合、音声合成機能部15に対して、音声合成を中止又は禁止し、元の音声を送信部18に出力する旨の通知を送る。送信部18は、当該音声信号に基づいて、元の音声を出力する。
(11)ステップS411
変換機能部14は、音声分析機能部13で分析された音声信号に、特定のキーワードを示すキーワードデータが含まれている場合、当該キーワードデータに基づいて、特定のキーワードを音声出力部16に出力する。このとき、変換機能部14は、音声合成機能部15を介して、特定のキーワードに該当する部分の合成音を音声出力部16に出力するようにしても良い。音声出力部16は、ユーザに、特定のキーワードを通知する。すなわち、変換機能部14は、キーワードデータに基づいて、特定のキーワードに対して音声合成を行う旨を、音声出力部16を介して、ユーザに通知する。なお、変換機能部14は、特定のキーワードに対して音声合成を行う旨を、ユーザに通知しない場合、特定のキーワードを音声出力部16に出力しなくても良い。
(12)ステップS412
音声合成機能部15は、音声データベース23を参照して、受け取った音声信号に応じて、特定の人物に似た音声の合成を行う。ここでは、音声合成機能部15は、受け取った音声信号に基づく音声の全体に対して、特定の人物に似た音声の合成を行う。なお、音声合成機能部15は、変換機能部14からキーワードデータを受け取り、キーワードデータに基づいて、受け取った音声信号に基づく音声に含まれる特定のキーワードの音声のみ、特定の人物に似た音声の合成を行うようにしても良い。例えば、音声合成機能部15は、キーワードデータが特定の人物の著名な発言を示している場合、受け取った音声信号に基づく音声にこの著名な発言と同じ内容が含まれていれば、その発言の箇所のみ、特定の人物に似た音声での合成を行う。
(13)ステップS413
音声合成機能部15は、音声合成された音声信号を送信部18に送る。送信部18は、受け取った音声信号を変調して高周波信号に変換し、アンテナ部11を介して、電話を掛ける相手に対し、その高周波信号を送信する。
(14)ステップS414
音声分析機能部13は、高周波信号の送信が終了するまで、継続的に、送話又は受話の少なくとも一方の音声の感情を分析し、送話又は受話の少なくとも一方の音声が怒り等の特定の感情を示す音声であるとの結果を得たら、現在の合成音の出力を中止して元の音声にフィルタをかけた音声を出力する処理に切り替える。音声分析機能部13は、通話が終了したら、一連の処理を終了する。
なお、本発明における各実施形態は、組み合わせて実施することも可能である。
以上のように、本発明の携帯端末は、音声合成機能と、特定のキーワードや特定の感情の音声に基づいた音声合成の切換機能、生の音声へのフィルタリング機能、及び特定キーワードの自動登録の機能を持つ。
本発明の携帯端末では、受話音を特定の人物の音声に真似た合成音で聞く事ができる。
また、本発明の携帯端末では、音声合成の切り替え相手の選択は予め電話番号帳21に登録した相手を登録でき、また、通話途中でもスイッチを押す事により音声合成をON、OFFする事ができる。
また、本発明の携帯端末では、キーワードデータベース22に登録された特定のキーワードの音声を認識すると音声合成を中止して受話音そのままの音声を出力できる。
また、本発明の携帯端末では、キーワードがNGワードとして登録されていた場合、相手に対しNGワードを出力する事もできる。
また、本発明の携帯端末では、受話の音声の感情を分析し、怒り等の特定の感情を示す音声であるとの結果を得たら、特定の人物の音声に真似た合成音を中止して元の音声にフィルタをかけた音声を出力する処理を行う事ができる。
また、本発明の携帯端末では、受話の操作者がボタンを押すとその所定時間前の音声を分析して、特定のキーワードをキーワードデータベース22に自動的に登録する事ができる。
以上の機能を持ったこの携帯端末を使用すれば、収益比率が減少中の音声ユーザの需要を喚起する事ができ、引いては携帯端末の販売シェアを伸ばす事ができる。
本発明は、携帯電話機の開発設計製造会社及びその部門での利用が考えられる。
以上、本発明の実施形態を詳述してきたが、実際には、上記の実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の変更があっても本発明に含まれる。
11… アンテナ部
12… 受信部
13… 音声分析機能部
14… 変換機能部
15… 音声合成機能部
16… 音声出力部
17… 音声入力部
18… 送信部
21… 電話番号帳
22… キーワードデータベース
23… 音声データベース

Claims (15)

  1. 音声通信の相手の識別情報が音声合成対象として登録されているか判断し、前記識別情報が音声合成対象として登録されている場合、前記音声通信に関する音声信号のスペクトラムを分析し、前記音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断する音声分析手段と、
    前記音声が前記音声パターンに該当する音声である場合、前記音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力し、前記音声が前記音声パターンに該当する音声でない場合、前記音声信号に含まれるキーワードがNGワードに該当するか判断し、前記キーワードがNGワードに該当する場合、前記音声信号の発信元に対し、前記キーワードがNGワードである旨を通知する変換手段と、
    前記音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力する音声合成手段と
    を具備する
    携帯端末。
  2. 請求項1に記載の携帯端末であって、
    前記変換手段は、前記音声通信の最中に、ユーザの所定の操作に応じて、前記所定の操作時から所定時間前までの間に発信された音声信号に含まれる特定のキーワードをNGワードとしてキーワードデータベースに登録し、前記音声信号に含まれるキーワードがNGワードに該当するか判断する際に、前記キーワードデータベースを参照する
    携帯端末。
  3. 請求項1又は2に記載の携帯端末であって、
    前記音声分析手段は、前記音声通信における送信側及び受信側の両方の音声信号のスペクトラムを分析し、前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が特定の感情を示す音声であるかどうか判断し、
    前記変換手段は、前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が前記音声パターンに該当する音声である場合、前記特定の感情を示している音声にフィルタをかけるフィルタリング処理を行う
    携帯端末。
  4. 請求項1乃至3のいずれか一項に記載の携帯端末であって、
    前記変換手段は、前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断し、前記キーワードが特定のキーワードに該当する場合、前記音声信号を前記音声合成手段に送る
    携帯端末。
  5. 請求項1乃至4のいずれか一項に記載の携帯端末であって、
    前記変換手段は、前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断し、前記キーワードが特定のキーワードに該当する場合、前記音声信号のうち特定のキーワードに該当する箇所の音声信号を、前記音声合成手段に送り、
    前記音声合成手段は、前記音声信号のうち特定のキーワードに該当する箇所の音声信号に対して、所定の音声の合成を行い、合成音を出力する
    携帯端末。
  6. 音声通信の相手の識別情報が音声合成対象として登録されているか判断し、
    前記識別情報が音声合成対象として登録されている場合、前記音声通信に関する音声信号のスペクトラムを分析し、前記音声信号に基づく音声が特定の感情を示す音声であるかどうか判断し、
    前記音声が前記音声パターンに該当する音声である場合、前記音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力し、
    前記音声が前記音声パターンに該当する音声でない場合、前記音声信号に含まれるキーワードがNGワードに該当するか判断し、前記キーワードがNGワードに該当する場合、前記音声信号の発信元に対し、前記キーワードがNGワードである旨を通知し、
    前記音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力する
    音声合成方法。
  7. 請求項6に記載の音声合成方法であって、
    前記音声通信の最中に、ユーザの所定の操作に応じて、前記所定の操作時から所定時間前までの間に発信された音声信号に含まれる特定のキーワードをNGワードとしてキーワードデータベースに登録し、
    前記音声信号に含まれるキーワードがNGワードに該当するか判断する際に、前記キーワードデータベースを参照する
    音声合成方法。
  8. 請求項6又は7に記載の音声合成方法であって、
    前記音声分析手段は、前記音声通信における送信側及び受信側の両方の音声信号のスペクトラムを分析し、前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が特定の感情を示す音声であるかどうか判断し、
    前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が前記音声パターンに該当する音声である場合、前記特定の感情を示している音声にフィルタをかけるフィルタリング処理を行う
    音声合成方法。
  9. 請求項6乃至8のいずれか一項に記載の音声合成方法であって、
    前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断し、
    前記キーワードが特定のキーワードに該当する場合、前記音声信号に対して、所定の音声の合成を行い、合成音を出力する
    音声合成方法。
  10. 請求項6乃至9のいずれか一項に記載の音声合成方法であって、
    前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断し、
    前記キーワードが特定のキーワードに該当する場合、前記音声信号のうち特定のキーワードに該当する箇所の音声信号に対して、所定の音声の合成を行い、合成音を出力する
    音声合成方法。
  11. 音声通信の相手の識別情報が音声合成対象として登録されているか判断するステップと、
    前記識別情報が音声合成対象として登録されている場合、前記音声通信に関する音声信号のスペクトラムを分析し、前記音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断するステップと、
    前記音声が前記音声パターンに該当する音声である場合、前記音声にフィルタをかけるフィルタリング処理を行い、フィルタをかけられた音声を出力するステップと、
    前記音声が前記音声パターンに該当する音声でない場合、前記音声信号に含まれるキーワードがNGワードに該当するか判断し、前記キーワードがNGワードに該当する場合、前記音声信号の発信元に対し、前記キーワードがNGワードである旨を通知するステップと、
    前記音声信号に基づく音声に対して、所定の音声の合成を行い、合成音を出力するステップと
    をコンピュータに実行させるための
    音声合成用プログラム。
  12. 請求項11に記載の音声合成用プログラムであって、
    前記音声通信の最中に、ユーザの所定の操作に応じて、前記所定の操作時から所定時間前までの間に発信された音声信号に含まれる特定のキーワードをNGワードとしてキーワードデータベースに登録するステップと、
    前記音声信号に含まれるキーワードがNGワードに該当するか判断する際に、前記キーワードデータベースを参照するステップと
    を更にコンピュータに実行させるための
    音声合成用プログラム。
  13. 請求項11又は12に記載の音声合成用プログラムであって、
    前記音声分析手段は、前記音声通信における送信側及び受信側の両方の音声信号のスペクトラムを分析し、前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が特定の感情を示す音声パターンに該当する音声であるかどうか判断するステップと、
    前記送信側及び前記受信側のうち少なくとも一方の音声信号に基づく音声が前記音声パターンに該当する音声である場合、前記特定の感情を示している音声にフィルタをかけるフィルタリング処理を行うステップと
    を更にコンピュータに実行させるための
    音声合成用プログラム。
  14. 請求項11乃至13のいずれか一項に記載の音声合成用プログラムであって、
    前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断するステップと、
    前記キーワードが特定のキーワードに該当する場合、前記音声信号に対して、所定の音声の合成を行い、合成音を出力するステップと
    を更にコンピュータに実行させるための
    音声合成用プログラム。
  15. 請求項11乃至14のいずれか一項に記載の音声合成用プログラムであって、
    前記音声信号に含まれるキーワードが特定のキーワードに該当するか判断するステップと、
    前記キーワードが特定のキーワードに該当する場合、前記音声信号のうち特定のキーワードに該当する箇所の音声信号に対して、所定の音声の合成を行い、合成音を出力するステップと
    を更にコンピュータに実行させるための
    音声合成用プログラム。
JP2009006810A 2009-01-15 2009-01-15 携帯端末、音声合成方法、及び音声合成用プログラム Ceased JP2010166324A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009006810A JP2010166324A (ja) 2009-01-15 2009-01-15 携帯端末、音声合成方法、及び音声合成用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009006810A JP2010166324A (ja) 2009-01-15 2009-01-15 携帯端末、音声合成方法、及び音声合成用プログラム

Publications (1)

Publication Number Publication Date
JP2010166324A true JP2010166324A (ja) 2010-07-29

Family

ID=42582141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009006810A Ceased JP2010166324A (ja) 2009-01-15 2009-01-15 携帯端末、音声合成方法、及び音声合成用プログラム

Country Status (1)

Country Link
JP (1) JP2010166324A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2487608A1 (en) 2010-07-23 2012-08-15 Sony Corporation Information processing device, information processing method, and information processing program for
JPWO2012104952A1 (ja) * 2011-02-03 2014-07-03 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
WO2018023520A1 (zh) * 2016-08-04 2018-02-08 易晓阳 一种语音控制音乐本地播放装置
WO2018023519A1 (zh) * 2016-08-04 2018-02-08 易晓阳 一种语音控制音乐本地播放方法
CN109964226A (zh) * 2016-11-16 2019-07-02 三星电子株式会社 电子装置及其控制方法
JP2020061621A (ja) * 2018-10-05 2020-04-16 京セラ株式会社 電子機器、制御方法および制御プログラム
JP2021149664A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 出力装置、出力方法及び出力プログラム
JP7164793B1 (ja) 2021-11-25 2022-11-02 ソフトバンク株式会社 音声処理システム、音声処理装置及び音声処理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316227A (ja) * 1992-05-13 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 音声変換電話サービス方式
JPH1097267A (ja) * 1996-09-24 1998-04-14 Hitachi Ltd 声質変換方法および装置
JP2005223500A (ja) * 2004-02-04 2005-08-18 Nippon Telegr & Teleph Corp <Ntt> 電気通信装置
JP2007259427A (ja) * 2006-02-23 2007-10-04 Matsushita Electric Ind Co Ltd 携帯端末装置
JP2008131310A (ja) * 2006-11-20 2008-06-05 Sharp Corp 電話装置、電話装置の制御方法、電話装置の制御プログラム、および該プログラムを記録した記録媒体
JP2008211271A (ja) * 2007-02-23 2008-09-11 Nomura Research Institute Ltd コールセンタ管理システム、コールセンタ管理方法、プログラム及び記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05316227A (ja) * 1992-05-13 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 音声変換電話サービス方式
JPH1097267A (ja) * 1996-09-24 1998-04-14 Hitachi Ltd 声質変換方法および装置
JP2005223500A (ja) * 2004-02-04 2005-08-18 Nippon Telegr & Teleph Corp <Ntt> 電気通信装置
JP2007259427A (ja) * 2006-02-23 2007-10-04 Matsushita Electric Ind Co Ltd 携帯端末装置
JP2008131310A (ja) * 2006-11-20 2008-06-05 Sharp Corp 電話装置、電話装置の制御方法、電話装置の制御プログラム、および該プログラムを記録した記録媒体
JP2008211271A (ja) * 2007-02-23 2008-09-11 Nomura Research Institute Ltd コールセンタ管理システム、コールセンタ管理方法、プログラム及び記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2487608A1 (en) 2010-07-23 2012-08-15 Sony Corporation Information processing device, information processing method, and information processing program for
JPWO2012104952A1 (ja) * 2011-02-03 2014-07-03 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
WO2018023520A1 (zh) * 2016-08-04 2018-02-08 易晓阳 一种语音控制音乐本地播放装置
WO2018023519A1 (zh) * 2016-08-04 2018-02-08 易晓阳 一种语音控制音乐本地播放方法
CN109964226B (zh) * 2016-11-16 2023-06-30 三星电子株式会社 电子装置及其控制方法
CN109964226A (zh) * 2016-11-16 2019-07-02 三星电子株式会社 电子装置及其控制方法
JP2020061621A (ja) * 2018-10-05 2020-04-16 京セラ株式会社 電子機器、制御方法および制御プログラム
JP7072482B2 (ja) 2018-10-05 2022-05-20 京セラ株式会社 電子機器、制御方法および制御プログラム
JP2021149664A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 出力装置、出力方法及び出力プログラム
JP7248615B2 (ja) 2020-03-19 2023-03-29 ヤフー株式会社 出力装置、出力方法及び出力プログラム
US11749270B2 (en) 2020-03-19 2023-09-05 Yahoo Japan Corporation Output apparatus, output method and non-transitory computer-readable recording medium
JP2023078068A (ja) * 2021-11-25 2023-06-06 ソフトバンク株式会社 音声処理システム、音声処理装置及び音声処理方法
JP2023077444A (ja) * 2021-11-25 2023-06-06 ソフトバンク株式会社 音声処理システム、音声処理装置及び音声処理方法
JP7164793B1 (ja) 2021-11-25 2022-11-02 ソフトバンク株式会社 音声処理システム、音声処理装置及び音声処理方法
JP7394192B2 (ja) 2021-11-25 2023-12-07 ソフトバンク株式会社 音声処理装置、音声処理方法、及び、プログラム

Similar Documents

Publication Publication Date Title
JP2010166324A (ja) 携帯端末、音声合成方法、及び音声合成用プログラム
US20080026355A1 (en) Song lyrics download for karaoke applications
US20080113325A1 (en) Tv out enhancements to music listening
JP2008099330A (ja) 情報処理装置、携帯電話機
CN106652996A (zh) 一种提示音生成方法和装置、移动终端
US20060167677A1 (en) Mobile communication terminal
CN112286481A (zh) 音频输出方法及电子设备
WO2023011370A1 (zh) 音频播放方法、装置
JP2011250311A (ja) 聴覚ディスプレイ装置及び方法
CN106020766A (zh) 音乐播放的方法及装置
JP4224450B2 (ja) 移動体通信端末及びプログラム
CN104317404A (zh) 一种声纹控制音频播放设备、控制系统及方法
KR20070076942A (ko) 휴대용 무선단말기의 작곡 장치 및 방법
KR20110050483A (ko) 통신 방법, 통신 관련 시스템 및 관련 변환부
JP2006084515A (ja) 音楽再生装置
CN114927139A (zh) 假音识别方法、假音还原方法、电子设备及存储介质
KR101054740B1 (ko) 통화 배경음 저장 및 제공이 가능한 스마트 폰 및 이를 이용한 통화 배경음 제공 방법
US8199904B2 (en) Method and device for creating a media signal
JP2007259427A (ja) 携帯端末装置
JP2005300863A (ja) 移動体通信端末及びカラオケシステム
JP2006033817A (ja) 携帯端末機のデータ伝送および出力装置、並びにその方法
KR20050067865A (ko) 통화와 함께 멀티미디어 컨텐츠 재생이 가능한 이동 통신단말기
CN115580675B (zh) 信息输出方式的控制方法、装置、存储介质及车载终端
KR100678119B1 (ko) 이동통신 단말기에서 음악파일 재생방법
KR20080007730A (ko) 생일 관련 정보를 이용한 이동 통신 단말기의 사용자 환경설정 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120906

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120910

AA92 Notification that decision to refuse application was cancelled

Free format text: JAPANESE INTERMEDIATE CODE: A971092

Effective date: 20121002