JP2003202885A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2003202885A5 JP2003202885A5 JP2001401424A JP2001401424A JP2003202885A5 JP 2003202885 A5 JP2003202885 A5 JP 2003202885A5 JP 2001401424 A JP2001401424 A JP 2001401424A JP 2001401424 A JP2001401424 A JP 2001401424A JP 2003202885 A5 JP2003202885 A5 JP 2003202885A5
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information processing
- feature data
- data
- text string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 claims 32
- 230000010365 information processing Effects 0.000 claims 31
- 238000003672 processing method Methods 0.000 claims 13
- 230000005540 biological transmission Effects 0.000 claims 8
- 238000000034 method Methods 0.000 claims 6
- 230000002194 synthesizing effect Effects 0.000 claims 6
- 238000001514 detection method Methods 0.000 claims 4
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
Claims (37)
- 音声による通話を行う通話手段と、
前記通話手段より得られる通話相手の音声から音声特徴データを生成する生成手段と、
前記生成手段で生成された音声特徴データを前記通話相手に対応させて格納する格納手段と、
テキストデータを含むメッセージを受信する受信手段と、
前記受信手段で受信したメッセージの送信者に対応する通話相手の音声特徴データを前記格納手段より取得する取得手段と、
前記取得手段で取得した音声特徴データを用いて、前記メッセージに含まれるテキストデータに対する合成音声データを生成する合成手段とを備えることを特徴とする情報処理装置。 - 前記通話手段による通話の間に前記生成手段により得られた音声特徴データを用いて、前記格納手段に既に格納されている、当該通話の通話相手に対応する音声特徴データを更新する更新手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
- 前記格納手段に格納された音声特徴データをマニュアルで調整する調整手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
- 前記通話手段より得られる通話相手の音声を、複数の感情分類項目のいずれかに分類する分類手段を更に備え、
前記生成手段は、前記分類手段によって分類された各感情分類項目毎に音声特徴データを取得し、前記格納手段は、前記感情分類項目毎に音声特徴データを格納することを特徴とする請求項1に記載の情報処理装置。 - 前記分類手段は、前記音声より検出されるピッチ及びアクセント等の音声律情報に基づいて感情分類を行うことを特徴とする請求項4に記載の情報処理装置。
- 前記メッセージに含まれるテキストデータが前記複数の感情分類項目の何れに属するかを判定する判定手段を更に備え、
前記取得手段は、前記受信手段で受信したメッセージの送信者に対応する通話相手の、前記判定手段で判定された感情項目分類に対応する音声特徴データを前記格納手段より取得することを特徴とする請求項4に記載の情報処理装置。 - 前記生成手段においてある感情分類項目に対応する音声特徴データが生成された場合、該音声特徴データを用いて他の感情分類項目に対応する音声特徴データを更新する更新手段を更に備えることを特徴とする請求項4に記載の情報処理装置。
- 音声を入力する入力手段と、
前記入力手段で入力された音声よりテキスト列を生成する音声認識手段と、
前記入力手段で入力された音声における発声状態の変化を検出する検出手段と、
前記検出手段で検出された発声状態の変化に基づいて、前記音声認識手段で生成されたテキスト列に付加的データを付与する付与手段と、
前記付与手段で付加的データが付与されたテキスト列を含む送信メッセージを生成する生成手段とを備えることを特徴とする情報処理装置。 - 前記付加的データは、前記テキスト列の属性であることを特徴とする請求項8に記載の情報処理装置。
- 前記検出手段は、前記入力された音声の音量及び/又はスピードの変化を検出することを特徴とする請求項8に記載の情報処理装置。
- 前記入力された音声より音声特徴データを取得する取得手段を更に備え、
前記生成手段で生成される送信メッセージは前記音声特徴データを含むことを特徴とする請求項8に記載の情報処理装置。 - 音声を入力する入力手段と、
前記入力手段で入力された音声よりテキスト列を生成する音声認識手段と、
前記入力された音声を、複数の感情分類項目のいずれかに分類する分類手段と、
前記分類手段による分類結果に基づいて、前記音声認識手段で生成されたテキスト列に前記分類項目に対応する付加的データを付与する付与手段と、
前記付与手段で付加的データが付与されたテキスト列を含む送信メッセージを生成する生成手段とを備えることを特徴とする情報処理装置。 - 前記分類手段は、前記入力された音声の各文節を前記複数の感情分類項目のいずれかに分類することを特徴とする請求項12に記載の情報処理装置。
- 前記分類手段で分類された各音声に基づいて、感情分類項目毎の音声特徴データを取得する取得手段を更に備え、
前記生成手段で生成される送信メッセージは前記感情分類項目毎の音声特徴データを含むことを特徴とする請求項12に記載の情報処理装置。 - 発声状態を表す付加データが付加されたテキスト列を含むメッセージを受信する受信手段と、
前記受信手段で受信されたメッセージのテキスト列に基づいて音声データを生成する音声合成手段と、
前記受信されたテキスト列より前記付加データを取得し、これに基づいて前記音声データの発声状態を変更する変更手段とを備えることを特徴とする情報処理装置。 - 前記発声状態が発声の音量及びスピードを含むことを特徴とする請求項15に記載の情報処理装置。
- 前記メッセージは、音声特徴データを含み、
前記音声合成手段は、前記メッセージに含まれる音声特徴データを用いてテキスト列に対する音声データを生成することを特徴とする請求項15に記載の情報処理装置。 - 複数の感情分類項目のうちのどの感情分類に属するかを表す付加データが付加されたテキスト列と、該複数の感情分類項目のそれぞれに対応する音声特徴データを含むメッセージを受信する受信手段と、
前記受信手段で受信されたメッセージの付加データに基づいて、テキスト列が属する感情分類項目に対応した音声特徴データを、該メッセージより取得する取得手段と、
前記取得手段で取得された音声特徴データを用いて、前記テキスト列に対する音声データを生成する音声合成手段とを備えることを特徴とする情報処理装置。 - 音声による通話を行う通話工程と、
前記通話工程より得られる通話相手の音声から音声特徴データを生成する生成工程と、
前記生成工程で生成された音声特徴データを前記通話相手に対応させて格納手段に格納する格納工程と、
テキストデータを含むメッセージを受信する受信工程と、
前記受信工程で受信したメッセージの送信者に対応する通話相手の音声特徴データを前記格納手段より取得する取得工程と、
前記取得工程で取得した音声特徴データを用いて、前記メッセージに含まれるテキストデータに対する合成音声データを生成する合成工程とを備えることを特徴とする情報処理方法。 - 前記通話工程による通話の間に前記生成工程により得られた音声特徴データを用いて、前記格納工程に既に格納されている、当該通話の通話相手に対応する音声特徴データを更新する更新工程を更に備えることを特徴とする請求項19に記載の情報処理方法。
- 前記格納工程に格納された音声特徴データをマニュアルで調整する調整工程を更に備えることを特徴とする請求項19に記載の情報処理方法。
- 前記通話工程より得られる通話相手の音声を、複数の感情分類項目のいずれかに分類する分類工程を更に備え、
前記生成工程は、前記分類工程によって分類された各感情分類項目毎に音声特徴データを取得し、前記格納工程は、前記感情分類項目毎に音声特徴データを前記格納手段に格納することを特徴とする請求項19に記載の情報処理方法。 - 前記分類工程は、前記音声より検出されるピッチ及びアクセント等の音声律情報に基づいて感情分類を行うことを特徴とする請求項22に記載の情報処理方法。
- 前記メッセージに含まれるテキストデータが前記複数の感情分類項目の何れに属するかを判定する判定工程を更に備え、
前記取得工程は、前記受信工程で受信したメッセージの送信者に対応する通話相手の、前記判定工程で判定された感情項目分類に対応する音声特徴データを前記格納手段より取得することを特徴とする請求項22に記載の情報処理方法。 - 前記生成工程においてある感情分類項目に対応する音声特徴データが生成された場合、該音声特徴データを用いて他の感情分類項目に対応する音声特徴データを更新する更新工程を更に備えることを特徴とする請求項22に記載の情報処理方法。
- 音声を入力する入力工程と、
前記入力工程で入力された音声よりテキスト列を生成する音声認識工程と、
前記入力工程で入力された音声における発声状態の変化を検出する検出工程と、
前記検出工程で検出された発声状態の変化に基づいて、前記音声認識工程で生成されたテキスト列に付加的データを付与する付与工程と、
前記付与工程で付加的データが付与されたテキスト列を含む送信メッセージを生成する生成工程とを備えることを特徴とする情報処理方法。 - 前記付加的データは、前記テキスト列の属性であることを特徴とする請求項26に記載の情報処理方法。
- 前記検出工程は、前記入力された音声の音量及び/又はスピードの変化を検出することを特徴とする請求項26に記載の情報処理方法。
- 前記入力された音声より音声特徴データを取得する取得工程を更に備え、
前記生成工程で生成される送信メッセージは前記音声特徴データを含むことを特徴とする請求項26に記載の情報処理方法。 - 音声を入力する入力工程と、
前記入力工程で入力された音声よりテキスト列を生成する音声認識工程と、
前記入力された音声を、複数の感情分類項目のいずれかに分類する分類工程と、
前記分類工程による分類結果に基づいて、前記音声認識工程で生成されたテキスト列に前記分類項目に対応する付加的データを付与する付与工程と、
前記付与工程で付加的データが付与されたテキスト列を含む送信メッセージを生成する生成工程とを備えることを特徴とする情報処理方法。 - 前記分類工程は、前記入力された音声の各文節を前記複数の感情分類項目のいずれかに分類することを特徴とする請求項30に記載の情報処理方法。
- 前記分類工程で分類された各音声に基づいて、感情分類項目毎の音声特徴データを取得する取得工程を更に備え、
前記生成工程で生成される送信メッセージは前記感情分類項目毎の音声特徴データを含むことを特徴とする請求項30に記載の情報処理方法。 - 発声状態を表す付加データが付加されたテキスト列を含むメッセージを受信する受信工程と、
前記受信工程で受信されたメッセージのテキスト列に基づいて音声データを生成する音声合成工程と、
前記受信されたテキスト列より前記付加データを取得し、これに基づいて前記音声データの発声状態を変更する変更工程とを備えることを特徴とする情報処理方法。 - 前記発声状態が発声の音量及びスピードを含むことを特徴とする請求項33に記載の情報処理方法。
- 前記メッセージは、音声特徴データを含み、
前記音声合成工程は、前記メッセージに含まれる音声特徴データを用いてテキスト列に対する音声データを生成することを特徴とする請求項33に記載の情報処理方法。 - 複数の感情分類項目のうちのどの感情分類に属するかを表す付加データが付加されたテキスト列と、該複数の感情分類項目のそれぞれに対応する音声特徴データを含むメッセージを受信する受信工程と、
前記受信工程で受信されたメッセージの付加データに基づいて、テキスト列が属する感情分類項目に対応した音声特徴データを、該メッセージより取得する取得工程と、
前記取得工程で取得された音声特徴データを用いて、前記テキスト列に対する音声データを生成する音声合成工程とを備えることを特徴とする情報処理方法。 - 請求項19乃至36のいずれかに記載の情報処理方法をコンピュータに実行させるコンピュータプログラムを格納する記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001401424A JP3806030B2 (ja) | 2001-12-28 | 2001-12-28 | 情報処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001401424A JP3806030B2 (ja) | 2001-12-28 | 2001-12-28 | 情報処理装置及び方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006019733A Division JP2006184921A (ja) | 2006-01-27 | 2006-01-27 | 情報処理装置及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003202885A JP2003202885A (ja) | 2003-07-18 |
JP2003202885A5 true JP2003202885A5 (ja) | 2004-11-11 |
JP3806030B2 JP3806030B2 (ja) | 2006-08-09 |
Family
ID=27640152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001401424A Expired - Fee Related JP3806030B2 (ja) | 2001-12-28 | 2001-12-28 | 情報処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3806030B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1603116A1 (en) | 2003-02-19 | 2005-12-07 | Matsushita Electric Industrial Co., Ltd. | Speech recognition device and speech recognition method |
JP4530134B2 (ja) * | 2004-03-09 | 2010-08-25 | 日本電気株式会社 | 音声合成装置、声質生成装置及びプログラム |
JP2005346252A (ja) * | 2004-06-01 | 2005-12-15 | Nec Corp | 情報伝達システムおよび情報伝達方法 |
JP2005342862A (ja) * | 2004-06-04 | 2005-12-15 | Nec Corp | ロボット |
JP4670431B2 (ja) * | 2005-03-30 | 2011-04-13 | 日本電気株式会社 | 音声感情認識によるメール作成機能付携帯端末、携帯端末システム、及び、音声感情認識によるメール作成方法 |
CA2611259C (en) * | 2005-06-09 | 2016-03-22 | A.G.I. Inc. | Speech analyzer detecting pitch frequency, speech analyzing method, and speech analyzing program |
JP2007004281A (ja) * | 2005-06-21 | 2007-01-11 | Mitsubishi Electric Corp | 音声メール入力装置 |
JP2007264284A (ja) * | 2006-03-28 | 2007-10-11 | Brother Ind Ltd | 感情付加装置、感情付加方法及び感情付加プログラム |
JP2007271655A (ja) * | 2006-03-30 | 2007-10-18 | Brother Ind Ltd | 感情付加装置、感情付加方法及び感情付加プログラム |
JP4583350B2 (ja) * | 2006-08-29 | 2010-11-17 | 京セラ株式会社 | 携帯端末装置、着信音出力方法 |
KR100850560B1 (ko) * | 2006-11-01 | 2008-08-06 | (주)폴리다임 | Sms 메시지의 아이콘 조합 방법 |
KR101044323B1 (ko) * | 2008-02-20 | 2011-06-29 | 가부시키가이샤 엔.티.티.도코모 | 음성 합성용 음성 데이터베이스를 구축하기 위한 통신 시스템, 이를 위한 중계 장치, 및 이를 위한 중계 방법 |
US20110093272A1 (en) | 2008-04-08 | 2011-04-21 | Ntt Docomo, Inc | Media process server apparatus and media process method therefor |
WO2010019831A1 (en) | 2008-08-14 | 2010-02-18 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
JP2010169925A (ja) * | 2009-01-23 | 2010-08-05 | Konami Digital Entertainment Co Ltd | 音声処理装置、チャットシステム、音声処理方法、ならびに、プログラム |
JP5049310B2 (ja) * | 2009-03-30 | 2012-10-17 | 日本電信電話株式会社 | 音声学習・合成システム及び音声学習・合成方法 |
KR101703214B1 (ko) * | 2014-08-06 | 2017-02-06 | 주식회사 엘지화학 | 문자 데이터의 내용을 문자 데이터 송신자의 음성으로 출력하는 방법 |
JP7036054B2 (ja) * | 2019-02-05 | 2022-03-15 | 日本電信電話株式会社 | 音響モデル学習装置、音響モデル学習方法、プログラム |
KR102430020B1 (ko) * | 2019-08-09 | 2022-08-08 | 주식회사 하이퍼커넥트 | 단말기 및 그것의 동작 방법 |
JP6993034B1 (ja) | 2021-05-14 | 2022-01-13 | Aiインフルエンサー株式会社 | コンテンツ再生方法、及びコンテンツ再生システム |
-
2001
- 2001-12-28 JP JP2001401424A patent/JP3806030B2/ja not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003202885A5 (ja) | ||
US7706510B2 (en) | System and method for personalized text-to-voice synthesis | |
US9769296B2 (en) | Techniques for voice controlling bluetooth headset | |
CN106898340B (zh) | 一种歌曲的合成方法及终端 | |
US7957972B2 (en) | Voice recognition system and method thereof | |
JP4025355B2 (ja) | 音声合成装置及び音声合成方法 | |
US20060074672A1 (en) | Speech synthesis apparatus with personalized speech segments | |
CN110136692A (zh) | 语音合成方法、装置、设备及存储介质 | |
CN111445897B (zh) | 歌曲生成方法、装置、可读介质及电子设备 | |
JP3806030B2 (ja) | 情報処理装置及び方法 | |
CN111445892A (zh) | 歌曲生成方法、装置、可读介质及电子设备 | |
KR20090085673A (ko) | 음성 인식을 이용한 콘텐츠 선택 | |
JP2018054790A (ja) | 音声対話システムおよび音声対話方法 | |
KR20150017662A (ko) | 텍스트-음성 변환 방법, 장치 및 저장 매체 | |
CN1381831A (zh) | 与扬声器无关的语音识别装置 | |
CN110265005B (zh) | 输出内容控制装置、输出内容控制方法以及存储介质 | |
US9286913B2 (en) | Atmosphere expression word selection system, atmosphere expression word selection method, and program | |
JP2018005122A (ja) | 検出装置、検出方法及び検出プログラム | |
CN115148185A (zh) | 语音合成方法及装置、电子设备及存储介质 | |
CN102857650A (zh) | 动态调整语音的方法 | |
KR100705176B1 (ko) | 모바일 단말기에서의 음악 파일 생성방법 | |
US11582174B1 (en) | Messaging content data storage | |
EP1703492A1 (en) | System and method for personalised text-to-voice synthesis | |
JPH10173769A (ja) | 音声メッセージ検索装置 | |
KR20130069262A (ko) | 통신 단말 및 그 통신 단말의 정보처리 방법 |