JP4455633B2 - 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム - Google Patents
基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム Download PDFInfo
- Publication number
- JP4455633B2 JP4455633B2 JP2007234246A JP2007234246A JP4455633B2 JP 4455633 B2 JP4455633 B2 JP 4455633B2 JP 2007234246 A JP2007234246 A JP 2007234246A JP 2007234246 A JP2007234246 A JP 2007234246A JP 4455633 B2 JP4455633 B2 JP 4455633B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- representative vector
- frequency pattern
- fundamental frequency
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
Description
また、本発明に係る基本周波数パターン生成装置は、韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力する選択部と、生成すべき基本周波数パターンに要求される、該基本周波数パターンのうち前記代表ベクトルの前記第1の区間から生成される部分に含まれる音韻の数に対する指定値に基づいて、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数が、前記指定値に等しくなるように、該第1の区間に含まれる音韻の数に対する伸縮比率を計算する計算部と、前記伸縮比率に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数を伸縮し、次いで、生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値に基づいて、該第1の区間に含まれる音韻の数が伸縮された後の前記選択代表ベクトルの全区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンを生成する伸縮部とを備えたことを特徴とする。
図1に、本発明の第1の実施形態に係る基本周波数パターン生成装置の構成例を示す。
x=(X−1){γ−w(γ−f(γ))}、
y=(Y−1){f(γ)+w(γ−f(γ))}、 (0≦w≦1)
f(γ)={g(α)−g(−α)}−1・g(2αγ−α)、 (0≦w≦1)
g(u)={1+exp(−u)}−1.
…(1)
ここで、αは、シグモイド関数gの定義域を有限にするためのものである。関数fは、定義域を有限化されたシグモイド関数の定義域と値域を、いずれも[0,1]に正規化するためのものである。
z{yb}=limh→0〔x{yb+h}−x{yb}〕/h …(2)
このようにして伸縮率z{yb}を、b=0からb=Y−1まで求めることによって、代表ベクトル中の可変音韻数対応区間の伸縮率を求めることができる。
次に、本発明の第2の実施形態について、第1の実施形態と相違する点を中心に説明する。
次に、本発明の第3の実施形態について、第1の実施形態と相違する点を中心に説明する。
Claims (17)
- 韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、
入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、
前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力する選択部と、
生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値のうちで、前記選択代表ベクトルの有する前記第1の区間から生成される該基本周波数パターンの第1の部分に含まれる所定数の音韻それぞれに対応する前記指定値に基づき、所定のマッピング関数に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる複数のサンプル点が、それら複数のサンプル点の時間軸方向での順序関係を維持しつつ、それぞれ、前記第1の部分に含まれる所定の音韻に対する継続時間内における所定の時間的位置にマッピングされる場合における、当該複数のサンプル点それぞれの時間軸方向での伸縮比率を計算する計算部と、
前記選択代表ベクトルの有する前記第1の区間に含まれる前記複数のサンプル点それぞれについて計算された前記伸縮比率に従って、該複数のサンプル点それぞれを伸縮して、前記基本周波数パターンの前記第1の部分を生成するとともに、前記選択代表ベクトルの有する前記第1の区間以外の区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンの前記第1の部分以外の部分を生成する伸縮部とを備えたことを特徴とする基本周波数パターン生成装置。 - 前記計算部は、前記第1の区間の始端から前記第1の区間の終端にかけて単調増加した後に単調減少する伸縮比率の系列又は前記第1の区間の始端から前記第1の区間の終端にかけて単調減少した後に単調増加する伸縮比率の系列を算出することを特徴とする請求項1に記載の基本周波数パターン生成装置。
- 韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、
入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、
前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力する選択部と、
生成すべき基本周波数パターンに要求される、該基本周波数パターンのうち前記代表ベクトルの前記第1の区間から生成される部分に含まれる音韻の数に対する指定値に基づいて、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数が、前記指定値に等しくなるように、該第1の区間に含まれる音韻の数に対する伸縮比率を計算する計算部と、
前記伸縮比率に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数を伸縮し、次いで、生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値に基づいて、該第1の区間に含まれる音韻の数が伸縮された後の前記選択代表ベクトルの全区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンを生成する伸縮部とを備えたことを特徴とする基本周波数パターン生成装置。 - 前記代表ベクトルの有する前記第1の区間以外の区間は、韻律制御単位始端音韻からアクセント核先行隣接音韻又はアクセント核音韻又はアクセント核後続隣接音韻までの第2の区間であり、
前記代表ベクトルは、前記第2の区間と、これに続く前記第1の区間とから構成されることを特徴とする請求項1ないし3のいずれか1項に記載の基本周波数パターン生成装置。 - 前記代表ベクトルの有する前記第1の区間以外の区間は、韻律制御単位始端音韻からアクセント核先行隣接音韻又はアクセント核音韻又はアクセント核後続隣接音韻までの第2の区間と、前記第1の区間に対する後続隣接音韻から韻律制御単位終端音韻までの第3の区間であり、
前記代表ベクトルは、前記第2の区間と、これに続く前記第1の区間と、これに続く前記第3の区間とから構成されることを特徴とする請求項1ないし3のいずれか1項に記載の基本周波数パターン生成装置。 - 前記韻律制御単位は、文の単位、呼気段落の単位、アクセント句の単位、形態素の単位、単語の単位、モーラの単位、音節の単位、音素の単位、半音素の単位、若しくは1音素を複数に分割した単位、又はこれらを組合せた単位のうち少なくとも1つであることを特徴とする請求項1ないし5のいずれか1項に記載の基本周波数パターン生成装置。
- 前記コンテキストは、テキストを解析することにより得られる前記韻律制御単位に関する言語情報を含むことを特徴とする請求項1ないし6のいずれか1項に記載の基本周波数パターン生成装置。
- 前記コンテキストは、任意の属性の値を含むことを特徴とする請求項1ないし6のいずれか1項に記載の基本周波数パターン生成装置。
- 前記属性は、プロミネンスに関する情報、発話スタイルに関する情報、意図を表す情報、心的態度を表す情報のうち少なくとも1つであることを特徴とする請求項8に記載の基本周波数パターン生成装置。
- 前記音韻は、モーラ、音節、音素、半音素、1音素を複数に分割した単位のうちの少なくとも1つであることを特徴とする請求項1ないし9のいずれか1項に記載の基本周波数パターン生成装置。
- 前記代表ベクトルは、自然音声より抽出した基本周波数パターン、該基本周波数パターンを近似した近似基本周波数パターン、自然音声より抽出した基本周波数パターンを量子化した量子化基本周波数パターン、該量子化基本周波数パターンを近似した近似量子化基本周波数パターンのうち少なくとも1つであることを特徴とする請求項1ないし10のいずれか1項に記載の基本周波数パターン生成装置。
- 前記指定値は、前記入力コンテキストから得られる値であることを特徴とする請求項1ないし11のいずれか1項に記載の基本周波数パターン生成装置。
- 前記指定値は、前記入力コンテキストとは別の入力情報から得られる値であることを特徴とする請求項1ないし11のいずれか1項に記載の基本周波数パターン生成装置。
- 韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、選択部と、計算部と、伸縮部とを備えた基本周波数パターン生成装置の基本周波数パターン生成方法であって、
前記選択部が、前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力するステップと、
前記計算部が、生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値のうちで、前記選択代表ベクトルの有する前記第1の区間から生成される該基本周波数パターンの第1の部分に含まれる所定数の音韻それぞれに対応する前記指定値に基づき、所定のマッピング関数に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる複数のサンプル点が、それら複数のサンプル点の時間軸方向での順序関係を維持しつつ、それぞれ、前記第1の部分に含まれる所定の音韻に対する継続時間内における所定の時間的位置にマッピングされる場合における、当該複数のサンプル点それぞれの時間軸方向での伸縮比率を計算するステップと、
前記伸縮部が、前記選択代表ベクトルの有する前記第1の区間に含まれる前記複数のサンプル点それぞれについて計算された前記伸縮比率に従って、該複数のサンプル点それぞれを伸縮して、前記基本周波数パターンの前記第1の部分を生成するとともに、前記選択代表ベクトルの有する前記第1の区間以外の区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンの前記第1の部分以外の部分を生成するステップとを有することを特徴とする基本周波数パターン生成方法。 - 韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、選択部と、計算部と、伸縮部とを備えた基本周波数パターン生成装置の基本周波数パターン生成方法であって、
前記選択部が、前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力するステップと、
前記計算部が、生成すべき基本周波数パターンに要求される、該基本周波数パターンのうち前記代表ベクトルの前記第1の区間から生成される部分に含まれる音韻の数に対する指定値に基づいて、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数が、前記指定値に等しくなるように、該第1の区間に含まれる音韻の数に対する伸縮比率を計算するステップと、
前記伸縮部が、前記伸縮比率に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数を伸縮し、次いで、生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値に基づいて、該第1の区間に含まれる音韻の数が伸縮された後の前記選択代表ベクトルの全区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンを生成するステップとを有することを特徴とする基本周波数パターン生成方法。 - 基本周波数パターン生成装置としてコンピュータを機能させるためのプログラムにおいて、
韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、
入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、
前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力する選択部と、
生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値のうちで、前記選択代表ベクトルの有する前記第1の区間から生成される該基本周波数パターンの第1の部分に含まれる所定数の音韻それぞれに対応する前記指定値に基づき、所定のマッピング関数に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる複数のサンプル点が、それら複数のサンプル点の時間軸方向での順序関係を維持しつつ、それぞれ、前記第1の部分に含まれる所定の音韻に対する継続時間内における所定の時間的位置にマッピングされる場合における、当該複数のサンプル点それぞれの時間軸方向での伸縮比率を計算する計算部と、
前記選択代表ベクトルの有する前記第1の区間に含まれる前記複数のサンプル点それぞれについて計算された前記伸縮比率に従って、該複数のサンプル点それぞれを伸縮して、前記基本周波数パターンの前記第1の部分を生成するとともに、前記選択代表ベクトルの有する前記第1の区間以外の区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンの前記第1の部分以外の部分を生成する伸縮部とをコンピュータに機能させるプログラム。 - 基本周波数パターン生成装置としてコンピュータを機能させるためのプログラムにおいて、
韻律制御単位の代表ベクトルであってアクセント核音韻とアクセント核後続隣接音韻とアクセント核後続2音韻目とのうちいずれかを始端とし且つ韻律制御単位終端音韻と韻律制御単位終端先行隣接音韻と韻律制御単位終端先行2音韻目とのうちいずれかを終端とする区間である第1の区間及び該第1の区間以外の区間からなる代表ベクトルを複数記憶する第1の記憶部と、
入力コンテキストに応じた代表ベクトルを選択するための規則を記憶する第2の記憶部と、
前記入力コンテキストに前記規則を適用することによって、前記複数の代表ベクトルのうちから当該入力コンテキストに応じた代表ベクトルを選択して選択代表ベクトルを出力する選択部と、
生成すべき基本周波数パターンに要求される、該基本周波数パターンのうち前記代表ベクトルの前記第1の区間から生成される部分に含まれる音韻の数に対する指定値に基づいて、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数が、前記指定値に等しくなるように、該第1の区間に含まれる音韻の数に対する伸縮比率を計算する計算部と、
前記伸縮比率に従って、前記選択代表ベクトルの有する前記第1の区間に含まれる音韻の数を伸縮し、次いで、生成すべき基本周波数パターンに要求される、該基本周波数パターンに含まれる全音韻それぞれの継続時間長に対する指定値に基づいて、該第1の区間に含まれる音韻の数が伸縮された後の前記選択代表ベクトルの全区間に含まれる各々の音韻の継続時間長を、それぞれ、当該音韻に対応する前記指定値に等しくなるように伸縮して、前記基本周波数パターンを生成する伸縮部とをコンピュータに機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007234246A JP4455633B2 (ja) | 2007-09-10 | 2007-09-10 | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム |
US12/205,626 US8478595B2 (en) | 2007-09-10 | 2008-09-05 | Fundamental frequency pattern generation apparatus and fundamental frequency pattern generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007234246A JP4455633B2 (ja) | 2007-09-10 | 2007-09-10 | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009069179A JP2009069179A (ja) | 2009-04-02 |
JP4455633B2 true JP4455633B2 (ja) | 2010-04-21 |
Family
ID=40432833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007234246A Expired - Fee Related JP4455633B2 (ja) | 2007-09-10 | 2007-09-10 | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8478595B2 (ja) |
JP (1) | JP4455633B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102203853B (zh) * | 2010-01-04 | 2013-02-27 | 株式会社东芝 | 合成语音的方法和装置 |
US9798653B1 (en) * | 2010-05-05 | 2017-10-24 | Nuance Communications, Inc. | Methods, apparatus and data structure for cross-language speech adaptation |
KR101246287B1 (ko) * | 2011-03-28 | 2013-03-21 | (주)클루소프트 | 음가의 강세를 이용한 발음기관 애니메이션 생성 장치 및 방법 |
WO2014017024A1 (ja) * | 2012-07-27 | 2014-01-30 | 日本電気株式会社 | 音声合成装置、音声合成方法、及び音声合成プログラム |
WO2014061230A1 (ja) * | 2012-10-16 | 2014-04-24 | 日本電気株式会社 | 韻律モデル学習装置、韻律モデル学習方法、音声合成システム、および韻律モデル学習プログラム |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5919358B2 (ja) * | 1978-12-11 | 1984-05-04 | 株式会社日立製作所 | 音声内容伝送方式 |
JP2834260B2 (ja) * | 1990-03-07 | 1998-12-09 | 三菱電機株式会社 | 音声のスペクトル包絡パラメータ符号化装置 |
SE516521C2 (sv) * | 1993-11-25 | 2002-01-22 | Telia Ab | Anordning och förfarande vid talsyntes |
JPH086591A (ja) * | 1994-06-15 | 1996-01-12 | Sony Corp | 音声出力装置 |
JP3563772B2 (ja) * | 1994-06-16 | 2004-09-08 | キヤノン株式会社 | 音声合成方法及び装置並びに音声合成制御方法及び装置 |
US5625749A (en) * | 1994-08-22 | 1997-04-29 | Massachusetts Institute Of Technology | Segment-based apparatus and method for speech recognition by analyzing multiple speech unit frames and modeling both temporal and spatial correlation |
JPH09127995A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号復号化方法及び信号復号化装置 |
US5845238A (en) * | 1996-06-18 | 1998-12-01 | Apple Computer, Inc. | System and method for using a correspondence table to compress a pronunciation guide |
US6029131A (en) * | 1996-06-28 | 2000-02-22 | Digital Equipment Corporation | Post processing timing of rhythm in synthetic speech |
JP3667950B2 (ja) * | 1997-09-16 | 2005-07-06 | 株式会社東芝 | ピッチパターン生成方法 |
JP3771565B2 (ja) | 1997-11-28 | 2006-04-26 | 松下電器産業株式会社 | 基本周波数パタン生成装置、基本周波数パタン生成方法、及びプログラム記録媒体 |
JP3576840B2 (ja) * | 1997-11-28 | 2004-10-13 | 松下電器産業株式会社 | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
US6064960A (en) * | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
JP2000056789A (ja) * | 1998-06-02 | 2000-02-25 | Sanyo Electric Co Ltd | 音声合成装置及び電話機 |
US6101470A (en) * | 1998-05-26 | 2000-08-08 | International Business Machines Corporation | Methods for generating pitch and duration contours in a text to speech system |
CN1168068C (zh) * | 1999-03-25 | 2004-09-22 | 松下电器产业株式会社 | 语音合成系统与语音合成方法 |
US7761296B1 (en) * | 1999-04-02 | 2010-07-20 | International Business Machines Corporation | System and method for rescoring N-best hypotheses of an automatic speech recognition system |
EP1045372A3 (en) * | 1999-04-16 | 2001-08-29 | Matsushita Electric Industrial Co., Ltd. | Speech sound communication system |
JP3450237B2 (ja) * | 1999-10-06 | 2003-09-22 | 株式会社アルカディア | 音声合成装置および方法 |
EP1222655A1 (en) * | 1999-10-19 | 2002-07-17 | Sony Electronics Inc. | Natural language interface control system |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
JP3515039B2 (ja) * | 2000-03-03 | 2004-04-05 | 沖電気工業株式会社 | テキスト音声変換装置におけるピッチパタン制御方法 |
JP4054507B2 (ja) * | 2000-03-31 | 2008-02-27 | キヤノン株式会社 | 音声情報処理方法および装置および記憶媒体 |
JP2001296883A (ja) * | 2000-04-14 | 2001-10-26 | Sakai Yasue | 音声認識方法および装置、音声合成方法および装置、記録媒体 |
US6856958B2 (en) * | 2000-09-05 | 2005-02-15 | Lucent Technologies Inc. | Methods and apparatus for text to speech processing using language independent prosody markup |
JP3673471B2 (ja) * | 2000-12-28 | 2005-07-20 | シャープ株式会社 | テキスト音声合成装置およびプログラム記録媒体 |
JP2002258894A (ja) * | 2001-03-02 | 2002-09-11 | Fujitsu Ltd | 音声データ圧縮・解凍装置及び方法 |
US7200558B2 (en) * | 2001-03-08 | 2007-04-03 | Matsushita Electric Industrial Co., Ltd. | Prosody generating device, prosody generating method, and program |
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
US6829581B2 (en) * | 2001-07-31 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method for prosody generation by unit selection from an imitation speech database |
CN1234109C (zh) * | 2001-08-22 | 2005-12-28 | 国际商业机器公司 | 语调生成方法、语音合成装置、语音合成方法及语音服务器 |
DE60234195D1 (de) * | 2001-08-31 | 2009-12-10 | Kenwood Corp | Vorrichtung und verfahren zum erzeugen eines tonhöhen-kurvenformsignals und vorrichtung und verfahren zum komprimieren, dekomprimieren und synthetisieren eines sprachsignals damit |
JP4214842B2 (ja) * | 2003-06-13 | 2009-01-28 | ソニー株式会社 | 音声合成装置及び音声合成方法 |
ES2312851T3 (es) * | 2003-12-16 | 2009-03-01 | Loquendo Spa | Procedimiento y sistema texto a voz y el programa informatico asociado. |
DE10361850A1 (de) * | 2003-12-31 | 2005-07-28 | Kress, Markus | Verfahren zur Identifizierung von Personen |
US20060074678A1 (en) * | 2004-09-29 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | Prosody generation for text-to-speech synthesis based on micro-prosodic data |
JP4025355B2 (ja) * | 2004-10-13 | 2007-12-19 | 松下電器産業株式会社 | 音声合成装置及び音声合成方法 |
JP2006309162A (ja) * | 2005-03-29 | 2006-11-09 | Toshiba Corp | ピッチパターン生成方法、ピッチパターン生成装置及びプログラム |
CN101223571B (zh) * | 2005-07-20 | 2011-05-18 | 松下电器产业株式会社 | 音质变化部位确定装置及音质变化部位确定方法 |
JP4246790B2 (ja) * | 2006-06-05 | 2009-04-02 | パナソニック株式会社 | 音声合成装置 |
JP2009047957A (ja) * | 2007-08-21 | 2009-03-05 | Toshiba Corp | ピッチパターン生成方法及びその装置 |
JP5159325B2 (ja) * | 2008-01-09 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそのプログラム |
JP4945465B2 (ja) * | 2008-01-23 | 2012-06-06 | 株式会社東芝 | 音声情報処理装置及びその方法 |
US8244546B2 (en) * | 2008-05-28 | 2012-08-14 | National Institute Of Advanced Industrial Science And Technology | Singing synthesis parameter data estimation system |
JP5728913B2 (ja) * | 2010-12-02 | 2015-06-03 | ヤマハ株式会社 | 音声合成情報編集装置およびプログラム |
-
2007
- 2007-09-10 JP JP2007234246A patent/JP4455633B2/ja not_active Expired - Fee Related
-
2008
- 2008-09-05 US US12/205,626 patent/US8478595B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8478595B2 (en) | 2013-07-02 |
US20090070116A1 (en) | 2009-03-12 |
JP2009069179A (ja) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11990118B2 (en) | Text-to-speech (TTS) processing | |
JP3933750B2 (ja) | 連続密度ヒドンマルコフモデルを用いた音声認識方法及び装置 | |
US10692484B1 (en) | Text-to-speech (TTS) processing | |
US11763797B2 (en) | Text-to-speech (TTS) processing | |
JP6266372B2 (ja) | 音声合成辞書生成装置、音声合成辞書生成方法およびプログラム | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
WO2005109399A1 (ja) | 音声合成装置および方法 | |
JP4738057B2 (ja) | ピッチパターン生成方法及びその装置 | |
JPH1195783A (ja) | 音声情報処理方法 | |
KR20090061920A (ko) | 음성 합성 방법 및 장치 | |
JP4455633B2 (ja) | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム | |
JP2006309162A (ja) | ピッチパターン生成方法、ピッチパターン生成装置及びプログラム | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP4945465B2 (ja) | 音声情報処理装置及びその方法 | |
Shen et al. | Automatic selection of phonetically distributed sentence sets for speaker adaptation with application to large vocabulary Mandarin speech recognition | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5328703B2 (ja) | 韻律パターン生成装置 | |
JP5393546B2 (ja) | 韻律作成装置及び韻律作成方法 | |
JP2002333897A (ja) | 韻律生成装置および韻律生成方法並びにプログラム | |
JP4417892B2 (ja) | 音声情報処理装置、音声情報処理方法および音声情報処理プログラム | |
Huang et al. | Hierarchical prosodic pattern selection based on Fujisaki model for natural mandarin speech synthesis | |
JP2006276493A (ja) | 韻律パターン生成装置および韻律パターン生成方法ならびに韻律パターン生成プログラム | |
JP6137708B2 (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JPH1097268A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100203 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |