JP5457706B2 - 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 - Google Patents
音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 Download PDFInfo
- Publication number
- JP5457706B2 JP5457706B2 JP2009083563A JP2009083563A JP5457706B2 JP 5457706 B2 JP5457706 B2 JP 5457706B2 JP 2009083563 A JP2009083563 A JP 2009083563A JP 2009083563 A JP2009083563 A JP 2009083563A JP 5457706 B2 JP5457706 B2 JP 5457706B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- parameter
- section
- unit
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
図1は、本発明の実施の形態にかかる学習モデル生成装置100の構成を示すブロック図である。学習モデル生成装置100は、テキスト解析部110と、スペクトル分析部120と、分割部130と、パラメータ化部140と、クラスタリング部150と、モデル学習部160と、モデル記憶部170とを備えている。学習モデル生成装置100は、テキスト情報と、テキスト情報の内容を読み上げた音声信号とを学習データとして取得し、学習データに基づいて、音声合成のための学習モデルを生成する。
120 スペクトル分析部
130 分割部
140 パラメータ化部
150 クラスタリング部
160 モデル学習部
Claims (8)
- テキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析部と、
前記テキスト情報に対応する音声信号を取得し、前記音声信号の各フレームから当該フレームのスペクトル形状を表す特徴パラメータを算出するスペクトル分析部と、
前記音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間の境界位置を示す区切り情報を取得し、前記区切り情報に基づいて、前記音声信号を前記言語区間に分割する分割部と、
対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれの前記特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより、前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータを取得するパラメータ化部と、
複数の言語区間それぞれに対して算出された複数のスペクトルパラメータを、前記言語情報に基づいて複数のクラスターにクラスタリングするクラスタリング部と、
同一のクラスターに属する複数のスペクトルパラメータから前記複数のスペクトルパラメータの特徴を示すスペクトルモデルを学習するモデル学習部と
を備えることを特徴とする音声モデル生成装置。 - 前記モデル学習部は、前記対象区間、前記対象区間の直前および直後の前記言語区間により、前記対象区間を複数のクラスターにクラスタリングすることを特徴とする請求項1に記載の音声モデル生成装置。
- 音声合成の対象となるテキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析部と、
音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間のうち、対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれのスペクトル形状を表す特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより取得された前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータの特徴を示すスペクトルモデルであって、前記言語区間の前記言語情報により複数のクラスターにクラスタリングされたスペクトルモデルを記憶する記憶部と、
音声合成の対象となるテキスト情報の前記言語区間の前記言語情報に基づいて、前記テキスト情報の前記言語区間が属する前記クラスターの前記スペクトルモデルを前記記憶部から選択する選択部と、
前記選択部により選択された前記スペクトルモデルに基づいて、前記言語区間に対するスペクトルパラメータを生成し、前記スペクトルパラメータを逆変換することにより、特徴パラメータを得る生成部と
を備えることを特徴とする音声合成装置。 - 前記生成部は、前記選択部により選択された前記スペクトルモデルの目的関数を生成し、前記目的関数を最大化することにより、前記言語区間に対するスペクトルパラメータを生成することを特徴とする請求項3に記載の音声合成装置。
- 音声モデル生成処理をコンピュータに実行させるための音声モデル生成プログラムであって、
前記コンピュータを、
テキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析部と、
前記テキスト情報に対応する音声信号を取得し、前記音声信号の各フレームから当該フレームのスペクトル形状を表す特徴パラメータを算出するスペクトル分析部と、
前記音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間の境界位置を示す区切り情報を取得し、前記区切り情報に基づいて、前記音声信号を前記言語区間に分割する分割部と、
対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれの前記特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより、前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータを取得するパラメータ化部と、
複数の言語区間それぞれに対して算出された複数のスペクトルパラメータを、前記言語情報に基づいて複数のクラスターにクラスタリングするクラスタリング部と、
同一のクラスターに属する複数のスペクトルパラメータから前記複数のスペクトルパラメータの特徴を示すスペクトルモデルを学習するモデル学習部と
して機能させるためのプログラム。 - 音声合成処理をコンピュータに実行させるための音声合成プログラムであって、
前記コンピュータを、
音声合成の対象となるテキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析部と、
音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間のうち、対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれのスペクトル形状を表す特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより取得された前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータの特徴を示すスペクトルモデルであって、前記言語区間の前記言語情報により複数のクラスターにクラスタリングされたスペクトルモデルを記憶する記憶部と、
前記音声合成の対象となるテキスト情報の前記言語区間の前記言語情報に基づいて、前記テキスト情報の前記言語区間が属する前記クラスターの前記スペクトルモデルを前記記憶部から選択する選択部と、
前記選択部により選択された前記スペクトルモデルに基づいて、前記言語区間に対するスペクトルパラメータを生成し、前記スペクトルパラメータを逆変換することにより、特徴パラメータを得る生成部と
して機能させるためのプログラム。 - テキスト解析部が、テキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析ステップと、
スペクトル分析部が、前記テキスト情報に対応する音声信号を取得し、前記音声信号の各フレームから当該フレームのスペクトル形状を表す特徴パラメータを算出するスペクトル分析ステップと、
分割部が、前記音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間の境界位置を示す区切り情報を取得し、前記区切り情報に基づいて、前記音声信号を前記言語区間に分割する分割ステップと、
パラメータ化部が、対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれの前記特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより、前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータを取得するパラメータ化ステップと、
クラスタリング部が、複数の言語区間それぞれに対して算出された複数のスペクトルパラメータを、前記言語情報に基づいて複数のクラスターにクラスタリングするクラスタリングステップと、
モデル学習部が、同一のクラスターに属する複数のスペクトルパラメータから前記複数のスペクトルパラメータの特徴を示すスペクトルモデルを学習する学習ステップと
を有することを特徴とする音声モデル生成方法。 - テキスト解析部が、音声合成の対象となるテキスト情報を取得し、前記テキスト情報をテキスト解析することにより、前記テキスト情報に含まれる言語の内容を示す言語情報を生成するテキスト解析ステップと、
選択部が、音声信号の複数フレームを有し、言語レベルを単位とする区間である言語区間のうち、対象となる前記言語区間である対象区間に含まれる前記複数フレームそれぞれのスペクトル形状を表す特徴パラメータに所定の線形変換を行うことにより基本パラメータを算出し、前記対象区間の前記基本パラメータと、前記対象区間の直前の前記言語区間の前記基本パラメータと、前記対象区間の直後の前記言語区間の前記基本パラメータと、に基づいて拡張パラメータを算出することにより取得された前記基本パラメータと前記拡張パラメータとを含むスペクトルパラメータの特徴を示すスペクトルモデルであって、前記言語区間の前記言語情報により複数のクラスターにクラスタリングされたスペクトルモデルを記憶する記憶部を参照するステップと、
選択部が、前記音声合成の対象となるテキスト情報の前記言語区間の前記言語情報に基づいて、前記テキスト情報の前記言語区間が属する前記クラスターの前記スペクトルモデルを前記記憶部から選択する選択ステップと、
生成部が、前記選択ステップで選択された前記スペクトルモデルに基づいて、前記言語区間に対するスペクトルパラメータを生成し、前記スペクトルパラメータを逆変換することにより、特徴パラメータを得る生成ステップと
を有することを特徴とする音声合成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009083563A JP5457706B2 (ja) | 2009-03-30 | 2009-03-30 | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
PCT/JP2009/067408 WO2010116549A1 (ja) | 2009-03-30 | 2009-10-06 | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
US13/238,187 US20120065961A1 (en) | 2009-03-30 | 2011-09-21 | Speech model generating apparatus, speech synthesis apparatus, speech model generating program product, speech synthesis program product, speech model generating method, and speech synthesis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009083563A JP5457706B2 (ja) | 2009-03-30 | 2009-03-30 | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010237323A JP2010237323A (ja) | 2010-10-21 |
JP5457706B2 true JP5457706B2 (ja) | 2014-04-02 |
Family
ID=42935852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009083563A Expired - Fee Related JP5457706B2 (ja) | 2009-03-30 | 2009-03-30 | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120065961A1 (ja) |
JP (1) | JP5457706B2 (ja) |
WO (1) | WO2010116549A1 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8595005B2 (en) * | 2010-05-31 | 2013-11-26 | Simple Emotion, Inc. | System and method for recognizing emotional state from a speech signal |
US8682670B2 (en) * | 2011-07-07 | 2014-03-25 | International Business Machines Corporation | Statistical enhancement of speech output from a statistical text-to-speech synthesis system |
US10469623B2 (en) * | 2012-01-26 | 2019-11-05 | ZOOM International a.s. | Phrase labeling within spoken audio recordings |
GB2505400B (en) * | 2012-07-18 | 2015-01-07 | Toshiba Res Europ Ltd | A speech processing system |
WO2014029099A1 (en) * | 2012-08-24 | 2014-02-27 | Microsoft Corporation | I-vector based clustering training data in speech recognition |
WO2014061230A1 (ja) * | 2012-10-16 | 2014-04-24 | 日本電気株式会社 | 韻律モデル学習装置、韻律モデル学習方法、音声合成システム、および韻律モデル学習プログラム |
EP3007165B1 (en) | 2013-05-31 | 2018-08-01 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
JP6375604B2 (ja) * | 2013-09-25 | 2018-08-22 | ヤマハ株式会社 | 音声制御装置、音声制御方法およびプログラム |
CN104766603B (zh) * | 2014-01-06 | 2019-03-19 | 科大讯飞股份有限公司 | 构建个性化歌唱风格频谱合成模型的方法及装置 |
WO2015108935A1 (en) | 2014-01-14 | 2015-07-23 | Interactive Intelligence Group, Inc. | System and method for synthesis of speech from provided text |
US9549068B2 (en) | 2014-01-28 | 2017-01-17 | Simple Emotion, Inc. | Methods for adaptive voice interaction |
WO2016196041A1 (en) * | 2015-06-05 | 2016-12-08 | Trustees Of Boston University | Low-dimensional real-time concatenative speech synthesizer |
CN106373575B (zh) * | 2015-07-23 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 一种用户声纹模型构建方法、装置及系统 |
JP6580911B2 (ja) * | 2015-09-04 | 2019-09-25 | Kddi株式会社 | 音声合成システムならびにその予測モデル学習方法および装置 |
JP6523893B2 (ja) * | 2015-09-16 | 2019-06-05 | 株式会社東芝 | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム |
US9858923B2 (en) * | 2015-09-24 | 2018-01-02 | Intel Corporation | Dynamic adaptation of language models and semantic tracking for automatic speech recognition |
US10891311B2 (en) | 2016-10-14 | 2021-01-12 | Red Hat, Inc. | Method for generating synthetic data sets at scale with non-redundant partitioning |
CN111566655B (zh) | 2018-01-11 | 2024-02-06 | 新智株式会社 | 多种语言文本语音合成方法 |
WO2019139428A1 (ko) * | 2018-01-11 | 2019-07-18 | 네오사피엔스 주식회사 | 다중 언어 텍스트-음성 합성 방법 |
CN108877765A (zh) * | 2018-05-31 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 语音拼接合成的处理方法及装置、计算机设备及可读介质 |
EP3836027A4 (en) * | 2018-08-10 | 2022-07-06 | Yamaha Corporation | METHOD AND APPARATUS FOR GENERATION OF FREQUENCY COMPONENT VECTOR OF TIME SERIES DATA |
JP6741051B2 (ja) * | 2018-08-10 | 2020-08-19 | ヤマハ株式会社 | 情報処理方法、情報処理装置およびプログラム |
CN112037760B (zh) * | 2020-08-24 | 2022-01-07 | 北京百度网讯科技有限公司 | 语音频谱生成模型的训练方法、装置及电子设备 |
CN112185340B (zh) * | 2020-10-30 | 2024-03-15 | 网易(杭州)网络有限公司 | 语音合成方法、语音合成装置、存储介质与电子设备 |
KR20220102476A (ko) * | 2021-01-13 | 2022-07-20 | 한양대학교 산학협력단 | 음성 합성 시스템의 동작방법 |
CN113192522B (zh) * | 2021-04-22 | 2023-02-21 | 北京达佳互联信息技术有限公司 | 音频合成模型生成方法及装置、音频合成方法及装置 |
CN113470614B (zh) * | 2021-06-29 | 2024-05-28 | 维沃移动通信有限公司 | 语音生成方法、装置和电子设备 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0573100A (ja) * | 1991-09-11 | 1993-03-26 | Canon Inc | 音声合成方法及びその装置 |
JP2782147B2 (ja) * | 1993-03-10 | 1998-07-30 | 日本電信電話株式会社 | 波形編集型音声合成装置 |
JP3557662B2 (ja) * | 1994-08-30 | 2004-08-25 | ソニー株式会社 | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 |
JP3346671B2 (ja) * | 1995-03-20 | 2002-11-18 | 株式会社エヌ・ティ・ティ・データ | 音声素片選択方法および音声合成装置 |
JPH08263520A (ja) * | 1995-03-24 | 1996-10-11 | N T T Data Tsushin Kk | 音声ファイル構成方式及び方法 |
JP2912579B2 (ja) * | 1996-03-22 | 1999-06-28 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 声質変換音声合成装置 |
US6163769A (en) * | 1997-10-02 | 2000-12-19 | Microsoft Corporation | Text-to-speech using clustered context-dependent phoneme-based units |
US6910007B2 (en) * | 2000-05-31 | 2005-06-21 | At&T Corp | Stochastic modeling of spectral adjustment for high quality pitch modification |
JP2003066983A (ja) * | 2001-08-30 | 2003-03-05 | Sharp Corp | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 |
US7266497B2 (en) * | 2002-03-29 | 2007-09-04 | At&T Corp. | Automatic segmentation in speech synthesis |
JP2004246292A (ja) * | 2003-02-17 | 2004-09-02 | Nippon Hoso Kyokai <Nhk> | 単語クラスタリング音声データベースおよび単語クラスタリング音声データベース生成装置、単語クラスタリング音声データベース生成方法、単語クラスタリング音声データベース生成プログラムならびに音声合成装置 |
US7496512B2 (en) * | 2004-04-13 | 2009-02-24 | Microsoft Corporation | Refining of segmental boundaries in speech waveforms using contextual-dependent models |
US8447592B2 (en) * | 2005-09-13 | 2013-05-21 | Nuance Communications, Inc. | Methods and apparatus for formant-based voice systems |
JP4829605B2 (ja) * | 2005-12-12 | 2011-12-07 | 日本放送協会 | 音声合成装置および音声合成プログラム |
JP4945465B2 (ja) * | 2008-01-23 | 2012-06-06 | 株式会社東芝 | 音声情報処理装置及びその方法 |
US20090240501A1 (en) * | 2008-03-19 | 2009-09-24 | Microsoft Corporation | Automatically generating new words for letter-to-sound conversion |
JP2010020166A (ja) * | 2008-07-11 | 2010-01-28 | Ntt Docomo Inc | 音声合成モデル生成装置、音声合成モデル生成システム、通信端末、及び音声合成モデル生成方法 |
DE602008000303D1 (de) * | 2008-09-03 | 2009-12-31 | Svox Ag | Sprachsynthese mit dynamischen Einschränkungen |
JP5268731B2 (ja) * | 2009-03-25 | 2013-08-21 | Kddi株式会社 | 音声合成装置、方法およびプログラム |
-
2009
- 2009-03-30 JP JP2009083563A patent/JP5457706B2/ja not_active Expired - Fee Related
- 2009-10-06 WO PCT/JP2009/067408 patent/WO2010116549A1/ja active Application Filing
-
2011
- 2011-09-21 US US13/238,187 patent/US20120065961A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2010116549A1 (ja) | 2010-10-14 |
JP2010237323A (ja) | 2010-10-21 |
US20120065961A1 (en) | 2012-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5457706B2 (ja) | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 | |
JP5665780B2 (ja) | 音声合成装置、方法およびプログラム | |
JP6266372B2 (ja) | 音声合成辞書生成装置、音声合成辞書生成方法およびプログラム | |
JP3667950B2 (ja) | ピッチパターン生成方法 | |
US9147392B2 (en) | Speech synthesis device and speech synthesis method | |
JP5025550B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
Latorre et al. | Multilevel parametric-base F0 model for speech synthesis. | |
US20120095767A1 (en) | Voice quality conversion device, method of manufacturing the voice quality conversion device, vowel information generation device, and voice quality conversion system | |
WO2015025788A1 (ja) | 定量的f0パターン生成装置及び方法、並びにf0パターン生成のためのモデル学習装置及び方法 | |
JP3646060B2 (ja) | 話者特徴抽出装置および話者特徴抽出方法、音声認識装置、音声合成装置、並びに、プログラム記録媒体 | |
JP4945465B2 (ja) | 音声情報処理装置及びその方法 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP4811993B2 (ja) | 音声処理装置、およびプログラム | |
Chunwijitra et al. | A tone-modeling technique using a quantized F0 context to improve tone correctness in average-voice-based speech synthesis | |
JP5722295B2 (ja) | 音響モデル生成方法と音声合成方法とそれらの装置とプログラム | |
JP2002182683A (ja) | 話者特徴推定装置および話者特徴推定方法、クラスタモデル作成装置、音声認識装置、音声合成装置、並びに、プログラム記録媒体 | |
JP2004279436A (ja) | 音声合成装置及びコンピュータプログラム | |
JP6523423B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP4787769B2 (ja) | F0値時系列生成装置、その方法、そのプログラム、及びその記録媒体 | |
JP6137708B2 (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP4417892B2 (ja) | 音声情報処理装置、音声情報処理方法および音声情報処理プログラム | |
JP3754614B2 (ja) | 話者特徴抽出装置および話者特徴抽出方法、音声認識装置、音声合成装置、並びに、プログラム記録媒体 | |
JP4282609B2 (ja) | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム | |
JP6036681B2 (ja) | 音声合成システム、音声合成方法、および音声合成プログラム | |
Majji | Building a Tamil Text-to-Speech Synthesizer using Festival |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140110 |
|
LAPS | Cancellation because of no payment of annual fees |