JP7180642B2 - 音声合成方法、音声合成システムおよびプログラム - Google Patents
音声合成方法、音声合成システムおよびプログラム Download PDFInfo
- Publication number
- JP7180642B2 JP7180642B2 JP2020113896A JP2020113896A JP7180642B2 JP 7180642 B2 JP7180642 B2 JP 7180642B2 JP 2020113896 A JP2020113896 A JP 2020113896A JP 2020113896 A JP2020113896 A JP 2020113896A JP 7180642 B2 JP7180642 B2 JP 7180642B2
- Authority
- JP
- Japan
- Prior art keywords
- control data
- data
- generating
- phoneme
- synthesized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 28
- 238000003786 synthesis reaction Methods 0.000 title claims description 28
- 238000001308 synthesis method Methods 0.000 title claims description 6
- 230000008859 change Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 26
- 230000005236 sound signal Effects 0.000 claims description 22
- 230000014509 gene expression Effects 0.000 claims description 18
- 230000002194 synthesizing effect Effects 0.000 claims description 16
- 230000008921 facial expression Effects 0.000 description 24
- 230000004044 response Effects 0.000 description 22
- 239000011295 pitch Substances 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 1
- 208000010473 Hoarseness Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
図1は、本発明の第1実施形態に係る音声合成装置100の構成を例示するブロック図である。音声合成装置100は、任意の音韻の音声(以下「合成音声」という)を合成する。第1実施形態の音声合成装置100は、歌唱者が楽曲を仮想的に歌唱した音声を合成音声として合成する歌唱合成装置である。図1に例示される通り、第1実施形態の音声合成装置100は、制御装置11と記憶装置12と操作装置13と表示装置14と放音装置15とを具備するコンピュータシステムで実現される。例えば携帯電話機もしくはスマートフォン等の可搬型の情報端末、またはパーソナルコンピュータ等の可搬型または据置型の情報端末が、音声合成装置100として好適に利用される。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用または機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。
Claims (10)
- 合成音声の各音符について音韻および第1発音期間を含む条件を指定する第1制御データを利用して、時間軸上において前記各音符の前記音韻および前記第1発音期間を表す第1画像を、表示装置に表示させ、
前記合成音声の前記音韻に対応する各音素について音素記号および第2発音期間を指定する第2制御データを前記第1制御データから生成し、
前記第2制御データを利用して、前記時間軸上において前記各音素の前記音素記号および前記第2発音期間を表す第2画像を、前記表示装置に表示させ、
利用者からの第1指示に応じて前記第2制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データとに応じて前記合成音声の音声信号を生成する、
コンピュータにより実現される音声合成方法。 - 前記第1制御データと前記変更後の前記第2制御データとに応じて、前記合成音声に関する表情を指定する第3制御データを生成し、
前記第3制御データを表す第3画像を前記表示装置に表示させ、
前記利用者からの第2指示に応じて前記第3制御データを変更し、
前記音声信号の生成においては、前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとに応じて前記音声信号を生成する
請求項1の音声合成方法。 - 合成音声について音韻を含む条件を指定する第1制御データを表す第1画像を表示装置に表示させ、
前記合成音声について前記音韻に対応する音素の時系列を指定する第2制御データを前記第1制御データから生成し、
前記第2制御データを表す第2画像を前記表示装置に表示させ、
利用者からの第1指示に応じて前記第2制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データとに応じて、前記合成音声に関する表情を指定する第3制御データを生成し、
前記第3制御データを表す第3画像を前記表示装置に表示させ、
前記利用者からの第2指示に応じて前記第3制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとに応じて、前記合成音声の周波数特性に関する合成データを生成し、
前記合成データを表す第4画像を前記表示装置に表示させ、
前記利用者からの第3指示に応じて前記合成データを変更し、
前記変更後の前記合成データに応じて前記合成音声の音声信号を生成する
コンピュータにより実現される音声合成方法。 - 前記第2制御データの生成においては、前記第1制御データを入力に含む第1学習済モデルにより前記第2制御データを生成し、
前記第3制御データの生成においては、前記第1制御データと前記変更後の前記第2制御データとを入力に含む第2学習済モデルにより前記第3制御データを生成し、
前記合成データの生成においては、前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとを入力に含む第3学習済モデルにより前記合成データを生成する
請求項3の音声合成方法。 - 制御装置と記憶装置とを具備する音声合成システムであって、
前記制御装置は、前記記憶装置に記憶されたプログラムを実行することで、
合成音声の各音符について音韻および第1発音期間を含む条件を指定する第1制御データを利用して、時間軸上において前記各音符の前記音韻および前記第1発音期間を表す第1画像を、表示装置に表示させ、
前記合成音声の前記音韻に対応する各音素について音素記号および第2発音期間を指定する第2制御データを前記第1制御データから生成し、
前記第2制御データを利用して、前記時間軸上において前記各音素の前記音素記号および前記第2発音期間を表す第2画像を、前記表示装置に表示させ、
利用者からの第1指示に応じて前記第2制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データとに応じて前記合成音声の音声信号を生成する、
音声合成システム。 - 前記制御装置は、
前記第1制御データと前記変更後の前記第2制御データとに応じて、前記合成音声に関する表情を指定する第3制御データを生成し、
前記第3制御データを表す第3画像を前記表示装置に表示させ、
前記利用者からの第2指示に応じて前記第3制御データを変更し、
前記音声信号の生成においては、前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとに応じて前記音声信号を生成する
請求項5の音声合成システム。 - 制御装置と記憶装置とを具備する音声合成システムであって、
前記制御装置は、前記記憶装置に記憶されたプログラムを実行することで、
合成音声について音韻を含む条件を指定する第1制御データを表す第1画像を表示装置に表示させ、
前記合成音声について前記音韻に対応する音素の時系列を指定する第2制御データを前記第1制御データから生成し、
前記第2制御データを表す第2画像を前記表示装置に表示させ、
利用者からの第1指示に応じて前記第2制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データとに応じて、前記合成音声に関する表情を指定する第3制御データを生成し、
前記第3制御データを表す第3画像を前記表示装置に表示させ、
前記利用者からの第2指示に応じて前記第3制御データを変更し、
前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとに応じて、前記合成音声の周波数特性に関する合成データを生成し、
前記合成データを表す第4画像を前記表示装置に表示させ、
前記利用者からの第3指示に応じて前記合成データを変更し、
前記変更後の前記合成データに応じて前記合成音声の音声信号を生成する
音声合成システム。 - 前記制御装置は、
前記第2制御データの生成において、前記第1制御データを入力に含む第1学習済モデルにより前記第2制御データを生成し、
前記第3制御データの生成において、前記第1制御データと前記変更後の前記第2制御データとを入力に含む第2学習済モデルにより前記第3制御データを生成し、
前記合成データの生成において、前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとを入力に含む第3学習済モデルにより前記合成データを生成する
請求項7の音声合成システム。 - 合成音声の各音符について音韻および第1発音期間を含む条件を指定する第1制御データを利用して、時間軸上において前記各音符の前記音韻および前記第1発音期間を表す第1画像を、表示装置に表示させる処理と、
前記合成音声の前記音韻に対応する各音素について音素記号および第2発音期間を指定する第2制御データを前記第1制御データから生成する処理と、
前記第2制御データを利用して、前記時間軸上において前記各音素の前記音素記号および前記第2発音期間を表す第2画像を、前記表示装置に表示させる処理と、
利用者からの第1指示に応じて前記第2制御データを変更する処理と、
前記第1制御データと前記変更後の前記第2制御データとに応じて前記合成音声の音声信号を生成する処理と
をコンピュータに実行させるプログラム。 - 合成音声について音韻を含む条件を指定する第1制御データを表す第1画像を表示装置に表示させる処理と、
前記合成音声について前記音韻に対応する音素の時系列を指定する第2制御データを前記第1制御データから生成する処理と、
前記第2制御データを表す第2画像を前記表示装置に表示させる処理と、
利用者からの第1指示に応じて前記第2制御データを変更する処理と、
前記第1制御データと前記変更後の前記第2制御データとに応じて、前記合成音声に関する表情を指定する第3制御データを生成する処理と、
前記第3制御データを表す第3画像を前記表示装置に表示させる処理と、
前記利用者からの第2指示に応じて前記第3制御データを変更する処理と、
前記第1制御データと前記変更後の前記第2制御データと前記変更後の前記第3制御データとに応じて、前記合成音声の周波数特性に関する合成データを生成する処理と、
前記合成データを表す第4画像を前記表示装置に表示させる処理と、
前記利用者からの第3指示に応じて前記合成データを変更する処理と、
前記変更後の前記合成データに応じて前記合成音声の音声信号を生成する処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113896A JP7180642B2 (ja) | 2020-07-01 | 2020-07-01 | 音声合成方法、音声合成システムおよびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113896A JP7180642B2 (ja) | 2020-07-01 | 2020-07-01 | 音声合成方法、音声合成システムおよびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017229042A Division JP6729539B2 (ja) | 2017-11-29 | 2017-11-29 | 音声合成方法、音声合成システムおよびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020166298A JP2020166298A (ja) | 2020-10-08 |
JP2020166298A5 JP2020166298A5 (ja) | 2021-01-07 |
JP7180642B2 true JP7180642B2 (ja) | 2022-11-30 |
Family
ID=72665928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020113896A Active JP7180642B2 (ja) | 2020-07-01 | 2020-07-01 | 音声合成方法、音声合成システムおよびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7180642B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134283A (ja) | 1999-11-04 | 2001-05-18 | Mitsubishi Electric Corp | 音声合成装置および音声合成方法 |
JP2004246129A (ja) | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2008268477A (ja) | 2007-04-19 | 2008-11-06 | Hitachi Business Solution Kk | 韻律調整可能な音声合成装置 |
JP2008292587A (ja) | 2007-05-22 | 2008-12-04 | Fujitsu Ltd | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
JP2011013454A (ja) | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP2017097176A (ja) | 2015-11-25 | 2017-06-01 | 株式会社テクノスピーチ | 音声合成装置および音声合成方法 |
JP2019101094A (ja) | 2017-11-29 | 2019-06-24 | ヤマハ株式会社 | 音声合成方法およびプログラム |
-
2020
- 2020-07-01 JP JP2020113896A patent/JP7180642B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134283A (ja) | 1999-11-04 | 2001-05-18 | Mitsubishi Electric Corp | 音声合成装置および音声合成方法 |
JP2004246129A (ja) | 2003-02-14 | 2004-09-02 | Arcadia:Kk | 音声合成制御装置 |
JP2008268477A (ja) | 2007-04-19 | 2008-11-06 | Hitachi Business Solution Kk | 韻律調整可能な音声合成装置 |
JP2008292587A (ja) | 2007-05-22 | 2008-12-04 | Fujitsu Ltd | 韻律生成装置、韻律生成方法、および、韻律生成プログラム |
JP2011013454A (ja) | 2009-07-02 | 2011-01-20 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
JP2017097176A (ja) | 2015-11-25 | 2017-06-01 | 株式会社テクノスピーチ | 音声合成装置および音声合成方法 |
JP2019101094A (ja) | 2017-11-29 | 2019-06-24 | ヤマハ株式会社 | 音声合成方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020166298A (ja) | 2020-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6724932B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6733644B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6728754B2 (ja) | 発音装置、発音方法および発音プログラム | |
JP6977818B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6737320B2 (ja) | 音響処理方法、音響処理システムおよびプログラム | |
JP7180642B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP6044284B2 (ja) | 音声合成装置 | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5176981B2 (ja) | 音声合成装置、およびプログラム | |
JP2010160406A (ja) | 音声合成装置、およびプログラム | |
JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP6372066B2 (ja) | 合成情報管理装置および音声合成装置 | |
JP5953743B2 (ja) | 音声合成装置及びプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
KR100994340B1 (ko) | 문자음성합성을 이용한 음악 컨텐츠 제작장치 | |
WO2023120288A1 (ja) | 情報処理装置、電子楽器システム、電子楽器、音節進行制御方法及びプログラム | |
JP2005107028A (ja) | 音色パラメータ編集装置、方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7180642 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |