JP6340839B2 - 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム - Google Patents
音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム Download PDFInfo
- Publication number
- JP6340839B2 JP6340839B2 JP2014047871A JP2014047871A JP6340839B2 JP 6340839 B2 JP6340839 B2 JP 6340839B2 JP 2014047871 A JP2014047871 A JP 2014047871A JP 2014047871 A JP2014047871 A JP 2014047871A JP 6340839 B2 JP6340839 B2 JP 6340839B2
- Authority
- JP
- Japan
- Prior art keywords
- accent
- candidate
- speech
- word
- correction target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
この音声合成装置は、合成音声のアクセント句の境界をユーザに編集させる際、アクセント句の境界の候補のうち、アクセント句の境界か否かが変更されてもアクセントが正しい候補を編集可能に表示する。一方、この音声合成装置は、アクセント句の境界の候補のうち、アクセント句の境界か否かが変更されると、アクセントが不適切となる候補を非表示とすることで、アクセント句の境界の編集によるアクセント誤りを防止する。
また、通信インターフェース部4は、処理部7から受け取った合成音声信号を、通信ネットワークを介して音声合成装置1と接続された他の装置へ出力してもよい。
記憶部6は、音声合成処理に用いられるデータとして、例えば、韻律モデルと、音声波形辞書を記憶する。さらに記憶部6は、単語辞書を記憶する。単語辞書には、様々な単語について、その単語の表記、表音文字列、その単語固有のアクセント及びアクセント結合のし易さを表すポイントが登録される。単語のアクセント結合のし易さを表すポイントは、その単語が他の単語の前に位置する場合と、他の単語の後に位置する場合とで異なっていてもよい。また、単語辞書には、登録された各単語の品詞情報及び活用形などがさらに登録されてもよい。
図2は、処理部7の機能ブロック図である。処理部7は、言語処理部10と、音声合成部11と、合成音声編集部12とを有する。
処理部7が有するこれらの各部は、例えば、処理部7が有するプロセッサ上で動作するコンピュータプログラムにより実現される機能モジュールである。あるいは、処理部7が有するこれらの各部は、その各部の機能を実現する一つの集積回路として音声合成装置1に実装されてもよい。
言語処理部10は、生成した中間表記を記憶部6に記憶する。
例えば、音声合成部11は、音素ごとに、目標韻律の音素長及びピッチ周波数に最も近い音声波形を、例えばパターンマッチングにより音声波形辞書に登録されている複数の音声波形の中から選択する。そのために、音声合成部11は、記憶部6から音声波形辞書を読み込む。音声波形辞書は、複数の音声波形及び各音声波形の識別番号を記録する。また音声波形は、例えば、一人以上のナレータが様々なテキストを読み上げた様々な音声を録音した音声信号から、音素単位で取り出された波形信号である。
さらに、音声合成部11は、音素ごとに選択された音声波形を目標韻律に沿って接続できるようにするため、それら選択された音声波形と目標韻律に示された対応する音素の波形パターンとのずれ量を、波形変換情報として算出してもよい。
音声合成部11は、音素ごとに選択された音声波形の識別番号を含む波形生成情報を作成する。波形生成情報は、波形変換情報をさらに含んでもよい。
音声合成部11は、合成音声信号を出力部5へ出力する。
(1)アクセント結合が生じているために、一つのアクセント句の途中に位置する候補(すなわち、中間表記では、アクセント句境界となっていない候補)
(2)中間表記でも二つのアクセント句の境界となっており、かつ、直前のアクセント句が平板なアクセントとなっている候補
したがって、候補404−1及び404−3は、修正対象候補となる。
したがって、候補404−2は、修正対象候補となる。
したがって、候補404−4は、修正対象候補とならない。
表示画面500には、原文510と、修正対象候補501〜503が表示されている。このうち、修正対象候補501及び503は、アクセント結合のために、一つのアクセント句の途中に位置するので、修正前の状態では、アクセント句境界ではない。そのため、この例では、修正対象候補501及び503は、点線で示されている。一方、修正対象候補502は、言語処理部10により生成された中間表記においてアクセント句境界となっている。そのため、この例では、修正対象候補502は、実線で示されている。
修正対象候補決定部22は、中間表記を参照して、アクセント句境界の候補のうち、上記の(1)及び(2)の条件の一方を満たすアクセント句境界の候補を修正対象候補に設定する(ステップS102)。
修正部24は、操作部2を介した操作に応じて、中間表記における、アクセント句境界か否かが変更された修正対象候補に相当する位置のアクセント句境界の表記を修正する(ステップS104)。そして修正部24は、修正した中間表記を記憶部6に記憶する。そして合成音声編集部12は、合成音声編集処理を終了する。
第2の実施形態による合成音声編集部12は、第1の実施形態による合成音声編集部と比較して、複合語判定部25及びアクセント位置変化判定部26を有する点、及び、表示制御部23の処理が異なる。そこで以下では、表示制御部23、複合語判定部25及びアクセント位置変化判定部26とその関連部分について説明する。第2の実施形態による音声合成装置のその他の構成要素については、第1の実施形態の対応する構成要素の説明を参照されたい。
複合語判定部25は、各アクセント句境界の候補について、複合語の結合位置にあるか否かを表す情報を記憶部6に記憶する。
なお、変形例によれば、修正対象候補でないアクセント句境界の候補は、原則として編集を許可されないので、複合語判定部25は、アクセント句境界の候補のうちの修正対象候補についてのみ、複合語中の結合位置にあるか否かを判定してもよい。
上記のアクセント結合ルールにより、前置アクセント句に含まれる名詞の固有アクセントが平板以外であるか、または、後置アクセント句に含まれる名詞の固有アクセントが平板であれば、アクセント結合の有無によってアクセントの位置が変化する。なお、固有アクセントは、その名詞を単独で発声する場合のアクセントである。
ここで、前置アクセント句802と後置アクセント句803の間のアクセント句境界の候補804をアクセント句境界に修正したとする。この場合、折れ線811に示されるように、前置アクセント句802及び後置アクセント句803のアクセント位置は、アクセント結合がされている場合のまま維持されてもよい。あるいは、折れ線812に示されるように、前置アクセント句802に含まれる名詞及び後置アクセント句803に含まれる名詞の固有アクセントに合わせて、アクセントの位置が修正されてもよい。
このように、アクセント位置を修正するか否かは、ユーザの選択によって決定できる。
表示画面1000には、原文1010と、修正対象候補1001〜1003が表示されている。このうち、修正対象候補1001及び1003は、アクセント結合のために、一つのアクセント句の途中に位置するので、修正前の状態では、アクセント句境界ではない。そのため、この例では、修正対象候補1001及び1003は、点線で示されている。一方、修正対象候補1002は、修正前の状態において、アクセント句境界となっている。そのため、この例では、修正対象候補1002は、実線で示されている。
修正部24は、修正対象候補をアクセント句境界とするか否かが変更される際に、その前後のアクセント句においてアクセントの位置も変更される場合、言語処理部10に、その前後のアクセント句を入力することで、アクセントの位置を修正する。
修正対象候補決定部22は、中間表記を参照して、アクセント句境界の候補のうち、上記の(1)及び(2)の条件の一方を満たすアクセント句境界の候補を修正対象候補に設定する(ステップS202)。
修正部24は、操作部2を介した操作に応じて、中間表記のうち、変更された修正対象候補に相当する位置のアクセント句境界の表記を修正する(ステップS206)。そして修正部24は、修正した中間表記を記憶部6に記憶する。そして合成音声編集部12は、合成音声編集処理を終了する。
2 操作部
3 表示部
4 通信インターフェース部
5 出力部
6 記憶部
7 処理部
8 スピーカ
10 言語処理部
11 音声合成部
12 合成音声編集部
21 アクセント句境界候補抽出部
22 修正対象候補決定部
23 表示制御部
24 修正部
25 複合語判定部
26 アクセント位置変化判定部
Claims (10)
- 合成音声の原文となるデータ及び前記原文の読みを表すデータを取得する入力部と、
単語ごとの品詞及びアクセント位置が登録された単語辞書を記憶する記憶部と、
前記単語辞書を参照して前記原文及び前記原文の読みに言語処理を行うことにより、前記原文に含まれる各単語の品詞を特定し、かつ、前記原文をアクセント句単位で分割して、各アクセント句のアクセント及びアクセント結合が生じた位置を表す中間表記を生成する言語処理部と、
前記原文に含まれる各単語の品詞を参照して自立語である単語を特定し、当該自立語と当該自立語の直前の単語間の境界を、それぞれ、アクセント句の境界の候補とするアクセント句境界候補抽出部と、
前記アクセント句の境界の候補のうち、当該候補の前のアクセント句のアクセント及び当該候補がアクセント結合された位置にあるか否かに応じて、アクセント句の境界か否かを変更しても、当該候補の前後のアクセント句が誤ったアクセントにならない候補を修正対象候補として特定する修正対象候補決定部と、
前記修正対象候補を表示部に表示させる表示制御部と、
を有する音声合成装置。 - 前記修正対象候補決定部は、前記アクセント句の境界の候補のうち、アクセント句の境界か否かを変更しても、該候補の前後のアクセント句のアクセントの位置が変化しない候補を前記修正対象候補とする、請求項1に記載の音声合成装置。
- 前記修正対象候補決定部は、前記アクセント句の境界の候補のうち、アクセント結合された位置にある候補を前記修正対象候補とする、請求項2に記載の音声合成装置。
- 前記修正対象候補決定部は、前記アクセント句の境界の候補のうち、アクセント結合されていない位置にあり、かつ、当該候補の直前のアクセント句のアクセントが平板である候補を前記修正対象候補とする、請求項2または3に記載の音声合成装置。
- 操作部を介した操作に応じて、前記中間表記における、選択された前記修正対象候補がアクセント句の境界か否かを修正する修正部をさらに有する、請求項1〜4の何れか一項に記載の音声合成装置。
- 前記修正対象候補のそれぞれについて、複数の名詞が連続する複合語中の名詞の結合位置にあるか否かを判定する複合語判定部と、
前記複合語のアクセント結合ルールに基づいて、前記結合位置にある前記修正対象候補のうち、アクセント句の境界か否かを変更すると、当該修正対象候補の前後のアクセント句の少なくとも一方のアクセントの位置が変化する修正対象候補に、アクセント位置が変化することを表す第1の属性を割り当て、一方、アクセント句の境界か否かを変更しても、当該修正対象候補の前後のアクセント句のアクセントの位置が変化しない修正対象候補に、アクセント位置が変化しないことを表す第2の属性を割り当てるアクセント位置変化判定部と、をさらに有し、
前記表示制御部は、前記第1の属性を持つ前記修正対象候補の前記表示部における表示を、前記第2の属性を持つ前記修正対象候補の前記表示部における表示と異ならせる、請求項1〜4の何れか一項に記載の音声合成装置。 - 前記アクセント結合ルールは、前記結合位置の直前の名詞のアクセントが平板となり、かつ、前記結合位置の直後の名詞のアクセントが平板以外の場合に前記複合語となっても変化しないことであり、
前記アクセント位置変化判定部は、前記結合位置にある前記修正対象候補の直前のアクセント句に含まれる名詞のアクセントが平板以外であるか、または、前記結合位置にある前記修正対象候補の直後のアクセント句に含まれる名詞のアクセントが平板である場合、当該修正対象候補に前記第1の属性を割り当てる、請求項6に記載の音声合成装置。 - 操作部を介した操作に応じて、前記中間表記における、選択された前記第1の属性を持つ前記修正対象候補がアクセント句の境界か否かが修正されたときに、前記第1の属性を持つ前記修正対象候補の前後のアクセント句のアクセントの位置を修正するか否かを決定する修正部をさらに有する、請求項6または7に記載の音声合成装置。
- 単語ごとの品詞及びアクセント位置が登録された単語辞書を参照して、合成音声の原文及び当該原文の読みに対して言語処理を行うことにより、前記原文に含まれる各単語の品詞を特定し、かつ、前記原文をアクセント句単位で分割して、各アクセント句のアクセント及びアクセント結合が生じた位置を表す中間表記を生成し、
前記原文に含まれる各単語の品詞を参照して自立語である単語を特定し、当該自立語と当該自立語の直前の単語間の境界を、それぞれ、アクセント句の境界の候補とし、
前記アクセント句の境界の候補のうち、当該候補の前のアクセント句のアクセント及び当該候補がアクセント結合された位置にあるか否かに応じて、アクセント句の境界か否かを変更しても、当該候補の前後のアクセント句が誤ったアクセントにならない候補を修正対象候補として特定し、
前記修正対象候補を表示部に表示させる、
ことを含む合成音声編集方法。 - 単語ごとの品詞及びアクセント位置が登録された単語辞書を参照して、合成音声の原文及び当該原文の読みに対して言語処理を行うことにより、前記原文に含まれる各単語の品詞を特定し、かつ、前記原文をアクセント句単位で分割して、各アクセント句のアクセント及びアクセント結合が生じた位置を表す中間表記を生成し、
前記原文に含まれる各単語の品詞を参照して自立語である単語を特定し、当該自立語と当該自立語の直前の単語間の境界を、それぞれ、アクセント句の境界の候補とし、
前記アクセント句の境界の候補のうち、当該候補の前のアクセント句のアクセント及び当該候補がアクセント結合された位置にあるか否かに応じて、アクセント句の境界か否かを変更しても、当該候補の前後のアクセント句が誤ったアクセントにならない候補を修正対象候補として特定し、
前記修正対象候補を表示部に表示させる、
ことをコンピュータに実行させるための合成音声編集用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014047871A JP6340839B2 (ja) | 2014-03-11 | 2014-03-11 | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014047871A JP6340839B2 (ja) | 2014-03-11 | 2014-03-11 | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015172625A JP2015172625A (ja) | 2015-10-01 |
JP6340839B2 true JP6340839B2 (ja) | 2018-06-13 |
Family
ID=54260002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014047871A Expired - Fee Related JP6340839B2 (ja) | 2014-03-11 | 2014-03-11 | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6340839B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7467314B2 (ja) * | 2020-11-05 | 2024-04-15 | 株式会社東芝 | 辞書編集装置、辞書編集方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2785628B2 (ja) * | 1991-12-20 | 1998-08-13 | 日本電気株式会社 | ピッチパタン生成装置 |
JP3268171B2 (ja) * | 1995-08-02 | 2002-03-25 | 日本電信電話株式会社 | アクセント付与方法 |
JPH0981173A (ja) * | 1995-09-12 | 1997-03-28 | Canon Inc | 音声規則合成方法とその装置 |
JP3721101B2 (ja) * | 2001-05-30 | 2005-11-30 | 株式会社東芝 | 音声合成編集装置及び音声合成編集方法並びに音声合成編集プログラム |
JP5870686B2 (ja) * | 2011-12-27 | 2016-03-01 | 富士通株式会社 | 合成音声修正装置,方法,及びプログラム |
-
2014
- 2014-03-11 JP JP2014047871A patent/JP6340839B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015172625A (ja) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8825486B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US9424833B2 (en) | Method and apparatus for providing speech output for speech-enabled applications | |
US7890330B2 (en) | Voice recording tool for creating database used in text to speech synthesis system | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
EP1096472B1 (en) | Audio playback of a multi-source written document | |
US20080195391A1 (en) | Hybrid Speech Synthesizer, Method and Use | |
US8914291B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
JP6790959B2 (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
JP2014062970A (ja) | 音声合成方法、装置、及びプログラム | |
JP5334716B2 (ja) | 文字情報提示制御装置及びプログラム | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
US20070219799A1 (en) | Text to speech synthesis system using syllables as concatenative units | |
US20070203706A1 (en) | Voice analysis tool for creating database used in text to speech synthesis system | |
JP2005031150A (ja) | 音声処理装置および方法 | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
JP6232724B2 (ja) | 音声合成装置及び言語辞書登録方法 | |
JP2004258561A (ja) | 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置 | |
US20070203705A1 (en) | Database storing syllables and sound units for use in text to speech synthesis system | |
JP6142632B2 (ja) | 単語辞書登録用コンピュータプログラム、音声合成装置及び単語辞書登録登録方法 | |
Nguyen | Hmm-based vietnamese text-to-speech: Prosodic phrasing modeling, corpus design system design, and evaluation | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP4208819B2 (ja) | 音声合成辞書登録方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180417 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6340839 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |