JP6289950B2 - 読み上げ装置、読み上げ方法及びプログラム - Google Patents
読み上げ装置、読み上げ方法及びプログラム Download PDFInfo
- Publication number
- JP6289950B2 JP6289950B2 JP2014056667A JP2014056667A JP6289950B2 JP 6289950 B2 JP6289950 B2 JP 6289950B2 JP 2014056667 A JP2014056667 A JP 2014056667A JP 2014056667 A JP2014056667 A JP 2014056667A JP 6289950 B2 JP6289950 B2 JP 6289950B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- expression
- speech
- text
- special
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L2013/083—Special characters, e.g. punctuation marks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
20 解析部
21 受付部
22 正規化部
23 正規化ルール
24 選択部
25 言語解析辞書
30 合成部
31 生成部
32 音声波形生成用データ
33 変形部
34 変形ルール
35 出力部
41 制御装置
42 主記憶装置
43 補助記憶装置
44 表示装置
45 入力装置
46 通信装置
47 出力装置
48 バス
Claims (9)
- 特殊表現を含む入力テキストの入力を受け付ける受付部と、
前記特殊表現と、前記特殊表現を通常の表現で表した通常表現と、前記特殊表現の表現方法と、が関連付けられた正規化ルールに基づいて、前記入力テキストを正規化した一以上の正規化テキストを生成する正規化部と、
それぞれの前記正規化テキストを言語解析し、前記言語解析の結果に基づいて一の正規化テキストを選択する選択部と、
前記選択部により選択された前記正規化テキストの読みを表す音声パラメタの系列を生成する生成部と、
前記入力テキストの特殊表現に対応する正規化テキストの音声パラメタを、前記特殊表現の正規化ルールに応じた複数の音声パラメタの変形方法に基づいて変形する変形部と、
変形された前記音声パラメタを含む前記音声パラメタの系列を使用して合成した音声を出力する出力部と、
を備える読み上げ装置。 - 前記生成部は、音声素片辞書から音声素片を選択することにより前記音声パラメタの系列を生成し、
前記変形部は、前記生成部により選択された前記音声素片を、前記特殊表現の正規化ルールに応じた複数の音声パラメタの変形方法に基づいて変形する
請求項1に記載の読み上げ装置。 - 前記生成部は、HMM(Hidden Markov Model)に基づく音響パラメタにより前記音声パラメタの系列を生成し、
前記変形部は、前記生成部により選択された前記音響パラメタを、前記特殊表現の正規化ルールに応じた複数の音声パラメタの変形方法に基づいて変形する
請求項1に記載の読み上げ装置。 - 前記変形部は、前記音声パラメタを変形することにより前記出力部により出力される音声の基本周波数を変更する
請求項1乃至3のいずれか1項に記載の読み上げ装置。 - 前記変形部は、前記音声パラメタを変形することにより前記出力部により出力される音声に含まれる各音の長さを変更する
請求項1乃至4のいずれか1項に記載の読み上げ装置。 - 前記変形部は、前記音声パラメタを変形することにより前記出力部により出力される音声のピッチを変更する
請求項1乃至5のいずれか1項に記載の読み上げ装置。 - 前記変形部は、前記音声パラメタを変形することにより前記出力部により出力される音声の音量を変更する
請求項1乃至6のいずれか1項に記載の読み上げ装置。 - 受付部が、特殊表現を含む入力テキストの入力を受け付けるステップと、
正規化部が、前記特殊表現と、前記特殊表現を通常の表現で表した通常表現と、前記特殊表現の表現方法と、が関連付けられた正規化ルールに基づいて、前記入力テキストを正規化した一以上の正規化テキストを生成するステップと、
選択部が、それぞれの前記正規化テキストを言語解析し、前記言語解析の結果に基づいて一の正規化テキストを選択するステップと、
生成部が、前記選択部により選択された前記正規化テキストの読みを表す音声パラメタの系列を生成するステップと、
変形部が、前記入力テキストの特殊表現に対応する正規化テキストの音声パラメタを、前記特殊表現の正規化ルールに応じた複数の音声パラメタの変形方法に基づいて変形するステップと、
出力部が、変形された前記音声パラメタを含む前記音声パラメタの系列を使用して合成した音声を出力するステップと、
を含む読み上げ方法。 - コンピュータを、
特殊表現を含む入力テキストの入力を受け付ける受付部と、
前記特殊表現と、前記特殊表現を通常の表現で表した通常表現と、前記特殊表現の表現方法と、が関連付けられた正規化ルールに基づいて、前記入力テキストを正規化した一以上の正規化テキストを生成する正規化部と、
それぞれの前記正規化テキストを言語解析し、前記言語解析の結果に基づいて一の正規化テキストを選択する選択部と、
前記選択部により選択された前記正規化テキストの読みを表す音声パラメタの系列を生成する生成部と、
前記入力テキストの特殊表現に対応する正規化テキストの音声パラメタを、前記特殊表現の正規化ルールに応じた複数の音声パラメタの変形方法に基づいて変形する変形部と、
変形された前記音声パラメタを含む前記音声パラメタの系列を使用して合成した音声を出力する出力部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014056667A JP6289950B2 (ja) | 2014-03-19 | 2014-03-19 | 読み上げ装置、読み上げ方法及びプログラム |
US14/644,389 US9570067B2 (en) | 2014-03-19 | 2015-03-11 | Text-to-speech system, text-to-speech method, and computer program product for synthesis modification based upon peculiar expressions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014056667A JP6289950B2 (ja) | 2014-03-19 | 2014-03-19 | 読み上げ装置、読み上げ方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015179198A JP2015179198A (ja) | 2015-10-08 |
JP6289950B2 true JP6289950B2 (ja) | 2018-03-07 |
Family
ID=54142706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014056667A Active JP6289950B2 (ja) | 2014-03-19 | 2014-03-19 | 読み上げ装置、読み上げ方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9570067B2 (ja) |
JP (1) | JP6289950B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2632424C2 (ru) * | 2015-09-29 | 2017-10-04 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер для синтеза речи по тексту |
CN111445384B (zh) * | 2020-03-23 | 2021-07-30 | 杭州小影创新科技股份有限公司 | 一种通用人像照片漫画风格化方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200554A (ja) * | 1993-12-28 | 1995-08-04 | Toshiba Corp | 文章読み上げ装置 |
JPH0836395A (ja) * | 1994-05-20 | 1996-02-06 | Toshiba Corp | 音声データの生成方法及び文書読上装置 |
US6064383A (en) * | 1996-10-04 | 2000-05-16 | Microsoft Corporation | Method and system for selecting an emotional appearance and prosody for a graphical character |
US6032111A (en) * | 1997-06-23 | 2000-02-29 | At&T Corp. | Method and apparatus for compiling context-dependent rewrite rules and input strings |
JP2001337688A (ja) * | 2000-05-26 | 2001-12-07 | Canon Inc | 音声合成装置及び音声合成方法並びに記憶媒体 |
US8856236B2 (en) * | 2002-04-02 | 2014-10-07 | Verizon Patent And Licensing Inc. | Messaging response system |
US20050119890A1 (en) * | 2003-11-28 | 2005-06-02 | Yoshifumi Hirose | Speech synthesis apparatus and speech synthesis method |
JP4260071B2 (ja) * | 2004-06-30 | 2009-04-30 | 日本電信電話株式会社 | 音声合成方法、音声合成プログラム及び音声合成装置 |
JP2006235916A (ja) * | 2005-02-24 | 2006-09-07 | Mitsubishi Electric Corp | テキスト解析装置およびテキスト解析方法ならびに音声合成装置 |
US20060224385A1 (en) * | 2005-04-05 | 2006-10-05 | Esa Seppala | Text-to-speech conversion in electronic device field |
US20070027673A1 (en) * | 2005-07-29 | 2007-02-01 | Marko Moberg | Conversion of number into text and speech |
US20070143410A1 (en) * | 2005-12-16 | 2007-06-21 | International Business Machines Corporation | System and method for defining and translating chat abbreviations |
WO2007117626A2 (en) * | 2006-04-05 | 2007-10-18 | Yap, Inc. | Hosted voice recognition system for wireless devices |
JP2007316916A (ja) * | 2006-05-25 | 2007-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 形態素解析装置、形態素解析方法及び形態素解析プログラム |
JP2007334144A (ja) | 2006-06-16 | 2007-12-27 | Oki Electric Ind Co Ltd | 音声合成方法、音声合成装置及び音声合成プログラム |
WO2008070094A2 (en) * | 2006-12-05 | 2008-06-12 | Nuance Communication, Inc. | Wireless server based text to speech email |
US8886537B2 (en) * | 2007-03-20 | 2014-11-11 | Nuance Communications, Inc. | Method and system for text-to-speech synthesis with personalized voice |
WO2008114453A1 (ja) | 2007-03-20 | 2008-09-25 | Fujitsu Limited | 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム |
US8355919B2 (en) * | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
KR101083540B1 (ko) * | 2009-07-08 | 2011-11-14 | 엔에이치엔(주) | 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법 |
US20110173001A1 (en) * | 2010-01-14 | 2011-07-14 | Cleverspoke, Inc | Sms messaging with voice synthesis and recognition |
WO2011131785A1 (en) * | 2010-04-21 | 2011-10-27 | Université Catholique de Louvain | Normalisation of noisy typewritten texts |
US8688435B2 (en) * | 2010-09-22 | 2014-04-01 | Voice On The Go Inc. | Systems and methods for normalizing input media |
JP5106608B2 (ja) | 2010-09-29 | 2012-12-26 | 株式会社東芝 | 読み上げ支援装置、方法、およびプログラム |
US20120143611A1 (en) * | 2010-12-07 | 2012-06-07 | Microsoft Corporation | Trajectory Tiling Approach for Text-to-Speech |
US8781836B2 (en) * | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
JP5665780B2 (ja) * | 2012-02-21 | 2015-02-04 | 株式会社東芝 | 音声合成装置、方法およびプログラム |
US9159314B2 (en) * | 2013-01-14 | 2015-10-13 | Amazon Technologies, Inc. | Distributed speech unit inventory for TTS systems |
US9311913B2 (en) * | 2013-02-05 | 2016-04-12 | Nuance Communications, Inc. | Accuracy of text-to-speech synthesis |
-
2014
- 2014-03-19 JP JP2014056667A patent/JP6289950B2/ja active Active
-
2015
- 2015-03-11 US US14/644,389 patent/US9570067B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015179198A (ja) | 2015-10-08 |
US20150269927A1 (en) | 2015-09-24 |
US9570067B2 (en) | 2017-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
US9916825B2 (en) | Method and system for text-to-speech synthesis | |
US20100042410A1 (en) | Training And Applying Prosody Models | |
EP3151239A1 (en) | Method and system for text-to-speech synthesis | |
JP7228998B2 (ja) | 音声合成装置及びプログラム | |
CN110197655B (zh) | 用于合成语音的方法和装置 | |
US20130080160A1 (en) | Document reading-out support apparatus and method | |
KR101160193B1 (ko) | 감성적 음성합성 장치 및 그 방법 | |
JP2009139677A (ja) | 音声処理装置及びそのプログラム | |
CN113409761B (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
CN112185341A (zh) | 基于语音合成的配音方法、装置、设备和存储介质 | |
CN113192484A (zh) | 基于文本生成音频的方法、设备和存储介质 | |
JP2007264284A (ja) | 感情付加装置、感情付加方法及び感情付加プログラム | |
Janokar et al. | Text-to-speech and speech-to-text converter—voice assistant | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
CN106471569B (zh) | 语音合成设备、语音合成方法及其存储介质 | |
US20220189455A1 (en) | Method and system for synthesizing cross-lingual speech | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
KR100806287B1 (ko) | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 | |
Ghimire et al. | Enhancing the quality of nepali text-to-speech systems | |
JP2006139162A (ja) | 語学学習装置 | |
JP2007086309A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
Narvani et al. | Text-to-Speech Conversion Using Concatenative Approach for Gujarati Language | |
Amadeus et al. | Phonetically rich corpus construction for a low-resourced language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20151102 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171024 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180207 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6289950 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |