JP2012198277A - 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム - Google Patents
文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム Download PDFInfo
- Publication number
- JP2012198277A JP2012198277A JP2011060702A JP2011060702A JP2012198277A JP 2012198277 A JP2012198277 A JP 2012198277A JP 2011060702 A JP2011060702 A JP 2011060702A JP 2011060702 A JP2011060702 A JP 2011060702A JP 2012198277 A JP2012198277 A JP 2012198277A
- Authority
- JP
- Japan
- Prior art keywords
- document
- feature information
- sentence
- utterance style
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 25
- 238000003786 synthesis reaction Methods 0.000 claims description 25
- 230000008451 emotion Effects 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 abstract 4
- 239000013598 vector Substances 0.000 description 56
- 230000014509 gene expression Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 244000205754 Colocasia esculenta Species 0.000 description 5
- 235000006481 Colocasia esculenta Nutrition 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
複数の文から抽出した情報を利用して発話スタイルを推定する文書読み上げ支援装置を提供することである。
【解決手段】
実施形態の文書読み上げ支援装置は、学習用の文書から抽出された複数文の素性情報と発話スタイルの対応付けを学習したモデルを格納するモデル格納手段と、読み上げ対象となる文書を取得する文書取得手段と、前記文書取得手段で取得された文書の各文から素性情報を抽出する素性情報抽出手段と、前記素性情報抽出手段で抽出された複数文の素性情報と前記モデル格納手段に格納されたモデルとを照合して、前記各文の発話スタイルを推定する発話スタイル推定手段とを備える。
【選択図】図1
Description
第1の実施形態の文書読み上げ支援装置は、複数の文から抽出した情報を利用して各文を音声波形に変換する際の発話スタイルを推定する。まず、文書読み上げ支援装置は、各文のテキスト表記から素性(そせい)情報を抽出する。素性情報は、文に対して形態素解析や係り受け解析を適用して抽出した品詞や係り受け等の文法情報を表している。次に、文書読み上げ支援装置は、読み上げ対象となる文およびその前後に隣接する文から抽出した素性情報を利用して、感情、口調、性別、年齢などの発話スタイルを推定する。発話スタイルの推定には、予め学習したモデル(発話スタイル推定モデル)と複数文の素性情報との照合結果を用いる。最後に、文書読み上げ支援装置は、当該発話スタイルに適合する音声合成のパラメータ(例えば、音声キャラクタ、音量、話速、ピッチなど)を選択して音声合成器に出力する。
図1は、第1の実施形態にかかる文書読み上げ支援装置を示すブロック図である。本実施形態の文書読み上げ支援装置は、予め学習した発話スタイル推定モデルを格納するHDD(Hard Disk Drive)等のモデル格納部105と、文書を取得する文書取得部101と、前記文書取得部101で取得された文書の各文から素性情報を抽出する素性情報抽出部102と、読み上げ対象となる文およびその前後に隣接する複数の文から抽出した素性情報とモデル格納部105に格納された発話スタイル推定モデルとを照合して、前記各文を音声波形に変換する際の発話スタイルを推定する発話スタイル推定部103と、前記発話スタイル推定部103で選択された発話スタイルに適合する音声合成のパラメータ選択する合成パラメータ選択部104とを備える。
図2は、本実施形態にかかる文書読み上げ支援装置のフローチャートである。
図3のフローチャートを参照して、文書の各文から素性情報を抽出するステップS22の詳細を説明する。なお、ここでの説明は、ステップS21においてプレーンテキスト形式の文書が入力されたものとして行う。
図5のフローチャートを参照して、複数文の素性情報から発話スタイルを推定するステップS23の詳細を説明する。
図10のフローチャートを参照して、推定された発話スタイルに適合した音声合成のパラメータを選択するステップS24の詳細を説明する。
最後に、図2のステップS25では、端末上の音声合成器あるいはweb経由でアクセスできるSaaS型の音声合成器に、音声キャラクタと各読み上げ対象文を対応付けて出力する。図12(b)の例の場合、ID1、ID3、ID4、ID6の文には音声キャラクタ「Taro」が、ID2、ID5、ID7の文には音声キャラクタ「Hana」が対応付けられており、音声合成器は、それぞれの文に応じた音声キャラクタを用いてこれらのテキストを音声波形に変換する。
このように、本実施形態にかかる文書読み上げ支援装置は、文書に含まれる複数の文から抽出した素性情報を利用して、読み上げ対象となる文の発話スタイルを推定している。これにより、文脈を考慮した発話スタイルを推定することができる。
以上の実施形態では、音声合成のパラメータとして音声合成のキャラクタを選択したが、音量、話速、ピッチなどを音声合成のパラメータとして選択することもできる。図14に、図8の発話スタイルに対して選択した音声合成のパラメータを示す。この例では、予め準備した所定のヒューリスティックを用いて音声合成のパラメータを付与している。例えば、音声キャラクタについては、発話スタイルの性別が「男」の文には「Taro」を、「女」の文には「Hana」を、その他の文には「Jane」を一律に付与することをルールとして持つことができる。また、音量については、感情が「恥」の文は「小さく」、「怒」の文は「大きく」、それ他の文は「ノーマル」のように選択することができる。この他にも、感情が「恥」の文は、話速を「速く」かつピッチを「高く」のような選択をすることができる。音声合成器は、これら選択された音声合成のパラメータを利用して各文を音声波形に変換する。
文書取得部101が取得した文書がXMLやHTMLである場合は、各文に対応付けられている要素名(タグ名)や属性名、属性値など、文書の論理要素に関する書式情報を素性情報の一つとして抽出することができる。例えば、同じ「はじめに」という文字列でも、「<title>はじめに</titile>」「<div class=”h1”>はじめに</div>」などの大見出し、「<h2>はじめに</h2>」「<li>はじめに</li>」などの見出し・箇条書きリスト、「<backquote>はじめに</backquote>」などの引用タグ、<section_body>などの節構造の本文に相当する場合がある。このように、書式情報を素性情報として抽出することにより、各文の状況に応じた発話スタイルを推定することができる。
以上の実施形態では、発話スタイル推定モデルをNeuralNetworkやSVM、CRFなどで学習したが、学習方法はこれに限られない。例えば、素性情報の「文タイプ」が「地の文」である場合の「感情」は「平(感情なし)」、のようなヒューリスティックを学習用の文書から決定してもよい。
102 素性情報抽出部
103 発話スタイル推定部
104 合成パラメータ選択部
105 モデル格納部
601 副詞の蓄積データ
1201 プルダウンメニュー
1305 第1のベクトル
1306 第2のベクトル
Claims (9)
- 学習用の文書から抽出された複数文の素性情報と発話スタイルの対応付けを学習したモデルを格納するモデル格納手段と、
読み上げ対象となる文書を取得する文書取得手段と、
前記文書取得手段で取得された文書の各文から素性情報を抽出する素性情報抽出手段と、
前記素性情報抽出手段で抽出された複数文の素性情報と前記モデル格納手段に格納されたモデルとを照合して、前記各文の発話スタイルを推定する発話スタイル推定手段と、
を備える文書読み上げ支援装置。 - 前記モデル格納手段に格納されたモデルを学習する際に使用した前記複数文の素性情報が、発話スタイルが対応付けられた学習対象の文から抽出された素性情報を含み、
前記発話スタイル推定手段における前記複数文の素性情報が、発話スタイルの推定対象となる文から抽出された素性情報を含む請求項1記載の文書読み上げ支援装置。 - 前記モデル格納手段に格納されたモデルを学習する際に使用した前記複数文の素性情報が、発話スタイルが対応付けられた学習対象の文および当該文の前後に隣接する文から抽出された素性情報であり、
前記発話スタイル推定手段における前記複数文の素性情報が、発話スタイルの推定対象となる文および当該文の前後に隣接する文から抽出された素性情報である請求項1記載の文書読み上げ支援装置。 - 前記素性情報が、前記文書から抽出した書式情報を含む請求項1から請求項3の何れか1項に記載の文書読み上げ支援装置。
- 前記発話スタイルが、性別、年齢、口調、感情のうちの少なくとも1つまたはその組み合わせである請求項1から請求項4の何れか1項に記載の文書読み上げ支援装置。
- 前記発話スタイル推定手段で推定された発話スタイルに適合する音声合成のパラメータを選択する合成パラメータ選択手段を更に備える請求項1から請求項5の何れか1項に記載の文書読み上げ支援装置。
- 前記合成パラメータ選択手段で選択される合成パラメータが、音声キャラクタ、音量、話速、ピッチのうちの少なくとも1つまたはその組み合わせである請求項6記載の文書読み上げ支援装置。
- 読み上げ対象となる文書を取得する文書取得工程と、
前記文書取得工程で取得した文書の各文から素性情報を抽出する素性情報抽出工程と、
前記素性情報抽出工程で抽出した複数文の素性情報と、学習用の文書から抽出した複数文の素性情報と発話スタイルの対応付けを学習したモデルとを照合して、前記各文の発話スタイルを推定する発話スタイル推定工程と、
を備える文書読み上げ支援方法。 - 文書読み上げ支援装置に、
読み上げ対象となる文書を取得する文書取得工程と、
前記文書取得工程で取得した文書の各文から素性情報を抽出する素性情報抽出工程と、
前記素性情報抽出工程で抽出した複数文の素性情報と、学習用の文書から抽出した複数文の素性情報と発話スタイルの対応付けを学習したモデルとを照合して、前記各文の発話スタイルを推定する発話スタイル推定工程と、
を実現させるための文書読み上げ支援プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011060702A JP2012198277A (ja) | 2011-03-18 | 2011-03-18 | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
US13/232,478 US9280967B2 (en) | 2011-03-18 | 2011-09-14 | Apparatus and method for estimating utterance style of each sentence in documents, and non-transitory computer readable medium thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011060702A JP2012198277A (ja) | 2011-03-18 | 2011-03-18 | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015134708A Division JP2015215626A (ja) | 2015-07-03 | 2015-07-03 | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012198277A true JP2012198277A (ja) | 2012-10-18 |
Family
ID=46829175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011060702A Pending JP2012198277A (ja) | 2011-03-18 | 2011-03-18 | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9280967B2 (ja) |
JP (1) | JP2012198277A (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197072A (ja) * | 2013-03-29 | 2014-10-16 | ブラザー工業株式会社 | 音声合成システム、及び音声合成方法 |
CN105531757A (zh) * | 2013-09-20 | 2016-04-27 | 株式会社东芝 | 语音选择辅助装置、语音选择方法以及程序 |
JP2016142936A (ja) * | 2015-02-03 | 2016-08-08 | 株式会社日立超エル・エス・アイ・システムズ | 音声合成用データ作成方法、及び音声合成用データ作成装置 |
JP2017122928A (ja) * | 2017-03-09 | 2017-07-13 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
JP2018004977A (ja) * | 2016-07-04 | 2018-01-11 | 日本電信電話株式会社 | 音声合成方法、システム及びプログラム |
US9928828B2 (en) | 2013-10-10 | 2018-03-27 | Kabushiki Kaisha Toshiba | Transliteration work support device, transliteration work support method, and computer program product |
US10089975B2 (en) | 2014-04-23 | 2018-10-02 | Kabushiki Kaisha Toshiba | Transliteration work support device, transliteration work support method, and computer program product |
US10255904B2 (en) | 2016-03-14 | 2019-04-09 | Kabushiki Kaisha Toshiba | Reading-aloud information editing device, reading-aloud information editing method, and computer program product |
JP2019511036A (ja) * | 2016-02-09 | 2019-04-18 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 複数レイヤの単語表現にわたる言語特徴生成のためのシステム及び方法 |
JP2020536265A (ja) * | 2017-10-03 | 2020-12-10 | グーグル エルエルシー | 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること |
JP2021152957A (ja) * | 2020-10-14 | 2021-09-30 | 北京百度網訊科技有限公司 | 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5820320B2 (ja) | 2012-03-27 | 2015-11-24 | 株式会社東芝 | 情報処理端末及び方法、並びに、情報管理装置及び方法 |
US9570066B2 (en) * | 2012-07-16 | 2017-02-14 | General Motors Llc | Sender-responsive text-to-speech processing |
JP2014240884A (ja) | 2013-06-11 | 2014-12-25 | 株式会社東芝 | コンテンツ作成支援装置、方法およびプログラム |
JP6251145B2 (ja) * | 2014-09-18 | 2017-12-20 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
CN109074353B (zh) * | 2016-10-10 | 2022-11-08 | 微软技术许可有限责任公司 | 用于信息检索的方法、装置和系统 |
CN108304436B (zh) | 2017-09-12 | 2019-11-05 | 深圳市腾讯计算机系统有限公司 | 风格语句的生成方法、模型的训练方法、装置及设备 |
US10565994B2 (en) * | 2017-11-30 | 2020-02-18 | General Electric Company | Intelligent human-machine conversation framework with speech-to-text and text-to-speech |
CN110634466B (zh) | 2018-05-31 | 2024-03-15 | 微软技术许可有限责任公司 | 具有高感染力的tts处理技术 |
KR20200027331A (ko) * | 2018-09-04 | 2020-03-12 | 엘지전자 주식회사 | 음성 합성 장치 |
CN112750423B (zh) * | 2019-10-29 | 2023-11-17 | 阿里巴巴集团控股有限公司 | 个性化语音合成模型构建方法、装置、系统及电子设备 |
US11521594B2 (en) | 2020-11-10 | 2022-12-06 | Electronic Arts Inc. | Automated pipeline selection for synthesis of audio assets |
CN112951200B (zh) * | 2021-01-28 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 语音合成模型的训练方法、装置、计算机设备及存储介质 |
CN113378583B (zh) * | 2021-07-15 | 2024-11-26 | 北京小米移动软件有限公司 | 对话回复方法及装置、对话模型训练方法及装置、存储介质 |
US12230243B2 (en) * | 2021-12-30 | 2025-02-18 | Microsoft Technology Licensing, Llc | Using token level context to generate SSML tags |
US12198676B2 (en) | 2022-03-31 | 2025-01-14 | Microsoft Technology Licensing, Llc | Assigning SSML tags to an audio corpus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188553A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 音声合成装置および方法、並びに記録媒体 |
JP2007264284A (ja) * | 2006-03-28 | 2007-10-11 | Brother Ind Ltd | 感情付加装置、感情付加方法及び感情付加プログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5860064A (en) * | 1993-05-13 | 1999-01-12 | Apple Computer, Inc. | Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system |
JPH08248971A (ja) | 1995-03-09 | 1996-09-27 | Hitachi Ltd | テキスト朗読読み上げ装置 |
US5887120A (en) * | 1995-05-31 | 1999-03-23 | Oracle Corporation | Method and apparatus for determining theme for discourse |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US7251601B2 (en) * | 2001-03-26 | 2007-07-31 | Kabushiki Kaisha Toshiba | Speech synthesis method and speech synthesizer |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US20040054534A1 (en) * | 2002-09-13 | 2004-03-18 | Junqua Jean-Claude | Client-server voice customization |
US7421386B2 (en) * | 2003-10-23 | 2008-09-02 | Microsoft Corporation | Full-form lexicon with tagged data and methods of constructing and using the same |
WO2006040908A1 (ja) * | 2004-10-13 | 2006-04-20 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置及び音声合成方法 |
US8326629B2 (en) * | 2005-11-22 | 2012-12-04 | Nuance Communications, Inc. | Dynamically changing voice attributes during speech synthesis based upon parameter differentiation for dialog contexts |
WO2007138944A1 (ja) * | 2006-05-26 | 2007-12-06 | Nec Corporation | 情報付与システム、情報付与方法、情報付与プログラム及び情報付与プログラム記録媒体 |
ATE555433T1 (de) * | 2007-04-26 | 2012-05-15 | Ford Global Tech Llc | Emotives beratungssystem und verfahren |
US7689421B2 (en) * | 2007-06-27 | 2010-03-30 | Microsoft Corporation | Voice persona service for embedding text-to-speech features into software programs |
CN101359473A (zh) * | 2007-07-30 | 2009-02-04 | 国际商业机器公司 | 自动进行语音转换的方法和装置 |
CN101452699A (zh) * | 2007-12-04 | 2009-06-10 | 株式会社东芝 | 韵律自适应及语音合成的方法和装置 |
JP5106155B2 (ja) | 2008-01-29 | 2012-12-26 | 株式会社東芝 | 文書処理装置、方法及びプログラム |
US20090326948A1 (en) * | 2008-06-26 | 2009-12-31 | Piyush Agarwal | Automated Generation of Audiobook with Multiple Voices and Sounds from Text |
US8224652B2 (en) * | 2008-09-26 | 2012-07-17 | Microsoft Corporation | Speech and text driven HMM-based body animation synthesis |
US8401849B2 (en) * | 2008-12-18 | 2013-03-19 | Lessac Technologies, Inc. | Methods employing phase state analysis for use in speech synthesis and recognition |
JP5106608B2 (ja) | 2010-09-29 | 2012-12-26 | 株式会社東芝 | 読み上げ支援装置、方法、およびプログラム |
-
2011
- 2011-03-18 JP JP2011060702A patent/JP2012198277A/ja active Pending
- 2011-09-14 US US13/232,478 patent/US9280967B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188553A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 音声合成装置および方法、並びに記録媒体 |
JP2007264284A (ja) * | 2006-03-28 | 2007-10-11 | Brother Ind Ltd | 感情付加装置、感情付加方法及び感情付加プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6015012193; Changhua Yang, et al.: 'Emotion Classification Using Web Blog Corpora' 2007 IEEE/WIC/ACM International Conference on Web Intelligence , 200711, pp. 275-278, IEEE * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197072A (ja) * | 2013-03-29 | 2014-10-16 | ブラザー工業株式会社 | 音声合成システム、及び音声合成方法 |
CN105531757A (zh) * | 2013-09-20 | 2016-04-27 | 株式会社东芝 | 语音选择辅助装置、语音选择方法以及程序 |
JPWO2015040751A1 (ja) * | 2013-09-20 | 2017-03-02 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
US9812119B2 (en) | 2013-09-20 | 2017-11-07 | Kabushiki Kaisha Toshiba | Voice selection supporting device, voice selection method, and computer-readable recording medium |
US9928828B2 (en) | 2013-10-10 | 2018-03-27 | Kabushiki Kaisha Toshiba | Transliteration work support device, transliteration work support method, and computer program product |
US10089975B2 (en) | 2014-04-23 | 2018-10-02 | Kabushiki Kaisha Toshiba | Transliteration work support device, transliteration work support method, and computer program product |
JP2016142936A (ja) * | 2015-02-03 | 2016-08-08 | 株式会社日立超エル・エス・アイ・システムズ | 音声合成用データ作成方法、及び音声合成用データ作成装置 |
JP2019511036A (ja) * | 2016-02-09 | 2019-04-18 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 複数レイヤの単語表現にわたる言語特徴生成のためのシステム及び方法 |
US10255904B2 (en) | 2016-03-14 | 2019-04-09 | Kabushiki Kaisha Toshiba | Reading-aloud information editing device, reading-aloud information editing method, and computer program product |
JP2018004977A (ja) * | 2016-07-04 | 2018-01-11 | 日本電信電話株式会社 | 音声合成方法、システム及びプログラム |
JP2017122928A (ja) * | 2017-03-09 | 2017-07-13 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
JP2020536265A (ja) * | 2017-10-03 | 2020-12-10 | グーグル エルエルシー | 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること |
JP7204690B2 (ja) | 2017-10-03 | 2023-01-16 | グーグル エルエルシー | 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること |
JP7524296B2 (ja) | 2017-10-03 | 2024-07-29 | グーグル エルエルシー | 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること |
JP2021152957A (ja) * | 2020-10-14 | 2021-09-30 | 北京百度網訊科技有限公司 | 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム |
KR20210122204A (ko) * | 2020-10-14 | 2021-10-08 | 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 | 대화 감정 스타일의 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 제품 |
JP7246437B2 (ja) | 2020-10-14 | 2023-03-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム |
KR102564689B1 (ko) * | 2020-10-14 | 2023-08-08 | 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 | 대화 감정 스타일의 예측 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 제품 |
Also Published As
Publication number | Publication date |
---|---|
US9280967B2 (en) | 2016-03-08 |
US20120239390A1 (en) | 2012-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012198277A (ja) | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム | |
US10475438B1 (en) | Contextual text-to-speech processing | |
JP2015215626A (ja) | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム | |
US9330657B2 (en) | Text-to-speech for digital literature | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
CN102549652B (zh) | 信息检索装置 | |
EP3616190A1 (en) | Automatic song generation | |
JP2009037633A (ja) | 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定 | |
WO2018200268A1 (en) | Automatic song generation | |
CN109326280B (zh) | 一种歌唱合成方法及装置、电子设备 | |
JPWO2009101837A1 (ja) | 記号挿入装置および記号挿入方法 | |
CN109949799B (zh) | 一种语义解析方法及系统 | |
CN104750677A (zh) | 语音传译装置、语音传译方法及语音传译程序 | |
Dethlefs et al. | Conditional random fields for responsive surface realisation using global features | |
JP2009223463A (ja) | 同義性判定装置、その方法、プログラム及び記録媒体 | |
CN109492126B (zh) | 一种智能交互方法及装置 | |
JP2021131514A (ja) | データ生成装置、データ生成方法およびプログラム | |
CN111611793B (zh) | 数据处理方法、装置、设备及存储介质 | |
KR20240034566A (ko) | 대화 데이터 증강 장치 및 대화 데이터 증강 방법 | |
JP5245737B2 (ja) | 音声読み上げ文生成装置、音声読み上げ文生成方法および音声読み上げ文生成プログラム | |
CN113658570B (zh) | 歌曲处理方法、装置、计算机设备、存储介质及程序产品 | |
JP2016048463A (ja) | 次発話候補ランキング装置、方法、及びプログラム | |
CN112905835B (zh) | 一种多模态乐曲标题生成方法、装置及存储介质 | |
JP6574469B2 (ja) | 次発話候補ランキング装置、方法、及びプログラム | |
JP5833166B2 (ja) | オブジェクト生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140822 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150216 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150218 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150403 |