JP7572388B2 - データ処理装置、データ処理方法及びプログラム - Google Patents
データ処理装置、データ処理方法及びプログラム Download PDFInfo
- Publication number
- JP7572388B2 JP7572388B2 JP2022024675A JP2022024675A JP7572388B2 JP 7572388 B2 JP7572388 B2 JP 7572388B2 JP 2022024675 A JP2022024675 A JP 2022024675A JP 2022024675 A JP2022024675 A JP 2022024675A JP 7572388 B2 JP7572388 B2 JP 7572388B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- reading
- data
- pitch
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 64
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000003384 imaging method Methods 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 9
- 238000010191 image analysis Methods 0.000 claims description 7
- 239000011295 pitch Substances 0.000 description 65
- 238000010586 diagram Methods 0.000 description 13
- 230000004044 response Effects 0.000 description 6
- 230000008451 emotion Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 206010041349 Somnolence Diseases 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 241000556720 Manga Species 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000001914 calming effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
図1は、実施の形態にかかるデータ処理システムSの概要を説明する図である。データ処理システムSは、コンテンツの朗読をユーザが聴取するためのシステムである。データ処理システムSは、データ処理装置1と、情報端末2と、を有する。
図2は、データ処理装置1の構成を示すブロック図である。データ処理装置1は、通信部11、記憶部12及び制御部13を有する。記憶部12は、朗読情報記憶部121、発声情報記憶部122、方言情報記憶部123及び反応情報記憶部124を有する。制御部13は、操作受付部131、生成部132、出力制御部133、撮像データ取得部134、判定部135、音声情報取得部136及び音声認識部137を有する。
朗読情報記憶部121は、朗読情報と関連付けて朗読情報のメタデータを記憶している。図4は、朗読情報に関連付けられたメタデータのデータ構造の一例を示す図である。朗読情報のメタデータは、朗読情報を識別する「朗読情報ID」、朗読されるコンテンツを識別する「コンテンツ」、当該コンテンツを朗読した第2話者を識別する「話者ID」情報、朗読情報が適する状況を示す「特徴」がメタデータとして関連付けられている。「特徴」は、例えば「明るい」、「眠たくなる」、「落ち着く」、「盛り上がる」等のそれぞれの朗読が適する状況を示す情報が含まれている。
操作受付部131は、情報端末2からユーザの操作に対応する操作情報を受け付ける。一例として、操作受付部131は、ユーザが選択したコンテンツを含む再生指示を受け付ける。
朗読を読み上げる音色を発声情報に基づいて変化させる例について説明したが、朗読の内容に変化をつけることで、ユーザをより楽しませることができる。そこで、データ処理装置1は、朗読情報の一部を方言に置き換えて朗読させてもよいし、朗読の途中にフレーズを挿入するよう構成されてもよい。
[ユーザの状況に応じた制御]
ユーザの反応に基づいて出力を制御する例について説明したが、データ処理装置1がユーザの発話内容に対応する応答をするよう制御するよう構成されてもよい。
図8は、データ処理装置1における処理の流れを示すフローチャートである。図8に示すフローチャートは、朗読情報の選択を受け付ける準備ができた時点から開始している。操作受付部131は、第2話者と朗読対象のコンテンツとの選択を情報端末2から受け付ける(S101)。生成部132は、選択されたコンテンツに対応する朗読情報を朗読情報記憶部121から取得する(S102)。生成部132は、選択された第2話者に対応する発声情報を発声情報記憶部122から取得する(S103)。
2 情報端末
11 通信部
12 記憶部
13 制御部
121 朗読情報記憶部
122 発声情報記憶部
123 方言情報記憶部
124 反応情報記憶部
131 操作受付部
132 生成部
133 出力制御部
134 撮像データ取得部
135 判定部
136 音声情報取得部
137 音声認識部
Claims (12)
- 文字列から構成されるコンテンツを朗読する第1話者の音声の特徴量を示す時系列データである朗読情報であって、コンテンツの再生時間における時刻と、該時刻において発声される文字と、音量と、音高と、を関連づけた朗読情報を記憶する朗読情報記憶部と、
第2話者が発声した音声をサンプリングして生成された発声情報であって、複数の文字と、複数の文字それぞれを発音する際に発声された声の音色と、を関連づけて記憶した発声情報を記憶する発声情報記憶部と、
前記朗読情報の前記時刻それぞれにおける前記文字に前記発声情報において対応する前記音色と該時刻における前記音量と前記音高とからなる音として出力させる読上データを生成する生成部と、
前記読上データを出力するよう制御する出力制御部と、
を有する、データ処理装置。 - 前記朗読情報記憶部は、前記コンテンツにおいて基準となる音高を示す第1基準音高データをさらに関連付けた前記朗読情報を記憶し、
前記発声情報記憶部は前記第2話者の基準となる音高を示す第2基準音高データをさらに記憶し、
前記生成部は、前記朗読情報の前記時刻それぞれにおける前記文字に前記発声情報において対応する前記音色を、該時刻における音高と、第1基準音高データと第2基準音高データとの比に基づいて決定した音高で出力させる前記読上データを生成する、
請求項1に記載のデータ処理装置。 - 複数の単語と、前記複数の単語それぞれが対応する方言と、前記方言を構成する1以上の文字と、前記方言を構成する文字を発音するための音高と、を関連付けた方言情報を記憶する方言情報記憶部をさらに有し、
前記朗読情報記憶部は、前記朗読情報を構成する単語と、前記単語を構成する1以上の前記文字と、をさらに関連付けた前記朗読情報を記憶し、
前記生成部は、前記朗読情報に含まれる前記1以上の文字と前記1以上の文字に対応する音高とを、前記1以上の文字それぞれが構成する前記単語に前記方言情報において対応する前記方言に含まれる文字と前記方言に含まれる文字を発音するための音高とで置換した置換朗読情報をさらに生成し、生成した置換朗読情報の前記時刻それぞれにおける置換後の文字に前記発声情報において対応する前記音色と該時刻における前記音量と置換後の音高とからなる音として出力させる前記読上データを生成する、
請求項1又は2に記載のデータ処理装置。 - 前記朗読情報記憶部は、前記時刻と、フレーズを挿入するタイミングを示すフラグを関連付けた前記朗読情報を記憶し、
前記生成部は、前記フラグが示すタイミングに複数の所定のフレーズから選択したフレーズを出力させる前記読上データを生成させる、
請求項1から3のいずれか1項に記載のデータ処理装置。 - 前記発声情報記憶部は、前記第2話者に対応する画像データをさらに記憶し、
前記出力制御部は、前記読上データを出力するよう制御している場合に前記第2話者に対応する画像を表示部に表示させるよう制御する、
請求項1から4のいずれか1項に記載のデータ処理装置。 - ユーザを撮像した撮像データを取得する撮像データ取得部と、
前記撮像データ取得部から取得した前記撮像データを画像解析することで前記ユーザの状態を判定する判定部と、をさらに有し、
前記出力制御部は、前記判定部が前記ユーザの状態を前記ユーザが眠っていると判定した場合に、前記読上データの出力を停止し、又は前記読上データの出力態様を変更する、
請求項1から5のいずれか1項に記載のデータ処理装置。 - ユーザを撮像した撮像データを取得する撮像データ取得部と、
前記撮像データ取得部から取得した前記撮像データを画像解析することで前記ユーザの状態を判定し、判定した前記ユーザの状態を情報端末に通知する判定部と、
をさらに有する、請求項1から5のいずれか1項に記載のデータ処理装置。 - 前記朗読情報記憶部は、前記コンテンツを複数の異なる第1話者それぞれが朗読した複数の前記朗読情報それぞれと、前記朗読情報それぞれが適する状況とを関連付けて記憶し、
前記判定部は、前記ユーザの属性及び前記ユーザの状態の少なくともいずれかに基づいて前記ユーザの状況を判定し、
前記生成部は、前記判定部が判定した前記ユーザの状況に関連付けられた前記朗読情報を選択し、選択した前記朗読情報の前記時刻それぞれにおける前記文字に前記発声情報において対応する前記音色と該時刻における前記音量と前記音高とからなる音として出力させる前記読上データを生成する、
請求項6又は7に記載のデータ処理装置。 - 前記朗読情報記憶部は、前記朗読情報において朗読の対象となる前記コンテンツに含まれる言葉と前記言葉が示す意味とを対応付けた辞書情報を前記朗読情報と関連付けてさらに記憶し、
前記データ処理装置は、コンテンツを視聴するユーザが発話した音声情報を取得する音声情報取得部と、
前記音声情報取得部が取得した音声情報を音声認識し、前記ユーザの発話内容を取得する音声認識部と、を有し、
前記生成部は、前記音声認識部が取得した前記ユーザの発話内容が前記コンテンツに対する質問である場合に、前記辞書情報を参照し、前記質問に対する回答を示す回答情報を生成し、
前記出力制御部は、前記回答情報を出力するよう制御する、
請求項1から5のいずれか1項に記載のデータ処理装置。 - 反応情報記憶部をさらに有し、
前記音声認識部は、前記ユーザの発話内容と、前記発話内容を前記ユーザが発話したタイミングに対応する、前記時刻と、を関連付けた反応情報を前記反応情報記憶部に記憶させる、請求項9に記載のデータ処理装置。 - コンピュータが実行する、朗読情報記憶部に記憶された文字列から構成されるコンテンツを朗読する第1話者の音声の特徴量を示す時系列データである朗読情報であって、コンテンツの再生時間における時刻と、該時刻において発声される文字と、音量と、音高と、を関連づけた朗読情報を取得するステップと、
発声情報記憶部に記憶された第2話者が発声した音声をサンプリングして生成された発声情報であって、複数の文字と、複数の文字それぞれを発音する際に発声された声の音色と、を関連づけて記憶した発声情報取得するステップと、
前記朗読情報の前記時刻それぞれにおける前記文字に前記発声情報において対応する前記音色と該時刻における前記音量と前記音高とからなる音として出力させる読上データを生成するステップと、
前記読上データを出力するよう制御するステップと、
を有するデータ処理方法。 - コンピュータに、朗読情報記憶部に記憶された文字列から構成されるコンテンツを朗読する第1話者の音声の特徴量を示す時系列データである朗読情報であって、コンテンツの再生時間における時刻と、該時刻において発声される文字と、音量と、音高と、を関連づけた朗読情報を取得するステップと、
発声情報記憶部に記憶された第2話者が発声した音声をサンプリングして生成された発声情報であって、複数の文字と、複数の文字それぞれを発音する際に発声された声の音色と、を関連づけて記憶した発声情報取得するステップと、
前記朗読情報の前記時刻それぞれにおける前記文字に前記発声情報において対応する前記音色と該時刻における前記音量と前記音高とからなる音として出力させる読上データを生成するステップと、
前記読上データを出力するよう制御するステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022024675A JP7572388B2 (ja) | 2022-02-21 | 2022-02-21 | データ処理装置、データ処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022024675A JP7572388B2 (ja) | 2022-02-21 | 2022-02-21 | データ処理装置、データ処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023121372A JP2023121372A (ja) | 2023-08-31 |
JP7572388B2 true JP7572388B2 (ja) | 2024-10-23 |
Family
ID=87798239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022024675A Active JP7572388B2 (ja) | 2022-02-21 | 2022-02-21 | データ処理装置、データ処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7572388B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282281A (ja) | 2000-03-28 | 2001-10-12 | Toshiba Corp | 記憶媒体、配信方法及び音声出力装置 |
JP2002258885A (ja) | 2001-02-27 | 2002-09-11 | Sharp Corp | テキスト音声合成装置およびプログラム記録媒体 |
JP2005249880A (ja) | 2004-03-01 | 2005-09-15 | Xing Inc | 携帯式通信端末によるディジタル絵本システム |
JP2005321706A (ja) | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | 電子書籍の再生方法及びその装置 |
JP2011028130A (ja) | 2009-07-28 | 2011-02-10 | Panasonic Electric Works Co Ltd | 音声合成装置 |
JP2011203859A (ja) | 2010-03-24 | 2011-10-13 | Fujitsu Frontech Ltd | 音声出力装置、および音声出力方法 |
JP2014178512A (ja) | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音声合成装置 |
JP2021068490A (ja) | 2019-10-25 | 2021-04-30 | 東京瓦斯株式会社 | 音声再生システムおよびプログラム |
-
2022
- 2022-02-21 JP JP2022024675A patent/JP7572388B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282281A (ja) | 2000-03-28 | 2001-10-12 | Toshiba Corp | 記憶媒体、配信方法及び音声出力装置 |
JP2002258885A (ja) | 2001-02-27 | 2002-09-11 | Sharp Corp | テキスト音声合成装置およびプログラム記録媒体 |
JP2005249880A (ja) | 2004-03-01 | 2005-09-15 | Xing Inc | 携帯式通信端末によるディジタル絵本システム |
JP2005321706A (ja) | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | 電子書籍の再生方法及びその装置 |
JP2011028130A (ja) | 2009-07-28 | 2011-02-10 | Panasonic Electric Works Co Ltd | 音声合成装置 |
JP2011203859A (ja) | 2010-03-24 | 2011-10-13 | Fujitsu Frontech Ltd | 音声出力装置、および音声出力方法 |
JP2014178512A (ja) | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音声合成装置 |
JP2021068490A (ja) | 2019-10-25 | 2021-04-30 | 東京瓦斯株式会社 | 音声再生システムおよびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023121372A (ja) | 2023-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gratier et al. | Imitation and repetition of prosodic contour in vocal interaction at 3 months. | |
JP4363590B2 (ja) | 音声合成 | |
US6847931B2 (en) | Expressive parsing in computerized conversion of text to speech | |
WO2017006766A1 (ja) | 音声対話方法および音声対話装置 | |
US20100298959A1 (en) | Speech reproducing method, speech reproducing device, and computer program | |
Hall et al. | Fundamental frequency, jitter, and shimmer in preschoolers who stutter | |
WO2023276539A1 (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
CN108986785B (zh) | 一种文本改编方法及装置 | |
JP4884212B2 (ja) | 音声合成装置 | |
JP2013072903A (ja) | 合成辞書作成装置および合成辞書作成方法 | |
Kato et al. | Modeling of Rakugo speech and its limitations: Toward speech synthesis that entertains audiences | |
JPH11109991A (ja) | マンマシンインターフェースシステム | |
JP2003241644A (ja) | 外国語会話学習法及び外国語会話学習装置 | |
CN116312471A (zh) | 语音迁移、语音交互方法、装置、电子设备及存储介质 | |
JP7572388B2 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2005321706A (ja) | 電子書籍の再生方法及びその装置 | |
JP2015102773A (ja) | 音声発生装置、音声変形装置及び方法 | |
JP2005215888A (ja) | テキスト文の表示装置 | |
Aaron et al. | Conversational computers | |
CN109036373A (zh) | 一种语音处理方法及电子设备 | |
JP3578961B2 (ja) | 音声合成方法及び装置 | |
Prögler | Choices in editing oral history: The distillation of Dr. Hiller | |
JPH10268753A (ja) | 中国語学習プログラムを記録したコンピュータ読取り可能な記録媒体及び中国語学習装置 | |
Yarrington et al. | A system for creating personalized synthetic voices | |
US12230244B1 (en) | Graphical user interface for customized storytelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231016 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7572388 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |