KR101160193B1 - 감성적 음성합성 장치 및 그 방법 - Google Patents
감성적 음성합성 장치 및 그 방법 Download PDFInfo
- Publication number
- KR101160193B1 KR101160193B1 KR1020100106317A KR20100106317A KR101160193B1 KR 101160193 B1 KR101160193 B1 KR 101160193B1 KR 1020100106317 A KR1020100106317 A KR 1020100106317A KR 20100106317 A KR20100106317 A KR 20100106317A KR 101160193 B1 KR101160193 B1 KR 101160193B1
- Authority
- KR
- South Korea
- Prior art keywords
- emotional
- word
- voice
- emotion
- similarity
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 감성 단어사전의 예를 나타낸 도면이다.
도 3은 도 1의 감성 추론모듈의 구성의 예를 나타낸 도면이다.
도 4는 도 3의 감성로그 저장부에 의한 감성 로그정보의 예를 나타낸 도면이다.
도 5는 본 발명의 다른 실시예에 따른 감성적 음성합성 장치를 개략적으로 도시한 도면이다.
도 6은 본 발명의 실시예에 이용되는 TTS 시스템의 구성 예를 나타낸 도면이다.
도 7은 음소열-발음열 정렬의 예를 나타낸 도면이다.
도 8은 생성된 규칙 트리의 예를 나타낸 도면이다.
도 9는 운율 경계 추정에 사용된 자질들의 예를 나타낸 도면이다.
도 10은 톤 추정에 사용된 자질들의 예를 나타낸 도면이다.
도 11은 본 발명의 일 실시예에 따른 감성적 음성합성 방법을 나타낸 흐름도이다.
도 12는 본 발명의 다른 실시예에 따른 감성적 음성합성 방법을 나타낸 흐름도이다.
110, 510: 단어사전 저장부
120: 음성 DB 저장부
130, 530: 감성 추론부
140: 음성 출력부
300: 감성 추론모듈
310: 문장 변환부
320: 매칭 확인부
330: 감성 추론부
340: 감성로그 저장부
350: 로그정보 검색부
520: 감성 TOBI 저장부
540: 음성 변환부
Claims (8)
- 감성 단어에 대하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 단어사전 저장부;
상기 감성 단어에 대응하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중의 적어도 하나에 따라 음성을 분류하여 데이터베이스로 저장하되, 상기 데이터베이스는 정렬된 음소열과 발음열을 이용한 특정 규칙을 생성하여 규칙 트리에 저장하고, 상기 규칙 트리를 기반으로 후보 발음열 중 누적 점수가 가장 높은 후보가 선택되도록 하고, 문맥 길에 따른 가중치로 계산된 상기 누적 점수를 포함하는 음성 DB 저장부;
텍스트, 이북(E-Book)을 포함하는 문서의 각 단어, 구문, 문장 중 적어도 하나에 대하여, 단어와 구문을 파악하여 기본형으로 변환하고, 상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하며, 상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 감성 추론부; 및
추론된 상기 감성에 따라 상기 데이터베이스로부터 상기 문서에 대응하는 음성을 선택하여 출력하는 음성 출력부
를 포함하는 것을 특징으로 하는 감성적 음성합성 장치.
- 제 1항에 있어서,
상기 음성 DB 저장부는,
상기 감성 단어에 대응하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중의 적어도 하나에 따라 음성의 운율을 분류하여 데이터베이스로 저장하는 것을 특징으로 하는 감성적 음성합성 장치.
- 삭제
- 삭제
- 감성 단어에 대하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 단계;
상기 감성 단어에 대응하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중의 적어도 하나에 따라 음성을 분류하여 데이터베이스로 저장하되, 하되, 상기 데이터베이스는 정렬된 음소열과 발음열을 이용한 특정 규칙을 생성하여 규칙 트리에 저장하고, 상기 규칙 트리를 기반으로 후보 발음열 중 누적 점수가 가장 높은 후보가 선택되도록 하고, 문맥 길에 따른 가중치로 계산된 상기 누적 점수를 포함하는 단계;
텍스트, 이북(E-Book)을 포함하는 문서의 각 단어, 구문, 문장 중 적어도 하나에 대하여, 단어와 구문을 파악하여 기본형으로 변환하고, 상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하며, 상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 단계; 및
추론된 상기 감성에 따라 상기 데이터베이스로부터 상기 문서에 대응하는 음성을 선택하여 출력하는 단계
를 포함하는 것을 특징으로 하는 감성적 음성합성 방법.
- 제 5항에 있어서,
상기 음성 데이터베이스 저장단계는,
상기 감성 단어에 대응하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중의 적어도 하나에 따라 음성의 운율을 분류하여 데이터베이스로 저장하는 것을 특징으로 하는 감성적 음성합성 방법.
- 삭제
- 삭제
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100106317A KR101160193B1 (ko) | 2010-10-28 | 2010-10-28 | 감성적 음성합성 장치 및 그 방법 |
US13/882,104 US20130211838A1 (en) | 2010-10-28 | 2011-10-28 | Apparatus and method for emotional voice synthesis |
EP11836654.1A EP2634714A4 (en) | 2010-10-28 | 2011-10-28 | DEVICE AND METHOD FOR EMOTIONAL SOUND SYNTHESIS |
PCT/KR2011/008123 WO2012057562A2 (ko) | 2010-10-28 | 2011-10-28 | 감성적 음성합성 장치 및 그 방법 |
JP2013536524A JP2013544375A (ja) | 2010-10-28 | 2011-10-28 | 感性的音声合成装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100106317A KR101160193B1 (ko) | 2010-10-28 | 2010-10-28 | 감성적 음성합성 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120044809A KR20120044809A (ko) | 2012-05-08 |
KR101160193B1 true KR101160193B1 (ko) | 2012-06-26 |
Family
ID=45994589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100106317A KR101160193B1 (ko) | 2010-10-28 | 2010-10-28 | 감성적 음성합성 장치 및 그 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20130211838A1 (ko) |
EP (1) | EP2634714A4 (ko) |
JP (1) | JP2013544375A (ko) |
KR (1) | KR101160193B1 (ko) |
WO (1) | WO2012057562A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020145439A1 (ko) * | 2019-01-11 | 2020-07-16 | 엘지전자 주식회사 | 감정 정보 기반의 음성 합성 방법 및 장치 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101508059B1 (ko) * | 2013-06-26 | 2015-04-07 | 숭실대학교산학협력단 | 단어의 쾌-불쾌 지수 예측 장치 및 방법 |
KR102222122B1 (ko) * | 2014-01-21 | 2021-03-03 | 엘지전자 주식회사 | 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기 |
KR101567789B1 (ko) * | 2014-08-26 | 2015-11-11 | 숭실대학교산학협력단 | 상대적 감정 유사도를 이용한 단어의 쾌-불쾌 지수 예측 장치 및 방법 |
US10803850B2 (en) * | 2014-09-08 | 2020-10-13 | Microsoft Technology Licensing, Llc | Voice generation with predetermined emotion type |
CN107437413B (zh) * | 2017-07-05 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
CN108615524A (zh) * | 2018-05-14 | 2018-10-02 | 平安科技(深圳)有限公司 | 一种语音合成方法、系统及终端设备 |
CN113128534A (zh) * | 2019-12-31 | 2021-07-16 | 北京中关村科金技术有限公司 | 情绪识别的方法、装置以及存储介质 |
US11809958B2 (en) | 2020-06-10 | 2023-11-07 | Capital One Services, Llc | Systems and methods for automatic decision-making with user-configured criteria using multi-channel data inputs |
KR102363469B1 (ko) * | 2020-08-14 | 2022-02-15 | 네오사피엔스 주식회사 | 텍스트에 대한 합성 음성 생성 작업을 수행하는 방법 |
CN113506562B (zh) * | 2021-07-19 | 2022-07-19 | 武汉理工大学 | 基于声学特征与文本情感特征融合的端到端语音合成方法及系统 |
US12142257B2 (en) | 2022-02-08 | 2024-11-12 | Snap Inc. | Emotion-based text to speech |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003219288A (ja) * | 2002-01-18 | 2003-07-31 | Aruze Corp | 放送情報提供システム、放送情報提供方法、放送情報提供装置及び放送情報提供プログラム |
KR20050058949A (ko) * | 2003-12-13 | 2005-06-17 | 엘지전자 주식회사 | 한국어 운율구 추출방법 |
JP2006030383A (ja) * | 2004-07-13 | 2006-02-02 | Sony Corp | テキスト音声合成装置及びテキスト音声合成方法 |
KR20070090745A (ko) * | 2006-03-03 | 2007-09-06 | 인터내셔널 비지네스 머신즈 코포레이션 | 감정 보존 기능을 갖는 음성 및 텍스트 채널을 통한 통신 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100241345B1 (ko) * | 1997-08-04 | 2000-02-01 | 정선종 | 케이티오비아이 데이터베이스 구축을 위한 억양곡선의단순화 방법 |
WO2002027709A2 (en) * | 2000-09-29 | 2002-04-04 | Lernout & Hauspie Speech Products N.V. | Corpus-based prosody translation system |
US7401020B2 (en) * | 2002-11-29 | 2008-07-15 | International Business Machines Corporation | Application of emotion-based intonation and prosody to speech in text-to-speech systems |
GB2427109B (en) * | 2005-05-30 | 2007-08-01 | Kyocera Corp | Audio output apparatus, document reading method, and mobile terminal |
US20080313130A1 (en) * | 2007-06-14 | 2008-12-18 | Northwestern University | Method and System for Retrieving, Selecting, and Presenting Compelling Stories form Online Sources |
US20090326948A1 (en) * | 2008-06-26 | 2009-12-31 | Piyush Agarwal | Automated Generation of Audiobook with Multiple Voices and Sounds from Text |
-
2010
- 2010-10-28 KR KR1020100106317A patent/KR101160193B1/ko active IP Right Grant
-
2011
- 2011-10-28 JP JP2013536524A patent/JP2013544375A/ja active Pending
- 2011-10-28 WO PCT/KR2011/008123 patent/WO2012057562A2/ko active Application Filing
- 2011-10-28 US US13/882,104 patent/US20130211838A1/en not_active Abandoned
- 2011-10-28 EP EP11836654.1A patent/EP2634714A4/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003219288A (ja) * | 2002-01-18 | 2003-07-31 | Aruze Corp | 放送情報提供システム、放送情報提供方法、放送情報提供装置及び放送情報提供プログラム |
KR20050058949A (ko) * | 2003-12-13 | 2005-06-17 | 엘지전자 주식회사 | 한국어 운율구 추출방법 |
JP2006030383A (ja) * | 2004-07-13 | 2006-02-02 | Sony Corp | テキスト音声合成装置及びテキスト音声合成方法 |
KR20070090745A (ko) * | 2006-03-03 | 2007-09-06 | 인터내셔널 비지네스 머신즈 코포레이션 | 감정 보존 기능을 갖는 음성 및 텍스트 채널을 통한 통신 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020145439A1 (ko) * | 2019-01-11 | 2020-07-16 | 엘지전자 주식회사 | 감정 정보 기반의 음성 합성 방법 및 장치 |
US11514886B2 (en) | 2019-01-11 | 2022-11-29 | Lg Electronics Inc. | Emotion classification information-based text-to-speech (TTS) method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
WO2012057562A3 (ko) | 2012-06-21 |
US20130211838A1 (en) | 2013-08-15 |
EP2634714A4 (en) | 2014-09-17 |
EP2634714A2 (en) | 2013-09-04 |
KR20120044809A (ko) | 2012-05-08 |
JP2013544375A (ja) | 2013-12-12 |
WO2012057562A2 (ko) | 2012-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101160193B1 (ko) | 감성적 음성합성 장치 및 그 방법 | |
Cahn | CHATBOT: Architecture, design, & development | |
US11514886B2 (en) | Emotion classification information-based text-to-speech (TTS) method and apparatus | |
CN110211563B (zh) | 面向情景及情感的中文语音合成方法、装置及存储介质 | |
Hopkins et al. | Automatically generating rhythmic verse with neural networks | |
Taylor | Text-to-speech synthesis | |
US20190332680A1 (en) | Multi-lingual virtual personal assistant | |
US10170101B2 (en) | Sensor based text-to-speech emotional conveyance | |
KR101634086B1 (ko) | 감정 분석을 통한 스티커 추천 방법 및 시스템 | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
CN110782870A (zh) | 语音合成方法、装置、电子设备及存储介质 | |
JP2006039120A (ja) | 対話装置および対話方法、並びにプログラムおよび記録媒体 | |
JP6370749B2 (ja) | 発話意図モデル学習装置、発話意図抽出装置、発話意図モデル学習方法、発話意図抽出方法、プログラム | |
CN109949791A (zh) | 基于hmm的情感语音合成方法、装置及存储介质 | |
JP5411845B2 (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
CN112397056A (zh) | 语音评测方法及计算机存储介质 | |
CN114005446B (zh) | 情感分析方法、相关设备及可读存储介质 | |
CN108091334A (zh) | 识别装置、识别方法以及存储介质 | |
Dongmei | Design of English text-to-speech conversion algorithm based on machine learning | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
CN113948061A (zh) | 语音合成方法、系统、语音合成模型及其训练方法 | |
CN114492382A (zh) | 人物提取方法、文本朗读方法、对话式文本生成方法、装置、设备及存储介质 | |
JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
Nenadić et al. | Computational modeling of an auditory lexical decision experiment using diana | |
CN112733546A (zh) | 表情符号生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20101028 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20111128 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20120322 |
|
PG1501 | Laying open of application | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120620 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120620 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20150618 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20150618 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160712 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20160712 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170619 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20170619 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180524 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20180524 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190520 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20190520 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20200519 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20210514 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20220411 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20230605 Start annual number: 12 End annual number: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20240430 Start annual number: 13 End annual number: 13 |