[go: up one dir, main page]

KR20040052110A - Tts를 이용한 코러스 및 아카펠라 구현방법 - Google Patents

Tts를 이용한 코러스 및 아카펠라 구현방법 Download PDF

Info

Publication number
KR20040052110A
KR20040052110A KR1020020079840A KR20020079840A KR20040052110A KR 20040052110 A KR20040052110 A KR 20040052110A KR 1020020079840 A KR1020020079840 A KR 1020020079840A KR 20020079840 A KR20020079840 A KR 20020079840A KR 20040052110 A KR20040052110 A KR 20040052110A
Authority
KR
South Korea
Prior art keywords
voice
cappella
tts
chorus
rhyme
Prior art date
Application number
KR1020020079840A
Other languages
English (en)
Inventor
천희진
나동원
엄봉수
경연정
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020020079840A priority Critical patent/KR20040052110A/ko
Publication of KR20040052110A publication Critical patent/KR20040052110A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

본 발명은 TTS를 이용한 코러스 및 아카펠라 구현방법에 관한 것으로서, 더 상세하게는 TTS 출력에 있어서 다중 스레드(Multi-thread) 방식 등을 이용하여 멀티 출력이 가능하게 하고, TTS의 부자연스러운 운율 생성 방식을 이용하여 아카펠라 효과를 내도록 구현하여 마이벨이나 컬러링(통화연결음)의 음원으로 활용할 수 있도록 하는 방법에 관한 것이다.
본 발명은 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와, 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와, 상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와, 상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와, 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와, 상기 합성음을 스피커 등을 통해 출력하는 단계로 구성된다.

Description

TTS를 이용한 코러스 및 아카펠라 구현방법 {Chorus and a cappella implementing method by TTS}
본 발명은 TTS를 이용한 코러스 및 아카펠라 구현방법에 관한 것으로서, 더 상세하게는 TTS 출력에 있어서 다중 스레드(Multi-thread) 방식 등을 이용하여 멀티 출력이 가능하게 하고, TTS의 부자연스러운 운율 생성 방식을 이용하여 아카펠라 효과를 내도록 구현하여 마이벨이나 컬러링(통화연결음)의 음원으로 활용할 수있도록 하는 방법에 관한 것이다.
TTS(Text to Speech)는 도움말 파일이나 웹페이지와 같은 컴퓨터 문서(Text)의 내용을 사람이 읽어주는 소리(Speech)로 만들어주는 음성합성 프로그램의 한 종류이다.
이러한 TTS를 이용해 시각 장애가 있는 사람들을 위해 컴퓨터 화면에 나타난 정보를 대신 읽어줄 수도 있다.
TTS 프로그램들로는 음성으로 내용을 읽어주는 음성 이메일과, 자동 응답 시스템의 음성 안내 기능, 음성 사서함 등이 있다.
종래 TTS의 음성 출력은 단순한 음성 출력으로 주어진 문장을 정해진 룰에 따라 음성으로 바꾸어 출력하는 기능만이 있었다.
이를 첨부된 도면 도 1을 참고로 하여 설명하면 다음과 같다.
도 1은 일반적인 TTS 시스템의 구성도이다.
소정의 언어로 입력된 문장(TexT)은 TTS 엔진(10)에 의해 오디오 웨이브 데이터(Audio Wave Data)로 변환되고, 상기 TTS 엔진(10)에 의해 변환된 오디오 웨이브 데이터는 오디오 처리부(20)에 의해 아날로그 음성으로 변환되고, 상기 오디오 처리부(20)에 의해 변환된 아날로그 음성 신호는 스피커(30)를 통해 음성으로 내보내진다.
그런데 종래기술에 의한 TTS 시스템은 주어진 문장을 정해진 룰에 따라 음성으로 바꾸어 출력하는 기능밖에 없었다.
본 발명은 종래 TTS 출력 방식을 좀 더 응용, 확대하기 위해 안출된 것으로, 본 발명의 목적은 TTS의 다양한 음색 혹은 단일 음색이라도 멀티 출력이 되도록 하고, 문장 해석에 따른 시스템에 의한 자율적 운율부가로 인하여 아카펠라 효과를 갖게 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하고자 한다.
본 발명의 다른 목적은 상기한 코러스 및 아카펠라 효과를 이용하여 음성메일이나 카드 음성사서함 뿐만 아니라 마이벨이나 컬러링의 음원으로 할용할 수 있도록 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하는데 있다.
상술한 목적을 달성하기 위하여, 본 발명은 문장 분석부, 운율/음성 생성부, 음성 합성부, 단위음성 DB, 운율 합성부로 구성되는 TTS 시스템에서 부가기능을 구현하는 방법에 있어서;
상기 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와, 상기 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와, 상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와, 상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와, 상기 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와, 상기 합성음을 스피커 등을 통해 출력하는 단계로 구성됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하고자 한다.
도 1은 일반적인 TTS 시스템의 구성도이다.
도 2는 본 발명에 따른 TTS 시스템의 구성도이다.
도 3은 본 발명에 따른 코러스 및 아카펠라 구현방법의 순서도이다.
<도면의 주요부분에 대한 부호의 설명>
10 : TTS 엔진20 : 오디오 처리부
30 : 스피커100 : 문장 분석부
200 : 운율/음성 생성부300 : 음성 합성부
400 : 운율 합성부500 : 단위음성 DB
이하 본 발명의 실시예에 대하여 첨부된 도면을 참고로 그 구성 및 작용을설명하기로 한다.
도 2는 본 발명에 따른 TTS 시스템의 구성도이다.
도시된 바와 같이 입력된 문장에 포함된 문자를 하나씩 확인하는 문장 분석부(100)와, 부가 기능의 설정 여부에 따라 문장에 대한 운율이나 음성을 생성하는 운율/음성 생성부(200)와, 상기 운율/음성 생성부(200)에 의해 생성된 음성에 설정된 사람수만큼 단위음성을 합성하여 코러스 기능을 수행하는 음성 합성부(300)와, 아카펠라 기능이 부여된 경우 상기 합성음에 운율을 더해 출력하는 운율 합성부(400)와, 단위음성에 대한 정보가 사람수만큼 다양하게 저장되어 상기 음성 합성부(300)의 요청에 의해 단위음성을 공급하는 단위음성 DB(500)로 구성된다.
본 발명에 따른 코러스(합창) 기능은 다양한 음색 혹은 단일 음색이라도 멀티 출력이 되도록 한 것으로, 합성음이 단일 출력이 되도록 하는 것이 아니라 음성 합성부(300)와 단위음성 DB(500) 부분의 스레드(Thread)를 지정한 사람수만큼 멀티가 되도록 하여 합성음 또한 설정한 사람수만큼 출력이 되도록 한 것이다.
상기 코러스 기능은 음성메일이나 카드, 음성 사서함 등의 서비스 이용시 응용할 수 있다.
본 발명에 따른 아카펠라 기능은 TTS 시스템의 경우 자연인과 동일한 음성 출력이 불가능한 것을 이용한 것으로, 의미가 있거나 없는 문장 또는 문자를 TTS 시스템의 입력으로 한 경우 운율/음성 생성부(200)에 의한 자동적인 운율정보 생성에 따라 합성음이 출력되고, 이는 원 문장과 상관없이 일정한 운율(아카펠라적 요소)을 갖게 된다.
상기 운율 합성부(400)는 문장 분석에 따라 운율/음성 생성부(200)에 의해 생성된 운율을 자율적으로 부가하여 아카펠라 효과를 갖게 한다.
상기 아카펠라 기능은 개그 음성 메시지나 음성편지, 벨소리, 컬러링의 음원 등에 활용 가능하다.
도 3은 본 발명에 따른 코러스 및 아카펠라 구현방법의 순서도이다.
먼저 입력수단을 이용하여 사용자는 문장을 입력하고(S302), 부가 기능 즉, 코러스 기능이나 아카펠라 기능의 선택 여부를 설정하고, 코러스 기능을 설정하는 경우 사람수를 설정한다(S304).
부가 기능 설정이 완료되면, 문장 분석부(100)는 입력된 문장에 포함된 문자를 하나씩 확인하여 분석한다(S306).
다음 TTS 시시템은 코러스 기능이 설정되어 있는 지 판단하고(S308), 코러스 기능이 설정되어 있으면, 운율/음성 생성부(200)는 분석된 문장에 대한 음성을 생성한다(S310).
음성 합성부(300)에서는 생성된 음성에, 부가기능 설정단계(S304)에서 설정한 사람수만큼 단위음성 DB(500)에서 단위음성을 불러와 합성한다(S312).
이때 멀티-스레드(Multi-thread)로 합성 프로세스를 생성하여 최소의 지연(delay)를 갖도록 한다.
합성 프로세스에 의해 생성된 각 합성음을 타 서비스(음성 메일이나 음성 사서함 등)에 이용하기 위해 상대방에게 전송하는 경우 아날로그 출력의 경우는 동시 녹음 방식으로 저장하고, 디지털 출력의 경우는 멀티-채널 방식으로 저장하여 전송한다.
다음 TTS 시스템은 아카펠라 기능이 설정되어 있는지 판단하여(S314), 아카펠라 기능이 설정되어 있지 않으면 음성(합성음)을 출력하여(S322) 코러스 기능을 구현한다.
아카펠라 기능이 설정되어 있으면, 운율/음성 생성부(200)에서 운율을 생성하여(S316) 음성 합성부(300)를 통해 운율 합성부(400)로 출력하고, 운율 합성부는 합성음에 운율을 더해서(S318) 음성(합성음+출력)을 출력함으로서(S320) 아카펠라 기능을 수행한다.
이때 TTS 시스템 기능에 따라 각종 문장부호(.,?!)를 아카펠라 효과의 제어부호로 활용할 수 있다.
아울러 의미있는 혹은 의미없는 문장이나 문자열(예를 들어 "아아아아아아아"와 같은 문자열) 모두에 대해 TTS 시스템에 의해 운율을 생성하여 아카펠라 효과를 얻을 수 있다.
상기한 실시예의 순서에서 코러스 기능이 수행된 후 아카펠라 기능을 수행하도록 되어 있으나 본 발명은 이 순서에 국한되지 않는다.
또한, 본 발명은 TTS의 멀티 스레드 방식 뿐 아니라 이와 유사한 동시 합성,출력 방식에 광범위하게 적용되며, TTS 시스템에 의하여 자동 생성된 운율에 의한 아카펠라 운율 효과 및 그 효과를 이용한 다양한 서비스에 광범위하게 적용된다.
이상에서 살펴본 바와 같이 본 발명에 의하면, TTS의 다양한 음색 혹은 단일음색이라도 멀티 출력이 되도록 하고, 문장 해석에 따른 시스템에 의한 자율적 운율부가로 인하여 아카펠라 효과를 갖게 하며, 상기한 코러스 및 아카펠라 효과를 이용하여 음성메일이나 카드 음성사서함 뿐만 아니라 마이벨이나 컬러링의 음원으로 활용할 수 있도록 한다.

Claims (5)

  1. 문장 분석부, 운율/음성 생성부, 음성 합성부, 단위음성 DB, 운율 합성부로 구성되는 TTS 시스템에서 부가기능을 구현하는 방법에 있어서;
    상기 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와,
    상기 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와,
    상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와,
    상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와,
    상기 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와,
    상기 합성음을 스피커 등을 통해 출력하는 단계로 구성됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
  2. 상기 음성합성 단계에서 멀티-스레드(Multi-thread)로 합성 프로세스를 생성하여 최소의 지연(delay)를 갖도록 함을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
  3. 청구항 1에 있어서, 상기 TTS 시스템에서 아카펠라 기능이 설정되어 있는 지판단하는 단계와,
    상기 아카펠라 기능이 설정되어 있는 경우 운율/음성 생성부에서 문장에 대해 운율을 생성하는 단계와,
    상기 운율 합성부에서 합성음에 운율을 더하는 단계와,
    상기 음성(합성음+운율)을 스피커 등을 통해 출력하는 단계가 더 구비됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
  4. 청구항 3에 있어서, 상기 문장의 각종 부호를 아카펠라 효과의 제어 부호로 활용함을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
  5. 청구항 3 또는 청구항 4에 있어서, 상기 아카펠라는 TTS 시스템에서 출력되는 음성이 자연인의 음성과 동일하지 않은 것을 이용한 것임을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
KR1020020079840A 2002-12-13 2002-12-13 Tts를 이용한 코러스 및 아카펠라 구현방법 KR20040052110A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020079840A KR20040052110A (ko) 2002-12-13 2002-12-13 Tts를 이용한 코러스 및 아카펠라 구현방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020079840A KR20040052110A (ko) 2002-12-13 2002-12-13 Tts를 이용한 코러스 및 아카펠라 구현방법

Publications (1)

Publication Number Publication Date
KR20040052110A true KR20040052110A (ko) 2004-06-19

Family

ID=37345870

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020079840A KR20040052110A (ko) 2002-12-13 2002-12-13 Tts를 이용한 코러스 및 아카펠라 구현방법

Country Status (1)

Country Link
KR (1) KR20040052110A (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146695A (ja) * 1993-11-26 1995-06-06 Fujitsu Ltd 歌声合成装置
JPH09258758A (ja) * 1996-03-25 1997-10-03 Brother Ind Ltd カラオケ装置
JP2000105595A (ja) * 1998-09-30 2000-04-11 Victor Co Of Japan Ltd 歌唱装置及び記録媒体
KR20010088951A (ko) * 2001-08-22 2001-09-29 백종관 데이터 합성을 통한 노래 구현 시스템 및 그 응용
JP2002304186A (ja) * 2001-04-05 2002-10-18 Sharp Corp 音声合成装置、音声合成方法および音声合成プログラム
JP2002304187A (ja) * 2001-04-03 2002-10-18 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
KR20040015605A (ko) * 2002-08-13 2004-02-19 홍광석 가상노래 합성장치 및 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146695A (ja) * 1993-11-26 1995-06-06 Fujitsu Ltd 歌声合成装置
JPH09258758A (ja) * 1996-03-25 1997-10-03 Brother Ind Ltd カラオケ装置
JP2000105595A (ja) * 1998-09-30 2000-04-11 Victor Co Of Japan Ltd 歌唱装置及び記録媒体
JP2002304187A (ja) * 2001-04-03 2002-10-18 Sony Corp 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2002304186A (ja) * 2001-04-05 2002-10-18 Sharp Corp 音声合成装置、音声合成方法および音声合成プログラム
KR20010088951A (ko) * 2001-08-22 2001-09-29 백종관 데이터 합성을 통한 노래 구현 시스템 및 그 응용
KR20040015605A (ko) * 2002-08-13 2004-02-19 홍광석 가상노래 합성장치 및 방법

Similar Documents

Publication Publication Date Title
US7062437B2 (en) Audio renderings for expressing non-audio nuances
JPH06223070A (ja) テキスト−スピーチコンバータ用テキストプロセッサ
WO2003088208A1 (en) Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
Levinson et al. Speech synthesis in telecommunications
JP3595041B2 (ja) 音声合成システムおよび音声合成方法
KR20050080671A (ko) 티티에스 시스템의 이모티콘 처리 방법
KR20040052110A (ko) Tts를 이용한 코러스 및 아카펠라 구현방법
CA2343071A1 (en) Device and method for digital voice processing
JPS6223888B2 (ko)
JP3404055B2 (ja) 音声合成装置
JPH08272388A (ja) 音声合成装置及びその方法
JPH0764583A (ja) テキスト読み上げ方法および装置
JP2002268664A (ja) 音声変換装置及びプログラム
JPH10228471A (ja) 音声合成システム,音声用テキスト生成システム及び記録媒体
Jenitta et al. Text to Speech Converter Using Python
JP3147898B2 (ja) 音声応答システム
JPH01204100A (ja) テキスト音声合成方式
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP3364569B2 (ja) 音声情報処理装置
JPS62103724A (ja) 文書作成装置
JPS62100831A (ja) 文字入力装置
JPH09251373A (ja) 音声合成方法および音声合成装置
JPS59140499A (ja) 音声合成装置
JPH01119822A (ja) 文章読み上げ装置
JPH04243299A (ja) 音声出力装置

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20021213

PA0201 Request for examination
PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20050221

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20050527

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20050221

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I