KR20040052110A

KR20040052110A - Ｔｔｓ를 이용한 코러스 및 아카펠라 구현방법

Info

Publication number: KR20040052110A
Application number: KR1020020079840A
Authority: KR
Inventors: 천희진; 나동원; 엄봉수; 경연정
Original assignee: 에스케이 텔레콤주식회사
Priority date: 2002-12-13
Filing date: 2002-12-13
Publication date: 2004-06-19

Abstract

본 발명은 TTS를 이용한 코러스 및 아카펠라 구현방법에 관한 것으로서, 더 상세하게는 TTS 출력에 있어서 다중 스레드(Multi-thread) 방식 등을 이용하여 멀티 출력이 가능하게 하고, TTS의 부자연스러운 운율 생성 방식을 이용하여 아카펠라 효과를 내도록 구현하여 마이벨이나 컬러링(통화연결음)의 음원으로 활용할 수 있도록 하는 방법에 관한 것이다.

본 발명은 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와, 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와, 상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와, 상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와, 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와, 상기 합성음을 스피커 등을 통해 출력하는 단계로 구성된다.

Description

ＴＴＳ를 이용한 코러스 및 아카펠라 구현방법 {Chorus and a cappella implementing method by TTS}

본 발명은 TTS를 이용한 코러스 및 아카펠라 구현방법에 관한 것으로서, 더 상세하게는 TTS 출력에 있어서 다중 스레드(Multi-thread) 방식 등을 이용하여 멀티 출력이 가능하게 하고, TTS의 부자연스러운 운율 생성 방식을 이용하여 아카펠라 효과를 내도록 구현하여 마이벨이나 컬러링(통화연결음)의 음원으로 활용할 수있도록 하는 방법에 관한 것이다.

TTS(Text to Speech)는 도움말 파일이나 웹페이지와 같은 컴퓨터 문서(Text)의 내용을 사람이 읽어주는 소리(Speech)로 만들어주는 음성합성 프로그램의 한 종류이다.

이러한 TTS를 이용해 시각 장애가 있는 사람들을 위해 컴퓨터 화면에 나타난 정보를 대신 읽어줄 수도 있다.

TTS 프로그램들로는 음성으로 내용을 읽어주는 음성 이메일과, 자동 응답 시스템의 음성 안내 기능, 음성 사서함 등이 있다.

종래 TTS의 음성 출력은 단순한 음성 출력으로 주어진 문장을 정해진 룰에 따라 음성으로 바꾸어 출력하는 기능만이 있었다.

이를 첨부된 도면 도 1을 참고로 하여 설명하면 다음과 같다.

도 1은 일반적인 TTS 시스템의 구성도이다.

소정의 언어로 입력된 문장(TexT)은 TTS 엔진(10)에 의해 오디오 웨이브 데이터(Audio Wave Data)로 변환되고, 상기 TTS 엔진(10)에 의해 변환된 오디오 웨이브 데이터는 오디오 처리부(20)에 의해 아날로그 음성으로 변환되고, 상기 오디오 처리부(20)에 의해 변환된 아날로그 음성 신호는 스피커(30)를 통해 음성으로 내보내진다.

그런데 종래기술에 의한 TTS 시스템은 주어진 문장을 정해진 룰에 따라 음성으로 바꾸어 출력하는 기능밖에 없었다.

본 발명은 종래 TTS 출력 방식을 좀 더 응용, 확대하기 위해 안출된 것으로, 본 발명의 목적은 TTS의 다양한 음색 혹은 단일 음색이라도 멀티 출력이 되도록 하고, 문장 해석에 따른 시스템에 의한 자율적 운율부가로 인하여 아카펠라 효과를 갖게 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하고자 한다.

본 발명의 다른 목적은 상기한 코러스 및 아카펠라 효과를 이용하여 음성메일이나 카드 음성사서함 뿐만 아니라 마이벨이나 컬러링의 음원으로 할용할 수 있도록 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하는데 있다.

상술한 목적을 달성하기 위하여, 본 발명은 문장 분석부, 운율/음성 생성부, 음성 합성부, 단위음성 DB, 운율 합성부로 구성되는 TTS 시스템에서 부가기능을 구현하는 방법에 있어서;

상기 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와, 상기 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와, 상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와, 상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와, 상기 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와, 상기 합성음을 스피커 등을 통해 출력하는 단계로 구성됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법을 제공하고자 한다.

도 1은 일반적인 TTS 시스템의 구성도이다.

도 2는 본 발명에 따른 TTS 시스템의 구성도이다.

도 3은 본 발명에 따른 코러스 및 아카펠라 구현방법의 순서도이다.

<도면의 주요부분에 대한 부호의 설명>

10 : TTS 엔진20 : 오디오 처리부

30 : 스피커100 : 문장 분석부

200 : 운율/음성 생성부300 : 음성 합성부

400 : 운율 합성부500 : 단위음성 DB

이하 본 발명의 실시예에 대하여 첨부된 도면을 참고로 그 구성 및 작용을설명하기로 한다.

도 2는 본 발명에 따른 TTS 시스템의 구성도이다.

도시된 바와 같이 입력된 문장에 포함된 문자를 하나씩 확인하는 문장 분석부(100)와, 부가 기능의 설정 여부에 따라 문장에 대한 운율이나 음성을 생성하는 운율/음성 생성부(200)와, 상기 운율/음성 생성부(200)에 의해 생성된 음성에 설정된 사람수만큼 단위음성을 합성하여 코러스 기능을 수행하는 음성 합성부(300)와, 아카펠라 기능이 부여된 경우 상기 합성음에 운율을 더해 출력하는 운율 합성부(400)와, 단위음성에 대한 정보가 사람수만큼 다양하게 저장되어 상기 음성 합성부(300)의 요청에 의해 단위음성을 공급하는 단위음성 DB(500)로 구성된다.

본 발명에 따른 코러스(합창) 기능은 다양한 음색 혹은 단일 음색이라도 멀티 출력이 되도록 한 것으로, 합성음이 단일 출력이 되도록 하는 것이 아니라 음성 합성부(300)와 단위음성 DB(500) 부분의 스레드(Thread)를 지정한 사람수만큼 멀티가 되도록 하여 합성음 또한 설정한 사람수만큼 출력이 되도록 한 것이다.

상기 코러스 기능은 음성메일이나 카드, 음성 사서함 등의 서비스 이용시 응용할 수 있다.

본 발명에 따른 아카펠라 기능은 TTS 시스템의 경우 자연인과 동일한 음성 출력이 불가능한 것을 이용한 것으로, 의미가 있거나 없는 문장 또는 문자를 TTS 시스템의 입력으로 한 경우 운율/음성 생성부(200)에 의한 자동적인 운율정보 생성에 따라 합성음이 출력되고, 이는 원 문장과 상관없이 일정한 운율(아카펠라적 요소)을 갖게 된다.

상기 운율 합성부(400)는 문장 분석에 따라 운율/음성 생성부(200)에 의해 생성된 운율을 자율적으로 부가하여 아카펠라 효과를 갖게 한다.

상기 아카펠라 기능은 개그 음성 메시지나 음성편지, 벨소리, 컬러링의 음원 등에 활용 가능하다.

먼저 입력수단을 이용하여 사용자는 문장을 입력하고(S302), 부가 기능 즉, 코러스 기능이나 아카펠라 기능의 선택 여부를 설정하고, 코러스 기능을 설정하는 경우 사람수를 설정한다(S304).

부가 기능 설정이 완료되면, 문장 분석부(100)는 입력된 문장에 포함된 문자를 하나씩 확인하여 분석한다(S306).

다음 TTS 시시템은 코러스 기능이 설정되어 있는 지 판단하고(S308), 코러스 기능이 설정되어 있으면, 운율/음성 생성부(200)는 분석된 문장에 대한 음성을 생성한다(S310).

음성 합성부(300)에서는 생성된 음성에, 부가기능 설정단계(S304)에서 설정한 사람수만큼 단위음성 DB(500)에서 단위음성을 불러와 합성한다(S312).

이때 멀티-스레드(Multi-thread)로 합성 프로세스를 생성하여 최소의 지연(delay)를 갖도록 한다.

합성 프로세스에 의해 생성된 각 합성음을 타 서비스(음성 메일이나 음성 사서함 등)에 이용하기 위해 상대방에게 전송하는 경우 아날로그 출력의 경우는 동시 녹음 방식으로 저장하고, 디지털 출력의 경우는 멀티-채널 방식으로 저장하여 전송한다.

다음 TTS 시스템은 아카펠라 기능이 설정되어 있는지 판단하여(S314), 아카펠라 기능이 설정되어 있지 않으면 음성(합성음)을 출력하여(S322) 코러스 기능을 구현한다.

아카펠라 기능이 설정되어 있으면, 운율/음성 생성부(200)에서 운율을 생성하여(S316) 음성 합성부(300)를 통해 운율 합성부(400)로 출력하고, 운율 합성부는 합성음에 운율을 더해서(S318) 음성(합성음+출력)을 출력함으로서(S320) 아카펠라 기능을 수행한다.

이때 TTS 시스템 기능에 따라 각종 문장부호(.,?!)를 아카펠라 효과의 제어부호로 활용할 수 있다.

아울러 의미있는 혹은 의미없는 문장이나 문자열(예를 들어 "아아아아아아아"와 같은 문자열) 모두에 대해 TTS 시스템에 의해 운율을 생성하여 아카펠라 효과를 얻을 수 있다.

상기한 실시예의 순서에서 코러스 기능이 수행된 후 아카펠라 기능을 수행하도록 되어 있으나 본 발명은 이 순서에 국한되지 않는다.

또한, 본 발명은 TTS의 멀티 스레드 방식 뿐 아니라 이와 유사한 동시 합성,출력 방식에 광범위하게 적용되며, TTS 시스템에 의하여 자동 생성된 운율에 의한 아카펠라 운율 효과 및 그 효과를 이용한 다양한 서비스에 광범위하게 적용된다.

이상에서 살펴본 바와 같이 본 발명에 의하면, TTS의 다양한 음색 혹은 단일음색이라도 멀티 출력이 되도록 하고, 문장 해석에 따른 시스템에 의한 자율적 운율부가로 인하여 아카펠라 효과를 갖게 하며, 상기한 코러스 및 아카펠라 효과를 이용하여 음성메일이나 카드 음성사서함 뿐만 아니라 마이벨이나 컬러링의 음원으로 활용할 수 있도록 한다.

Claims

문장 분석부, 운율/음성 생성부, 음성 합성부, 단위음성 DB, 운율 합성부로 구성되는 TTS 시스템에서 부가기능을 구현하는 방법에 있어서;

상기 TTS 시스템에 코러스나 아카펠라 같은 부가기능을 설정하는 단계와,

상기 문장 분석부에서 입력된 문장에 포함된 문자를 확인하여 분석하는 단계와,

상기 TTS 시스템에서 코러스 기능이 설정되어 있는 지 판단하는 단계와,

상기 코러스 기능이 설정되어 있는 경우 운율/음성 생성부에서 분석된 문장에 대한 음성을 생성하는 단계와,

상기 음성 합성부에서 생성된 음성에, 부가기능 설정단계에서 설정한 사람수만큼 단위음성 DB에서 단위음성을 불러와 합성하는 단계와,

상기 합성음을 스피커 등을 통해 출력하는 단계로 구성됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
상기 음성합성 단계에서 멀티-스레드(Multi-thread)로 합성 프로세스를 생성하여 최소의 지연(delay)를 갖도록 함을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
청구항 1에 있어서, 상기 TTS 시스템에서 아카펠라 기능이 설정되어 있는 지판단하는 단계와,

상기 아카펠라 기능이 설정되어 있는 경우 운율/음성 생성부에서 문장에 대해 운율을 생성하는 단계와,

상기 운율 합성부에서 합성음에 운율을 더하는 단계와,

상기 음성(합성음+운율)을 스피커 등을 통해 출력하는 단계가 더 구비됨을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
청구항 3에 있어서, 상기 문장의 각종 부호를 아카펠라 효과의 제어 부호로 활용함을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.
청구항 3 또는 청구항 4에 있어서, 상기 아카펠라는 TTS 시스템에서 출력되는 음성이 자연인의 음성과 동일하지 않은 것을 이용한 것임을 특징으로 하는 TTS를 이용한 코러스 및 아카펠라 구현방법.