[go: up one dir, main page]

KR100434538B1 - 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 - Google Patents

음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 Download PDF

Info

Publication number
KR100434538B1
KR100434538B1 KR10-1999-0051065A KR19990051065A KR100434538B1 KR 100434538 B1 KR100434538 B1 KR 100434538B1 KR 19990051065 A KR19990051065 A KR 19990051065A KR 100434538 B1 KR100434538 B1 KR 100434538B1
Authority
KR
South Korea
Prior art keywords
peak value
excitation signal
speech
value
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR10-1999-0051065A
Other languages
English (en)
Other versions
KR20010047038A (ko
Inventor
김무영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-1999-0051065A priority Critical patent/KR100434538B1/ko
Priority to US09/562,887 priority patent/US6385570B1/en
Publication of KR20010047038A publication Critical patent/KR20010047038A/ko
Application granted granted Critical
Publication of KR100434538B1 publication Critical patent/KR100434538B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의 음성 합성 방법을 개시한다. 본 발명에 의한 음성의 천이 구간 검출 장치는, 음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하는 여기신호 전처리부, 전처리된 여기신호의 피크치를 구하고, 소정의 기준 피크치를 이용하여 상대적 피크치를 구하는 상대적 피크치 계산부 및 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 천이 구간 검출부를 구비하는 것을 특징으로 한다.

Description

음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의 음성 합성 방법{Detection apparatus and method for transitional region of speech and speech synthesis method for transitional region}
본 발명은 음성 신호 처리에 관한 것으로, 특히 음성의 천이 구간 검출, 합성 방법 및 그 장치에 관한 것이다.
사람이 발성하는 음성은 크게 안정(stationary) 구간과 천이(transition) 구간으로 구분할 수 있다. 안정 구간은 예컨대, 침묵, 울림의 유무에 따른 유성음/무성음 등에 해당하며, 천이 구간은 예컨대, 파열음, 급격한 음의 개시, 불규칙한 파생음 등에 해당한다. 종래의 음성 부호화기 특히, 하모닉 음성 부호화기는 주파수 영역에서 피치의 하모닉 성분을 이용하여 음성을 부호화하는데, 음성의 진폭 정보와 밴드별 음성 확률을 주요 파라미터로 이용한다.
이상적으로, 음성 부호화에 있어서 음성의 안정 구간에 대해서는 진폭 정보를, 천이 구간에 대해서는 위상 정보를 이용하는 것이 바람직하다. 그러나, 실제적으로 하모닉 음성 부호화기는 진폭 정보만을 이용함으로써 안정 구간에 대한 정확한 스펙트럼 크기 평가만을 수행하고, 위상 정보를 이용하지 않음으로써 천이 구간에 대해선 음질 저하를 초래한다. 따라서, 음성 부호화기가 저비트율, 현재로서 바람직하게 4-kbit/s의 고음질 음성을 얻기 위해서는 음성의 천이 구간에 대한 검출 및 합성 알고리즘이 요구된다.
종래의 방법은 음성의 천이 구간 검출을 위해 슬라이딩 윈도우(sliding window)에 따른 절대 피크치를 이용하였다. 다음 수학식 1은 절대 피크치(P)를 계산하는데 사용된 식이다.
여기서,는 슬라이딩 윈도우에 따른 i번째 샘플에서의 피크치를, r(n)은 LPC 여기신호를, N은 서브프레임 크기를,는 최대 슬라이딩 범위를 각각 나타낸다. 천이 구간 플래그는 절대 피크치(P)가 임계치보다 클 경우에 설정된다.
도 1 및 도 2는 종래의 방법에 따라 음성의 천이 구간을 검출예를 나타낸 도면들이다. 도 1에서 (a)는 클린 환경에서의 음성신호를 나타내고, 도 2에서 (a)는 노이즈 환경에서의 음성신호를 나타낸다. (b)는 절대 피크치를, (c)는 천이 구간을 검출한 결과를 각각 나타낸다. 이들 도면들로 부터 알 수 있듯이, 도 1에서는 절대 피크치를 이용하여 천이 구간을 검출하였지만, 도 2에서는 천이 구간을 검출하지 못하였다. 즉, 종래의 방법은 노이즈 환경에서 검출 결과가 양호하지 못하다.
또한, 절대 피크치를 높여주면 검출율이 높아지지만, 상대적으로 오검출율도 높아진다. 반대로, 절대 피크치를 낮추면 오검출율은 낮아지지만, 상대적으로 검출율도 떨어지게 된다. 따라서, 종래의 방법은 절대 피크치에 따라 검출율 및 오검출율이 좌우되는 한계가 있다.
본 발명이 이루고자 하는 기술적 과제는, 노이즈 환경에서의 음성에 대한 천이 구간 검출율을 향상시키고, 궁극적으로 저비트율의 고음질 음성을 얻기 위한 음성의 천이 구간 검출 장치를 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기 장치에 의해 수행되는 음성의 천이 구간 검출 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또다른 기술적 과제는, 검출된 천이 구간의 효과적인 음성 합성 방법을 제공하는데 있다.
도 1 및 도 2는 종래의 방법에 따른 음성의 천이 구간 검출예를 나타낸 도면들이다.
도 3은 본 발명에 의한 음성의 천이 구간 검출 장치를 설명하기 위한 블럭도이다.
도 4는 본 발명에 의한 음성의 천이 구간 검출 방법에 따른 실험예를 나타낸 도면이다.
도 5는 본 발명과 종래의 천이 구간 검출 방법에 따른 실험에서 검출율을 비교한 그래프이다.
도 6은 본 발명과 종래의 천이 구간 검출 방법에 따른 실험에서 오검출율을 비교한 그래프이다.
상기 과제를 이루기 위하여, 본 발명에 의한 음성의 천이 구간 검출 장치는, 음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하는 여기신호 전처리부, 전처리된 여기신호의 피크치를 구하고, 소정의 기준 피크치를 이용하여 상대적 피크치를 구하는 상대적 피크치 계산부 및 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 천이 구간 검출부를 구비하는 것을 특징으로 한다.
상기 다른 과제를 이루기 위하여, 본 발명에 의한 음성의 천이 구간 검출 방법은, (a) 음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하여 여기신호를 전처리하는 단계, (b) 전처리된 여기신호의 피크치를 구하는 단계, (c) 소정의 기준 피크치를 이용하여 전처리된 여기신호의 피크치에 대한 상대적 피크치를 구하는 단계 및 (d) 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 단계를 구비하는 것을 특징으로 한다.
상기 또다른 과제를 이루기 위하여, 음성의 천이 구간에 대한 음성 합성 방법은, (a) 음성을 주파수 영역으로 나타낼 때 피치의 하모닉 성분중에서 어느 하모닉에 위상 정보를 할당할 것인가를 판단하는 단계; (b) 판단 결과, 위상 정보가 중요한 하모닉에 대해서는 천이 구간의 개시점과 그때의 위상으로 부터 얻은 위상 정보를 할당하는 단계 및 (c) 할당된 위상 정보를 이용하여 해당 천이 구간을 합성하는 단계를 구비하는 것을 특징으로 한다.
이하, 본 발명에 의한 음성의 천이 구간 검출, 합성 방법 및 그 장치를 첨부한 도면을 참조하여 다음과 같이 설명한다.
본 발명은 특징적으로 음성의 천이 구간을 검출하기 위해 상대적인 피크치(relative peakness value)를 사용함으로써, 노이즈 환경에 강하고, 천이 구간에 대한 정확한 개시점을 검출할 수 있다.
도 3은 본 발명에 의한 음성의 천이 구간 검출 장치를 설명하기 위한 블럭도이며, 여기신호 전처리부(300), 상대적 피크치 계산부(310) 및 천이 구간 검출부(320)를 구비한다. 상대적 피크치 계산부(310)는 제1 피크치 계산기(312), 비교기(314), 카운터(316) 및 제2 피크치 계산기(318)를 구비한다.
도 4는 본 발명에 의한 음성의 천이 구간 검출 방법에 따른 실험예를 나타낸 도면이다. 도 4를 참조하여 도 3에 도시된 장치의 동작을 구체적으로 설명한다.
표준화에 따른 음성 부호화기들은 일반적으로 음성을 스펙트럼 포락선 신호와 스펙트럼 여기신호로 나누어 표현한다. 음성으로 부터 선형 예측 부호화(LPC : Linear Predictive Coding) 계수가 추출되고, 이를 이용하여 LPC 여기신호를 구한다. 도 4 (d)는 음성신호(S(n))를, 도 4 (a)는 LPC 여기신호(r(n))를 각각 나타낸다.
도 3에서, 여기신호 전처리부(300)는 LPC 여기신호의 피크치를 구하기에 앞서 예컨대, 신호 정형화, DC성분 제거 및 센터 클리핑 등을 거쳐 피크치를 포함한 구간을 강조하는 전처리 과정을 수행한다.
구체적으로, 여기신호(r(n))의 절대치와 여기신호의 평균치()와의 차(r'(n))를 구한다. 여기서, 여기신호의 평균치()는 임의의 신호 구간에서의 평균치이다. 다음에, 차(r'(n))가 소정의 기준치()보다 크면 그대로 차(r'(n))를 이용하고, 그렇지 않으면 0의 값을 설정함으로써 피크 강조된 여기신호()를 구한다. 이러한 과정은 다음 수학식 2와 같이 나타낼 수 있다.
여기서, N은 서브프레임 크기를 나타내며, 실험에서는 N=80으로 설정하였다. 실험 결과, 도 4 (b)와 같이 차() 즉, 정형화된 신호를 얻었고, 도 4 (c)와 같이 피크 강조된 여기신호() 즉, DC성분 제거되고 센터 클리핑된 신호를 얻었다.
다음에, 상대적 피크치 계산부(310)는 전처리된 여기신호의 피크치를 구하고, 소정의 기준 피크치를 이용하여 전처리된 여기신호의 피크치에 대한 상대적 피크치를 구한다. 피크치()는 다음 수학식 3을 이용하여 구할 수 있다.
여기서,는 i번째 샘플에서의 피크치를, N은 서브프레임 크기를 각각 나타낸다. 실험 결과, 도 4 (e)와 같이 피크치를 갖는 신호를 얻었다.
상대적 피크치를 구하기 위해 구체적으로, i번째 샘플에서의 전처리된 여기신호의 피크치(Pi)와 일정 구간(1≤j<J)내에 포함된 그 이전 피크치들(Pi-j)간의 차를 비교한다. 비교된 결과, 차가 소정의 기준 피크치보다 큰가를 판단하고, 클때마다 1씩 카운팅한다. 카운팅된 계수가 소정의 기준 계수보다 크면 1의 값을 설정하고, 그렇지 않으면 0의 값을 설정한다. 이러한 과정을 거쳐 1 또는 0으로 표현되는 상대적 피크치()를 얻는다. 다음 수학식 4와 같이 나타낼 수 있다.
여기서,는 기준 피크치를,는 기준 계수 및 J는 일정 신호구간 크기를 각각 나타내며, 실험에서 0.42, 2 및 20으로 각각 설정하였다.
다음에, 천이 구간 검출부(320)는 상대적 피크치를 이용하여 천이 구간, 정확히 말하면 천이 구간의 개시점을 검출한다. 즉, 수학식 4를 이용하여 얻어진 상대적 피크치가 1인 샘플의 서브프레임을 천이 구간으로서 검출한다. 또한, 수학식4에서 i가 해당 서브프레임의 천이 구간 개시점이 된다. 도 4 (f)는 검출된 천이 구간을 나타낸다.
한편, 검출된 천이 구간에 대한 음성 합성 방법은 다음과 같다.
하모닉 음성 부호화기에서, 위상 성분은 매 프레임 경계에서 평가되어야 한다. 종래에 음성 합성 단계에서 음성의 안정 구간에 대해, 제로 위상 및 랜덤한 위상 적용 방법이 유성음 밴드 및 무성음 밴드 각각에 사용되었다. 또한, 천이 구간에 대해서도 마찬가지로 적용하였다. 다음 수학식 5는 안정 구간에서 시간(N)에서의 유성 밴드의 h번째 하모닉 위상을 나타낸다. 여기서, 여기신호는 제로 위상 신호인 것으로 가정한다.
여기서,는 각각 이전 및 현재 프레임에서의 기본 주파수를 나타내며, H(N)은 현재 프레임에서의 전체 하모닉의 수이다.
본 발명에 의한 음성 합성 방법은 위상 정보가 중요한 하모닉에 대해서는 수학식 5에 나타낸 위상과 다른 위상을 이용하여 합성한다. 즉, 음성의 급격한 변화 구간이나 개시 구간 등과 같은 음성의 천이 구간은 천이 구간의 개시점 및 그때의 원래의 위성 정보를 이용하여 합성하는 것이 바람직하다. 다음 수학식 6은 본 발명에 따른 천이 구간에서의 위상을 나타낸다.
여기서, h=1,2,...,H(N)이며, H(N)은 현재 프레임에서의 전체 하모닉의 수를 나타낸다.,는 각각 천이 구간의 개시점 및 보정된 위상 정보를 각각 나타낸다.
본 발명에 의한 음성 합성 방법은 먼저, 어느 하모닉에 위상 정보를 할당할 것인가를 판단한다. 판단의 기준 및 할당 방법에 대해서는 "청각 특성을 이용한 신호의 위상 합성 방법 및 기구(본 발명의 동일 출원인에 의해 기출원된 국내 특허출원 99-17505)"에 개시되어 있다. 판단 결과, 위상 정보가 중요한 하모닉은 수학식 6에서의 두개의 식중에서 밑 식으로 위상을 할당한다. 여기서, 위상 정보가 중요한 하모닉은 전술한 천이 구간의 검출 과정을 통해 천이 구간의 개시점() 및 그때의 위상을 가지고 있을 것이다.
다음 표 1은 본 발명과 종래의 천이 구간 검출 방법에 따른 실험 결과를 나타낸다. 도 5는 본 발명과 종래의 천이 구간 검출 방법에 따른 실험에서 검출율을 비교한 그래프이며, 도 6은 본 발명과 종래의 천이 구간 검출 방법에 따른 실험에서 오검출율을 비교한 그래프이다.
성능 평가 방법 클린 환경 바블 노이즈 환경 차량 노이즈 환경
검출율(%) 종래 64.67 34.80 0.71
본 발명 92.94 85.78 71.43
오검출율(%) 종래 1.14 0.52 0.19
본 발명 0.11 0.14 0.00
표 1, 도 5 및 도 6을 살펴보면, 본 발명의 방법은 종래의 방법에 비교하여 클린 환경 뿐만 아니라, 노이즈 환경에서 천이 구간의 검출율이 높고, 오검출율이 현저히 낮다는 것을 알 수 있다.
한편, 다음 표 2는 천이 구간의 음성 합성 방법에 따른 실험 결과를 나타낸다. 마찬가지로 표 2를 살펴보면, 본 발명의 방법은 진폭 정보만을 이용한 종래의 방법에 비교하여 클린 환경 뿐만 아니라, 노이즈 환경에서 보다 개선된 음질을 재생한다는 것을 알 수 있다.
테스트 조건 종래(%) 본 발명(%)
클린 환경에서의 음성 25.52 31.25
부호화기 두번 통과 26.04 39.06
바블 노이즈 환경에서의 음성 18.75 25.00
이상에서 설명한 바와 같이, 본 발명에 의한 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의 음성 합성 방법은, 노이즈 환경에서 음성에 대한 천이 구간 검출율을 향상시키고, 검출된 천이 구간을 효과적으로 음성 합성함으로써 저비트율의 고음질 음성을 얻는 이점이 있다.

Claims (11)

  1. 음성의 천이 구간 검출 장치에 있어서,
    음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하는 여기신호 전처리부;
    전처리된 여기신호의 피크치를 구하고, 소정의 기준 피크치를 이용하여 상대적 피크치를 구하는 상대적 피크치 계산부; 및
    상기 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 천이 구간 검출부를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
  2. 제1항에 있어서, 상기 여기신호 전처리부는,
    상기 여기신호를 정형화하고, 직류 성분을 제거하고, 센터 클리핑을 취함으로써 피크치가 포함된 구간을 강조하는 것을 특징으로 하는 음성의 천이 구간 검출장치.
  3. 제2항에 있어서, 상기 피크 강조된 여기신호()는 다음 수학식을 이용하여 계산되며,
    [수학식]
    여기서,는 여기신호의 평균치를, r'(n)는 여기신호의 절대치와 여기신호의 평균치와의 차를, N은 서브프레임 크기를 각각 나타내는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
  4. 제1항에 있어서, 상기 상대적 피크치 계산부는,
    전처리된 여기신호의 피크치를 구하는 제1 피크치 계산기;
    전처리된 여기신호의 피크치에 대해 일정 신호구간내에 포함된 그 이전 피크치들과의 차를 순차적으로 비교하는 비교기;
    비교된 결과, 차가 소정의 기준 피크치보다 큰가를 판단하고, 클때마다 1씩 카운팅하는 카운터; 및
    카운팅된 계수가 소정의 기준 계수보다 크면 제1 값을 설정하고, 그렇지 않으면 제2 값을 설정하여 제1 및 제2 값으로 표현되는 상대적 피크치를 구하는 제2 피크치 계산기를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
  5. 제4항에 있어서, 상기 전처리된 여기신호의 피크치는 다음 수학식을 이용하여 계산되며,
    [수학식]
    여기서,는 i번째 샘플에서의 피크치를,은 피크 강조된 여기신호를, N은 서브프레임 크기를 각각 나타내는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
  6. 제4항에 있어서, 상기 상대적 피크치는 다음 수학식을 이용하여 계산되며,
    [수학식]
    여기서,는 기준 피크치를,는 기준 계수 및 J는 일정 신호구간 크기를 각각 나타내며, i는 해당 서브프레임의 천이 구간 개시점이 되는 것을 특징으로 하는 음성의 천이 구간 검출 장치.
  7. 음성의 천이 구간 검출 방법에 있어서,
    (a) 음성에 대한 여기신호에서 피크치가 포함된 구간을 강조하여 여기신호를 전처리하는 단계;
    (b) 전처리된 여기신호의 피크치를 구하는 단계;
    (c) 소정의 기준 피크치를 이용하여 전처리된 여기신호의 피크치에 대한 상대적 피크치를 구하는 단계; 및
    (d) 상대적 피크치에 근거하여 천이 구간의 유무를 판단하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 방법.
  8. 제7항에 있어서, 상기 (a) 단계는,
    (a1) 여기신호의 절대치와 여기신호의 평균치와의 차를 구하는 단계; 및
    (a2) 상기 차가 소정의 기준치보다 크면 그대로 차를 이용하고, 그렇지 않으면 0의 값을 설정함으로써 피크 강조된 여기신호를 구하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출 방법.
  9. 제7항에 있어서, 상기 (c) 단계는,
    (c1) 전처리된 여기신호의 피크치에 대해 일정 신호구간내에 포함된 그 이전 피크치들과의 차를 순차적으로 비교하는 단계;
    (c2) 비교된 결과, 차가 소정의 기준 피크치보다 큰가를 판단하고, 클때마다 1씩 카운팅하는 단계; 및
    (c3) 카운팅된 계수가 소정의 기준 계수보다 크면 제1 값을 설정하고, 그렇지 않으면 제2 값을 설정하여 제1 및 제2 값으로 표현되는 상대적 피크치를 구하는 단계를 포함하는 것을 특징으로 하는 음성의 천이 구간 검출방법.
  10. 음성의 천이 구간에 대한 음성 합성 방법에 있어서,
    (a) 음성을 주파수 영역으로 나타낼 때 피치의 하모닉 성분중에서 어느 하모닉에 위상 정보를 할당할 것인가를 판단하는 단계;
    (b) 판단 결과, 위상 정보가 중요한 하모닉에 대해서는 천이 구간의 개시점과 그때의 위상으로 부터 얻은 위상 정보를 할당하는 단계; 및
    (c) 할당된 위상 정보를 이용하여 해당 천이 구간을 합성하는 단계를 포함하는 것을 특징으로 하는 천이 구간에 대한 음성 합성 방법.
  11. 제10항에 있어서, 상기 위상 정보가 중요한 하모닉은 다음 수학식에서의 두개의 식중에서 밑 식으로 나타낸 위상을 할당하고, 위상 정보가 덜 중요한 하모닉은 위 식으로 나타낸 위상을 할당하며,
    [수학식]
    여기서,는 각각 이전 및 현재 프레임에서의 기본 주파수를 나타내며, h=1,2,...,H(N)이며, H(N)은 현재 프레임에서의 전체 하모닉의 수를 나타내며,,는 각각 천이 구간의 개시점 및 보정된 위상 정보를 각각 나타내는 것을 특징으로 하는 천이 구간에 대한 음성 합성 방법.
KR10-1999-0051065A 1999-11-17 1999-11-17 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법 Expired - Fee Related KR100434538B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-1999-0051065A KR100434538B1 (ko) 1999-11-17 1999-11-17 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법
US09/562,887 US6385570B1 (en) 1999-11-17 2000-05-01 Apparatus and method for detecting transitional part of speech and method of synthesizing transitional parts of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-1999-0051065A KR100434538B1 (ko) 1999-11-17 1999-11-17 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법

Publications (2)

Publication Number Publication Date
KR20010047038A KR20010047038A (ko) 2001-06-15
KR100434538B1 true KR100434538B1 (ko) 2004-06-05

Family

ID=19620485

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-0051065A Expired - Fee Related KR100434538B1 (ko) 1999-11-17 1999-11-17 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법

Country Status (2)

Country Link
US (1) US6385570B1 (ko)
KR (1) KR100434538B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210100823A (ko) 2020-02-07 2021-08-18 김민서 디지털 음성 마크 생성 장치

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100383668B1 (ko) * 2000-09-19 2003-05-14 한국전자통신연구원 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
WO2008002098A1 (en) * 2006-06-29 2008-01-03 Lg Electronics, Inc. Method and apparatus for an audio signal processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930014263A (ko) * 1991-12-23 1993-07-22 이헌조 음성전이구간 검출기
JPH05265488A (ja) * 1992-03-18 1993-10-15 Sony Corp ピッチ抽出方法
JPH096386A (ja) * 1995-06-19 1997-01-10 Canon Inc 状態遷移モデルの設計方法及び該状態遷移モデルを用いた音声認識装置
US5687288A (en) * 1994-09-20 1997-11-11 U.S. Philips Corporation System with speaking-rate-adaptive transition values for determining words from a speech signal
JPH113095A (ja) * 1997-06-13 1999-01-06 Sharp Corp 音声合成装置
KR19990066557A (ko) * 1998-01-30 1999-08-16 전주범 음성 인식시 천이 구간의 음성 식별 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241649A (en) * 1985-02-18 1993-08-31 Matsushita Electric Industrial Co., Ltd. Voice recognition method
US5408581A (en) * 1991-03-14 1995-04-18 Technology Research Association Of Medical And Welfare Apparatus Apparatus and method for speech signal processing
US5390278A (en) * 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
US5189701A (en) * 1991-10-25 1993-02-23 Micom Communications Corp. Voice coder/decoder and methods of coding/decoding
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
US6188979B1 (en) * 1998-05-28 2001-02-13 Motorola, Inc. Method and apparatus for estimating the fundamental frequency of a signal
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930014263A (ko) * 1991-12-23 1993-07-22 이헌조 음성전이구간 검출기
JPH05265488A (ja) * 1992-03-18 1993-10-15 Sony Corp ピッチ抽出方法
US5687288A (en) * 1994-09-20 1997-11-11 U.S. Philips Corporation System with speaking-rate-adaptive transition values for determining words from a speech signal
JPH096386A (ja) * 1995-06-19 1997-01-10 Canon Inc 状態遷移モデルの設計方法及び該状態遷移モデルを用いた音声認識装置
JPH113095A (ja) * 1997-06-13 1999-01-06 Sharp Corp 音声合成装置
KR19990066557A (ko) * 1998-01-30 1999-08-16 전주범 음성 인식시 천이 구간의 음성 식별 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210100823A (ko) 2020-02-07 2021-08-18 김민서 디지털 음성 마크 생성 장치

Also Published As

Publication number Publication date
KR20010047038A (ko) 2001-06-15
US6385570B1 (en) 2002-05-07

Similar Documents

Publication Publication Date Title
US6138093A (en) High resolution post processing method for a speech decoder
JP4440937B2 (ja) 暗騒音存在時の音声を改善するための方法および装置
US7124078B2 (en) System and method of coding sound signals using sound enhancement
EP1973104A2 (en) Method and apparatus for estimating noise by using harmonics of a voice signal
JP2002516420A (ja) 音声コーダ
EP1116224A1 (en) Noise suppression for low bitrate speech coder
KR20060007363A (ko) 백엔드 음성 활동 검출 장치 및 방법을 이용한 분산스피치 인식
EP1386313B1 (en) Speech enhancement device
US5732388A (en) Feature extraction method for a speech signal
EP0882287B1 (en) System and method for error correction in a correlation-based pitch estimator
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
KR100434538B1 (ko) 음성의 천이 구간 검출 장치, 그 방법 및 천이 구간의음성 합성 방법
Ishizuka et al. Study of noise robust voice activity detection based on periodic component to aperiodic component ratio.
JP3815323B2 (ja) 周波数変換ブロック長適応変換装置及びプログラム
CN106716529A (zh) 对数字音频信号中的前回声进行辨别和衰减
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
JP2003058186A (ja) 雑音抑圧方法および雑音抑圧装置
KR100291584B1 (ko) 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법
JP2002258899A (ja) 雑音抑圧方法および雑音抑圧装置
JPH0449952B2 (ko)
KR100194953B1 (ko) 유성음 구간에서 프레임별 피치 검출 방법
KR100399057B1 (ko) 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
KR20040073145A (ko) 음성인식기의 성능 향상 방법
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
JPH0377998B2 (ko)

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 19991117

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20020624

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 19991117

Comment text: Patent Application

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20040429

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20040525

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20040527

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20070319

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20080312

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20080312

Start annual number: 5

End annual number: 5

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee