KR950013555B1

KR950013555B1 - 음성신호처리장치

Info

Publication number: KR950013555B1
Application number: KR1019940023425A
Authority: KR
Inventors: 죠지 카네; 아끼라 노하라
Original assignee: 마쯔시다덴기산교 가부시기가이샤; 다니이 아끼오
Priority date: 1990-05-28
Filing date: 1994-09-15
Publication date: 1995-11-08
Anticipated expiration: 2011-05-28

Abstract

내용 없음.

Description

음성신호처리장치

제1도는 본 발명의 제1실시예에 의한 음성신호처리장치를 도시한 블록도.

제2도는 본 발명의 제2실시예에 의한 음성신호처리장치를 도시한 블록도.

제3도는 음성신호처리장치의 음성판별수단을 구체적으로 도시한 블록도.

제4도는 본 발명의 제3실시예에 의한 음성신호처리장치를 도시한 블록도.

제5도는 본 발명의 켑스트럼분석을 설명하기 위한 그래프.

제6도는 본 발명의 제4실시예에 의한 음성신호처리장치를 도시한 블록도.

제7도는 본 발명의 제5실시예에 의한 음성신호처리장치를 도시한 블록도.

제8도는 본 발명의 제6실시예에 의한 음성신호처리장치를 도시한 블록도.

제9도는 제8도의 제6실시예의 구체예에 의한 음성신호처리장치를 도시한 블록도.

제10도는 본 발명의 제7실시예에 의한 음성신호처리장치를 도시한 블록도.

제11도는 본 발명에 의한 잡음제거방법을 설명하기 위한 그래프.

제12도는 본 발명에 의한 잡음예측을 설명하기 위한 그래프.

제13도는 본 발명에 의한 다른 잡음제거방법을 설명하기 위한 그래프.

제14도는 종래의 음성신호처리장치를 표시한 블록도.

* 도면의 주요부분에 대한 부호의 설명

201, 307 : 대역분할수단 201' : FFT수단

202, 308 : 켑스트럼분석수단 203, 309 : 음성판정수단

204, 304 : 잡음구간판정수단 205, 305 : 뮤팅제어수단

206, 306 : 뮤팅수단 207 : A/D변환수단

208 : 디지틀뮤팅수단 209 : D/A변환수단

201, 301 : 음성검출수단 211 : 기억수단

212 : 최대우도추정수단 231 : 피크검출수단

232 : 평균치산출수단 233 : 모음/자음판정수단

234 : 음성판정회로 302 : 잡음예측수단

303 : 잡음제거수단 310 : 대역합성수단

311 : 잡음파워산출수단

본 발명은 음성인식의 앞단계 등에 사용되는 음성신호처리장치에 관한 것이다.

제14도에 종래의 음성신호처리장치를 도시한다. 제14도에 도시한 바와같이, 종래의 음성신호처리장치는, 잡음을 포함한 음성신호에 대해서, 음성구간을 검출하는 음성검출수단(451)과, 상기 음성검출수단(451)에 의해 검출된 음성구간으로부터 잡음구간을 산출하는 잡음구간판정수단(452)과, 상기 잡음구간판정수단(452)으로부터 뮤팅하기 위한 뮤팅제어신호를 발생하는 뮤팅제어수단(453)과, 상기 뮤팅제어신호에 응답하여 상기 잡음을 포함한 음성신호로부터, 잡음구간의 신호를 감쇠하는 뮤팅수단(454)을 구비하고 있다.

상기 종래의 음성신호처리장치는, 음성검출수단(451)에서 잡음을 포함한 음성신호로부터 음성구간을 검출하고, 잡음구간판정수단(452)에 의해 검출된 음성구간을 반전하여 잡음구간을 검출하고, 뮤팅제어수단(453)에 의해 잡음구간에 대한 제어신호를 발생하고, 뮤팅수단(454)에 의해 잡음을 포함한 음성신호로부터 잡음구간의 신호를 감쇠한다.

그러나, 이와같은 종래의 음성신호처리장치에서는, 잡음의 억제가 충분하지 않기 때문에 음성인식장치등의 앞단계에 사용되는 경우 인식율이 낮다.

본 발명의 제1목적은, 상기의 종래의 음성신호처리장치의 과제를 고려하여, 잡음을 효과적으로 억제할 수 있는 음성신호처리장치를 제공하는 데 있다.

본 발명의 제2목적은, 상기의 종래의 음성신호처리장치의 과제를 고려하여, 잡음제거를 행한 다음에, 잡음을 감쇠하는 음성신호처리장치를 제공하는데 있다.

본 발명의 제1목적에 따른 제1측면에 의하면, 잡음을 포함한 음성입력신호에 대해서 푸리에 변환을 포함한 주파수대역분할처리를 행하고 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 대해 켑스트럼분석(cepstrum analysis)처리를 행하고 켑스트럼결과를 출력하는 켑스트럼수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 음성신호구간을 검출하고, 검출된 음성신호구간을 출력하는 음성판정수단과, 상기 음성판정수단으로부터 검출된 음성신호구간에 응답하여 잡음구간을 검출하는 잡음구간판정수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 응답하여, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만 잡음혼입의 음성입력 신호를 감쇠하고, 검출된 잡음구간에 대해서만 감쇠된 음성신호를 출력하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치가 제공된다.

본 발명의 제1목적에 따른 제2측면에 의하면, 복수인의 음성특징을 미리 기억하고 있는 기억수단과, 잡음혼입의 음성입력신호에 응답하여 음성신호구간을 검출하고, 검출된 음성구간을 출력하는 음성검출수단과, 상기 음성검출수단으로부터 출력된 음성신호의 특징정보와 상기 기억수단에 저장된 복수인의 음성특징을 비교하여 음성신호의 종류를 검출하고 검출된 음성신호의 종류를 출력하는 최대우도추정(maximum likelihood estimation)수단과, 상기 음성검출수단으로부터 출력된 음성신호구간과 상기 최대우도검출수단으로부터 출력된 음성신호의 종류에 응답하여 잡음구간을 검출하고, 검출된 잡음구간을 출력하는 잡음구간판정수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 응답하여 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만 상기 잡음을 포함한 음성신호를 감쇠하고, 검출된 잡음구간에 대해서만 감쇠된 음성신호를 출력하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치가 제공된다.

상기 제1, 제2측면에 따른 구성에 의한 음성신호처리장치는, 켑스트럼분석을 이용해서 잡음부분을 산출하고 있으므로, 한층더 정확히 잡음감쇠가 가능해진다.

또, 여러사람의 음성의 특징을 기억해 놓고 특정인 이외의 음성을 잡음으로 취급하므로, 잡음을 한층더 효과적으로 감쇠하여 특정인의 음성을 추출할 수 있다.

본 발명의 제2목적에 따르면, 잡음을 포함한 음성입력신호에 응답하여 음성신호구간을 검출하고 검출된 음성신호구간을 출력하는 음성검출수단과, 상기 음성검출수단에 의해 검출된 음성신호구간에 응답하여 잡음구간을 검출하고 검출된 잡음구간을 출력하는 잡음구간판정수단과, 상기 음성검출수단으로부터 검출된 음성신호구간에 의거해서, 상기 잡음혼입의 입력신호로부터 음성신호구간의 잡음을 예측하고 예측된 잡음을 출력하는 잡음예측수단과, 상기 잡음예측수단에 의해 예측된 잡음을 상기 잡음혼입의 입력신호로부터 제거하고, 잡음제거된 음성신호를 출력하는 잡음제거수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간정보에 응답하여, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만 상기 잡음제거수단으로부터 잡음제거된 음성신호를 소정의 감쇠값으로 감쇠하고, 검출된 잡음구간에 대해서만 소정의 감쇠값으로 감쇠된 음성신호를 출력하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치가 제공된다.

상기 구성에 의한 음성신호처리장치는, 음성구간의 잡음을 제거해서, 잡음구간의 잡음을 감쇠하므로, 한층 더 효과적인 잡음감쇠가 가능하게 된다.

이하 본 발명의 실시예의 각각에 대해 도면을 참조하면서 설명한다.

[제1실시예]

제1도는, 본 발명의 제1 실시예에 의한 음성신호처리장치를 도시한 블록도이다.

제1도에 있어서, (201)은, 신호를 주파수분석하는 주파수분석수단의 일예로서의 대역분할수단이고, 특히 신호를 A/D변환하는 A/D변환수단과, 푸리에 변환하는 FFT(fast Fourier transformer)수단을 구비하고, (202)는, 켑스트럼분석을 행하는 켑스트럼분석수단이고, (203)은 켑스트럼분석결과를 이용해서 음성구간을 판정하는 음성판정수단이다.

보다 구체적으로 설명하면, 음성판정수단(203)은, 제3도에 도시한 바와같이, 켑스트럼분포의 피크를 검출하는 피치검출수단의 일예로서의 피크검출수단(231)과, 켑스트럼분포의 평균치를 산출하는 평균치산출수단(232)과, 모음과 자음을 판정하는 모음/자음판정수단(233) 및 음성판정회로(234)를 가진다.

잡음구간판정수단(204)은, 상기 음성판정수단(203)에 의해 판정된 음성구간정보에 의거해서, 잡음구간을 검출하는 수단이다. 예를들면, 검출된 음성구간을 반전하여 잡음구간을 검출한다. 뮤팅제어수단(205)은, 잡음구간에 대한 제어신호를 발생하는 수단으로서, 예를들면, 잡음구간의 시작과 종료의 타이밍을 발생하는 피로이다. 뮤팅수단(206)은, 뮤팅제어신호에 따라서, 잡음혼입의 음성신호에 대해서 잡음구간의 신호를 감쇠하는 수단이다.

다음에, 상기 실시예의 동작을 설명한다.

잡음혼입의 음성신호는, 대역분할수단(201)에 의해 대역분할되고, 켑스트럼분석수단(202)에 의해 켑스트럼분석을 행한다. 켑스트럼이란, 파형의 단시간 진폭스펙트럼의 대수를 푸리에 역변환한 것으로서, 제5도에 도시한 바와같다. 제5(a)도는, 단시간 스펙트럼이고, 제5(b)도는, 켑스트럼이다. 피크검출수단(231)은, 켑스트럼 분석결과에 대해서 피크(피치)를 검출한다. 제5(b)도의 피치가 피크를 표시하고, 피크가 존재하는 곳이 음성신호부분이다. 피크의 검출에 대하여 예를들면, 소정의 한계치가 미리 설정하고, 이것과의 비교를 행함으로써 피크를 검출한다. 평균치산출수단(232)은 켐스트럼분석결과에 대한 평균치를 산출한다. 모음/자음판정수단(233)은, 피크정보와 평균치정보에 의해서, 모음/자음을 판정한다. 즉, 피크검출수단(231)으로부터 피크가 검출된 것을 나타내는 신호가 입력된 경우에는, 음성신호입력은 모음구간으로 판정한다. 또한, 자음의 판정에 대해서는, 예를들면 평균치산출수단(232)으로부터 입력되는 켑스트럼평균치가 미리 결정된 규정치보다 큰 경우나 켑스트럼평균치의 증가량(미분계수)이 미리 결정된 규정치보다 큰 경우에는, 음성신호입력은 자음구간으로 판정한다. 결과적으로, 모음/ 자음을 표시한 신호나 모음과 자음을 포함한 음성구간을 표시한 신호를 출력한다. 음성판정회로(234)는 상기 모음/자음판정수단(233)의 출력에 의해 음성구간을 판정한다. 잡음구간판정수단(204)은 음성구간정보를 반전하여 잡음구간을 산출한다. 뮤팅제어수단(205)은 잡음구간정보를 이용해서 제어신호를 출력한다. 뮤팅수단(206)은 제어신호에 응답하여 잡음혼입의 음성신호의 잡음구간의 레벨을 감쇠한다.

[제2실시예]

제2도는, 본 발명의 제2의 실시예에 의한 음성신호처리장치를 도시한 블록도이다.

본 실시예에서는 모두 디지틀처리로 행하여진다. A/D변환수단(207)은 잡음을 포함한 음성신호를 디지틀 신호로 변환하는 수단이다. FFT(201)는 디지틀신호를 푸리에 변환하는 수단이다. 켑스트럼분석수단(202), 음성판정수단(203), 잡음구간판정수단(204), 뮤팅제어수단(205)은, 제1도의 제1실시예와 마찬가지이다. 디지틀뮤팅수단(208)은, 뮤팅제어수단(205)으로부터의 제어신호에 따라서, A/D변환수단(207)으로부터 출력된 디지틀신호를 감쇠하기 위한 디지틀기능을 가진 수단이다. D/A변환수단(209)은 디지틀뮤팅수단(208)의 디지틀출력을 애널로그신호로 변환하는 수단이다.

이들 수단에 의해 모두 디지틀적으로 처리되고 잡음구간을 감쇠한다.

[제3실시예]

제4도는, 본 발명의 제3실시예에 의한 신호처리장치를 도시한 도면이다.

음성검출수단(210)은, 잡음을 포함한 음성신호의 음성구간을 검출하는 수단이다. 예를들면, 상기 음성검출수단(210)은, 제1도에 도시된 바와같이, 대역분할수단(201), 켑스트럼분석수단(202), 음성판정수단(203)으로 이루어질 수 있다. 또는, 필터등을 사용한 회로이어도 된다.

기억수단(211)은 여러사람의 음성신호의 특징을 미리 기억한 ROM등으로 이루어진 수단이다. 상기 기억수단(211)은, 특정인의 음성특징을 선택하여 출력하는 음성선택신호가 입력되도록 되어 있다.

최대우도추정수단(212)은, 상기 음성검출수단(210)에서 검출된 음성부분과 기억수단(211)으로부터 선택되어 출력되는 음성특징을 비교하고, 비교된 음성이 누구의 음성인지를 검출하는 수단이다. 상기 최대우도추정수단(212)에서 사용되는 방법으로서는, 패턴매칭법, 진폭레벨의 유사도, 위상의 유사도를 조사하는 방법등이 있다. 이에 의해, 현재 발생되는 음성은, 선택된 사람의 음성인지의 여부를 검출할 수 있다. 잡음구간판정수단(204)은, 상기 음성검출수단(210)의 출력과 최대우도추정수단(212)의 출력을 입력하고, 음성검출수단(204)으로부터의 신호에 의거해서, 음성이외의 잡음구간을 산출하고, 또한 최대우도추정수단(212)의 출력신호에 의거해서 선택된 사람의 음성인지의 여부를 판정한다. 즉, 잡음인지의 여부를 판정한다. 뮤팅제어수단(205)과 뮤팅수단(206)은, 제1도의 제1실시예의 것과 마찬가지이다.

본 실시예의 동작은 다음과 같다.

미리, 여러사람(A, B, C, …)의 음성의 특징을 기억수단(211)에 기록해둔다. 그리고, 특정인(예를들면, A)의 음성을 선택하는 음성선택신호를 입력시켜둔다. 그 결과, 기억수단(211)으로부터는, "A"의 음성이 특징정보가, 최대우도추정수단(212)에 입력된다.

지금, 자동차를 "A"가 운전하고 있고, "B"가 동승자로 타고 있다고 가정한다. 운전하고 있는 "A"는, 음성을 사용해서, 음성을 사용한 다이얼이나 핸드프리폰(hand-free telephone)에 의한 통화를 행한다. "A"가 발음하는 음성에는, 자동차의 엔진음등 본래의 잡음이 들어가는 외에, 동승자 "B"의 음성등이 들어간다.

음성검출수단(210)은, 이들 잡음혼입의 음성을 입력하고, 음성부분을 검출한다. 검출된 음성신호는, 잡음산출수단(204)과, 최대우도추정수단(212)으로입력된다. 최대우도추정수단(212)은, 음성검출수단(210)에서 검출된 음성의 특징과, 기억수단(211)으로부터 출력된 "A"의 음성특징을 비교하고, 비교되는 음성이 "A"의 음성인지의 여부를 추정한다. 따라서, 검출된 음성이 "B"의 음성인 경우에는, "A"의 음성이 아니라고 추정한다. 또, 검출된 음성이 "A"의 음성인 경우에는, "A"의 음성이라고 추정한다.

잡음구간판정수단(204)은, 음성검출수단(210)으로부터의 신호에 의거, 음성이 아닌 엔진음등의 신호구간을 잡음구간으로 함과 동시에, 최대우도추정수단(212)의 추정결과를 입력하고, "A"가 아닌 사람의 음성도 잡음으로서, 본래의 잡음과 같이 잡음구간으로 한다. 즉, "A"의 음성만을 음성구간으로 한다. 그 결과를 뮤팅제어수단(205)으로 출력한다. 뮤팅제어수단(205)은 상기 잡음구간판정수단(204)의 출력에 응답하여 제어신호를 출력한다. 뮤팅수단(206)은, 상기 제어신호를 수신하여 잡음구간에 대해서 신호를 감쇠한다. 이에 의해, 엔진의 음은 물론이거니와 "A"가 아닌 다른 사람의 음성도 잡음으로서 감쇠되므로, 잡음이 충분히 억제된 "A"의 음성신호만을 얻게 된다. 따라서, 음성을 사용한 다이얼이나 핸드프리폰에 의한 통화가 틀림없이 행하여 진다.

[제4실시예]

제6도는, 제4실시예에 의한 음성신호처리장치의 블록도로서, 제4도에 도시한 제3실시예의 음성검출수단(210)대신에, 대역분할수단(201), 켑스트럼분석수단(202), 음성판정수단(203)으로 대치되어 있다. 이들 각각의 수단은, 제1도의 제1실시예의 것과 마찬가지이기 때문에 이에 대한 설명은 생략한다. 본 실시예에서는, 켑스트럼분석이 사용되므로, 기억수단(211)이나 최대우도추정수단(212)에서 사용되는 음성특징도, 켑스트럼분석결과의 피크정보, 평균치정보, 또는 포만트(formant)정보가 사용되는 것이 바람직하다.

[제5실시예]

제7도는, 제5실시예에 의한 음성신호처리장치를 도시한 블록도로서, 제6도에 도시한 제4실시예의 음성판정수단(203) 대신에, 피크검출수단(231), 평균치산출수단(232), 모음/자음판정수단(233) 및 음성판정회로(234)로 대치되어 있다. 이들 각각의 수단은, 제3도에서 표시되는 것과 마찬가지이기 때문에, 이에 대한 설명은 생략한다. 본 실시예에서는, 모음/자음이 판정되므로, 음성부분의 판단이 한층 더 정확하게 된다.

[제6실시예]

제8도는, 본 발명의 제6실시예에 의한 음성신호처리장치의 블록도이고, 제9도는 제8도의 음성신호처리장치를 구체화한 실시예를 표시한 블록도이다. 이하, 제8도와 제9도를 참조하면서 음성신호처리장치에 대하여 설명한다.

제8도에 있어서, 음성검출수단(301)은, 잡음을 포함한 음성신호에 음성구간을 검출하기 위한 수단으로서, 예를들면, 제9도에 표시한 바와같은, 대역분할수단(307), 켑스트럼분석수단(308), 음성판정수단(309)등으로 구성될 수 있다. 즉, 대역분할수단(307)은, 잡음을 포함한 신호를 대역분할하는 대역분할수단이고, 예를들면, 신호를 A/D변환하는 A/D변환수단과 푸리에 변화하는 FFT수단을 구비하고 있다. 켑스트럼분석수단(308)에 있어서의 켑스트럼이란, 파형의 단시간 진폭스펙트럼의 대수를 푸리에 역변환한 것으로서, 제5도에 도시한 바와같다. 제5(a)도는, 단시간 스펙트럼이고, 제5(b)도는 켑스트럼이다. 음성판정수단(309)은, 예를들면, 켑스트럼분포의 피크를 검출하는 피치검출수단, 켑스트럼분포의 평균치를 산출하는 평균치산출수단, 모음과 자음을 판정하는 모음/자음판정수단, 음성판정회로로 구성되고, 음성부분을 판정한다.

잡음구간판정수단(304)은, 상기 음성검출수단(301)에 의해 판정된 음성구간정보에 의거해서, 잡음구간을 검출하는 수단이다. 예를들면, 음성구간을 반전하여 잡음구간을 검출한다. 뮤팅제어수단(305)은, 잡음구간에 대해 제어신호를 발생하는 수단으로서, 예를들면, 잡음구간의 시작과 종료의 타이밍을 발생하는 회로이다. 또한, 상기 뮤팅제어수단(305)은, 외부로부터 부여되는 뮤팅 ON/OFF 제어신호에 따라서 제어신호를 출력하도록 되어 있다. 상기 뮤팅 ON/OFF 제어신호는 수동으로 설정되는 외부신호로서, 입력신호가 잡음뿐일 때나 처리시에 잡음이 불필요한 때에는 ON으로 설정하고, 처리시에 잡음이 존재하여도 되는 때에 OFF로 설정한다.

잡음예측수단(302)은, 음성검출수단(301)에 의해서 움성구간이 검출되면, 검출된 음성구간을 이용해서, 음성구간이외의 부분을 잡음만의 구간으로 예측할 수 있다. 즉, 잡음만의 구간의 잡음데이터를 이용해서 음성구간중의 잡음데이터를 예측하는 수단이다. 또한, 제9도에 도시한 바와같이, 상기 잡음예측수단(302)은 m개의 채널로 분할된 잡음혼입의 음성신호에 의거하여 잡음성분을 각 채널마다 예측한다.

예를들면, 제12도에 표시한 바와같이, X축에 주파수, Y축에 음성레벨, Z축에 시간을 취함과 동시에, 주파수(f1)에서 데이터(P₁), (P₂), …, (Pi)를 취하고, 다음의 데이터(Pj)를 예측한다. 예를들면, 잡음부분(P₁)∼(Pi)의 평균을 취해서 "Pj"로 한다. 또는, 음성신호부분이 계속될때는 "Pj"에 감쇠계수를 곱한다.

잡음제거수단(303)은, 상기 잡음예측수단(302)에 의해서 예측된 잡음을 상기 잡음혼입의 음성신호로부터 제거하는 수단이다. 일반적으로, 잡음제거방법의 일예로서, 시간축에서의 잡음제거는, 제11도에 도시한 바와 같이, 잡음혼입의 음성신호(a)로부터 예측된 잡음파형(b)을 감산함으로써, 행해진다. 이에 의해 신호(c)만이 인출된다. 또는, 제9도의 실시예와 같은 주파수축에서의 잡음제거는, 제13도에 표시한 바와같이, 주파수를 기준으로 하여 잡음을 제거하기 위하여, 잡음을 포함한 음성신호(a)를 푸리에 변환하고, 푸리에 변환된 입력파형(b)으로부터 예측잡음의 스펙트럼(c)을 감산하고, 이것을 푸리에 역변환해서, 잡음이 없는 음성신호(e)를 얻는다. 즉, 잡음제거수단(30)은, 대역분할수단(307)과 잡음예측수단(302)으로부터 m개의 채널의 신호가 공급되고, 채널마다 잡음을 감산해서 제거하는 수단이다. 대역합성수단(310)은, 음질이 양호한 음성출력을 얻기 위하여, 잡음제거수단(303)으로부터 공급되는 m개의 채널의 신호를 푸리에 역변환하는 수단이다.

뮤팅수단(306)은, 상기 뮤팅제어수단(305)으로부터 출력되는 제어신호에 따라서 상기 잡음제거수단(303)으로부터의 출력신호에 대해서 잡음구간의 신호를 감쇠하는 수단이다.

다음에, 상기 실시예의 동작에 대하여, 제9도를 참조하면서 설명한다.

잡음을 포함한 음성신호를, 대역분할수단(301)에 의해 대역분할한 다음에, 켑스트럼분석수단(302)에 의해 켑스트럼분석을 행한다. 음성판정수단(309)의 피크검출수단은, 켑스트럼분석결과로부터 피크(피치)를 검출한다. 제5(b)도의 피치가 피크를 표시하고, 피크가 존재하는 곳이 음성신호구간이다. 피크의 검출에 대하여 예를들면 소정의 한계치를 미리 설정해 놓고, 한계치와의 비교를 행함으로써 피크를 검출한다. 또한, 음성판정수단(309)의 평균치산출수단은 켑스트럼분석겨로가에 대한 평균치를 산출한다. 또한, 음성판정수단(309)의 모음/자음판정수단은, 피크정보와 평균치정보에 의해서, 모음/자음을 판정한다. 즉, 피크검출수단으로부터 피크가 검출된 것을 표시한 신호를 입력한 경우에는, 음성신호입력은 모음구간으로 판정된다. 또한, 자음의 판정에 대해서는, 예를들면 평균치산출수단으로부터 입력되는 켑스트럼평균치가 미리 결정된 규정치보다 큰 경우나 켑스트럼평균치의 증가량(미분계수)이 미리 결정된 규정치보다 큰 경우에는, 음성신호입력은 자음구간으로 판정한다. 결과적으로, 모음/자음을 표시한 신호나 모음과 자음을 포함한 음성구간을 표시한 신호를 출력한다. 음성판정회로는, 모음/자음판정수단의 출력에 의거해서 음성구간을 판정한다.

잡음구간판정수단(304)은 상기 음성구간정보를 반전하여 잡음구간을 산출한다. 뮤팅제어수단(305)은 잡음구간정보를 이용해서 제어신호를 출력한다. 뮤팅수단(306)은 상기 뮤팅제어수단(305)의 제어신호에 따라서 잡음을 포함한 음성신호의 잡음구간의 레벨을 감쇠한다. 또한, 뮤팅 ON/OFF 제어신호가 OFF인 경우에는, 감쇠되지 않는다.

잡음예측수단(302)은, 음성판정수단(309)으로부터의 신호를 이용해서, 잡음만의 부분적인 데이터에 의거해서, 대역분할된 음성신호로부터, 음성신호부분내의 잡음을 예측한다. 잡음제거수단(303)은, 상기 잡음예측수단(302)에 의해 예측된 잡음을, 대역분할수단(307)으로부터 출력되는 대역분할된 잡음혼입의 음성신호로부터 제거한다. 잡음이 제거된 음성신호는, 대역합성수단(310)에 의해서 합성된다.

뮤팅수단(306)은, 상기 뮤팅제어신호에 따라서 대역합성된 신호로부터 잡음구간의 신호를 감쇠한다.

[제7실시예]

제10도는, 본 발명의 제7실시예에 의한 음성신호처리장치를 도시한 블록도이다.

본 실시예는, 제8도의 제6실시예에 잡음파워산출수단(311)이 부가되어 있다. 즉, 상기 잡음파워산출수단(311)은, 음성검출수단(301)에서 검출된 음성부분정보를 입력하고, 잡음부분의 파워를 산출하는 수단이다. 그리고, 상기 뮤팅제어수단(305)은, 상기 잡음파워산출수단(311)의 산출결과에 의거하여 잡음의 감쇠의 여부나 감쇠의 정도를 제어한다. 제8도와 제9도의 제6실시예에서는, 뮤팅제어수단(305)에 입력되는 뮤팅 ON/OFF 제어신호나 외부로부터 고정되지만, 이에 대해서 본 실시예에서는, 잡음파워의 크기에 대응해서, 예를들면, 잡음이 큰 때에만, 잡음의 감쇠를 행하게 하고, 잡음이 비교적 적을 때에는, 잡쇠를 행하지 않도록 한다.

[기타 실시예]

또한, 이상의 실시예에 있어서, 켑스트럼분석수단, 음성검츨수단, 잡음구간판정수단, 뮤팅수단, 잡음제거수단 등의 각종 수단은, 컴퓨터를 이용해서 소프트웨어적으로 실현할 수 있으나, 전용의 하드회로를 사용하여 실현가능하다.

이상의 설명으로부터 명백한 바와같이, 본 발명에 의한 음성신호처리장치는, 켑스트럼분석을 이용해서 잡음부분을 산출하고 있기 때문에, 한층더 정확한 잡음감쇠가 가능하다. 또한, 여러사람의 음성의 특징을 기억해 두고, 특정인 이외의 음성을 잡음으로 취급하기 때문에, 한층더 효과적으로 잡음을 감쇠한 상태에서 특정인의 음성을 추출할 수 있다.

또한, 본 발명에 의한 신호처리장치는, 음성부분의 잡음을 제거하고 또한 잡음구간의 잡음을 감쇠하기 때문에, 한층더 효과적으로 잡음감쇠가 가능하다.

Claims

잡음을 포함한 음성입력신호에 대해서 푸리에 변환을 포함한 주파수대역분할처리를 행하고, 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 대해 켑스트럼분석(cepstrum analysis)처리를 행하고, 켑스트럼분석결과를 출력하는 켑스트럼분석수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 음성신호구간을 검출하고, 검출된 음성신호구간을 출력하는 음성판정수단과, 상기 음성판정수단으로부터 검출된 음성신호구간에 응답하여 잡음구간을 검출하는 잡음구간판정수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 응답하여 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만 잡음혼입의 음성입력신호를 감쇠하고, 검출된 잡음구간에 대해서만 감회된 음성신호를 출력하는 뮤팅수단을 포함한 음성신호처리장치에 있어서, 상기 음성판정 수단은, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 피크를 검출하고검출된 켑스트럼의 피크를 출력하는 피크검출수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 평균치를 산출하고, 산출된 평균치를 출력하는 평균치산출수단과, 상기 피크검출수단으로부터 출력된 상기 켑스트럼의 피크에 응답하여 모음을 검출하고, 상기 평균치산출수단으로부터 출력된 평균치에 응답하여 자음을 검출하고, 검출결과를 출력하는 모음/자음판정수단과, 상기 모음/자음판정수단으로부터 출력된 검출결과에 응답하여 음성신호구간을 검출하고, 검출된 음성신호구간을 출력하는 음성판정회로를 가지는 것을 특징으로 하는 음성신호처리장치.
복수인의 음성특징을 미리 기억하고 있는 기억수단과, 잡음혼입의 음성입력신호에 응답하여 음성신호구간을 검출하고, 검출된 음성신호구간을 출력하는 음성검출수단과, 상기 음성검출수단으로부터 출력된 음성신호의 특징과 상기 기억수단에 저장된 복수인의 음성특징을 비교하여 음성신호의 종류를 검출하고, 검출된 음성신호의 종류를 출력하는 최대우도추정(maximum likelihood estimation)수단과, 상기 음성검출수단으로부터 출력된 음성신호구간과 상기 최대우도추정수단으로부터 출력된 음성신호의 종류에 응답하여 잡음구간을 검출하고, 검출된 잡음구간을 출력하는 잡음구간판정수단과, 상기 잡음구간판정수단으로부터 검출된 잡음 구간에 응답하여 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만 상기 잡음을 포함한 음성신호를 감쇠하고, 검출된 잡음구간에 대해서만 감쇠된 음성신호를 출력하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치.
제2항에 있어서, 상기 음성검출수단은, 잡음을 포함한 음성입력신호에 대해서 푸리에 변환을 포함한 주파수대역분할처리를 행하고 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 대해 켑스트럼분석을 행하고, 켑스트럼결과를 출력하는 켑스트럼분석수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 음성신호구간을 검출하고 검출된 음성신호구간을 출력하는 음성판정수단을 가지는 것을 특징으로 하는 음성신호처리장치.
제3항에 있어서, 상기 음성판정수단은, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 피크를 검출하고, 검출된 켑스트럼의 피크를 상기 최대우도추정수단에 출력하는 피크검출수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 켑스트럼의 평균치를 산출하고, 상기 최대우도추정수단에 상기 평균치를 출력하는 평군치산출수단과, 상기 피크검출수단으로부터 검출된 켑스트럼의 피크에 응답하여 모음을 검출하고, 상기 평균치산출수단으로부터 산출된 평균치에 응답하여 자음을 검출하여, 감출결과를 출력하는 모음/자음판정수단을 구비하고, 상기 기억수단에 기억된 복수인의 음성특징과 상기 최대우도추정수단에 의해 비교된 음성특징은, 켑스트럼의 피트와 평균치인 것을 특징으로 하는 음성신호처리장치.
잡음을 포함한 음성입력신호에 응답하여 음성신호구간을 검출하고 검출된 음성신호구간을 출력하는 음성검출수단과, 상기 음성검출수단에 의해 검출된 음성신호구간에 응답하여 잡음구간을 검출하고 검출된 잡음구간을출력하는 잡음구간판정수단과, 상기 음성검출수단으로부터 검출된 음성신호구간에 의거해거, 상기 잡음혼입의 입력신호로부터 음성신호구간의 잡음을 예측하고 예측된 잡음을 출력하는 잡음예측수단과, 상기 잡음혼입의 입력신호로부터 잡음예측수단에 의해 예측된 잡음을 제거하고 잡음제거된 음성신호릏 출력하는잡음제거수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 응답하여, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만, 상기 잡음제거수단으로부터 잡음제거된 음성신호를 소정의 감쇠값으로 감쇠하고, 검출된 잡음구간에 대해서만 감쇠된 음성신호를 출력하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치.
제 5 항에 있어서, 음성검출수단에서 검출된 음성신호구간에 응답하여 잡음혼입의 음성입력신호로부터 잡음부분의 파워를 산출하고, 산출된 잡음부분의 파워를 상기 뮤팅수단에 출력하는 잡음파워산출수단을 부가하여 구비하여, 상기 뮤팅수단은, 상기 잡음파워산출수단의 산출결과에 의거하여 잡음의 감쇠값을 변경하는 것을 특징으로 하는 음성신호처리장치.
잡음을 포함한 음성입력신호에 대해서 푸리에 변환을 포함한 주파수대역분할처리를 행하고, 복수채널의 스펙트럼신호를 출력하는 대역분할수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호에 대해 켑스트럼분석처리를 행하고 켑스트럼분석결과를 출력하는 켑스트럼수단과, 상기 켑스트럼분석수단으로부터 출력된 켑스트럼분석결과에 응답하여 음성신호구간을 검출하고, 검출된 음성신호구간을 출력하는 음성판정수단과, 상기 음성판정수단으로부터 검출된 음성신호구간에 응답하여 잡음구간을 검출하고 검출된 잡음구간을 출력하는 잡음구간판정수단과, 상기 음성판정수단으로부터 검출된 음성신호구간에 응답하여, 상기 대역분할수단으로부터 출력된 복수의 스펙트럼신호의 잡음을 예측하고, 복수채널의 예측잡음을 출력하는 잡음예측수단과, 상기 대역분할수단으로부터 출력된 복수채널의 스펙트럼신호로부터 상기 잡음예측수단에 의해 예측된 잡음을 제거하고 잡음제거된 음성신호를 출력하는 잡음제거수단과, 잡음이 제거된 복수채널의 스펙트럼신호를 대역합성하고, 대역합성된 스펙트럼신호를 변환된 음성신호로 푸리에 역변환하고, 역변환된 음성신호를 출력하는 대역합성수단과, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 응답하여, 소정의 감쇠값으로, 상기 잡음구간판정수단으로부터 검출된 잡음구간에 대해서만, 상기 대역합성수단으로부터 출력된 음성신호를 소정의 감쇠값으로, 감쇠하는 뮤팅수단을 구비한 것을 특징으로 하는 음성신호처리장치.