[go: up one dir, main page]

KR100970446B1 - 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 - Google Patents

주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 Download PDF

Info

Publication number
KR100970446B1
KR100970446B1 KR1020080040890A KR20080040890A KR100970446B1 KR 100970446 B1 KR100970446 B1 KR 100970446B1 KR 1020080040890 A KR1020080040890 A KR 1020080040890A KR 20080040890 A KR20080040890 A KR 20080040890A KR 100970446 B1 KR100970446 B1 KR 100970446B1
Authority
KR
South Korea
Prior art keywords
noise level
frequency
harmonic
high band
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020080040890A
Other languages
English (en)
Other versions
KR20090052789A (ko
Inventor
이태진
백승권
김민제
서정일
장대영
강경옥
홍진우
박영철
김인철
박호종
오승준
안창범
심동규
Original Assignee
한국전자통신연구원
광운대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 광운대학교 산학협력단 filed Critical 한국전자통신연구원
Priority to US12/414,768 priority Critical patent/US8296157B2/en
Publication of KR20090052789A publication Critical patent/KR20090052789A/ko
Application granted granted Critical
Publication of KR100970446B1 publication Critical patent/KR100970446B1/ko
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10046Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10222Improvement or modification of read or write signals clock-related aspects, e.g. phase or frequency adjustment or bit synchronisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10564Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account frequency

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법에 관한 것으로, 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 고대역 잡음레벨을 조정함으로써, 고대역 잡음레벨을 정확하게 측정할 수 있으며 고대역 신호의 품질을 향상시킬 수 있게 하는, 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법을 제공하고자 한다.
이를 위하여, 본 발명은 가변 잡음레벨 결정 장치에 있어서, 주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하기 위한 잡음레벨 결정 수단; 상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하기 위한 피치 주파수 분석 수단; 및 상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하기 위한 잡음레벨 조정 수단을 포함한다.
주파수 확장, 고대역, 톤 성질, 고대역 잡음레벨, 피치 주파수

Description

주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법{APPARATUS AND METHOD FOR DECIDING ADAPTIVE NOISE LEVEL FOR FREQUENCY EXTENSION}
본 발명은 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 고대역 잡음레벨을 조정함으로써, 고대역 잡음레벨을 정확하게 측정할 수 있으며 고대역 신호의 품질을 향상시킬 수 있게 하는, 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법에 관한 것이다.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT성장동력기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2007-S-005-01, 과제명: AV코덱 고도화를 통한 리치미디어 방송 기술개발].
도 1 은 주파수 확장을 이용한 일반적인 오디오 부호화/복호화 장치의 구성 도이다.
도 1에 도시된 바와 같이, 주파수 확장을 이용한 일반적인 오디오 부호화 장치(110)는 저대역 신호 추출부(111), 저대역 부호화부(112) 및 고대역 부호화부(113)를 포함한다. 반면에, 주파수 확장을 이용한 일반적인 오디오 복호화 장치(120)는 저대역 복호화부(121), 고대역 복호화부(122) 및 합성부(123)를 포함한다. 여기서, 고대역 복호화부(122)는 고대역 합성부(1221)와 고대역 보정부(1222)를 포함한다.
주파수 확장을 이용한 일반적인 오디오 부호화 장치(110)는 주파수 확장 기술을 이용하여 입력 신호를 압축하는 기능을 수행한다.
구체적으로 살펴보면, 저대역 신호 추출부(111)는 입력 신호(오디오 신호)를 입력받아 저주파 통과 필터(LPF: Low Pass Filter)를 통과시켜 저대역 신호를 추출한다. 이때, 예를 들어 저대역 신호 추출부(111)는, 8 kHz 저대역을 통과시키는 저주파 통과 필터(LPF: Low Pass Filter)를 이용하여 구현할 수 있다. 이렇게 구현할 경우 저대역은 8 kHz 이하의 주파수 대역이 되고, 고대역은 8 kHz 이상의 주파수 대역이 될 수 있다.
그리고 저대역 부호화부(112)는 저대역 신호 추출부(111)에서 추출된 저대역 신호를 변환 부호화(Transform Coding) 방식에 따라 부호화한다. 변환 부호화 방식은 입력 신호를 주파수 영역으로 변환하고 변환된 주파수 영역 신호를 각 주파수 계수를 청각적 중요도에 따라 양자화하여 부호화하는 기술을 말한다. 예를 들어, 변환 부호화 기술로는 대표적으로 MP3, AAC(Advanced Audio Coding) 등이 있다.
한편, 주파수 확장을 이용한 오디오 부호화 장치(110)는 변환 부호화 방식에 따라 고대역 신호를 직접 양자화하여 전송하는 일반적인 부호화 방식을 이용하지 않는다. 따라서 고대역 부호화부(113)는 입력 신호(오디오 신호)를 입력받아 저대역과 고대역의 주파수 정보를 서로 비교 분석하여 보정에 필요한 보정 파라미터를 추출하고 양자화하여 오디오 복호화 장치(120)로 전송한다.
한편, 오디오 복호화 장치(120)는 오디오 부호화 장치(110)에서 압축된 신호와 보정 파라미터를 이용하여 압축된 신호를 복원하는 기능을 수행한다.
구체적으로 살펴보면, 저대역 복호화부(121)는 오디오 부호화 장치(110)에서 변환 부호화된 저대역 신호를 변환 복호화 방식에 따라 복호화하여 저대역 신호를 복원한다.
그리고 고대역 복호화부(122)는 저대역 복호화부(121)에서 이미 복원된 저대역 신호로부터 필요한 주파수 정보를 복사하여 고대역 신호를 복호화한다. 이때, 고대역 복호화부(122)는 저대역과 고대역의 주파수 성질 사이에 존재하는 성질 차이에 부합하는 보정 파라미터를 고대역 부호화부(113)로부터 전송받아 고대역 신호를 보정한다. 이는 정확하면서도 용이하게 고대역 신호를 복원하기 위함이다.
더욱 구체적으로 살펴보면, 고대역 합성부(1221)는 저대역 복호화부(121)에서 복원된 저대역 신호로부터 필요한 주파수 정보를 복사하여 고대역 신호를 합성한다. 그리고 고대역 보정부(1222)는 고대역 합성부(1221)에서 합성된 고대역 신호를 고대역 부호화부(113)로부터의 보정 파라미터에 따라 보정한다.
합성부(123)는 저대역 복호화부(121)에서 복원된 저대역 신호와, 고대역 복 호화부(122)에서 복원된 고대역 신호를 합성하고, 합성된 신호를 출력 신호로서 출력한다.
한편, 주파수 확장을 이용한 오디오 부호화/복호화 과정에 이용되는 대표적인 보정 파라미터는 에너지와 톤 성질(Tonality)이다. 저대역과 고대역의 주파수 에너지가 일치하지 않으므로 오디오 부호화 장치(110)는 고대역을 몇 개의 부대역(Subband)으로 분할하고 각 부대역의 에너지를 양자화하여 전송한다. 그리고 오디오 복호화 장치(120)는 전송된 각 부대역의 에너지를 기준으로 고대역의 주파수 부대역별로 에너지를 조정한다.
또한, 톤 성질을 살펴보면, 고대역 신호는 일반적으로 저대역 신호에 비하여 톤 성질이 약하다. 따라서 오디오 복호화 장치(120)는 고대역 합성 과정에서 저대역 신호를 그대로 사용하지 않고 주기적인 성질을 감소시켜 톤 성질을 약화시킨 후 이용해야 한다. 이를 위하여, 오디오 부호화 장치(110)는 일반적으로 고대역 주파수 대역별로 적절한 잡음을 추가한다. 오디오 부호화 장치(110)는 고대역 신호의 톤 성질을 보정하기 위해 필요한 대역별 잡음레벨을 계산하고 양자화하여 오디오 복호화 장치(120)로 전송한다.
전술된 주파수 확장을 이용한 오디오 부호화/복호화 기술에서 널리 이용되는 대표적인 기술에는 MPEG-4 HE-AAC 부호화 장치에서 사용하는 SBR(Spectral Band Replication) 기술이 있다.
종래의 SBR 기술에 따라, 고대역 부호화부(113)는 QMF(Quadrature Mirror Filter)를 이용하여 입력 신호를 다수의 시간-주파수 영역 신호로 변환한다. 그리 고 고대역 부호화부(113)는 각 주파수 채널에 해당하는 시간 영역 신호의 예측 성능을 기반으로 각 채널의 톤 성질을 측정하고 추가할 잡음레벨을 결정한다. 여기서, 고대역 부호화부(113)는 시간 영역 신호의 예측을 위하여, 2차 선형 예측기를 이용한다.
종래의 SBR 기술 중에서 잡음레벨 결정 방법에서는 입력 신호의 특성을 고려하지 않고 항상 동일한 방식에 따라 잡음레벨을 결정하고 있다. 따라서 종래의 잡음레벨 결정 방법에서는 입력 신호의 특성이 고려되지 않아 톤 성질이 정확하게 측정되지 않을 수 있다.
특히, 입력 신호의 피치 주파수가 낮을 때, 종래의 SBR 기술에서 결정하는 잡음레벨은 실제보다 크게 결정되게 된다. 이렇게 결정된 잡음레벨을 활용하여 고대역 신호를 합성하면, 과도한 잡음이 추가되어 고대역 성능이 저하되고 전체 합성된 신호의 품질이 저하되는 문제점이 발생하게 된다. 따라서 SBR의 성능과 그에 따라 전체 오디오 부호화 장치(110)의 성능을 향상시키기 위하여 입력 신호의 특성을 고려하여 정확한 잡음레벨을 결정하는 방법이 절실히 요구되고 있는 상황이다.
도 2 는 종래의 SBR 기술에 따른 잡음레벨 결정 장치의 구성도이다.
도 2에 도시된 바와 같이, 종래의 잡음레벨 결정 장치(200)는 신호 변환부(210), 선형 예측부(220) 및 잡음레벨 결정부(230)를 포함한다.
신호 변환부(210)는 입력 신호를 32×64 구조의 시간-주파수 영역으로 변환한다. 예를 들어, 입력 신호의 샘플링 주파수가 48kHz이면 각 주파수 채널의 대역폭은 375Hz이다.
그리고 선형 예측부(220)는 신호 변환부(210)에서 주파수 영역으로 변환된 입력 신호를 64개의 주파수 채널에 대하여 독립적으로 2차 선형 예측하여 각 채널의 톤 성질을 측정한다.
그리고 잡음레벨 결정부(230)는 저대역부터 고대역으로 복사되는 채널 조합에 대하여, 선형 예측부(220)에서 측정된 각 채널의 톤 성질을 비교하여 추가할 잡음레벨을 결정한다. 이는 복원된 고대역 신호가 원래의 톤 성질을 가지기 위함이다. 이때, 잡음레벨 결정부(230)는 전송할 파라미터 양을 줄이기 위하여 주파수 채널의 해상도를 감소시켜 복수의 채널을 하나의 블록으로 묶어 블록별로 잡음레벨을 할당할 수도 있다.
잡음레벨을 결정하는 구체적인 방법은 하기의 [수학식 1]과 같다.
Figure 112008031493811-pat00001
여기서, T[i]는 주파수 채널 i에 대한 톤 성질 값, G K 는 임의의 상수 값을 나타낸다.
고대역 합성부(1221)는 저대역의 q 번째 채널로부터 주파수를 복사하여 고대역의 p 번째 채널 주파수를 합성한다. 이때, p 번째 채널에 추가하는 잡음레벨은 상기 [수학식 1]로부터 계산된다.
하지만, 도 2에 도시된 잡음레벨 결정 장치(200)는 입력 신호의 피치 주파수 를 고려하지 않고 실제 톤 성질 값과 다르게 측정하며, 그에 따라 다른 잡음레벨을 결정하게 된다. 예를 들어, 잡음레벨 결정 장치(200)가 실제 톤 성질 값보다 두 배 작게 톤 성질 값을 측정하면, 상기 [수학식 1]에 의하여 해당 잡음레벨은 두 배 크게 결정된다. 이 경우, 고대역 잡음이 정상 수치보다 높게 첨가되어 오디오 부호화 장치(110)의 성능이 크게 저하될 수 있다.
도 3 은 음성 신호의 하모닉 성분을 나타내는 스펙트럼의 예시도이다.
톤 성질이 강한 음성 신호는 기본 주파수와 그의 배수에 해당하는 하모닉 주파수 성분이 강하게 존재한다. 도 3에 도시된 바와 같이, 음성 신호의 하모닉 주파수 성분은 주파수 영역에서 일정 간격인 피크 간격(302)마다 하모닉 피크(301)를 가지는 형태로 나타나 있다. 이때, 피치 주파수가 작으면 피크 간격(302)이 줄어들게 된다.
SBR 기술에서는 한 주파수 채널에 여러 개의 하모닉 주파수 성분이 분포될 수 있다. 또한, 특정 주파수 채널에 포함되지 않는 주파수 성분도 시간-주파수 분할을 위한 QMF의 에일리어싱(Aliasing) 효과에 의하여 해당 주파수 채널에 포함될 수도 있다.
이와 같이, 한 주파수 채널에 다수의 하모닉 주파수 성분이 존재하면, 선형 예측부(220)에 의해, 입력 신호를 2차 선형 예측하여 각 채널의 톤 성질을 측정하는 예측 성능이 저하되게 된다. 선형 예측부(220)는 정상적인 톤 성질에 비하여 낮은 톤 성질을 가지는 것으로 잘못 측정할 수 있다. 따라서 입력의 피치 주파수와 채널의 상관 특성에 따라 입력 신호가 강한 톤 성능을 가지더라도, 실제 측정되는 톤 성질은 작게 된다. 이에 따라, 잡음레벨 결정부(230)는 잡음레벨을 정상보다 크게 결정하고, 이로 인해 SBR 성능 및 오디오 부호화 장치(110)의 성능이 저하되게 된다.
도 4a 내지 도 4d 는 피치 주파수에 따른 주파수 채널의 하모닉 성분 차이와 그에 따른 톤 성질 차이에 대한 설명도이다.
도 4a에 도시된 바와 같이, 도형 ""로 나타낸 피치 주파수 105Hz에 대한 하모닉 주파수 위치(421 내지 426)와 도형 "
Figure 112008031493811-pat00003
"로 나타낸 피치 주파수 225Hz에 대한 하모닉 주파수 위치(411 내지 415)가 나타나 있다. 피치 주파수 105Hz 및 225Hz에 대한 하모닉 주파수의 상대적 위치를 두 번째 주파수 채널(41) 및 세 번째 주파수 채널(42)에 대해서 살펴보기로 한다. 여기서, 샘플링 주파수는 48kHz이고, 채널의 대역폭은 375Hz이다.
도 4b 내지 도 4d에는 두 번째 및 세 번째 주파수 채널의 각 피치 주파수에 대한 스펙트럼이 나타나 있다.
피치 주파수 225Hz를 가지는 신호 중에서 두 번째 채널(375Hz ~ 750Hz)(41) 신호의 스펙트럼 및 각 하모닉 성분이 도 4b에 나타나 있다. 피치 주파수 225Hz를 가지는 신호에 대해서, 두 번째 채널(41)의 450Hz를 가지는 하모닉 성분(411)은 스펙트럼 상에서 두 번째 피크(431)와 대응되고, 675Hz를 가지는 하모닉 성분(412)은 스펙트럼 상에서 첫 번째 피크(432)와 대응된다. 이렇게 위치가 변경되어 나타나는 이유는, 64배 다운 샘플링(Down-Sampling)에 의한 주파수 폴딩(folding)이 발생하 여 스펙트럼 상에서 순서가 변경되었기 때문이다. 또한, 각각 900Hz와 225Hz에 해당하는 작은 두 개의 피크(434, 433)는 두 번째 채널 밖의 하모닉 성분(414, 413)이지만, 에일리어싱(Aliasing)에 의하여 일부 에너지가 두 번째 채널에 포함된 것이다. 이 신호는 2차 예측기로 정확하게 예측되며, 톤 성분은 약 40으로 측정된다.
피치 주파수 105Hz를 가지는 신호 중에서 두 번째 채널(375Hz ~ 750Hz)(41) 신호의 스펙트럼 및 각 하모닉 성분이 도 4c에 나타나 있다. 피치 주파수 105Hz를 가지는 신호에 대해서, 두 번째 채널(41)의 420Hz, 525Hz, 630Hz 및 735Hz를 가지는 하모닉 성분(421, 422, 423, 424)은 각각 스펙트럼 상에서 네 번째 피크(441), 세 번째 피크(442), 두 번째 피크(443) 및 첫 번째 피크(444)와 순서에 맞게 대응된다. 또한, 해당 채널에 4개의 정상적인 하모닉 피크(441 내지 444)와 2개의 에일리어싱에 의한 하모닉 피크(445, 446)가 포함된다. 이에 따라, 2차 예측기가 정상적인 예측 동작을 수행하지 못하며, 톤 성질은 1.0 정도로 잘못 측정된다.
피치 주파수 225Hz를 가지는 신호 중에서 세 번째 채널(750Hz ~ 1125Hz)(42) 신호의 스펙트럼 및 각 하모닉 성분이 도 4d에 나타나 있다. 피치 주파수 225Hz를 가지는 신호에 대해서, 세 번째 채널(42)의 900Hz와 1125Hz를 가지는 하모닉 성분(414, 415)은 각각 스펙트럼 상에서 두 번째 피크(451) 및 첫 번째 피크(452)와 순서에 맞게 대응된다. 또한, 해당 채널에 2개의 정상적인 하모닉 피크(451, 452)와 1개의 에일리어싱에 의한 하모닉 피크(453)가 포함된다. 도 4b와 비교하면, 하모닉 피크 수는 감소하였지만, 에일리어싱 성분에 해당하는 하모닉 피크(453)인 675Hz의 크기가 증가하고, 그에 따라 톤 성질이 약 1.0으로 작게 측정된다. 이는 채널 밖에 존재하는 675Hz 성분이 채널 경계에 근접하여 에일리어싱 효과가 크게 발생하기 때문이다.
결론적으로, 도 4a 내지 도 4d를 살펴볼 때, 피치 주파수의 크기와 채널 대역에 대한 하모닉 성분의 상대적 위치에 따라 톤 성질이 다르게 측정된다. 이 중에서, 에일리어싱 현상은 근본적으로 해결할 수 없다. 하지만, 이러한 현상은 피치 주파수가 크면 모든 채널에서 발생하는 것이 아니라, 채널 대역과 하모닉 주파수와의 상대적 위치에 따라 일부 채널에서만 발생한다.
특히, 도 2의 잡음레벨 결정 장치(200)에서는 채널 해상도를 줄여 톤 성질을 측정할 때 복수의 채널에 대한 평균값을 구하는 경우도 있다. 이러한 경우는 작게 측정된 톤 성질 값이 약간 보정될 수도 있다. 그러나 피치 주파수가 작을 경우, 한 채널에 포함되는 정상적인 피치 하모닉 수가 증가하고 이 문제는 모든 채널에 공통으로 나타나게 된다. 따라서 채널 해상도 감소에 의하여 그 영향이 감소하지 않는다는 문제점이 있다. 또한, 피치 주파수가 작으면 채널 에일리어싱 영향이 발생할 확률이 증가하므로 피치 주파수가 작을 때는 잡음레벨이 더 커진다는 문제점이 있다.
이와 같이, 잡음레벨은 피치 주파수에 따라 정확도가 변경된다. 따라서 샘플링 주파수에 따라 각 주파수 채널의 대역폭과 경계를 계산하고 입력 신호의 피치 주파수와의 상관 관계를 분석하여 각 채널의 잡음레벨을 수정하여 주는 과정이 절실히 필요한 상황이다.
상기와 같은 종래 기술은 주파수 확장을 위해 추가할 고대역 잡음레벨을 입력 신호의 피치 주파수와 채널의 상관 특성에 따라 정확하게 측정하지 못하며, 그에 따라 고대역 신호 품질이 떨어지는 문제점이 있으며, 이러한 문제점을 해결하고자 하는 것이 본 발명의 과제이다.
따라서 본 발명은 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 고대역 잡음레벨을 조정함으로써, 고대역 잡음레벨을 정확하게 측정할 수 있으며 고대역 신호의 품질을 향상시킬 수 있게 하는, 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
본 발명은 상기 문제점을 해결하기 위하여, 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 해당 고대역 잡음레벨을 조정하는 것을 특징으로 한다.
더욱 구체적으로, 본 발명은, 가변 잡음레벨 결정 장치에 있어서, 주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하기 위한 잡음레벨 결정 수단; 상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하기 위한 피치 주파수 분석 수단; 및 상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하기 위한 잡음레벨 조정 수단을 포함한다.
한편, 본 발명은, 가변 잡음레벨 결정 방법에 있어서, 주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하는 잡음레벨 결정 단계; 상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하는 피치 주파수 분석 단계; 및 상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 잡음레벨 조정 단계를 포함한다.
상기와 같은 본 발명은, 주파수 확장(Bandwidth extension)에 필요한 고대역(High-band)의 톤 성질(Tonality)을 보정하기 위해 고대역 잡음레벨을 결정함에 있어서, 입력 신호의 피치(Pitch) 주파수에 따라 가변적으로 고대역 잡음레벨을 조 정함으로써, 고대역 잡음레벨을 정확하게 측정할 수 있으며 고대역 신호의 품질을 향상시킬 수 있게 하는 효과가 있다.
예를 들면, 본 발명은, 고대역 확장 기술을 사용하는 오디오 부호화 장치에서 고대역 신호의 부호화 품질을 향상시키므로, 동일한 비트 수를 사용하면서 전체 오디오 부호화 장치의 성능을 향상시킬 수 있다. 특히, 본 발명은, 종래기술에 의한 오디오 부호화 장치의 비트열 구조와 규격을 변경하지 않고 피치 주파수에 따라 정확한 고대역 잡음레벨을 결정하여 전송하므로, 잡음레벨을 정하는 방법만 변경하여 전체 오디오 부호화 장치의 성능을 향상시킬 수 있는 효과가 있다.
상술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되어 있는 상세한 설명을 통하여 보다 명확해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다.
본 발명에 따른 가변 잡음레벨 결정 장치(500)는 주파수 확장 방법을 이용하고 샘플링 주파수가 48kHz인 신호를 입력받는 것으로 가정한다. 여기서, 다른 샘플링 주파수에 대해서도 동일한 방식을 적용할 수 있다.
도 5 는 본 발명에 따른 가변 잡음레벨 결정 장치의 일실시예 구성도이다.
도 5에 도시된 바와 같이, 본 발명에 따른 가변 잡음레벨 결정 장치(500)는 잡음레벨 결정부(510), 피치 주파수 분석부(520) 및 잡음레벨 조정부(530)를 포함한다. 여기서, 잡음레벨 결정부(510)는 신호 변환부(511)와 레벨 결정부(512)를 포함한다. 또한, 피치 주파수 분석부(520)는 피치 주파수 검출부(521)와 하모닉 분석부(522)를 포함한다.
이하, 본 발명에 따른 가변 잡음레벨 결정 장치(500)의 구성요소 각각에 대하여 살펴보기로 한다.
잡음레벨 결정부(510)는 입력 신호를 주파수 영역으로 변환하고 그 변환된 입력 신호의 각 주파수 채널의 톤 성질을 측정한다. 그리고 잡음레벨 결정부(510)는 측정된 각 주파수 채널의 톤 성질에 따라 각 주파수 채널 또는 다수의 주파수 채널이 결합된 대역에 대하여 고대역 잡음레벨을 결정한다.
구체적으로 살펴보면, 현재 프레임에 해당하는 입력 신호를 x[n](n=0, …, 1023)이라 하면, 신호 변환부(511)는 입력 신호(x[n])를 주파수 영역으로 변환하고, 그 변환된 입력 신호를 X[j][k](j=0, …, 31, k=0, …, 63)라 한다. 여기서, j는 시간 인덱스, k는 주파수 채널을 나타낸다.
레벨 결정부(512)는 2차 예측 성능에 따라 각 주파수 채널의 톤 성질을 측정한다. 여기서, 측정된 톤 성질 측정값을 T[i]라 한다. 이때, 시간 축에서 더욱 상세하게 보정을 하기 위하여, 레벨 결정부(512)는 j=0, …, 15와 j=16, …, 31로 두 영역으로 분리하여 각각 T 0[i]과 T 1[i]를 구할 수도 있다.
그리고 레벨 결정부(512)는 톤 성질 측정값 T[i]를 이용하여 상기 [수학식 1]에 따라 각 주파수 채널 또는 다수의 주파수 채널이 결합된 대역에 대하여 고대역에 대한 잡음레벨을 결정한다.
한편, 피치 주파수 분석부(520)는 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석한다.
이를 구체적으로 살펴보면, 피치 주파수 검출부(521)는 입력 신호의 피치 주파수를 검출한다. 이때, 피치 주파수 검출부(521)는 첨단 피치 주파수 검색 방법을 이용할 수 있다. 예를 들어, 피치 주파수 검출부(521)는 입력 신호에 대한 상관 관계 계수를 구한다. 그리고 피치 주파수 검출부(521)는 상관 관계 계수 값과 기준치(예를 들면, 0.75)를 비교하여 그 상관 관계 계수 값이 기준치보다 크고 입력 신호의 에너지가 기준치보다 크면 현재 프레임을 하모닉 프레임으로 결정한다. 그리고 피치 주파수 검출부(521)는 이전 프레임의 피치 주파수와의 관계를 확인하여 현재 프레임의 피치 주파수를 계산한다.
만일, 현재 프레임이 하모닉 프레임으로 결정되지 않으면, 피치 주파수 검출부(521)는 이에 해당하는 정보를 출력한다. 예를 들어, 피치 주파수 검출부(521)는 피치 주파수 검출 값으로 "0"을 출력할 수 있다. 이때, 피치 주파수 검출 값이 "0"이면 하모닉 분석부(522)와 잡음레벨 조정부(530)는 다른 동작을 수행하지 않고, 레벨 결정부(512)에서 결정된 잡음레벨을 최종 잡음레벨로 결정한다.
하모닉 분석부(522)는 피치 주파수 검출부(521)에서 검출된 피치 주파수와 주파수 채널 특성을 이용하여 상관 관계와 관련된 하모닉 주파수 성분을 분석한다. 즉, 하모닉 분석부(522)는 부호화 장치 규격에 의하여 결정되는 채널 대역폭 및 대역 경계, 피치 주파수 검출부(521)에서 검출된 피치 주파수의 위치 상관 관계를 분석하고 분석 결과를 잡음레벨 조정부(530)로 전달한다.
잡음레벨 조정부(530)는 하모닉 분석부(522)에서 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 레벨 결정부(512)에서 결정된 고대역 잡음레벨을 가변적으로 조정한다. 즉, 잡음레벨 조정부(530)는 레벨 결정부(512)에서 결정된 잡음레벨을 조정하여 새로운 잡음레벨을 출력한다. 새로운 잡음레벨은 레벨 결정부(512)에서 결정된 잡음레벨이 새롭게 조정된 것이며, 우수한 부호화 성능을 위해 피치 주파수에 따라 가변적으로 조정된 것이다.
구체적으로 살펴보면, 잡음레벨 조정부(530)는 입력 잡음레벨에 적절한 이득을 곱하는 동작을 수행한다. 즉, 잡음레벨 조정부(530)는 분석된 하모닉 주파수 성분에 따라 잡음레벨 이득값을 구하고, 그 잡음레벨 이득값을 이용하여 고대역 잡음레벨을 가변적으로 조정한다. 만일, 각 주파수 채널에 3개 이상의 강한 하모닉 성분이 존재하는 것으로 판단되면, 잡음레벨 조정부(530)는 이득값을 "1"보다 작게 하여(이득<1.0) 레벨 결정부(512)의 출력을 감소시킨다. 반면에, 2개 이하의 강한 하모닉 성분이 존재하는 것으로 판단되면, 잡음레벨 조정부(530)는 이득값을 "1"로 같게 하여(이득=1.0) 레벨 결정부(512)의 출력인 고대역 잡음레벨을 조정하지 않고 그대로 출력한다.
여기서, 잡음레벨 조정부(530)는 피치 주파수가 대역폭에 비하여 작아 한 채널에 다수의 하모닉 성분이 포함되는 경우와 채널 외부에 존재하는 하모닉 성분이 채널 경계에 인접하여 에일리어싱 현상에 의하여 잘못된 하모닉 성분으로 나타나는 경우를 모두 포함하여 하모닉 성분 수를 판단한다. 각 하모닉 성분의 크기는 해당 채널의 경계와의 거리에 따라 결정된다. 정상적인 하모닉 성분은 경계에서 멀어질수록, 에일리어싱 현상에 의한 하모닉 성분은 대역 경계에 가까울수록 크기가 증가한다.
한편, 레벨 결정부(512)는 각 채널 별이 아니라 다수 채널을 하나의 부대역으로 묶고 해상도를 낮추어 각 부대역 별로 하나의 잡음레벨을 결정할 수 있다. 이 경우, 해당 부대역의 잡음레벨은 부대역에 포함되는 모든 채널의 잡음레벨의 평균을 취하는 효과를 가진다. 그에 따라, 대역 경계에 위치하여 발생하는 에일리어싱 현상은 감소하게 된다. 즉, 피치 주파수가 크면 모드 채널에서 강한 에일리어싱 현상이 발생하는 것이 아니라 경계에 인접하여 외부 하모닉이 존재하는 일부 채널에서만 에일리어싱 현상이 발생한다. 따라서 다수의 채널에 대하여 평균을 취하면 이러한 효과는 감소하게 된다.
그러나 피치 주파수가 대역폭에 비하여 작아 한 채널에 다수의 하모닉 성분이 존재하는 경우에서는 모든 채널에 이 현상이 발생하므로 평균 동작에 의하여 추가적인 감소 효과는 발생하지 않는다. 따라서 잡음레벨 조정부(530)는 피치 주파수가 작은 경우에 대하여 고대역 잡음레벨을 감소시키는 기능을 수행한다.
잡음레벨 조정부(530)는 다양한 피치 주파수와 채널 대역폭에 대하여 훈련을 통하여 미리 최적의 이득을 구한 테이블을 저장하고 있다. 잡음레벨 조정부(530)는 각 경우에 대하여 테이블 값을 이용하여 잡음레벨을 조정할 수 있다. 또한, 잡음레벨 조정부(530)는 피치 주파수가 작은 경우에 한정하여 간단하게 문제를 해결할 수 있다.
이에 대하여, 잡음레벨 조정부(530)는 하기의 [표 1]에 따라 이득(Gain)값을 구할 수 있다.
Figure 112008031493811-pat00004
잡음레벨 조정부(530)는 피치 주파수가 125Hz 미만이면, 이득값을 "100"으로 정한다. 잡음레벨 조정부(530)는 피치 주파수가 125Hz 이상이면서 200Hz 미만이면, 이득값을 상기 [표 1]에 따라 정한다. 그 이외의 경우에는 잡음레벨 조정부(530)는 이득값을 "1"로 정한다.
도 6a 내지 도 6c 는 종래의 잡음레벨 결정 방법과 본 발명에 따라 복원된 신호의 스펙트로그램에 대한 일실시예 비교도이다.
도 6a에 도시된 바와 같이, 입력 신호는 모노 남성 음성 신호가 이용되고 있다. 모노 남성 음성 신호는 48kHz로 샘플링되고, 16kbps로 AAC+ 부호화된다.
도 6b에는 도 6a의 입력 신호가 종래의 SBR 기술에 의하여 복원된 신호의 스펙트로그램이 나타나 있다.
한편, 도 6c에는 도 6a의 입력 신호가 본 발명에 따라 복원된 신호의 스펙트로그램이 나타나 있다.
도 6a에 나타나 있는 입력 신호와 도 6b 및 6c를 비교하면, 본 발명에 의한 신호의 품질이 종래의 SBR 기술에 의한 것보다 우수한 것임을 알 수 있다.
도 7 은 본 발명에 따른 주파수 확장을 위한 가변 잡음레벨 결정 방법에 대한 일실시예 흐름도이다. 본 발명에 따른 구체적인 실시예는 전술한 바와 같으므로, 여기서는 그 동작 방법의 요지만을 간략하게 설명하기로 한다.
먼저, 잡음레벨 결정부(510)가 주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정한다(701).
그리고 피치 주파수 분석부(520)가 상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석한다(702).
이후, 잡음레벨 조정부(530)가 상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정한다(703).
한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
도 1 은 일반적인 주파수 확장을 이용한 오디오 부호화/복호화 장치의 구성도,
도 2 는 종래의 SBR 기술에 따른 잡음레벨 결정 장치의 구성도,
도 3 은 음성 신호의 하모닉 성분을 나타내는 스펙트럼의 예시도,
도 4a 내지 도 4d 는 피치 주파수에 따른 주파수 채널의 하모닉 성분 차이와 그에 따른 톤 성질 차이에 대한 설명도,
도 5 는 본 발명에 따른 가변 잡음레벨 결정 장치의 일실시예 구성도,
도 6a 내지 도 6c 는 종래의 잡음레벨 결정 방법과 본 발명에 따라 복원된 신호의 스펙트로그램에 대한 일실시예 비교도,
도 7 은 본 발명에 따른 주파수 확장을 위한 가변 잡음레벨 결정 방법에 대한 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
500: 가변 잡음레벨 결정 장치 510: 잡음레벨 결정부
511: 신호 변환부 512: 레벨 결정부
520: 피치 주파수 분석부 521: 피치 주파수 검출부
522: 하모닉 분석부 530: 잡음레벨 조정부

Claims (17)

  1. 가변 잡음레벨 결정 장치에 있어서,
    주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하기 위한 잡음레벨 결정 수단;
    상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하기 위한 피치 주파수 분석 수단; 및
    상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하기 위한 잡음레벨 조정 수단
    을 포함하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  2. 제 1 항에 있어서,
    상기 피치 주파수 분석 수단은,
    상기 입력 신호의 피치 주파수를 검출하기 위한 피치 주파수 검출 수단; 및
    상기 검출된 피치 주파수와 주파수 채널 특성을 이용하여 상기 상관 관계와 관련된 하모닉 주파수 성분의 특성을 분석하기 위한 하모닉 분석 수단
    을 포함하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  3. 제 2 항에 있어서,
    상기 하모닉 분석 수단은,
    상기 검출된 피치 주파수에 대한 하모닉 주파수 위치와 하모닉 피크 크기, 주파수 채널의 대역폭과, 대역 경계와 하모닉 주파수 위치의 상대적 관계를 분석하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 잡음레벨 조정 수단은,
    상기 분석된 하모닉 주파수 성분에 따라 잡음레벨 이득값을 구하고 상기 구한 잡음레벨 이득값을 이용하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  5. 제 4 항에 있어서,
    상기 잡음레벨 조정 수단은,
    미리 계산된 각각의 피치 주파수 및 채널 대역폭에 대한 잡음레벨 이득값에 따라 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  6. 제 5 항에 있어서,
    상기 잡음레벨 조정 수단은,
    상기 분석된 하모닉 주파수 성분이 각 주파수 채널에 임계치 이상 포함된 것으로 판단됨에 따라 상기 결정된 고대역 잡음레벨을 감소시키는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  7. 제 6 항에 있어서,
    상기 잡음레벨 조정 수단은,
    상기 검출된 피치 주파수가 각 주파수 채널의 대역폭에 비하여 작아 각 주파수 채널에 복수의 하모닉 주파수가 존재함에 따라 상기 임계치 이상의 하모닉 주파수 성분이 포함된 것으로 판단하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  8. 제 6 항에 있어서,
    상기 잡음레벨 조정 수단은,
    주파수 채널 밖의 인접한 하모닉 주파수 성분에 의해 에일리어싱이 발생하여 각 주파수 채널에 큰 크기의 상기 에일리어싱 성분이 다수 존재함에 따라 상기 임계치 이상의 하모닉 주파수 성분이 포함된 것으로 판단하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  9. 제 5 항에 있어서,
    상기 잡음레벨 조정 수단은,
    상기 분석된 하모닉 주파수 성분이 각 주파수 채널에 임계치 미만 포함된 것으로 판단됨에 따라 상기 결정된 고대역 잡음레벨을 조정하지 않는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 장치.
  10. 가변 잡음레벨 결정 방법에 있어서,
    주파수 확장을 위한 고대역 잡음레벨을 입력 신호의 톤 성질에 따라 결정하는 잡음레벨 결정 단계;
    상기 입력 신호의 피치 주파수를 검출하고 상기 검출된 피치 주파수와 주파수 채널과의 상관 관계를 분석하는 피치 주파수 분석 단계; 및
    상기 분석된 피치 주파수와 주파수 채널과의 상관 관계를 기초로 하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 잡음레벨 조정 단계
    를 포함하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  11. 제 10 항에 있어서,
    상기 피치 주파수 분석 단계는,
    상기 입력 신호의 피치 주파수를 검출하는 피치 주파수 검출 단계; 및
    상기 검출된 피치 주파수와 주파수 채널 특성을 이용하여 상기 상관 관계와 관련된 하모닉 주파수 성분의 특성을 분석하는 하모닉 분석 단계
    를 포함하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  12. 제 11 항에 있어서,
    상기 잡음레벨 조정 단계는,
    상기 분석된 하모닉 주파수 성분에 따라 잡음레벨 이득값을 구하고 상기 구한 잡음레벨 이득값을 이용하여 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  13. 제 12 항에 있어서,
    상기 잡음레벨 조정 단계는,
    미리 계산된 각각의 피치 주파수 및 채널 대역폭에 대한 잡음레벨 이득값에 따라 상기 결정된 고대역 잡음레벨을 가변적으로 조정하는 것을 특징으로 하는 주 파수 확장을 위한 가변 잡음레벨 결정 방법.
  14. 제 13 항에 있어서,
    상기 잡음레벨 조정 단계는,
    상기 분석된 하모닉 주파수 성분이 각 주파수 채널에 임계치 이상 포함된 것으로 판단됨에 따라 상기 결정된 고대역 잡음레벨을 감소시키는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  15. 제 14 항에 있어서,
    상기 잡음레벨 조정 단계는,
    상기 검출된 피치 주파수가 각 주파수 채널의 대역폭에 비하여 작아 각 주파수 채널에 복수의 하모닉 주파수가 존재함에 따라 상기 임계치 이상의 하모닉 주파수 성분이 포함된 것으로 판단하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  16. 제 14 항에 있어서,
    상기 잡음레벨 조정 단계는,
    주파수 채널 밖의 인접한 하모닉 주파수 성분에 의해 에일리어싱이 발생하여 각 주파수 채널에 큰 크기의 상기 에일리어싱 성분이 다수 존재함에 따라 상기 임계치 이상의 하모닉 주파수 성분이 포함된 것으로 판단하는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
  17. 제 13 항에 있어서,
    상기 잡음레벨 조정 단계는,
    상기 분석된 하모닉 주파수 성분이 각 주파수 채널에 임계치 미만 포함된 것으로 판단됨에 따라 상기 결정된 고대역 잡음레벨을 조정하지 않는 것을 특징으로 하는 주파수 확장을 위한 가변 잡음레벨 결정 방법.
KR1020080040890A 2007-11-21 2008-04-30 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 Expired - Fee Related KR100970446B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US12/414,768 US8296157B2 (en) 2007-11-21 2009-03-31 Apparatus and method for deciding adaptive noise level for bandwidth extension

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070119426 2007-11-21
KR20070119426 2007-11-21

Publications (2)

Publication Number Publication Date
KR20090052789A KR20090052789A (ko) 2009-05-26
KR100970446B1 true KR100970446B1 (ko) 2010-07-16

Family

ID=40860458

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080040890A Expired - Fee Related KR100970446B1 (ko) 2007-11-21 2008-04-30 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법

Country Status (2)

Country Link
US (1) US8296157B2 (ko)
KR (1) KR100970446B1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
ES2568640T3 (es) * 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
KR200484139Y1 (ko) * 2016-05-23 2017-08-03 신현종 석재 절단용 톱날 결합 장치
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002261553A (ja) 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
KR20030010898A (ko) * 2001-07-27 2003-02-06 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
KR20060051298A (ko) * 2004-09-17 2006-05-19 하만 베커 오토모티브 시스템즈 게엠베하 대역 제한 오디오 신호의 대역폭 확장
WO2006132159A1 (ja) 2005-06-09 2006-12-14 A.G.I. Inc. ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5946650A (en) * 1997-06-19 1999-08-31 Tritech Microelectronics, Ltd. Efficient pitch estimation method
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
BRPI0409327B1 (pt) * 2003-04-17 2018-02-14 Koninklijke Philips N.V. Dispositivo para gerar um sinal de áudio de saída com base em um sinal de aúdio de entrada, método para prover um sinal de áudio de saída com base em um sinal de áudio de entrada e aparelho para fornecer um sinal de áudio de saída
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002261553A (ja) 2001-03-02 2002-09-13 Ricoh Co Ltd 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
KR20030010898A (ko) * 2001-07-27 2003-02-06 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
KR20060051298A (ko) * 2004-09-17 2006-05-19 하만 베커 오토모티브 시스템즈 게엠베하 대역 제한 오디오 신호의 대역폭 확장
WO2006132159A1 (ja) 2005-06-09 2006-12-14 A.G.I. Inc. ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム

Also Published As

Publication number Publication date
US8296157B2 (en) 2012-10-23
US20100094638A1 (en) 2010-04-15
KR20090052789A (ko) 2009-05-26

Similar Documents

Publication Publication Date Title
KR100970446B1 (ko) 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US11922956B2 (en) Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
CN102144259B (zh) 用于产生带宽扩展输出数据的装置和方法
US9812136B2 (en) Audio processing system
CN106796798B (zh) 用于使用独立噪声填充生成增强信号的装置和方法
KR102380487B1 (ko) 오디오 신호 디코더에서의 개선된 주파수 대역 확장
US20130346073A1 (en) Audio encoder/decoder apparatus
JP2019502948A (ja) 符号化されたオーディオ信号を処理するための装置および方法
Chang et al. Design of HE-AAC Version 2 Encoder

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

R15-X000 Change to inventor requested

St.27 status event code: A-3-3-R10-R15-oth-X000

R16-X000 Change to inventor recorded

St.27 status event code: A-3-3-R10-R16-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R11-asn-PN2301

St.27 status event code: A-3-3-R10-R13-asn-PN2301

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

Fee payment year number: 1

St.27 status event code: A-2-2-U10-U11-oth-PR1002

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

St.27 status event code: A-5-5-R10-R13-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

FPAY Annual fee payment

Payment date: 20130624

Year of fee payment: 4

PR1001 Payment of annual fee

Fee payment year number: 4

St.27 status event code: A-4-4-U10-U11-oth-PR1001

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

FPAY Annual fee payment

Payment date: 20140630

Year of fee payment: 5

PR1001 Payment of annual fee

Fee payment year number: 5

St.27 status event code: A-4-4-U10-U11-oth-PR1001

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R11-asn-PN2301

St.27 status event code: A-5-5-R10-R13-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Not in force date: 20150709

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

St.27 status event code: A-4-4-U10-U13-oth-PC1903

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PC1903 Unpaid annual fee

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20150709

St.27 status event code: N-4-6-H10-H13-oth-PC1903

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000