[go: up one dir, main page]

KR20030062338A - 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치 - Google Patents

적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20030062338A
KR20030062338A KR10-2003-7006515A KR20037006515A KR20030062338A KR 20030062338 A KR20030062338 A KR 20030062338A KR 20037006515 A KR20037006515 A KR 20037006515A KR 20030062338 A KR20030062338 A KR 20030062338A
Authority
KR
South Korea
Prior art keywords
signal
spectral whitening
hfr
decoder
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR10-2003-7006515A
Other languages
English (en)
Other versions
KR100517229B1 (ko
Inventor
크졸링크리스토퍼
엑스트란트페르
헨프레드릭
빌레모라아스
Original Assignee
코딩 테크놀러지스 스웨덴 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20281813&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20030062338(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 코딩 테크놀러지스 스웨덴 에이비 filed Critical 코딩 테크놀러지스 스웨덴 에이비
Publication of KR20030062338A publication Critical patent/KR20030062338A/ko
Application granted granted Critical
Publication of KR100517229B1 publication Critical patent/KR100517229B1/ko
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Amplifiers (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Networks Using Active Elements (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Filters And Equalizers (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

본 발명은 고주파 복원(HFR)을 이용하여 음원 코딩 시스템의 향상을 위한 새로운 방법 및 새로운 장치를 제공한다. 본 발명은 적응형 필터링을 이용하여 HFR이 수행되는 오디오 신호의 다른 주파수 범위의 다른 음조 특성에 기인한 인공음을 저감한다. 본 발명은 음성 코딩 및 자연음 코딩 시스템 양측에 적용 가능하다.

Description

적응형 필터링에 의해 고주파 복원 코딩 방법의 인식 성능을 향상시키기 위한 방법 및 장치{ENHANCING PERCEPTUAL PERFORMANCE OF HIGH FREQUENCY RECONSTRUCTION CODING METHODS BY ADAPTIVE FILTERING}
저대역(low band)으로부터 고대역(high band)이 추정되는 오디오 신호의 고주파 복원에서는, HFR 시스템에서 흔히 이용되는 바와 같은 대충적인 포락선 조절(coarse envelope adjustment)로 달성될 수 있는 것보다 큰 정도로 복원된 고대역의 음조 성분을 제어하는 수단을 갖는 것이 중요하다. 이것은, 음성이나 대부분의 음향기기과 같은 대부분의 오디오 신호에 대한 음조 성분들이 통상적으로 고주파 영역에 비하여 저주파 영역(즉, 4~5kHz미만)에서 더 강하기 때문에 필요하다. 극단적인 예로서 저대역에서의 매우 명백한 조화급수(harmonic series) 및 고대역에서의 다소 순수한 잡음이 있다. 이에 접근하는 한가지 방법은 잡음을 복원된 고대역에 적응식으로 가산하는 것이다(적응형 잡음 가산(Adaptive Noise Addition[PCT/SE00/00159])). 그러나, 이것은 때때로 저대역의 음조 특성을 억제하기에 충분하지 않아서, 복원된 고대역에 반복적인 "버저"음("buzzy" sound) 특성을 제공한다. 또한, 잡음의 시변적인 특성을 달성하는 것이 어려울 수도 있다. 또 다른 문제가 두개의 조화급수, 즉 높은 조화 밀도(harmonic density)(저피치)를 갖는 하나와 낮은 조화 밀도(고피치)를 갖는 다른 하나가 혼합되는 경우에 일어난다. 고피치 조화급수가 고대역이 아니라 저대역에서 상기 다른 하나에 비하여 우세하다면, HFR은 고피치 신호의 고조파(harmonics)가 고대역에서 우세하게 하여, 복원된 고대역 음을 원음에 비하여 "금속음(metallic)"으로 만든다. 전술한 시나리오의 어느 것도 HFR 시스템에 흔히 이용되는 포락선 조절을 이용하여 제어될 수 없다. 일부 구현예에서는, HFR 신호의 스펙트럼 포락선 조절 중에 일정한 정도의 스펙트럼 화이트닝(spetral whitening)이 도입된다. 이것은 특정한 정도의 스펙트럼 화이트닝이 필요한 경우에는 만족할 만한 결과를 제공하지만, 특정한 정도의 스펙트럼 화이트닝으로부터 이득을 얻지 않는 신호 발췌음(excerpts)에 대하여는 심각한 인공음(artifacts)을 발생시킨다.
본 발명은 스펙트럼 대역 복제(Spectral Band Replication),SBR [WO 98/57436], 또는 관련된 방법들 등과 같은 고주파 복원(High Frequency Reconstruction: HFR)을 이용하는 음원(audio source) 코딩 시스템에 관한 것이다. 본 발명은 저품질(low quality) 방법들 [U.S. Pat. 5,127,054] 뿐만 아니라 고품질(high quality) 방법(SBR)들의 성능을 향상시킨다. 본 발명은 음성 코딩 및 자연음(natural audio) 코딩 시스템 양측에 적용 가능하다.
이하, 본 발명의 범위나 사상을 제한하지 않지 않고서 첨부 도면을 참조하여 도식적인 예를 통하여 본 발명을 설명한다.
도 1은 LPC 스펙트럼의 대역폭 확장을 나타낸다.
도 2는 시각 t0및 시각 t1에서의 원음 신호의 절대 스펙트럼을 나타낸다.
도 3은 적응형 필터링이 없는 종래 기술의 카피업(copy up) HFR 시스템의 시각 t0및 시각 t1에서의 출력의 절대 스펙트럼을 나타낸다.
도 4는 본 발명에 따른 적응형 필터링을 갖춘 카피업 HFR 시스템의 시각 t0 및 시각 t1에서의 출력의 절대 스펙트럼을 나타낸다.
도 5a는 본 발명에 따른 최악의 경우의 신호를 나타낸다.
도 5b는 최악의 경우의 신호의 고대역 및 저대역에 대한 자동 상관을 나타낸다.
도 5c는 본 발명에 따른 다른 주파수에 대한 음조-잡음비(tonal to noise ratio)(q)를 나타낸다.
도 6은 본 발명에 따른 디코더에서의 적응형 필터링의 시간 영역 구현을 나타낸다.
도 7은 본 발명에 따른 디코더에서의 적응형 필터링의 부대역 필터뱅크 실행을 나타낸다.
도 8은 본 발명의 인코더 구현을 나타낸다.
도 9는 본 발명의 디코더 구현을 나타낸다.
본 발명은 HFR 방법에 흔히 도입되는 "버저음" 및 "금속음"의 문제에 관한 것이다. 본 발명은 인코더측의 복잡한 디텍션(detection) 알고리즘을 이용하여 디코더에 적용될 바람직한 정도의 스펙트럼 화이트닝을 추정한다. 스펙트럼 화이트닝은 반복되는 고대역의 고조파 성분을 제어하는 최선의 수단을 보장하면서, 주파수뿐만 아니라 시간에 따라 변화한다. 본 발명은 부대역(subband)의 필터뱅크(filterbank)에서 성취가능할 뿐만 아니라 시간 영역에서도 성취되는 것이 가능하다.
본 발명은 다음과 같은 특징을 갖는다.
- 인코더에서, 주어진 시간에 다른 주파수 영역에 대하여 원음 신호의 음조 특성을 평가한다.
- 인코더에서, 디코더에서 사용되는 HFR 방법이 제공된다면, 디코더에서의 HFR 후에 유사 음조 특성을 얻기 위하여 주어진 시간에 다른 주파수 영역에 대하여 원하는 양의 스펙트럼 화이트닝을 평가한다.
- 바람직한 정도의 스펙트럼 화이트닝에 대한 정보를 인코더로부터 디코더로 전송한다.
- 디코더에서는, 인코더로부터 전송된 정보에 따라서 시간 영역이나 부대역 필터뱅크에서 스펙트럼 화이트닝을 수행한다.
- 디코더에서의 스펙트럼 화이트닝에 사용되는 적응형 필터가 선형 예측에 의해 얻어진다.
- 요구되는 스펙트럼 화이트닝의 정도가 예측에 의해 인코더에서 판단된다.
- 예측자 차수를 변화시키거나, LPC 다항식의 대역폭 확장 인자를 변화시키거나, 필터링된 신호를 처리되지 않은 대응부와 소정의 정도까지 혼합함으로써, 스펙트럼 화이트닝의 정도가 제어된다.
- 낮은 차수의 예측자를 위해 부대역 필터뱅크를 이용하는 것은 특히 필터뱅크가 이미 포락선 조절에 이용된 시스템에 대해서는 매우 효과적인 성과를 부여한다.
- 본 발명에 의한 새로운 필터뱅크가 얻어지는 경우, 스펙트럼 화이트닝의 주파수 선택도는 매우 쉽게 얻어지게 된다.
이하에 설명하는 실시예들은 고주파 복원 시스템(high frequency reconstruction system)의 향상을 위한 본 발명의 원리를 단지 예시하고 있을 뿐이다. 여기에 기재되는 구성 및 세부 사항의 수정 및 변경은 이 분야에서 통상의 지식을 가진 자에게는 명백하다는 것을 알아야 한다. 따라서, 여기의 실시예의 기재 및 설명을 통하여 제시된 특정 사항들에 의해서가 아니라 첨부된 특허청구범위에 의해서만 제한되는 것이다.
신호의 스펙트럼 포락선을 주어진 스펙트럼 포락선으로 조절할때, 소정 정도의 스펙트럼 화이트닝이 항상 적용된다. 전송된 대략적인 스펙트럼 포락선이 HenvRef(z)로 기재되고 현재의 신호 세그먼트의 스펙트럼 포락선은 HenvCur(z)로 기재되기 때문에, 적용된 필터 함수는 다음과 같다.
본 발명에 있어서, HenvRef(z)에 대한 주파수 분석은 HenvCur(z)와 반드시 동일하지 않다. 본 발명은 HFR 신호의 포락선 조절을 위한 HenvCur(z)의 적응형 주파수 분석을 이용한다. 신호 세그먼트는 식 1 에 따른 신호의 스펙트럼 화이트닝을 위하여 HenvCur(z)의 역으로 필터링된다.
여기서,
는 자동상관(autocorrelation) 방법 또는 공분산(covariance) 방법 [Digital Processing of Speech Signals, Rabiner & Schafer, Prentice Hall, Inc., Englewood Cliffs, New Jersey 07632, ISBN 0-13-213603-1, Chapter 8]을 사용하여 얻어진 다항식이고, G 는 이득이다. 이 경우, 스펙트럼 화이트닝의 정도는, 예를 들어 다항식 A(z)의 차수를 제한시켜 예측자 차수를 변화시키는 것에 의하고, 그럼으로서 HenvCur(z)로 기재될 수 있는 미세 구조의 규모를 제한하거나, 다항식 A(z)에 대역폭 확장 인자를 적용하는 것에 의해 제한될 수 있다. 대역폭 확장은 다음에 따라 정의된다: 대역폭 확장 인자가 ρ이면, 다항식 A(z)은
로 전개된다.
이것은 도 1 에 따라 HenvCur(z)에 의해 평가된 포르만트(formant)의 대역폭을 확장시킨다. 따라서, 본 발명에 따르면, 역 필터는 주어진 시간에서 다음과 같이 기재된다.
여기서, p 는 예측자 차수이고, ρ는 대역폭 확장 인자이다.
계수 αk는 상술한 바와 같이 다른 방법, 예를 들어, 자동상관 방법 또는 공분산 방법으로 얻어질 수 있다. Hinv가규칙적인 포락선 조절전에 사용되면 이득 인자(G)는 1로 설정될 수 있다. 시스템의 안정성을 확보하기 위하여 여러 종류의 평가에 대한 완화치를 더하는 것이 일반적이다. 자동상관 방법을 사용하면, 이것은 상관 벡터의 제로-래그(zero-lag) 값을 오프셋함으로써 용이하게 성취된다. 이것은 A(z)를 평가하는데 사용되는 신호에 백색 잡음을 일정 레벨로 부가하는 것과 동등하다. 파라미터(p 및 ρ)는 인코더로부터 전송된 정보에 기초하여 산출된다.
대역폭 확장의 다른 방법은
로 기재된다.
여기서, b 는 블렌딩(blending) 팩터이다. 이것은
에 따라 적응 필터를 산출한다.
여기서, b=1 일때, 식 7 은 ρ=1를 갖는 식 5 로 평가되고, b=0 일때, 식 7 은 일정 비주파수 선택 이득 인자로 평가된다.
본 발명은 디코더에서 사용될 화이트닝의 정도에 관한 정보가 매우 효과적으로 전송될 수 있기 때문에 매우 낮은 추가 비트 레이트 비용으로 HFR 시스템의 성능을 크게 증가시킨다. 도 2 내지 도 4 는 본 발명에 의하지 않는 시스템에 비교하여 본 발명에 의한 시스템의 성능을 예시적인 절대 스펙트럼으로 표시한다. 도 2 에서, 시간 t0및 시간 t1에서의 원음 신호의 절대 스펙트럼이 표시된다. 신호의 저대역 및 고대역에 대한 음조 특성은 시간 t0에서 유사하지만, 시간 t1에서 매우 다르다. 도 3 에는, 본 발명에 의하지 않고, HFR에 기초하여 카피업(copy-up)을 사용하는 시스템의 시간 t0및 시간 t1에서의 출력이 표시된다. 여기서, 시간 t0에서는 올바른 음조 특성을 부여하기 위하여 스펙트럼 화이트닝은 전혀 적용되지 않지만, 그것은 시간 t1에 대해서는 전적으로 틀리게 된다. 이 경우는 매우 불쾌한 인공음을 발생시킨다. 인공음들은 다른 특성을 가지며 다른 순간에 발생하지만, 어떠한 일정 정도의 스펙트럼 화이트닝에 대해서도 유사한 결과가 얻어진다. 도 4 에는, 본 발명을 이용한 시스템의 시간 t0및 시간 t1에서의 출력이 표시된다. 여기서, 스펙트럼 화이트닝은 그 정도가 시간에 따라 변화하며, 본 발명에 의하지 않는 시스템에서보다 우수한 음성 품질을 결과한다.
인코더측의 검출기
지금 HFR 방법이 사용된다고 할 때, 본 발명에서 인코더측의 검출기는 가능한한 원음과 유사한 고대역를 얻기 위하여, 디코더에서 사용될 최상의 스펙트럼 화이트닝(LPC 차수, 대역폭 확장 인자 및/또는 블렌딩 팩터)을 평가하는데 사용된다. 디코더에서 사용될 스펙트럼 화이트닝 정도의 적절한 평가를 얻기 위하여 여러 가지 접근법이 사용될 수 있다. 이하의 설명에서, 실질적으로 HFR 알고리즘은 고주파가 발진되는 전과정에서 저대역 스펙트럼의 음조 구조를 변화시키지 않는 것으로 가정한다. 즉, 발생된 고대역은 저대역과 동일한 음조 특성을 갖는다. 이러한 가정이 가능하지 않다면, 이하의 디텍션(detection)은 인코더의 원음 신호에 HFR 을 수행하는 합성에 의한 분석을 할 수 있고, 원음 신호의 저대역 및 고대역에 관한 비교 연구을 수행하는 것보다 2개의 신호의 고대역에 관한 비교 연구를 할 수 있다.
하나의 접근법은 적당량의 스펙트럼 화이트닝을 평가하기 위하여 자동상관을 이용한다. 디택터(detector)는 소오스 범위(즉, HFR이 디코더에서 기초할때의 주파수 범위) 및 목표 범위(즉, 디코더에서 복원될 주파수 범위)에 대한 자동상관함수를 평가한다. 도 5a에는, 저대역에서의 조화 급수를 갖고 고대역에서 백색 잡음을 갖는 최악의 경우의 신호가 기재된다. 상이한 자동 상관 함수는 도 5b에 표시된다. 여기서, 저대역은 고도로 서로 연관되고 고대역는 그렇지 않음이 명백하다. 최소 래그보다 큰 임의의 래그에 대한 최대 상관은 고대역 및 저대역 둘다에서 얻어진다. 그 2개의 지수(quotient)는 디코더에 적용될 최적의 스펙트럼 화이트닝을 산출하는데 사용된다. 본 발명을 상술한 바와 같이 구현하면, 상관의 계산을 위하여 FFT 를 사용하는 것이 바람직할 것이다. 시퀀스 x(n)의 자동상관은
에 의해 정의된다.
여기서,
목표는 고대역와 저대역에서 자동상관의 차를 비교하기 위한 것이며 주파수 영역에서 필터링이 수행될 수 있다. 이것은 다음을 산출한다.
여기서, HLp(k) 및 HHp(k) 는 LP 및 HP 필터 임펄스 응답의 푸리에 변환이다. 상술한 것으로부터, 저대역와 고대역에 대한 자동상관 함수는
에 따라 산출될 수 있다.
각각의 자동상관 벡터에서, 최소 래크보다 큰 래그에 대한 최대값은
로 산출된다.
그 2개의 몫은 예시적인 맵에 대한 적절한 대역폭 확장 인자에 사용될 수 있다.
상술한 기재는 주어진 시간에 주어진 주파수 대역에 대한 올바른 역 필터링 레벨을 얻기 위하여, 예측의 일반적인 측정, 즉, 주어진 시간 및 주어진 주파수 대역에서 신호의 음조-잡음비를 평가하는 것이 유익함을 암시한다. 이것은 이하의 좀더 개량된 접근법을 이용하여 성취될 수 있다. 여기서, 부대역 필터뱅크를 가정하였지만, 본 발명은 이것에 한정되는 것은 아니다.
필터뱅크의 각각의 부대역에 대한 음조-잡음비(q)는 부대역 샘플의 블록에 대한 선형 예측을 사용하여 정의될 수 있다. q 의 큰 값은 많은 양의 음색을 가리키고, q의 작은 값은 시간과 주파수의 대응하는 위치에서 신호가 잡음같다라는 것을 가리킨다. q 값은 공분산 방법 및 자동상관 방법을 사용하여 얻어질 수 있다.
공분산 방법에서, 부대역 신호 블록 [x(0), x(1), ..., x(N-1)]에 대한 예측 에러 및 선형 예측 계수는 초레스키(Cholesky) 분해를 사용하여 효과적으로 계산될 수 있다[Digital Processing of Speech Signals, Rabiner & Schafer, Prentice Hall, Inc., Englewood Cliffs, New Jersey 07632, ISBN 0-13-213603-1, Chapter 8]. 음조-잡음비(q)는
에 의해 정의된다.
여기서,는 신호 블록의 에너지이고, E 는 예측 에러 블록의 에너지이다.
자동상관 방법에서, 좀더 자연적인 접근법은 레빈슨-더빈(Levinson-Durbin) 알고리즘을 사용하는 것이다[Digital Signal Processing, Principles, Algorithms and Application, Third Edition, John G. Proakis, Dimitris G. Manolakis, Prentice Hall, International Editions, ISBN-0-13-394338-9, Chapter 11]. 여기서, q 는
에 따라 정의된다.
여기서, Ki는 예측 다항식으로부터 얻어진 대응 격자 필터 구조의 반사계수이고, p는 예측자 차수이다.
q 의 고대역 및 저대역 값사이의 비는 본원된 고대역의 음조-잡음비는 원음의 고대역의 음조-잡음비에 접근하도록 스펙트럼 화이트닝의 정도를 조절하는데 사용된다. 여기서, 블렌딩 팩터 b를 이용하여 화이트닝의 정도를 제어하는 것이 유리하다(식 6).
고대역에서 음조-잡음비 q=qH가 측정되고 저대역에서 q=qL≥qH이 측정되는 것으로 가정하면, 화이트닝 인자(b)의 적절한 선택은 식
에 의해 주어진다.
이것을 확인하기 위하여, 식 6을 다음의 형태로 재작성하는 하는 것이 첫번째 단계이다.
이것은, A(z)를 평가하기 위하여 사용된 신호가 필터 Ab(z)로 필터링되면, 예측된 신호가 이득 인자(1-b)에 의해 억압되고 예측 에러가 변경되지 않는 것을 나타낸다. 음조-잡음비가 자승 평균 예측 신호-자승의 평균 예측 에러에 대한 비율이므로, 필터링전의 q 의 값은 필터링 동작에 의해 (1-b)2q로 변한다. 저대역 신호에 이것을 적용하면 음조-잡음비(1-b)2ql를 갖는 신호를 생성하고, 적용된 HFR 방법이 음색을 변경하지 않는 가정하에서, 식 15에 따라 b가 선택되면 고대역의 목표값(qH)은 정확히 도달한다.
도 5a 의 신호에 대하여, 64 채널 필터 뱅크의 각각의 부대역의 예측 차수 p=2 에 기초한 q 의 값은 도 5c 에 도시된다. 두드러지게 높은 값은 잡음 부분보다 신호의 고조파 부분에서 도달된다. 고조파 부분에서의 평가의 변화성은 선택된 주파수 분석 및 예측 차수에 의존한다.
시간 영역에서의 적응형 LPC 기반 화이트닝
디코더의 적응형 필터링은 고주파 복원전 또는 후에 수행될 수 있다. HFR 전에 필터링이 수행되면, 사용된 HFR 방법의 특성을 고려할 필요가 있다. 주파수 선택 적응형 필터링이 수행되면, HFR 유닛전에 저대역 영역에 올바른 양의 스펙트럼 화이트닝을 적용하기 위하여, 시스템은 어느 저대역 영역으로부터 벗어나고 소정의 고대역 영역이 시작될 것이다. 이하의 예에서, 본 발명의 영역 구현의 시간의, 비주파수 선택 적응형 스펙트럼 화이트닝이 약술된다. 당업자에게는 본 발명의 시간 영역 구현이 이하에 기재된 구현에 한정되지 않음이 명백할 것이다.
시간 영역의 적응형 필터링을 수행하면, 자동 상관 방법을 사용하는 선형 예측이 바람직하다. 자동 상관 방법은 공분산 방법에 대한 경우가 아닌 계수 αk를 평가하는데 사용된 입력 세그먼트의 윈도우를 요구한다. 본 발명에 따른 스펙트럼 화이트닝에 사용되는 필터는
여기서, 이득 인자(G; 식 5)는 1로 설정된다. 적응형 스펙트럼 화이트닝이 HFR 유닛전에 수행되면, 적응형 필터가 낮은 샘플링 레이트로 동작할 수 있기 때문에 효과적인 구현이 성취된다. 저대역 신호는 도 6 에 따라 윈도우되고 예측자 차수와 인코더에 의해 주어진 대역폭 확장 인자로 적절한 시간 베이스에서 필터링된다. 본 발명의 현재의 구현에서, 신호는 저역 통과 필터링(601)되고 데시메이트(decimate)된다(602). 603 은 적응형 필터를 나타낸다. 윈도우(606)은 A(z) 다항식의 평가를 위한 적절한 시간 세그먼트를 선택하는데 사용되고, 50% 오버랩이 사용된다. LPC 루틴(607)은 일반적으로 바람직한 LPC 차수와 대역폭 확장 인자가 주어지면 적절한 완화로 A(z)을 추출한다. FIR 필터(608)는 신호 세그먼트를 적응식으로 필터링하는데 사용된다. 스펙트럼 화이트닝 신호 세그먼트는샘플링(604, 605)되고 함께 윈도우되어 입력 신호를 HFR 유닛으로 형성한다.
하위 밴드 필터뱅크에서의 적응형 LPC 기반 화이트닝
적응형 필터링은 필터뱅크를 사용하여 효과적이고 확고하게 수행될 수 있다. 선형 예측 및 필터링은 필터 뱅크에 의해 생성된 각각의 부대역 신호에 대하여 독립적으로 수행된다. 하위 밴드 신호의 알리아스(alias) 성분이 억압되는 경우 필터뱅크를 이용하는 것이 바람직하다. 이것은 예를 들어 필터뱅크를 오버샘플링함으로써 성취될 수 있다. 예를 들어 적응형 필터링에 의한 결과로, 부대역 신호의 독립 변형으로부터 알리아싱(Aliasing) 출현에 의한 인공음은 현저히 감소될 수 있다. 부대역 신호의 스펙트럼 화이트닝은 상술한 시간 영역 방법과 유사한 선형 예측을 통해 얻어진다. 부대역 신호가 복소값(complex value)이면, 복소 필터 계수는 필터링 뿐만 아니라 선형 예측을 위하여 사용된다. 합당한 양의 필터뱅크 채널을 갖는 시스템에서, 각 주파수 대역의 음조 성분의 예상수가 매우 작으므로, 선형 예측의 차수는 매우 낮게 유지될 수 있다. 시간 영역 LPC 와 동일한 시간 베이스에 대응하기 위하여, 각각의 블록의 부대역 샘플의 수가 필터뱅크의 다운샘플링과 동일한 인자에 의해 더 작아진다. 낮은 필터 차수 및 작은 블록 사이즈라면, 예측 필터 계수는 공분산 방법을 사용하여 바람직하게 얻어진다. 필터 계수 산출 및 스펙트럼 화이트닝은 블록 길이(N)보다 작은 부대역 샘플 시간 단계(L)를 사용하여 블록 베이시스에 의해 블록에 수행될 수 있다. 스펙트럼 화이트닝 블록은 적절한 합성 윈도우를 사용하여 함께 더해져야 한다.
백색 가우시간 잡음(white gaussian noise)으로 구성된 입력 신호를 갖는 최대 데시메이트 필터뱅크를 공급하는 것은, 백색 스펙트럼 밀도를 갖는 부대역 신호를 생성한다. 백색 잡음을 갖는 오버샘플된 필터뱅크를 공급하면 착색된 스펙트럼 밀도를 갖는 부대역 신호를 부여한다. 이것은 분석 필터의 주파수 응답의 효과에 의한 것이다. 필터뱅크 채널의 LPC 예측자는 잡음같은 입력 신호의 경우에 필터 특성을 따를 것이다. 이것은 원하지 않는 특징이며 보상으로부터 얻어진다. 가능한 해결책은 선형 예측자를 위한 입력신호의 프리필터링이다. 프리필터링은 분석 필터의 주파수 응답에 대하여 보상하기 위하여 분석 필터의 역 또는 역의 근사이어야 한다. 상술한 바와 같이, 화이트닝 필터에는 원음 부대역 신호가 공급된다. 도 7 은 부대역의 화이트닝 프로세스를 나타낸다. 채널(l)에 대응하는 부대역 신호는 프리필터링 블록(701)에 공급되고, 이어서 동등물의 깊이가 필터 차수(702)에 의존하는 지연 회로에 공급된다. 지연된 신호와 그 공액(703)은 계수가 산출되는 선형 예측 블록(704)에 공급된다. 모든 L:th 산출로부터의 계수는 데시메이터(705)에 의해 유지된다. 부대역 신호는, 예측 계수가 사용되고 모든 L:th 샘플에 대하여 갱신되는 필터블록(706)을 통해 최종적으로 필터링된다.
실제적인 구현
본 발명은 임의의 코드를 사용하여 아날로그 또는 디지털 신호의 저장 또는 전송을 위하여 다양한 종류의 시스템에 대한 하드웨어 칩과 DSP 에서 구현될 수 있다. 도 8 및 도 9 는 본 발명의 가능한 구현을 나타낸다. 도 8 에는 인코더측이 표시된다. 아날로그 입력 신호는 A/D 컨버터(801), 임의의 오디오 코더(802), 역 필터링 레벨 평가 유닛(803), 및 포락선 추출 유닛(804)에 공급된다. 코딩된 정보는 시리얼 비트스트림(805)으로 멀티플렉스되고 전송 또는 저장된다. 도 9 에는 일반적인 디코더 구현이 표시된다. 시리얼 비트스트림은 디멀티플렉스(901)되고, 포락선 데이터, 즉, 고대역의 스펙트럼 포락선이 디코드(902)된다. 디멀티플렉스된 음원 코드 신호가 임의의 오디오 디코더(903)을 사용하여 디코드된다. 디코드된 신호는 고대역 신호가 다시 발생되는 임의의 HFR 유닛(904)로 공급된다. 고대역 신호는 적응형 스펙트럼 화이트닝을 수행하는 스펙트럼 화이트닝 유닛(905)에 공급된다. 이어서, 신호는 포락선 조절기(906)에 공급된다. 포락선 조절기로부터의 출력은 지연(907)을 통해 공급된 디코드 신호와 결합된다. 마지막으로, 디지털 출력은 아날로그 파형(908)으로 다시 변환된다.

Claims (12)

  1. 고주파 복원을 사용하여 음원 코딩 시스템을 향상시키는 방법으로서, 상기 음원 코딩 시스템은 저장 또는 전송전에 수행된 모든 동작을 나타내는 인코더와 저장 또는 전송후에 수행되는 모든 동작을 나타내는 디코더를 포함하는 음원 코딩 시스템 향상 방법에 있어서,
    상기 인코더에서, 주어진 시간에 원음 신호의 음조 특성을 평가하는 단계,
    상기 인코더에서, 상기 디코더에서 사용된 HFR 방법이 주어지면, 상기 디코더에서 HFR 후에 유사 음조 특성를 얻기 위하여 주어진 시간에 원하는 정도의 스펙트럼 화이트닝을 평가하는 단계,
    상기 인코더로부터 상기 디코더로 상기 양의 스펙트럼 화이트닝의 정보를 전송하는 단계, 그리고
    상기 디코더에서, 상기 인코더로부터 얻어진 스펙트럼 화이트닝 정보에 따라 고주파 복원(HFR)전에 또는 HFR 후에 신호를 적응식으로 스펙트럼 화이트닝하는 단계를 구비하는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  2. 제 1 항에 있어서,
    원음 신호의 음조 특성의 상기 평가는 다른 주파수 영역에 대하여 수행되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  3. 제 1 항에 있어서,
    상기 원하는 정도의 스펙트럼 화이트닝의 평가는 다른 주파수 영역에 대하여 수행되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  4. 제 1 항에 있어서,
    상기 스펙트럼 화이트닝은 시간 영역에서 수행되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  5. 제 1 항에 있어서,
    상기 스펙트럼 화이트닝은 부대역 필터뱅크에서 수행되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  6. 제 1 항에 있어서,
    원하는 정도의 스펙트럼 화이트닝의 상기 평가는 상기 원음 신호의 부대역 필터링으로부터 얻어진 다른 부대역 신호의 음조-잡음 신호 비(q)의 비교에 의해 수행되고, 상기 비는 상기 부대역 신호의 선형 예측을 사용하여 얻어지는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  7. 제 1 항에 있어서,
    원하는 정도의 스펙트럼 화이트닝의 상기 평가는 상기 원음 신호와 HFR 신호의 부대역 필터링으로부터 얻어진 다른 부대역 신호의 음조-잡음 신호비(q)의 비교에 의해 수행되고, 상기 비는 상기 부대역 신호의 선형 예측을 이용하여 얻어지고, 상기 HFR 신호는 상기 디코더에서의 상기 HFR 과 동일하게 생성되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  8. 제 1 항에 있어서,
    상기 양의 스펙트럼 화이트닝은 LPC 예측자 차수에 의해 제어 되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  9. 제 1 항에 있어서,
    상기 양의 스펙트럼 화이트닝은 LPC 다항식의 대역폭 확장 인자에 의해 제어되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  10. 제 1 항에 있어서,
    상기 양의 스펙트럼 화이트닝은 블렌딩(blending) 팩터(b)에 의해 제어되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  11. 제 5 항에 있어서,
    필터뱅크 분석 필터의 특성을 보상하기 위하여 LPC 평가에 프리필터링이 포함되는 것을 특징으로 하는 음원 코딩 시스템의 향상 방법.
  12. 고주파 복원을 이용하여 음원 코딩 시스템을 향상시키는 장치로서, 상기 음원 코딩 시스템은 저장 또는 전송전에 수행되는 모든 동작을 나타내는 인코더와 저장 또는 전송후에 수행되는 모든 동작을 나타내는 디코더를 포함하는 음원 코딩 시스템 향상 장치에 있어서,
    상기 인코더에서, 주어진 시간에 원음 신호의 음조 특성을 평가하는 수단, 및
    상기 인코더에서, 상기 디코더에서 사용된 HFR 방법이 주어지면, 상기 디코더에서 HFR 후의 유사 음조 특성을 얻기 위하여, 주어진 시간에 원하는 양의 스펙트럼 화이트닝을 평가하는 수단을 구비하고,
    상기 디코더에서, 상기 인코더로부터 얻어진 스펙트럼 화이트닝에 따라 고주파 복원(HFR)전에 또는 HFR 후에 신호를 적응식으로 스펙트럼 화이트닝하는 수단을 구비하는 것을 특징으로 하는 음원 코딩 시스템 향상 장치.
KR10-2003-7006515A 2000-11-14 2001-11-13 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치 Expired - Lifetime KR100517229B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0004163A SE0004163D0 (sv) 2000-11-14 2000-11-14 Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004163-2 2000-11-14
PCT/SE2001/002510 WO2002041301A1 (en) 2000-11-14 2001-11-13 Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering

Publications (2)

Publication Number Publication Date
KR20030062338A true KR20030062338A (ko) 2003-07-23
KR100517229B1 KR100517229B1 (ko) 2005-09-27

Family

ID=20281813

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-7006515A Expired - Lifetime KR100517229B1 (ko) 2000-11-14 2001-11-13 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치

Country Status (13)

Country Link
US (2) US7003451B2 (ko)
EP (1) EP1342230B1 (ko)
JP (2) JP3954495B2 (ko)
KR (1) KR100517229B1 (ko)
CN (2) CN1267890C (ko)
AT (1) ATE264533T1 (ko)
AU (1) AU2002214496A1 (ko)
DE (1) DE60102838T2 (ko)
DK (1) DK1342230T3 (ko)
ES (1) ES2215935T3 (ko)
PT (1) PT1342230E (ko)
SE (1) SE0004163D0 (ko)
WO (1) WO2002041301A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
KR101406748B1 (ko) * 2013-08-13 2014-06-17 한국광성전자 주식회사 디지털 오디오 음질 개선 장치

Families Citing this family (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
BRPI0311601B8 (pt) * 2002-07-19 2018-02-14 Matsushita Electric Industrial Co Ltd "aparelho e método decodificador de áudio"
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CN100492492C (zh) 2002-09-19 2009-05-27 松下电器产业株式会社 音频解码设备和方法
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4789622B2 (ja) * 2003-09-16 2011-10-12 パナソニック株式会社 スペクトル符号化装置、スケーラブル符号化装置、復号化装置、およびこれらの方法
WO2005033198A1 (en) * 2003-10-07 2005-04-14 Coloplast A/S A composition useful as an adhesive and use of such a composition
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
KR101194902B1 (ko) * 2005-02-24 2012-10-25 파나소닉 주식회사 데이터 재생장치
KR100956525B1 (ko) * 2005-04-01 2010-05-07 퀄컴 인코포레이티드 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치
US8892448B2 (en) 2005-04-22 2014-11-18 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP1742509B1 (en) * 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
RU2008112137A (ru) * 2005-09-30 2009-11-10 Панасоник Корпорэйшн (Jp) Устройство кодирования речи и способ кодирования речи
CA2636493A1 (en) * 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
EP1827002A1 (en) * 2006-02-22 2007-08-29 Alcatel Lucent Method of controlling an adaptation of a filter
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8077821B2 (en) * 2006-09-25 2011-12-13 Zoran Corporation Optimized timing recovery device and method using linear predictor
WO2008053970A1 (en) * 2006-11-02 2008-05-08 Panasonic Corporation Voice coding device, voice decoding device and their methods
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
DE102007003187A1 (de) 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
BRPI0815972B1 (pt) * 2007-08-27 2020-02-04 Ericsson Telefon Ab L M método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
EP2242046A4 (en) * 2008-01-11 2013-10-30 Nec Corp SYSTEM, APPARATUS, METHOD AND PROGRAM FOR CONTROL OF SIGNAL ANALYSIS, SIGNAL ANALYSIS AND SIGNAL CONTROL
WO2009113516A1 (ja) 2008-03-14 2009-09-17 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
US8374854B2 (en) * 2008-03-28 2013-02-12 Southern Methodist University Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US8594173B2 (en) * 2008-08-25 2013-11-26 Dolby Laboratories Licensing Corporation Method for determining updated filter coefficients of an adaptive filter adapted by an LMS algorithm with pre-whitening
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
MY208222A (en) 2009-01-16 2025-04-25 Dolby Int Ab Cross product enhanced harmonic transposition
AU2010225051B2 (en) 2009-03-17 2013-06-13 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI484481B (zh) 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
WO2011001578A1 (ja) * 2009-06-29 2011-01-06 パナソニック株式会社 通信装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2491560B1 (en) 2009-10-19 2016-12-21 Dolby International AB Metadata time marking information for indicating a section of an audio object
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
SG10202107800UA (en) * 2010-07-19 2021-09-29 Dolby Int Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
IL313284B2 (en) * 2010-09-16 2025-05-01 Dolby Int Ab Method and system for cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR101572034B1 (ko) 2011-05-19 2015-11-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 오디오 코딩 방식들의 포렌식 검출
EP2777042B1 (en) 2011-11-11 2019-08-14 Dolby International AB Upsampling using oversampled sbr
CN103366751B (zh) * 2012-03-28 2015-10-14 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
CN105264601B (zh) * 2013-01-29 2019-05-31 弗劳恩霍夫应用研究促进协会 用于使用次频带时间平滑技术产生频率增强信号的装置及方法
WO2014185569A1 (ko) 2013-05-15 2014-11-20 삼성전자 주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102064890B1 (ko) * 2013-10-22 2020-02-11 삼성전자 주식회사 내부 및 외부 메모리를 선택적으로 사용하는 harq 데이터 처리 장치 및 그 처리 방법
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
US10410645B2 (en) 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
SG10201808274UA (en) 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
CN107851442B (zh) * 2015-04-13 2021-07-20 日本电信电话株式会社 匹配装置、判定装置、它们的方法、程序及记录介质
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
WO2019081070A1 (en) * 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS, METHOD, OR COMPUTER PROGRAM PRODUCT FOR GENERATING ENHANCED BANDWIDTH AUDIO SIGNAL USING NEURAL NETWORK PROCESSOR
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
WO2022223100A1 (en) * 2021-04-20 2022-10-27 Nokia Solutions And Networks Oy Interference rejection in cooperative multi-point communication

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4361875A (en) * 1980-06-23 1982-11-30 Bell Telephone Laboratories, Incorporated Multiple tone detector and locator
DE3587251T2 (de) * 1984-12-20 1993-07-15 Gte Laboratories Inc Anpassbares verfahren und vorrichtung fuer sprachkodierung.
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp., Tokio/Tokyo Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JP3144009B2 (ja) * 1991-12-24 2001-03-07 日本電気株式会社 音声符号復号化装置
US5347611A (en) * 1992-01-17 1994-09-13 Telogy Networks Inc. Apparatus and method for transparent tone passing over narrowband digital channels
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
US5915235A (en) * 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
US6035177A (en) * 1996-02-26 2000-03-07 Donald W. Moses Simultaneous transmission of ancillary and audio signals by means of perceptual coding
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5995561A (en) * 1996-04-10 1999-11-30 Silicon Systems, Inc. Method and apparatus for reducing noise correlation in a partial response channel
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6249762B1 (en) * 1999-04-01 2001-06-19 The United States Of America As Represented By The Secretary Of The Navy Method for separation of data into narrowband and broadband time series components
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
EP1147514B1 (en) * 1999-11-16 2005-04-06 Koninklijke Philips Electronics N.V. Wideband audio transmission system
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP4067762B2 (ja) * 2000-12-28 2008-03-26 ヤマハ株式会社 歌唱合成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
KR101406748B1 (ko) * 2013-08-13 2014-06-17 한국광성전자 주식회사 디지털 오디오 음질 개선 장치

Also Published As

Publication number Publication date
ATE264533T1 (de) 2004-04-15
ES2215935T3 (es) 2004-10-16
WO2002041301A1 (en) 2002-05-23
JP2004514179A (ja) 2004-05-13
CN1267890C (zh) 2006-08-02
CN1766993A (zh) 2006-05-03
CN1766993B (zh) 2011-07-27
AU2002214496A1 (en) 2002-05-27
SE0004163D0 (sv) 2000-11-14
DE60102838D1 (de) 2004-05-19
EP1342230B1 (en) 2004-04-14
CN1481545A (zh) 2004-03-10
US7003451B2 (en) 2006-02-21
KR100517229B1 (ko) 2005-09-27
US7433817B2 (en) 2008-10-07
EP1342230A1 (en) 2003-09-10
DE60102838T2 (de) 2005-04-21
JP2006079106A (ja) 2006-03-23
US20060036432A1 (en) 2006-02-16
HK1056429A1 (en) 2004-02-13
US20020087304A1 (en) 2002-07-04
PT1342230E (pt) 2004-09-30
JP3954495B2 (ja) 2007-08-08
DK1342230T3 (da) 2004-08-02

Similar Documents

Publication Publication Date Title
KR100517229B1 (ko) 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치
US9245533B2 (en) Enhancing performance of spectral band replication and related high frequency reconstruction coding
EP4120254B1 (en) Improved harmonic transposition
HK1056429B (en) Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
HK40079330B (en) Improved harmonic transposition
HK40079330A (en) Improved harmonic transposition
HK40118155A (en) Improved harmonic transposition
HK40116396A (en) Improved harmonic transposition
HK40116397A (en) Improved harmonic transposition
HK40077895A (en) Improved harmonic transposition
HK40077895B (en) Improved harmonic transposition
HK40035675B (en) Improved harmonic transposition
HK40035675A (en) Improved harmonic transposition
HK1093812B (en) An apparatus for enhancing source decoder
HK1190224A1 (en) Improved harmonic transposition
HK1062349B (en) Enhancing perceptual quality of sbr(spectral band replication) and hfr(high frequency reconstruction) coding methods by adaptive noise-floor addition and noise substitution limiting
HK1213079B (en) Improved harmonic transposition
HK1190224B (en) Improved harmonic transposition
HK1241128A1 (en) Improved harmonic transposition
HK1169509A1 (en) Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
HK1169509B (en) Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
HK1082093B (en) Spectral band replication and high frequency reconstruction audio coding methods and apparatuses using adaptive noise-floor addition and noise substitution limiting

Legal Events

Date Code Title Description
A201 Request for examination
PA0105 International application

Patent event date: 20030514

Patent event code: PA01051R01D

Comment text: International Patent Application

PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20030514

Comment text: Request for Examination of Application

PG1501 Laying open of application
A302 Request for accelerated examination
PA0302 Request for accelerated examination

Patent event date: 20050228

Patent event code: PA03022R01D

Comment text: Request for Accelerated Examination

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20050627

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20050920

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20050921

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20080918

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20090917

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20100907

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20110906

Start annual number: 7

End annual number: 7

FPAY Annual fee payment

Payment date: 20120905

Year of fee payment: 8

PR1001 Payment of annual fee

Payment date: 20120905

Start annual number: 8

End annual number: 8

FPAY Annual fee payment

Payment date: 20130909

Year of fee payment: 9

PR1001 Payment of annual fee

Payment date: 20130909

Start annual number: 9

End annual number: 9

FPAY Annual fee payment

Payment date: 20140905

Year of fee payment: 10

PR1001 Payment of annual fee

Payment date: 20140905

Start annual number: 10

End annual number: 10

FPAY Annual fee payment

Payment date: 20150904

Year of fee payment: 11

PR1001 Payment of annual fee

Payment date: 20150904

Start annual number: 11

End annual number: 11

FPAY Annual fee payment

Payment date: 20160908

Year of fee payment: 12

PR1001 Payment of annual fee

Payment date: 20160908

Start annual number: 12

End annual number: 12

FPAY Annual fee payment

Payment date: 20170911

Year of fee payment: 13

PR1001 Payment of annual fee

Payment date: 20170911

Start annual number: 13

End annual number: 13

FPAY Annual fee payment

Payment date: 20180905

Year of fee payment: 14

PR1001 Payment of annual fee

Payment date: 20180905

Start annual number: 14

End annual number: 14

PR1001 Payment of annual fee

Payment date: 20190902

Start annual number: 15

End annual number: 15

PR1001 Payment of annual fee

Payment date: 20200901

Start annual number: 16

End annual number: 16

PR1001 Payment of annual fee

Payment date: 20210820

Start annual number: 17

End annual number: 17

PC1801 Expiration of term