[go: up one dir, main page]

KR20040048978A - 감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법 - Google Patents

감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법 Download PDF

Info

Publication number
KR20040048978A
KR20040048978A KR10-2004-7005938A KR20047005938A KR20040048978A KR 20040048978 A KR20040048978 A KR 20040048978A KR 20047005938 A KR20047005938 A KR 20047005938A KR 20040048978 A KR20040048978 A KR 20040048978A
Authority
KR
South Korea
Prior art keywords
audio signal
narrowband
wideband
information
spectral
Prior art date
Application number
KR10-2004-7005938A
Other languages
English (en)
Inventor
타오리라케쉬
게리츠안드레아스제이.
슬우이즈터로버트제이.
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20040048978A publication Critical patent/KR20040048978A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

협대역 오디오 신호(9)는 그 신호를 광대역 신호로 처리하기 위해 지각할 수 있는 왜곡들이 존재하는 정보를 포함한다. 광대역 오디오 신호(1)를 협대역 오디오 신호(9)로 처리하는 방법에서, 제 1 스펙트럼 부분(4)은 협대역 신호에서 변하지 않고 유지되고, 나머지 스펙트럼 부분들을 복구하는데 사용할 수 있는 협대역 정보(7)는 인식 가능한 방식으로 상기 제 1 스펙트럼 부분을 복구함으로써, 바람직하게 지각적으로 들을 수 없이, 바람직하게 워터마크로서 삽입된다(8). 광대역 오디오 신호(1)를 협대역 신호(9)로 코딩하는 엔코더와 협대역 오디오 신호를 디코딩하는 디코더뿐만 아니라, 협대역 전송 채널을 통해 광대역 오디오 신호를 전송하는 시스템과, 저장 매체 상에 광대역 오디오 신호를 저장하고 저장 장치로부터 광대역 신호를 복구하는 시스템과, 협대역 오디오 신호를 담은 저장 매체가 개시된다.

Description

감소된 대역폭을 가진 전송 채널 상에 광대역 오디오 신호들을 전송하는 방법{Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth}
독일 특허 출원 제 DE 34 18 297호로부터, 협대역 전송 채널을 통한 광대역 오디오 신호를 전송하는 방법이 공지되어 있다.
광대역 오디오 신호는 저주파수 대역과 고주파수 대역으로 나누어진다. 고주파수 대역은 다수의 부대역들로 나누어지고, 순시 신호 전력값(momentary signal power value)은 부대역들 각각에 대해 결정된다. 이들 부대역들에 걸친 순시 신호 전력 분포상의 정보는 나머지 부대역들의 상대적 신호 전력값들뿐만 아니라 가장 큰 크기의 상기 전력값들을 식별하는 곱셈 인자의 형태로 제공된다. 이러한 정보는 보통의 협대역 전송 채널을 통해 상기 저주파수 대역과 함께 전송되는 디지털 단어로 변환되며, 가장 낮은 지각 가능한 사운드 레벨 이하의 파일럿 신호의 형태로 저주파수 대역 신호에 삽입된다.
이러한 방법의 단점은 고주파수 대역의 정보를 포함하는 파일럿 신호가 모호하지 않은 사실에 기초하여 확립되지 않는다는 점과, 파일럿 신호가 신호 전력 분포에만 기초하여 제공된다는 점이다. 그러한 이유로, 개시된 발명은 상이한 입력들에게 동일한 출력을 제공할 것이고, 따라서 그러한 경우 그릇된 보충의 스펙트럼 성분들은 개선보다는 협대역 신호의 열화를 가져온다.
1993년 4월 27-30일, 미니애폴리스, 미네소타(미국)에서, 1993 IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP-93)의“Wideband Speech Coding in 7.2kb/s”인 C.McElroy 등에 의한 논문으로부터, 광대역 음성 신호를 매체 비트-레이트로 코딩하는 방법이 공지되어 있다.
다시, 광대역 신호는 저주파수 대역 및 고주파수 대역으로 나누어진다. 이들 대역들은 그들 엔코더들 각각을 사용하여 그들 비트 스트림 각각으로 엔코딩된다; 저주파수 대역은 공지된 CELP(Code Excited Linear Prediction : 코드 여진 선형 예측) 코더를 사용하여 엔코딩되고, 고주파수 대역은 2 차 선형 예측기 및 초저비트 레이트 이득 형상 벡터 양자화기(very low bit rate gain shape vector quantiser)를 사용하여 엔코딩된다.
두개의 비트 스트림들은 특정 신택스를 사용하여 병합된다; 그 결과는 7.2kb/s의 비트 레이트를 갖는 디지털 신호이다. 비트 스트림들이 고대역 및 저대역 오디오 신호로 각각 디코딩되기 전에 상기 신택스는 비트 스트림을 고대역 비트 스트림 및 저대역 비트 스트림으로 나누기 위해 원격단에서 사용되어야 하고, 그 후 원하는 광대역 음성 신호로 병합되어야 한다.
이러한 발명의 단점은 결과로서 생긴 비트스트림이 전화 중계 회선들 또는 라인들, 또는 전화 교환들과 같은 기존 협대역 네트워크들을 통해 전송되는데 적합하지 않다는 점이다.
유럽 특허 제 658,874호로부터, 협대역 오디오 신호의 대역폭을 확장하는 방법 및 회로가 공지되어 있다.
이 특허에서, 협대역 오디오 신호는 단기간 스펙트럼 분석에 의해 분석된다; 결과로서 생긴 스펙트럼은 저장된 스펙트럼들과 비교되고; 결과로서 생긴 스펙트럼은 결과로서 생긴 스펙트럼 내에 포함되지 않은 스펙트럼 성분들로 보충된다.
결과로서 생긴 스펙트럼과 저장된 스펙트럼들 모두는 선형 예측 방식(LPC; Linear Predictive Coding)으로 코딩된다. 저장된 스펙트럼들은 광대역이고, 협대역 신호에 대한 보충들로서 사용될 스펙트럼 성분들을 결정하는데 즉시 사용된다. 저장된 스펙트럼들의 크기(amplitude)는 협대역 주파수의 저장된 스펙트럼들과 협대역 오디오 신호 사이의 매칭 크기를 성취하도록 조정된다.
상기 방법 및 회로의 단점은, 저장된 스펙트럼들로부터 얻어지고 협대역 신호에 부가되는 스펙트럼 성분들이 모호하지 않은 사실에 기초하여 확립되지 않는다는 점과, 부가될 스펙트럼 성분들이 단지 분석된 스펙트럼을 유한 수의 스펙트럼들과 비교하는 것으로만 결정된다는 점이다. 그러한 이유로, 개시된 발명 및 회로는 부정확한 보충 스펙트럼 성분들을 제공할 것이고 개선보다는 협대역 신호의 열화를 가져온다.
2001년 5월 12-15일, 암스테르담(네덜란드)에서, Audio EngineeringSociety, 110thConvention의 “Robust, Multi-Functional and High-Quality Audio Watermarking Technology”인 Michiel van der Veen 등에 의한 종래 논문으로부터, 페이로드를 갖는 워터마크를 삽입하고, 존재의 검출을 위해 그러한 워터마크들의 페이로드를 추출하는 방법들이 공지되어 있다.
이미지 및 오디오 워터마킹에 사용된 기존 기술에 기초하여, 강력한, 다중 기능 및 고품질 오디오 워터마킹 기술이 상기 논문에 제공된다. 삽입 알고리즘은 주파수 도메인에서 동작하며, 푸리에 계수들의 크기들은 약간 수정된다. 워터마크 검출은 상호 상관 기술들에 의존하며, 워터마크의 존재뿐만 아니라 그 페이로드도 검출된다.
상기 논문에 개시된 특정 워터마크에 대해, 객관적 및 주관적 오디오 품질 대책(measures)이 공정하게 잘 상관되는 실험들이 논증되었다. 지각된 오디오 품질의 품질의 분석들이 조합되었고, 특정 워터마크 파라미터들이 상이한 응용들에 최적화될 수 있다는 강력함(robustness)이 나타났다. 이들은 복사 관리(제한된 정보 용량, 높은 강력함, 및 매우 높은 오디오 품질)로부터 방송 모니터링(큰 정보 용량을 중재(intermediate), 강력함을 중재, 높은 오디오 품질을 중재)까지의 범위에 이른다.
본 발명은 전화 네트워크들과 같은 협대역 인프라구조를 통한 전송에 적합한 협대역 오디오 신호들을 제공하기 위한 광대역 오디오 신호들의 처리에 관한 것이다.
도 1은 본 발명에 따른 엔코더의 원리를 설명한 도면.
도 2는 본 발명의 실시예에 따른 디코더의 원리를 설명한 도면.
도 3은 도 1의 엔코더의 양호한 실시예의 개략적 도면.
도 4는 도 2의 디코더의 양호한 실시예의 개략적 도면.
본 발명의 목적은 필요한 처리들을 수행하는 기기와 같은 관련된 설비들뿐만 아니라, 광대역 오디오 신호들의 협대역 오디오 신호들로의 고품질 코딩 및 대응하는 디코딩을 제공하는 것이다.
협대역 오디오 신호를 대응하는 광대역 오디오 신호로 처리하는데 사용할 수 있는 정보를 포함하는 협대역 오디오 신호에서, 이러한 목적은 상기 정보가 인식 가능한 왜곡들로서 협대역 오디오 신호에 존재하는 것으로 충족된다.
본 발명의 실시예들에 따른 신호들로의 실험들은 대응하는 협대역 오디오 신호의 대역폭 바깥쪽의 광대역 오디오 신호에 포함된 정보가 협대역 오디오 신호의 매우 작은 왜곡들에 삽입될 수 있음을 보여주었다.
또한, 실험들은 협대역 오디오 신호에 왜곡들로서 삽입된 정보의 신뢰할 수 있는 추출이 신뢰할 수 있는 방법으로 상호 상관 방법들에 의해 가능함을 보여주었다.
바람직하게, 코딩된 협대역 오디오 신호는 기존 협대역 기기 및 인프라구조와 양립할 수 있어서, 즉 1) 협대역 오디오 신호는 기존 협대역 인프라구조를 통해 전송할 수 있어야 하고, 광대역 정보의 품질 왜곡 또는 손실 없이 기존 협대역 기기에 의해 기록 및/또는 저장할 수 있고, 2) 협대역 오디오 신호는 신호의 협대역 컨텐트들의 상당한 품질 열화 없이 기존 협대역 기기에 의해 형성된 협대역에서 수신 및 재생할 수 있어야 한다.
이렇게 저장된 협대역 오디오 신호는, 협대역 오디오 신호의 대역폭 내의 왜곡들이 상기 인프라구조를 통해 영향을 미치지 않고 통과됨에 따라, 전화 접속들과 같은 협대역 신호 인프라구조와 양립할 수 있게 될 수 있다.
협대역 오디오 신호가 저장 매체 상에 저장될 때, 대응하는 광대역 오디오신호보다 더 작은 공간을 차지할 것이며, 따라서 광대역 오디오 신호의 압축된 버전으로 나타나서 저장 공간을 절약한다.
저장된 압축 신호가 종래의 협대역 기기에 의해 쉽게 판독할 수 있음으로써, 예컨대 오디오 신호들을 위한 새로운 저장 매체들을 도입할 때 소급 호환성(backwards compatibility)을 보증하는 장점이 있다.
상기 정보는 바람직하게, 지각적으로 들을 수 없는 방식으로 워터마크로서 협대역 오디오 신호로 도입되는 것이 바람직하다. 그에 의해, 오디오 신호들을 워터마킹하는 사용 가능한 회로들 및 방법들은 협대역 오디오 신호를 생성할 때 사용될 수 있다.
광대역 오디오 신호를, 광대역 오디오 신호와 실질적으로 동일한 정보를 포함하는 협대역 오디오 신호로 처리하는 방법에서, 상기 표준화된 주파수 한계들 내에 있는 광대역 오디오 신호의 제 1 스펙트럼 부분은 협대역 오디오 신호에서 실질적으로 변경되지 않고 유지되고, 광대역 오디오 신호의 나머지 스펙트럼 부분들을 복구하는데 사용할 수 있는 복구 정보는 바람직하게, 지각적으로 들을 수 없는 방식으로 상기 제 1 스펙트럼 부분으로 삽입되는, 상기 처리 방법에 있어서, 본 발명의 목적은, 상기 복구 정보가 상기 협대역 오디오 신호를 얻기 위해 지각할 수 있는 방법으로 상기 제 1 스펙트럼 부분을 복구함으로써 상기 제 1 스펙트럼 부분으로 삽입되는 것으로 충족된다.
본 발명의 실시예들로의 실험들은 대응하는 협대역 오디오 신호의 대역폭 바깥의 광대역 오디오 신호에 포함된 정보가 협대역 오디오 신호의 매우 작은 왜곡들에 삽입될 수 있음을 보여주었다.
본질적으로, 광대역 오디오 신호의 전체 오디오 정보 컨텐트들은 협대역 오디오 신호에 포함될 수 있다.
또한, 실험들은, 거의 들을 수 없는 또는 지각적으로 들을 수 없는 인식 가능한 왜곡들이 광대역 오디오 신호의 나머지 스펙트럼 부분들의 신뢰할 수 있는 고품질 재구성을 가능하게 하기 위해, 정보의 충분한 양들을 얻을 수 있음을 보여주었다.
상기 복구 정보는, 페이로드로서 상기 복구 정보를 갖는 워터마크로서 상기 제 1 스펙트럼 부분에 삽입되는 것이 바람직하다.
그에 의해 오디오 신호들을 워터마킹하는 사용 가능한 회로들 및 방법들은 본 발명의 방법을 수행할 때 사용될 수 있다.
상기 워터마크는,
- 상기 제 1 스펙트럼 부분 및 상기 나머지 스펙트럼 부분들을 디지털 형태로 제공하고;
- 상기 제 1 스펙트럼 부분을 프레임들로 조직하고;
- 각 프레임을 주파수 도메인으로 변환하여 상기 프레임의 푸리에 변환을 수행하고;
- 상기 워터마크에 의존하여 푸리에 계수들을 수정하고;
- 시간 도메인의 워터마킹된 프레임을 얻기 위해 수정된 푸리에 계수들을 역푸리에 변환하고, 또한
- 상기 주파수 도메인의 워터마킹된 프레임을 시간 도메인으로 바람직하게 변환함으로써, 상기 제 1 스펙트럼 부분으로 삽입되는 것이 특히 바람직하다.
이러한 워터마크 삽입 방식의 사용은 복구 정보를 포함하는 원하는 페이로드를 가질 수 있는 강력한 워터마크를 제공하는 것으로 판명되었다.
양호한 실시예에서, 상기 협대역 오디오 신호는, 바람직하게 전송 채널을 통해 상기 협대역 오디오 신호를 전송하거나 협대역 오디오 신호를 저장 매체에 저장한 후에 광대역 오디오 신호로 재처리된다.
이러한 방식으로, 증가된 이점은 고품질 오디오 신호들이 인프라구조에 대한 어떠한 보정들 필요 없이 기존의 협대역 인프라 구조를 통해 쉽게 전송될 수 있다는 점이다.
광대역 오디오 신호를, 광대역 오디오 신호와 실질적으로 동일한 정보를 포함하는 협대역 오디오 신호로 코딩하는 엔코딩에서, 본 발명의 목적은,
- 광대역 오디오 신호로부터 제 1 스펙트럼 부분을 추출하는 필터로서, 상기 제 1 스펙트럼 부분은 표준화된 주파수 한계들 내에 있는, 상기 필터;
- 광대역 오디오 신호로부터, 또는 광대역 오디오 신호의 나머지 스펙트럼 부분들로부터 복구 정보를 추출하는 정보 발생 회로로서, 상기 정보는 상기 광대역 오디오 신호의 나머지 스펙트럼 부분들을 복구하는데 사용할 수 있는, 상기 정보 발생 회로; 및
- 상기 협대역 오디오 신호를 얻기 위해, 바람직하게 페이로드로서 상기 복구 정보를 갖는 워크마크의 형태로 상기 제 1 스펙트럼 부분에 상기 복구 정보를삽입하는 삽입기를 포함하는 것으로 충족된다.
이들 대책에 의해, 엔코더는, 실질적으로 광대역 오디오 신호의 전체 정보 및 스펙트럼 컨텐트들을 포함하는 협대역 오디오 신호를 발생할 수 있으며, 협대역 오디오 신호는 협대역 신호 인프라구조와 양립할 수 있다.
양호한 실시예에서, 상기 정보 발생 회로는,
- 상기 제 1 스펙트럼 부분을, 광대역 오디오 신호의 주파수 한도들에 실질적으로 대응하는 주파수 한도들을 갖는 외삽된 오디오 신호(extrapolated audio signal)로 외삽하는 외삽기; 및
- 상기 외삽된 오디오 신호를 광대역 오디오 신호와 비교하고, 그 비교에 의존하여 상기 복구 정보를 제공하는 비교기를 포함한다.
이러한 방식으로, 추출된 제 1 스펙트럼 정보는 신호 처리의 더 본질적인 형태에 의해 광대역 오디오 신호로 재처리된다. 따라서, 제공된 외삽된 (광대역) 오디오 신호는 원하는 품질 레벨을 충족시키지 않지만, 신호 처리 전력의 적당한 양을 사용하여 제공된다.
이러한 외삽된 오디오 신호가 원래의 광대역 오디오 신호에 관해 결정될 것이므로, 협대역 오디오 신호와 함께 전송될 필요가 없으며, 광대역 오디오 신호와 외삽된 오디오 신호간의 차(difference)만 제 1 스펙트럼 부분으로 삽입되어야 한다. 이러한 방식으로, 삽입기에 대한 처리 전력 요구들이 감소될 수 있다.
협대역 오디오 신호를 대응하는 광대역 오디오 신호로 처리하는데 사용할 수 있는 복구 정보를 포함하는 협대역 오디오 신호를 디코딩하는 디코더에서, 본 발명의 목적은,
- 상기 복구 정보를 추출하는 추출기로서, 바람직하게 워터마크 추출기는 워터마크의 형태로 존재하는 복구 정보를 추출하는, 상기 추출기; 및
- 상기 복구 정보를 사용하여 하나 이상의 스펙트럼 오디오 신호 부분들을 복구하고, 상기 대응하는 광대역 오디오 신호를 얻기 위해 상기 스펙트럼 오디오 신호 부분들을 상기 협대역 오디오 신호와 병합하는 복구 회로를 포함하는 디코더에 의해 충족된다.
이들 대책에 의해, 디코더는 원래의 광대역 오디오 신호를 매우 신뢰적으로 복구할 수 있으며, 저장된 광대역 오디오 신호는 실질적으로 원래의 광대역 오디오 신호의 전체 정보 및 스펙트럼 컨텐트들을 포함한다.
양호한 실시예에서, 상기 복구 회로는,
- 상기 협대역 오디오 신호를, 대응하는 광대역 오디오 신호의 주파수 한도들에 실질적으로 대응하는 주파수 한도들을 갖는 외삽된 오디오 신호로 외삽하는 외삽기; 및
- 상기 복구 정보에 의존하여 상기 외삽된 오디오 신호의 특성들을 수정하는 상관기로서, 바람직하게 외삽기에 포함되는 상기 상관기를 포함한다.
이러한 방식으로, 외삽은 신호 처리 전력의 적당한 양을 사용하여 원래의 광대역 오디오 신호의 나머지 스펙트럼 부분들의 상당한 부분을 제공한다. 따라서, 광대역 오디오 신호와 외삽된 오디오 신호간의 차만이 제 1 스펙트럼 부분으로 삽입된 인식 가능한 왜곡들로부터 복구되어야 한다. 이러한 방식으로, 추출기에 대한처리 전력 필요들은 감소될 수 있다.
협대역 전송 채널을 통해 광대역 오디오 신호를 전송하는 시스템에서, 본 발명의 목적은, 전송단에서 광대역 오디오 신호를 협대역 오디오 신호로 처리하는 본 발명에 따른 엔코더, 및 수신단에서 상기 협대역 오디오 신호를 광대역 오디오 신호로 재처리하는 본 발명에 따른 디코더를 포함하는 시스템에 의해 충족된다.
이들 대책에 의해, 광대역 오디오 신호들을 전송하는 완전한 시스템은, 협대역에서 광대역 상태로 전송 채널을 갱신할 필요 없이 확립된다. 따라서, 새로운 시스템은 단지, 전체 전송 채널의 전송단 및 수신단에서 설치되어야만 한다.
본 발명의 실시예들에 따라, 그러한 새로운 설치들은, 전화선들을 통한 라디오 프로그램들의 고품질 전송을 위해서와 같이, 하나 또는 몇 개의 전송들을 위해 시스템들이 설치될 수 있거나, 또는 공중 전화망에 접속된 전화 세트들 또는 이동 전화기들과 같은 장치로 포함될 수 있는 것에 의해 바람직하게 구현될 수 있고, 따라서 동일한 설비들을 갖는 별도의 장치에 접속될 때 향상된 전송 품질을 가입자에게 제공할 수 있다.
협대역 오디오 신호가 광대역 오디오 신호보다 저장 매체에서 더 작은 저장 공간을 차지할 것이므로, 오디오 신호들의 저장을 위한 임의의 저장 매체의 효과적인 용량은 충분히 감소된다.
저장 및 검색을 위한 본 발명의 실시예에 따른 시스템은 당연히 그러한 저장 매체를 사용할 때 제공되어야 하지만, 그러한 단 하나의 시스템이 저장 매체의 용량에 상관없이 제공되어야 하므로, 경제적 이점은 더 큰 용량들을 갖는 저장 매체들에 대해 더 클 것이다.
협대역 오디오 신호 또는 제 1 스펙트럼 부분 각각에 대해 전송 목적들과는 다른 주파수 제한들을 저장 목적을 위해 사용하는 것이 본 발명 및 청구항들의 범위 내에 있다.
전송 목적을 위해, 협대역 오디오 신호는 바람직하게, 전송 채널과 동일한 주파수 제한들이 제공됨으로써, 제 1 스펙트럼 부분에 삽입될 정보량을 감소시킨다.
그러나, 저장 목적을 위해, 본 발명의 저장 시스템을 사용하여 재생 품질의 원하는 레벨을 위한 가장 큰 압축비를 제공하는 본 발명의 협대역 오디오 신호의 주파수 제한들은 전송 목적들을 위한 상기 양호한 주파수 제한들과 동일할 필요는 없을 것이다.
이하, 본 발명은 실시예들에 의해 도면들을 참조하여 실보다 상세히 설명될 것이다.
도 1에서, 광대역 오디오 신호(1)는 입력 단자에 존재한다. 그 신호는 두 필터들, 즉 대역 통과 필터(2) 및 대역 정지 필터(3)의 입력들에 전달된다. 대역 통과 필터(2)는 광대역 오디오 신호의 제 1 스펙트럼 부분을 통과시키고, 이 부분은 협대역 오디오 신호(4)를 구성한다. 대역 통과 필터(2)에 대한 주파수 제한들 또는 차단 주파수들은 예컨대, 각각 300Hz 및 3.4kHz일 수 있다. 협대역 오디오 신호(4)는 필터(2)의 주파수 제한들에 대응하는 주파수 제한들을 가질 것이다.
바람직하게, 대역 정지 필터(3)의 주파수 제한들 또는 차단 주파수들은 대역 통과 필터(2)의 주파수 제한들 또는 차단 주파수들에 대응한다. 그에 의해 대역 정지 필터(3)는 협대역 오디오 신호(4)에 포함되지 않는 광대역 오디오 신호(1)의 나머지 스펙트럼 부분들(5)을 통과시킨다.
광대역 오디오 신호(1)는 20 또는 100Hz에서 10 또는 20kHz 범위의 전체 오디오 신호일 수 있다. 그 경우, 대역 정지 필터(3)는 대역 통과 필터(2)와 동일한 차단 주파수들, 즉 300Hz 및 3.4kHz를 가질 수 있다. 나머지 스펙트럼 부분들(5)은 100Hz 내지 300Hz와 3.4kHz 내지 10 또는 20kHz의 주파수 대역들에 의해 구성된다.
광대역 오디오 신호(1)는 즉,300Hz 내지 8kHz의 주파수들을 포함하는 매체-대역 음성 신호이며, 그 경우, 나머지 스펙트럼 부분들(5)은 3.4kHz 내지 8kHz의 주파수 대역일 것이며, 대역 정지 필터(3)는 3.4kHz의 고역 필터에 의해 대체된다.
나머지 스펙트럼 부분들(5)은 정보 발생기 또는 정보 발생 회로(6)에 의해 생성된다. 이러한 회로(6)는 나머지 스펙트럼 부분들(5)의 컨텐트들에 대한 정보(7)를 적당한 포맷으로 삽입기(8)에 전달한다. 본 발명에 따라, 상기 정보(7)는 나머지 스펙트럼 부분들(5)을 복구하기 위한 기초로서 적절하지만, 나머지 스펙트럼 부분들(5)보다 더 작은 정보량을 바람직하게 구성한다.
삽입기(8)는 상기 부분(4)의 주파수 범위를 증가시키지 않고 바람직하게 지각적으로 들을 수 없는 방식으로 제 1 스펙트럼 부분(4)에 정보(7)를 삽입하고, 따라서 삽입기(8)로부터의 출력은 대역 통과 필터(2)의 차단 주파수에 대응하는 주파수 제한들을 갖는 협대역 오디오 신호(9)를 구성한다.
삽입과 같은 여러 개의 사용할 수 있는 방법들은 정보(7)가 워터마크의 "페이로드(payload)"로서 바람직하게 삽입되는, 워터마킹하는 하나의 양호한 방법이 존재한다.
도 1의 엔코더의 한 목적은, 전체 정보(7)가 신호(9)로부터 모호하지 않게 회복할 수 있는 방식과, 동시에, 협대역 오디오 정보(9)에 이렇게 삽입된 정보가 들리지 않거나, 적어도 협대역 오디오 신호(9)를 듣는 사람을 그다지 방해하지 않을 것이 보장되는 방식으로 제 1 스펙트럼 부분으로 삽입된다.
협대역 오디오 신호(9)가 대역 통과 필터(2)의 주파수 제한들 바깥의 주파수들을 포함하지 않기 때문에, 협대역 오디오 신호들을 다루도록 설계된 임의의 인프라구조에 의해 쉽게 처리 또는 전송할 수 있을 것이다. 언급된 경우, 대역 통과 필터(2) 및 협대역 오디오 신호(9)의 주파수 제한들이 각각 300Hz 및 3.4kHz일 때, 협대역 오디오 신호(9)는 상당한 스펙트럼 열화 없이, 예컨대 공중 전화 시스템을 통해 전송될 수 있다.
도 2를 참조하면, 도 1의 신호(9)와 같은 코딩된 협대역 오디오 신호(20)는 입력 단자에 존재한다. 협대역 오디오 신호(20)는 삽입된 정보(22)가 신호로부터추출되는 경우 추출기(21)에 전달된다. 이러한 정보는, 예컨대 도 1의 정보(7)에 대응하고, 워터마크로서 신호(20)에 바람직하게 존재한다. 삽입된 정보의 추출에 대해 방법들 기기들이 본래 공지되어 있다.
이러한 정보(22)에 기초하여, 나머지 스펙트럼 부분들(24)은 복구기(23)에 의해 복구된다. 이들 스펙트럼 부분들은 광대역 오디오 신호(27)를 얻기 위해 병합 회로(26)에서 협대역 오디오 신호(20)와 병합된다. 이러한 신호(27)는 예컨대, 도 1의 광대역 오디오 신호에 대응한다.
도 1의 엔코더 및 도 2의 디코더는 예컨대, 전화선과 같은 협대역 전송 채널의 각각 전송단 및 수신단에서 바람직하게 작동을 가져온다.
이제, 그러한 전송 채널이 전송된 협대역 오디오 신호의 품질을 유지하도록 연장하고, 도 1의 정보 발생(6) 및 삽입(7)에 이어 도 2의 추출(21) 및 복구(23)가 광대역 오디오 신호(1)의 나머지 스펙트럼 부분들의 품질을 유지하도록 연장하기 위하여, 이러한 광대역 신호는 협대역 전송 채널을 통해 전송될 수 있고 특정 스펙트럼 품질로 품질의 상당한 손실 없이 기술된 바와 같이 다시 복구될 수 있다.
그러한 전송 채널에 사용된 변조 및 복조 원리들의 선택은 본 발명의 협대역 오디오 신호의 전송 능력에 영향을 미치지 않는다.
그러한 변조는 예컨대, GSM 이동 전화 네트워크 또는 종래의 아날로그 전화 네트워크에 사용될 수 있다. 전자의 경우, 변조기는 전송단에서 GSM 이동 전화일 수 있고, 복조기는 수신단에서 GSM 이동 전화일 수 있다. 전송 채널을 따라, 여러 종류의 변조가 사용될 수 있다.
예컨대, 전송단에서 이동 전화를 서빙하는 GSM 네트간의 접속은 종래 형태의 아날로그 변조를 사용하여 종래의 장거리 아날로그 전화 네트워크를 통해 수신단에서 이동 전화를 서빙하는 GSM 네트에 접속될 수 있다.
기존 협대역 인프라구조를 통한 그러한 광대역 오디오 신호들의 전송은 큰 경제적 이점들을 제공하는 것이 분명하다. 공중 전화 시스템은 표준화된 협대역 오디오 신호들을 위한 거의 보편적으로 분포된 전송 시스템을 제공한다. 광대역 오디오 신호들의 임의의 전송을 위한 이러한 시스템의 사용은 광대한 대다수 환경들에 없어도 되는 광대역 오디오 신호들에 대한 특정한 전송 서비스들을 렌더링할 것이고, 따라서, 투자를 절감할 수 있다.
코딩된 협대역 오디오 신호(9, 20)가 기존의 종래 협대역 오디오 신호 처리 방법들 및 기기와 직접 양립할 수 있다는 점이 본 발명의 별도의 장점이다. 언급한 바와 같이, 삽입된 정보는 바람직하게, 본 발명의 협대역 오디오 신호들(9, 20)에서 들을 수 없거나, 적어도 거의 들을 수 없거나 지각적으로 들을 수 없다.
이것은 협대역 오디오 신호(9)가 기존의 협대역 단말들, 즉 기존 협대역 인프라구조에 결합된 임의의 미리 공지된 종단 기기에 의해 쉽게 재생 또는 수신될 수 있음을 의미한다. 그러한 기기에서, 본 발명의 협대역 오디오 신호들이 인식되고, 종래의 신호들로서 다루어진다. 삽입된 정보는 그러한 기기에 사용되지 않지만, 실제로 방해를 일으키지도 않을 것이다; 들리게 된다면, 그것은 잡음으로 나타날 것이다.
상기 기술된 본 발명의 엔코더 및 디코더의 사용을 약속하는 것은 전화 세트들 및 이동 전화들을 포함하는 전화 장치들이 될 것이다. 본 발명의 엔코더 및 디코더들이 그러한 전화들 내에 만들어진다면, 광대역 음성 접속들은 그러한 기기가 공중 전화 네트워크에 결합될 때, 쉽게 이루어질 수 있다.
전화 접속이 그러한 전화와 종래의 전화 사이에 확립된다면, 당연히 접속은 협대역이 될 것이다. 종래의 전화는 매우 가벼운 잡음으로 삽입된 정보를 재생할 것이고, 본 발명의 전화는, 정보(22)(도 2)가 존재하지 않고 따라서 나머지 스펙트럼 부분들(24)이 협대역 오디오 신호로 병합되지 않지만, 문제없이 접속이 성공함에 따라, 종래의 전화로부터 협대역 오디오 전화를 재생할 것이다.
그러나, 본 발명에 따른 두 전화들이 함께 결합될 때마다, 광대역 전화 접속이 발생하고, 결과적으로 전화 가입자들에 의해 훨씬 더 높은 신호 품질이 경험될 것이다. 그러한 향상된 접속 품질은 예컨대, 여전히 성장하는 이동 전화 시장에서 중요한 경쟁 파라미터로서 판명될 수 있다.
스피커 또는 대응 코멘트들(correspondent comments)을 전송할 때 방송 스튜디오들을 상호 접속하는 특정한 단말 기기도 또한 본 발명으로부터 이점이 될 수 있다. 오늘날, 그러한 접속은 매우 불량한 전송 품질을 유발하는 공중 전화 네트워크를 통해 가장 흔하게 만들어진다. 그러한 기기에 본 발명을 사용하면 매우 개선된 방송 오디오 품질을 제공할 것이다.
본 발명의 엔코더의 하나의 양호한 실시예는 도 3에 도시되어 있다. 아날로그 광대역 오디오 신호(40)는 A/D 변환기(41)에서 디지털 광대역 오디오 신호로 변환되고, 이어서 두개의 디지털 필터들(42, 43)에서 필터링된다. 디지털 필터(43)는협대역 오디오 신호를 구성하는 제 1 스펙트럼 부분(51)을 제공하는 대역 통과 필터이고, 디지털 필터(42)는 광대역 오디오 신호(40)의 나머지 스펙트럼 부분(들)(52)을 제공하는 대역 정지 필터 또는 고역 필터일 수 있다.
제 1 스펙트럼 부분(51)과 나머지 스펙트럼 부분들(52)은 정보 발생기(55)에 전달된다. 여기서, 제 1 스펙트럼 부분(51)은 의사 신호(pseudo signal; 57)를 형성하기 위해 외삽기(53)에서 외삽된다. 의사 신호(57)는 출력에서 차 신호(56)를 제공하는 비교기(54)에서 나머지 스펙트럼 부분들(52)과 비교될 수 있다.
도 3의 제 1 버전의 실시예에서, 외삽기(53)에 의해 전달된 의사 신호(57)는 제 1 스펙트럼 부분(51)에서 포함되지 않은 광대역 오디오 신호(40)의 주파수들에 대응하는 주파수들을 포함한다. 즉, 의사 신호의 스펙트럼은 나머지 스펙트럼 부분들(52)의 스펙트럼에 대응한다.
외삽기는 비교적 단순한 회로로서 이해된다. 그러한 회로들은 미리 공지되어 있고, 더 높은 품질의 광대역 오디오 신호를 얻기 위하여 협대역 오디오 신호를 향상시키도록 의도된다; 그러나, 일반적으로 더 불량한 품질을 가져온다.
의사 신호(57)는 비교기(54)에서 나머지 스펙트럼 부분들(52)과 비교되고, 언급된 차 신호가 생성된다.
이러한 장치의 목적은 제 1 스펙트럼 부분으로 삽입될 정보량을 감소시키는 것이다. 의사 신호(57)가 나머지 스펙트럼 부분들(52)의 불량한 유사성(imitation)이 될 수 있는 경우에도, 차 신호(56)에서의 정보량이 나머지 스펙트럼 부분들(52)에서보다 상당히 더 작을 만큼 더 양호하게 될 수 있다.
도 3의 제 2 버전의 실시예에서, 외삽기(53)에 의해 전달된 의사 신호(57)는 광대역 오디오 신호(40)의 전체 주파수 스펙트럼을 포함한다.
이러한 경우, 의사 신호(57)는 광대역 오디오 신호(40)와 비교되고, 따라서, 디지털 필터(42)는 생략될 것이다. 이러한 제 2 버전에서, 차 신호(56)는 제 1 버전에서와 같을 필요는 없지만, 그래도 일반적으로, 의사 신호(57)의 나머지 스펙트럼 부분들(52)과 대응하는 스펙트럼 부분들 간의 차를 표현한다.
제 1 스펙트럼 부분(51)은 제 1 스펙트럼 부분을 프레임들로 분할하는 분할 회로 또는 프레임기(44)에도 전달된다. 이들 프레임들(46)은 삽입기(45)에 전달된다.
삽입기(45)에서, 각 프레임은 고속 푸리에 변환 회로(47)에서 시간 도메인에서 주파수 도메인으로 먼저 변환된다. 푸리에 계수들은 차 신호(56)에 의존하여 수정되는 경우 수정기(modifier; 48)에 전달되고, 따라서 차 신호(56)의 정보를 주파수 도메인의 제 1 스펙트럼 부분으로 삽입된다.
수정된 푸리에 계수들은 역푸리에 변환 회로(49)에 전달되고, 수정된 제 1 스펙트럼 부분은 주파수 도메인에서 시간 도메인으로 다시 변환된다.
결과로서 생긴 시간 도메인 신호(50)는 프레임들로 분할되고, 스펙트럼 부분에 삽입되는 차 신호(56)를 가진다는 사실은 별문제로 하고, 제 1 스펙트럼 부분(51)과 유사하다.
제 1 스펙트럼 부분을 프레임들로 분할하는 단계는 가장 먼저, 사용된 삽입 원리의 목적을 위해 본 발명의 디코더의 이러한 실시예에 포함된다. 그러나, 디지털 오디오 신호의 분할은 다른 목적들을 위해서도 사용될 수 있다.
도 3의 제 3 버전의 실시예에서, 정보 발생기가 분배되고, 나머지 스펙트럼 부분들(52)은 차 신호(56) 대신 삽입기에 직접 전달된다. 이것은 엔코더를 더 단순하게 만들지만, 동시에 삽입될 정보량을 상당히 크게 한다.
수정기(48)에서, 차 신호(56) 또는 나머지 스펙트럼 부분(52)은 각각, 공지된 이진 워드들의 시퀀스(특정한 “워터마크(watermark)")로부터의 샘플들을 푸리에 계수들의 절대값들에 부가함으로써 푸리에 계수들의 수정들이 바람직하게 표현될 수 있다. 상기 시퀀스는 각 프레임(46)에서 신호 샘플들의 수에 대응하는 다수의 이진 워드들을 바람직하게 포함할 것이다.
각 프레임(46)에 대한 상기 샘플들의 시퀀스는 차 신호(56) 또는 나머지 스펙트럼 부분들(52) 각각의 값에 의존하여 바람직하게 순환적으로 시프트될 수 있으며, 실제로 상기 값은 워터마크 샘플들의 시퀀스의 시프트량에 의해 표현된다.
실험들은, 본 발명에 따른 협대역 오디오 신호를 산출하기 위해 제 1 스펙트럼 부분으로 삽입된 차 신호가 종래의 협대역 기기의 부분에 의해 재생될 때, 임의의 상당한 범위(significant extent)까지 협대역 오디오 신호(50)를 열화하지 않음을 보여주었다.
본 발명의 디코더의 한 양호한 실시예는 도 4에 도시되어 있다. 본 발명의 디지털 프레임된 협대역 오디오 신호(70)는 입력 단자에 수신되고 추출기(71)에 전달되며, 여기서 본 발명에 따른 임의의 삽입된 정보는 협대역 오디오 신호(70)로부터 추출된다.
추출기(71)에서, 프레임된 협대역 오디오 신호(70)는 이산 푸리에 변환을 받고, 푸리에 계수들은 상호 상관 회로(73)에 전달된다.
도 3의 삽입기(45)의 양호한 실시예에 대응하는 이러한 회로의 양호한 실시예에서, 푸리에 계수들과 공지된 워터마크(도 3의 이진 워드들의 동일한 시퀀스) 사이의 상관은 삽입기(45)에서 사용된 워터마크 워드의 순환적 시프트의 각각의 가능한 값에 대해 확립된다.
이러한 상관은 순환적 시프트가 삽입에 사용된 시프트와 동일할 때 상당한 값(significant value)을 취할 것이고, 이러한 방식으로 삽입된 값(“페이로드”)이 식별되고 따라서 추출될 수 있다. 이러한 추출은 도 4의 페이로드 추출 회로를 표현하는 박스(75)에 의해 기호화된다. 차 신호(56) 또는 나머지 스펙트럼 부분들(52)에 대응하는 추출된 페이로드는 각각 도 4의 단자(76)에서 나타날 것이며, 이로부터 수신된 협대역 오디오 신호(70)와 함께 복구기(79)에 공급된다.
복구기에서, 수신된 협대역 오디오 신호(70)는 외삽기(80)에 전달되고, 외삽기(80)는 외삽된 의사 신호(74)를 공급한다. 이러한 의사 신호(74)는 정정기(81)에 공급되고, 정정기(81)는 추출된 페이로드(76)에 의존하여 보정된다. 의사 신호(74)가 도 3의 의사 신호(57)에 대응하는 것이 필수적이다.
도 4의 제 1 버전의 실시예에서, 외삽기(80)에 의해 전달된 의사 신호(74)는 도 3의 제 1 버전의 엔코더에 대응하는 방식으로, 제 1 스펙트럼 부분(51)에 포함되지 않은 광대역 오디오 신호(40)의 주파수들에 대응하는 주파수들을 포함한다.
이러한 버전에서, 페이로드(76)는 의사 신호(74)에 부가될 차 신호를 구성할것이고, 합 신호(82)는 나머지 스펙트럼 부분들(52)에 대응할 것이다. 이들은 병합 회로(83)에서 수신된 협대역 오디오 신호(70)와 병합되고, 병합 회로(83)로부터의 출력 신호(84)는 복구된 광대역 오디오 신호를 구성할 것이다.
도 3의 제 2 버전의 엔코더와 함께 사용될 도 4의 제 2 버전의 실시예에서, 외삽기(80)에 의해 전달된 의사 신호(74)는 원래의 광대역 오디오 신호(40)의 전체 주파수 스펙트럼을 포함한다.
그 경우, 페이로드(76)는 일반적으로, 의사 신호(74)의 나머지 스펙트럼 부분(52)과 대응하는 스펙트럼 부분들 사이의 차를 표현할 것이다. 이러한 차를 의사 신호(74)에 부가하는 것은 나머지 스펙트럼 부분들(52)에 대응하는 합 신호(82)를 다시 산출할 것이며, 이는 복구된 광대역 오디오 신호(84)를 얻기 위해, 수신된 협대역 오디오 신호(70)와 병합된다.
도 3의 제 3 버전의 엔코더에 대응하는 도 4의 제 3 버전의 디코더에서, 페이로드는 전체의 나머지 스펙트럼 부분들(52)에 대응하고, 병합 회로(83)에 직접 전달될 것이다. 이러한 경우, 복구기(79)는 생략된다.
도 3의 세 가지 버전이 엔코더와, 도 4의 대응하는 버전의 디코더는 협대역 인프라구조를 따라 광대역 오디오 신호를 전송하기 위한 본 발명에 따른 엔코더-디코더 쌍들의 세 가지 실시예들을 구성한다. 광대역 오디오 신호는 전송단에서 엔코딩되고 수신단에서 디코딩된다.
그러나, 협대역 인프라구조는 전송 채널일 필요는 없지만, 예컨대 저장 시스템과 같은 임의의 협대역 구조일 수 있다. 그 경우, 광대역 오디오신호는 본 발명에 따른 협대역 오디오 신호의 형태로 저장될 수 있고, 저장 장치로부터의 검색에서, 도 2 및 도 4를 참조하여 기술되는 바와 같이 광대역 형태로 디코딩될 수 있다. 그에 의해, 광대역 오디오 신호의 효과적인 압축이 얻어진다. 그러한 시스템으로부터 얻어진 이점들은 본 명세서의 처음 부분에 기술되었다.
임의의 원하는 재생 품질 레벨을 위한 더 큰 정도의 압축을 제공하기 위해 제 1 스펙트럼 부분에 대한 주파수 제한들을 설계하는 것이 본 발명 내에 있다.
유사하게, 본 발명의 협대역 오디오 신호는 협대역 오디오 신호 처리 또는 구조의 임의의 다른 형태에 속할 수 있고, 대응하는 이점들을 제공한다.
신호들의 워터마킹으로부터 공지된 삽입 방법들의 사용을 포함하는, 복구 정보를 제 1 스펙트럼 부분으로 삽입하는 특정 방식들에 대한 기준이 만들어졌지만, 제 1 스펙트럼 부분으로 복구 정보를 삽입하고, 상기 정보의 후속 추출하는 임의의 방법을 사용하는 것이 본 발명의 범위 내에 있다.
일반적으로 광대역 오디오 신호들에 대한 기준이 만들어졌지만, 광대역 음성 신호들에 본 발명을 적용하는 것이 특히 유리한 것으로 간주된다.
음성은 오디오 신호를 구성하며, 음성 메시지의 이해를 위해 필요한 신호의 없어서는 안 되는 부분들은 신호의 명확한 스펙트럼 부분, 즉 300 내지 3400Hz 주파수 대역에 포함된다. 이러한 대역은 본 발명을 사용할 때, 임의의 변경 없이 각각 전송 또는 저장될 수 있는 반면, 나머지 스펙트럼 부분들은 300 내지 3400Hz 주파수 대역과 동일한 적합도로 재생될 필요는 없다.
따라서, 나머지 스펙트럼 부분들을 재생하는 것은 음성 신호들, 즉 음악을재생할 때, 낮은 표준으로 행해질 수 있다. 이러한 방식으로, 본 발명은 낮지만 여전히 사용되는 재생의 수용할 수 있는 품질을 선택하는데 사용될 수 있고, 따라서 처리전력을 절약할 수 있다.
상술된 실시예들은 본 발명을 제한하기보다는 설명하기 위한 목적이며, 당업자는 첨부된 청구항들의 범위를 벗어나지 않고 많은 대안적인 실시예들을 설계할 수 있다. 청구항들에서, 괄호 안의 임의의 참조 부호들은 청구항을 제한하는 것으로 구성되어서는 안 된다. 단어 ‘포함하는’은 청구항에 나열된 소자들 또는 단계들 이외의 것들의 존재를 배제하지 않는다. 본 발명은 여러 개의 별도의 소자들을 포함하는 하드웨어에 의해 구현될 수 있고, 적절히 프로그램된 컴퓨터에 의해 구현될 수도 있다. 여러 개의 수단을 나열한 장치 청구항에서, 이들 여러 개의 수단은 하드웨어의 하나 또는 동일 항목에 의해 구체화될 수 있다. 특정 측정들이 서로 다른 종속 청구항들에서 인용되는 단순한 사실은 이들 측정들의 조합이 유리하게 사용될 수 없음을 나타내지 않는다.

Claims (15)

  1. 협대역 오디오 신호를 대응하는 광대역 오디오 신호(27; 84)로 처리하는데 사용할 수 있는 정보를 포함하는 상기 협대역 오디오 신호(9; 50)에 있어서, 상기 정보는 인식할 수 있는 왜곡들로서 상기 협대역 오디오 신호에 존재하는 것을 특징으로 하는, 협대역 오디오 신호.
  2. 제 1 항에 있어서,
    상기 정보는 바람직하게, 지각적으로 들을 수 없는 방식으로 워터마크로서 상기 협대역 오디오 신호로 삽입되는, 협대역 오디오 신호.
  3. 광대역 오디오 신호(1; 40)를, 상기 광대역 오디오 신호와 실질적으로 동일한 정보를 포함하는 협대역 오디오 신호(9; 50)로 처리하는 방법으로서, 상기 표준화된 주파수 한계들 내에 있는 상기 광대역 오디오 신호의 제 1 스펙트럼 부분(4; 51)은 상기 협대역 오디오 신호에서 실질적으로 변경되지 않고 유지되고, 상기 광대역 오디오 신호의 나머지 스펙트럼 부분들(5; 52)을 복구하는데 사용할 수 있는 복구 정보(7; 56)는 상기 제 1 스펙트럼 부분으로 삽입되는, 상기 처리 방법에 있어서,
    상기 복구 정보는 상기 협대역 오디오 신호를 얻기 위해 인식할 수 있는 방법으로 상기 제 1 스펙트럼 부분을 왜곡함으로써 상기 제 1 스펙트럼 부분으로 삽입되는 것을 특징으로 하는, 처리 방법.
  4. 제 3 항에 있어서,
    상기 복구 정보(7; 56)는 상기 복구 정보를 페이로드로 갖는 워터마크로서 상기 제 1 스펙트럼 부분(4; 51)으로 삽입되는, 처리 방법.
  5. 제 4 항에 있어서, 상기 워터마크는,
    - 상기 제 1 스펙트럼 부분(51) 및 상기 나머지 스펙트럼 부분들(52)을 디지털 형태로 제공하고;
    - 상기 제 1 스펙트럼 부분(51)을 프레임들(46)로 조직하고;
    - 상기 프레임을 푸리에 변환하고(47);
    - 상기 워터마크에 의존하여 상기 푸리에 계수들을 수정하고(48);
    - 시간 도메인의 워터마킹된 프레임을 얻기 위해 상기 수정된 푸리에 계수들을 역푸리에 변환(49)함으로써, 상기 제 1 스펙트럼 부분으로 삽입되는, 처리 방법.
  6. 제 3 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 협대역 오디오 신호는, 바람직하게는, 전송 채널을 통해 상기 협대역 오디오 신호를 전송하거나 저장 매체 상에 상기 신호를 저장한 후에, 광대역 오디오 신호로 재처리되는, 처리 방법.
  7. 광대역 오디오 신호(1; 40)를, 상기 광대역 오디오 신호와 실질적으로 동일한 정보를 포함하는 협대역 오디오 신호(9; 50)로 코딩하는 엔코더에 있어서,
    - 상기 광대역 오디오 신호로부터 제 1 스펙트럼 부분(4; 51)을 추출하는 필터(2; 43)로서, 상기 제 1 스펙트럼 부분은 표준화된 주파수 한계들 내에 있는, 상기 필터(2; 43);
    - 상기 광대역 오디오 신호로부터, 또는 상기 광대역 오디오 신호의 나머지 스펙트럼 부분들(5; 52)로부터 복구 정보(7; 56)를 추출하는 정보 발생 회로(6; 55)로서, 상기 정보는 상기 광대역 오디오 신호의 나머지 스펙트럼 부분들을 복구하는데 사용할 수 있는, 상기 정보 발생 회로(6; 55); 및
    - 상기 협대역 오디오 신호를 얻기 위해, 바람직하게는, 페이로드로서 상기 복구 정보를 갖는 워크마크의 형태로 상기 제 1 스펙트럼 부분에 상기 복구 정보를 삽입하는 삽입기(8; 45)를 포함하는 것을 특징으로 하는, 엔코더.
  8. 제 7 항에 있어서, 상기 정보 발생 회로(55)는,
    - 상기 제 1 스펙트럼 부분(51)을, 상기 광대역 오디오 신호의 주파수 한도들에 실질적으로 대응하는 주파수 한도들을 갖는 외삽된 오디오 신호(extrapolated audio signal; 57)로 외삽하는 외삽기(53); 및
    - 상기 외삽된 오디오 신호를 상기 광대역 오디오 신호(40) 또는 상기 나머지 스펙트럼 부분들(52)과 비교하고 상기 비교에 의존하여 상기 복구 정보(56)를제공하는 비교기(54)를 포함하는, 엔코더.
  9. 협대역 오디오 신호를 대응하는 광대역 오디오 신호(27; 84)로 처리하는데 사용할 수 있는 복구 정보를 포함하는 상기 협대역 오디오 신호(20; 70)를 디코딩하는 디코더에 있어서,
    - 상기 복구 정보(22; 76)를 추출하는 추출기(21; 71); 및
    - 상기 복구 정보를 사용하여 하나 이상의 스펙트럼 오디오 신호 부분들(24
    ; 82)을 복구하고, 상기 대응하는 광대역 오디오 신호를 얻기 위해 상기 스펙트럼 오디오 신호 부분들을 상기 협대역 오디오 신호와 병합하는 복구 회로(23; 79)를 포함하는, 디코더.
  10. 제 9 항에 있어서, 상기 복구 회로(79)는,
    - 상기 협대역 오디오 신호를, 상기 대응하는 광대역 오디오 신호의 주파수 한도들에 실질적으로 대응하는 주파수 한도들을 갖는 외삽된 오디오 신호(74)로 외삽하는 외삽기(80); 및
    - 상기 복구 정보에 의존하여 상기 외삽된 오디오 신호의 특성들을 수정하는 상관기(81)를 포함하는, 디코더.
  11. 협대역 전송 채널을 통해 광대역 오디오 신호를 전송하는 시스템에 있어서,
    전송단(transmitting end)에서 상기 광대역 오디오 신호를 협대역 오디오 신호로 처리하는 제 7 항에 따른 엔코더, 및 수신단에서 상기 협대역 오디오 신호를 광대역 오디오 신호로 재처리하는 제 9 항에 따른 디코더를 포함하는 것을 특징으로 하는, 전송 시스템.
  12. 광대역 오디오 신호를 저장 매체 상에 저장하고, 저장 장치로부터 상기 광대역 오디오 신호를 검색하는 시스템에 있어서,
    저장하기 전에 상기 광대역 오디오 신호를 협대역 오디오 신호로 처리하는 제 7 항에 따른 엔코더, 및 저장 장치로부터 검색한 후에 상기 저장된 협대역 오디오 신호를 광대역 오디오 신호로 재처리하는 제 9 항에 따른 디코더를 포함하는 것을 특징으로 하는, 저장 및 검색 시스템.
  13. 제 1 항에 따른 협대역 오디오 신호를 담는, 저장 매체.
  14. 제 9 항에 청구된 바와 같은 디코더를 포함하는, 재생 장치.
  15. 제 7 항에 청구된 바와 같은 엔코더를 포함하는, 전송기.
KR10-2004-7005938A 2001-10-25 2002-10-10 감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법 KR20040048978A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01204075 2001-10-25
EP01204075.4 2001-10-25
PCT/IB2002/004260 WO2003036624A1 (en) 2001-10-25 2002-10-10 Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth

Publications (1)

Publication Number Publication Date
KR20040048978A true KR20040048978A (ko) 2004-06-10

Family

ID=8181137

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7005938A KR20040048978A (ko) 2001-10-25 2002-10-10 감소된 대역폭을 가진 전송 채널 상에 광대역 오디오신호들을 전송하는 방법

Country Status (9)

Country Link
US (1) US20030088327A1 (ko)
EP (1) EP1446797B1 (ko)
JP (1) JP2005506584A (ko)
KR (1) KR20040048978A (ko)
CN (1) CN1288626C (ko)
AT (1) ATE363121T1 (ko)
BR (1) BR0206194A (ko)
DE (1) DE60220307T2 (ko)
WO (1) WO2003036624A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101722885B1 (ko) 2016-08-23 2017-04-03 백기출 덧버선 편직방법 및 덧버선 편직장치 및 덧버선

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2268112T3 (es) * 2001-11-14 2007-03-16 Matsushita Electric Industrial Co., Ltd. Codificacion y descodificacion de audio.
US7188248B2 (en) * 2002-07-09 2007-03-06 Kaleidescope, Inc. Recovering from de-synchronization attacks against watermarking and fingerprinting
WO2004006559A2 (en) * 2002-07-09 2004-01-15 Kaleidescape, Inc. Secure presentation of encrypted digital content
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US20060034481A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US20060034299A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US8019449B2 (en) * 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections
GB0710211D0 (en) * 2007-05-29 2007-07-11 Intrasonics Ltd AMR Spectrography
ES2409843T3 (es) * 2008-01-24 2013-06-28 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, y dispositivo y programa para los mismos, y medio o soporte de registro o grabación
EP2234400A1 (en) * 2009-03-23 2010-09-29 Sony Corporation Method and device for providing a multimedia content stream embedding processing information for the content
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
CN102522092B (zh) * 2011-12-16 2013-06-19 大连理工大学 一种基于g.711.1的语音带宽扩展的装置和方法
EP2709102A1 (en) * 2012-09-12 2014-03-19 Thomson Licensing Method and apparatus for determining an optimum frequency range within a full frequency range of a watermarked input signal
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10707905B2 (en) * 2015-06-23 2020-07-07 Skyworks Solutions, Inc. Wideband multiplexer for radio-frequency applications
CN114679192B (zh) * 2020-12-24 2023-06-09 海能达通信股份有限公司 一种宽窄带多模终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3418297A1 (de) * 1984-05-17 1985-11-21 Europäische Rundfunk- und Fernseh AG - EUROPA 1, 6600 Saarbrücken Verfahren zur uebertragung breitbandiger tonsignale ueber einen uebertragungskanal mit verminderter uebertragungsbandbreite
AU697176B2 (en) * 1994-11-04 1998-10-01 Koninklijke Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6557103B1 (en) * 1998-04-13 2003-04-29 The United States Of America As Represented By The Secretary Of The Army Spread spectrum image steganography
US6871180B1 (en) * 1999-05-25 2005-03-22 Arbitron Inc. Decoding of information in audio signals
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101722885B1 (ko) 2016-08-23 2017-04-03 백기출 덧버선 편직방법 및 덧버선 편직장치 및 덧버선

Also Published As

Publication number Publication date
JP2005506584A (ja) 2005-03-03
DE60220307D1 (de) 2007-07-05
ATE363121T1 (de) 2007-06-15
BR0206194A (pt) 2004-02-03
EP1446797B1 (en) 2007-05-23
CN1288626C (zh) 2006-12-06
CN1575492A (zh) 2005-02-02
DE60220307T2 (de) 2008-02-07
EP1446797A1 (en) 2004-08-18
US20030088327A1 (en) 2003-05-08
WO2003036624A1 (en) 2003-05-01

Similar Documents

Publication Publication Date Title
EP1446797B1 (en) Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
CA2444151C (en) Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
KR100299528B1 (ko) 인텐서티-스테레오 프로세스와 예측 프로세스를 이용한 오디오신호의 부호화/복호화 장치 및 그 방법
US7805313B2 (en) Frequency-based coding of channels in parametric multi-channel coding systems
RU2666291C2 (ru) Устройство и способ обработки сигнала и программа
CN1327409C (zh) 提供信号重建的宽带音频信号发送机、接收机、系统和方法
TWI545931B (zh) 在無線電話網路的語音頻道上傳輸資料之系統,方法及裝置
US10964332B2 (en) Audio communication method and apparatus for watermarking an audio signal with spatial information
WO1999003096A1 (fr) Procede et dispositif de codage et decodage d'informations et support de distribution
JPH0955778A (ja) 音声信号の広帯域化装置
KR20050116828A (ko) 다채널 신호를 나타내는 주 및 부 신호의 코딩
JP2002341896A (ja) ディジタルオーディオ圧縮回路および伸長回路
EP1249837A2 (en) A method for decompressing a compressed audio signal
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
MX2010010368A (es) Sistemas, metodos y aparatos para transmitir datos sobre un canal de voz de una red telefonica inalambrica.
KR100891666B1 (ko) 믹스 신호의 처리 방법 및 장치
Ding Wideband audio over narrowband low-resolution media
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP2904427B2 (ja) 欠落音声補間装置
JP3594829B2 (ja) Mpegオーディオの復号化方法
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
EP2285025A1 (en) Method and apparatus for coding/decoding a stereo audio signal into a mono audio signal
CN100596041C (zh) 嵌入辅助信息的方法和系统及从中解码的方法和系统
JPH04249300A (ja) 音声符復号化方法及びその装置
JP2001094432A (ja) サブバンド符号化・復号方法

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20040422

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20071010

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20090128

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20090429

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20090128

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I