[go: up one dir, main page]

KR101363793B1 - 부호화 장치, 복호 장치 및 그 방법 - Google Patents

부호화 장치, 복호 장치 및 그 방법 Download PDF

Info

Publication number
KR101363793B1
KR101363793B1 KR1020097017702A KR20097017702A KR101363793B1 KR 101363793 B1 KR101363793 B1 KR 101363793B1 KR 1020097017702 A KR1020097017702 A KR 1020097017702A KR 20097017702 A KR20097017702 A KR 20097017702A KR 101363793 B1 KR101363793 B1 KR 101363793B1
Authority
KR
South Korea
Prior art keywords
layer
band
encoding
decoding
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020097017702A
Other languages
English (en)
Other versions
KR20090117883A (ko
Inventor
마사히로 오시키리
도모후미 야마나시
도시유키 모리이
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20090117883A publication Critical patent/KR20090117883A/ko
Application granted granted Critical
Publication of KR101363793B1 publication Critical patent/KR101363793B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

전대역 중에서 오차가 큰 대역을 적은 연산량으로 정확하게 특정할 수 있는 부호화 장치 등을 개시한다. 이 장치에 있어서, 제1 위치 특정부(201)는, 입력 신호에 대한 복호 신호의 오차를 나타내는 제1 레이어 오차 변환계수를 이용해, 입력 신호의 전대역에 걸쳐서, 상대적으로 넓은 대역폭에서 오차가 큰 대역을 탐색하여, 특정한 대역을 나타내는 제1 위치 정보를 생성하고, 제2 위치 특정부(202)는, 제1 위치 특정부(201)에서 특정된 대역에 대해, 상대적으로 좁은 대역폭에서 오차가 큰 타겟주파수 대역을 탐색하여, 특정한 타겟주파수 대역을 나타내는 제2 위치 정보를 생성하고, 부호화부(203)는, 타겟주파수 대역에 포함되는 제1 레이어 복호 오차 변환계수를 부호화하여 부호화 정보를 생성한다. 제1 위치 정보, 제2 위치 정보 및 부호화 정보는, 통신 상대에게 송신된다.

Description

부호화 장치, 복호 장치 및 그 방법{ENCODING DEVICE, DECODING DEVICE, AND METHOD THEREOF}
본 발명은, 스케일러블 부호화 방식의 통신 시스템에 사용되는 부호화 장치, 복호 장치 및 그들의 방법에 관한 것이다.
이동체 통신 시스템에서는, 전파 자원등의 유효 이용을 위해, 음성 신호를 저(低)비트레이트로 압축해서 전송하는 것이 요구되고 있다. 그 한편으로, 통화 음성의 품질 향상이나 현장감 높은 통화 서비스의 실현도 희망되고 있어, 그 실현에는, 음성 신호의 고품질화 뿐만 아니라, 보다 대역이 넓은 오디오 신호 등, 음성 신호 이외의 신호도 고품질로 부호화하는 것이 바람직하다.
이와 같이 상반되는 2개의 요구에 대해서, 복수의 부호화 기술을 계층적으로 통합하는 기술이 유망시 되고 있다. 이 기술은, 음성 신호에 적합한 모델로 입력 신호를 저비트레이트로 부호화하는 제1 레이어와, 입력 신호와 제1 레이어의 복호 신호의 차분 신호를 음성 이외의 신호에도 적합한 모델로 부호화하는 제2 레이어를 계층적으로 조합하는 것이다. 이와 같이 계층적으로 부호화를 행하는 기술은, 부호화 장치로부터 얻어지는 비트 스트림에 스케일러빌리티성, 즉, 비트 스트림의 일부 정보로부터도 복호 신호를 얻을 수 있는 성질을 가지기때문에, 일반적으로 스케 일러블 부호화(계층 부호화)라고 불리고 있다.
스케일러블 부호화 방식은, 그 성질때문에, 비트레이트가 다른 네트워크 사이의 통신에 유연하게 대응할 수 있으므로, IP프로토콜로 다양한 네트워크가 통합되어 가는 향후의 네트워크 환경에 적합한 것이라고 말할 수 있다.
MPEG-4(Moving Picture Experts Group phase-4)로 규격화된 기술을 이용해 스케일러블 부호화를 실현하는 예로서 예를 들면, 비특허 문헌 1에 개시되어 있는 기술이 있다. 이 기술은, 제1 레이어에 있어서, 음성 신호에 적합한 CELP(Code Excited Linear Prediction;부호 여진 선형 예측) 부호화를 이용하고, 제2 레이어에 있어서, 원신호로부터 제1 레이어 복호 신호를 뺀 잔차신호에 대해서, AAC(Advanced Audio Coder)나 TwinVQ(Transform Domain Weighted Interleave Vector Quantization;주파수 영역 가중 인터리브 벡터 양자화) 등의 변환 부호화를 이용한다.
한편, 비특허 문헌 2는, 기본 구성 단위로서 모듈화된 TwinVQ를 이용하여 소망하는 주파수 대역의 MDCT 계수를 계층적으로 부호화하는 수법을 개시하고 있다. 해당 모듈을 공통화하여 복수 회수 사용함으로써, 심플하면서도 자유도 높은 스케일러블 부호화를 실현할 수 있다. 이 수법에서는, 각 계층(레이어)의 부호화 대상이 되는 서브밴드는 미리 결정되어 있는 구성이 기본이 되지만, 입력 신호의 성질에 따라 각 계층 레이어의 부호화 대상이 되는 서브밴드의 위치를 미리 결정된 대역 안에서 변동시키는 구성도 개시되어 있다.
[비특허 문헌 1]삼목필일(三木弼一)편저, 「MPEG-4의 모든 것」, 초판, (주) 공업 조사회, 1998년 9월 30일, p.126-127
[비특허 문헌 2]신명부(神明夫)외, 「계층적 변환 부호화 기본 모듈에 의해 구성되는 스케일러블 악음 부호화」, 전자 정보통신 학회 논문잡지 A, Vol. J83-A, No.3, pp.241-252, 2000년 3월
[비특허 문헌 3] "AMR Wideband Speech Codec; Transcoding functions", 3GPP TS 26.190, March 2001.
[비특허 문헌 4] "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems 3GPP2 C.S0052-A, April 2005.
[비특허 문헌 5] "피치 필터링에 의한 대역 확장 기술을 이용한7/10/15 kHz 대역 스케일러블 음성 부호화 방식" 음 강론집3-11-4, pp.327-328, March 2004.
그렇지만, 출력 신호의 음성 품질을 개선하는데 있어서, 제2 레이어 부호화부의 서브밴드(타겟주파수 대역)를 어떻게 설정하는가가 중요하다. 비특허 문헌 2에 개시된 수법에 따르면, 제2 레이어의 부호화 대상이 되는 서브밴드는 미리 결정되어 있다(도 1 A). 이 경우, 항상 소정 서브밴드의 품질을 높이도록 되기때문에, 그 서브밴드 이외의 대역에 오차 성분이 집중하고 있을 경우에 충분한 음성 품질의 개선 효과는 얻지못한다고 하는 문제가 있다.
또, 입력 신호의 성질에 따라, 각 계층(레이어)의 부호화 대상이 되는 서브밴드의 위치를 미리 결정된 대역 안에서 변동시키는(도1B) 것이 기재되어 있는데, 서브밴드가 취할 수 있는 위치가 소정 대역 내로 한정되어 버리기 때문에, 전술한 과제를 해결하지는 못한다. 또, 만일 서브밴드가 취할 수 있는 대역이 입력 신호의 전대역에 걸치도록(도1C) 했을 경우, 서브밴드의 위치를 특정하기 위한 연산량이 증가해 버린다고 하는 문제가 있다. 또, 레이어수를 늘렸을 때에, 레이어마다 서브밴드의 위치를 특정할 필요가 있기때문에, 이 문제는 현저해진다.
본 발명의 목적은, 스케일러블 부호화 방식에 있어서, 전(全)대역 안에서 오차가 큰 대역을 적은 연산량으로 정확하게 특정할 수 있는 부호화 장치, 복호 장치 및 그것들의 방법을 제공하는 것이다.
본 발명의 부호화 장치는, 입력 변환계수에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성하는 제1 레이어 부호화 수단과, 상기 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여, 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 수단과, 상기 입력 변환계수와 상기 제1 레이어 복호 변환계수의 오차인 제1 레이어 오차 변환계수 중, 상기 오차가 가장 큰 타겟주파수 대역 @부분에 대해서 부호화 처리를 행하여, 제2 레이어 부호화 데이터를 생성하는 제2 레이어 부호화 수단을 구비하고, 상기 제2 레이어 부호화 수단은, 전(全)대역에 걸쳐서, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을, 소정의 제1의 피치폭으로 탐색하고, 특정한 제1 대역을 나타내는 제1 위치 정보를 생성하는 제1 위치 특정 수단과, 상기 제1 대역에 걸쳐서, 상기 제1 의 피치폭보다 좁은 제2의 피치폭으로 상기 타겟주파수 대역을 탐색하여, 특정한 타겟주파수 대역을 나타내는 제2 위치 정보를 생성하는 제2 위치 특정 수단과, 상기 제1 위치 정보, 상기 제2 위치 정보에 의해 특정된 타겟주파수 대역에 포함되는 상기 제1 레이어 오차 변환계수를 부호화하여 부호화 정보를 생성하는 부호화 수단을 구비하는 구성을 취한다.
본 발명의 복호 장치는, 입력 변환계수에 대해서 부호화 처리를 행하여 얻어진 제1 레이어 부호화 데이터, 상기 제1 레이어 부호화 데이터를 복호한 제1 레이어 복호 변환계수와 상기 입력 변환계수의 오차인 제1 레이어 오차 변환계수 중, 상기 오차가 가장 큰 타겟주파수 대역 부분에 대해서 부호화 처리를 행하여 얻어진 제2 레이어 부호화 데이터, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을 나타내는 제1 위치 정보 및 상기 제1 대역안의 상기 타겟주파수 대역을 나타내는 제2 위치 정보를 수신하는 수신 수단과, 상기 제1 레이어 부호화 데이터를 복호하여 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 수단과, 상기 제1 위치 정보 및 상기 제2 위치 정보에 기초하여 상기 타겟주파수 대역을 특정하고, 상기 제2 레이어 부호화 데이터를 복호하여 제1 레이어 복호 오차 변환계수를 생성하는 제2 레이어 복호 수단과, 상기 제1 레이어 복호 변환계수와 상기 제1 레이어 복호 오차 변환계수를 가산하여 제2 레이어 복호 변환계수를 생성하는 가산 수단을 구비하는 구성을 취한다.
본 발명의 부호화 방법은, 입력 변환계수에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성하는 제1 레이어 부호화 스텝과, 상기 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여, 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 스텝과, 상기 입력 변환계수와 상기 제1 레이어 복호 변환계수와의 오차인 제1 레이어 오차 변환계수 중, 상기 오차가 가장 큰 타겟주파수 대역부분에 대해서 부호화 처리를 행하여, 제2 레이어 부호화 데이터를 생성하는 제2 레이어 부호화 스텝을 구비하고, 상기 제2 레이어 부호화 스텝은, 전 대역에 걸쳐서, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을, 소정의 제1 의 피치폭으로 탐색하고, 특정한 제1 대역을 나타내는 제1 위치 정보를 생성하는 제1 위치 특정 스텝과, 상기 제1 대역에 걸쳐서, 상기 제1 피치폭보다 좁은 제2 의 피치폭으로 상기 타겟주파수 대역을 탐색하여, 특정한 타겟주파수 대역을 나타내는 제2 위치 정보를 생성하는 제2 위치 특정 스텝과, 상기 제1 위치 정보, 상기 제2 위치 정보에 의해 특정된 타겟주파수 대역에 포함되는 상기 제1 레이어 오차 변환계수를 부호화하여 부호화 정보를 생성하는 부호화 스텝을 구비하는 방법을 취한다.
본 발명의 복호 방법은, 입력 변환계수에 대해서 부호화 처리를 행하여 얻어진 제1 레이어 부호화 데이터, 상기 제1 레이어 부호화 데이터를 복호한 제1 레이어 복호 변환계수와 상기 입력 변환계수의 오차인 제1 레이어 오차 변환계수 중 상기 오차가 가장 큰 타겟주파수 대역부분에 대해서 부호화 처리를 행하여 얻어진 제2 레이어 부호화 데이터, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을 나타내는 제1 위치 정보, 및 상기 제1 대역안의 상기 타겟주파수 대역을 나타내는 제2 위치 정보를 수신하는 수신 스텝과, 상기 제1 레이어 부호화 데이터를 복호하여 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 스텝과, 상기 제1 위치 정보 및 상기 제2 위치 정보에 기초하여 상기 타겟주파수 대역을 특정하고, 상기 제2 레이어 부호화 데이터를 복호하여 제1 레이어 복호 오차 변환계수를 생성하는 제2 레이어 복호 스텝과, 상기 제1 레이어 복호 변환계수와 상기 제1 레이어 복호 오차 변환계수를 가산하여 제2 레이어 복호 변환계수를 생성하는 가산 스텝을 구비하는 방법을 취한다.
본 발명에 의하면, 제1 위치 특정 수단에 의해 입력 신호의 전대역에 걸쳐서, 상대적으로 넓은 대역폭 및 상대적으로 넓은 피치폭으로, 오차가 큰 대역을 탐색해서 특정하고, 제2 위치 특정 수단은, 제1 위치 특정 수단에 의해 특정된 대역에 있어서, 상대적으로 좁은 대역폭 및 상대적으로 좁은 피치폭으로 타겟주파수 대역(오차가 가장 큰 주파수 대역)을 탐색하여 특정함으로써, 전대역 중에서 오차가 큰 대역을 적은 연산량으로 정확하게 특정할 수 있어, 음질을 개선할 수 있다.
도1은 종래의 음성 부호화 장치의 제2 레이어 부호화부의 부호화 대역을 나타내는 도면
도2는 본 발명의 실시형태 1에 따른 부호화 장치의 주요한 구성을 나타내는 블록도
도3은 도2에 나타낸 제2 레이어 부호화부의 구성을 나타내는 블록도
도4는 도3에 나타낸 제1 위치 특정부가 특정하는 대역의 위치를 나타내는 도면
도 5는 도 3에 나타낸 제1 위치 특정부가 특정하는 대역의 다른 위치를 나타내는 도면
도 6은 도 3에 나타낸 제2 위치 특정부가 특정하는 타겟주파수 대역의 위치를 나타내는 도면
도 7은 도 3에 나타낸 부호화부의 구성을 나타내는 블록도
도 8은 본 발명의 실시형태 1에 따른 복호 장치의 주요한 구성을 나타내는 블록도
도 9는 도 8에 나타낸 제2 레이어 복호부의 구성을 나타내는 도면
도 10은 도 9에 나타낸 배치부로부터 출력되는 제1 레이어 복호 오차 변환계수의 양상을 나타내는 도면
도 11은 도3에 나타낸 제2 위치 특정부가 특정하는 타겟주파수의 위치를 나타내는 도면
도 12는 도7에 나타낸 부호화부의 다른 형태의 구성을 나타내는 블록도
도 13은 도9에 나타낸 제2 레이어 복호부의 다른 형태의 구성을 나타내는 블록도
도 14는 본 발명의 실시형태 3에 따른 부호화 장치의 제2 레이어 부호화부의 구성을 나타내는 블록도
도 15는 실시형태 3에 따른 부호화 장치의 복수의 서브 위치 특정부가 특정하는 타겟주파수의 위치를 나타내는 도면
도16은 본 발명의 실시형태 4에 따른 부호화 장치의 제2 레이어 부호화부의 구성을 나타내는 블록도
도17은 도16에 나타낸 부호화부의 구성을 나타내는 블록도
도18은 도17의 제2 위치 정보 코드북에 기억하는 각각의 제2 위치 정보 후보가 3개의 타겟주파수를 가지는 경우의 부호화부를 나타내는 도면
도 19는 도 16에 나타낸 부호화부의 다른 구성을 나타내는 블록도
도 20은 본 발명의 실시형태 5에 따른 제2 레이어 부호화부의 구성을 나타내는 블록도
도 21은 도20에 나타낸 제1 위치 특정부가 특정하는 대역의 위치를 나타내는 도면
도 22는 실시형태 6에 따른 부호화 장치의 주요한 구성을 나타내는 블록도
도 23은 도22에 나타낸 부호화 장치의 제1 레이어 부호화부의 구성을 나타내는 블록도
도 24는 도22에 나타낸 부호화 장치의 제1 레이어 복호부의 구성을 나타내는 블록도
도 25는 도22에 나타낸 부호화 장치에 대응하는 복호 장치의 주요한 구성을 나타내는 블록도
도 26은 실시형태 7에 따른 부호화 장치의 주요한 구성을 나타내는 블록도
도 27은 도 26에 나타낸 부호화 장치에 대응하는 복호 장치의 주요한 구성을 나타내는 블록도
도 28은 실시형태 7에 따른 다른 형태의 부호화 장치의 주요한 구성을 나타내는 블록도
도 29A는 도28에 나타낸 제2 레이어 부호화부에 있어서의 대역의 위치를 나 타내는 도면
도 29B는 도28에 나타낸 제3 레이어 부호화부에 있어서의 대역의 위치를 나타내는 도면
도 29C는 도 28에 나타낸 제4 레이어 부호화부에 있어서의 대역의 위치를 나타내는 도면
도 30은 도28에 나타낸 부호화 장치에 대응하는 복호 장치의 주요한 구성을 나타내는 블록도
도 31A는 도28에 나타낸 제2 레이어 부호화부에 있어서의 대역의 다른 위치를 나타내는 도면
도31B는 도28에 나타낸 제3 레이어 부호화부에 있어서의 대역의 다른 위치를 나타내는 도면
도31C는 도28에 나타낸 제4 레이어 부호화부에 있어서의 대역의 다른 위치를 나타내는 도면
도32는 실시형태 8에 따른 제1 위치 특정부의 동작을 설명하기 위한 도면
도33은 실시형태 8에 따른 제1 위치 특정부의 구성을 나타내는 블록도
도34는 실시형태 8에 따른 제1 위치 정보 구성부에 있어서 제1 위치 정보를 구성하는 모습을 예시하는 도면
도35는 실시형태 8에 따른 복호 처리를 설명하기 위한 도면
도36은 실시형태 8에 따른 베리에이션을 설명하기 위한 도면
도37은 실시형태 8에 따른 베리에이션을 설명하기 위한 도면
이하, 본 발명의 실시형태에 대해서, 첨부 도면을 참조하여 상세히 설명한다.
(실시형태 1)
도2는, 본 발명의 실시형태 1에 따른 부호화 장치의 주요한 구성을 나타내는 블록도이다. 도2에 나타내는 부호화 장치(100)는, 주파수 영역 변환부(101)와, 제1 레이어 부호화부(102)와, 제1 레이어 복호부(103)와, 감산부(104)와, 제2 레이어 부호화부(105)와, 다중화부(106)를 구비한다.
주파수 영역 변환부(101)는, 시간영역의 입력 신호를 주파수영역의 신호(입력 변환계수)로 변환하고, 입력 변환계수를 제1 레이어 부호화부(102)에 출력한다.
제1 레이어 부호화부(102)는, 입력 변환계수에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성하고, 이 제1 레이어 부호화 데이터를 제1 레이어 복호부(103) 및 다중화부(106)에 출력한다.
제1 레이어 복호부(103)는, 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하고, 제1 레이어 복호 변환계수를 생성하여, 감산부(104)에 출력한다.
감산부(104)는, 입력 변환계수로부터 제1 레이어 복호부(103)에서 생성된 제1 레이어 복호 변환계수를 빼고 제1 레이어 오차 변환계수를 생성하여, 이 제1 레이어 오차 변환계수를 제2 레이어 부호화부(105)에 출력한다.
제2 레이어 부호화부(105)는, 감산부(104)로부터 출력된 제1 레이어 오차 변환계수의 부호화 처리를 행하여, 제2 레이어 부호화 데이터를 생성하고, 이 제2 레 이어 부호화 데이터를 다중화부(106)에 출력한다.
다중화부(106)는, 제1 레이어 부호화부(102)에서 구해지는 제1 레이어 부호화 데이터와 제2 레이어 부호화부(105)에서 구해지는 제2 레이어 부호화 데이터를 다중화하여 비트 스트림을 형성하고, 이것을 최종적인 부호화 데이터로서 통신로에 출력한다.
도3은, 도2에 나타낸 제2 레이어 부호화부(105)의 구성을 나타내는 블록도이다. 도3에 표시된 제2 레이어 부호화부(105)는, 제1 위치 특정부(201)와, 제2 위치 특정부(202)와, 부호화부(203)와, 다중화부(204)를 구비한다.
제1 위치 특정부(201)는, 감산부(104)로부터 입력되는 제1 레이어 오차 변환계수를 이용하여, 부호화의 대상이 되는 타겟주파수 대역이 취할 수 있는 대역을, 소정의 대역폭 및 소정의 피치폭으로 탐색하고, 특정한 대역을 나타내는 정보를 제1 위치 정보로서, 제2 위치 특정부(202), 부호화부(203) 및 다중화부(204)에 출력한다. 또한, 제1 위치 특정부(201)의 상세한 것에 대해서는 후술한다. 또한, 이 특정한 대역을, 「범위」혹은 「영역」등이라고 말할 수도 있다.
제2 위치 특정부(202)는, 제1 위치 특정부(201)에 의해 특정된 대역중에서, 제1 위치 특정부(201)에서의 대역폭보다 좁은 대역폭, 및 제1 위치 특정부(201)에서의 피치폭보다 좁은 피치폭으로 타겟주파수 대역을 탐색하고, 특정한 타겟주파수 대역을 나타내는 정보를 제2 위치 정보로서 부호화부(203) 및 다중화부(204)에 출력한다. 또한, 제2 위치 특정부(202)의 상세한 것에 대해서는 후술한다.
부호화부(203)는, 제1 위치 정보 및 제2 위치 정보에 의해 특정된 타겟주파 수 대역에 포함되는 제1 레이어 오차 변환계수를 부호화하고, 부호화 정보를 생성하여 다중화부(204)에 출력한다. 또한, 부호화부(203)의 상세한 것에 대해서는 후술한다.
다중화부(204)는, 제1 위치 정보, 제2 위치 정보, 부호화 정보를 다중화하여, 제2 레이어 부호화 데이터를 생성해 출력한다. 또한, 이 다중화부(204)는 필수는 아니고, 이들 정보를 직접 도2에 나타내는 다중화부(106)에 출력해도 좋다.
도4는, 도3에 나타낸 제1 위치 특정부(201)가 특정하는 대역을 나타낸 도면이다.
도4에서는, 제1 위치 특정부(201)는, 미리 소정의 대역폭으로 설정되는 3개의 대역중에서 1개를 특정하고, 이 대역의 위치 정보를 제1 위치 정보로서 제2 위치 특정부(202), 부호화부(203) 및 다중화부(204)에 출력한다. 도4에 나타낸 각 대역은 타겟주파수대역 이상의 대역폭을 가지도록 설정된다(대역 1은 F1이상 F3미만, 대역 2는 F2이상 F4미만, 대역 3은 F3이상 F5미만으로 하고 있다). 또한, 본 실시형태에서는 각 대역은 동일한 대역폭을 가지도록 설정되어 있지만, 각 대역이 다른 대역폭을 가지도록 설정해도 좋다. 예를 들면, 인간의 청각의 임계 대역폭처럼, 저역에 위치하는 대역의 대역폭은 좁게, 고역에 위치하는 대역의 대역폭은 넓어지도록 설정해도 좋다.
그 다음에, 제1 위치 특정부(201)에 의한 대역의 특정 방법에 대해서 설명한다. 여기에서는, 제1 위치 특정부(201)는, 제1 레이어 오차 변환계수의 에너지의 크기를 기준으로 대역을 특정한다. 제1 레이어 오차 변환계수를 e1(k)라고 표시하고, 각 대역에 포함되는 제1 레이어 오차 변환계수의 에너지 ER(i)를 다음 수학식(1)에 의해 산출한다.
[수 1]
Figure 112009052015916-pct00001
여기서, i는 대역을 특정하는 식별자, FRL(i)는 대역 i의 최저역 주파수, FRH(i)는 대역 i의 최고역 주파수를 나타낸다.
이와 같이, 제1 레이어 오차 변환계수의 에너지가 큰 대역을 특정하여, 오차가 큰 대역에 포함되는 제1 레이어 오차 변환계수를 부호화함으로써, 입력 신호에 대한 복호 신호의 오차가 작아져, 음성 품질을 개선할 수 있다.
또한, 제1 레이어 오차 변환계수의 에너지 대신에, 다음 수학식(2)와 같이 대역폭으로 정규화한 정규화 에너지 NER(i)를 산출해도 좋다.
[수 2]
Figure 112009052015916-pct00002
또, 대역을 특정하는 기준으로서, 제1 레이어 오차 변환계수의 에너지 대신에, 인간의 청감 특성을 반영한 가중이 행해진 제1 레이어 오차 변환계수의 에너지 WER(i), WNER(i)(대역폭으로 정규화한 정규화 에너지)를, 수학식(3), (4)에 의해 산 출해도 좋다. 여기서, w(k)는 인간의 청감 특성에 관련된 가중을 나타낸다.
[수 3]
Figure 112009052015916-pct00003
[수 4]
Figure 112009052015916-pct00004
이 경우, 제1 위치 특정부(201)는, 청감 특성상, 중요도가 높은 주파수에는 가중을 크게 하여, 그 주파수를 포함한 대역이 선택되기 쉽도록 하고, 한편, 중요도가 낮은 주파수에는 가중을 작게 하여, 그 주파수를 포함한 대역이 선택되기 어렵도록 한다. 이에 의해, 청감적으로 중요한 대역이 우선적으로 선택되기 때문에, 상기와 동일한 음질 개선의 효과를 얻을 수 있다. 이 가중으로서, 예를 들면, 입력 신호 또는 제1 레이어의 복호 신호를 기초로 산출된 청각 마스킹 임계값이나, 인간의 청각의 라우드네스(Loudness) 특성을 이용하여 구한 것을 이용해도 좋다.
또, 대역 선택법에 있어서, 주파수가 미리 설정된 기준주파수(Fx)보다 낮은 저역부에 배치된 대역중에서 대역을 선택하도록 해도 좋다. 도5의 예에서는, 대역 1~대역 8가운데서 대역을 선택한다. 대역 선택에 제한(기준주파수)을 설정하는 이유는 다음과 같다. 음성 신호의 특징의 하나인 조파 구조 또는 하모닉스(Harmonics) 구조(어느 주파수 간격으로 스펙트럼이 피크형태로 나타나는 구조)는, 고역부에 비해 저역부의 피크가 크게 나타나며, 부호화 처리에 의해 발생하는 양자화 오차(오차 스펙트럼 또는 오차 변환계수)에 있어서도 마찬가지로, 고역부보다는 저역부의 피크성이 강하게 된다. 그 때문에, 비록, 저역부의 오차 스펙트럼(오차 변환계수)의 에너지가 고역부와 비교해 작다하더라도, 저역부의 오차 스펙트럼(오차 변환계수)의 피크성이 고역부에 비해 강해지는 경향이 있기때문에, 저역부의 오차 스펙트럼(오차 변환계수)이 청각 마스킹 임계값(인간이 소리를 감지할 수 있는 임계값)을 초과하기 쉬워져, 그 결과, 청감적인 음질 열화를 일으킨다.
이 방법에 의하면, 기준주파수를 미리 설정함으로써, 주파수가 기준주파수(Fx)보다 높은 고역부와 비교하여, 오차 변환계수(또는 오차 벡터)의 피크성이 강한 저역부로부터 타겟주파수가 결정되기때문에, 오차 변환계수의 피크를 억제할 수 있어, 음질을 개선할 수 있다.
또, 대역의 선택법에 있어서, 저중역부에 배치되어 있는 대역중에서 대역을 선택하도록 해도 좋다. 도4의 예에서는, 대역 3은 선택 후보로부터 제외하고, 대역 1 및 대역 2중에서 대역을 선택한다. 이에 의해, 저중역부 중에서 타겟주파수 대역이 결정되게 된다.
이하에서는, 제1 위치 특정부(201)는, 대역 1을 특정했을 경우에 「1」을, 대역 2를 특정했을 경우에 「2」를, 대역 3을 특정했을 경우에 「3」을 제1 위치 정보로서 출력한다.
도6은, 도3에 나타낸 제2 위치 특정부(202)가 특정하는 타겟주파수 대역의 위치를 나타내는 도면이다.
제2 위치 특정부(202)는, 제1 위치 특정부(201)에 의해 특정된 대역에 있어 서, 더 좁은 피치폭으로 타겟주파수 대역을 특정하고, 그 타겟주파수 대역의 위치 정보를 제2 위치 정보로서 부호화부(203) 및 다중화부(204)에 출력한다.
그 다음에, 제2 위치 특정부(202)에 의한 타겟주파수 대역의 특정 방법을 설명한다. 여기에서는, 도3에 나타내는 제1 위치 특정부(201) 로부터 출력되는 제1 위치 정보가 「2」인 경우를 예로 하여, 타겟주파수 대역의 폭을 BW라고 한다. 또, 대역 2의 최저 주파수 F2를 기점으로 하여, 이 최저 주파수 F2를 편의상G1라고 한다. 그리고, 제2 위치 특정부(202)가 특정할 수 있는 타겟주파수 대역의 최저 주파수를 G2~GN라고 한다. 또한, 제2 위치 특정부(202)가 특정하는 타겟주파수 대역의 피치폭은 Gn-Gn -1이며, 한편, 제1 위치 특정부(201)가 특정하는 대역의 피치폭은 Fn-Fn -1(Gn-Gn -1<Fn-Fn -1)이다.
제2 위치 특정부(202)는, 최저 주파수가 각각 G1,…, GN의 타겟주파수 대역 후보로부터, 제1 레이어 오차 변환계수의 에너지 또는 그것과 비슷한 기준으로, 타겟주파수 대역을 특정한다. 예를 들면, 모든 Gn개의 타겟주파수 대역후보에 대해서, 수학식(5)에 의해 제1 레이어 오차 변환계수의 에너지를 산출하고, 산출된 에너지 ER(n)가 최대인 타겟주파수 대역을 특정하고, 이 타겟주파수 대역의 위치 정보를 제2 위치 정보로서 출력한다.
[수 5]
Figure 112009052015916-pct00005
또한, 상기의 설명처럼, 인간의 청감 특성을 반영한 가중이 행해진 제1 레이어 오차 변환계수의 에너지 WER(n)이 기준이 될 경우, 다음 수학식(6)에 의해 WER(n)의 산출을 행한다. 여기서, w(k)은 인간의 청감 특성에 관련된 가중을 표시한다. 이 가중으로서 예를 들면, 입력 신호 또는 제1 레이어의 복호 신호를 기초로 산출된 청각 마스킹 임계값이나, 인간 청각의 라우드네스 특성을 이용하여 구한 것을 이용해도 좋다.
[수 6]
Figure 112009052015916-pct00006
이 경우, 제2 위치 특정부(202)는, 청감 특성상, 중요도가 높은 주파수에는 가중을 크게 하여, 그 주파수를 포함한 타겟주파수 대역이 선택되기 쉽게 하고, 한편, 중요도가 낮은 주파수에는 가중을 작게 하여, 그 주파수를 포함한 타겟주파수 대역이 선택되기 어렵도록 한다. 이에 의해, 청감적으로 중요한 타겟주파수 대역이 우선적으로 선택되기때문에, 음질을 한층 더 개선할 수 있다.
도7은, 도3에 나타낸 부호화부(203)의 구성을 나타내는 블록도이다. 도7에 나타내는 부호화부(203)는, 목표 신호 구성부(301)와, 오차 산출부(302)와, 탐색부(303)와, 형상 코드북(304)과, 게인 코드북(305)을 구비한다.
목표 신호 구성부(301)는, 제1 위치 특정부(201)로부터 입력되는 제1 위치 정보와 제2 위치 특정부(202)로부터 입력되는 제2 위치 정보를 사용해 타겟주파수 대역을 특정하고, 감산부(104)로부터 입력되는 제1 레이어 오차 변환계수로부터 타겟주파수 대역에 포함되는 부분을 추출하고, 추출된 제1 레이어 오차 변환계수를 목표 신호로 하여 오차 산출부(302)에 출력한다. 이 제1 오차 변환계수를 e1(k)라고 표시한다.
오차 산출부(302)는, 오차 변환계수의 형상을 나타내는 후보(형상 후보)를 저장하는 형상 코드북(304)으로부터 입력되는 제i번째의 형상 후보, 오차 변환계수의 게인을 나타내는 후보(게인 후보)를 저장하는 게인 코드북(305)으로부터 입력되는 제m번째의 게인 후보, 및 목표 신호 구성부(301)로부터 입력되는 목표 신호에 기초하여, 다음 수학식(7)에 의해 오차 E를 산출하고, 산출된 오차 E를 탐색부(303)에 출력한다.
[수 7]
Figure 112009052015916-pct00007
여기서, sh(i, k)는 제i번째의 형상 후보, ga(m)은 제m번째 게인 후보를 나타낸다.
탐색부(303)는, 오차 산출부(302)에 의해 산출된 오차 E를 기초로, 오차 E가 최소인 형상 후보와 게인 후보의 조합을 탐색하고, 탐색 결과인 형상 정보와 게인 정보를 부호화 정보로서, 도3에 나타내는 다중화부(204)에 출력한다. 여기서, 형 상 정보는 오차 E를 최소로 할 때의 파라미터 m, 게인 정보는 오차 E를 최소로 할 때의 파라미터 i를 가리킨다.
또한, 오차 산출부(302)는, 청감적으로 중요한 스펙트럼에 큰 가중을 행함으로써 청감적으로 중요한 스펙트럼의 영향을 크게 하여, 다음 수학식(8)에 의해 오차 E를 구해도 좋다. 여기서, w(k)는 인간의 청감 특성에 관련하는 가중을 나타낸다.
[수 8]
Figure 112009052015916-pct00008
이와 같이, 청감 특성상, 중요도가 높은 주파수에는 가중을 크게 하여, 청감 특성상, 중요도가 높은 주파수의 양자화 왜곡의 영향을 크게 하는 한편, 중요도가 낮은 주파수에는 가중을 작게 하여, 중요도가 낮은 주파수의 양자화 왜곡의 영향을 작게함으로써, 주관 품질을 개선할 수 있다.
도8은, 본 실시형태에 따른 복호 장치의 주요한 구성을 나타내는 블록도이다. 도8에 나타내는 복호 장치(600)는, 분리부(601)와, 제1 레이어 복호부(602)와, 제2 레이어 복호부(603)와, 가산부(604)와, 전환부(605)와, 시간 영역 변환부(606)와, 포스트 필터(607)를 구비한다.
분리부(601)는, 통신로를 경유하여 입력되는 비트 스트림을, 제1 레이어 부호화 데이터와 제2 레이어 부호화 데이터로 분리하고, 각각 제1 레이어 부호화 데이터를 제1 레이어 복호부(602)에, 제2 레이어 부호화 데이터를 제2 레이어 복호 부(603)에 출력한다. 또, 분리부(601)는, 입력되는 비트 스트림에 제1 레이어 부호화 데이터 및 제2 레이어 부호화 데이터의 양쪽이 포함될 경우에는, 「2」를 레이어 정보로서 전환부(605)에 출력한다. 한편, 분리부(601)는, 비트 스트림에 제1 레이어 부호화 데이터 밖에 포함되지 않은 경우에는, 「1」을 레이어 정보로서 전환부(605)에 출력한다. 또한, 전부의 부호화 데이터가 폐기되어 있는 경우도 있는데, 그 경우는 각 레이어의 복호부는 소정의 오류 보상 처리를 행하고, 포스트 필터는 레이어 정보가 「1」로서 처리를 행하는 것으로 한다. 본 실시형태에서는, 복호 장치에 있어서, 모든 부호화 데이터 또는 제2 레이어 부호화 데이터가 폐기된 부호화 데이터의 어느것인가를 얻을 수 있는 것을 전제로 설명을 한다.
제1 레이어 복호부(602)는, 제1 레이어 부호화 데이터의 복호 처리를 행하고, 제1 레이어 복호 변환계수를 생성하여, 가산부(604) 및 전환부(605)에 출력한다.
제2 레이어 복호부(603)는, 제2 레이어 부호화 데이터의 복호 처리를 행하고, 제1 레이어 복호 오차 변환계수를 생성하여, 가산부(604)에 출력한다.
가산부(604)는, 제1 레이어 복호 변환계수와 제1 레이어 복호 오차 변환계수를 가산하여 제2 레이어 복호 변환계수를 생성해, 전환부(605)에 출력한다.
전환부(605)는, 분리부(601)로부터 입력되는 레이어 정보에 기초하여, 레이어 정보가「1」일 경우에는 제1 레이어 복호 변환계수를, 레이어 정보가「2」일 경우에는 제2 레이어 복호 변환계수를, 복호 변환계수로서 시간 영역 변환부(606)에 출력한다.
시간 영역 변환부(606)는, 복호 변환계수를 시간 영역의 신호로 변환해 복호 신호를 생성하여, 포스트 필터(607)에 출력한다.
포스트 필터(607)는, 시간 영역 변환부(606)로부터 출력되는 복호 신호에 대해서, 포스트필터 처리를 행하여, 출력 신호를 생성한다.
도9는, 도8에 나타낸 제2 레이어 복호부(603)의 구성을 나타내는 도면이다. 도9에 나타내는 제2 레이어 복호부(603)는, 형상 코드북(701)과, 게인 코드북(702)과, 곱셈부(703)와, 배치부(704)를 구비한다.
형상 코드북(701)은, 분리부(601)로부터 출력된 제2 레이어 부호화 데이터에 포함되는 형상 정보를 기초로 형상 후보 sh(i, k)를 선택하여, 곱셈부(703)에 출력한다.
게인 코드북(702)은, 분리부(601)로부터 출력된 제2 레이어 부호화 데이터에 포함된 게인 정보를 기초로 게인 후보 ga(m)를 선택하여, 곱셈부(703)에 출력한다.
곱셈부(703)는, 형상 후보 sh(i, k)에 게인 후보 ga(m)를 곱하여, 배치부(704)에 출력한다.
배치부(704)는, 분리부(601)로부터 출력된 제2 레이어 부호화 데이터에 포함되는 제1 위치 정보와 제2 위치 정보에 의해 특정되는 타겟주파수 대역에, 곱셈부(703)로부터 입력되는 게인 후보 곱셈 후의 형상 후보를 배치하여, 제1 레이어 복호 오차 변환계수로서 가산부(604)에 출력한다.
도10은, 도9에 나타낸 배치부(704)로부터 출력되는 제1 레이어 복호 오차 변 환계수의 양상을 나타내는 도면이다. 여기서, Fm은 제1 위치 정보에 의해 특정되는 주파수, Gn은 제2 위치 정보에 의해 특정되는 주파수를 나타낸다.
이와 같이, 본 실시형태에 의하면, 제1 위치 특정부(201)가, 입력 신호의 전대역에 걸쳐, 소정의 대역폭 및 소정의 피치폭으로 오차가 큰 대역을 탐색해서 특정하고, 제2 위치 특정부(202)는, 제1 위치 특정부(201)에 의해 특정된 대역에 대해, 상기 소정의 대역폭보다 좁은 대역폭, 및 상기 소정의 피치폭보다 좁은 피치폭으로 타겟주파수 대역을 탐색해서 특정함으로써, 전 대역중에서 오차가 큰 대역을 적은 연산량으로 정확하게 특정할 수 있어, 음질을 개선할 수 있다.
(실시형태 2)
실시형태 2에서는, 제2 위치 특정부(202)에 의한 타겟주파수 대역의 다른 특정 방법에 대해서 설명한다. 도11은, 도3에 나타낸 제2 위치 특정부(202)가 특정하는 타겟주파수의 위치를 나타내는 도면이다. 본 실시형태에 따른 부호화 장치의 제2 위치 특정부는, 실시형태 1에서 설명한 부호화 장치의 제2 위치 특정부와 달리, 단일 타겟주파수를 특정한다. 단일 타겟주파수에 대응하는 오차 변환계수의 형상 후보는 펄스(또는 선 스펙트럼)로 표시된다. 또한, 본 실시형태에 있어서, 부호화 장치의 구성은, 부호화부(203)의 내부 구성을 제외하고, 도2에 표시한 부호화 장치와 동일하며, 복호 장치의 구성은 제2 레이어 복호부(603)의 내부 구성을 제외하고, 도8에 나타낸 복호 장치와 동일하므로, 이들의 설명을 생략하고, 제2 위치 특정에 관련하는 부호화부(203) 및 복호 장치의 제2 레이어 복호부(603)에 대해 서만 설명한다.
본 실시형태에서는, 제2 위치 특정부(202)는, 제1 위치 특정부(201)에 의해 특정된 대역에 있어서, 단일 타겟주파수를 특정한다. 따라서, 본 실시형태에서는, 단일 제1 레이어 오차 변환계수가 부호화의 대상으로서 선택된다. 여기에서는, 제1 위치 특정부(201)가 대역 2를 특정한 경우를 예로 들어 설명한다. 타겟주파수 대역의 대역폭을 BW라고 했을 경우, 본 실시형태에서는 BW=1이다.
구체적으로, 제2 위치 특정부(202)는, 도11에 나타내는 바와 같이, 대역 2에 포함되는 복수의 타겟주파수 후보 GN에 대해서, 상기의 식(5)에 의해, 각각의 제1 레이어 오차 변환계수의 에너지를 산출하고, 또는 상기의 식(6)에 의해, 각각의 인간의 청감 특성을 반영한 가중이 행해진 제1 레이어 오차 변환계수의 에너지를 산출한다. 또, 제2 위치 특정부(202)는, 산출한 에너지가 최대가 되는 타겟주파수 Gn(1≤n≤N)를 특정하고, 특정된 타겟주파수 Gn의 위치 정보를 제2 위치 정보로서 부호화부(203)에 출력한다.
도12는, 도7에 나타낸 부호화부(203)의 다른 형태의 구성을 나타내는 블록도이다. 도12에 나타내는 부호화부(203)는, 도7에 비해서 형상 코드북(305)을 삭제한 구성을 취한다. 또한, 이 구성은 형상 코드북(304)으로부터 출력되는 신호가 항상 「1」인 경우에 상당한다.
부호화부(203)는, 제2 위치 특정부(202)에서 특정된 타겟주파수 Gn에 포함되는 제1 레이어 오차 변환계수를 부호화하고, 부호화 정보를 생성하여 다중화 부(204)에 출력한다. 여기에서는, 제2 위치 특정부(202)로부터 입력되는 타겟주파수는 단일(單一)이며, 부호화 대상이 되는 제1 레이어 오차 변환계수도 단일이 되므로, 부호화부(203)는 형상 코드북(304)로부터의 형상 정보를 필요로 하지 않고, 게인 코드북(305) 에서만 탐색을 행하고, 탐색 결과인 게인 정보를 부호화 정보로서 다중화부(204)에 출력한다.
도13은, 도9에 나타낸 제2 레이어 복호부(603)의 다른 형태의 구성을 나타내는 블록도이다. 도13에 나타내는 제2 레이어 복호부(603)는, 도9에 비해서, 형상 코드북(701)과 곱셈부(703)를 삭제한 구성을 취한다. 또한, 이 구성은 형상 코드북(701)으로부터 출력되는 신호가 항상 「1」인 경우에 상당한다.
배치부(704)는, 분리부(601)로부터 출력된 제2 레이어 부호화 데이터에 포함되는 제1 위치 정보와 제2 위치 정보에 의해 특정되는 단일 타겟주파수에, 게인 정보에 의해 게인 코드북으로부터 선택한 게인 후보를 배치하여, 제1 레이어 복호 오차 변환계수로서 가산부(604)에 출력한다.
이와 같이, 본 실시형태에 의하면, 제2 위치 특정부(202)는, 제1 위치 특정부(201)에 의해 특정된 대역중에서 단일 타겟주파수를 특정함으로써, 선(線)스펙트럼을 정확하게 나타낼 수 있기때문에, 모음과 같은 토날리티가 강한 신호(다수의 피크가 관찰되는 스펙트럼 특성을 가지는 신호)의 음질을 개선할 수 있다.
(실시형태 3)
실시형태 3에서는, 제2 위치 특정부에 의한 타겟주파수 대역의 다른 특정 방법에 대해 설명한다. 또한, 본 실시형태에 있어서, 부호화 장치의 구성은, 제2 레 이어 부호화부(105)의 내부 구성을 제외하고, 도2에 나타낸 부호화 장치와 동일하므로, 그 설명을 생략한다.
도14는, 본 실시형태에 따른 부호화 장치의 제2 레이어 부호화부(105)의 구성을 나타내는 블록도이다. 도14에 나타내는 제2 레이어 부호화부(105)는, 도3에 비해서, 제2 위치 특정부(202)를 대신하여, 제2 위치 특정부(301)를 구비하는 구성을 취한다. 도3에 나타낸 제2 레이어 부호화부(105)와 동일한 구성에는 동일한 번호를 붙이며, 그 설명을 생략한다.
도14에 나타내는 제2 위치 특정부(301)는, 제1 서브 위치 특정부(311-1)와, 제2 서브 위치 특정부(311-2)와…, 제J서브 위치 특정부(311-J)와, 다중화부(312)를 구비한다.
복수의 서브 위치 특정부(311-1,…, 311-J)는, 제1 위치 특정부(201)에 의해 특정된 대역에 있어서, 각각 다른 타겟주파수를 특정한다. 구체적으로는, 제n번째의 서브 위치 특정부(311-n)는, 제1 위치 특정부(201)에 의해 특정된 대역으로부터 제1~ 제n-1번째의 서브 위치 특정부(311-1,…, 311-n-1)가 특정한 타겟주파수를 제외한 대역에 있어서, 제n번째의 타겟주파수를 특정한다.
도15는 본 실시형태에 따른 부호화 장치의 복수의 서브 위치 특정부(311-1,…, 311-J)가 특정하는 타겟주파수의 위치를 나타내는 도면이다. 여기에서는, 제1 위치 특정부(201)가 대역 2를 특정하고, 제2 위치 특정부(301)에 의해 J개의 타겟주파수의 위치를 특정하는 경우를 예로 들어 설명한다.
도15A에 나타내는 바와 같이, 제1 서브 위치 특정부(311-1)는, 대역 2에 있 어서의 타겟주파수 후보중에서 1개의 타겟주파수를 특정하고(여기에서는 G3), 그 타겟주파수의 위치 정보를 다중화부(312)에 출력함과 동시에 제2 서브 위치 특정부(311-2)에 출력한다.
도15B에 나타내는 바와 같이, 제2 서브 위치 특정부(311-2)는, 대역 2로부터 제1 서브 위치 특정부(311-1)가 특정한 타겟주파수 G3를 제외한 타겟주파수의 후보중에서 1개의 타겟주파수를 특정하고 (여기에서는 GN-1), 그 타겟주파수의 위치 정보를 다중화부(312)에 출력함과 동시에 제3 서브 위치 특정부(311-3)에 출력한다.
마찬가지로, 도15C에 나타내는 바와 같이, 제J서브 위치 특정부(311-J)는, 대역 2로부터 제1~ 제J-1 서브 위치 특정부(311-1,…, 311-J-1)가 특정한 J-1개의 타겟주파수를 제외한 타겟주파수의 후보중에서 1개의 타겟주파수를 선택하고(여기에서는 G5), 그것을 특정하는 위치 정보를 다중화부(312)에 출력한다.
다중화부(312)는, 서브 위치 특정부(311-1,…311-J)로부터 입력되는 J개의 위치 정보를 다중하고 제2 위치 정보를 생성하여, 부호화부(203)와 다중화부(204)에 출력한다. 또한, 이 다중화부(312)는 필수는 아니고, J개의 위치 정보를 직접 부호화부(203) 및 다중화부(204)에 출력해도 좋다.
이와 같이, 제2 위치 특정부(301)는, 제1 위치 특정부(201)에 의해 특정된 대역에 있어서, J개의 타겟주파수를 특정하여, 복수개의 피크를 표현할 수 있기때문에, 모음과 같은 토나리티 강한 신호의 음질을 더욱 개선할 수 있다. 또, 제1 위치 특정부(201)에 의해 특정된 대역중에서 J개의 타겟주파수를 결정하면 되기 때문에, 전대역중에서 J개의 타겟주파수를 결정하는 경우에 비해, 복수개 타겟주파수의 조합수를 큰폭으로 삭감할 수 있다. 이에 의해, 저비트레이트화 및 저연산량화를 실현할 수 있다.
(실시형태 4)
실시형태 4에서는, 제2 레이어 부호화부(105)에 있어서의 다른 부호화 방법에 대해 설명한다. 또한, 본 실시형태에 있어서, 부호화 장치의 구성은, 제2 레이어 부호화부(105)의 내부 구성을 제외하고, 도2에 나타낸 부호화 장치와 동일하므로, 그 설명을 생략한다.
도16은, 본 실시형태에 따른 부호화 장치의 다른 양상의 제2 레이어 부호화부(105)의 구성을 나타내는 블록도이다. 도16에 나타내는 제2 레이어 부호화부(105)는, 도3에 나타낸 제2 위치 특정부(202)를 가지지않으며, 또, 도3에 나타낸 부호화부(203)를 대신하여 부호화부(221)를 구비하는 구성을 취한다.
부호화부(221)는, 타겟주파수에 포함되는 오차 변환계수의 부호화 시에 발생하는 양자화 왜곡이 최소가 되도록 제2 위치 정보를 결정한다. 이 제2 위치 정보는 제2 위치 정보 코드북(321)에 기억되어 있다.
도17은, 도16에 나타낸 부호화부(221)의 구성을 나타내는 블록도이다. 도17에 나타내는 부호화부(221)는, 도7에 나타낸 부호화부(203)에 대해서 제2 위치 정보 코드북(321)을 추가하고, 탐색부(303)를 대신하여 탐색부(322)를 구비하는 구성을 취한다. 또한, 도7에 나타낸 부호화부(203)와 동일한 구성에는 동일한 번호를 붙이며, 그 설명을 생략한다.
제2 위치 정보 코드북(321)은, 후술하는 탐색부(322)로부터의 제어 신호에 따라, 기억하고 있는 제2 위치 정보의 후보로부터 1개의 제2 위치 정보를 선택하여, 목표 신호 구성부(301)에 출력한다. 도17의 제2 위치 정보 코드북(321)에서는, 흑점(黑点)은 각각의 제2 위치 정보 후보의 타겟주파수의 위치를 나타낸다.
목표 신호 구성부(301)는, 제1 위치 특정부(201)로부터 입력되는 제1 위치 정보와 제2 위치 정보 코드북(321)에 있어서 선택된 제2 위치 정보를 이용하여 타겟주파수를 특정하고, 감산부(104)로부터 입력되는 제1 레이어 오차 변환계수로부터 특정한 타겟주파수에 포함되는 부분을 추출하고, 추출된 제1 레이어 오차 변환계수를 목표 신호로서 오차 산출부(302)에 출력한다.
탐색부(322)는, 오차 산출부(302)로부터 입력되는 오차 E를 기초로, 오차 E가 최소가 되는 형상 후보와 게인 후보, 그리고 제2 위치 정보 후보의 조합을 탐색하고, 탐색 결과의 형상 정보, 게인 정보 및 제2 위치 정보를 부호화 정보로서 도16에 나타내는 다중화부(204)에 출력한다. 또, 탐색부(322)는, 제2 위치 정보 후보를 선택하여 목표 신호 구성부(301)에 출력한다고 하는 제어 신호를 제2 위치 정보 코드북(321)에 출력한다.
이와 같이, 본 실시형태에 의하면, 타겟주파수에 포함되는 오차 변환계수의 부호화 시에 생기는 양자화 왜곡이 최소가 되도록 제2 위치 정보를 결정하므로, 최종적인 양자화 왜곡이 작아지기때문에, 음성 품질을 개선할 수 있다.
또한, 본 실시형태에서는, 도17에 나타낸 제2 위치 정보 코드북(321)이, 단 일 타겟주파수를 요소로서 가지는 제2 위치 정보 후보를 기억하는 예에 대해서 설명했지만, 본 발명은 이것에 한하지 않고, 도18에 나타내는 바와 같이 제2 위치 정보 코드북(321)은, 복수개의 타겟주파수를 요소로서 가지는 제2 위치 정보 후보를 기억해도 좋다. 도18은, 제2 위치 정보 코드북(321)에 기억되어 있는 제2 위치 정보 후보가 각각 3개의 타겟주파수를 가지는 경우의 부호화부(221)를 나타내는 도면이다.
또, 본 실시형태에서는, 도17에 나타낸 오차 산출부(302)가, 형상 코드북(304) 및 게인 코드북(305)에 기초하여 오차 E를 산출하는 예에 대해 설명했지만, 본 발명은 이것에 한하지 않고, 도19에 나타내는 바와 같이 형상 코드북(304)을 삭제하고, 게인 코드북(305)에만 기초를 두고 오차 E를 산출해도 괜찮다. 도19는, 도16에 나타낸 부호화부(221)의 다른 구성을 나타내는 블록도이다. 이 구성은, 형상 코드북(304)으로부터 출력되는 신호가 항상 「1」인 경우에 상당한다. 이 경우, 형상이 복수개 펄스로 구성되어 형상 코드북(304)은 불필요하게 되기때문에, 탐색부(322)는 게인 코드북(305) 및 제2 위치 정보 코드북(321)만을 탐색하고, 탐색 결과인 게인 정보 및 제2 위치 정보를 부호화 정보로서 도16에 나타낸 다중화부(204)에 출력한다.
또한, 본 실시형태에서는, 제2 위치 정보 코드북(321)이, 실제로 기억 영역을 확보하여 제2 위치 정보 후보를 기억하는 형태를 취하는 것을 전제로 설명했지만, 본 발명은 이것에 한하지 않고, 제2 위치 정보 코드북(321)이, 미리 정해진 처리 순서에 따라 제2 위치 정보 후보를 생성하도록 해도 좋다. 이 경우, 제2 위치 정보 코드북(321)에는 기억 영역이 불필요하게 된다.
(실시형태 5)
실시형태 5에서는, 제1 위치 특정부에 의한 대역의 다른 특정 방법에 대해 설명한다. 또한, 본 실시형태에 있어서, 부호화 장치의 구성은, 제2 레이어 부호화부(105)의 내부 구성을 제외하고, 도2에 나타낸 부호화 장치와 동일하므로, 그 설명을 생략한다.
도20은 본 실시형태에 따른 부호화 장치의 제2 레이어 부호화부(105)의 구성을 나타내는 블록도이다. 도20에서 나타내는 제2 레이어 부호화부(105)는, 도3에 나타낸 제1 위치 특정부(201)를 대신하여, 제1 위치 특정부(231)를 구비하는 구성을 취한다.
도시하지않는 산출부는, 입력 신호에 대해서 피치분석하여, 피치 주기를 구하고, 구해진 피치 주기의 역수로부터 피치 주파수를 산출한다. 또한, 산출부는, 제1 레이어 부호화부(102)의 부호화 처리에 의해 생성된 제1 레이어 부호화 데이터로부터 피치 주파수를 산출해도 좋다. 이 경우, 제1 레이어 부호화 데이터가 송신되기때문에, 피치 주파수를 특정하는 정보를 별도 송신할 필요가 없어진다. 또, 산출부는, 피치 주기를 특정하는 피치 주기 정보를 다중화부(106)에 출력한다.
제1 위치 특정부(231)는, 도시하지않는 산출부로부터 입력되는 피치 주파수를 기초로, 소정의 상대적으로 넓은 대역폭에서 대역을 특정하고, 특정된 대역의 위치 정보를 제1 위치 정보로서 제2 위치 특정부(202), 부호화부(203) 및 다중화부(204)에 출력한다.
도21은, 도20에 나타낸 제1 위치 특정부(231)가 특정하는 대역의 위치를 나타내는 도면이다. 도21에 나타내는 3개의 대역은, 입력되는 피치 주파수 PF를 기초로 결정되는 기준주파수 F1~F3의 정수배 근방의 대역이다. 기준주파수는, 피치 주파수 PF에 소정의 값을 더해 구해지는 주파수이다. 구체적인 예로서 여기에서는 -1, 0, 1을 PF에 더한 값으로 하여, 기준주파수는 F1=PF-1, F2=PF, F3=PF+1이 된다.
피치 주파수의 정수배를 기준으로 한 대역을 설정하는 이유는, 음성 신호에는, 특히 피치 주기성이 강한 모음부에 있어서, 피치 주기의 역수(피치 주파수)의 정수배 근방에 스펙트럼의 피크가 생긴다고 하는 특징(조파 구조 또는 하모닉스)이 있고, 또, 제1 레이어 오차 변환계수에 있어서도 피치 주파수의 정수배 근방에 큰 오차가 생기기 쉽기 때문이다.
이와 같이, 본 실시형태에 의하면, 제1 위치 특정부(231)는, 피치 주파수의 정수배 근방의 대역을 특정하기때문에, 최종적으로 제2 위치 특정부(202)에 의해 특정되는 타겟주파수는 피치 주파수의 근방이 되므로, 적은 연산량으로 음성 품질을 개선할 수 있다.
(실시형태 6)
실시형태 6에서는, 부호화 처리에 있어서, 고역부를 잡음등에 의한 근사(近似) 신호로 대용하는 방법을 이용하는 제1 레이어 부호화부를 가지는 부호화 장치에, 본 발명에 의한 부호화 방법을 적용하는 경우에 대해 설명한다. 도22는 본 실 시형태에 따른 부호화 장치(220)의 주요한 구성을 나타내는 블록도이다. 도22에 나타내는 부호화 장치(220)는, 제1 레이어 부호화부(2201)와, 제1 레이어 복호부(2202)와, 지연부(2203)와, 감산부(104)와, 주파수 영역 변환부(101)와, 제2 레이어 부호화부(105)와, 다중화부(106)를 구비한다. 또한, 도22의 부호화 장치(220)에 있어서, 도2에 나타낸 부호화 장치(100)와 동일한 구성요소에는 동일한 번호를 붙이고, 그 설명을 생략한다.
본 실시형태의 제1 레이어 부호화부(2201)는, 고역부를 잡음등에 의한 근사 신호로 대용하는 방식을 채용한다. 구체적으로는, 청감적으로 중요도가 낮은 고역부를 근사 신호로 표시하고, 그 대신에 청감적으로 중요한 저역부(또는 저중역부)의 비트 배분을 늘려 이 대역의 원신호에 대한 충실도를 향상시킨다. 이것으로, 전체적인 음질의 향상을 꾀한다. 예를 들면, AMR-WB방식(비특허 문헌 3)이나 VMR-WB방식(비특허 문헌 4)을 들 수 있다.
제1 레이어 부호화부(2201)는, 입력 신호를 부호화해 제1 레이어 부호화 데이터를 생성하여, 다중화부(106) 및 제1 레이어 복호부(2202)에 출력한다. 또한, 제1 레이어 부호화부(2201)의 상세한 것에 대해서는 후술한다.
제1 레이어 복호부(2202)는, 제1 레이어 부호화부(2201)로부터 입력되는 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여, 제1 레이어 복호 신호를 생성해, 감산부(104)에 출력한다. 또한, 제1 레이어 복호부(2202)의 상세한 것에 대해서는 후술한다.
그 다음에, 도23을 이용하여, 제1 레이어 부호화부(2201)의 상세한 것에 대 해 설명한다. 도23은 부호화 장치(220)의 제1 레이어 부호화부(2201)의 구성을 나타내는 블록도이다. 도23에 나타내는 바와 같이, 제1 레이어 부호화부(2201)는, 다운 샘플링부(2210)와, 코어 부호화부(2220)로 구성된다.
다운 샘플링부(2210)는, 시간 영역의 입력 신호를 다운 샘플링해, 소망하는 샘플링 레이트로 변환하고, 다운 샘플링한 시간 영역 신호를 코어 부호화부(2220)에 출력한다.
코어 부호화부(2220)는, 다운 샘플링부(2210)의 출력 신호에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성해, 제1 레이어 복호부(2202) 및 다중화부(106)에 출력한다.
그 다음에, 도24를 이용해 제1 레이어 복호부(2202)의 상세한 것에 대해서 설명한다. 도24는 부호화 장치(220)의 제1 레이어 복호부(2202)의 구성을 나타내는 블록도이다. 도24에 나타내는 바와 같이, 제1 레이어 복호부(2202)는, 코어 복호부(2230)와, 업 샘플링부(2240)와, 고역성분 부여부(2250)로 구성된다.
코어 복호부(2230)는, 코어 부호화부(2220)로부터 입력되는 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 복호 신호를 생성해, 업 샘플링부(2240)에 출력함과 동시에, 복호 처리에 의해 구해진 복호 LPC 계수를 고역성분 부여부(2250)에 출력한다.
업 샘플링부(2240)는, 코어 복호부(2230)로부터 출력된 복호 신호를 업 샘플링하여, 입력 신호와 동일한 샘플링 레이트로 변환해, 업 샘플링 후의 신호를 고역성분 부여부(2250)에 출력한다.
고역성분 부여부(2250)는, 다운 샘플링부(2240)로부터 업 샘플링된 신호에 대해서, 예를 들면 비특허 문헌 3 및 비특허 문헌 4에 기재되어 있는 방법을 이용하여 고역성분의 근사 신호를 생성하여, 결손된 고역부를 보충한다.
도25는, 본 실시형태에 따른 부호화 장치에 대응하는 복호 장치의 주요한 구성을 나타내는 블록도이다. 도25의 복호 장치(250)는, 도8에 나타낸 복호 장치(600)와 동일한 기본 구성을 가지고 있으며, 제1 레이어 복호부(602)를 대신하여, 제1 레이어 복호부(2501)를 구비한다. 제1 레이어 복호부(2501)는 부호화 장치의 제1 레이어 복호부(2202)와 마찬가지로, 도시하지않는 코어 복호부, 업 샘플링부 및 고역성분 부여부로 구성된다. 여기에서는, 그것들에 대한 상세한 설명을 생략한다.
코어 복호부로부터 주어지는 복호 LPC 계수에 의해 구성되는 합성 필터에, 잡음 신호 같은 부호화부 및 복호부에서 부가 정보없이 생성할 수 있는 신호를 통과시켜, 합성 필터의 출력 신호를 고역성분의 근사 신호로 이용한다. 이 때, 입력 신호의 고역성분과 제1 레이어 복호 신호의 고역성분이 완전히 다른 파형이 되기때문에, 감산부에서 구해지는 오차 신호의 고역성분의 에너지는 입력 신호의 고역성분의 에너지보다 오히려 커져 버린다. 이에 의해, 제2 레이어 부호화부에서는, 청감적인 중요도가 낮은 고역부에 배치된 대역이 선택되기 쉬워진다고 하는 문제가 생긴다.
본 실시형태에 의하면, 상기와 같이 제1 레이어 부호화부(2201)의 부호화 처리에 있어서, 고역부를 잡음등에 의한 근사 신호로 대용하는 방법을 이용하는 부호 화 장치(220)에 있어서, 미리 설정된 기준주파수보다 주파수가 낮은 저역부로부터 대역을 선택함으로써, 오차 신호(또는 오차 변환계수)의 고역부의 에너지가 증대되더라도, 청각적인 감도가 높은 저역부를 제2 레이어 부호화부의 부호화 대상으로서 선택할 수 있기때문에, 음질을 개선할 수 있다.
또한, 본 실시형태에서는, 고역부에 관한 정보를 복호부에 보내지 않는 구성을 예로 들어 설명했지만, 본 발명은 이것에 한하지 않으며, 예를 들면, 비특허 문헌 5와 같이 고역부의 신호를 저역부에 비해 저비트레이트로 부호화하여 복호부에 보내는 구성이어도 좋다.
또, 도22에 나타내는 부호화 장치(220)에 있어서, 감산부(104)는, 시간 영역의 신호끼리의 차(差)를 취하는 구성이지만, 감산부는 주파수 영역의 변환계수끼리의 차를 취하는 구성으로 해도 좋다. 이 경우, 주파수 영역 변환부(101)를 지연부(2203)와 감산부(104) 사이에 배치해 입력 변환계수를 구하고, 제1 레이어 복호부(2202)와 감산부(104) 사이에 주파수 영역 변환부(101)를 새로이 추가하여 제1 레이어 복호 변환계수를 구한다. 그리고, 감산부(104)는 입력 변환계수와 제1 레이어 복호 변환계수의 차를 취하고, 그 오차 변환계수를 제2 레이어 부호화부에 직접 주는 구성이 된다. 이 구성에 의하면, 어떤 대역에서는 차를 취하고 다른 대역에서는 차(差)는 취하지 않는 등, 각 대역에 적합한 감산 처리가 가능하게 되어, 음질을 한층 더 개선할 수 있다.
(실시형태 7)
실시형태 7에서는, 다른 구성의 부호화 장치 및 복호 장치에 있어서, 본 발 명에 의한 부호화 방법을 적용하는 경우에 대해서 설명한다. 도26은, 본 실시형태에 따른 부호화 장치(260)의 주요한 구성을 나타내는 블록도이다.
도26에 나타내는 부호화 장치(260)는, 도22에 나타낸 부호화 장치(220)에 대해서, 가중 필터부(2601)를 추가한 구성을 가진다. 또한, 도26의 부호화 장치(260)에 있어서, 도22와 동일한 구성요소에 대해서는 동일한 번호를 붙이며, 그 설명을 생략한다.
중량감 필터부(2601)는, 감산부(104)로부터 입력되는 오차 신호에 청감적인 가중을 하는 필터 처리를 행하고, 필터 처리 후의 신호를 주파수 영역 변환부(101)에 출력한다. 가중 필터부(2601)는, 입력 신호의 스펙트럼 포락과 역(逆)의 스펙트럼 특성을 가지며, 입력 신호의 스펙트럼을 평탄화(백색화) 혹은 거기에 가까운 스펙트럼 특성으로 변화시킨다. 예를 들면, 가중 필터W(z)는, 제1 레이어 복호부(2202)에서 얻어지는 복호 LPC 계수를 이용하여, 다음 수학식(9)과 같이 구성된다.
[수 9]
Figure 112009052015916-pct00009
여기서,α(i)는 복호 LPC 계수, NP는 LPC 계수의 차수, 그리고 γ은 스펙트럼 평탄화(백색화)의 정도를 제어하는 파라미터이며, 0≤γ≤1의 범위의 값을 취한다. γ가 클수록 평탄화의 정도가 커지며, 예를 들면 γ에는 0.92를 이용한다.
도27에 나타내는 복호 장치(270)는, 도25에 나타낸 복호 장치(250)에 대해 서, 합성 필터부(2701)를 추가한 구성을 가진다. 또한, 도27의 복호 장치(270)에 있어서, 도25와 동일한 구성요소에 대해서는 동일한 번호를 붙이며, 그 설명을 생략한다.
합성 필터부(2701)는, 시간 영역 변환부(606)로부터 입력되는 신호에 대해서, 평탄화된 스펙트럼의 특성을 원래의 특성으로 복원하는 필터 처리를 행하고, 필터 처리 후의 신호를 가산부(604)에 출력한다. 합성 필터부(2701)는, 식(9)에서 표시되는 가중 필터와 역 스펙트럼 특성, 즉 입력 신호의 스펙트럼 포락과 동일한 특성을 가진다. 합성 필터 B(z)는, 식(9)를 이용하여 다음 수학식(10)과 같이 표시된다.
[수 10]
Figure 112009052015916-pct00010
여기서,α(i)는 복호 LPC 계수, NP는 LPC 계수의 차수, 그리고 γ은 스펙트럼 평탄화(백색화)의 정도를 제어하는 파라미터이며, 0≤γ≤1의 범위의 값을 취한다. γ가 클수록 평탄화의 정도가 커지며, 예를 들면 γ에는 0.92를 이용한다.
일반적으로는, 상기와 같은 부호화 장치 및 복호 장치에 있어서, 음성 신호의 스펙트럼 포락은 저역부의 에너지가 고역부의 에너지보다 크게 나타나기때문에, 합성 필터를 통과시키기 전의 신호의 부호화 왜곡이 저역부와 고역부에서 동등하더라도, 합성 필터를 통과시킨 다음에는 저역부의 부호화 왜곡이 커진다. 음성 신호 를 저비트레이트로 압축해서 전송하는 경우에는 부호화 왜곡을 충분히 작게 할 수 없기 때문에, 전술한 것같은 복호부의 합성 필터부의 영향에 의해 부호화 왜곡의 저역부의 에너지가 증대되어 버려, 저역부의 품질 열화가 나타나기 쉬워진다고 하는 문제가 있다.
본 실시형태의 부호화 방법에 의하면, 주파수가 기준주파수보다 낮은 저역부로부터 타겟주파수가 결정되기때문에, 저역부가 제2 레이어 부호화부(105)의 부호화 대상으로서 선택되기 쉽고, 그에 의해 저역부의 부호화 왜곡을 작게 할 수 있다. 즉, 본 실시형태에 의하면, 합성 필터에 의해 저역부가 강조되더라도, 저역부의 부호화 왜곡이 지각되기 어렵게 되기 때문에, 음질을 개선하는 효과가 얻어진다.
또한, 본 실시형태에서는 부호화 장치(260)의 감산부(104)를 시간 영역의 신호끼리의 차(差)를 취하는 구성으로 했지만, 본 발명은 이것에 한하지 않고, 주파수 영역의 변환계수끼리의 차를 취하는 구성으로 해도 좋다. 구체적으로는, 가중 필터부(2601)와 주파수 영역 변환부(101)를 지연부(2203)와 감산부(104) 사이에 배치해 입력 변환계수를 구하고, 그리고 제1 레이어 복호부(2202)와 감산부(104) 사이에 가중 필터부(2601)와 주파수 영역 변환부(101)를 새로이 추가하여 제1 레이어 복호 변환계수를 구한다. 그리고, 감산부(104)에서는 입력 변환계수와 제1 레이어 복호 변환계수의 차를 취하고, 그 오차 변환계수를 제2 레이어 부호화부(105)에 직접 주는 구성으로 한다. 이 구성에 의하면, 어떤 대역에서는 차를 취하고 다른 대역에서는 차는 취하지 않는 등, 각 대역에 적합한 감산 처리가 가능하게 되어, 음 질을 한층 더 개선할 수 있다.
또, 본 실시형태에서는, 부호화 장치(220)의 레이어수가 2인 경우를 예로 들어 설명했지만, 본 발명은 이것에 한하지 않으며, 예를 들면, 도28에 나타내는 부호화 장치(280)와 같이, 부호화 계층을 레이어수가 2이상인 구성으로 해도 좋다.
도28은 부호화 장치(280)의 주요한 구성을 나타내는 블록도이다. 도2에 나타낸 부호화 장치(100)에 대해서, 제2 레이어 복호부(2801)와, 제3 레이어 부호화부(2802)와, 제3 레이어 복호부(2803)와, 제4 레이어 부호화부(2804)와, 2개의 가산기(2805)를 추가하고, 3개의 감산부(104)를 가지는 구성을 취한다.
도28에 나타내는 제3 레이어 부호화부(2802)와 제4 레이어 부호화부(2804)는, 도2에 나타낸 제2 레이어 부호화부(105)와 동일한 구성을 가지고, 동일한 동작을 행하며, 제2 레이어 복호부(2801)와 제3 레이어 복호부(2803)는, 도2에 나타낸 제1 레이어 복호부(103)와 동일한 구성을 가지고, 동일한 동작을 행한다. 여기에서는, 각 레이어 부호화부에 있어서의 대역의 위치에 대해서, 도29를 이용해 설명한다.
각 레이어 부호화부에 있어서의 대역의 배치의 일례로서 도29A는, 제2 레이어 부호화부에 있어서의 대역의 위치를 나타해고, 도29B는, 제3 레이어 부호화부에 있어서의 대역의 위치를 나타내고, 도29C는, 제4 레이어 부호화부에 있어서의 대역의 위치를 나타내며, 대역수는 각각 4이다.
보다 자세하게 말하면, 제2 레이어 부호화부(105)에서는, 레이어 2의 기준주파수 Fx(L2)를 초과하지 않도록 4개의 대역이 배치되고, 제3 레이어 부호화 부(2802)에서는, 레이어 3의 기준주파수 Fx(L3)를 초과하지 않도록 4개의 대역이 배치되며, 제4 레이어 부호화부(2804)에서는, 레이어 4의 기준주파수 Fx(L4)를 초과하지 않도록 대역이 배치되어 있다. 그리고, 각 레이어의 기준주파수 간에는, Fx(L2)<Fx(L3)<Fx(L4)의 관계가 있다. 즉, 비트레이트가 낮은 레이어 2에서는, 청감적인 감도가 높은 저역부중에서 부호화의 대상이 되는 대역을 결정하고, 비트레이트가 높아지는 고위 레이어가 될수록 고역부까지 포함시킨 대역중에서 부호화의 대상이 되는 대역을 결정한다.
이러한 구성을 취함으로써, 저위 레이어에 있어서 저역부를 중시하고, 고위 레이어에 있어서 보다 넓은 대역을 커버하도록 하기때문에, 음성 신호의 고음질화를 실현할 수 있다.
도30은, 도28에 나타낸 부호화 장치(280)에 대응하는 복호 장치(300)의 주요한 구성을 나타내는 블록도이다. 도30의 복호 장치(300)는, 도8에 나타낸 복호 장치(600)에 대해서, 제3 레이어 복호부(3001)와 제4 레이어 복호부(3002)와 2개의 가산기(604)를 추가한 구성을 가진다. 또한, 제3 레이어 복호부(3001)와 제4 레이어 복호부(3002)는, 도8에 나타낸 복호 장치(600)의 제2 레이어 복호부(603)와 동일한 구성을 가지며, 동일한 동작을 행하기때문에, 여기에서는, 그 상세한 설명을 생략한다.
또, 각 레이어 부호화부에 있어서의 대역의 배치의 다른 일례로서 도31A는 제2 레이어 부호화부(105)에 있어서의 4개 대역의 위치를 나타내고, 도31B는, 제3 레이어 부호화부(2802)에 있어서의 6개 대역의 위치를 나타내며, 도31C는, 제4 레 이어 부호화부(2804)에 있어서의 8개 대역의 위치를 나타낸다.
도31에서는, 각 레이어 부호화부에 있어서, 각 대역은 등간격으로 배치되고, 도31A에 나타내는것 같은 저위 레이어에서는 저역부에 배치된 대역만이 부호화의 대상이 되고, 도31B 또는 도31C에 나타내는 것 같은 고위 레이어가 될수록 부호화의 대상이 되는 대역이 증가한다.
이러한 구성에 의하면, 각 레이어에서는 대역이 등간격으로 배치되어, 저위 레이어에서는 부호화의 대상이 되는 대역을 선택할 경우, 선택 후보인 저역부에 배치되는 대역의 수가 적기 때문에, 연산량과 비트레이트를 삭감할 수 있다.
(실시형태 8)
본 발명의 실시형태 8은, 제1 위치 특정부의 동작에 있어서만 실시형태 1과 상위하여, 그것을 나타내기 위해서, 본 실시형태에 따른 제1 위치 특정부에는 「801」이라는 번호를 붙인다. 제1 위치 특정부(801)는, 부호화의 대상이 되는 타겟주파수가 취할 수 있는 대역을 특정할 때, 전대역을 미리 복수의 부분 대역으로 분할하고, 각 부분 대역에 있어서 소정의 대역폭 및 소정의 피치폭으로 탐색을 행한다. 그리고, 제1 위치 특정부(801)는, 탐색에 의해 구해진 각 부분 대역내의 대역을 결합하여, 부호화 대상이 되는 타겟주파수가 취할 수 있는 대역으로 한다.
본 실시형태에 따른 제1 위치 특정부(801)의 동작에 대해 도32를 이용해 설명한다. 도32는, 부분 대역수N=2이며, 저역부를 커버하도록 부분 대역 1이 설정되고, 고역부를 커버하도록 부분 대역 2가 설정되는 경우를 예시한다. 부분 대역 1에서는, 미리 소정의 대역폭으로 설정된 복수의 대역중에서 1개의 대역이 선택된 다(이 대역의 위치 정보를 제1 부분 대역 위치 정보라고 부름). 마찬가지로, 부분 대역 2에서는, 미리 소정의 대역폭으로 설정된 복수의 대역중에서 1개의 대역이 선택된다(이 대역의 위치 정보를 제2 부분 대역 위치 정보라고 부름).
다음에, 제1 위치 특정부(801)는, 부분 대역 1에 있어서 선택된 대역과, 부분 대역 2에 있어서 선택된 대역을 결합하여 결합 대역을 구성한다. 이 결합대역이 제1 위치 특정부(801)에 의해 특정되는 대역이 되고, 이어서, 제2 위치 특정부(202)는 해당 결합 대역을 기초로 제2 위치 정보를 특정한다. 예를 들면, 부분 대역 1에서 선택된 대역이 대역 2, 부분 대역 2에서 선택된 대역이 대역 4인 경우, 제1 위치 특정부(801)는, 도32의 하단에 표시되는 바와 같이 이 2개의 대역을 결합하여, 부호화 대상이 되는 주파수 대역이 취할 수 있는 대역으로 한다.
도33은, 부분 대역의 수가 N인 경우에 대응하는 제1 위치 특정부(801)의 구성을 나타내는 블록도이다. 도33에 있어서, 감산부(104)로부터 입력되는 제1 레이어 오차 변환계수는 부분 대역 1 특정부(811-1)~부분 대역 N특정부(811-N) 각각에 주어진다. 각각의 부분 대역 n특정부(811-n(n=1~N))는, 소정의 부분 대역 n중에서 1개의 대역을 선택하고, 선택된 대역의 위치를 나타내는 정보(제n부분 대역 위치 정보)를 제1 위치 정보 구성부(812)에 출력한다.
제1 위치 정보 구성부(812)는, 각각의 부분 대역 n특정부(811-n)로부터 입력되는 제n부분 대역 위치 정보(n=1~N)를 이용해 제1 위치 정보를 구성하고, 해당 제 1 위치 정보를 제2 위치 특정부(202), 부호화부(203) 및 다중화부(204)에 출력한다.
도34는, 제1 위치 정보 구성부(812)에 있어서 제1 위치 정보를 구성하는 모습을 예시하는 도면이다. 이 도면에 있어서, 제1 위치 정보 구성부(812)는, 제1 부분 대역 위치 정보(A1비트)~ 제N부분 대역 위치 정보(AN비트)를 순서대로 배열하여 제1 위치 정보를 구성한다. 여기서, 각각의 제n부분 대역 위치 정보의 비트 길이 An은, 각 부분 대역 n에 포함되는 후보 대역의 수에 의해 결정되고, 각각 다른 값을 가져도 좋다.
도35는, 본 실시형태의 복호 처리에 있어서, 제1 위치 정보와 제2 위치 정보를 이용해 제1 레이어 복호 오차 변환계수를 구하는 양상을 나타내는 도면이다. 여기에서는, 부분 대역수가 2인 경우를 예로 들어 설명한다. 또한, 이하의 설명에 있어서는, 실시형태 1에 따른 제2 레이어 복호부(603)를 구성하는 각 구성요소의 명칭 및 번호를 유용한다.
배치부(704)는, 곱셈부(703)로부터 입력되는 게인후보 곱셈후의 형상 후보에 대해서, 제2 위치 정보를 이용해 재배치를 행한다. 다음에, 배치부(704)는, 제2 위치 정보를 이용한 재배치 후의 형상 후보에 대해서, 제1 위치 정보를 이용해 다시 부분 대역 1 및 부분 대역 2에의 재배치를 행한다. 배치부(704)는, 이와 같이 하여 구해진 신호를 제1 레이어 복호 오차 변환계수로서 출력한다.
본 실시형태에 의하면, 제1 위치 특정부는 각각의 부분 대역중에서 1개의 대역을 선택하기때문에, 부분 대역에 적어도 1개의 복호 스펙트럼을 배치하는 것이 가능하게 된다. 이에 의해, 전대역중에서 1개의 대역을 결정하는 실시 형태와 비교해, 음질을 개선하고 싶은 복수의 대역을 미리 설정해 둘 수 있다. 예를 들면, 저역부와 고역부의 양자의 품질 개선을 동시에 꾀하고 싶을 경우 등에 본 실시형태는 유효하다.
또, 본 실시형태에 의하면, 저위 레이어(본 실시형태에서는 제1 레이어)에 있어서 저비트레이트의 부호화를 행하는 경우에서도, 복호 신호의 주관 품질을 개선할 수 있다. 저위 레이어에 CELP 방식을 이용하는 구성은 그 일례이다. CELP 방식은, 파형 매칭에 기초한 부호화 방식이기때문에, 고역부에 비해 에너지가 큰 저역부의 양자화 왜곡이 보다 작아지도록 부호화를 한다. 그 결과, 고역부의 스펙트럼이 감쇠해 버려, 틀어막힌 느낌(대역감의 결여)으로 지각된다. 그런 한편 CELP 방식의 부호화는 저비트레이트의 부호화 방식이기때문에, 저역의 양자화 왜곡을 충분히 억제할 수 없어, 그 양자화 왜곡은 잡음감으로서 지각되어 버린다. 본 실시형태에서는, 저역부와 고역부의 각각으로부터 부호화의 대상이 되는 대역을 선택하기 때문에, 저역부의 잡음감, 고역부의 틀어막힌 느낌이라고 하는 다른 2개의 열화 요인을 동시에 해소하여, 주관 품질을 개선하는 것이 가능하게 된다.
또, 본 실시형태에 의하면, 저역으로부터 선택된 대역 및 고역으로부터 선택된 대역을 결합하여 결합 대역을 구성하고, 이 결합 대역 중에서 스펙트럼의 형상을 결정하기때문에, 고역보다 저역의 품질 개선이 필요한 프레임에서는, 저역을 중시한 스펙트럼의 형상을 선택하고, 저역보다 고역의 품질 개선이 필요한 프레임에서는, 고역을 중시한 스펙트럼의 형상을 선택한다고 하는 적응 처리를 행할 수 있어, 주관 품질을 개선할 수 있다. 예를 들면, 스펙트럼의 형상을 펄스로 표시할 경우, 고역보다 저역의 품질 개선이 필요한 프레임에서는 저역에 많은 펄스를 배치 하고, 저역보다 고역의 품질 개선이 필요한 프레임에서는 고역에 많은 펄스를 배치할 수 있어, 이러한 적응 처리에 의해, 주관 품질을 개선할 수 있다.
또한, 본 실시형태의 베리에이션으로서 도36에 나타내는 바와 같이, 특정 부분 대역에 있어서 항상 고정된 대역이 선택되도록 해도 좋다. 도36에 나타내는 예에서는, 부분 대역 2에 있어서 항상 대역 4가 선택되고, 이것이 결합 대역의 일부로 되어 있다. 이에 의해, 본 실시형태의 효과와 마찬가지로, 음질을 개선하고 싶은 대역을 미리 설정해 둘 수 있으며, 또, 예를 들면, 부분 대역 2의 부분 대역 위치 정보가 불필요하게 되기 때문에, 도34에 표시된 것같은 제1 위치 정보를 나타내기 위한 비트수를 보다 작게 할 수 있다.
또, 도36은, 고역부(부분 대역 2)에 있어서 항상 고정된 범위가 선택되는 경우를 예로 들어 나타내고 있지만, 이것으로 한정되지 않고, 저역부(부분 대역 1)에 있어서 항상 고정된 범위가 선택되도록 해도 좋고, 또, 도36에는 도시되어 있지않은 중역부의 부분 대역에 있어서, 항상 고정된 범위가 선택되도록 해도 좋다.
또, 본 실시형태의 베리에이션으로서 도37에 나타낸 바와 같이, 각 부분 대역에 있어서 설정되는 후보 대역의 대역폭이 달라도 좋다. 도37에 있어서는, 부분 대역 1에 있어서 설정되어 있는 후보 대역보다도 부분 대역 2에 있어서 설정되어 있는 부분 대역의 대역폭이 짧은 경우를 예시하고 있다.
이상, 본 발명의 실시형태에 대해서 설명했다.
또한, 각 레이어 부호화부에 있어서의 대역의 배치로서 본 발명에서는 상기 설명한 예에 한하지 않고, 예를 들면, 저위 레이어에서는 각 대역의 대역폭을 좁 게, 고위 레이어에서는 각 대역의 대역폭을 넓게 하도록 구성해도 좋다.
또, 상기의 각 실시형태에서는, 과거의 프레임에서 선택한 대역과 관련화하여 현프레임의 대역을 선택해도 좋다. 예를 들면, 전(前) 프레임에서 선택한 대역의 근방에 위치하는 대역중에서 현프레임의 대역을 결정해도 괜찮다. 또, 전(前)프레임에서 선택한 대역의 근방에 현프레임의 대역의 후보를 재배치하고, 그 재배치된 대역의 후보중에서 현프레임의 대역을 결정해도 괜찮다. 또, 범위 정보를 몇프레임에 1번의 비율로 전송하고, 범위 정보를 전송하지 않는 프레임에서는 과거에 전송된 범위 정보가 나타내는 범위를 이용해도 괜찮다(대역 정보의 간헐 전송).
또, 상기의 각 실시형태에서는, 저위 레이어에서 선택한 대역과 관련화하여 현재의 레이어 대역을 선택해도 좋다. 예를 들면, 저위 레이어에서 선택한 대역의 근방에 위치하는 대역중에서 현재의 레이어의 대역을 결정해도 괜찮다. 저위 레이어에서 선택한 대역의 근방에 현재 레이어의 대역의 후보를 재배치하고, 그 재배치된 대역의 후보중에서 현재의 레이어의 대역을 결정해도 괜찮다. 또, 범위 정보를 몇 프레임에 1번의 비율로 전송하고, 범위 정보를 전송하지않는 프레임에서는 과거에 전송된 범위 정보가 나타내는 범위를 이용해도 괜찮다(대역 정보의 간헐 전송).
또한, 본 발명은, 스케일러블 부호화의 계층수에 제한은 없다.
또, 상기 실시형태에서는, 복호 신호로서 음성 신호를 상정하고 있지만, 본 발명은 이것에 한하지 않고, 예를 들면, 오디오 신호 등이라도 좋다.
또, 상기 각 실시형태에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 소프트웨어로 실현하는 것도 가능하다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이것들은 개별적으로 1 칩화되어도 괜찮고, 일부 또는 모두를 포함하도록1 칩화되어도 괜찮다. 여기에서는, LSI라고 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니고, 전용 회로 또는 범용 프로세서로 실현해도 괜찮다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 괜찮다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히, 그 기술을 이용해 기능 블록의 집적화를 행해도 괜찮다. 바이오 기술의 적용 등이 가능성으로서 있을 수 있다.
2007년 3월 2 일에 출원한 특허출원 2007-053498의 일본 출원, 2007년 5월 18 일에 출원한 특허출원 2007-133525의 일본 출원, 2007년 7월 13 일에 출원한 특허출원 2007-184546의 일본 출원, 및 2008년 2월 26 일에 출원한 특허출원 2008-044774의 일본 출원에 포함되는 명세서, 도면 및 요약서의 개시 내용은, 모두 본원에 원용된다.
본 발명은, 스케일러블 부호화 방식의 통신 시스템에 사용되는 부호화 장치, 복호 장치 등에 이용하는데 매우 적합하다.

Claims (14)

  1. 입력 변환계수에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성하는 제1 레이어 부호화 수단과,
    상기 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여, 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 수단과,
    상기 입력 변환계수와 상기 제1 레이어 복호 변환계수의 오차인 제1 레이어 오차 변환계수 중, 상기 오차가 가장 큰 타겟주파수 대역부분에 대해서 부호화 처리를 행하여, 제2 레이어 부호화 데이터를 생성하는 제2 레이어 부호화 수단을 구비하고,
    상기 제2 레이어 부호화 수단은,
    전대역에 걸쳐서, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을, 소정의 제1 피치폭으로 탐색하고, 특정한 제1 대역을 나타내는 제1 위치 정보를 생성하는 제1 위치 특정 수단과,
    상기 제1 대역에 걸쳐서, 상기 제1 피치폭보다 좁은 제2 피치폭으로 상기 타겟주파수 대역을 탐색하여, 특정한 타겟주파수 대역을 나타내는 제2 위치 정보를 생성하는 제2 위치 특정 수단과,
    상기 제1 위치 정보, 상기 제2 위치 정보에 의해 특정된 타겟주파수 대역에 포함되는 상기 제1 레이어 오차 변환계수를 부호화하여 부호화 정보를 생성하는 부호화 수단을 구비하는 부호화 장치.
  2. 제1항에 있어서,
    상기 제2 위치 특정 수단은,
    단일의 타겟주파수에 의해 상기 타겟주파수 대역을 특정하는 부호화 장치.
  3. 제1항에 있어서,
    상기 제2 위치 특정 수단은,
    복수의 타겟주파수에 의해 상기 타겟주파수 대역을 특정하는 부호화 장치.
  4. 제1항에 있어서,
    상기 제2 위치 특정 수단은,
    상기 제1 레이어 오차 변환계수의 부호화시에 발생하는 양자화 왜곡이 최소가 되도록 상기 타겟주파수 대역을 특정하는 부호화 장치.
  5. 제1항에 있어서,
    상기 제1 위치 특정 수단은
    상기 제1 레이어 오차 변환계수의 에너지의 크기를 기준으로 상기 제1 대역을 특정하는 부호화 장치.
  6. 제1항에 있어서,
    상기 제1 위치 특정 수단은,
    설정된 기준주파수보다 낮은 저역부로부터 상기 제1 대역을 특정하는 부호화 장치.
  7. 제 1항에 있어서,
    상기 제1 위치 특정 수단은,
    피치 주파수의 정수배를 기준으로 상기 제1 대역을 특정하는 부호화 장치.
  8. 제1항에 있어서,
    부호화 처리의 레이어수는, 2이상이며,
    기준주파수는, 고위 레이어일수록 높게 설정되고,
    상기 제1 위치 특정 수단은,
    레이어마다 상기 각 기준주파수보다 낮은 저역부로부터 상기 제1 대역을 특정하는 부호화 장치.
  9. 제1항에 있어서,
    상기 제1 위치 특정 수단은,
    전대역을 복수의 부분 대역으로 분할하고, 상기 복수의 부분 대역 각각에 있어서 1개의 대역을 선택하고, 선택된 복수의 대역을 결합한 결합 대역을, 상기 제1 대역으로 하는 부호화 장치.
  10. 제9항에 있어서,
    상기 제1 위치 특정 수단은,
    상기 복수의 부분 대역 중의 적어도 1개에 있어서, 미리 결정된 고정된 대역을 선택하는 부호화 장치.
  11. 입력 변환계수에 대해서 부호화 처리를 행하여 얻어진 제1 레이어 부호화 데이터, 상기 제1 레이어 부호화 데이터를 복호한 제1 레이어 복호 변환계수와 상기 입력 변환계수의 오차인 제1 레이어 오차 변환계수 중 상기 오차가 가장 큰 타겟주파수 대역 부분에 대해서 부호화 처리를 행하여 얻어진 제2 레이어 부호화 데이터, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을 나타내는 제1 위치 정보, 및 상기 제1 대역 안의 상기 타겟주파수 대역을 나타내는 제2 위치 정보를 수신하는 수신 수단과,
    상기 제1 레이어 부호화 데이터를 복호하여 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 수단과,
    상기 제1 위치 정보 및 상기 제2 위치 정보에 기초하여 상기 타겟주파수 대역을 특정하여, 상기 제2 레이어 부호화 데이터를 복호하여 제1 레이어 복호 오차 변환계수를 생성하는 제2 레이어 복호 수단과,
    상기 제1 레이어 복호 변환계수와 상기 제1 레이어 복호 오차 변환계수를 가산하여 제2 레이어 복호 변환계수를 생성하는 가산 수단을 구비하는 복호 장치.
  12. 제11항에 있어서,
    상기 제2 레이어 복호 수단은,
    상기 제2 레이어 부호화 데이터에 포함되는 형상 정보 및 게인 정보를 이용해 복호를 행하는 복호 장치.
  13. 입력 변환계수에 대해서 부호화 처리를 행하여, 제1 레이어 부호화 데이터를 생성하는 제1 레이어 부호화 스텝과,
    상기 제1 레이어 부호화 데이터를 이용해 복호 처리를 행하여, 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 스텝과,
    상기 입력 변환계수와 상기 제1 레이어 복호 변환계수와의 오차인 제1 레이어 오차 변환계수 중, 상기 오차가 가장 큰 타겟주파수 대역부분에 대해서 부호화 처리를 행하여, 제2 레이어 부호화 데이터를 생성하는 제2 레이어 부호화 스텝을 구비하고,
    상기 제2 레이어 부호화 스텝은,
    전대역에 걸쳐서, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을, 소정의 제1 피치폭으로 탐색하여, 특정한 제1 대역을 나타내는 제1 위치 정보를 생성하는 제1 위치 특정 스텝과,
    상기 제1 대역에 걸쳐서, 상기 제1 피치폭보다 좁은 제2 피치폭으로 상기 타겟주파수 대역을 탐색하여, 특정한 타겟주파수 대역을 나타내는 제2 위치 정보를 생성하는 제2 위치 특정 스텝과,
    상기 제1 위치 정보, 상기 제2 위치 정보에 의해 특정된 타겟주파수 대역에 포함되는 상기 제1 레이어 오차 변환계수를 부호화해 부호화 정보를 생성하는 부호화 스텝을 구비하는 부호화 방법.
  14. 입력 변환계수에 대해서 부호화 처리를 행하여 얻어진 제1 레이어 부호화 데이터, 상기 제1 레이어 부호화 데이터를 복호한 제1 레이어 복호 변환계수와 상기 입력 변환계수의 오차인 제1 레이어 오차 변환계수 중 상기 오차가 가장 큰 타겟주파수 대역부분에 대해서 부호화 처리를 행하여 얻어진 제2 레이어 부호화 데이터, 상기 타겟주파수 대역보다 넓은 대역폭에서 상기 오차가 가장 큰 제1 대역을 나타내는 제1 위치 정보, 및 상기 제1 대역안의 상기 타겟주파수 대역을 나타내는 제2 위치 정보를 수신하는 수신 스텝과,
    상기 제1 레이어 부호화 데이터를 복호하여 제1 레이어 복호 변환계수를 생성하는 제1 레이어 복호 스텝과,
    상기 제1 위치 정보 및 상기 제2 위치 정보에 기초하여 상기 타겟주파수 대역을 특정하고, 상기 제2 레이어 부호화 데이터를 복호해 제1 레이어 복호 오차 변환계수를 생성하는 제2 레이어 복호 스텝과,
    상기 제1 레이어 복호 변환계수와 상기 제1 레이어 복호 오차 변환계수를 가산해 제2 레이어 복호 변환계수를 생성하는 가산 스텝을 구비하는 복호 방법.
KR1020097017702A 2007-03-02 2008-02-29 부호화 장치, 복호 장치 및 그 방법 Active KR101363793B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JPJP-P-2007-053498 2007-03-02
JP2007053498 2007-03-02
JPJP-P-2007-133525 2007-05-18
JP2007133525 2007-05-18
JPJP-P-2007-184546 2007-07-13
JP2007184546 2007-07-13
JP2008044774A JP4708446B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置およびそれらの方法
JPJP-P-2008-044774 2008-02-26
PCT/JP2008/000396 WO2008120437A1 (ja) 2007-03-02 2008-02-29 符号化装置、復号装置およびそれらの方法

Publications (2)

Publication Number Publication Date
KR20090117883A KR20090117883A (ko) 2009-11-13
KR101363793B1 true KR101363793B1 (ko) 2014-02-14

Family

ID=39808024

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097017702A Active KR101363793B1 (ko) 2007-03-02 2008-02-29 부호화 장치, 복호 장치 및 그 방법

Country Status (10)

Country Link
US (3) US8543392B2 (ko)
EP (3) EP2747079B1 (ko)
JP (1) JP4708446B2 (ko)
KR (1) KR101363793B1 (ko)
CN (3) CN101611442B (ko)
BR (1) BRPI0808705A2 (ko)
CA (1) CA2679192C (ko)
ES (1) ES2473277T3 (ko)
RU (2) RU2502138C2 (ko)
WO (1) WO2008120437A1 (ko)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
US8660851B2 (en) 2009-05-26 2014-02-25 Panasonic Corporation Stereo signal decoding device and stereo signal decoding method
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
WO2011045926A1 (ja) * 2009-10-14 2011-04-21 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5295380B2 (ja) 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
KR101309671B1 (ko) * 2009-10-21 2013-09-23 돌비 인터네셔널 에이비 결합된 트랜스포저 필터 뱅크에서의 오버샘플링
JP5525540B2 (ja) * 2009-10-30 2014-06-18 パナソニック株式会社 符号化装置および符号化方法
WO2011155144A1 (ja) * 2010-06-11 2011-12-15 パナソニック株式会社 復号装置、符号化装置及びこれらの方法
CA2801362A1 (en) * 2010-06-21 2011-12-29 Panasonic Corporation Decoding device, encoding device, and methods for same
SG10201604880YA (en) 2010-07-02 2016-08-30 Dolby Int Ab Selective bass post filter
BR112013005683A2 (pt) 2010-09-10 2018-01-23 Panasonic Corp aparelho codificador e método de codificação
MX2013009306A (es) 2011-02-14 2013-09-26 Fraunhofer Ges Forschung Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada.
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP2676267B1 (en) 2011-02-14 2017-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
CN102959620B (zh) 2011-02-14 2015-05-13 弗兰霍菲尔运输应用研究公司 利用重迭变换的信息信号表示
SG192734A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
MY160272A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Audio Codec Using Noise Synthesis During Inactive Phases
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
CN103718240B (zh) * 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
US9558752B2 (en) 2011-10-07 2017-01-31 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
WO2013175368A1 (en) * 2012-05-25 2013-11-28 Koninklijke Philips N.V. Method, system and device for protection against reverse engineering and/or tampering with programs
SG11201510510PA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved signal fade out in different domains during error concealment
MX365958B (es) 2014-08-28 2019-06-20 Nokia Technologies Oy Cuantificación de parámetros de audio.
CN107004417B (zh) 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
WO2017129270A1 (en) * 2016-01-29 2017-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal
US10524173B2 (en) * 2016-02-24 2019-12-31 Cisco Technology, Inc. System and method to facilitate sharing bearer information in a network environment
CA3016949C (en) 2016-03-07 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
KR102250472B1 (ko) * 2016-03-07 2021-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
MX386551B (es) 2016-03-07 2025-03-19 Fraunhofer Ges Forschung Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente.
JP6685198B2 (ja) * 2016-07-27 2020-04-22 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
US10917857B2 (en) 2019-04-18 2021-02-09 Comcast Cable Communications, Llc Methods and systems for wireless communication

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002020658A (ja) 2000-07-05 2002-01-23 Hiroshi Takimoto 記録液
WO2005027095A1 (ja) 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
US5999905A (en) * 1995-12-13 1999-12-07 Sony Corporation Apparatus and method for processing data to maintain continuity when subsequent data is added and an apparatus and method for recording said data
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3352406B2 (ja) * 1998-09-17 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び復号方法及び装置
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US7236839B2 (en) * 2001-08-23 2007-06-26 Matsushita Electric Industrial Co., Ltd. Audio decoder with expanded band information
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
WO2003077235A1 (en) * 2002-03-12 2003-09-18 Nokia Corporation Efficient improvements in scalable audio coding
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
FR2849727B1 (fr) 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
RU2248619C2 (ru) * 2003-02-12 2005-03-20 Рыболовлев Александр Аркадьевич Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7724818B2 (en) * 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
US7548852B2 (en) * 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
KR20050022419A (ko) * 2003-08-30 2005-03-08 엘지전자 주식회사 음성 부호화기의 스펙트럼 벡터 양자화 장치 및 방법
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
KR20060090995A (ko) 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
JP4771674B2 (ja) 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
KR20070084002A (ko) * 2004-11-05 2007-08-24 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 복호화 장치 및 스케일러블 부호화 장치
WO2006104017A1 (ja) 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JP4907522B2 (ja) 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4850827B2 (ja) 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
RU2296377C2 (ru) * 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
EP1953736A4 (en) 2005-10-31 2009-08-05 Panasonic Corp STEREO CODING DEVICE AND STEREOSIGNAL PREDICTION PROCESS
JP5173795B2 (ja) 2006-03-17 2013-04-03 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002020658A (ja) 2000-07-05 2002-01-23 Hiroshi Takimoto 記録液
WO2005027095A1 (ja) 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置

Also Published As

Publication number Publication date
JP2009042733A (ja) 2009-02-26
CN101611442A (zh) 2009-12-23
US8543392B2 (en) 2013-09-24
WO2008120437A1 (ja) 2008-10-09
EP2747080A2 (en) 2014-06-25
CN101611442B (zh) 2012-02-08
EP2747079A3 (en) 2014-08-13
CN102394066A (zh) 2012-03-28
EP2128860B1 (en) 2014-06-04
EP2747080B1 (en) 2017-06-28
CN102394066B (zh) 2013-10-09
CA2679192A1 (en) 2008-10-09
KR20090117883A (ko) 2009-11-13
EP2747079B1 (en) 2018-04-04
US20140019144A1 (en) 2014-01-16
US8935162B2 (en) 2015-01-13
EP2747079A2 (en) 2014-06-25
RU2488897C1 (ru) 2013-07-27
CA2679192C (en) 2016-01-19
RU2502138C2 (ru) 2013-12-20
US8935161B2 (en) 2015-01-13
CN102385866B (zh) 2013-05-08
US20100017200A1 (en) 2010-01-21
BRPI0808705A2 (pt) 2014-09-09
US20130332150A1 (en) 2013-12-12
ES2473277T3 (es) 2014-07-04
RU2012115551A (ru) 2013-08-27
EP2747080A3 (en) 2014-08-06
EP2128860A4 (en) 2013-10-23
CN102385866A (zh) 2012-03-21
EP2128860A1 (en) 2009-12-02
JP4708446B2 (ja) 2011-06-22

Similar Documents

Publication Publication Date Title
KR101363793B1 (ko) 부호화 장치, 복호 장치 및 그 방법
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
KR101366124B1 (ko) 오디오 인코딩/디코딩에서의 인지 가중 장치
JPWO2008072737A1 (ja) 符号化装置、復号装置およびこれらの方法
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
KR20070083856A (ko) 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법
JP5236032B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20090825

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20121224

Comment text: Request for Examination of Application

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20140115

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20140210

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20140210

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20170103

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20170103

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20180104

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20180104

Start annual number: 5

End annual number: 5

FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 6

PR1001 Payment of annual fee

Payment date: 20190107

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20200107

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20200107

Start annual number: 7

End annual number: 7

PR1001 Payment of annual fee

Payment date: 20210108

Start annual number: 8

End annual number: 8

PR1001 Payment of annual fee

Payment date: 20211222

Start annual number: 9

End annual number: 9

PR1001 Payment of annual fee

Payment date: 20221220

Start annual number: 10

End annual number: 10

PR1001 Payment of annual fee

Payment date: 20231220

Start annual number: 11

End annual number: 11