KR101425355B1 - 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 - Google Patents
파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 Download PDFInfo
- Publication number
- KR101425355B1 KR101425355B1 KR1020070089971A KR20070089971A KR101425355B1 KR 101425355 B1 KR101425355 B1 KR 101425355B1 KR 1020070089971 A KR1020070089971 A KR 1020070089971A KR 20070089971 A KR20070089971 A KR 20070089971A KR 101425355 B1 KR101425355 B1 KR 101425355B1
- Authority
- KR
- South Korea
- Prior art keywords
- sinusoidal wave
- frequency
- phase
- encoded
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (22)
- 입력되는 오디오 신호를 복수의 세그먼트로 분할하는 단계;상기 복수의 세그먼트의 각각에 대하여 적어도 하나의 정현파를 추출하는 단계;상기 정현파를 연결하는 단계;상기 정현파가 시작 정현파인지 여부를 결정하는 단계; 및상기 정현파가 상기 시작 정현파이면, 상기 시작 정현파의 위상이 상기 시작 정현파의 주파수를 기초로 부호화된 비트 스트림을 출력하는 단계를 포함하고,상기 시작 정현파의 위상을 부호화하기 위하여 할당되는 비트수는 상기 시작 정현파의 주파수에 따라서 조절되고,상기 시작 정현파의 위상을 부호화하는 단계는, 상기 시작 정현파가 소정의 기준 주파수보다 높은 주파수를 가지면, 상기 시작 정현파의 위상에 할당되는 비트수는 0인 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 삭제
- 제1항에 있어서, 상기 시작 정현파의 위상을 부호화하는 단계는,상기 시작 정현파의 주파수 및 소정의 상수의 곱으로써 양자화 스텝을 결정 하는 단계;상기 양자화 스텝에 따라서 상기 시작 정현파의 위상을 양자화하는 단계; 및상기 양자화된 시작 정현파의 위상을 부호화한 비트 스트림을 출력하는 단계를 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 제1항에 있어서, 상기 시작 정현파의 위상을 부호화하는 단계는,상기 정현파의 주파수를 심리 음향적 주파수로 변환하는 단계;상기 심리 음량적 주파수 및 소정의 상수의 곱으로써 양자화 스텝을 결정하는 단계;상기 양자화 스텝에 따라서 상기 시작 정현파의 위상을 양자화하는 단계; 및상기 양자화된 시작 정현파의 위상을 부호화한 비트 스트림을 출력하는 단계를 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 제4항에 있어서,상기 정현파의 주파수는 ERB(Equivalent Rectangular Band) 함수, 바크 밴드 스케일(Bark Band Scale) 함수, 및 크리티컬 밴드(Critical Band) 함수 중 어느 하나에 의해서 상기 심리 음향적 주파수로 변환되는 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 제1항에 있어서,상기 비트 스트림은 상기 정현파가 상기 시작 정현파인지 여부에 관한 연결 정보, 부호화된 시작 정현파의 진폭 및 부호화된 시작 정현파의 주파수를 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 제6항에 있어서,상기 비트스트림은 양자화 스텝 정보를 더 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 방법.
- 입력되는 오디오 신호를 복수의 세그먼트로 분할하는 세그먼테이션부;상기 복수의 세그먼트의 각각에 대하여 적어도 하나의 정현파를 추출하는 정현파 추출부;상기 정현파를 연결하는 정현파 연결부;상기 정현파가 시작 정현파인지 여부를 결정하는 시작 정현파 결정부; 및상기 정현파가 상기 시작 정현파이면, 상기 시작 정현파의 위상이 상기 시작 정현파의 주파수를 기초로 하여 부호화된 비트 스트림을 출력하는 부호화부를 포함하고,상기 부호화부는 상기 시작 정현파의 위상을 부호화하기 위하여 할당되는 비트수를 상기 시작 정현파의 주파수에 따라서 조절하고,상기 부호화부는, 상기 시작 정현파가 소정의 기준 주파수보다 높은 주파수를 가지면, 상기 시작 정현파의 위상에 상기 비트수를 할당하지 않는 것을 특징으로 하는 파라메트릭 오디오 부호화 장치.
- 삭제
- 제8항에 있어서, 상기 부호화부는,상기 시작 정현파의 주파수 및 소정의 상수의 곱으로써 양자화 스텝을 결정하는 양자화 스텝 결정부;상기 양자화 스텝에 따라서 상기 시작 정현파의 위상을 양자화하는 양자화부; 및상기 양자화된 시작 정현파의 위상을 부호화한 비트 스트림을 출력하는 비트 스트림 출력부를 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 장치.
- 제8항에 있어서, 상기 부호화부는,상기 정현파의 주파수를 심리 음향적 주파수로 변환하는 주파수 변환부;상기 심리 음량적 주파수 및 소정의 상수의 곱으로써 양자화 스텝을 결정하는 양자화 스텝 결정부;상기 양자화 스텝에 따라서 상기 시작 정현파의 위상을 양자화하는 양자화부; 및상기 양자화된 시작 정현파의 위상을 부호화한 비트 스트림을 출력하는 비트 스트림 출력부를 포함하는 것을 특징으로 하는 파라메트릭 오디오 부호화 장치.
- 입력되는 비트 스트림을 파싱하는 단계;부호화된 정현파가 부호화된 시작 정현파인지 여부를 결정하는 단계;상기 부호화된 정현파가 상기 부호화된 시작 정현파이면, 상기 부호화된 시작 정현파의 진폭 및 주파수를 복호화하는 단계;상기 시작 정현파의 주파수를 기초로 하여 상기 부호화된 시작 정현파의 위상을 복호화하는 단계; 및상기 시작 정현파의 진폭, 주파수 및 위상을 이용하여 상기 시작 정현파를 복원하고, 상기 복원된 시작 정현파를 이용하여 오디오 신호를 복원하는 단계를 포함하고,상기 부호화된 시작 정현파의 위상을 복호화하는 단계는, 상기 시작 정현파의 주파수가 소정의 기준 주파수보다 높으면, 상기 시작 정현파의 위상을 0 내지 2π 사이의 랜덤 값으로 결정하는 것을 특징으로 하는 파라메트릭 오디오 복호화 방법.
- 삭제
- 제12항에 있어서, 상기 부호화된 시작 정현파의 위상을 복호화하는 단계는,상기 비트 스트림에 포함된 양자화 스텝 정보를 이용하여 상기 부호화된 시작 정현파의 위상을 복호화하는 것을 특징으로 하는 파라메트릭 오디오 복호화 방 법.
- 제12항에 있어서, 상기 부호화된 시작 정현파의 위상을 복호화하는 단계는,상기 시작 정현파의 주파수를 이용하여 양자화 스텝을 결정하는 단계; 및상기 양자화 스텝을 이용하여 상기 부호화된 시작 정현파의 위상을 복호화하는 단계를 포함하는 것을 특징으로 하는 파라메트릭 오디오 복호화 방법.
- 제12항에 있어서,상기 비트 스트림은 상기 부호화된 정현파가 상기 부호화된 시작 정현파인지 여부에 관한 연결 정보 및 양자화 스텝 정보를 포함하는 것을 특징으로 하는 파라메트릭 오디오 복호화 방법.
- 입력되는 비트 스트림을 파싱하는 파싱부;상기 파싱부로부터 출력되는 부호화된 정현파가 부호화된 시작 정현파인지 여부를 결정하는 시작 정현파 결정부;상기 부호화된 정현파가 상기 부호화된 시작 정현파이면, 상기 부호화된 시작 정현파의 진폭 및 주파수를 복호화하는 제1 복호화부;상기 시작 정현파의 주파수를 기초로 하여 상기 부호화된 시작 정현파의 위상을 복호화하는 제2 복호화부; 및상기 시작 정현파의 진폭, 주파수 및 위상을 기초로 하여 상기 시작 정현파를 복원하고, 상기 복원된 시작 정현파를 이용하여 오디오 신호를 복원하는 복원부를 포함하고,상기 제2 복호화부는, 상기 시작 정현파의 주파수가 소정의 기준 주파수보다 높으면, 상기 시작 정현파의 위상을 0 내지 2π 사이의 랜덤 값으로 결정하는 것을 특징으로 하는 파라메트릭 오디오 복호화 장치.
- 삭제
- 제17항에 있어서, 상기 제2 복호화부는 상기 비트 스트림 입력에 포함된 양자화 스텝 정보를 이용하여 상기 부호화된 시작 정현파의 위상을 복호화하는 것을 특징으로 하는 파라메트릭 오디오 복호화 장치.
- 제17항에 있어서, 상기 제2 복호화부는,상기 시작 정현파의 주파수를 이용하여 양자화 스텝을 결정하고, 상기 양자화 스텝을 이용하여 상기 부호화된 시작 정현파의 위상을 복호화하는 것을 특징으로 하는 파라메트릭 오디오 복호화 장치.
- 제1항, 제3항 내지 제7항 중 어느 한 항의 파라메트릭 오디오 부호화 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 기록매체.
- 제12항, 제14항 내지 제16항 중 어느 한 항의 파라메트릭 오디오 복호화 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 판독 가능한 기록매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070089971A KR101425355B1 (ko) | 2007-09-05 | 2007-09-05 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
PCT/KR2008/003856 WO2009031754A1 (en) | 2007-09-05 | 2008-06-30 | Parametric audio encoding and decoding apparatus and method thereof |
US12/170,819 US8473302B2 (en) | 2007-09-05 | 2008-07-10 | Parametric audio encoding and decoding apparatus and method thereof having selective phase encoding for birth sine wave |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070089971A KR101425355B1 (ko) | 2007-09-05 | 2007-09-05 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090024970A KR20090024970A (ko) | 2009-03-10 |
KR101425355B1 true KR101425355B1 (ko) | 2014-08-06 |
Family
ID=40408844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070089971A Expired - Fee Related KR101425355B1 (ko) | 2007-09-05 | 2007-09-05 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8473302B2 (ko) |
KR (1) | KR101425355B1 (ko) |
WO (1) | WO2009031754A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030083886A1 (en) * | 2001-10-26 | 2003-05-01 | Den Brinker Albertus Cornelis | Audio coding |
US20070027678A1 (en) * | 2003-09-05 | 2007-02-01 | Koninkijkle Phillips Electronics N.V. | Low bit-rate audio encoding |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4937873A (en) * | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
CN1408146A (zh) * | 2000-11-03 | 2003-04-02 | 皇家菲利浦电子有限公司 | 音频信号的参数编码 |
JP2004519741A (ja) * | 2001-04-18 | 2004-07-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化 |
GB2380640A (en) * | 2001-08-21 | 2003-04-09 | Micron Technology Inc | Data compression method |
JP4296753B2 (ja) | 2002-05-20 | 2009-07-15 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 |
US20050259822A1 (en) * | 2002-07-08 | 2005-11-24 | Koninklijke Philips Electronics N.V. | Sinusoidal audio coding |
BR0305555A (pt) * | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
BRPI0305710B1 (pt) | 2002-08-01 | 2017-11-07 | Panasonic Corporation | "apparatus and method of decoding of audio" |
JP2006503323A (ja) * | 2002-10-17 | 2006-01-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 位相の更新による正弦波オーディオコーディング |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
WO2005008628A1 (en) * | 2003-07-18 | 2005-01-27 | Koninklijke Philips Electronics N.V. | Low bit-rate audio encoding |
US20050091041A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
-
2007
- 2007-09-05 KR KR1020070089971A patent/KR101425355B1/ko not_active Expired - Fee Related
-
2008
- 2008-06-30 WO PCT/KR2008/003856 patent/WO2009031754A1/en active Application Filing
- 2008-07-10 US US12/170,819 patent/US8473302B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030083886A1 (en) * | 2001-10-26 | 2003-05-01 | Den Brinker Albertus Cornelis | Audio coding |
US20070027678A1 (en) * | 2003-09-05 | 2007-02-01 | Koninkijkle Phillips Electronics N.V. | Low bit-rate audio encoding |
Also Published As
Publication number | Publication date |
---|---|
US20090063162A1 (en) | 2009-03-05 |
WO2009031754A1 (en) | 2009-03-12 |
KR20090024970A (ko) | 2009-03-10 |
US8473302B2 (en) | 2013-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612215B2 (en) | Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same | |
US8489405B2 (en) | Compression coding and decoding method, coder, decoder, and coding device | |
JP2005531024A (ja) | 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法 | |
CN101223576A (zh) | 从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备 | |
JP2006048043A (ja) | オーディオデータの高周波数の復元方法及びその装置 | |
US7225123B2 (en) | Method for compressing audio signal using wavelet packet transform and apparatus thereof | |
JP2003523535A (ja) | 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置 | |
JP2003108197A (ja) | オーディオ信号復号化装置およびオーディオ信号符号化装置 | |
JP3158932B2 (ja) | 信号符号化装置及び信号復号化装置 | |
KR101380170B1 (ko) | 미디어 신호 인코딩/디코딩 방법 및 장치 | |
US20060100885A1 (en) | Method and apparatus to encode and decode an audio signal | |
KR101149448B1 (ko) | 오디오 부호화 및 복호화 장치와 그 방법 | |
KR101425355B1 (ko) | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 | |
KR101299155B1 (ko) | 오디오 부호화 및 복호화 장치와 그 방법 | |
KR101261524B1 (ko) | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
KR20090018530A (ko) | 종지 정현파 신호와 일반적인 연속 정현파 신호를 다른방식으로 처리하는 오디오 신호 인코딩 방법 및 장치와오디오 신호 디코딩 방법 및 장치 | |
KR20080072224A (ko) | 오디오 부호화 및 복호화 장치와 그 방법 | |
US8301282B2 (en) | Fast synthesis sub-band filtering method for digital signal decoding | |
JPH08179794A (ja) | サブバンド符号化方法及び装置 | |
KR100685974B1 (ko) | 워터마크 삽입/검출을 위한 장치 및 방법 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
Cavagnolo et al. | Introduction to Digital Audio Compression | |
EP2179588B1 (en) | Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20070905 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20120824 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20070905 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20131024 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20140425 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20140725 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20140728 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20170629 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20180628 Start annual number: 5 End annual number: 5 |
|
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20200505 |