KR20100007651A - 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 - Google Patents
오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR20100007651A KR20100007651A KR1020080068377A KR20080068377A KR20100007651A KR 20100007651 A KR20100007651 A KR 20100007651A KR 1020080068377 A KR1020080068377 A KR 1020080068377A KR 20080068377 A KR20080068377 A KR 20080068377A KR 20100007651 A KR20100007651 A KR 20100007651A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- audio
- speech
- unit
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (19)
- 입력 오디오 또는 스피치 신호를 높은 주파수 분해능(high frequency resolution) 및/또는 높은 시간 분해능(high temporal resolution)을 포함하는 신호로 변환하는 신호 변환부;상기 신호 변환부가 상기 입력 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하도록 제어하는 심리음향 모델부;상기 신호 변환부에서 변환된 신호를 음성 발성 모델에 기초하여 부호화하는 높은 시간 분해능 부호화부(high temporal resolution coding tool); 및상기 신호 변환부 및/또는 높은 시간 분해능 부호화부에서 출력된 신호를 양자화 및 부호화하는 양자화/부호화부;를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 양자화/부호화부는,중복정보가 제거된 신호를 모델링하기 위한 CELP(Code Excitation Linear Prediction)를 포함하여 구성되는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 오디오 또는 스피치 입력 신호의 고주파수 정보를 처리하는 고주파 신호 처리부 및 상기 오디오 또는 스피치 입력 신호의 스테레오 정보를 처리하는 스테레오 신호 처리부 중 적어도 하나를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 높은 시간 분해능 부호화부는,중복정보가 제거된 신호를 모델링하기 위한 CELP(Code Excitation Linear Prediction)를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 입력 오디오 또는 스피치 신호가, 높은 주파수 분해능(high frequency resolution) 및/또는 높은 시간 분해능(high temporal resolution)을 포함하는 정보에 기초하여, 상기 양자화/부호화부 및 높은 시간 분해능 부호화부에 의한 부호화 중 어느 하나를 선택하는 스위칭부를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 입력 오디오 또는 스피치 신호를 다운샘플링하는 다운샘플링부를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 신호 변환부는,FV-MLT 및 MDCT 중 적어도 어느 하나를 포함하여 구성되는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 심리음향 모델부는,상기 양자화/부호화부 측으로, 양자화 시의 노이즈에 대한 정보를 제공하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제1항에 있어서,상기 높은 시간 분해능 부호화부는,상기 신호 변환부에서 변환된 신호에 음성 발성모델을 적용하여 부호화하고, 중복정보를 제거하는 예측부를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 비트스트림에 포함된 시간 영역(time domain) 코딩 또는 주파수 영역(frequency domain) 코딩에 대한 정보에 기초하여, 현재 프레임의 신호가 높은 주파수 신호(high frequency resolution signal) 또는 높은 시간 신호 (high temporal resolution signal)인지 결정하는 분해능 결정부;상기 분해능 결정부의 출력신호에 따라 상기 비트스트림을 역양자화하는 역양자화부;상기 역양자화부로부터 역양자화된 신호를 수신하고, 상기 비트스트림으로부터 역 선형예측에 필요한 부가정보를 검출한 후, 상기 역양자화된 신호와 상기 부가정보를 이용하여 높은 시간 신호를 복원하는 높은 시간 분해능 복호화부(high temporal resolution decoding tool); 및상기 높은 시간 분해능 복호화부로부터 제공되는 신호 및/또는 상기 역양자화/부호화 부에서 역양자화된 신호를 시간영역의 오디오 또는 스피치신호로 역변환하는 역신호 변환부를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 복호화 장치.
- 제10항에 있어서,상기 역변환된 신호의 고주파수 정보를 처리하는 고주파 신호 처리부; 또는상기 역변환된 신호의 스테레오 정보를 처리하는 스테레오 신호 처리부를 더 포함하여 구성되는 것을 특징으로 하는 오디오/스피치 신호의 복호화 장치.
- 입력 오디오 또는 스피치 신호를 높은 주파수 분해능(high frequency resolution) 및/또는 높은 시간 분해능(high temporal resolution)을 포함하는 신호로 변환하는 신호 변환부;상기 신호 변환부가 상기 입력 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하도록 제어하는 심리음향 모델부;상기 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하는 시간 노이즈 성형부;상기 변환된 신호의 스테레오 정보를 부호화하는 하이레이트 스테레오부; 및상기 시간 노이즈 성형부 및/또는 하이레이트 스테레오부에서 출력된 신호를 양자화 및 부호화하는 양자화/부호화 부;를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제12항에 있어서,상기 오디오 또는 스피치 신호의 고주파 신호를 처리하는 고주파 신호 처리부를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 비트스트림을 역양자화하는 역양자화/부호화 부;상기 역양자화 된 신호를 복호화하는 하이레이트 스테레오 복호화부;상기 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환한 신호를, 복호화하는 시간 노이즈 성형 복호화부; 및상기 복호화된 신호를 시간영역의 오디오 또는 스피치신호로 역변환하는 역신호 변환부를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 복호화 장치.
- 제14항에 있어서,상기 역변환 된 신호의 고주파 정보를 처리하는 고주파 신호 처리부를 더 포함하는 것을 특징으로 하는 오디오/스피치 신호의 복호화 장치.
- 입력 오디오 또는 스피치 신호를 높은 주파수 분해능(high frequency resolution) 및/또는 높은 시간 분해능(high temporal resolution)을 포함하는 신호로 변환하는 신호 변환부;상기 신호 변환부가 상기 입력 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하도록 제어하는 심리음향 모델부;상기 변환된 신호가 로우 레이트(Low rate)인지의 여부를 판단하는 로우 레 이트 판단부;상기 판단 결과 로우 레이트인 경우, 상기 신호 변환부에서 변환된 신호를 음성 발성 모델에 기초하여 부호화하는 높은 시간 분해능 부호화부(high temporal resolution coding tool);상기 오디오 또는 스피치 신호를 높은 주파수 신호(high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하는 시간 노이즈 성형부;상기 변환된 신호의 스테레오 정보를 변수화된 정보로 코딩하는 하이레이트 스테레오부; 및상기 신호 변환부 및/또는 높은 시간 분해능 부호화부에서 출력된 신호를 양자화 및 부호화하는 양자화/부호화부를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 제16항에 있어서,선정된 정보에 기초하여 스테레오 신호 처리부의 동작 여부를 판단하는 스테레오 신호 처리부 판단부;상기 스테레오 신호 처리부의 동작이 필요한 것으로 판단되는 경우, 입력되는 고주파 신호의 스테레오 정보를 처리하는 스테레오 신호 처리부;선정된 정보에 기초하여 고주파 신호 처리부의 동작 여부를 판단하는 고주파 신호 처리부 판단부; 및상기 고주파 신호 처리부의 동작이 필요한 것으로 판단되는 경우, 입력되는 고주파 신호를 처리하는 고주파 신호 처리부를 더 포함하여 구성되는 것을 특징으로 하는 오디오/스피치 신호의 부호화 장치.
- 입력 오디오 또는 스피치 신호를 높은 주파수 분해능(high frequency resolution) 및/또는 높은 시간 분해능(high temporal resolution)을 포함하는 신호로 변환하는 단계;상기 입력 오디오 또는 스피치 신호를 높은 주파수 신호 (high frequency resolution signal) 및/또는 높은 시간 신호(high temporal resolution signal)로 변환하도록 제어하는 단계;상기 변환된 신호를 음성 발성 모델에 기초하여 부호화하는 단계; 및상기 변환된 신호 및/또는 부호화된 신호를 양자화 및 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 부호화 방법.
- 비트스트림에 포함된 시간 영역(time domain) 코딩 또는 주파수 영역(frequency domain) 코딩에 대한 정보에 기초하여, 현재 프레임의 신호가 높은 주파수 신호(high frequency resolution signal) 또는 높은 시간 신호 (high temporal resolution signal)인지 결정하는 단계;상기 결정에 따라 상기 비트스트림을 역양자화하는 단계;상기 역양자화된 신호를 수신하고, 상기 비트스트림으로부터 역 선형예측에 필요한 부가정보를 검출한 후, 상기 역양자화된 신호와 상기 부가정보를 이용하여 높은 시간 신호를 복원하는 단계; 및상기 복원된 신호 및/또는 상기 역양자화된 신호를 시간영역의 오디오 또는 스피치신호로 역변환하는 단계를 포함하는 것을 특징으로 하는 오디오/스피치 신호의 복호화 방법.
Priority Applications (14)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080068377A KR101756834B1 (ko) | 2008-07-14 | 2008-07-14 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
EP09798088.2A EP2313888A4 (en) | 2008-07-14 | 2009-07-14 | METHOD AND DEVICE FOR CODING AND DECODING A TONE / LANGUAGE SIGNAL |
MYPI2011000202A MY154100A (en) | 2008-07-14 | 2009-07-14 | Method and apparatus to encode and decode an audio/speech signal |
PCT/KR2009/003870 WO2010008185A2 (en) | 2008-07-14 | 2009-07-14 | Method and apparatus to encode and decode an audio/speech signal |
JP2011518646A JP2011528135A (ja) | 2008-07-14 | 2009-07-14 | オーディオ/音声信号の符号化及び復号化方法とその装置 |
BRPI0916449A BRPI0916449A8 (pt) | 2008-07-14 | 2009-07-14 | aparelho para codificar um sinal de áudio/voz, aparelho para decodificar sinal de áudio/voz, aparelho de decodificação de sinal de áudio/voz, método de codificar um sinal de áudio/voz, método de decodificar sinal de áudio/voz, e método de decodificar sinais de áudio e voz |
MX2011000557A MX2011000557A (es) | 2008-07-14 | 2009-07-14 | Metodo y aparato de codificacion y decodificacion de señal de audio/voz. |
CN200980135987.5A CN102150202B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
US12/502,454 US8532982B2 (en) | 2008-07-14 | 2009-07-14 | Method and apparatus to encode and decode an audio/speech signal |
CN201610509620.7A CN105913851B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
CN201610515415.1A CN105957532B (zh) | 2008-07-14 | 2009-07-14 | 对音频/语音信号进行编码和解码的方法和设备 |
IL210664A IL210664A (en) | 2008-07-14 | 2011-01-13 | Method and install and decode audio / speech signal |
US14/020,006 US9355646B2 (en) | 2008-07-14 | 2013-09-06 | Method and apparatus to encode and decode an audio/speech signal |
US15/149,847 US9728196B2 (en) | 2008-07-14 | 2016-05-09 | Method and apparatus to encode and decode an audio/speech signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080068377A KR101756834B1 (ko) | 2008-07-14 | 2008-07-14 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170084983A Division KR101847076B1 (ko) | 2017-07-04 | 2017-07-04 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100007651A true KR20100007651A (ko) | 2010-01-22 |
KR101756834B1 KR101756834B1 (ko) | 2017-07-12 |
Family
ID=41505940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080068377A Active KR101756834B1 (ko) | 2008-07-14 | 2008-07-14 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
Country Status (10)
Country | Link |
---|---|
US (3) | US8532982B2 (ko) |
EP (1) | EP2313888A4 (ko) |
JP (1) | JP2011528135A (ko) |
KR (1) | KR101756834B1 (ko) |
CN (3) | CN105957532B (ko) |
BR (1) | BRPI0916449A8 (ko) |
IL (1) | IL210664A (ko) |
MX (1) | MX2011000557A (ko) |
MY (1) | MY154100A (ko) |
WO (1) | WO2010008185A2 (ko) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
US9378745B2 (en) | 2010-04-09 | 2016-06-28 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN110890101B (zh) | 2013-08-28 | 2024-01-12 | 杜比实验室特许公司 | 用于基于语音增强元数据进行解码的方法和设备 |
CN103473836B (zh) * | 2013-08-30 | 2015-11-25 | 福建星网锐捷通讯股份有限公司 | 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统 |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
CN105957533B (zh) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | 语音压缩方法、语音解压方法及音频编码器、音频解码器 |
US10141009B2 (en) | 2016-06-28 | 2018-11-27 | Pindrop Security, Inc. | System and method for cluster-based audio event detection |
US9824692B1 (en) | 2016-09-12 | 2017-11-21 | Pindrop Security, Inc. | End-to-end speaker recognition using deep neural network |
US10553218B2 (en) | 2016-09-19 | 2020-02-04 | Pindrop Security, Inc. | Dimensionality reduction of baum-welch statistics for speaker recognition |
US10347256B2 (en) | 2016-09-19 | 2019-07-09 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
WO2018053537A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Improvements of speaker recognition in the call center |
US10397398B2 (en) | 2017-01-17 | 2019-08-27 | Pindrop Security, Inc. | Authentication using DTMF tones |
CN108768587B (zh) * | 2018-05-11 | 2021-04-27 | Tcl华星光电技术有限公司 | 编码方法、设备及可读存储介质 |
US11355103B2 (en) | 2019-01-28 | 2022-06-07 | Pindrop Security, Inc. | Unsupervised keyword spotting and word discovery for fraud analytics |
US11019201B2 (en) | 2019-02-06 | 2021-05-25 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
WO2020164753A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method selecting an error concealment mode, and encoder and encoding method |
US11646018B2 (en) | 2019-03-25 | 2023-05-09 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
CN111341330B (zh) * | 2020-02-10 | 2023-07-25 | 科大讯飞股份有限公司 | 音频编解码方法、存取方法及其相关设备及存储装置 |
US20230230605A1 (en) * | 2020-08-28 | 2023-07-20 | Google Llc | Maintaining invariance of sensory dissonance and sound localization cues in audio codecs |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3158932B2 (ja) * | 1995-01-27 | 2001-04-23 | 日本ビクター株式会社 | 信号符号化装置及び信号復号化装置 |
JP3342996B2 (ja) * | 1995-08-21 | 2002-11-11 | 三星電子株式会社 | 多チャネルオーディオ符号化器及び符号化方法 |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
CA2246532A1 (en) * | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
CA2356869C (en) * | 1998-12-28 | 2004-11-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
EP1493146B1 (en) * | 2002-04-11 | 2006-08-02 | Matsushita Electric Industrial Co., Ltd. | Encoding and decoding devices, methods and programs |
JP4399185B2 (ja) * | 2002-04-11 | 2010-01-13 | パナソニック株式会社 | 符号化装置および復号化装置 |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
JP2005141121A (ja) * | 2003-11-10 | 2005-06-02 | Matsushita Electric Ind Co Ltd | オーディオ再生装置 |
KR20070001139A (ko) * | 2004-02-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 |
WO2005096508A1 (fr) * | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Equipement de codage et de decodage audio ameliore, procede associe |
WO2005096273A1 (fr) * | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Ameliorations apportees a un procede et un dispositif de codage/decodage audio |
CN1677490A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR101037931B1 (ko) | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
CN101010726A (zh) * | 2004-08-27 | 2007-08-01 | 松下电器产业株式会社 | 音频解码器、方法以及程序 |
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
US7548853B2 (en) | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
CN100561576C (zh) | 2005-10-25 | 2009-11-18 | 芯晟(北京)科技有限公司 | 一种基于量化信号域的立体声及多声道编解码方法与系统 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR101237413B1 (ko) | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
ATE429118T1 (de) * | 2005-12-16 | 2009-05-15 | Dolby Sweden Ab | Vorrichtung zum erzeugen und interpretieren eines datenstroms mit einer reihe von segmenten unter verwendung von daten in nachfolgenden datenrahmen |
US7809018B2 (en) * | 2005-12-16 | 2010-10-05 | Coding Technologies Ab | Apparatus for generating and interpreting a data stream with segments having specified entry points |
CN101136202B (zh) * | 2006-08-29 | 2011-05-11 | 华为技术有限公司 | 音频信号处理系统、方法以及音频信号收发装置 |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
EP2201566B1 (en) * | 2007-09-19 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Joint multi-channel audio encoding/decoding |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
-
2008
- 2008-07-14 KR KR1020080068377A patent/KR101756834B1/ko active Active
-
2009
- 2009-07-14 MY MYPI2011000202A patent/MY154100A/en unknown
- 2009-07-14 WO PCT/KR2009/003870 patent/WO2010008185A2/en active Application Filing
- 2009-07-14 BR BRPI0916449A patent/BRPI0916449A8/pt not_active Application Discontinuation
- 2009-07-14 MX MX2011000557A patent/MX2011000557A/es active IP Right Grant
- 2009-07-14 CN CN201610515415.1A patent/CN105957532B/zh active Active
- 2009-07-14 US US12/502,454 patent/US8532982B2/en active Active
- 2009-07-14 CN CN200980135987.5A patent/CN102150202B/zh active Active
- 2009-07-14 CN CN201610509620.7A patent/CN105913851B/zh active Active
- 2009-07-14 EP EP09798088.2A patent/EP2313888A4/en not_active Withdrawn
- 2009-07-14 JP JP2011518646A patent/JP2011528135A/ja active Pending
-
2011
- 2011-01-13 IL IL210664A patent/IL210664A/en active IP Right Grant
-
2013
- 2013-09-06 US US14/020,006 patent/US9355646B2/en active Active
-
2016
- 2016-05-09 US US15/149,847 patent/US9728196B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20160254005A1 (en) | 2016-09-01 |
CN102150202A (zh) | 2011-08-10 |
US9355646B2 (en) | 2016-05-31 |
CN105957532B (zh) | 2020-04-17 |
CN105913851A (zh) | 2016-08-31 |
CN105957532A (zh) | 2016-09-21 |
WO2010008185A2 (en) | 2010-01-21 |
BRPI0916449A8 (pt) | 2017-11-28 |
US20100010807A1 (en) | 2010-01-14 |
US8532982B2 (en) | 2013-09-10 |
CN105913851B (zh) | 2019-12-24 |
JP2011528135A (ja) | 2011-11-10 |
EP2313888A2 (en) | 2011-04-27 |
US20140012589A1 (en) | 2014-01-09 |
MX2011000557A (es) | 2011-03-15 |
IL210664A0 (en) | 2011-03-31 |
CN102150202B (zh) | 2016-08-03 |
MY154100A (en) | 2015-04-30 |
IL210664A (en) | 2014-07-31 |
US9728196B2 (en) | 2017-08-08 |
KR101756834B1 (ko) | 2017-07-12 |
EP2313888A4 (en) | 2016-08-03 |
WO2010008185A3 (en) | 2010-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101756834B1 (ko) | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 | |
KR101435893B1 (ko) | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 | |
JP5117407B2 (ja) | オーディオ符号化/復号化で知覚的に重み付けするための装置 | |
JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
KR101373004B1 (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
KR101379263B1 (ko) | 대역폭 확장 복호화 방법 및 장치 | |
EP1883067A1 (en) | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream | |
JP2001522156A (ja) | オーディオ信号をコーディングする方法及び装置並びにビットストリームをデコーディングする方法及び装置 | |
EP2041745A1 (en) | Adaptive encoding and decoding methods and apparatuses | |
US9454972B2 (en) | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech | |
KR100721537B1 (ko) | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 | |
US20130103394A1 (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding | |
KR101847076B1 (ko) | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 | |
KR101449432B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 | |
US20090006081A1 (en) | Method, medium and apparatus for encoding and/or decoding signal | |
KR101457897B1 (ko) | 대역폭 확장 부호화 및 복호화 방법 및 장치 | |
KR20130012972A (ko) | 오디오/스피치 신호 부호화방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20080714 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20130715 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20080714 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20140619 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20141226 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20150629 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20141226 Comment text: Notification of reason for refusal Patent event code: PE06011S01I Patent event date: 20140619 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
PJ0201 | Trial against decision of rejection |
Patent event date: 20150831 Comment text: Request for Trial against Decision on Refusal Patent event code: PJ02012R01D Patent event date: 20150629 Comment text: Decision to Refuse Application Patent event code: PJ02011S01I Appeal kind category: Appeal against decision to decline refusal Decision date: 20170223 Appeal identifier: 2015101005147 Request date: 20150831 |
|
AMND | Amendment | ||
PB0901 | Examination by re-examination before a trial |
Comment text: Amendment to Specification, etc. Patent event date: 20150930 Patent event code: PB09011R02I Comment text: Request for Trial against Decision on Refusal Patent event date: 20150831 Patent event code: PB09011R01I Comment text: Amendment to Specification, etc. Patent event date: 20150226 Patent event code: PB09011R02I Comment text: Amendment to Specification, etc. Patent event date: 20140819 Patent event code: PB09011R02I |
|
B601 | Maintenance of original decision after re-examination before a trial | ||
PB0601 | Maintenance of original decision after re-examination before a trial |
Comment text: Report of Result of Re-examination before a Trial Patent event code: PB06011S01D Patent event date: 20151015 |
|
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2015101005147; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20150831 Effective date: 20170223 |
|
PJ1301 | Trial decision |
Patent event code: PJ13011S01D Patent event date: 20170223 Comment text: Trial Decision on Objection to Decision on Refusal Appeal kind category: Appeal against decision to decline refusal Request date: 20150831 Decision date: 20170223 Appeal identifier: 2015101005147 |
|
PS0901 | Examination by remand of revocation | ||
S901 | Examination by remand of revocation | ||
GRNO | Decision to grant (after opposition) | ||
PS0701 | Decision of registration after remand of revocation |
Patent event date: 20170405 Patent event code: PS07012S01D Comment text: Decision to Grant Registration Patent event date: 20170228 Patent event code: PS07011S01I Comment text: Notice of Trial Decision (Remand of Revocation) |
|
A107 | Divisional application of patent | ||
PA0107 | Divisional application |
Comment text: Divisional Application of Patent Patent event date: 20170704 Patent event code: PA01071R01D |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170705 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170706 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200629 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210629 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220629 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20230629 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240627 Start annual number: 8 End annual number: 8 |