KR101871644B1 - 적응적 대역폭 확장 및 그것을 위한 장치 - Google Patents
적응적 대역폭 확장 및 그것을 위한 장치 Download PDFInfo
- Publication number
- KR101871644B1 KR101871644B1 KR1020177027672A KR20177027672A KR101871644B1 KR 101871644 B1 KR101871644 B1 KR 101871644B1 KR 1020177027672 A KR1020177027672 A KR 1020177027672A KR 20177027672 A KR20177027672 A KR 20177027672A KR 101871644 B1 KR101871644 B1 KR 101871644B1
- Authority
- KR
- South Korea
- Prior art keywords
- band
- highband
- low
- audio signal
- excitation spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 1은 종래의 CELP 인코더를 이용하여 원래 스피치의 인코딩 동안 수행되는 동작들을 도해한다.
도 2는 아래에 더 기술되는 바와 같이 본 발명의 실시예들의 구현 시에 CELP 디코더를 이용하여 원래 스피치의 디코딩 동안 수행되는 동작들을 도해한다.
도 3은 종래의 CELP 인코더에서 원래 스피치의 인코딩 동안 수행되는 동작들을 도해한다.
도 4는 아래에 기술되는 바와 같이 본 발명의 실시예들의 구현 시에 도 5의 인코더에 대응하는 기본 CELP 디코더를 도해한다.
도 5a와 도 5b는 대역 폭 확장(BWE)을 이용하는 인코딩/디코딩의 예를 도해하며, 도 5a는 BWE 사이드 정보를 이용하는 인코더에서의 동작들을 도해하는 반면에, 도 5b는 BWE를 이용하는 디코더에서의 동작들을 도해한다.
도 6a와 도 6b는 사이드 정보를 전송하지 않고 BWE를 이용하는 인코딩/디코딩의 다른 예를 도해하며, 도 6a는 인코더에서 동안의 동작들을 도해하는 반면에, 도 6b는 디코더에서의 동작들을 도해한다.
도 7은 CELP 타입의 코덱이 이용될 때 유성 스피치 또는 고조파 음악에 대한 이상적인 여기 스펙트럼의 예를 도해한다.
도 8은 CELP 타입의 코덱이 이용될 때 유성 스피치 또는 고조파 음악에 대한 디코딩된 여기 스펙트럼의 종래의 대역폭 확장의 예를 도해한다.
도 9는 CELP 타입의 코덱이 이용될 때 유성 스피치 또는 고조파 음악에 대한 디코딩된 여기 스펙트럼에 본 발명의 실시예의 대역폭 확장이 적용되는 예를 도해한다.
도 10은 BWE를 위해 서브대역 시프팅 또는 카피를 구현하는 본 발명의 실시예들에 따른 디코더에서의 동작들을 도해한다.
도 11은 BWE를 위해 서브대역 시프팅 또는 카피를 구현하는 디코더의 대안적인 실시예를 도해한다.
도 12는 본 발명의 실시예들에 따른 디코더에서 수행되는 동작들을 도해한다.
도 13a와 도 13b는 본 발명의 실시예들에 따른 대역 폭 확장을 구현하는 디코더를 도해한다.
도 14는 본 발명의 실시예에 따른 통신 시스템을 도해한다.
도 15는 본 명세서에 개시된 디바이스들 및 방법들을 구현하기 위해 이용될 수 있는 처리 시스템의 블록도를 도해한다.
Claims (24)
- 인코딩된 오디오 비트스트림을 디코딩하는 방법으로서:
상기 오디오 비트스트림을 디코딩하여, 디코딩된 저대역 오디오 신호를 생성하고 저주파수 대역에 대응하는 저대역 여기 스펙트럼을 생성하는 단계;
상기 디코딩된 저대역 오디오 신호의 스펙트럼 포락선의 에너지 정보를 나타내는 파라미터를 이용하여 상기 저주파수 대역 내로부터 서브대역 영역을 선택하는 단계 - 선택된 서브대역 영역의 시작 포인트는 검색 범위 내의 가장 높은 스펙트럼 포먼트 에너지에 대응하고, 상기 검색 범위는 상기 저주파수 대역 내의 주파수 범위임 -; 및
상기 선택된 서브대역 영역으로부터의 서브대역 여기 스펙트럼을, 고주파수 대역 내의 고 서브대역 영역에 복사함으로써(copying), 고대역 여기 스펙트럼을 생성하는 단계
를 포함하는 방법. - 제1항에 있어서, 상기 스펙트럼 포락선의 에너지 정보를 나타내는 상기 파라미터는 상기 스펙트럼 포락선의 가장 높은 에너지 또는 스펙트럼 포먼트 피크를 반영하는 파라미터를 포함하는 방법.
- 제1항에 있어서, 상기 검색 범위는 코덱 비트 레이트에 의존하는 방법.
- 제3항에 있어서,
확장된 고대역 오디오 신호를 획득하기 위해서 고대역 스펙트럼 포락선을 나타내는 고대역 필터를 사용하여 상기 고대역 여기 스펙트럼을 필터링하는 단계
를 더 포함하는 방법. - 제4항에 있어서,
상기 확장된 고대역 오디오 신호를 상기 디코딩된 저대역 오디오 신호에 부가하여 확장된 주파수 대역폭을 갖는 오디오 출력 신호를 생성하는 단계
를 더 포함하는 방법. - 인코딩된 오디오 비트스트림을 디코딩하는 방법으로서:
상기 오디오 비트스트림을 디코딩하여, 디코딩된 저대역 오디오 신호를 생성하고 저주파수 대역에 대응하는 저대역 여기 스펙트럼을 생성하는 단계;
상기 디코딩된 저대역 오디오 신호의 스펙트럼 포락선의 에너지 정보를 나타내는 파라미터를 이용하여 상기 저주파수 대역 내의 주파수 범위 내의 서브대역 영역을 결정하는 단계 - 상기 서브대역 영역은 상기 주파수 범위 내의 상기 스펙트럼 포락선의 가장 높은 스펙트럼 피크 부근에 위치함 -; 및
상기 결정된 서브대역 영역으로부터의 서브대역 여기 스펙트럼을 고주파수 대역에 복사함으로써, 상기 고주파수 대역에 대한 고대역 여기 스펙트럼을 생성하는 단계
를 포함하는 방법. - 제6항에 있어서, 상기 서브대역 영역은 상기 주파수 범위 내의 상기 스펙트럼 포락선의 최고 에너지 포인트를 검색함으로써 결정되는 방법.
- 제6항에 있어서, 상기 파라미터는 상기 스펙트럼 포락선의 가장 높은 에너지 또는 포먼트를 반영하는 방법.
- 제6항 내지 제8항 중 어느 한 항에 있어서, 상기 주파수 범위는 코덱 비트 레이트에 의존하는 방법.
- 제9항에 있어서,
확장된 고대역 오디오 신호를 획득하기 위해서 고대역 스펙트럼 포락선을 나타내는 고대역 필터를 사용하여 상기 고대역 여기 스펙트럼을 필터링하는 단계
를 더 포함하는 방법. - 스피치 처리를 위한 장치로서:
프로세서; 및
명령어들을 저장하는 컴퓨터 판독 가능 저장 매체
를 포함하고,
상기 명령어들은 상기 프로세서에 의해 실행될 때 상기 프로세서로 하여금:
오디오 비트스트림을 디코딩하여, 디코딩된 저대역 오디오 신호를 생성하고 저주파수 대역에 대응하는 저대역 여기 스펙트럼을 생성하게 하고;
상기 디코딩된 저대역 오디오 신호의 스펙트럼 포락선의 에너지 정보를 나타내는 파라미터를 이용하여 상기 저주파수 대역 내로부터 서브대역 영역을 선택하게 하고 - 선택된 서브대역 영역의 시작 포인트는 검색 범위 내의 가장 높은 스펙트럼 포락선 에너지에 대응하고, 상기 검색 범위는 상기 저주파수 대역 내의 주파수 범위임 -;
상기 선택된 서브대역 영역으로부터의 서브대역 여기 스펙트럼을, 고주파수 대역 내의 고 서브대역 영역에 복사함으로써, 고대역 여기 스펙트럼을 생성하게 하는
장치. - 제11항에 있어서, 상기 스펙트럼 포락선의 에너지 정보를 나타내는 상기 파라미터는 상기 스펙트럼 포락선의 가장 높은 에너지 또는 스펙트럼 포먼트 피크를 반영하는 파라미터를 포함하는 장치.
- 제11항 또는 제12항에 있어서, 상기 검색 범위는 코덱 비트 레이트에 의존하는 장치.
- 제13항에 있어서,
상기 프로세서는 또한, 확장된 고대역 오디오 신호를 획득하기 위해서 고대역 스펙트럼 포락선을 나타내는 고대역 필터를 사용하여 상기 고대역 여기 스펙트럼을 필터링하도록 구성되는 장치. - 제14항에 있어서,
상기 프로세서는 또한, 상기 확장된 고대역 오디오 신호를 상기 디코딩된 저대역 오디오 신호에 부가하여 확장된 주파수 대역폭을 갖는 오디오 출력 신호를 생성하도록 구성되는 장치. - 스피치 처리를 위한 장치로서:
프로세서; 및
명령어들을 저장하는 컴퓨터 판독 가능 저장 매체
를 포함하고,
상기 명령어들은 상기 프로세서에 의해 실행될 때 상기 프로세서로 하여금:
오디오 비트스트림을 디코딩하여, 디코딩된 저대역 오디오 신호를 생성하고 저주파수 대역에 대응하는 저대역 여기 스펙트럼을 생성하게 하고;
상기 디코딩된 저대역 오디오 신호의 스펙트럼 포락선의 에너지 정보를 나타내는 파라미터를 이용하여 상기 저주파수 대역 내의 주파수 범위 내의 서브대역 영역을 결정하게 하고 - 상기 서브대역 영역은 상기 주파수 범위 내의 상기 스펙트럼 포락선의 가장 높은 스펙트럼 피크 부근에 위치함 -;
상기 결정된 서브대역 영역으로부터의 서브대역 여기 스펙트럼을 고주파수 대역에 복사함으로써, 상기 고주파수 대역에 대한 고대역 여기 스펙트럼을 생성하게 하는
장치. - 제16항에 있어서, 상기 파라미터는 상기 스펙트럼 포락선의 가장 높은 에너지 또는 포먼트를 반영하는 장치.
- 제16항 또는 제17항에 있어서, 상기 주파수 범위는 코덱 비트 레이트에 의존하는 장치.
- 제18항에 있어서,
상기 프로세서는 또한, 확장된 고대역 오디오 신호를 획득하기 위해서 고대역 스펙트럼 포락선을 나타내는 고대역 필터를 사용하여 상기 고대역 여기 스펙트럼을 필터링하도록 구성되는 장치. - 적어도 하나의 프로세서에 의해 실행될 때, 상기 프로세서로 하여금 제1항 내지 제6항 중 어느 한 항에 따른 동작들을 수행하도록 하는 명령어들이 저장된 비일시적 저장 매체.
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361875690P | 2013-09-10 | 2013-09-10 | |
US61/875,690 | 2013-09-10 | ||
US14/478,839 | 2014-09-05 | ||
US14/478,839 US9666202B2 (en) | 2013-09-10 | 2014-09-05 | Adaptive bandwidth extension and apparatus for the same |
PCT/CN2014/086135 WO2015035896A1 (en) | 2013-09-10 | 2014-09-09 | Adaptive bandwidth extension and apparatus for the same |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167008694A Division KR101785885B1 (ko) | 2013-09-10 | 2014-09-09 | 적응적 대역폭 확장 및 그것을 위한 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170117207A KR20170117207A (ko) | 2017-10-20 |
KR101871644B1 true KR101871644B1 (ko) | 2018-06-26 |
Family
ID=52626402
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167008694A Active KR101785885B1 (ko) | 2013-09-10 | 2014-09-09 | 적응적 대역폭 확장 및 그것을 위한 장치 |
KR1020177027672A Active KR101871644B1 (ko) | 2013-09-10 | 2014-09-09 | 적응적 대역폭 확장 및 그것을 위한 장치 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167008694A Active KR101785885B1 (ko) | 2013-09-10 | 2014-09-09 | 적응적 대역폭 확장 및 그것을 위한 장치 |
Country Status (15)
Country | Link |
---|---|
US (2) | US9666202B2 (ko) |
EP (4) | EP4546337A3 (ko) |
JP (1) | JP6336086B2 (ko) |
KR (2) | KR101785885B1 (ko) |
CN (2) | CN107393552B (ko) |
AU (1) | AU2014320881B2 (ko) |
BR (1) | BR112016005111B1 (ko) |
CA (1) | CA2923218C (ko) |
ES (2) | ES3020834T3 (ko) |
MX (1) | MX356721B (ko) |
MY (1) | MY192508A (ko) |
PL (1) | PL3301674T3 (ko) |
RU (1) | RU2641224C2 (ko) |
SG (1) | SG11201601637PA (ko) |
WO (1) | WO2015035896A1 (ko) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2908550C (en) * | 2008-12-15 | 2018-02-13 | Frederik Nagel | Audio encoder and bandwidth extension decoder |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP3115991A4 (en) * | 2014-03-03 | 2017-08-02 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
KR101701623B1 (ko) * | 2015-07-09 | 2017-02-13 | 라인 가부시키가이샤 | VoIP 통화음성 대역폭 감소를 은닉하는 시스템 및 방법 |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
CN106057220B (zh) * | 2016-05-19 | 2020-01-03 | Tcl集团股份有限公司 | 一种音频信号的高频扩展方法和音频播放器 |
KR102494080B1 (ko) | 2016-06-01 | 2023-02-01 | 삼성전자 주식회사 | 전자 장치 및 전자 장치의 사운드 신호 보정 방법 |
EP3497697B1 (en) * | 2016-11-04 | 2024-01-31 | Hewlett-Packard Development Company, L.P. | Dominant frequency processing of audio signals |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
US10681486B2 (en) * | 2017-10-18 | 2020-06-09 | Htc Corporation | Method, electronic device and recording medium for obtaining Hi-Res audio transfer information |
CN107886966A (zh) * | 2017-10-30 | 2018-04-06 | 捷开通讯(深圳)有限公司 | 终端及其优化语音命令的方法、存储装置 |
CN107863095A (zh) * | 2017-11-21 | 2018-03-30 | 广州酷狗计算机科技有限公司 | 音频信号处理方法、装置和存储介质 |
TW202516497A (zh) * | 2018-01-26 | 2025-04-16 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
CN110232909B (zh) * | 2018-03-02 | 2024-07-23 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
CN110660402B (zh) | 2018-06-29 | 2022-03-29 | 华为技术有限公司 | 立体声信号编码过程中确定加权系数的方法和装置 |
CN110556122B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
CN113470667B (zh) * | 2020-03-11 | 2024-09-27 | 腾讯科技(深圳)有限公司 | 语音信号的编解码方法、装置、电子设备及存储介质 |
CN112201261B (zh) * | 2020-09-08 | 2024-05-03 | 厦门亿联网络技术股份有限公司 | 基于线性滤波的频带扩展方法、装置及会议终端系统 |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN114999503B (zh) * | 2022-05-23 | 2024-08-27 | 北京百瑞互联技术股份有限公司 | 一种基于生成对抗网络的全带宽谱系数生成方法及系统 |
CN118215959B (zh) * | 2022-09-05 | 2025-05-13 | 北京小米移动软件有限公司 | 一种音频信号频带扩展方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010044722A1 (en) * | 2000-01-28 | 2001-11-22 | Harald Gustafsson | System and method for modifying speech signals |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6070236A (en) * | 1996-12-19 | 2000-05-30 | Deutsche Thomson-Brandt Gmbh | Apparatus for processing a sequence of control commands as well as a method for generating a sequence of control commands, and storage medium for storing control commands |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
US7461003B1 (en) * | 2003-10-22 | 2008-12-02 | Tellabs Operations, Inc. | Methods and apparatus for improving the quality of speech signals |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
WO2007037361A1 (ja) | 2005-09-30 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
CN101089951B (zh) | 2006-06-16 | 2011-08-31 | 北京天籁传音数字技术有限公司 | 频带扩展编码方法及装置和解码方法及装置 |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
EP2220646A1 (en) * | 2007-11-06 | 2010-08-25 | Nokia Corporation | Audio coding apparatus and method thereof |
AU2008326957B2 (en) | 2007-11-21 | 2011-06-30 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR100970446B1 (ko) * | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
RU2455709C2 (ru) * | 2008-03-03 | 2012-07-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки аудиосигнала |
KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
JP5369180B2 (ja) * | 2008-07-11 | 2013-12-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
PL2304723T3 (pl) * | 2008-07-11 | 2013-03-29 | Fraunhofer Ges Forschung | Urządzenie i sposób dekodowania zakodowanego sygnału audio |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2301011T3 (pl) * | 2008-07-11 | 2019-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób i dyskryminator do klasyfikacji różnych segmentów sygnału audio zawierającego segmenty mowy i muzyki |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
CN102144259B (zh) * | 2008-07-11 | 2015-01-07 | 弗劳恩霍夫应用研究促进协会 | 用于产生带宽扩展输出数据的装置和方法 |
EP2146344B1 (en) * | 2008-07-17 | 2016-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding/decoding scheme having a switchable bypass |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
CN101770776B (zh) * | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
CN102044250B (zh) | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
JP2011209548A (ja) * | 2010-03-30 | 2011-10-20 | Nippon Logics Kk | 帯域拡張装置 |
DK2375782T3 (en) * | 2010-04-09 | 2019-03-18 | Oticon As | Improvements in sound perception by using frequency transposing by moving the envelope |
WO2011127832A1 (en) * | 2010-04-14 | 2011-10-20 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
CA3124114C (en) * | 2010-07-02 | 2022-07-05 | Dolby International Ab | Audio decoding with selective post filtering |
EP3285258B1 (en) * | 2010-07-19 | 2018-12-19 | Dolby International AB | Processing of audio signals during high frequency reconstruction |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8937382B2 (en) | 2011-06-27 | 2015-01-20 | Intel Corporation | Secondary device integration into coreless microelectronic device packages |
JP5470342B2 (ja) * | 2011-08-11 | 2014-04-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
JP6010539B2 (ja) * | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
MX2014004670A (es) * | 2011-11-02 | 2014-05-28 | Ericsson Telefon Ab L M | Generacion de extension de banda superior de una señal de audio extendida en ancho de banda. |
HUE028238T2 (en) * | 2012-03-29 | 2016-12-28 | ERICSSON TELEFON AB L M (publ) | Extend the bandwidth of a harmonic audio signal |
US20130332171A1 (en) * | 2012-06-12 | 2013-12-12 | Carlos Avendano | Bandwidth Extension via Constrained Synthesis |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
-
2014
- 2014-09-05 US US14/478,839 patent/US9666202B2/en active Active
- 2014-09-09 BR BR112016005111-4A patent/BR112016005111B1/pt active IP Right Grant
- 2014-09-09 KR KR1020167008694A patent/KR101785885B1/ko active Active
- 2014-09-09 MX MX2016003074A patent/MX356721B/es active IP Right Grant
- 2014-09-09 EP EP24219925.5A patent/EP4546337A3/en active Pending
- 2014-09-09 EP EP14844454.0A patent/EP3039676B1/en active Active
- 2014-09-09 MY MYPI2016700813A patent/MY192508A/en unknown
- 2014-09-09 AU AU2014320881A patent/AU2014320881B2/en active Active
- 2014-09-09 EP EP23168838.3A patent/EP4258261B1/en active Active
- 2014-09-09 PL PL17186095.0T patent/PL3301674T3/pl unknown
- 2014-09-09 RU RU2016113288A patent/RU2641224C2/ru active
- 2014-09-09 KR KR1020177027672A patent/KR101871644B1/ko active Active
- 2014-09-09 EP EP17186095.0A patent/EP3301674B1/en active Active
- 2014-09-09 ES ES23168838T patent/ES3020834T3/es active Active
- 2014-09-09 WO PCT/CN2014/086135 patent/WO2015035896A1/en active Application Filing
- 2014-09-09 JP JP2016541789A patent/JP6336086B2/ja active Active
- 2014-09-09 CN CN201710662896.3A patent/CN107393552B/zh active Active
- 2014-09-09 CA CA2923218A patent/CA2923218C/en active Active
- 2014-09-09 SG SG11201601637PA patent/SG11201601637PA/en unknown
- 2014-09-09 CN CN201480047702.3A patent/CN105637583B/zh active Active
- 2014-09-09 ES ES14844454.0T patent/ES2644967T3/es active Active
-
2017
- 2017-04-19 US US15/491,181 patent/US10249313B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010044722A1 (en) * | 2000-01-28 | 2001-11-22 | Harald Gustafsson | System and method for modifying speech signals |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
Non-Patent Citations (2)
Title |
---|
Bernd Geiser, et al. Bandwidth extension for hierarchical speech and audio coding in ITU-T Rec. G. 729.1. IEEE Transactions on Audio, Speech, and Language Processing, 2007, Vol.15,No.8, pp.2496-2509. |
Ulrich Kornagel. Techniques for artificial bandwidth extension of telephone speech. Signal Processing, 2006.06.01, Vol.86, no.6, pp.1296-1306. |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101871644B1 (ko) | 적응적 대역폭 확장 및 그것을 위한 장치 | |
US10885926B2 (en) | Classification between time-domain coding and frequency domain coding for high bit rates | |
JP6470857B2 (ja) | 音声処理のための無声/有声判定 | |
HK1240702A1 (en) | Adaptive bandwidth extension and apparatus for the same | |
HK1220541B (en) | Adaptive bandwidth extension and apparatus for the same | |
HK1240702B (zh) | 自適應帶寬擴展方法及其裝置 | |
HK40001217A (en) | Improving classification between time-domain coding and frequency domain coding | |
HK40001217B (en) | Improving classification between time-domain coding and frequency domain coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20170928 Application number text: 1020167008694 Filing date: 20160401 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20171212 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20180528 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180620 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20180620 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20210517 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240522 Start annual number: 7 End annual number: 7 |