JP5923517B2 - 階層型符号器における改良ステージの改良符号化 - Google Patents
階層型符号器における改良ステージの改良符号化 Download PDFInfo
- Publication number
- JP5923517B2 JP5923517B2 JP2013543859A JP2013543859A JP5923517B2 JP 5923517 B2 JP5923517 B2 JP 5923517B2 JP 2013543859 A JP2013543859 A JP 2013543859A JP 2013543859 A JP2013543859 A JP 2013543859A JP 5923517 B2 JP5923517 B2 JP 5923517B2
- Authority
- JP
- Japan
- Prior art keywords
- stage
- signal
- encoder
- input signal
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 claims description 94
- 238000000034 method Methods 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 241001123248 Arma Species 0.000 claims 1
- 238000007493 shaping process Methods 0.000 description 26
- 238000001914 filtration Methods 0.000 description 12
- 230000006872 improvement Effects 0.000 description 12
- 230000000873 masking effect Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
−“v(n’)”が量子化倍率(quantization scale factor)である量子化された誤差信号の前のサンプル
−“e(n)”と表示される予測誤差信号を獲得するために、入力信号“x(n)”からその予測値
−“B+K”ビットから成る量子化インデックス“IB+K(n)”を与えるために誤差信号“e(n)”を入力として受け取る、誤差信号のための量子化モジュール130“QB+K”とを備える。量子化モジュール“QB+K”は、埋め込みコードタイプの量子化モジュールであり、すなわち、それは、“B”ビットを有する“コア”量子化器と、“コア”量子化器に埋め込まれた“B+k(k=1,...,K)”ビットを有する量子化器を含む。
−“B”ビットの低ビットレートインデックス“IB(n)”を与えるために、インデックス“IB+K(n)”の“K”個の低位のビットを削除するためのモジュール150と、
−出力において、“B”ビットの量子化された誤差信号
−次の時点に対して倍率とも呼ばれるレベル制御パラメータ“v(n)”を与えるために、量子化器及び逆量子化器を適応させるためのモジュール170“QAdapt”と、
−低ビットレートの再構成された信号“rB(n)”を与えるために、予測値
−“B”ビットの量子化された誤差信号
−符号303において、先行する埋め込み符号器のインデックス(IB+k−1)に基づいて現在のステージkのみの絶対再構成レベルを判定することによって、現在の改良ステージkに関する考えられる量子化値
−符号306において、考えられる量子化値のうちの1つに対応する、ステージkに関する量子化インデックス(Ienh B+k(n))、及び量子化信号
−第1の部分“a0x(n)”は、現在の入力“x(n)”のみによって変わる。本明細書において、通常は、そして我々にとって興味がある場合に、“a0=1”である。
−第2の部分“a1x(n−1)+a2x(n−2)+a3x(n−3)+a4x(n−4)”は、過去の入力“x(n−i),i>0”のみによって変わる。それは、従って、以前のサンプルに基づいて“x(n)”の予測を表す線形予測を有する類推による、フィルタ処理の予測部分(predictive part)であると考えられるであろう。
120 減算モジュール
121 逆量子化モジュール
130 量子化モジュール
140 データ伝送路
150 “K”個の低位のビットを削除するためのモジュール
165、175 予測器
180 加算モジュール
210 逆量子化モジュール
220 モードビットレートインジケータ及びセレクタ
230、240 逆量子化器
301 マスキングフィルタ
302 PCM/ADPCM符号化モジュール
303 量子化値の辞書を構成するためのモジュール
306 量子化モジュール
307 改良量子化器
308 ローカル復号化モジュール
310 前処理モジュール
311 重み付けフィルタ“W(z)”
404 予測フィルタ“WPRED(z)”
900 符号器
BM メモリブロック
μP プロセッサ
Claims (8)
- “B”ビットを有するコア符号化ステージと、少なくとも1つの現在の改良符号化ステージkを備える階層型符号器においてデジタル音声入力信号(x(n))を符号化する方法であって、
前記現在のステージkに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックス(IB+k−1)を形成するように連結された量子化インデックスを配信し、
前記方法が、
−前記現在のステージkのみの絶対再構成レベル
−前記考えられる量子化値のうちの1つに対応する、前記ステージkに関する量子化インデックス(Ienh B+k(n))、及び量子化信号
を含むことを特徴とする方法。 - 改良符号化ステージkの前記考えられる量子化値が、更に、適応タイプのコア符号化から生じる倍率及び予測値を含む
ことを特徴とする請求項1に記載の方法。 - 改良符号化ステージkにおいて量子化されるべき修正された入力信号(x''(n))は、適応タイプのコア符号化から生じる予測値が差し引かれた知覚的に重み付けされた入力信号(x’(n))である
ことを特徴とする請求項2に記載の方法。 - 前記知覚の重み付け処理が、ARMAタイプのフィルタを形成する予測フィルタによって実行される
ことを特徴とする請求項1から請求項4のいずれか一項に記載の方法。 - “B”ビットを有するコア符号化ステージと、少なくとも1つの現在の改良符号化ステージkを備える、デジタル音声入力信号(x(n))の階層型符号器であって、
前記現在のステージkに先行する前記コア符号化ステージ及び前記改良符号化ステージが、先行する埋め込み符号器のインデックス(IB+k−1)を形成するように連結された量子化インデックスを配信し、
前記符号器が、
−前記先行する埋め込み符号器のインデックス(IB+k−1)に基づいて前記現在のステージkのみの絶対再構成レベルを判定することによって、前記現在の改良符号化ステージkに関する考えられる量子化値
−前記考えられる量子化値のうちの1つに対応する、前記ステージkに関する量子化インデックス(Ienh B+k(n))、及び量子化信号
備えることを特徴とする階層型符号器。 - プロセッサによって実行される場合に請求項1から請求項5のいずれか一項に記載の符号化方法のステップを実施するためのコード命令を含むコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1060631 | 2010-12-16 | ||
FR1060631A FR2969360A1 (fr) | 2010-12-16 | 2010-12-16 | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
PCT/FR2011/052959 WO2012080649A1 (fr) | 2010-12-16 | 2011-12-13 | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014501395A JP2014501395A (ja) | 2014-01-20 |
JP5923517B2 true JP5923517B2 (ja) | 2016-05-24 |
Family
ID=44356295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013543859A Expired - Fee Related JP5923517B2 (ja) | 2010-12-16 | 2011-12-13 | 階層型符号器における改良ステージの改良符号化 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20130268268A1 (ja) |
EP (1) | EP2652735B1 (ja) |
JP (1) | JP5923517B2 (ja) |
KR (1) | KR20140005201A (ja) |
CN (1) | CN103370740B (ja) |
FR (1) | FR2969360A1 (ja) |
WO (1) | WO2012080649A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
EP2980793A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
CN105679312B (zh) * | 2016-03-04 | 2019-09-10 | 重庆邮电大学 | 一种噪声环境下声纹识别的语音特征处理方法 |
WO2020086067A1 (en) * | 2018-10-23 | 2020-04-30 | Nine Energy Service | Multi-service mobile platform for well servicing |
CN118471203B (zh) * | 2024-07-11 | 2024-10-08 | 广汽埃安新能源汽车股份有限公司 | 一种车载语音识别方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
KR101366124B1 (ko) * | 2006-02-14 | 2014-02-21 | 오렌지 | 오디오 인코딩/디코딩에서의 인지 가중 장치 |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
US8719012B2 (en) * | 2007-06-15 | 2014-05-06 | Orange | Methods and apparatus for coding digital audio signals using a filtered quantizing noise |
US8577687B2 (en) * | 2007-07-06 | 2013-11-05 | France Telecom | Hierarchical coding of digital audio signals |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
FR2938688A1 (fr) | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
CA2777601C (en) * | 2009-10-15 | 2016-06-21 | Widex A/S | A hearing aid with audio codec and method |
FR2960335A1 (fr) * | 2010-05-18 | 2011-11-25 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
FR2981781A1 (fr) * | 2011-10-19 | 2013-04-26 | France Telecom | Codage hierarchique perfectionne |
-
2010
- 2010-12-16 FR FR1060631A patent/FR2969360A1/fr not_active Withdrawn
-
2011
- 2011-12-13 WO PCT/FR2011/052959 patent/WO2012080649A1/fr active Application Filing
- 2011-12-13 KR KR20137018623A patent/KR20140005201A/ko not_active Ceased
- 2011-12-13 US US13/995,014 patent/US20130268268A1/en not_active Abandoned
- 2011-12-13 CN CN201180067643.2A patent/CN103370740B/zh not_active Expired - Fee Related
- 2011-12-13 JP JP2013543859A patent/JP5923517B2/ja not_active Expired - Fee Related
- 2011-12-13 EP EP11811097.2A patent/EP2652735B1/fr not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
KR20140005201A (ko) | 2014-01-14 |
US20130268268A1 (en) | 2013-10-10 |
EP2652735B1 (fr) | 2015-08-19 |
CN103370740A (zh) | 2013-10-23 |
WO2012080649A1 (fr) | 2012-06-21 |
EP2652735A1 (fr) | 2013-10-23 |
CN103370740B (zh) | 2015-09-30 |
JP2014501395A (ja) | 2014-01-20 |
FR2969360A1 (fr) | 2012-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5474088B2 (ja) | スケーラブルエンコーダでのノイズ変換を伴う音声デジタル信号の符号化 | |
JP5161212B2 (ja) | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 | |
JP5143193B2 (ja) | スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法 | |
JP4394578B2 (ja) | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 | |
RU2752127C2 (ru) | Усовершенствованный квантователь | |
NO341186B1 (no) | Selektiv anvendelse ved bruk av flere entropimodeller i adaptiv koding og dekoding | |
WO2008072670A1 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
JP2011527441A (ja) | スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法 | |
CA2578610A1 (en) | Voice encoding device, voice decoding device, and methods therefor | |
JP7104749B2 (ja) | 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム | |
JP5923517B2 (ja) | 階層型符号器における改良ステージの改良符号化 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
CN1989546B (zh) | 语音编码装置和语音编码方法 | |
JP2010532489A (ja) | デジタルオーディオ信号の符号化 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP4525693B2 (ja) | 音声符号化装置および音声復号化装置 | |
JP4525694B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5923517 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |