JP4259401B2 - 音声処理装置及び音声符号化方法 - Google Patents
音声処理装置及び音声符号化方法 Download PDFInfo
- Publication number
- JP4259401B2 JP4259401B2 JP2004164511A JP2004164511A JP4259401B2 JP 4259401 B2 JP4259401 B2 JP 4259401B2 JP 2004164511 A JP2004164511 A JP 2004164511A JP 2004164511 A JP2004164511 A JP 2004164511A JP 4259401 B2 JP4259401 B2 JP 4259401B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- frequency
- unit
- frequency component
- data amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 58
- 230000005236 sound signal Effects 0.000 claims description 104
- 239000013598 vector Substances 0.000 claims description 70
- 238000012217 deletion Methods 0.000 claims description 61
- 230000037430 deletion Effects 0.000 claims description 61
- 238000006243 chemical reaction Methods 0.000 claims description 32
- 238000013139 quantization Methods 0.000 claims description 30
- 238000009432 framing Methods 0.000 claims description 13
- 238000007906 compression Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 10
- 230000008707 rearrangement Effects 0.000 description 6
- 230000001629 suppression Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
まず、本実施形態における構成について説明する。
以下では、本実施形態で適用されるエントロピー符号化の例として、ハフマン符号化、レンジコーダによる符号化について説明する。
ハフマン符号化とは、出現頻度の高い記号には短い符号を割り当て、出現頻度の低い記号には長い符号を割り当てることで、全体のデータ量を圧縮する方式である。例えば、4つの記号{a、b、c、d}からなる100文字のデータがあったとする。全ての記号に同じ長さの2進数の符号(固定長符号)を割り当てる場合、4つの記号を表すには2ビットが必要であるため、100文字のデータ量は、2[bit]×100=200[bit]となる。
符号化前の元信号に含まれる記号の集合をS={si|i=1,…,n}とし、各記号siの出現確率をpiとする。また、元信号に含まれる各記号siを予め決められた順番に並べ替えた記号列{s1、s2、…、sn}において、記号sk(k≧2)より前に並んでいる各記号の出現確率の合計をGkとする。即ち、Gkは、式(6)のように表される。
range'=range×pk (7)
low'=low+range×Gk (8)
式(7)及び式(8)で算出されたrange'、low'が、次の信号が入力されたときのrange、lowとなる。
gk'=gk+1 (12−1)
エントロピー符号化部8は、出現確率gkの加算に伴い、cum、出現確率pi、Giを再計算し、生起確率テーブル81を更新する。エントロピー符号化部8は、これらの処理を、入力信号がなくなるまで行い、最後の信号が入力されたときに算出されたrange、lowに基づいて決定される範囲low〜low+rangeの間の値を符号値として出力する。
まず、図9のフローチャートを参照して、音声処理装置100において実行される音声圧縮処理について説明する。
max=MAX(|Fi|) i=0,…,N-1 (17)
ここで、MAXは最大値をとる関数である。式(17)に示す最大値maxに、予め設定された倍率rを乗算した値をP(P=r・max)として設定することができる。この倍率rは、例えば、0.1の値をとる。
2 DC除去部
3 フレーム化部
4 レベル調整部
5 周波数変化部
6 周波数並べ替え部
7 ベクトル量子化部
7a 高域用VQテーブル
7b 低域用VQテーブル
8 エントロピー符号化部
81 生起確率テーブル
9 レートコントローラ(判定部)
10 データ削除部
100 音声処理装置
Claims (9)
- 入力された音声信号をフレームに分割するフレーム化部と、
前記フレーム化部により得られたフレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整するレベル調整部と、
前記レベル調整部によりレベルが調整された音声信号に対し、周波数変換を施す周波数変換部と、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施すベクトル量子化部と、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施すエントロピー符号化部と、
前記エントロピー符号化部により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定する判定部と、
前記判定部により、前記エントロピー符号化部により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化された音声信号の中から、エネルギーが最小の帯域の周波数成分を削除する第1の削除処理と、周波数軸上で隣り合う周波数成分が0で、かつ振幅値の絶対値が所定値より大きい周波数成分を削除する第2の削除処理を行うデータ削除部と、
前記データ削除部でデータ削除された音声信号について再度エントロピー符号化し、符号化された音声信号のデータ量が前記目標データ量に収まるまで前記削除処理と符号化処理を行わせるコントロール部と、
を備えることを特徴とする音声処理装置。 - 前記データ削除部の第2の削除処理において、前記所定値は全周波数成分の振幅値の最大値から算出される値であることを特徴とする請求項1に記載の音声処理装置。
- 前記データ削除部は、前記周波数変換部により得られた音声信号の高周波成分の値が低周波成分の値より大きいか否かを判定し、当該音声信号の高周波成分の値が低周波成分の値以下であると判定された場合に、周波数軸上で予め設定された周波数間隔以上離れて存在する高周波成分を削除するとともに、前記第2の削除処理を実行することを特徴とする請求項1または2に記載の音声処理装置。
- 入力された音声信号をフレームに分割するフレーム化部と、
前記フレーム化部により得られたフレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整するレベル調整部と、
前記レベル調整部によりレベルが調整された音声信号に対し、周波数変換を施す周波数変換部と、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施すベクトル量子化部と、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施すエントロピー符号化部と、
前記エントロピー符号化部により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定する判定部と、
前記判定部により、前記エントロピー符号化部により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化された音声信号の中から、エネルギーが最小の帯域の周波数成分を削除する第1の削除処理と、周波数軸上で予め設定された周波数間隔以上離れて存在する周波数成分を削除する第2の削除処理を行うデータ削除部と、
前記データ削除部でデータ削除された音声信号について再度エントロピー符号化し、符号化された音声信号のデータ量が前記目標データ量に収まるまで前記削除処理と符号化処理を行わせるコントロール部と、
を備えることを特徴とする音声処理装置。 - 前記データ削除部は、前記周波数変換部により得られた音声信号の高周波成分の値が低周波成分の値より大きいか否かを判定し、当該音声信号の高周波成分の値が低周波成分の値以下であると判定された場合に、当該高周波成分の中から、周波数軸上で予め設定された周波数間隔以上離れて存在する周波数成分を削除することを特徴とする請求項4に記載の音声処理装置。
- 前記データ削除部は、前記周波数変換部により得られた音声信号における各周波数成分の対数を演算し、高周波成分における対数の和と、低周波成分における対数の和を比較することによって、当該音声信号の高周波成分の値が低周波成分の値より大きいか否かを判定することを特徴とする請求項3又は5に記載の音声処理装置。
- 前記データ削除部は、前記レベル調整部によりレベルが調整された音声信号を、高域通過フィルタと低域通過フィルタにより高周波成分と低周波成分に分離し、当該高域通過フィルタと低域通過フィルタにより得られた高周波成分の値が低周波成分の値より大きいか否かを判定することを特徴とする請求項3又は5に記載の音声処理装置。
- 入力された音声信号をフレームに分割し、
フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整し、
レベルが調整された音声信号に対し、周波数変換を施し、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施し、
前記エントロピー符号化により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定し、
前記エントロピー符号化により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化された音声信号の中から、エネルギーが最小の帯域の周波数成分を削除し、周波数軸上で隣り合う周波数成分が0で、かつ振幅値の絶対値が所定値より大きい周波数成分を削除し、
前記データ削除された音声信号について再度エントロピー符号化し、符号化された音声信号のデータ量が前記目標データ量に収まるまで前記削除処理と符号化処理を行わせることを特徴とする音声符号化方法。 - 入力された音声信号をフレームに分割し、
フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整し、
レベルが調整された音声信号に対し、周波数変換を施し、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施し、
前記エントロピー符号化により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定し、
前記エントロピー符号化により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化された音声信号の中から、エネルギーが最小の帯域の周波数成分を削除し、周波数軸上で予め設定された周波数間隔以上離れて存在する周波数成分を削除し、
前記データ削除された音声信号について再度エントロピー符号化し、符号化された音声信号のデータ量が前記目標データ量に収まるまで前記削除処理と符号化処理を行わせることを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004164511A JP4259401B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004164511A JP4259401B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005345707A JP2005345707A (ja) | 2005-12-15 |
JP4259401B2 true JP4259401B2 (ja) | 2009-04-30 |
Family
ID=35498161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004164511A Expired - Lifetime JP4259401B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4259401B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1866915B1 (en) * | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
ES2705589T3 (es) | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
JP4978539B2 (ja) * | 2008-04-07 | 2012-07-18 | カシオ計算機株式会社 | 符号化装置、符号化方法及びプログラム。 |
CN112185390B (zh) * | 2020-09-27 | 2023-10-03 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 机上信息辅助方法及装置 |
CN115171721B (zh) * | 2022-07-03 | 2023-10-17 | 北京星汉博纳医药科技有限公司 | 一种音频数据切片识别处理方法 |
-
2004
- 2004-06-02 JP JP2004164511A patent/JP4259401B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005345707A (ja) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
US5206884A (en) | Transform domain quantization technique for adaptive predictive coding | |
KR100840439B1 (ko) | 음성부호화장치 및 음성복호장치 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3434260B2 (ja) | オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体 | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
JP4259401B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP3255022B2 (ja) | 適応変換符号化方式および適応変換復号方式 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2914549B2 (ja) | 画像符号化方法 | |
JP4009781B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP5539992B2 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
JP3150475B2 (ja) | 量子化方法 | |
JP4054919B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP2523286B2 (ja) | 音声符号化及び復号化方法 | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2005128401A (ja) | 音声処理装置及び音声符号化方法 | |
JP2006126592A (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
JP3747357B2 (ja) | 楽音信号の符号化装置及び復号化装置 | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP2002141805A (ja) | 符号化器および通信デバイス | |
JPWO2010067800A1 (ja) | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 | |
JP6712643B2 (ja) | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4259401 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
EXPY | Cancellation because of completion of term |