JP4218134B2 - 復号装置及び方法、並びにプログラム提供媒体 - Google Patents
復号装置及び方法、並びにプログラム提供媒体 Download PDFInfo
- Publication number
- JP4218134B2 JP4218134B2 JP17057499A JP17057499A JP4218134B2 JP 4218134 B2 JP4218134 B2 JP 4218134B2 JP 17057499 A JP17057499 A JP 17057499A JP 17057499 A JP17057499 A JP 17057499A JP 4218134 B2 JP4218134 B2 JP 4218134B2
- Authority
- JP
- Japan
- Prior art keywords
- bit
- class
- error
- bits
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0059—Convolutional codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/03—Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
- H03M13/23—Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using convolutional codes, e.g. unit memory codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0041—Arrangements at the transmitter end
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0045—Arrangements at the receiver end
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0045—Arrangements at the receiver end
- H04L1/0054—Maximum-likelihood or sequential decoding, e.g. Viterbi, Fano, ZJ algorithms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0061—Error detection codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/007—Unequal error protection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0078—Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
- H04L1/0079—Formats for control data
- H04L1/0082—Formats for control data fields explicitly indicating existence of error in data being transmitted, e.g. so that downstream stations can avoid decoding erroneous packet; relays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L2001/0098—Unequal error protection
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Communication Control (AREA)
Description
【発明の属する技術分野】
本発明は、伝送路で発生する誤りに対して選択的に保護された符号化パラメータを復号する復号装置及び方法、並びにプログラム提供媒体に関する。
【0002】
【従来の技術】
オーディオ信号(音声信号や音響信号を含む)の時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法として、いわゆるCELP(Code Excited Linear Prediction:符号励起線形予測)符号化系の符号化方式であるVSELP(Vector Sum Excited Linear Prediction:ベクトル和励起線形予測)符号化方式や、PSI−CELP(Pitch Synchronus Innovation - CELP:ピッチ同期雑音励振源−CELP)符号化方式等が低ビットレートの音声符号化方式として近年着目されている。
【0003】
このCELP符号化方式等の波形符号化方式においては、入力音声信号の所定数のサンプルを符号化単位としてブロック化あるいはフレーム化し、ブロックあるいはフレーム毎の音声時間軸波形に対して、合成による分析(analysis by synthesis)法を用いて最適ベクトルのクローズドループサーチを行うことにより波形のベクトル量子化を行い、そのベクトルのインデクスを出力している。
【0004】
ところで、上記低ビットレート、例えば2kbps又は4kbpsの音声符号化方式により得られた符号化ビットは、特定のオーディオ情報内容にとらわれない、一般的なオーディオとして、通信、コンピュータ、放送などの分野に広く適用されるため、伝送路で発生する誤りに対して強く保護する必要がある。
【0005】
伝送路で連続的に誤りが発生した場合、音声復号時に音の欠け等が長い時間にわたり続いてしまい、音声品質の低下を招いてしまうことになる。
【0006】
そこで、本件出願人は特願平09−285903号明細書により、伝送路で発生する誤りに強く、品質を改善できる符号化方法及び装置、並びに復号方法及び装置を明らかにした。
【0007】
この符号化方法及び装置は、入力音声信号を時間軸上で所定の符号化単位で区分し、各符号化単位で符号化を行って複数種類の音声符号化パラメータを出力し、その複数種類の音声符号化パラメータの内で聴感上重要な重要ビット群を選択し、この重要ビット群から誤り検査符号を生成し、上記誤り検査符号と上記重要ビット群に畳み込み符号化を施す。このため、聴感上重要なビット群を伝送路誤りから保護できる。
【0008】
また、上記誤り検査符号と上記重要ビット群に畳み込み符号化が施され、上記重要ビット群を除くビット群に接合されて伝送されてきた符号化データを復号するため、上記復号方法及び装置は、上記畳み込み符号化出力に畳み込み復号化を施し、上記誤り検査符号が付加されたままの上記重要ビット群と、上記重要ビット群を除いたビット群とを畳み込み復号化出力とし、その畳み込み復号化出力に付加されている上記誤り検査符号を用いて伝送誤りを検査し、その誤り検査結果に応じて上記畳み込み復号化出力を調整し、この調整された畳み込み復号化出力に音声復号化処理を施す。このため、伝送路誤りによる品質の低下を抑えた音声を復号できる。
【0009】
【発明が解決しようとする課題】
ところで、上記復号方法及び装置では、畳み込み復号化出力に付加されている上記誤り検査符号を用いて伝送誤りを検査した誤り検査結果に応じて上記復号化出力を調整する際、音声復号処理が施された後の音声信号としての連続性を保つ必要がある。
【0010】
本発明は、上記課題に鑑みてなされたものであり、音声信号としての連続性を保ち、高品質の音声を復号することのできる復号装置及び方法、並びにプログラム提供媒体の提供を目的とする。
【0011】
【課題を解決するための手段】
本発明に係る復号装置は、上記課題を解決するために、符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号する復号装置において、上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号手段を備える。
【0012】
ここで、上記符号化装置における符号化処理は複数個のベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号手段は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、上記符号化単位内で発生した上記インデクスの誤りに応じてフレームマスク処理を異ならせる。
【0013】
また、上記符号化装置における符号化処理は交互学習によって作成された多段ベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号手段は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、複数個のインデクスに誤りが検出されたか否かに応じてフレームマスク処理を異ならせる。
【0014】
本発明に係る復号方法は、上記課題を解決するために、符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号するための復号方法において、上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号工程を備える。
【0015】
また、上記符号化装置における符号化処理は複数個のベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号工程は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、上記符号化単位内で発生した上記インデクスの誤りに応じてフレームマスク処理を異ならせる。
【0016】
また、上記符号化装置における符号化処理は交互学習によって作成された多段ベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号工程は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、複数個のインデクスに誤りが検出されたか否かに応じてフレームマスク処理を異ならせる。
【0017】
本発明に係るプログラム提供媒体は、上記課題を解決するために、符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号するための復号プログラムを提供するためのプログラム提供媒体において、上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号ステップを備えるプログラムを提供する。
【0018】
また、上記符号化装置における符号化処理は複数個のベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号ステップは所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、上記符号化単位内で発生した上記インデクスの誤りに応じてフレームマスク処理を異ならせるプログラムを提供する。
【0019】
また、上記符号化装置における符号化処理は交互学習によって作成された多段ベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号ステップは所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、複数個のインデクスに誤りが検出されたか否かに応じてフレームマスク処理を異ならせるプログラムを提供する。
【0020】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。この実施の形態は本発明の復号装置及び方法の具体例となる復号装置を備えた、図1に示す携帯電話装置である。この携帯電話装置は、例えば2kbps又は4kbpsの低ビットレートの音声符号化を行う符号化装置も備えている。
【0021】
符号化装置は、入力音声信号を時間軸上で所定の符号化単位で区分して各符号化単位毎に符号化を行って複数種類の音声符号化パラメータを生成する。そして、この音声符号化パラメータの伝送路誤りに対するビットの聴感上の感度に応じて、ビットを複数の保護クラスに割り当てる。例えば、ビットレートが2kbpsである場合には6クラス、4kbpsである場合には7クラスに割り当てる。クラス割り当て、音声符号化パラメータの詳細については後述する。
【0022】
先ず、この携帯電話装置において、符号化装置は、音声符号化器3と、クラス分割&入力順決定部23と、伝送路符号化器4とを備えてなる。音声符号化器3は、入力音声信号を時間軸上で所定の符号化単位で区分して各符号化単位で符号化を行って複数種類の音声符号化パラメータを出力する。クラス分割&入力順決定部23は、音声符号化器3からの上記複数種類の音声符号化パラメータを、伝送路誤りに対するビットの聴感上の感度に応じてビットレートが2kbpsである場合には6クラス、4kbpsである場合には7クラスにクラス分けすると共に、次段の伝送路符号化器4への入力順を決定する。伝送路符号化器4は、クラス分類&入力順決定部23で分割されたクラス、及び入力順に応じてCRC(Cyclic Redundancy Check :巡回冗長チェック)検査符号を生成し、そのCRC検査符号を掛けた後、畳み込み符号化により保護したり、CRC検査符号を掛けるだけにしたり、さらに何の保護もしなかったりする。
【0023】
クラス分類&入力順決定部23は、ビットコントローラ23aとRAM23bを備える。ビットコントローラ23aは、音声符号化器3からの上記複数種類の音声符号化パラメータをRAM23bを作業領域とし、伝送路誤りに対するビットの聴感上の感度に応じてクラス分割すると共に入力順を決定する。
【0024】
伝送路符号化器4は、CRC符号計算部5と畳み込み符号化器6とを備える。CRC符号計算部5はCRC(Cyclic Redundancy Check :巡回冗長チェック)検査符号を生成する。畳み込み符号化器6は必要に応じてCRC符号計算部5からの上記CRC検査符号が掛けられたビット群に畳み込み符号化を施す。また、伝送路符号化器4は単にCRC符号計算部5からの上記CRC検査符号が掛けられたビット群を出力することもある。さらにクラスによっては何もせずにそのまま通してしまうこともある。
【0025】
また、この携帯電話装置において、本発明に係る復号装置及び方法を適用した復号装置は、上記畳み込み符号化出力に畳み込み復号化を施し、上記誤り検査符号が付加されたままの上記重要ビット群と、上記重要ビット群を除いたビット群とを畳み込み復号化出力とする畳み込み復号化器16と、この畳み込み復号化器16からの畳み込み復号化出力に付加されている上記CRC検査符号と上記重要ビット群を除いたビット群より計算したCRC誤り検査符号とを比較し、その比較結果に応じて上記畳み込み復号化出力を調整するCRC符号比較&フレームマスク部15と、このCRC符号比較&フレームマスク部15からの畳み込み復号化出力に音声復号化処理を施す音声復号化器17とを備えてなる。
【0026】
この携帯電話装置において、送信時、マイクロホン1から入力された音声信号は、A/D変換器2によりディジタル信号に変換され、音声符号化器3により2kbps/4kbpsという低ビットレートの符号化パラメータとされ、クラス分割&入力順決定部23においてクラス分け及び入力順が決定され、伝送路符号化器4により伝送路の品質が音声品質に影響を受けにくいように符号化された後、変調器7で変調され、送信機8で出力ビットに送信処理が施され、アンテナ共用器9を通して、アンテナ10から送信される。
【0027】
また、受信時には、アンテナ10で捉えられた電波が、アンテナ共用器9を通じて受信機11で受信され、復調器13で復調され、伝送路復号化器14で伝送路誤りが訂正され、音声復号化器17が復号され、D/A変換器18でアナログ音声信号に戻されて、スピーカ19から出力される。
【0028】
また、制御部20は上記各部をコントロールし、シンセサイザ12は送受信周波数を送信機8、及び受信機11に与えている。また、キーパッド21及びLCD表示器22はマンマシンインターフェースに利用される。
【0029】
このような構成の携帯電話装置の中で、伝送路符号化器4を構成するCRC符号計算部5は、クラス分割&入力順決定部23でクラス分けされ、入力順が決定された、上記音声信号の周波数スペクトルの概形を形成する線スペクトル対(LSP)パラメータの一部又は全部、上記音声信号が有声音(Voice:V)か無声音(Un Voice:UV)かを示す有声音(V)/無声音(UV)判定パラメータの全部、上記音声信号が有声音であるときのピッチ(Pith)パラメータの一部又は全部、同じく上記音声信号が有声音であるときの線形予測符号化(LPC)残差信号のスペクトルエンベロープを示すスペクトルコードブックインデクス及びゲインインデクスの一部又は全部、及び上記音声信号が無声音であるときの線形予測符号化(LPC)残差信号の雑音コードブックインデクス及びゲインインデクスの一部又は全部を選択し、これらからCRC検査符号を生成する。
【0030】
これらの音声符号化パラメータは、音声符号化器3により得られる。この音声符号化器3が行う音声符号化方法は、入力音声信号の短期予測残差を求める短期予測残差算出工程と、求められた短期予測残差をサイン波分析符号化するサイン波分析符号化工程と、上記入力音声信号を波形符号化により符号化する波形符号化工程とを備えてなる。この音声符号化器3について図2及び図3を用いて説明する。
【0031】
図2の音声符号化器3の基本的な考え方は、入力音声信号の短期予測残差例えばLPC(線形予測符号化)残差を求めてサイン波分析(sinusoidal analysis )符号化、例えばハーモニックコーディング(harmonic coding )を行う第1の符号化部110と、入力音声信号に対して位相再現性のある波形符号化により符号化する第2の符号化部120とを有し、入力信号の有声音(V:Voiced)の部分の符号化に第1の符号化部110を用い、入力信号の無声音(UV:Unvoiced)の部分の符号化には第2の符号化部120を用いるようにすることである。
【0032】
上記第1の符号化部110には、例えばLPC残差をハーモニック符号化やマルチバンド励起(MBE)符号化のようなサイン波分析符号化を行う構成が用いられる。上記第2の符号化部120には、例えば合成による分析法を用いて最適ベクトルのクローズドループサーチによるベクトル量子化を用いた符号励起線形予測(CELP)符号化の構成が用いられる。
【0033】
図2の例では、入力端子101に供給された音声信号が、第1の符号化部110のLPC逆フィルタ111及びLPC分析・量子化部113に送られている。LPC分析・量子化部113から得られたLPC係数あるいはいわゆるαパラメータは、LPC逆フィルタ111に送られて、このLPC逆フィルタ111により入力音声信号の線形予測残差(LPC残差)が取り出される。また、LPC分析・量子化部113からは、後述するようにLSP(線スペクトル対)の量子化出力が取り出され、これが出力端子102に送られる。LPC逆フィルタ111からのLPC残差は、サイン波分析符号化部114に送られる。サイン波分析符号化部114では、ピッチ検出やスペクトルエンベロープ振幅計算が行われると共に、V(有声音)/UV(無声音)判定部115によりV/UVの判定が行われる。サイン波分析符号化部114からのスペクトルエンベロープ振幅データがベクトル量子化部116に送られる。スペクトルエンベロープのベクトル量子化出力としてのベクトル量子化部116からのコードブックインデクスは、スイッチ117を介して出力端子103に送られ、サイン波分析符号化部114からの出力は、スイッチ118を介して出力端子104に送られる。また、V/UV判定部115からのV/UV判定出力は、出力端子105に送られると共に、スイッチ117、118の制御信号として送られており、上述した有声音(V)のとき上記インデクス及びピッチが選択されて各出力端子103及び104からそれぞれ取り出される。
【0034】
図2の第2の符号化部120は、この例ではCELP(符号励起線形予測)符号化構成を有しており、雑音コードブック121からの出力を、重み付きの合成フィルタ122により合成処理し、得られた重み付き音声を減算器123に送り、入力端子101に供給された音声信号を聴覚重み付けフィルタ125を介して得られた音声との誤差を取り出し、この誤差を距離計算回路124に送って距離計算を行い、誤差が最小となるようなベクトルを雑音コードブック121でサーチするような、合成による分析(Analysis by Synthesis )法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。このCELP符号化は、上述したように無声音部分の符号化に用いられており、雑音コードブック121からのUVデータとしてのコードブックインデクスは、上記V/UV判定部115からのV/UV判定結果が無声音(UV)のときオンとなるスイッチ127を介して、出力端子107より取り出される。
【0035】
図3は、上記図2に示した音声符号化器3のより具体的な構成を示す図である。なお、この図3において、上記図2の各部と対応する部分には同じ指示符号を付している。
【0036】
この図3に示された音声符号化器3において、入力端子101に供給された音声信号は、ハイパスフィルタ(HPF)109にて不要な帯域の信号を除去するフィルタ処理が施された後、LPC(線形予測符号化)分析・量子化部113のLPC分析回路132と、LPC逆フィルタ回路111とに送られる。
【0037】
LPC分析・量子化部113のLPC分析回路132は、入力信号波形の256サンプル程度の長さを1ブロックとしてハミング窓をかけて、自己相関法により線形予測係数、いわゆるαパラメータを求める。データ出力の単位となるフレーミングの間隔は、160サンプル程度とする。サンプリング周波数fsが例えば8kHzのとき、1フレーム間隔は160サンプルで20msec となる。
【0038】
LPC分析回路132からのαパラメータは、α→LSP変換回路133に送られて、線スペクトル対(LSP)パラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば10個、すなわち5対のLSPパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このLSPパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【0039】
α→LSP変換回路133からのLSPパラメータは、LSP量子化器134によりマトリクスあるいはベクトル量子化される。このとき、フレーム間差分をとってからベクトル量子化してもよく、複数フレーム分をまとめてマトリクス量子化してもよい。ここでは、20msec を1フレームとし、20msec 毎に算出されるLSPパラメータを2フレーム分まとめて、マトリクス量子化及びベクトル量子化している。
【0040】
このLSP量子化器134からの量子化出力、すなわちLSP量子化のインデクスは、端子102を介して取り出され、また量子化済みのLSPベクトルは、LSP補間回路136に送られる。
【0041】
LSP補間回路136は、上記20msecあるいは40msec 毎に量子化されたLSPのベクトルを補間し、8倍のレートにする。すなわち、2.5msec 毎にLSPベクトルが更新されるようにする。これは、残差波形をハーモニック符号化復号化方法により分析合成すると、その合成波形のエンベロープは非常になだらかでスムーズな波形になるため、LPC係数が20msec 毎に急激に変化すると異音を発生することがあるからである。すなわち、2.5msec 毎にLPC係数が徐々に変化してゆくようにすれば、このような異音の発生を防ぐことができる。
【0042】
このような補間が行われた2.5msec 毎のLSPベクトルを用いて入力音声の逆フィルタリングを実行するために、LSP→α変換回路137により、LSPパラメータを例えば10次程度の直接型フィルタの係数であるαパラメータに変換する。このLSP→α変換回路137からの出力は、上記LPC逆フィルタ回路111に送られ、このLPC逆フィルタ111では、2.5msec 毎に更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。このLPC逆フィルタ111からの出力は、サイン波分析符号化部114、具体的には例えばハーモニック符号化回路、の直交変換回路145、例えばDFT(離散フーリエ変換)回路に送られる。
【0043】
LPC分析・量子化部113のLPC分析回路132からのαパラメータは、聴覚重み付けフィルタ算出回路139に送られて聴覚重み付けのためのデータが求められ、この重み付けデータが後述する聴覚重み付きのベクトル量子化器116と、第2の符号化部120の聴覚重み付けフィルタ125及び聴覚重み付きの合成フィルタ122とに送られる。
【0044】
ハーモニック符号化回路等のサイン波分析符号化部114では、LPC逆フィルタ111からの出力を、ハーモニック符号化の方法で分析する。すなわち、ピッチ検出、各ハーモニクスの振幅Amの算出、有声音(V)/無声音(UV)の判別を行い、ピッチによって変化するハーモニクスのエンベロープあるいは振幅Amの個数を次元変換して一定数にしている。
【0045】
図3に示すサイン波分析符号化部114の具体例においては、一般のハーモニック符号化を想定しているが、特に、MBE(Multiband Excitation: マルチバンド励起)符号化の場合には、同時刻(同じブロックあるいはフレーム内)の周波数軸領域いわゆるバンド毎に有声音(Voiced)部分と無声音(Unvoiced)部分とが存在するという仮定でモデル化することになる。それ以外のハーモニック符号化では、1ブロックあるいはフレーム内の音声が有声音か無声音かの択一的な判定がなされることになる。なお、以下の説明中のフレーム毎のV/UVとは、MBE符号化に適用した場合には全バンドがUVのときを当該フレームのUVとしている。ここで上記MBEの分析合成手法については、本件出願人が先に提案した特願平4−91422号明細書及び図面に詳細な具体例を開示している。
【0046】
図3のサイン波分析符号化部114のオープンループピッチサーチ部141には、上記入力端子101からの入力音声信号が、またゼロクロスカウンタ142には、上記HPF(ハイパスフィルタ)109からの信号がそれぞれ供給されている。サイン波分析符号化部114の直交変換回路145には、LPC逆フィルタ111からのLPC残差あるいは線形予測残差が供給されている。オープンループピッチサーチ部141では、入力信号のLPC残差をとってオープンループによる比較的ラフなピッチのサーチが行われ、抽出された粗ピッチデータは高精度ピッチサーチ146に送られて、後述するようなクローズドループによる高精度のピッチサーチ(ピッチのファインサーチ)が行われる。また、オープンループピッチサーチ部141からは、上記粗ピッチデータと共にLPC残差の自己相関の最大値をパワーで正規化した正規化自己相関最大値r(p) が取り出され、V/UV(有声音/無声音)判定部115に送られている。
【0047】
直交変換回路145では例えばDFT(離散フーリエ変換)等の直交変換処理が施されて、時間軸上のLPC残差が周波数軸上のスペクトル振幅データに変換される。この直交変換回路145からの出力は、高精度ピッチサーチ部146及びスペクトル振幅あるいはエンベロープを評価するためのスペクトル評価部148に送られる。
【0048】
高精度(ファイン)ピッチサーチ部146には、オープンループピッチサーチ部141で抽出された比較的ラフな粗ピッチデータと、直交変換部145により例えばDFTされた周波数軸上のデータとが供給されている。この高精度ピッチサーチ部146では、上記粗ピッチデータ値を中心に、0.2〜0.5きざみで±数サンプルずつ振って、最適な小数点付き(フローティング)のファインピッチデータの値へ追い込む。このときのファインサーチの手法として、いわゆる合成による分析 (Analysis by Synthesis)法を用い、合成されたパワースペクトルが原音のパワースペクトルに最も近くなるようにピッチを選んでいる。このようなクローズドループによる高精度のピッチサーチ部146からのピッチデータについては、スイッチ118を介して出力端子104に送っている。
【0049】
スペクトル評価部148では、LPC残差の直交変換出力としてのスペクトル振幅及びピッチに基づいて各ハーモニクスの大きさ及びその集合であるスペクトルエンベロープが評価され、高精度ピッチサーチ部146、V/UV(有声音/無声音)判定部115及び聴覚重み付きのベクトル量子化器116に送られる。
【0050】
V/UV(有声音/無声音)判定部115は、直交変換回路145からの出力と、高精度ピッチサーチ部146からの最適ピッチと、スペクトル評価部148からのスペクトル振幅データと、オープンループピッチサーチ部141からの正規化自己相関最大値r(p) と、ゼロクロスカウンタ142からのゼロクロスカウント値とに基づいて、当該フレームのV/UV判定が行われる。さらに、MBEの場合の各バンド毎のV/UV判定結果の境界位置も当該フレームのV/UV判定の一条件としてもよい。このV/UV判定部115からの判定出力は、出力端子105を介して取り出される。
【0051】
ところで、スペクトル評価部148の出力部あるいはベクトル量子化器116の入力部には、データ数変換(一種のサンプリングレート変換)部が設けられている。このデータ数変換部は、上記ピッチに応じて周波数軸上での分割帯域数が異なり、データ数が異なることを考慮して、エンベロープの振幅データ|Am| を一定の個数にするためのものである。すなわち、例えば有効帯域を3400kHzまでとすると、この有効帯域が上記ピッチに応じて、8バンド〜63バンドに分割されることになり、これらの各バンド毎に得られる上記振幅データ|Am| の個数mMX+1も8〜63と変化することになる。このためデータ数変換部119では、この可変個数mMX+1の振幅データを一定個数M個、例えば44個、のデータに変換している。
【0052】
このスペクトル評価部148の出力部あるいはベクトル量子化器116の入力部に設けられたデータ数変換部からの上記一定個数M個(例えば44個)の振幅データあるいはエンベロープデータが、ベクトル量子化器116により、所定個数、例えば44個のデータ毎にまとめられてベクトルとされ、重み付きベクトル量子化が施される。この重みは、聴覚重み付けフィルタ算出回路139からの出力により与えられる。ベクトル量子化器116からの上記エンベロープのインデクスidSは、スイッチ117を介して出力端子103より取り出される。なお、上記重み付きベクトル量子化に先だって、所定個数のデータから成るベクトルについて適当なリーク係数を用いたフレーム間差分をとっておくようにしてもよい。
【0053】
次に、第2の符号化部120について説明する。第2の符号化部120は、いわゆるCELP(符号励起線形予測)符号化構成を有しており、特に、入力音声信号の無声音部分の符号化のために用いられている。この無声音部分用のCELP符号化構成において、雑音コードブック、いわゆるストキャスティック・コードブック(stochastic code book)121からの代表値出力である無声音のLPC残差に相当するノイズ出力を、ゲイン回路126を介して、聴覚重み付きの合成フィルタ122に送っている。重み付きの合成フィルタ122では、入力されたノイズをLPC合成処理し、得られた重み付き無声音の信号を減算器123に送っている。減算器123には、上記入力端子101からHPF(ハイパスフィルタ)109を介して供給された音声信号を聴覚重み付けフィルタ125で聴覚重み付けした信号が入力されており、合成フィルタ122からの信号との差分あるいは誤差を取り出している。なお、聴覚重み付けフィルタ125の出力から聴覚重み付き合成フィルタの零入力応答を事前に差し引いておくものとする。この誤差を距離計算回路124に送って距離計算を行い、誤差が最小となるような代表値ベクトルを雑音コードブック121でサーチする。このような合成による分析(Analysis by Synthesis )法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。
【0054】
このCELP符号化構成を用いた第2の符号化部120からのUV(無声音)部分用のデータとしては、雑音コードブック121からのコードブックのシェイプインデクスidSlと、ゲイン回路126からのコードブックのゲインインデクスidGlとが取り出される。雑音コードブック121からのUVデータであるシェイプインデクスidSlは、スイッチ127sを介して出力端子107sに送られ、ゲイン回路126のUVデータであるゲインインデクスidGlは、スイッチ127gを介して出力端子107gに送られている。
【0055】
ここで、これらのスイッチ127s、127g及び上記スイッチ117、118は、上記V/UV判定部115からのV/UV判定結果によりオン/オフ制御され、スイッチ117、118は、現在伝送しようとするフレームの音声信号のV/UV判定結果が有声音(V)のときオンとなり、スイッチ127s、127gは、現在伝送しようとするフレームの音声信号が無声音(UV)のときオンとなる。
【0056】
以上のように構成される音声符号化器3が出力した各パラメータ、すなわち、LSPパラメータLSP、有声音/無声音判定パラメータVUV、ピッチパラメータPCH、スペクトルエンベロープのコードブックパラメータidS及びゲインインデクスidG、雑音コードブックパラメータidSl及びゲインインデクスidGlを2k/4kbps符号化に分け、割り当てビット数も示したのが、図4及び図5である。図4には2kbps及び4kbpsに共通のパラメータを示す。図5には4kbpsにのみ固有のパラメータを示す。共に1フレーム当たりのパラメータである。
【0057】
LSPパラメータは、LSP0,LSP2,LSP3,LSP4,LSP5に分けられる。LSP0は10次のLSPパラメータのコードブックインデクスであり、エンベロープの基本的なパラメータとして使われ、20msecのフレームでは5ビットが割り当てられる。LSP2は5次の低周波数域誤差補正のLSPパラメータのコードブックインデクスであり、7ビットが割り当てられる。LSP3は5次の高周波数域誤差補正のLSPパラメータのコードブックインデクスであり、5ビットが割り当てられる。LSP5は10次の全帯域誤差補正のLSPパラメータのコードブックインデクスであり、8ビットが割り当てられる。このうち、LSP2,LSP3及びLSP5は前の段階での誤差を埋めてやるために使われるインデクスであり、特に、LSP2とLSP3はLSP0でエンベロープを表現しきれなかったときに補助的に用いられる。LSP4は符号化時の符号化モードが直接モード(straight mode)であるか、差分モード(differential mode)であるかの1ビットの選択フラグである。元々の波形から分析して求めたオリジナルのLSPパラメータに対する、量子化により求めた直接モードのLSPと、量子化された差分により求めたLSPの差の少ない方のモードの選択を示す。LSP4が0であるときには直接モードであり、LSP4が1であるときには差分モードである。
【0058】
VUVパラメータは、所定のフレーム内の音声符号化データが有声音/無声音(Voiced/Unvoiced)であるかを示すフラグであり、2ビットが割り当てられる。
【0059】
PCHパラメータは、ピッチパラメータであり、上述したようにクローズドループによる高精度のピッチサーチ部146からのピッチデータであり、7ビットが割り当てられる。
【0060】
スペクトルエンベロープのコードブックパラメータidSは2kbpsの場合、idS0で記される第0LPC残差スペクトルコードブックインデクスとidS1で記される第1LPC残差スペクトルコードブックインデスクに分けられる。共に4ビットが割り当てられる。第0及び第1LPC残差スペクトルコードブックインデクスは別々のコードブックに対応したインデクスでありそれらより選択された両コードブックの加算によりLPC残差スペクトルが形成される。idGはLPC残差スペクトルゲインコードブックインデスクであり、5ビットが割り当てられる。また、スペクトルエンベロープのコードブックパラメータidSは4kbpsの場合、idS0_4kで記される第0拡張LPC残差スペクトルコードブックインデクスと、idS1_4kで記される第1拡張LPC残差スペクトルコードブックインデクスと、idS2_4kで記される第2拡張LPC残差スペクトルコードブックインデクスと、idS3_4kで記される第3拡張LPC残差スペクトルコードブックインデクスとに分けられる。idS0_4kには7ビットが割り当てられ、idS1_4kには10ビット、idS2_4kには9ビット、idS3_4kには6ビットが割り当てられる。
【0061】
ここで、idS0_4k他は、idS0,idS1,idGにより得られる量子化LPC残差スペクトルとオリジナルのLPC残差スペクトルの誤差分を補正するもので、idS3_4kに向けて低い周波数成分から高い周波数成分へと補正範囲が割り当てられている。
【0062】
これら以外のパラメータは無声音(Unvoiced)のとき使われるもので、idSL00やidSL11などSLの付いたものは雑音コードブックインデクス、idGL00やidGL11などGLの付いたものは雑音コードブックゲインコードブックインデクスを表す。idSL00には6ビットが、idSL01には6ビットが、idGL00には4ビットが、idGL01にも4ビットが割り当てられる。また、idSL10には5ビットが、idSL11にも5ビットが、idSL12にも5ビットが、idSL13にも5ビットが割り当てられる。また、また、idGL10には3ビットが、idGL11にも3ビットが、idGL12にも3ビットが、idGL13にも3ビットが割り当てられる。
【0063】
そして、上記図4及び図5に示した各パラメータは、クラス分割&入力順決定部23により、伝送路誤りに対するビットの聴感上の感度に応じて複数のクラスに分けられる。
【0064】
クラス分割&入力順決定部23はビットレートが2kbps(伝送レート3.5kbps)の場合に、有声音及び無声音を図6及び図7に示すように、例えば6クラスに分ける。この図において添え字“p”は前フレーム、添え字“c”は現在フレームに対応する。つまり、前フレームpと現在フレームcの2フレーム分を対象としている。また、クラスの数字が小さいほど重要ビットであることを示す。
【0065】
先ず、有声音である場合について図6を参照して説明する。LSPパラメータの、10次のコードブックインデスクLSP0は前フレームp及び現在フレームc共に5ビット全てがクラスIとされる。また、LSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2は前フレームp及び現在フレームc共に7ビットの内の2ビットがクラスIとされ、残りの5ビットがクラスVIとされる。また、LSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3は前フレームp及び現在フレームc共に5ビットの内の1ビットがクラスIとされ、残りの4ビットがクラスVIとされる。また、LSPパラメータの直接モード/差分モード選択フラグLSP4は前フレームp及び現在フレームc共にクラスIで保護される。
【0066】
また、有声音/無声音フラグVUVの各2ビットは前フレームp及び現在フレームc共にクラスIで保護される。また、ピッチパラメータPCHは7ビットの内の6ビットが前フレームp及び現在フレームc共にクラスIとされ、残りの1ビットがクラスVIとされる。
【0067】
また、LPC残差スペクトルゲインコードブックインデクスidGの5ビットは前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、前フレームpの第0LPC残差スペクトルコードブックインデクスidS0は全てクラスIIとされるが、現在フレームcの第0LPC残差スペクトルコードブックインデクスidS0は全てクラスIVとされる。また、前フレームpの第1LPC残差スペクトルコードブックインデクスidS1の4ビットは全てクラスIIIとされるが、現在フレームcの第1LPC残差スペクトルコードブックインデクスidS1の4ビットは全てクラスVとされる。
【0068】
次に、ビットレートが2kbps(伝送レート3.5kbps)で、無声音である場合について図7を参照して説明する。LSPパラメータの、10次のコードブックインデスクLSP0は前フレームp及び現在フレームc共に5ビット全てがクラスIとされる。
【0069】
また、LSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2は前フレームp及び現在フレームc共に7ビットの内の4ビットがクラスIとされ、残りの3ビットがクラスVIとされる。また、LSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3は前フレームp及び現在フレームc共に5ビットの内の2ビットがクラスIとされ、残りの3ビットがクラスVIとされる。また、LSPパラメータの直接モード/差分モード選択フラグLSP4は前フレームp及び現在フレームc共にクラスIで保護される。
【0070】
また、有声音/無声音フラグVUVの各2ビットは前フレームp及び現在フレームc共にクラスIで保護される。
【0071】
また、雑音コードブックゲインコードブックインデクスidGL00の4ビットは前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、雑音コードブックゲインコードブックインデクスidGL01の4ビットも前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、雑音コードブックインデクスidSL00の6ビットは前フレームp及び現在フレームc共に全てクラスVIとされる。また、雑音コードブックインデクスidSL01の6ビットも前フレームp及び現在フレームc共に全てクラスVIとされる。
【0072】
この無声音においてクラスVIのビットの一部がクラスIIからVのビットとして保護されているが、誤りを検出した場合には他のクラスVIのビットと同様に何の処置も施されない。
【0073】
ビットレートが4kbps(伝送レート6.2kbps)の場合、クラス分割&入力順決定部23は、有声音及び無声音を図8及び図9に示すように、例えば7クラスに分ける。この図でも添え字“p”は前フレーム、添え字“c”は現在フレームに対応する。つまり、前フレームpと現在フレームcの2フレーム分を対象としている。また、クラスの数字が小さいほど重要ビットであることを示すのも同様である。
【0074】
先ず、有声音である場合について図8を参照して説明する。LSPパラメータの、10次のコードブックインデスクLSP0は前フレームp及び現在フレームc共に5ビット全てがクラスIとされる。また、LSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2は前フレームp及び現在フレームc共に7ビットの内の4ビットがクラスIとされ、残りの3ビットがクラスVIIとされる。また、LSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3は前フレームp及び現在フレームc共に5ビットの内の1ビットがクラスIとされ、残りの4ビットがクラスVIIとされる。また、LSPパラメータの直接モード/差分モード選択フラグLSP4は前フレームp及び現在フレームc共にクラスIで保護される。
【0075】
また、有声音/無声音フラグVUVの各2ビットは前フレームp及び現在フレームc共にクラスIで保護される。また、ピッチパラメータPCHは7ビットの内の6ビットが前フレームp及び現在フレームc共にクラスIとされ、残りの1ビットがクラスVIIとされる。
【0076】
また、LPC残差スペクトルゲインコードブックインデクスidGの5ビットは前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、前フレームpの第0LPC残差スペクトルコードブックインデクスidS0の4ビットは全てクラスIIIとされるが、現在フレームcの第0LPC残差スペクトルコードブックインデクスidS0の4ビットは全てクラスVとされる。また、前フレームpの第1LPC残差スペクトルコードブックインデクスidS1の4ビットは全てクラスIVとされるが、現在フレームcの第1LPC残差スペクトルコードブックインデクスidS1の4ビットは全てクラスVIとされる。
【0077】
また、第0拡張LPC残差スペクトルコードブックインデクスidS0_4kの7ビットの内の5ビットは前フレームp及び現在フレームc共にクラスIとされるが、残りの2ビットはクラスVIIとされる。また、第1拡張LPC残差スペクトルコードブックインデクスidS1_4kの10ビットの内の1ビットは前フレームp及び現在フレームc共にクラスIとされるが、残りの9ビットはクラスIIとされる。また、第2拡張LPC残差スペクトルコードブックインデクスidS2_4kの9ビットの内の1ビットは前フレームp及び現在フレームc共にクラスIとされるが、残りの8ビットはクラスIIとされる。また、第3拡張LPC残差スペクトルコードブックインデクスidS3_4kの6ビットの内の1ビットは前フレームp及び現在フレームc共にクラスIとされるが、残りの5ビットはクラスIIとされる。
【0078】
次に、ビットレートが4kbps(伝送レート6.2kbps)で、無声音である場合について図9を参照して説明する。LSPパラメータの、10次のコードブックインデスクLSP0は前フレームp及び現在フレームc共に5ビット全てがクラスIとされる。
【0079】
また、LSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2は前フレームp及び現在フレームc共に7ビットの内の4ビットがクラスIとされ、残りの3ビットがクラスVIIとされる。また、LSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3は前フレームp及び現在フレームc共に5ビットの内の1ビットがクラスIとされ、残りの4ビットがクラスVIIとされる。また、LSPパラメータの直接モード/差分モード選択フラグLSP4は前フレームp及び現在フレームc共にクラスIで保護される。また、10次の全帯域誤差補正のLSPパラメータのコードブックインデクスLSP5は前フレームp及び現在フレームc共に8ビットの内の1ビットがクラスIとされ、残りの7ビットがクラスVIIとされる。
【0080】
また、有声音/無声音フラグVUVの各2ビットは前フレームp及び現在フレームc共にクラスIで保護される。
【0081】
また、雑音コードブックゲインコードブックインデクスidGL00の4ビットは前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、雑音コードブックゲインコードブックインデクスidGL01の4ビットも前フレームp及び現在フレームc共に全てクラスIとされて保護される。
【0082】
また、雑音コードブックインデクスidSL00の6ビットは前フレームp及び現在フレームc共に全てクラスVIIとされる。また、雑音コードブックインデクスidSL01の6ビットも前フレームp及び現在フレームc共に全てクラスVIIとされる。
【0083】
雑音コードブックゲインコードブックインデクスidGL10の3ビットは前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、雑音コードブックゲインコードブックインデクスidGL11の3ビットも前フレームp及び現在フレームc共に全てクラスIとされて保護される。また、雑音コードブックインデクスidGL12の3ビットも前フレームp及び現在フレームc共に全てクラスIとされる。また、雑音コードブックインデクスidGL13の3ビットの内の2ビットは前フレームp及び現在フレームc共に全てクラスIとされるが、残りの1ビットはクラスV11とされる。
【0084】
また、雑音コードブックインデクスidSL10の5ビットは前フレームp及び現在フレームc共に全てクラスVIIとされる。また、雑音コードブックインデクスidSL11の5ビットも前フレームp及び現在フレームc共に全てクラスVIIとされる。また、雑音コードブックインデクスidSL12の5ビットも前フレームp及び現在フレームc共に全てクラスVIIとされる。また、雑音コードブックインデクスidSL13の5ビットも前フレームp及び現在フレームc共に全てクラスVIIとされる。
【0085】
ここでも無声音においてクラスVIIのビットの一部がクラスIIからVIのビットとして保護されているが、誤っていたとしても何の処置も施されず、他のクラスVIIのビットと同様に扱われる。
【0086】
次に、2kbpsのクラスIからクラスVIまでの有声音及び無声音の各パラメータの、伝送路符号化器(チャネルコーダ)4への入力順を、図10及び図11を用いて説明する。この入力順の決定も、上述したように、クラス分割&入力順決定部23で行われる。ここでビットの並び順は伝送路のエラーに対するビットの聴感上の感度に応じたものである。添え字“p”は前のフレームのパラメータを示し、“c”は現在のフレームのパラメータを示す。また、ビット0はLSBを示す。
【0087】
先ず、図10において、有声音のクラスIの入力順は、前のフレームpの有声音/無声音判定フラグVUVの1番目のビットから、同じく前のフレームpの有声音/無声音判定フラグVUVの0番目のビットに続き、以下、前のフレームpのLSPパラメータの直接モード/差分モード選択フラグLSP4の0番目のビット、そして、前のフレームpのLPC残差スペクトルゲインコードブックインデクスidGの4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。さらに、前のフレームのLSPパラメータの、10次のコードブックインデスクLSP0の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。またさらに、前のフレームpのピッチパラメータPCHの6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.0からNO.18までの入力順である。さらにNO.19からは前のフレームpのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の6番目のビットが続き、NO.20は前のフレームpのLSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3の4番目のビットが続き、NO.21には前のフレームpのLSPパラメータのコードブックインデスクLSP2の5番目が続く。以下、NO.22からNO.43までには、現在のフレームcのパラメータが、上記NO.0からNO.21までの順番を繰り返すように、入力される。
【0088】
また、有声音のクラスIIビットの入力順(NO.44からNO.47まで)は、前フレームpの第0LPC残差スペクトルコードブックインデクスidS0の3番目のビットから0番目までの計4ビットが図10に示すように決定される。
【0089】
また、有声音のクラスIIIビットの入力順(NO.48からNO.51まで)は、前フレームpの第1LPC残差スペクトルコードブックインデクスidS1の3番目のビットから0番目までの計4ビットが図10に示すように決定される。
【0090】
また、有声音のクラスIVビットの入力順(NO.52からNO.55まで)は、現在フレームcの第0LPC残差スペクトルコードブックインデクスidS0の3番目のビットから0番目までの計4ビットが図10に示すように決定される。
【0091】
また、有声音のクラスVビットの入力順(NO.56からNO.59まで)は、現在フレームcの第1LPC残差スペクトルコードブックインデクスidS1の3番目のビットから0番目までの計4ビットが図10に示すように決定される。
【0092】
また、有声音のクラスVIビットの入力順(NO.60からNO.79まで)は以下の通りとなる。先ず、前フレームpのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.60からNO.64までの入力順である。NO.65からNO.68までは、前のフレームpのLSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.69には前のフレームpのピッチパラメータPCHの0番目のビットが入る。NO.70からNO.74までは、現在フレームcのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.75からNO.78までは、現在フレームcのLSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。そして、最後のNO.79には、現在フレームcのピッチパラメータPCHの0番目のビットが入る。
【0093】
次に、図11において、無声音のクラスIの入力順は、前のフレームpの有声音/無声音判定フラグVUVの1番目のビットから、同じく前のフレームpの有声音/無声音判定フラグVUVの0番目のビットに続き、以下、前のフレームpのLSPパラメータの直接モード/差分モード選択フラグLSP4の0番目のビット、そして、前のフレームpの雑音コードブックゲインコードブックインデクスidGL00の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。さらに、前のフレームの雑音コードブックゲインコードブックインデクスidGL01の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。またさらに、前のフレームpのLSPパラメータの10次のコードブックインデスクLSP0の4番目のビット、同3番目のビット、同2番目のビットから同0番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.0からNO.15までの入力順である。さらにNO.16からNO.19までは前のフレームpのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の6番目のビット、同5番目のビット、同4番目のビット、同3番目のビットが続く。NO.20、NO21には前のフレームpのLSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3の4番目のビット、同3番目のビットが入る。以下、NO.22からNO.43までには、現在のフレームcのパラメータが、上記NO.0からNO.21までの順番を繰り返すように、入力される。
【0094】
また、無声音のクラスIIは、前フレームpの5次の低周波数域誤差補正のコードブックインデクスLSP2の2番目のビットから同0番目の計3ビットと、5次の高周波数域誤差補正のコードブックインデクスLSP3の2番目のビットという入力順(NO.44からNO.47まで)とされる。
【0095】
また、無声音のクラスIIIは、前フレームpの5次の高周波数域誤差補正のコードブックインデクスLSP3の1番目のビットがNO.48に、同0番目のビットがNO.49になる入力順とされる。また、NO.50には前フレームpの雑音コードブックインデクスidSL00の5番目のビットが入り、NO.51には同4番目のビットが入る。
【0096】
また、無声音のクラスIVは、現在フレームcの5次の低周波数域誤差補正のコードブックインデクスLSP2の2番目のビットから同0番目の計3ビットと、5次の高周波数域誤差補正のコードブックインデクスLSP3の2番目のビットという入力順(NO.52からNO.55まで)とされる。
【0097】
また、無声音のクラスVは、現在フレームcの5次の高周波数域誤差補正のコードブックインデクスLSP3の1番目のビットがNO.56に、同0番目のビットがNO.57になる入力順とされる。また、NO.58には現在レームcの雑音コードブックインデクスidSL00の5番目のビットが入り、NO.59には同4番目のビットが入る。
【0098】
また、無声音のクラスVIビットの入力順(NO.60からNO.79まで)は以下の通りとなる。先ず、前フレームpの雑音コードブックインデクスidSL00の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.60からNO.63までの入力順である。NO.64からNO.69までは、前のフレームpの雑音コードブックインデクスidSL01の5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.70からNO.73までは、現在フレームcの雑音コードブックインデクスidSL00の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。そして、NO.74からNO.79までは、現在フレームcの5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。
【0099】
次に、4kbpsのクラスIからクラスVIIまでの有声音及び無声音の各パラメータの、伝送路符号化器(チャネルコーダ)4への入力順を、図12〜図14及び図15〜図17に示す。ここでの入力順の決定も、上述したように、クラス分割&入力順決定部23で行われる。ここでビットの並び順は伝送路のエラーに対するビットの聴感上の感度に応じたものである。添え字“p”は前のフレームのパラメータを示し、“ c”は現在のフレームのパラメータを示す。また、ビット0はLSBを示す。
【0100】
図12には有声音のクラスIの入力順を示す。NO.0からNO.65まで、計66個のビットの入力順が決定されている。先ず、前のフレームpの有声音/無声音判定フラグVUVの1番目のビットから、同じく前のフレームpの有声音/無声音判定フラグVUVの0番目のビットに続き、以下、前のフレームpのLSPパラメータの直接モード/差分モード選択フラグLSP4の0番目のビット、そして、前のフレームpのLPC残差スペクトルゲインコードブックインデクスidG0の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。さらに、前のフレームのLSPパラメータの、10次のコードブックインデスクLSP0の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。また、前のフレームpのピッチパラメータPCHの6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.0からNO.18までの入力順である。さらにNO.19からは前のフレームpのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の6番目のビット、同5番目のビット(NO.20)、同4番目のビット(NO.21)、同3番目のビット(NO.22)が続く。またNO.23からNO.27までは、前フレームpの第0拡張LPC残差スペクトルコードブックインデクスidS0_4kの6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビットが続く。また、NO.28には前のフレームpの5次の高周波数域誤差補正のコードブックインデクスLSP3の4番目が入り、NO.29には前フレームpの10次の全帯域誤差補正のLSPパラメータのコードブックインデクスLSP5の7番目のビットが入る。また、NO.30からNO.32までは、先ず、第1拡張LPC残差スペクトルコードブックインデクスidS1_4kの9番目のビット、第2拡張LPC残差スペクトルコードブックインデクスidS2_4kの8番目のビット、第3拡張LPC残差スペクトルコードブックインデクスidS3_4kの5番目のビットが続く。以下、NO.33からNO.65までには、現在のフレームcのパラメータが、上記NO.0からNO.32までの順番を繰り返すように、入力される。
【0101】
図13には有声音のクラスIIからクラスVまでの入力順を示す。クラスIIの計44個のビットは、NO.66からNO.109までの入力順とされる。先ず、NO.66からNO.74までは、前フレームの第1拡張LPC残差スペクトルコードブックインデクスidS1_4kの8番目のビット、同7番目のビット、同6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.75からNO.82までは、前フレームの第2拡張LPC残差スペクトルコードブックインデクスidS2_4kの7番目のビット、同6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.83からNO.87までは、前フレームの第3拡張LPC残差スペクトルコードブックインデクスidS3_4kの4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。そして、NO.88からNO.109までは、上記NO.66からNO.87までの計22個のビットの現在フレームcに関してのビットが繰り返される。
【0102】
クラスIIIの計4ビットは、NO.110からNO.113までに、前フレームpの第0LPC残差スペクトルコードブックインデクスidS0の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットという順番とされる。
【0103】
クラスIVの計4ビットは、NO.114からNO.117までに、前フレームpの第1LPC残差スペクトルコードブックインデクスidS1の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットという順番とされる。
【0104】
クラスVの計4ビットは、NO.118からNO.121までに、現在フレームcの第0LPC残差スペクトルコードブックインデクスidS0の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットという順番とされる。
【0105】
図14には有声音のクラスVIとクラスVIIの入力順を示す。クラスVIの計4ビットは、NO.122からNO.125までに、現在フレームcの第1LPC残差スペクトルコードブックインデクスidS1の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットという順番とされる。
【0106】
クラスVIIの計34ビットは、NO.126からNO.159までに以下の様に割り当てられる。NO.126からNO.128までには前フレームpの5次の低周波数域誤差補正のコードブックインデクスLSP2の2番目のビット、同1番目のビット、同0番目のビットが割り当てられる。また、NO.129からNO.132までには前フレームpの5次の高周波数域誤差補正のコードブックインデクスLSP3の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが割り当てられる。また、NO.133からNO.139までには前フレームの10次の全帯域誤差補正のLSPパラメータのコードブックインデクスLSP5の6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが割り当てられる。また、NO.140には前フレームのピッチパラメータPCHの0番目のビットが、NO.141、NO142には第0拡張LPC残差スペクトルコードブックインデクスidS0_4kの1番目のビット、同0番目のビットが割り当てられる。そして、NO.143からNO.159までには、上記NO.126からNO.142までの計17個のビットの現在フレームcに関してのビットが繰り返される。
【0107】
図15には無声音のクラスIの入力順を示す。NO.0からNO.65まで、計66個のビットの入力順が決定されている。先ず、前のフレームpの有声音/無声音判定フラグVUVの1番目のビットから、同じく前のフレームpの有声音/無声音判定フラグVUVの0番目のビットに続き、以下、前のフレームpのLSPパラメータの直接モード/差分モード選択フラグLSP4の0番目のビット、前のフレームpの雑音コードブックゲインコードブックインデクスidGL00の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。さらに、前のフレームの雑音コードブックゲインコードブックインデクスidGL01の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットへと続く。またさらに、前のフレームpのLSPパラメータの10次のコードブックインデスクLSP0の4番目のビット、同3番目のビット、同2番目のビットから同0番目のビットへと続く。ここまでが、伝送路符号化器4へのNO.0からNO.15までの入力順である。さらにNO.16からNO.19までは前のフレームpのLSPパラメータの5次の低周波数域誤差補正のコードブックインデクスLSP2の6番目のビット、同5番目のビット、同4番目のビット、同3番目のビットが続く。NO.20、NO21には前のフレームpのLSPパラメータの5次の高周波数域誤差補正のコードブックインデクスLSP3の4番目のビット、前フレームpの10次の全帯域誤差補正のLSPパラメータのコードブックインデクスLSP5の7番目のビットが続く。またNO.22からNO.24までは、前フレームpの雑音コードブックゲインコードブックインデクスidGL10の2番目のビット、同1番目のビット、同0番目のビットが続く。またNO.25からNO.27までは、前フレームpの雑音コードブックゲインコードブックインデクスidGL11の2番目のビット、同1番目のビット、同0番目のビットが続く。またNO.28からNO.30までは、前フレームpの雑音コードブックゲインコードブックインデクスidGL12の2番目のビット、同1番目のビット、同0番目のビットが続く。
【0108】
またNO.31、NO.32には、前フレームpの雑音コードブックゲインコードブックインデクスidGL13の2番目のビット、同1番目のビットが続く。そして、以下、NO.33からNO.65までには、現在のフレームcのパラメータが、上記NO.0からNO.32までの順番を繰り返すように、入力される。
【0109】
図16には無声音のクラスIIとクラスIIIの入力順を示す。上記図9には記載していなかったがクラスVIIの一部がクラスIIからクラスVIのビットとして、CRCで保護されるが、誤っていても何の処置もされず、クラスVIIのビットと同様に扱われる。先ず、NO.66には前フレームpの雑音コードブックゲインコードインデクスidGL13の0番目のビットが入る。次に、NO.67からNO.69には、前フレームpの5次の低周波数域誤差補正のコードブックインデクスLSP2の2番目のビット、同1番目のビット、同0番目のビットが続く。NO.70からNO.73には、前フレームpの5次の高周波数域誤差補正のコードブックインデクスLSP3の3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。また、NO.74からNO.80には、前フレームpの10次の全帯域誤差補正のLSPパラメータのコードブックインデクスLSP5の6番目のビット、同5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。また、NO.81からNO.86には、前フレームpの雑音コードブックインデクスidSL00の5番目のビット、同4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.87には前フレームpの雑音コードブックインデクスidSL01の5番目が入る。そして、以下、NO.88からNO.109までには、現在のフレームcのパラメータが、上記NO.66からNO.87までの順番を繰り返すように、入力される。
【0110】
無声音のクラスIIIの計4ビットは、NO.110からNO.113に、前フレームpの雑音コードブックインデクスidSL01の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビットが続く。
【0111】
図17には無声音のクラスIVからクラスVIIまでの計46個のビット入力順を示す。前述したように、上記図9には記載していなかったがクラスVIIの一部がクラスIIからクラスVIのビットとして、CRCで保護されるが、誤っていても何の処置もされず、クラスVIIのビットと同様に扱われる。
【0112】
先ず、クラスIVのNO.114には、前フレームpの雑音コードブックインデクスidSL01の0番目のビットが入る。NO.115からNO.117には、前フレームpの雑音コードブックインデクスidSL10の4番目のビット、同3番目のビット、同2番目のビットが続く。
【0113】
クラスVの計4ビットは、NO.118からNO.121に、現在フレームcの雑音コードブックインデクスidSL01の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビットが続く。
【0114】
クラスVIのNO.122には、前フレームpの雑音コードブックインデクスidSL01の0番目のビットが入る。NO.123からNO.125には、現在フレームpc雑音コードブックインデクスidSL10の4番目のビット、同3番目のビット、同2番目のビットが続く。
【0115】
クラスVIIの計34ビットは、NO.126からNO.159までに以下の様に割り当てられる。NO.126、NO.127には前フレームpの雑音コードブックインデクスidSL10の1番目のビット、同0番目のビットが入る。また、NO.128からNO.132には前フレームpの雑音コードブックインデクスidSL11の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。また、NO.133からNO.137には前フレームpの雑音コードブックインデクスidSL12の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。NO.138からNO.142には前フレームpの雑音コードブックインデクスidSL13の4番目のビット、同3番目のビット、同2番目のビット、同1番目のビット、同0番目のビットが続く。そして、NO.143からNO.159までには、上記NO.126からNO.142までの計17個のビットの現在フレームcに関してのビットが繰り返される。
【0116】
そして、ビットレート2kbpsの有声音,無声音の各符号化パラメータが上記図10,図11に示した入力順で、またビットレート4kbpsの有声音,無声音の各符号化パラメータが上記図12〜図17に示した入力順で、図1に示した伝送路符号化器4に入力される。
【0117】
すると、伝送路符号化器4のCRC符号計算部5は、ビットレートの2kbps/4kbpsの違いと、クラス分類に応じ、必要があればクラスIについて次の(1)式に示すCRC多項式により、CRC符号CRC[i]を得る。なお、クラスII以降についても、適当なCRC多項式を使って同様にCRC符号を得る。
【0118】
【数1】
【0119】
但し、
【0120】
【数2】
【0121】
【数3】
【0122】
CRC符号計算部5が上記(1)〜(3)式を用いてCRC符号CRC[i]を得るのは、2kbpsのときのクラスI,クラスII,クラスIV,クラスVまでである。有声音と無声音の両方が対象となるが、本発明ではクラスIを除いて有声音の該当クラスに掛けたCRC符号に応じて検出した誤りに応じて復号装置側で出力を調整することを主旨とする。
【0123】
2kbpsの有声音のクラスI〜クラスVIまでのビット総数を図18に示す。この図18には後述する4kbpsの有声音のクラスI〜クラスVIIまでのビット総数も示す。
【0124】
2kbpsの有声音のクラスIを対象としてCRC符号計算部5は、オーディオフレーム(Audio Frame)44ビットから6ビットのCRC符号CRC[i]、(CRC parity)を計算する。また、クラスIIを対象としたとき、CRC符号計算部5は、オーディオフレーム4ビットから1ビットのCRC parityを計算する。クラスIII〜クラスVを対象としたときも同様に、それぞれ、オーディオフレーム4ビットから1ビットのCRC parityを計算する。クラスVIを対象としたときにはCRC parityを計算しない。
【0125】
そして、例えば、上記(1)式〜(3)式により求めたCRC符号CRC[i]と、上記図10に示した入力順P[i]を使って、以下の(4)式に示すようにビット列CVin[i]を作成する。
【0126】
【数4】
【0127】
一方、4kbpsの有声音のクラスIを対象としてCRC符号計算部5は、オーディオフレーム66ビットから6ビットのCRC parityを計算する。また、クラスIIを対象としたとき、CRC符号計算部5は、オーディオフレーム44ビットから6ビットのCRC parityを計算する。クラスIII〜クラスVIを対象としたときには、それぞれ、オーディオフレーム4ビットから1ビットのCRC parityを計算する。クラスVIIを対象としたときにはCRC parityを計算しない。
【0128】
そして、ここでも、上記(1)式〜(3)式により求めたCRC符号CRC[i]と、上記図12〜図14に示した入力順P[i]を使って、上記(4)式に示すようにビット列CVin[i]を作成する。
【0129】
次に、畳み込み符号化器6は、上述したように必要に応じてCRC符号計算部5から供給される上記CRC検査符号が掛けられたビット群、つまりビット列CVin[i]に畳み込み符号化を施す。この符号化装置では、ビットレート2kbps及び4kbpsのクラスIビットに応じたビット列CVin[i]にのみ畳み込み符号を施し、保護している。
【0130】
畳み込み符号化器6は、上記ビットレート2kbps及び4kbpsのクラスIビットに応じたビット列CVin[i]について、Tailビットを必要としない畳み込み符号化方式、例えばH.223AnnexCで使われているSRCPC(Systematic Rate Compatible Punctured Convolutional Code)により畳み込み符号化を行う。この畳み込み符号化器6での畳み込み符号化は2倍のコードレート(Code Rate)で行われる。上記図18には8/16と示している。したがって、2kbpsのクラスIのトータルのビット数は、(オーディオフレーム44ビット+CRCparity6ビット)×2=100ビットとなる。また、4kbpsのクラスIのトータルのビット数は、(オーディオフレーム66ビット+CRCparity6ビット)×2=144ビットとなる。
【0131】
2kbpsのクラスIIからクラスVまでは、畳み込み符号化を行わず、CRC符号を掛けるだけなので、トータルのビット数は、図18に示すように、(オーディオフレーム4ビット+CRCparity1ビット)×1=5ビットとなる。また、クラスVIでは、CRC符号を生成しないので、オーディオフレーム20ビットのみがトータルビット数となる。
【0132】
4kbpsのクラスIIからクラスVIまでは、畳み込み符号化を行わず、CRC符号を掛けるだけなので、クラスIIのトータルのビット数は、図18に示すように、(オーディオフレーム44ビット+CRCparity6ビット)×1=50ビットとなり、クラスIIIからクラスVIまでは、(オーディオフレーム4ビット+CRCparity1ビット)×1=5ビットとなる。また、クラスVIIでは、CRC符号を生成しないので、オーディオフレーム34ビットのみがトータルビット数となる。
【0133】
したがって、2kbpsのソースコーダー(source coder)は、全てのクラスの合計が140ビットとなるので、ビットレート3.5kbpsとなる。
【0134】
また、4kbpsのソースコーダー(source coder)は、全てのクラスの合計が248ビットとなるので、ビットレート6.2kbpsとなる。
【0135】
そして、このようにクラス分割&入力順決定部23で伝送路の誤りに対するビットの聴感上の感度に応じてクラス分けされ、かつ伝送路符号化器4でクラスに応じて保護された複数種類の符号化パラメータが変調器7で変調され、送信機8で出力ビットに送信処理が施され、アンテナ共用器9を通して、アンテナ10から送信される。
【0136】
次に、上記復号化装置側では、例えば他の携帯電話装置の符号化装置からアンテナ10、アンテナ共用器9、受信機11及び復調器13を介して復調した符号化出力であるビット列を、畳み込み復号化器16で畳み込み復号化し、CRC符号比較&フレームマスク部15でこの畳み込み復号化器16からの畳み込み復号化出力に付加されている上記CRC検査符号と上記重要ビット群を除いたビット群より計算したCRC誤り検査符号とを比較し、その比較結果に応じて上記畳み込み復号化出力を調整する。
【0137】
CRC符号比較&フレームマスク部15は、畳み込み復号化器16が実行する上記畳み込み復号化工程からの畳み込み復号化出力に付加されている上記誤り検査符号を用いて伝送誤りを検査する誤り検査工程と、上記誤り検査工程での誤り検査結果に応じて上記畳み込み復号化出力を調整する出力調整工程とを実行する。
【0138】
特に、CRC符号が一致しないとき、すなわちCRCエラーが検出されるとき、そのフレームのデータを用いて音声復号化を行うと、音声品質を非常に劣化させるので、誤りの検出の連続する度合いに応じて、エラー保護処理(フレームマスキング)が実行される。
【0139】
現在のフレームのフレームマスキング状態は、クラスIのCRC復号結果に基づいて更新される。図19には、フレームマスキング処理による状態遷移図を示す。各状態(状態0から状態7)は、矢印で示した方向に遷移する。遷移は状態0から始まり、遷移線上の“1”は誤りフレームの場合の遷移方向を、“0”は誤りのないフレームの場合の遷移方向を表す。
【0140】
状態の値に応じて以下のパラメータ置換が実行されるが、エラーのない状態では、状態値は0になり、受信した音声フレームビットが処理される。また、状態7は復帰時を示す。
【0141】
例えば、上記LSPパラメータを復号する場合、状態変数stateが「状態1」〜「状態6」であるときには、LSPパラメータは前フレームのものと置換される。
【0142】
状態7、すなわち復帰時には、もしLSP4=0(LSPモードが直接型)であるなら、LSPパラメータは全てのLSP符号から計算される。もしLSP4=1(LSPモードが差分型)なら、LSPパラメータは次の(5)式から計算される。つまり、差分モードでは、LSP0符号からのLSPパラメータは前フレームのものと補間される。
【0143】
【数5】
【0144】
上記(5)式にてLSPbase(n)は基本層のLSPパラメータ、LSPprev(n)は前フレームのLSPパラメータであり、LSP0th(n)はLSP0符号から復号したものである。またPは補間係数であり、図20に示すように、クラスIの直前のCRC誤りフレームの数(frame)により、0.7〜0.0の中で0.1毎に変化する。例えば、過去の誤ったフレームの数が0であれば、P=0.7を使い、基本層のLSPパラメータLSPbase(n)は、0.7・LSPprev(n)+0.3・LSP0th(n)となる。LSP2、LSP3及びLSP5符号は無視され、LSPbase(n)が現在のLSPパラメータとして使用される。
【0145】
また、例えば、上記状態変数stateの値に応じて、出力音の音量を制御するミュート変数muteを図21のように設定する。例えば、状態変数stateが0であれば、ミュート変数muteを1.000とする。また、状態変数stateが6であれば、ミュート変数muteを0.000とする。状態変数state=7でのミュート変数muteは1.0と前フレームのmute値の平均が使われるが、平均が0.8を越えるときは0.8に置換される。
【0146】
有声音パラメータの置換と利得の制御は以下の様になる。
【0147】
有声音/無声音判定パラメータVUVがVであるときには、状態変数state=1〜6では、スペクトルエンベロープのコードブックパラメータidS0、idS1、LPC残差スペクトルゲインコードブックインデスクスidG、4kbps用スペクトルパラメータidS0_4k〜idS3_4kは前フレームのものと置換される。さらに、出力音声の音量を制御するためLSP残差信号のハーモニックレベルパラメータAm[00..127]が次の(6)式のように利得制御される。この(6)式において、Am(org)[i]はスペクトルパラメータから計算したものである。
【0148】
【数6】
【0149】
ところで、状態7において、もし有声音に復帰したとき直前フレームが無声音ならば、上記(6)式の代わりに(7)式が適用される。これはゲインを抑えて連続性を保つためである。つまり、前後のスペクトルの違いによる波形の乱れを抑えるためである。
【0150】
【数7】
【0151】
なお、第0LPC残差スペクトルコードブックインデクスidS0と、第1LPC残差スペクトルコードブックインデクスidS1の前フレームpと現在フレームcのそれぞれ4ビットは、例えば2kbpsでは上記図6に示したように、クラスI及びクラスVIを除く他のクラスであるので、上記図18から1CRCビットにより個別に保護されている。状態0或いは状態7、つまり正常時あるいは復帰時では、同一フレームのこれらのクラスのCRCエラーが同時に検出されると、固定次元の量子化したハーモニクスレベルパラメータAm[00..44]は、次の(8)式に示すように低周波数域のレベルを抑圧するため元のものであるAmqnt(org)[1..44]から変換される。
【0152】
【数8】
【0153】
この(8)式において、s[i]はAmqnt(org)を抑圧するための係数であり、図22に示すように設定される。
【0154】
また、4kbpsでは、第1拡張LPC残差スペクトルコードブックインデクスidS1_4k、第2拡張LPC残差スペクトルコードブックインデクスidS2_4k及び第3拡張LPC残差スペクトルコードブックインデクスidS3_4kのほとんどのビットがクラスIIビットとして複数のCRCビットにより保護されている。クラスIIに誤りが検出されると、拡張層のスペクトルエンベロープが無視される。
【0155】
また、例えば、VUV判定パラメータがUVであるときには、状態変数state=1〜6のとき、雑音コードブックゲインパラメータidGL00、idGL01、4kbps用雑音コードブックゲインパラメータidGL10〜idGL13は前フレームのものと置換される。また同様の場合、雑音コードブックゲインパラメータidGL00、idGL01は前フレームのidGL01、4kbps用雑音コードブックゲインパラメータidGL10〜idGL13は前フレームのidGL13と置換してもよい。雑音コードブックパラメータidSL00、idSL01、4kbps用雑音コードブックパラメータidSL10〜idSL13は個々のビット数の範囲で一様乱数を発生させてできたものを使う。
【0156】
さらに、出力音声の音量を制御するため、LPC残差信号res[00..159]は次の(9)式に示すように利得制御される。ここで、式中のres[i]は雑音符号パラメータから求めたものである。
【0157】
【数9】
【0158】
このようにしてCRC符号比較部&フレームマスク部15でフレームマスキング処理が施された畳み込み符号化出力は、音声復号化器17に供給される。
【0159】
この音声復号化器17の構成を図23及び図24に示す。CRC符号比較部&フレームマスク部15からは、端子202を介して上記LSP(線スペクトル対)の量子化出力に相当するコードブックインデクスが、端子203、204、及び205を介して、エンベロープ量子化出力としてのインデクス、ピッチ、及びVUVパラメータがそれぞれ取り出され、また、端子207を介して、UV(無声音)用のデータとしてのインデクスが取り出される。さらに、CRC符号比較部&フレームマスク部15でCRC検査されて得られたCRCエラー信号は、無声音合成部220に送られている。
【0160】
端子203からのエンベロープ量子化出力としてのインデクスは、逆ベクトル量子化器212に送られて逆ベクトル量子化され、LPC残差のスペクトルエンベロープが求められて有声音合成部211に送られる。有声音合成部211は、サイン波合成により有声音部分のLPC(線形予測符号化)残差を合成するものであり、この有声音合成部211には端子204及び205からのピッチ及びV/UV判定出力も供給されている。有声音合成部211からの有声音のLPC残差は、LPC合成フィルタ214に送られる。また、端子207からのUVデータのインデクスは、無声音合成部220に送られて、雑音コードブックを参照することにより無声音部分の励起ベクトルであるLPC残差が取り出される。このLPC残差もLPC合成フィルタ214に送られる。LPC合成フィルタ214では、上記有声音部分のLPC残差と無声音部分のLPC残差とがそれぞれ独立に、LPC合成処理が施される。あるいは、有声音部分のLPC残差と無声音部分のLPC残差とが加算されたものに対してLPC合成処理を施すようにしてもよい。ここで端子202からのLSPのインデクスは、LPCパラメータ再生部213に送られて、LPCのαパラメータが取り出され、これがLPC合成フィルタ214に送られる。LPC合成フィルタ214によりLPC合成されて得られた音声信号は、出力端子201より取り出される。
【0161】
次に、図24は、上記図23に示した音声復号化器17のより具体的な構成を示している。この図24において、上記図23の各部と対応する部分には、同じ指示符号を付している。
【0162】
入力端子202には、上記CRC符号比較部&フレームマスク部15を介したLSPのベクトル量子化出力、いわゆるコードブックのインデクスが供給されている。
【0163】
このLSPのインデクスは、LPCパラメータ再生部213のLSPの逆ベクトル量子化器231に送られてLSP(線スペクトル対)データに逆ベクトル量子化され、LSP補間回路232、233に送られてLSPの補間処理が施された後、LSP→α変換回路234、235でLPC(線形予測符号)のαパラメータに変換され、このαパラメータがLPC合成フィルタ214に送られる。ここで、LSP補間回路232及びLSP→α変換回路234は有声音(V)用であり、LSP補間回路233及びLSP→α変換回路235は無声音(UV)用である。またLPC合成フィルタ214は、有声音部分のLPC合成フィルタ236と、無声音部分のLPC合成フィルタ237とを分離している。すなわち、有声音部分と無声音部分とでLPCの係数補間を独立に行うようにして、有声音から無声音への遷移部や、無声音から有声音への遷移部で、全く性質の異なるLSP同士を補間することによる悪影響を防止している。
【0164】
また、入力端子203には、上記CRC符号比較部&フレームマスク部15を介したスペクトルエンベロープ(Am)の重み付けベクトル量子化されたコードインデクスデータが供給され、入力端子204には、上記CRC符号比較部&フレームマスク部15を介したピッチパラメータPCHのデータが供給され、入力端子205には、上記CRC符号比較部&フレームマスク部15を介したV/UV判定データが供給されている。
【0165】
入力端子203からのスペクトルエンベロープAmのベクトル量子化されたインデクスデータは、逆ベクトル量子化器212に送られて逆ベクトル量子化が施され、上記データ数変換に対応する逆変換が施されて、スペクトルエンベロープのデータとなって、有声音合成部211のサイン波合成回路215に送られている。
【0166】
なお、エンコード時にスペクトルのベクトル量子化に先だってフレーム間差分をとっている場合には、ここでの逆ベクトル量子化後にフレーム間差分の復号を行ってからデータ数変換を行い、スペクトルエンベロープのデータを得る。
【0167】
サイン波合成回路215には、入力端子204からのピッチ及び入力端子205からの上記V/UV判定データが供給されている。サイン波合成回路215からは、上述した図2、図3のLPC逆フィルタ111からの出力に相当するLPC残差データが取り出され、これが加算器218に送られている。このサイン波合成の具体的な手法については、例えば本件出願人が先に提案した、特願平4−91422号の明細書及び図面、あるいは特願平6−198451号の明細書及び図面に開示されている。
【0168】
また、逆ベクトル量子化器212からのエンベロープのデータと、入力端子204、205からのピッチ、V/UV判定データとは、有声音(V)部分のノイズ加算のためのノイズ合成回路216に送られている。このノイズ合成回路216からの出力は、重み付き重畳加算回路217を介して加算器218に送っている。これは、サイン波合成によって有声音のLPC合成フィルタへの入力となるエクサイテイション(Excitation:励起、励振)を作ると、男声等の低いピッチの音で鼻づまり感がある点、及びV(有声音)とUV(無声音)とで音質が急激に変化し不自然に感じる場合がある点を考慮し、有声音部分のLPC合成フィルタ入力すなわちエクサイテイションについて、音声符号化データに基づくパラメータ、例えばピッチ、スペクトルエンベロープ振幅、フレーム内の最大振幅、残差信号のレベル等を考慮したノイズをLPC残差信号の有声音部分に加えているものである。
【0169】
加算器218からの加算出力は、LPC合成フィルタ214の有声音用の合成フィルタ236に送られてLPCの合成処理が施されることにより時間波形データとなり、さらに有声音用ポストフィルタ238vでフィルタ処理された後、加算器239に送られる。
【0170】
次に、図24の入力端子207s及び207gには、UVデータとしてのシェイプインデクス及びゲインインデクスがそれぞれ供給され、無声音合成部220に送られている。端子207sからのシェイプインデクスは、無声音合成部220の雑音コードブック221に、端子207gからのゲインインデクスはゲイン回路222にそれぞれ送られている。雑音コードブック221から読み出された代表値出力は、無声音のLPC残差に相当するノイズ信号成分であり、これがゲイン回路222で所定のゲインの振幅となり、窓かけ回路223に送られて、上記有声音部分とのつなぎを円滑化するための窓かけ処理が施される。
【0171】
窓かけ回路223からの出力は、無声音合成部220からの出力として、LPC合成フィルタ214のUV(無声音)用の合成フィルタ237に送られる。合成フィルタ237では、LPC合成処理が施されることにより無声音部分の時間波形データとなり、この無声音部分の時間波形データは無声音用ポストフィルタ238uでフィルタ処理された後、加算器239に送られる。
【0172】
加算器239では、有声音用ポストフィルタ238vからの有声音部分の時間波形信号と、無声音用ポストフィルタ238uからの無声音部分の時間波形データとが加算され、出力端子201より取り出される。
【0173】
この出力端子201から取り出された音声復号化出力は、D/A変換器18によりアナログ音声信号とされ、スピーカ19から音声として発せられる。
【0174】
図25及び図26には、上記携帯電話装置が行う符号化方法と、音声復号化方法をまとめたフローチャートを示す。
【0175】
すなわち、携帯電話装置の符号化装置側が実行する音声符号化処理とは、ステップS1の音声符号化工程により入力音声信号を符号化し、ステップS2でステップS1からの複数種類の音声符号化パラメータの内で伝送路誤りに対して聴感上のビット感度が高い重要なビット群を選択し、この重要ビット群からCRC検査符号を計算し、ステップS3でステップS2で計算したCRC検査符号と上記重要ビット群に畳み込み符号化を行う処理である。
【0176】
また、上記携帯電話装置の復号化装置側が実行する音声復号化処理とは、ステップS11で他の携帯電話装置からの畳み込み符号化出力に畳み込み復号化を施した後、ステップS12でCRC保護ビットを持つクラスはCRC符号比較によりエラー検出が行われる。その際、ステップS13でクラスIのエラー検出結果に応じてフレームマスキング状態変数stateが更新される。ここで、もしクラスIにエラーが検出された場合にはステップS14に進み、パラメータ置換によるフレームマスキングが施されてからステップS15に進み音声が復号化される。
【0177】
一方、ステップS13でクラスIにエラーが検出されなかった場合、ステップS16に進み、もし更新されてstate=7ならステップS17に進んで、変数muteが全フレームの変数mute(p)と1との平均をとった結果0.8を越えたか否かをステップS18で判定し、越えなかった場合には平均がセットされ、0.8を越えた場合にはステップS19に進んでmute=0.8をセットする。
【0178】
次に、ステップS20でLSP4=1と判断し、差分モードであるときには、ステップS21に進み、直前のクラスIのエラー数に応じて補間係数がセットされ、ステップS22でLSP復号される。このとき誤差分に当たるLSP2,LSP3,LSP5による成分は加算されない。また、ステップS20でLSP=1でない場合には、ステップS23に進み、通常のLSP復号が行われる。
【0179】
状態変数stateが0或いは7で上記処理後に、ステップS24でvoiced frame(VUV>0)であるなら、ステップS25に進み、LPC残差スペクトルAmをidS0,idS1,idGより復号する、がもしステップS26でidS0とidS1に個別に付加されたCRCビットより同時にエラーが検出された場合、ステップS27で低域抑圧をかける。
【0180】
ところで、上記Amは固定次元に変換されたものなのでピッチに基づく本来の次元に戻すためステップS28で次元変換が行われる。
【0181】
さらにステップS29でレートが4kbpsであるときにはステップS30に進み、Amの拡張成分であるidS2_4k,idS3_4k,idS4_4kをカバーするCRCビットがチェックされるが、その結果エラーが検出されなかった場合のみステップS31で拡張成分が加算される。
【0182】
さらにステップS32でstate=7であり、かつ前フレームのVUVであるprevVUV=0、つまりunvoicedであるとき、ステップS33に進みAmの抑圧が施される。
【0183】
このように、伝送路符号化器4と、符号化器3を符号化装置として送信側に備える携帯電話装置では、伝送路の誤りに強い符号化データを出力することができる。
【0184】
また、本発明に係る復号化方法及び装置を適用した伝送路復号化器と、音声復号化器とを復号化装置として受信側に備えた携帯電話装置では、伝送路誤りによる品質の低下を抑えた音声を復号できる。
【0185】
以上、本発明の復号装置及び方法の具体例となる復号装置を備えた携帯電話装置について説明してきたが、本発明は携帯電話装置の復号装置にのみ適用が限定されるものではない。例えば、伝送システムにも適用できる。
【0186】
図27は、本発明を適用した伝送システム(システムとは、複数の装置が論理的に集合したものをいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成例を示している。
【0187】
この伝送システムでは、上記復号装置をクライアント端末63が備え、上記符号化装置をサーバ61が備えている。クライアント端末63とサーバ61は、例えば、インターネットや、ISDN(Integrated Service Digital Network)、LAN(Local Area Network)、PSTN(Public Switched Telephone Network) などのネットワーク62で接続されている。
【0188】
クライアント端末63からサーバ1に対して、ネットワーク62を介して、例えば、曲などのオーディオ信号の要求があると、サーバ61において、その要求のあった曲に対応するオーディオ信号の符号化パラメータを、ネットワーク62上の伝送路誤りに対するビットの聴感上の感度に応じて保護し、クライアント端末63に伝送する。クライアント端末63では、上記復号方法に応じてサーバー61から伝送路誤りに対して保護されてきた符号化パラメータを復号して例えばスピーカのような出力装置から音声として出力する。
【0189】
図28は、図27のサーバ61のハードウェア構成例を示している。
【0190】
ROM(Read Only Memory)71には、例えば、IPL(Initial Program Loading) プログラムなどが記憶されている。CPU(Central Processing Unit)72は、例えば、ROM71に記憶されているIPLプログラムにしたがって、外部記憶装置76に記憶(記録)されたOS(Operating System)のプログラムを実行し、さらに、そのOSの制御の下、外部記憶装置76に記憶された所定のアプリケーションプログラムを実行することで、オーディオ信号の符号化処理やその符号化により得られた符号化パラメータに対して保護処理を施し、その符号化データの、クライアント端末63への送信処理などを行う。RAM(Random Access Memory)73は、CPU72の動作上必要なプログラムやデータなどを記憶する。入力装置74は、例えば、キーボードやマウス、マイク、外部インターフェースなどで構成され、必要なデータやコマンドを入力するときに操作される。さらに、入力装置74は、外部から、クライアント端末63に対して提供するディジタルオーディオ信号の入力を受け付けるインターフェースとしても機能するようになされている。出力装置75は、例えば、ディスプレイや、スピーカ、プリンタなどで構成され、必要な情報を表示、出力する。外部記憶装置76は、例えば、ハードディスクなどでなり、上述したOSや所定のアプリケーションプログラムなどを記憶している。また、外部記憶装置76は、その他、CPU72の動作上必要なデータなども記憶する。通信装置77は、ネットワーク62を介しての通信に必要な制御を行う。
【0191】
外部記憶装置76に記憶されている所定のアプリケーションプログラムとは、上記図1に示した、音声符号化器3と、伝送路符号化器4と、変調器7の機能をCPU72に実行させるためのプログラムである。
【0192】
また、図29は、図27のクライアント端末63のハードウェア構成例を示している。
【0193】
クライアント端末63は、ROM81乃至通信装置87で構成され、上述したROM71乃至通信装置77で構成されるサーバ61と基本的に同様に構成されている。
【0194】
但し、外部記憶装置86には、アプリケーションプログラムとして、サーバ61からの符号化データを復号するための、本発明に係る復号方法を実行するためのプログラムや、その他の後述するような処理を行うためのプログラムなどが記憶されており、CPU82では、これらのアプリケーションプログラムが実行されることで、伝送路誤りに対して保護された符号化データの復号、再生処理などが行われるようになされている。
【0195】
すなわち、外部記憶装置86には、上記図1に示した、復調器13と、伝送路復号化器14と、音声復号化器17の機能をCPU82に実行させるためのアプリケーションプログラムが記憶されている。
【0196】
このため、クライアント端末63では、外部記憶装置86に記憶されている復号方法を、上記図1に示したハードウェア構成を必要とせず、ソフトウェアとして実現することができる。
【0197】
なお、クライアント端末63では、外部記憶装置86にサーバ61から伝送されてきた上記符号化データを記憶しておいて所望の時間にその符号化データを読み出して上記復号方法を実行し所望の時間に音声を出力装置85から出力するようにしてもよい。また、上記符号化データを外部記憶装置86とは別の外部記憶装置、例えば光磁気ディスクや他の記録媒体に記録しておいてもよい。
【0198】
また、上述の実施の形態においては、サーバ61の外部記憶装置76としても、光記録媒体、光磁気記録媒体、磁気記録媒体等の記録可能な媒体を使用して、この記録媒体に符号化された符号化データを記録しておいてもよい。
【0199】
【発明の効果】
本発明に係る復号装置及び方法によれば、音声信号としての連続性を保ち、高品質の音声を復号することができる。
【0200】
また、本発明に係るプログラム提供媒体を用いることにより、コンピュータシステムにおいて、音声信号としての連続性を保ち、高品質の音声を復号することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態となる携帯電話装置の構成を示すブロック図である。
【図2】上記携帯電話装置を構成する音声符号化器の基本的な構成を示すブロック図である。
【図3】上記音声符号化器の詳細な構成を示すブロック図である。
【図4】ビットレート2kbps及び4kbpsに共通のパラメータを示す図である。
【図5】4kbpsにのみ固有のパラメータを示す図である。
【図6】ビットレート2kbpsのときの有声音パラメータのクラス分割を示す図である。
【図7】ビットレート2kbpsのときの無声音パラメータのクラス分割を示す図である。
【図8】ビットレート4kbpsのときの有声音パラメータのクラス分割を示す図である。
【図9】ビットレート4kbpsのときの無声音パラメータのクラス分割を示す図である。
【図10】ビットレート2kbpsのときの有声音パラメータのチャネルコーダへの入力順を示す図である。
【図11】ビットレート2kbpsのときの無声音パラメータのチャネルコーダへの入力順を示す図である。
【図12】ビットレート4kbpsのときの有声音パラメータのクラスIビットのチャネルコーダへの入力順を示す図である。
【図13】ビットレート4kbpsのときの有声音パラメータのクラスII〜クラスVビットのチャネルコーダへの入力順を示す図である。
【図14】ビットレート4kbpsのときの有声音パラメータのクラスVI,クラスVIIビットのチャネルコーダへの入力順を示す図である。
【図15】ビットレート4kbpsのときの無声音パラメータのクラスIビットのチャネルコーダへの入力順を示す図である。
【図16】ビットレート4kbpsのときの無声音パラメータのクラスII〜クラスVビットのチャネルコーダへの入力順を示す図である。
【図17】ビットレート4kbpsのときの無声音パラメータのクラスVI,クラスVIIビットのチャネルコーダへの入力順を示す図である。
【図18】2kbpsの有声音のクラスI〜クラスVIまで、4kbpsの有声音のクラスII〜クラスVIIまでのビットアサインメントを示す図である。
【図19】上記携帯電話装置を構成する伝送路復号化器の動作を説明するための状態遷移図である。
【図20】上記(7)式にて使用される、補間係数Pの値を示す図である。
【図21】状態変数stateの値に応じて、出力音の音量を制御するミュート変数muteの設定を説明するための図である。
【図22】上記(10)式にて使用される、s[i]の値を示す図である。
【図23】上記音声復号化器の基本的な構成を示すブロック図である。
【図24】上記音声復号化器の詳細な構成を示すブロック図である。
【図25】上記携帯電話装置が行う符号化方法を説明するためのフローチャートである。
【図26】上記携帯電話装置が行う復号化方法を説明するためのフローチャートである。
【図27】本発明を適用できる伝送システムのブロック図である。
【図28】上記伝送システムを構成するサーバのブロック図である。
【図29】上記伝送システムを構成するクライアント端末のブロック図である。
【符号の説明】
3 音声符号化器、4 伝送路符号化器、5 CRC符号計算部、6 畳み込み符号化器、14 伝送路復号化器、15 CRC符号比較部&フレームマスク部、16 畳み込み復号化器、23 クラス分割&入力順決定部
Claims (8)
- 符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号する復号装置において、
上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、
所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号手段を備える復号装置。 - 上記符号化装置における符号化処理は複数個のベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号手段は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、上記符号化単位内で発生した上記インデクスの誤りに応じてフレームマスク処理を異ならせる請求項1記載の復号装置。
- 上記伝送路復号手段は、所定個数以上の符号化単位内で誤りが検出されたときにフレームマスク処理を行い、それ以外のときには誤ったインデクスをそのまま使用する請求項2記載の復号装置。
- 上記符号化装置における符号化処理は交互学習によって作成された多段ベクトル量子化器を用いて行われたものであり、各コードベクトルを表すインデクスが、伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されて来ることにより、上記伝送路復号手段は所定のクラスの上記インデクスに付加されてくる誤り検査符号を検出し、複数個のインデクスに誤りが検出されたか否かに応じてフレームマスク処理を異ならせる請求項1記載の復号装置。
- 上記符号化装置における符号化処理は、音声のスペクトル情報を、交互学習による2段ベクトル量子化器で量子化伝送する符号化処理であり、上記伝送路復号手段は二つのベクトル量子化器の出力であるコードベクトルを表すインデクスが同時に誤った場合に低域を抑圧するフレームマスク処理を施す請求項4記載の復号装置。
- 上記伝送路復号手段は、1個以上の連続する上記時間軸上の所定の符号化単位であるフレームから誤りが検出された後、最初の正常なフレームが受信されたときに、そのフレームが有声音で、かつ誤る前の最後の正常なフレームが無声音だったときに信号のレベルを抑圧するフレームマスク処理を施す請求項1記載の復号装置。
- 符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号するための復号方法において、
上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、
所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号工程を備える復号方法。 - 符号化装置により入力音声信号が時間軸上の所定の符号化単位で区分されて符号化され、かつ伝送路誤りに対するビットの聴感上の感度に応じてクラス分けされて伝送されてきた符号化パラメータを復号するための復号プログラムを提供するためのプログラム提供媒体において、
上記符号化パラメータは、伝送路誤りに対するビットの聴感上の感度に応じて誤り検査符号を掛けた後畳み込み符号化が施されるクラスと、誤り検査符号が掛けられるだけのクラスと、何もされないクラスに分けられており、
所定のクラスの上記符号化パラメータに付加されている誤り検査符号を用いて誤りを検出し、上記符号化単位内で発生した上記符号化パラメータの誤りに応じてフレームマスク処理を異ならせる伝送路復号ステップを備えるプログラムを提供するプログラム提供媒体。
Priority Applications (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17057499A JP4218134B2 (ja) | 1999-06-17 | 1999-06-17 | 復号装置及び方法、並びにプログラム提供媒体 |
EP05016949A EP1596364B1 (en) | 1999-06-17 | 2000-06-15 | Error detection and error concealment for encoded speech data |
DE60038913T DE60038913D1 (de) | 1999-06-17 | 2000-06-15 | Fehlererkennung und Fehlerverdeckung für kodierte Sprachdaten |
EP00305063A EP1061503B1 (en) | 1999-06-17 | 2000-06-15 | Error detection and error concealment for encoded speech data |
DE60026660T DE60026660T2 (de) | 1999-06-17 | 2000-06-15 | Fehlererkennung und Fehlerverdeckung für kodierte Sprachdaten |
KR1020000033320A KR100718712B1 (ko) | 1999-06-17 | 2000-06-16 | 복호장치와 방법 및 프로그램 제공매체 |
TW089111891A TW466843B (en) | 1999-06-17 | 2000-06-16 | Decoding method and apparatus and program furnishing medium |
US09/595,215 US6658378B1 (en) | 1999-06-17 | 2000-06-16 | Decoding method and apparatus and program furnishing medium |
CNB00126270XA CN1201288C (zh) | 1999-06-17 | 2000-06-17 | 解码方法和设备 |
CNB2004100834989A CN100512022C (zh) | 1999-06-17 | 2000-06-17 | 解码方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17057499A JP4218134B2 (ja) | 1999-06-17 | 1999-06-17 | 復号装置及び方法、並びにプログラム提供媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000357999A JP2000357999A (ja) | 2000-12-26 |
JP2000357999A5 JP2000357999A5 (ja) | 2006-04-20 |
JP4218134B2 true JP4218134B2 (ja) | 2009-02-04 |
Family
ID=15907371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17057499A Expired - Lifetime JP4218134B2 (ja) | 1999-06-17 | 1999-06-17 | 復号装置及び方法、並びにプログラム提供媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6658378B1 (ja) |
EP (2) | EP1596364B1 (ja) |
JP (1) | JP4218134B2 (ja) |
KR (1) | KR100718712B1 (ja) |
CN (2) | CN1201288C (ja) |
DE (2) | DE60026660T2 (ja) |
TW (1) | TW466843B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108040463B (zh) * | 2015-08-07 | 2021-06-18 | 数字内窥镜检查有限公司 | 内窥镜、盖子以及盖子形成方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6681203B1 (en) * | 1999-02-26 | 2004-01-20 | Lucent Technologies Inc. | Coupled error code protection for multi-mode vocoders |
WO2002058245A2 (en) * | 2001-01-17 | 2002-07-25 | Koninklijke Philips Electronics N.V. | Method and apparatus for protecting lossless transmission of a data stream |
JP4711099B2 (ja) * | 2001-06-26 | 2011-06-29 | ソニー株式会社 | 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体 |
KR100467326B1 (ko) * | 2002-12-09 | 2005-01-24 | 학교법인연세대학교 | 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기 |
US8359197B2 (en) * | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
US7778826B2 (en) * | 2005-01-13 | 2010-08-17 | Intel Corporation | Beamforming codebook generation system and associated methods |
US7475103B2 (en) * | 2005-03-17 | 2009-01-06 | Qualcomm Incorporated | Efficient check node message transform approximation for LDPC decoder |
WO2006134992A1 (ja) * | 2005-06-17 | 2006-12-21 | Matsushita Electric Industrial Co., Ltd. | ポストフィルタ、復号化装置及びポストフィルタ処理方法 |
KR101244310B1 (ko) * | 2006-06-21 | 2013-03-18 | 삼성전자주식회사 | 광대역 부호화 및 복호화 방법 및 장치 |
CN101548555B (zh) * | 2006-12-07 | 2012-10-03 | Akg声学有限公司 | 用于隐藏多通道布置的一条或多条通道中的信息失落的方法 |
CN101232347B (zh) * | 2007-01-23 | 2011-01-12 | 联芯科技有限公司 | 语音传输的方法及amr系统 |
CN101141644B (zh) * | 2007-10-17 | 2010-12-08 | 清华大学 | 编码集成系统和方法与解码集成系统和方法 |
US20090287489A1 (en) * | 2008-05-15 | 2009-11-19 | Palm, Inc. | Speech processing for plurality of users |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
WO2010103854A2 (ja) * | 2009-03-13 | 2010-09-16 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 |
TWI392373B (zh) * | 2009-09-04 | 2013-04-01 | Nat Univ Chung Cheng | The Method of Reverse Conversion and Sub - sampling of Low Computational Complexity |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN102325224B (zh) * | 2011-09-16 | 2014-01-22 | 成都摩宝网络科技有限公司 | 音频数据传输系统、传输方法及其应用 |
CN103138880B (zh) * | 2011-11-30 | 2016-03-16 | 北京东方广视科技股份有限公司 | 编解码方法和设备 |
US9105270B2 (en) * | 2013-02-08 | 2015-08-11 | Asustek Computer Inc. | Method and apparatus for audio signal enhancement in reverberant environment |
TWI557724B (zh) * | 2013-09-27 | 2016-11-11 | 杜比實驗室特許公司 | 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器 |
KR102356012B1 (ko) * | 2013-12-27 | 2022-01-27 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
EP2922055A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
EP2922054A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
US10361717B2 (en) | 2016-06-17 | 2019-07-23 | Huawei Technologies Co., Ltd. | Apparatus and methods for error detection coding |
US10880062B2 (en) * | 2017-06-29 | 2020-12-29 | Qualcomm Incorporated | Providing protection for information delivered in demodulation reference signals (DMRS) |
CN110190857B (zh) * | 2019-04-28 | 2023-04-11 | 深圳大学 | 一种crc辅助校验极化码译码方法和智能终端 |
CN114915380B (zh) * | 2022-07-19 | 2022-09-30 | 中国科学院宁波材料技术与工程研究所 | 基于can总线的低成本高实时自动纠错通讯系统及方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5255343A (en) * | 1992-06-26 | 1993-10-19 | Northern Telecom Limited | Method for detecting and masking bad frames in coded speech signals |
JP3343965B2 (ja) * | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
CN1064773C (zh) * | 1993-06-30 | 2001-04-18 | 索尼公司 | 数字信号的编码方法和解码方法 |
US5754127A (en) * | 1994-02-05 | 1998-05-19 | Sony Corporation | Information encoding method and apparatus, and information decoding method and apparatus |
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
US5754734A (en) * | 1995-10-31 | 1998-05-19 | Motorola, Inc. | Method of transmitting voice coding information using cyclic redundancy check bits |
JP3475985B2 (ja) * | 1995-11-10 | 2003-12-10 | ソニー株式会社 | 情報符号化装置および方法、情報復号化装置および方法 |
JP2838994B2 (ja) * | 1995-12-27 | 1998-12-16 | 日本電気株式会社 | データ信号受信装置 |
JPH11122120A (ja) * | 1997-10-17 | 1999-04-30 | Sony Corp | 符号化方法及び装置、並びに復号化方法及び装置 |
-
1999
- 1999-06-17 JP JP17057499A patent/JP4218134B2/ja not_active Expired - Lifetime
-
2000
- 2000-06-15 EP EP05016949A patent/EP1596364B1/en not_active Expired - Lifetime
- 2000-06-15 EP EP00305063A patent/EP1061503B1/en not_active Expired - Lifetime
- 2000-06-15 DE DE60026660T patent/DE60026660T2/de not_active Expired - Lifetime
- 2000-06-15 DE DE60038913T patent/DE60038913D1/de not_active Expired - Lifetime
- 2000-06-16 TW TW089111891A patent/TW466843B/zh not_active IP Right Cessation
- 2000-06-16 KR KR1020000033320A patent/KR100718712B1/ko not_active IP Right Cessation
- 2000-06-16 US US09/595,215 patent/US6658378B1/en not_active Expired - Lifetime
- 2000-06-17 CN CNB00126270XA patent/CN1201288C/zh not_active Expired - Lifetime
- 2000-06-17 CN CNB2004100834989A patent/CN100512022C/zh not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108040463B (zh) * | 2015-08-07 | 2021-06-18 | 数字内窥镜检查有限公司 | 内窥镜、盖子以及盖子形成方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1061503A2 (en) | 2000-12-20 |
CN1604483A (zh) | 2005-04-06 |
DE60026660D1 (de) | 2006-05-11 |
CN1283007A (zh) | 2001-02-07 |
EP1596364B1 (en) | 2008-05-14 |
EP1596364A1 (en) | 2005-11-16 |
JP2000357999A (ja) | 2000-12-26 |
CN1201288C (zh) | 2005-05-11 |
EP1061503A3 (en) | 2003-05-14 |
KR20010007417A (ko) | 2001-01-26 |
KR100718712B1 (ko) | 2007-05-15 |
DE60026660T2 (de) | 2006-12-07 |
EP1061503B1 (en) | 2006-03-15 |
DE60038913D1 (de) | 2008-06-26 |
CN100512022C (zh) | 2009-07-08 |
US6658378B1 (en) | 2003-12-02 |
TW466843B (en) | 2001-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4218134B2 (ja) | 復号装置及び方法、並びにプログラム提供媒体 | |
US6230124B1 (en) | Coding method and apparatus, and decoding method and apparatus | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
US7636055B2 (en) | Signal decoding apparatus and signal decoding method | |
JP4166673B2 (ja) | 相互使用可能なボコーダ | |
JP4438127B2 (ja) | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 | |
US9082398B2 (en) | System and method for post excitation enhancement for low bit rate speech coding | |
US10607624B2 (en) | Signal codec device and method in communication system | |
JP4040126B2 (ja) | 音声復号化方法および装置 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
JP3896654B2 (ja) | 音声信号区間検出方法及び装置 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JPH08160996A (ja) | 音声符号化装置 | |
JP2962623B2 (ja) | 音声符号の誤り検出方法 | |
KR20150014607A (ko) | 통신 시스템에서 오류 은닉 방법 및 장치 | |
Fumoto et al. | A low‐bit‐rate speech codec using multiband excitation and LPC modeling of harmonic magnitudes for private mobile radio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080617 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081103 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111121 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4218134 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111121 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111121 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121121 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121121 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131121 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |