JP4135240B2 - 受信装置及び方法、通信装置及び方法 - Google Patents
受信装置及び方法、通信装置及び方法 Download PDFInfo
- Publication number
- JP4135240B2 JP4135240B2 JP35483198A JP35483198A JP4135240B2 JP 4135240 B2 JP4135240 B2 JP 4135240B2 JP 35483198 A JP35483198 A JP 35483198A JP 35483198 A JP35483198 A JP 35483198A JP 4135240 B2 JP4135240 B2 JP 4135240B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- sampling frequency
- noise reduction
- reduction processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
本発明は、通信や放送によって伝えられた、音声信号の音声パラメータ符号を使って音声信号を合成する受信装置及び方法、通信装置及び方法に関する。
【0002】
【従来の技術】
従来の通信装置では、受話側における入力音声と出力音声のサンプリング周波数が同一であると共に、音声周波数帯域も同一であった。これは、電話回線の伝送帯域が例えば300〜3400Hzと狭く、電話回線を介して送られてくる音声信号の周波数帯域が制限されてしまうためである。
【0003】
【発明が解決しようとする課題】
ところで、上記伝送帯域が制限された、入力音声と同様の音声周波数帯域で出力される音声では音質はあまり良好とは言えない。つまり、聴覚的品質が劣る。また、ディジタル携帯電話の音質についても不満がある。
【0004】
本発明は、上記実情に鑑みてなされたものであり、聴覚的品質を向上させた受話音声を得ることのできる受信装置及び方法、通信装置及び方法の提供を目的とする。
【0005】
【課題を解決するための手段】
本発明に係る受信装置は、上記課題を解決するために、第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数fs2とされた第1の帯域B1の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2の第2の帯域B2の音声信号を加算する加算手段と、上記加算手段からの加算出力に雑音低減処理を施す雑音低減処理手段とを備え、上記雑音低減処理手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた雑音低減処理をf s2 /f s1 回施す。
【0006】
ここで、上記雑音低減処理手段は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をfs2/fs1回行う。
【0007】
また、本発明に係る受信方法は、上記課題を解決するために、第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域B1の音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を加算し、その加算出力に雑音低減処理を施すようにし、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記雑音低減処理を上記加算出力に対してf s2 /f s1 回施す。
【0008】
本発明に係る通信装置は、上記課題を解決するために、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成する送信手段と、上記伝送信号を受信する受信手段とを備え、上記受信手段は、第1のサンプリング周波数f s1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B 1 の音声信号のサンプリング周波数を第2のサンプリング周波数f s2 (f s2 >f s1 )に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第1の帯域B 1 の帯域外成分である第2の帯域B 2 の第2のサンプリング周波数f s2 の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数f s2 とされた第1の帯域B 1 の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数f s2 の第2の帯域B 2 の音声信号を加算する加算手段と、上記加算手段からの加算出力に雑音低減処理を施す雑音低減処理手段とを備え、上記雑音低減処理手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた雑音低減処理をf s2 /f s1 回施す。
【0009】
ここで、上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記雑音低減処理手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をfs2/fs1回行う。
【0010】
また、本発明に係る通信方法は、上記課題を解決するために、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域B2の音声信号とを加算した加算出力に、雑音低減処理を施すようにし、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいて上記雑音低減処理をf s2 /f s1 回行う。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。この実施の形態は、本発明に係る受信装置の具体例となる、図1に示す受信装置1である。この受信装置1は、パーソナルディジタルセルラー(Personal Digital Cellular,PDC)として、現在広く使用されている、ディジタル携帯電話の受話側に適用される。
【0012】
受信装置1は、第1のサンプリング周波数fs1の音声信号を生成するために後述する送信装置から基地局を介して伝送されてきた伝送信号に基づく音声パラメータ符号から、第2のサンプリング周波数fs2(fs2>fs1)の音声信号を生成する。第1のサンプリング周波数fs1としては8KHzを、第2のサンプリング周波数fs2としては16KHzを用いる。
【0013】
アンテナ2を介して基地局から受信した音声パラメータ符号は、RF(RF受信部)アンプ3、制御部4を経由して信号処理装置5のメモリ5aに格納される。
【0014】
信号処理装置5のメモリ5aに格納された音声パラメータ符号は、信号処理装置5の復号部で復号処理された後、所定の信号処理が施されて出力される。
【0015】
信号処理装置5からの出力信号は、D/A変換器6でアナログ信号とされた後、アンチエイリアシングフィルタ7、ボリューム8及びアンプ9を経由してスピーカ10から出力される。なお、制御部4には例えばキー操作部11とLCD表示部12が接続されている。
【0016】
図2には、上記音声パラメータ符号を例えば無線伝送路、及び基地局を介して送信する、送信装置15の構成を示す。この送信装置15もPDCとして、現在広くしようされている、ディジタル携帯電話の送話側に適用される。
【0017】
マイクロホン16から入力された音声信号は、アンプ17,ボリューム18,アンチエイリアシングフィルタ19及びA/D変換器20を経由して信号処理装置21のメモリ21aに格納される。
【0018】
メモリ21aに格納された音声信号は、信号処理装置21内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。この音声パラメータ符号は、制御部22及びRF(RF送信)アンプ23及びアンテナ24を経由して基地局へ送信される。なお、制御部22にはキー操作部25とLCD表示部26が接続されている。
【0019】
ここで、信号処理装置21内部の音声符号化部は、無線伝送路により制限される狭帯域化を考慮した音声パラメータ符号を生成する。一般的には、300Hz〜3400Hzの伝送帯域を考慮している。上記伝送信号に基づく音声パラメータ符号は、制御部22を介してRFアンプ23に供給される。例えば、音声パラメータ符号としては、励振源に関する線形予測(LPC)残差や、線形予測係数αがある。他には、ピッチ周波数に関するラグLAGや、例えば20msecのフレームにおけるフレームパワーR0等がある。
【0020】
図1の受信装置1内部の信号処理装置5は、図3に示すデコーダ27と、図4に示す帯域幅拡張部32とを備えてなる。
【0021】
上記図2に示した送信装置15の信号処理装置21における音声符号器での符号化方法がPSI−CELP(Pitch Synchronus Innovation - CELP:ピッチ同期雑音励振源−CELP)符号化方式によるものであるとすれば、デコーダ27は、PSI−CELP符号化による伝送信号を用いて音声をデコードし、出力端子28にデコード音声SndNを、出力端子29に線形予測係数αNを、出力端子30に励振源NExcNを供給する。PSI−CELP符号化による伝送信号は、第1のサンプリング周波数fs1=8KHzの第1の帯域B1=300〜3400Hzの音声信号を生成するために伝送されてきたものである。
【0022】
帯域幅拡張部32は、第1のサンプリング周波数fs1(=8KHz)の音声信号を生成するために送信装置から伝送されてきたPSI−CELP符号化による伝送信号を基にデコーダ27が復号した第1の帯域B1(300〜3400Hz)のデコード音声SndNのサンプリング周波数を第2のサンプリング周波数fs2(=16KHz)に変換するサンプリングレート変換手段と、上記デコーダ27が上記PSI−CELP符号化による伝送信号をデコードして得た線形予測係数αNと、励振源NExcNとを使って第2のサンプリング周波数fs2(=16KHz)の第2の帯域B2(3400Hz〜6000Hz)の信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数fs2(=16KHz)とされた第1の帯域B1(300〜3400Hz)の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2(=16KHz)の第2の帯域B2(3400Hz〜6000Hz)の音声信号を加算する加算手段と、上記加算手段からの加算出力(300Hz〜6000Hz)に雑音低減処理を施す雑音低減処理手段とを備える。
【0023】
ここで、上記サンプリングレート変換手段は図4におけるアップサンプル回路45である。また、上記加算手段は加算器46であり、上記雑音低減処理手段は雑音低減処理部47である。また、上記帯域外成分推測手段は、図4において、アップサンプル回路45と、加算器46と、雑音低減処理部47を除いた部分である。
【0024】
以下、帯域幅拡張部32の構成を詳細に説明する。先ず、上記帯域外成分推測手段について説明する。上記帯域外成分推測手段は、線形予測係数→自己相関(αN→rN)変換回路36と、自己相関(r)広帯域化部37と、広帯域コードブック(rwCB)38と、自己相関→線形予測係数(rw→αw)変換部39と、LPC合成部40と、励振源拡張部41と、高域抽出&抑圧フィルタ42と、乗算器43とからなる。
【0025】
入力端子34から供給された線形予測係数αNは、線形予測係数→自己相関(αN→rN)変換回路36に供給される。このαN→rN変換回路36は、線形予測係数αNを自己相関rNに変換し、自己相関(r)広帯域化部37に供給する。自己相関(r)広帯域化部37は広帯域コードブック(rwCB)38を用いて自己相関rを広帯域化(拡張化)する。広帯域コードブック(rwCB)38は広帯域音から抽出した自己相関パラメータrwを用いて予め作成されている。
【0026】
広帯域コードブック(rwCB)38を用い、自己相関(r)広帯域化部37が拡張した拡張自己相関rwは自己相関→線形予測係数(rw→αw)変換部39に供給される。rw→αw変換部39は拡張自己相関rwを拡張線形予測係数αwに再度変換してからLPC合成部40に供給する。LPC合成部40はrw→αw変換部39からの広帯域線形予測係数αwと後述する励振源拡張部41からの拡張励振源に基づいて広帯域音声を合成する。
【0027】
LPC合成回路40の合成出力は、高域抽出&抑圧フィルタ42に供給される。高域抽出&抑圧フィルタ42は、周波数帯域300Hz〜3400Hzの信号成分を除去し、第2の帯域B2=3400Hz〜6000Hzの信号成分を抽出するように、高い周波数成分を抑圧する。このフィルタ42からのフィルタ出力には、端子44から供給されるゲインが乗算器43で乗算される。乗算器43でゲインが乗算された出力(第2の帯域B2=3400Hz〜6000Hz)は、加算器46に供給される。
【0028】
上記LPC合成部40には、上述したように励振源拡張部41からの拡張励振源も供給される。励振源拡張部41は、入力端子35から供給された励振源に関するパラメータとしてのLPC残差(このLPC残差を励振源NExcNと記す。)を拡張する。この励振源拡張部41の詳細な構成を図5に示す。
【0029】
先ず、入力端子35を介して供給された励振源NExcNは、アップサンプル回路50によりアップサンプルされる。アップサンプル回路50の出力は、LPF51、ブースト回路52を介して出力端子55からLPC合成部40に送られる。すなわち、励振源NExcNをアップサンプルした信号は、音声信号を合成する際の上記拡張励振源として用いられる。ブースト回路52は、破擦音や摩擦音が検出された場合に、上記拡張励振源をブーストするためのもので、そのブースト量は破擦音検出回路54の出力により制御される。破擦音検出回路54は、入力端子53を介して上記αN→rN変換回路36からの自己相関rNを受け取り、破擦音や摩擦音を検出する。
【0030】
また、帯域幅拡張部32は、上述したように上記サンプリングレート変換手段として、入力端子33から供給された、第1の帯域B1=300〜3400Hzのデコード音声SndNのサンプリング周波数をfs1=8kHzからfs2=16kHzにアップサンプルするアップサンプル回路45を備えている。
【0031】
そして、アップサンプル回路45でサンプリング周波数が第2のサンプリング周波数fs2=16kHzに変換された、第1の帯域B1=300Hz〜3400Hzの音声信号成分と、乗算器43からの乗算出力である、第2のサンプリング周波数fs2=16kHzの第2の帯域B2=3400Hz〜6000Hzの音声信号成分とを加算器46で加算する。
【0032】
さらに、加算器46からの加算出力となる、帯域300〜6000Hz、サンプリング周波数が16kHzの広帯域音声信号Sndwを、雑音低減処理部47に供給する。
【0033】
この雑音低減処理部47は、本件出願人が既に出願した、特開平7−193548号公報に開示されている、雑音低減処理方法を用いて、背景雑音を検出し、抑圧する。この雑音低減処理方法は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいて雑音低減処理の内容を変化させる。
【0034】
図6には、上記雑音低減処理方法を適用した、雑音低減処理部47の詳細な構成を示す。上記加算器46からの加算出力となる、帯域300〜6000Hz、サンプリング周波数が16kHzの広帯域音声信号Sndwは入力端子131を介して、フレームパワー計算回路132に供給される。フレームパワー計算回路132は、例えば周期20msecのフレーム毎のパワーとして、例えば自乗平均の平方根、いわゆるrms値を計算する。このフレームパワー計算回路132で計算されたフレーム平均パワー値は、抑圧比計算回路133に供給される。抑圧比計算回路133は、上記フレームパワー計算回路132で計算されたフレーム平均パワーを用いて、雑音を抑圧するための係数である抑圧比を計算する。抑圧比計算回路133で計算された抑圧比は、スムージング回路143に送られる。スムージング回路134は、抑圧比計算回路133で計算された抑圧比にスムージング処理を施す。このスムージング処理とは、例えば20msecで160サンプルのフレーム単位で分割された入力音声信号のつながりの不連続性を避けるための処理である。このスムージング処理が施された抑圧比は、ノイズリデュース回路135に送られ、このノイズリデュース回路135において上記広帯域音声信号Sndwの雑音を除去するために用いられる。
【0035】
抑圧比計算回路133には、端子138を介して入力された雑音レベル検出信号をレベル弁別回路137で弁別して得られた制御信号が供給されており、この制御信号に応じて、例えば上記抑圧比計算のしきい値が切換制御されるようになっている。
【0036】
以上の構成の帯域幅拡張部32における、主要な動作原理について以下に説明する。帯域幅拡張部32は、300Hz〜3400Hzの第1の帯域B1の音声信号を生成するための音声パラメータ符号から3400Hz〜6000Hzという第2の帯域B2用の音声符号化パラメータを生成し、広帯域LPC合成を行う。その後、原音声の周波数帯域である低域(300Hz〜3400Hz)側を、原音声を16KHzにアップサンプルしたものに置換する。すなわち、高域通過フィルタを施し高域(3400Hz〜6000Hz)のみを残し、この高域成分の中でも高い周波数成分を抑圧し、さらにゲインを調整し、その後、原音声(300Hz〜3400Hz)をアップサンプル(第2のサンプリング周波数fs2)したものに加算する。
【0037】
ここで、音声パラメータ符号の広帯域化(或いは拡張化)は、線形予測係数αの広帯域化、励振源NExcNの広帯域化の二つが必要である。また、αの広帯域化には、αと相互に変換可能なパラメータである自己相関rによるコードブックを予め作成しておく必要がある。このコードブックによる量子化、逆量子化によって自己相関rが広帯域化される。
【0038】
先ず、線形予測係数αの広帯域化について説明する。αはスペクトル包絡を表すフィルタ係数であることに着目し、高域側を推定しやすい別のスペクトル包絡を表すパラメータである自己相関rに一旦変換し、これを広帯域化し、その後で広帯域(或いは拡張)自己相関rwから広帯域(或いは拡張)線形予測係数αwに逆変換する。拡張にはベクトル量子化を用いる。狭帯域自己相関rnをベクトル量子化し、そのインデックスから対応するrwを求めればよい。
【0039】
狭帯域自己相関と広帯域自己相関には、後述するように一定の関係が成り立つため、広帯域自己相関によるコードブックのみを用意すればよく、狭帯域自己相関をこれによりベクトル量子化でき、また逆量子化により広帯域自己相関が求まる。
【0040】
狭帯域信号を、広帯域信号を帯域制限したものとすれば、広帯域自己相関と狭帯域自己相関には以下の(1)式に示す関係がある。
【0041】
【数1】
【0042】
ここで、φは自己相関、xnは狭帯域信号、xwは広帯域信号、hは帯域制限フィルタのインパルス応答である。
【0043】
さらに、自己相関とパワースペクトルの関係から、次の(2)式が得られる。
【0044】
【数2】
【0045】
この帯域制限フィルタのパワー特性と等しい周波数特性を持つ、もう一つの帯域制限フィルタを考え、これをH’とすれば、上記(2)式は、次の(3)式のようになる。
【0046】
【数3】
【0047】
この新たなフィルタの通過域、阻止域は当初の帯域制限フィルタと同等であり、減衰特性が2乗となる。したがって、この新たなフィルタもまた、帯域制限フィルタといえる。これを考慮すると、狭帯域自己相関は、広帯域自己相関と帯域制限のフィルタのインパルス応答との畳み込み、すなわち広帯域自己相関を帯域制限したものと単純化される。すなわち、次の(4)式となる。
【0048】
【数4】
【0049】
以上より、狭帯域自己相関をベクトル量子化するにあたっては、広帯域コードブックのみを用意すれば、量子化時に必要な狭帯域ベクトルは演算により作成が可能であり、狭帯域自己相関から予めコードブックを用意しておく必要がないことが分かる。
【0050】
さらに、各広帯域自己相関のrwコードベクタは単調減少もしくはなだらかに増減するカーブを持つために、上記H’により低域通過させても大きな変化がなく、rn量子化は、直接rwコードブックで行える。ただし、サンプリング周波数が1/2のため、1次おきに比較する必要がある。
【0051】
線形予測係数αの拡張は有声音(V)と無声音(UV)に分けることによって、さらに精度良い拡張が可能であるため、これも行っている。これに伴いコードブックもV用、UV用の二つを用いている。
【0052】
次に、励振源の拡張について説明する。PSI−CELPにおいては狭帯域での励振源を、図5のアップサンプル回路50でゼロ値を挿入することでアップサンプルし、エイリアシング歪みを発生させたものを用いる。この方法は非常に単純であるが、元の音声のパワーや調波構造の差分が保存されるので、励振源としては十分な品質であるといえる。
【0053】
そして、以上で得られた広帯域αと広帯域励振源によりLPC合成回路40でLPC合成を行う。
【0054】
また、広帯域LPC合成された音声は、このままでは品質が悪いので、低域側はコーデック出力のオリジナル音声SndNで置換する。このために、合成音のうち3400Hz以上を抽出し、一方でコーデック出力をfs=16KHzにアップサンプルし、これらを加算する。
【0055】
このとき、乗算器43で高域側に乗算するゲインをユーザの好みに応じてゲイン調整器で調整可能としている。ユーザ毎の個人差が大きいため、この値を可変にしている。高域側ゲインの値をユーザからの入力により予め設定しておき、この値を参照し、乗算を行う。
【0056】
また、加算前に高域側に対し、高域抽出&抑圧フィルタ42で約6KHz以上の成分を若干抑圧するフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数を選択可能とし、予め選択されたフィルタにより処理を行うことで、好みに応じ高域側の周波数帯域を選択可能とした。このフィルタの選択もユーザの入力により設定する。
【0057】
なお、このフィルタ42を用いての処理は、低域側のパワー特性に影響を与えないため、加算後に行っても良い。あるいは、あえて低域側にも影響のあるフィルタを加算後に施す事も可能である。以上により広帯域音声が得られる。
【0058】
次に、以上の動作原理に基づいて、帯域幅拡張部32が広帯域音声信号を生成する動作について図7のフローチャートを用いて説明する。
【0059】
ステップS1で図4に示したαN→rN変換回路36は、図3に示したデコーダ27によりデコードされた線形予測係数αNを自己相関rNに変換する。また、デコーダ27でデコードされた音声信号SndNはステップS2でV/UV判定される。
【0060】
このステップS2での判定結果がVであると、ステップS4では有声音用自己相関rNを量子化する。この量子化は、ステップS3で求めた狭帯域V用パラメータを用いる。すなわち、広帯域Vのコードブック38から、1次おきに比較して求めた狭帯域V用パラメータを用いる。
【0061】
一方、ステップS2での判定結果がUVであるときには、ステップS4ではステップS3で求めた狭帯域UV用パラメータを用いて無声音用自己相関rを量子化する。
【0062】
そして、ステップS5でそれぞれ広帯域Vコードブック又は広帯域UVコードブックを用いて逆量子化し、これにより広帯域自己相関rWが得られる。広帯域自己相関rWはステップS6でrW→αW変換回路39によりαWに変換される。
【0063】
一方、デコーダ27からの励振源は、ステップS7で図5に示したアップサンプル回路50によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。これが広帯域励振源として、LPC合成回路40に供給される。
【0064】
そして、ステップS8で、LPC合成回路40が広帯域αWと広帯域励振源とを、LPC合成し、広帯域の音声信号が得られる。
【0065】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれているので品質が悪い。特に入力狭帯域音声の周波数範囲(300Hz〜3400Hz)に関しては、コーデック出力のオリジナル音声SndN(入力音声)をそのまま利用したほうが良い。
【0066】
したがって、LPC合成回路40からの合成音のうち、入力狭帯域音声の周波数範囲300〜3400HzをステップS9でバンドストップフィルタ(BSP)を用いたフィルタリングにより除去する。
【0067】
そして、ステップS10でアップサンプル回路45により上記オリジナル音声SndNをアップサンプルしたものと、ステップS13で加算器46により加算する。このとき、ステップS11で高域側に対し、約6KHz以上の成分を若干抑圧する高域抽出&抑圧フィルタ42によりフィルタリングすることで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能とされている。
【0068】
さらに、ステップS12では、乗算器43を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【0069】
なお、ここで、帯域幅拡張部32で用いる、コードブックの作成について説明する。コードブックの作成は一般によく知られたGLA(Generalized Lloyd Algorithm)による方法である。広帯域音声を一定時間、例えば20msecごとのフレームに区切り、そのフレーム毎に、一定次例えば6次までの自己相関を求めておく。このフレーム毎の自己相関をトレーニングデータとし、6次元のコードブックを作成する。このとき、有声音、無声音の区別を行い、有声音の自己相関、無声音の自己相関を別々に集め、それぞれのコードブックを作成してもよい。この場合、帯域拡張処理中αの拡張時、コードブックを参照するが、このときにも有声音、無声音の判別を行い、対応するコードブックを利用する。
【0070】
帯域幅拡張部32では、広帯域有声音用コードブックと広帯域無声音用コードブックを用いている。この広帯域有声音用コードブックの作成については図8を、広帯域無声音用コードブックの作成については図9を参照しながら説明する。
【0071】
先ず、広帯域音声信号を学習用に用意し、図8のステップS31で1フレーム20msecにフレーミングする。次に、ステップS32で各フレームにおいて、例えばフレームエネルギーやゼロクロスの値等を調べることによって有声音(V)か無声音(UV)かの分類を行う。
【0072】
そして、ステップS33で広帯域有声音フレームにおいて、例えば6次までの自己相関パラメータrを計算する。また、ステップS34では広帯域無声音フレームにおける、例えば6次までの自己相関パラメータrを求める。
【0073】
この各フレームの6次の自己相関パラメータから、図9のステップS41で広帯域パラメータを抽出し、GLAにより次元6の広帯域V(UV)コードブックをステップS42で作成する。
【0074】
以上、PSI−CELPによる復号化方法を用いた帯域幅拡張部32では、サンプリング周波数を8KHzから16KHzに変換した高品質の広帯域音声信号を提供することができる。
【0075】
さらに、この帯域幅拡張部32は、既に構成を示した雑音低減処理部47により、上記広帯域音声信号の雑音を低減できる。この雑音低減処理部47の動作について詳細に説明する。
【0076】
図6のフレームパワー計算回路132は、上記フレーム当たりの上記広帯域音声信号Sndwの平均パワーrmsを計算する。この平均パワーrmsは抑圧比計算回路133に供給される。
【0077】
抑圧比計算回路133は、平均パワーrmsと、あるしきい値nr1とを比較し、その比較結果により、抑圧比scaleを計算する。すなわち、この抑圧比scaleは、上記平均パワーrmsがしきい値nr1以上のとき1とし、しきい値nr1よりも小さいとき、
scale=rms/K ・・・(5)
とする。ここで、Kは定数である。この例の場合には、K=nr1となる。
【0078】
あるいは、全てのrmsについて上記(5)式を計算し、その計算結果としての抑圧比scaleが1よりも小(scale<1)となる場合には、この(5)式で計算された抑圧比scaleを上記広帯域音声信号Sndwに乗算する。これは、上記平均パワーrmsが上記しきい値rn1よりも小となるフレームにおいては、上記広帯域音声信号Sndwに1よりも小さいゲインを乗算することを意味する。また、この(5)式の結果、抑圧比scaleが1以上(scale≧1)となる場合には、上記広帯域音声信号Sndwには何も処理を施さずそのまま出力する。これは、抑圧比scaleが上記しきい値となるフレームにおいては、上記広帯域音声信号Sndwに1のゲインを乗算することを意味する。したがって、このしきい値nr1を適切に選ぶことにより、雑音部分のようなパワーの小さい部分ではゲインが小さく制御されることになり、実質的に雑音低減の効果が得られる。なお、上記(5)式を用いた場合のノイズ抑圧の効果は、入力信号の平均パワーに対して1/2倍となる。
【0079】
また、ノイズの抑圧がききすぎる場合や、一定レベル以下をミュートする回路と組み合わせて使用する場合などにおいては、上記しきい値nr1(これを第1のしきい値とする。)よりも小さい第2のしきい値nr2を設定し、入力レベルがこの第2のしきい値nr2よりも小さくなる領域で、抑圧を小さく、すなわちエキスパンダの伸長作用の強さを弱めることが好ましい。
【0080】
ところで、入力された信号に対して音声と雑音とを区別して処理しているわけではないので、子音などの音声パワーが相対的に小さいところで音声が無くなる傾向がある。特に強くノイズリデュースをかけたときにこの現象が顕著に現れ、音声の種類によってはかなりの違和感を感じる。したがって、フレーム平均パワーに対して、どの程度の強さでノイズリデュースをかけるか、またどのくらいの大きさからかけるかの検討が必要になってくる。
【0081】
また、上記のような処理をフレーム単位で行うと、フレームでの音声のつながりが不連続になり、聞いたときに不自然感を感じてしまう。
【0082】
これらのことを考慮して、上記抑圧比scaleに対してアタックタイム、リカバリタイムを設定し、例えばフレーム単位のスムージングを行うことにより、上記不自然感が出ないようにすることが考えられる。
【0083】
すなわち、上記図6の構成からも明らかなように、抑圧比計算回路133で計算して求められた抑圧比scaleは、一旦スムージング回路134によるスムージング処理を施した後、ノイズリデュース回路135に送るようにしている。
【0084】
このスムージング回路134は、上述したようなノイズ低減処理において生じる問題を解決するために設けられたものであり、上記アタックタイム、リカバリタイムを設定している。この例では、アタックタイムを“0”とし、リカバリータイムは可変としている。
【0085】
すなわち、計算した現在のフレームの音声パワーが前のフレームより大きい時にはその値をそのまま使い、逆に小さい場合は所定の特性を備えるローパスフィルタ(LPF)によりスムージングを行い、フレームパワーの変化による処理の不自然感が出ないようにする。
ノイズリデュース回路135は、上記広帯域音声信号Sndwにスムージング回路134を介した抑圧比scaleを乗算して入力信号Sndwの雑音低減処理を行い、雑音が低減された出力信号を出力端子136から出力している。
【0086】
ところで、上記抑圧比計算回路133には、端子138を介した雑音レベル検出信号をレベル弁別回路137で弁別して得られた制御信号が供給されている。この制御信号に応じて、上記抑圧比計算のしきい値が切換制御されている。すなわち、抑圧比計算のしきい値は、雑音レベル検出信号に基づいている。
【0087】
この雑音レベル検出信号は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の音声レベルである。
【0088】
ここでは、図示を省略しているが、上記音声パラメータ符号から背景雑音区間を検出する雑音区間検出回路と、この雑音区間検出回路で検出された雑音区間の雑音レベルを検出する雑音レベル検出回路が必要とされ、端子138には雑音レベル検出回路で検出された雑音レベル検出信号が供給される。
【0089】
また、この雑音低減処理部47は、上記第1のサンプリング周波数fs1(8KHz)の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を処理に用いているが、実際に雑音低減処理を施すのは、第2のサンプリング周波数fs2(16KHz)とされた上記広帯域音声信号SndWに対してである。このため、雑音低減処理部47は、上記図6に示した構成による雑音低減処理を1フレーム(20msec)当たり、320サンプル(ワード)の上記広帯域音声信号SndWに、160ワード分ずつ2回(=fs2/fs1)に分けて施している。
【0090】
このようにして、雑音低減処理部47は、上記広帯域音声信号中の雑音成分を低減できるので、帯域幅拡張部32は、雑音成分を低減した上記広帯域音声信号を出力できる。
【0091】
次に、図1の受信装置1内部の信号処理装置5の他の具体例について図10〜図12を用いて説明する。この他の具体例は、図10に示すデコーダ58と、図11に示す帯域幅拡張部65とを備えてなる。
【0092】
上記図2に示した送信装置15の信号処理装置21における音声符号器での符号化方法がVSELP(Vector Sum Excited Linear Prediction:ベクトル和励起線形予測)符号化方式によるものであるとすれば、デコーダ58はVSELP符号化による伝送信号を用いて音声をデコードして出力端子59にデコード音声SndNを、出力端子60に線形予測係数αNを、出力端子61に励振源1ExcN1を、出力端子62に励振源2ExcN2を供給する。
【0093】
帯域幅拡張部65は、図11に示すような構成である。上記図4に示した帯域幅拡張部32と異なるのは励振源切換&拡張部68を設けている点である。
【0094】
PSI−CELPは、コーデック自体、特に有声音Vを聴感上滑らかに聞こえるような処理を行っているが、VSELPにはこれがなく、このために帯域幅拡張したときに若干雑音が混入したように聞こえる。そこで、広帯域励振源を作成する際に、励振源を切り換える回路を内部に備えた励振源切換&拡張部68を用い、図12に示すような処理を施す。この図12に示す処理は、上記図7に示した励振源処理をステップS87〜ステップS89のように変えたものである。
【0095】
VSELPの励振源は、コーデックに利用されるパラメータβ(長期予測係数), bL[i](長期フィルタ状態),γ(利得), c1[i](励起コードベクタ)により、β * bL[i] + γ * c1[i]
として作成されるが、このうち前者がピッチ成分、後者がノイズ成分を表すので、これをβ * bL[i]とγ * c1[i]に分け、ステップS87で、一定の時間範囲において、前者のエネルギーが大きい場合にはピッチが強い有声音と考えられるため、ステップS88でYESに進み、励振源をパルス列とし、ピッチ成分のない部分ではNOに進み0に抑圧した。また、ステップS87でエネルギーが大きくない場合には従来どおりとし、こうして作成された狭帯域励振源にステップS89でゼロ詰め処理によりPSI-CELP同様0を詰めアップサンプルすることで広帯域励振源とした。これにより、VSELPにおける有声音の聴感上の品質が向上する。
【0096】
そして、ステップS92でアップサンプル回路45により上記オリジナル音声SndNをアップサンプルしたものと、ステップS95で加算器46により加算する。このとき、ステップS91で高域側に対し、約6KHz以上の成分を若干抑圧する高域抽出&抑圧フィルタ42によりフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能としている。
【0097】
さらに、ステップS93では、乗算器43を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【0098】
以上、VSELPによる復号化方法を用いた帯域幅拡張部65でも、サンプリング周波数を8KHzから16KHzに変換した高品質の広帯域音声信号を提供することができる。
【0099】
さらに、この帯域幅拡張部65は、上記図6に示したのと同様の雑音低減処理部47を備えているので、雑音成分を低減した上記広帯域音声信号を出力できる。
【0100】
上記図1の受信装置1内部の信号処理装置5としては、図13に示す帯域幅拡張部70とその前段の、図14に示すデコード部とからなる信号処理装置を他の具体例としてもよい。
【0101】
図14に示したデコード部は、VSELPデコーダ77とPSI−CELPデコーダ81とを備え、送信装置側から伝送されてくる、伝送信号の符号化方式に応じて、デコーダ77又は81への音声パラメータ符号の入力を切り換える。つまり、入力端子75を介して受け取った上記伝送信号を切換スイッチ76で、上記符号化方式の種類、つまりVSELP又はPSI-CELPに応じて切り換えている。
【0102】
VSELPデコーダ77からの二つの励振源1ExcN1及び励振源2ExcN2は出力端子78及び79を介して図13の入力端子66及び67に供給される。また、PSI-CELPデコーダ81からの励振源NExcNは出力端子82を介して図13の入力端子35に供給される。
【0103】
また、VSELPデコーダ77又はPSI−CELPデコーダ81からの線形予測係数αV又はαpは上記符号化方式の種類に応じて切換スイッチ80により選択されてから出力端子83を介して図13の入力端子34に供給される。
【0104】
同様に、VSELPデコーダ77又はPSI−CELPデコーダ81からのデコード音声も上記符号化方式の種類に応じて切換スイッチ84により選択されてから出力端子85を介して図13の入力端子33に供給される。
【0105】
また、図13に示す、帯域幅拡張部70側では、上記符号化方式の種類に応じて切り換わる切換スイッチ71により、励振源切換&拡張部68又は励振源拡張部41からの励振源出力を切り換えて、LPC合成部40に供給する。
【0106】
したがって、この帯域幅拡張部70によれば、送信装置側から伝送されてくる伝送信号の符号化方式の種類に応じ、サンプリング周波数を2倍にした高品質の帯域幅拡張を行うことができ、かつ雑音成分を低減できる。
【0107】
さらに、上記図1の受信装置1内部の信号処理装置5は、図15に示すような帯域幅拡張部90を備えてもよい。
【0108】
帯域幅拡張部90の入力端子91には、LPC残差である励振源が供給される。また、入力端子92には線形予測係数αが供給される。入力端子91からの励振源は、LPC合成フィルタ93に送られると共に、アップサンプル回路100に送られる。入力端子92からの線形予測係数はLPC合成フィルタ93に送られる。
【0109】
LPC合成フィルタ93は、入力端子91からの励振源を基に、入力端子92からの線形予測係数を用いて音声信号を合成する。LPC合成フィルタ93で合成された音声信号は、アップサンプル回路94に供給される。
【0110】
アップサンプル回路94は、LPC合成フィルタ93で合成された音声信号のサンプリング周波数fs1をアップサンプルする。アップサンプルされた上記音声信号は、バンドパスフィルタ95で所定の帯域のみが通過され、加算器96に供給される。このアップサンプル回路94、バンドパスフィルタ95、加算回路96に通じる経路は、元の周波数帯域の成分の信号を合成された音声信号に付加するための経路である。
【0111】
また、LPC合成フィルタ93から線形予測係数−自己相関変換回路97に線形予測係数が送られる。線形予測係数−自己相関変換回路97は、線形予測係数を自己相関に変換するものである。この自己相関は狭帯域コードブック98に送られると共に、破擦音検出回路99に送られる。
【0112】
また、入力端子91からの励振源は、アップサンプル回路100でアップサンプルされ、ローパスフィルタ101、ブースト回路102を介して、LPC合成フィルタ103に送られる。ブースト回路102は、破擦音や摩擦音が検出された場合に励振源をブーストするためのもので、ブースト回路102のブースト量は、破擦音検出回路99の出力により制御される。
【0113】
狭帯域コードブック98には、予め複数の音声信号のパターンから得られた狭帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック98で、線形予測係数−自己相関変換回路97からの自己相関と、狭帯域コードブック98に格納されている自己相関情報とが比較され、マッチング処理が行われる。そして、最もマッチしている自己相関情報のインデックスが広帯域コードブック104に送られる。
【0114】
広帯域コードブック104には、狭帯域コードブック98と対応して、狭帯域コードブック98を作成したときと同一のパターンの音声信号から得られる広帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック98で最もマッチしている自己相関情報が判断されると、このインデックスが広帯域コードブック104に送られ、広帯域コードブック104により、最もマッチしていると判断された狭帯域の自己相関情報に対応する広帯域の自己相関情報が読み出される。
【0115】
広帯域コードブック104から読み出された広帯域の自己相関情報は、自己相関−線形予測係数変換回路105に送られる。自己相関−線形予測係数変換回路105により、自己相関から線形予測係数への変換が行われる。この線形予測係数がLPC合成フィルタ103に送られる。
【0116】
LPC合成フィルタ103ではLPC合成が行われ、これにより、広帯域音声信号が合成される。LPC合成フィルタ103で合成された音声信号は、高域抽出&抑圧フィルタ106及び乗算器107に供給される。
【0117】
高域抽出&抑圧フィルタ106は、LPC合成フィルタ103からの合成出力から入力狭帯域音声信号の周波数帯域300Hz〜3400Hzの信号成分を除去し、3400Hz以上の信号成分を抽出すると共に、ユーザの好みに応じて高い周波数成分を抑圧する。乗算器107は、高域抽出&抑圧フィルタ106からのフィルタ出力に端子108から調整されたゲインを乗算する。
【0118】
そして、加算器96は、乗算器107からの乗算出力に、BPF95を介した元の狭帯域音声信号成分を加算する。これにより、広帯域の音声信号が得られる。
【0119】
この音声信号は、雑音低減処理部109に供給される。この雑音低減処理部109は、上記図6に示した構成をとり、上記広帯域音声信号の雑音を低減する。
【0120】
以上より、この図15に示した帯域幅拡張部90を備える受信装置でも、サンプリング周波数を2倍にした高品質の広帯域音声信号を生成し、雑音を低減することができる。
【0121】
なお、上記帯域幅拡張部32、65、70又は90を備えた信号処理装置を用いた受信装置は、送信装置と一体化され、図16に示すような、携帯電話装置110を構成してもよい。この携帯電話装置110も、PDCとして、現在広くしようされている、ディジタル携帯電話に適用される。
【0122】
この携帯電話装置110で、マイクロホン111から入力された音声信号は、アンプ112,ボリューム113,アンチエイリアシングフィルタ114及びA/D変換器115を経由して信号処理装置116のメモリ116aに格納される。
【0123】
メモリ116aに格納された音声信号は、信号処理装置116内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。
【0124】
この音声パラメータ符号は、制御部117及びRF(RF送信)アンプ118及びアンテナ119を経由して基地局へ送信される。
【0125】
ここで、信号処理装置116内部の音声符号化部は、伝送路により制限される狭帯域化を考慮した音声パラメータ符号を制御部117を介してRFアンプ118に供給する。
【0126】
また、アンテナ119を介して基地局から受信した音声パラメータ符号は、RFアンプ118、制御部117を経由して信号処理装置122のメモリ122aに格納される。
【0127】
信号処理装置122のメモリ122aに格納された音声パラメータ符号は、信号処理装置122の復号部で復号処理された後、所定の信号処理が施されて出力される。
【0128】
信号処理装置122から出力信号は、D/A変換器123でアナログ信号とされた後、アンチエイリアシングフィルター124、ボリューム125及びアンプ128を経由してスピーカ127から出力される。
【0129】
ここで、信号処理装置122は、上記帯域幅拡張部32、65、70又は90を備えてなる。したがって、この図16に示した携帯電話装置110は、受話側でサンプリング周波数を2倍にした高品質の広帯域音声信号を、雑音成分を低減しながら出力することができる。
【0130】
なお、上記実施の形態では、受信装置、送信装置、携帯電話装置を、PDCとして使用されているディジタル携帯電話装置に適用できるとして説明したが、広帯域(ワイドバンド)CDMA方式、すなわち、周波数帯域幅が広い移動体通信システムにも適用が可能である。
【0131】
【発明の効果】
本発明に係る受信装置及び受信方法は、第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域B1の音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を加算し、その加算出力に雑音低減処理を施すので、雑音低減処理を施した広帯域音声信号を出力することができる。
【0132】
また、本発明に係る通信装置及び通信方法は、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域B2の音声信号とを加算した加算出力に、雑音低減処理を施すので、雑音低減処理を施した広帯域音声信号を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態となる受信装置の構成を示すブロック図である。
【図2】上記図1に示した受信装置に音声パラメータ符号を基地局を介して送信する送信装置の構成を示すブロック図である。
【図3】上記図1に示した受信装置内部の信号処理装置を帯域幅拡張部と共に構成するPSI−CELPデコーダを示す図である。
【図4】上記図1に示した受信装置内部の信号処理装置をPSI−CELPデコーダと共に構成する帯域幅拡張部を示すブロック図である。
【図5】上記図4に示した帯域幅拡張部に含まれる励振源拡張部の詳細な構成を示すブロック図である。
【図6】上記図4に示した帯域幅拡張部に含まれる雑音低減処理部の詳細な構成を示すブロック図である。
【図7】上記図4に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図8】上記図4に示した帯域幅拡張部で用いられるコードブックに使われるトレーニングデータ生成処理を説明するためのフローチャートである。
【図9】上記コードブックの生成を説明するためのフローチャートである。
【図10】上記図1に示した受信装置内部の信号処理装置の他の具体例に含まれるVSELPデコーダを示す図である。
【図11】上記図1に示した受信装置内部の信号処理装置の他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図12】上記図11に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図13】上記図1に示した受信装置内部の信号処理装置のさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図14】上記図1に示した受信装置内部の信号処理装置のさらに他の具体例に含まれるデコード部の構成を示すブロック図である。
【図15】上記図1に示した受信装置内部の信号処理装置の、またさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図16】上記図4,図10,図12又は図14に示した帯域幅拡張部を用いた信号処理装置を含んだ受信装置を、送信装置と一体化して有してなる、携帯電話装置の構成を示すブロック図である。
【符号の説明】
1 受信装置、15 送信装置、21 信号処理装置、27 PSI−CELPデコーダ、32 帯域幅拡張部、36 線形予測係数→自己相関(αN→rN)変換回路、37 自己相関広帯域化部、38 広帯域コードブック、39 自己相関→線形予測係数変換部、40 LPC合成部、41 励振源拡張部、47 雑音低減処理部
Claims (14)
- 第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換するサンプリングレート変換手段と、
上記音声パラメータ符号を使って上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を推測する帯域外成分推測手段と、
上記サンプリングレート変換手段で第2のサンプリング周波数fs2とされた第1の帯域B1の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2の第2の帯域B2の音声信号を加算する加算手段と、
上記加算手段からの加算出力に雑音低減処理を施す雑音低減処理手段とを備え、
上記雑音低減処理手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた雑音低減処理をf s2 /f s1 回施す
受信装置。 - 上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数の広帯域への拡張部分とからなる請求項1記載の受信装置。
- 上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第1変換部と、第1変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第2の変換部とを備える請求項2記載の受信装置。
- 上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備える請求項2記載の受信装置。
- 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記帯域外成分推測手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号を使って上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を推測する請求項1記載の受信装置。
- 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記雑音低減処理手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を生成し、この制御信号に基づいた雑音低減処理を上記加算出力に施す請求項1記載の受信装置。
- 第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域B1の音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を加算し、その加算出力に雑音低減処理を施すようにし、
上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記雑音低減処理を上記加算出力に対してf s2 /f s1 回施す
受信方法。 - 入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成する送信手段と、
上記伝送信号を受信する受信手段とを備え、
上記受信手段は、
第1のサンプリング周波数f s1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B 1 の音声信号のサンプリング周波数を第2のサンプリング周波数f s2 (f s2 >f s1 )に変換するサンプリングレート変換手段と、
上記音声パラメータ符号を使って上記第1の帯域B 1 の帯域外成分である第2の帯域B 2 の第2のサンプリング周波数f s2 の音声信号を推測する帯域外成分推測手段と、
上記サンプリングレート変換手段で第2のサンプリング周波数f s2 とされた第1の帯域B 1 の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数f s2 の第2の帯域B 2 の音声信号を加算する加算手段と、
上記加算手段からの加算出力に雑音低減処理を施す雑音低減処理手段とを備え、
上記雑音低減処理手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた雑音低減処理をf s2 /f s1 回施す
通信装置。 - 上記受信手段の上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数の広帯域への拡張部分とからなる請求項8記載の通信装置。
- 上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第1変換部と、第1変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第2の変換部とを備える請求項9記載の通信装置。
- 上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備える請求項9記載の通信装置。
- 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記帯域外成分推測手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号を使って上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を推測する請求項8記載の通信装置。
- 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記雑音低減処理手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた雑音低減処理を上記加算出力に施す請求項8記載の通信装置。
- 入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域B2の音声信号とを加算した加算出力に、雑音低減処理を施すようにし、
上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいて上記雑音低減処理をf s2 /f s1 回行う
通信方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35483198A JP4135240B2 (ja) | 1998-12-14 | 1998-12-14 | 受信装置及び方法、通信装置及び方法 |
KR1019990055298A KR20000047944A (ko) | 1998-12-11 | 1999-12-07 | 수신장치 및 방법과 통신장치 및 방법 |
EP99309902A EP1008984A3 (en) | 1998-12-11 | 1999-12-09 | Windband speech synthesis from a narrowband speech signal |
CN99127498A CN1261713A (zh) | 1998-12-11 | 1999-12-11 | 接收装置和方法,通信装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35483198A JP4135240B2 (ja) | 1998-12-14 | 1998-12-14 | 受信装置及び方法、通信装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000181496A JP2000181496A (ja) | 2000-06-30 |
JP4135240B2 true JP4135240B2 (ja) | 2008-08-20 |
Family
ID=18440206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35483198A Expired - Fee Related JP4135240B2 (ja) | 1998-12-11 | 1998-12-14 | 受信装置及び方法、通信装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4135240B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
JP5493655B2 (ja) * | 2009-09-29 | 2014-05-14 | 沖電気工業株式会社 | 音声帯域拡張装置および音声帯域拡張プログラム |
JP5443547B2 (ja) * | 2012-06-27 | 2014-03-19 | 株式会社東芝 | 信号処理装置 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
GB201420039D0 (en) * | 2014-11-11 | 2014-12-24 | Teva Uk Ltd | System for training a user in administering a medicament |
-
1998
- 1998-12-14 JP JP35483198A patent/JP4135240B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000181496A (ja) | 2000-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6539355B1 (en) | Signal band expanding method and apparatus and signal synthesis method and apparatus | |
JP4740260B2 (ja) | 音声信号の帯域幅を疑似的に拡張するための方法および装置 | |
US8229106B2 (en) | Apparatus and methods for enhancement of speech | |
EP1775717B1 (en) | Speech decoding apparatus and compensation frame generation method | |
AU763471B2 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
JP4296622B2 (ja) | エコー消去装置及び方法、並びに音声再生装置 | |
US9251800B2 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
JP4777918B2 (ja) | 音声処理装置及び音声を処理する方法 | |
EP1008984A2 (en) | Windband speech synthesis from a narrowband speech signal | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
JPH07193548A (ja) | 雑音低減処理方法 | |
JP2000305599A (ja) | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 | |
JPH1097296A (ja) | 音声符号化方法および装置、音声復号化方法および装置 | |
EP2774148B1 (en) | Bandwidth extension of audio signals | |
JP4135242B2 (ja) | 受信装置及び方法、通信装置及び方法 | |
JP4135240B2 (ja) | 受信装置及び方法、通信装置及び方法 | |
JP4099879B2 (ja) | 帯域幅拡張方法及び装置 | |
JP2000206995A (ja) | 受信装置及び方法、通信装置及び方法 | |
Chanda et al. | Speech intelligibility enhancement using tunable equalization filter | |
JP2000206996A (ja) | 受信装置及び方法、通信装置及び方法 | |
JP2000122679A (ja) | 音声帯域拡張方法及び装置、音声合成方法及び装置 | |
JP4269364B2 (ja) | 信号処理方法及び装置、並びに帯域幅拡張方法及び装置 | |
JP2000099095A (ja) | 音声信号をフィルタリングする装置及び方法、受話器、並びに、電話通信システム | |
JP2000181494A (ja) | 受信装置及び方法、通信装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080513 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080526 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |