JP3762204B2 - 音声符号化・復号化機器の検査方法および検査装置 - Google Patents
音声符号化・復号化機器の検査方法および検査装置 Download PDFInfo
- Publication number
- JP3762204B2 JP3762204B2 JP2000271013A JP2000271013A JP3762204B2 JP 3762204 B2 JP3762204 B2 JP 3762204B2 JP 2000271013 A JP2000271013 A JP 2000271013A JP 2000271013 A JP2000271013 A JP 2000271013A JP 3762204 B2 JP3762204 B2 JP 3762204B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- encoding
- error signal
- decoding
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は、入力音声を符号化した後復号化して出力音声を生成する音声符号化・復号化機器、または入力音声を符号化する符号化機器と符号化した入力音声を復号化して出力音声を作成する復号化機器とで構成される音声符号化・復号化機器の検査方法および検査装置に関するものである。
【0002】
【従来の技術】
従来の音声符号化・復号化機器の検査方法としては、特開平7−84596号公報に符号化音声の品質評価方法が示されている。この品質評価方法はフローチャートを図7に示す通りであり、SB1において、その原音声データが被測定符号化・復号化装置で符号化された音声が、例えば20ms毎に1フレームにまとめられ、原音声データと復号化されて出力された音声データとを高速フーリエ変換し、SB2において、パワースペクトルの算出処理により、短時間音声スペクトルの実数部と虚数部とが分離され、2乗和されて短時間パワースペクトルが出力され、短時間パワースペクトルは周波数軸からBark周波数に変換される。
【0003】
SB3において、短時間パワースペクトルとあらかじめフィルタ係数記憶部に記憶された例えば図8に示す臨界帯域フィルタのフィルタ係数との乗算(以下、畳み込みという)が行われ、次にフィルタ係数の複数個のセットと短時間パワースペクトルの畳み込みによって複数個の臨界帯域パワースペクトルが得られ、臨界パワースペクトルに等ラウドネス曲線を模擬したプリエンファシス特性が乗算されて複数個の総合的な臨界帯域パワースペクトルが得られ、SB4において、プリエンファシス処理とBarkスペクトルの計算処理が行われ、SB5において、各フレーム毎のマスキング量計算処理が行われて現フレームでのBarkスペクトルが求められ、SB6において、歪計算処理が行われる。
【0004】
この方法によれば符号化音声の品質を高い精度で推定でき、しかも計算量が削減できるという効果が得られると示されている。
【0005】
【発明が解決しようとする課題】
上記の従来の音声符号化・復号化機器の検査方法は、入力される原音声(以下入力音声と呼称する)と、入力音声を符号化・復号化した音声(以下、出力音声と呼称する)とを高速フーリエ変換し、各周波数領域にて入力音声および出力音声の特徴量を抽出し、比較して評価する方法であり、時間領域から周波数領域への変換に時間を要するためにリアルタイムで長時間の音声検査を行うことができないという問題点、および検査対象機器の符号化・復号化に要する時間が変動する場合に、周波数領域での特徴量を比較するこの方法では、符号化・復号化に要する時間変動に対応できず正確な検査ができないという問題点があった。
【0006】
この発明は上記問題点を解決するためになされたものであり、対象とする符号化・復号化機器の出力音声をリアルタイムに長時間の音声検査ができる音声検査方法および検査装置を提供することを目的とするものである。
【0007】
【課題を解決するための手段】
この発明の請求項1に係る音声符号化・復号化機器の検査方法は、音声符号化・復号化機器に入力される入力音声および出力される出力音声をそれぞれサンプリングし、サンプリングした入力音声と、音声符号化・復号化機器の特性変動に追従して制御するフィルタ係数制御部を備えた適応型ディジタルフィルタのフィルタ係数との演算により出力側の音声を推定した推定音声を作成し、この推定音声とサンプリングされた出力音声との差を誤差信号として算出して適応型ディジタルフィルタのフィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて誤差信号が最小となるように適応型ディジタルフィルタのフィルタ係数を更新する動作を繰り返し、最小となった誤差信号と予め設定された異常検出レベルとを比較することにより、上記音声符号化・復号化機器を評価する方法である。
【0008】
この発明の請求項2に係る音声符号化・復号化機器の検査装置は、音声符号化・復号化機器に入力される入力音声をサンプリングする入力音声検出部と、音声符号化・復号化機器から出力される出力音声をサンプリングする出力音声検出部と、音声符号化・復号化機器の特性変動に追従してフィルタ係数を制御するフィルタ係数制御部を備えた適応型ディジタルフィルタで構成され、サンプリングされた入力音声と上記適応型ディジタルフィルタのフィルタ係数との演算により、出力側の音声を推定した推定音声を作成する推定音声作成部と、推定音声作成部が作成した推定音声と出力音声検出部がサンプリングした出力音声との差の誤差信号を算出し、推定音声作成部にフィードバックするとともに、誤差評価部に出力する誤差信号作成部と、入力された誤差信号の波形レベルと、予め設定された音声異常検出レベルとを比較して音声符号化・復号化機器を評価する誤差評価部とを備え、推定音声作成部は、誤差信号作成部からの誤差信号をフィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて誤差信号が最小となるように適応型ディジタルフィルタのフィルタ係数を更新し、誤差評価部は、誤差信号作成部から入力された誤差信号の波形レベルと音声異常レベルとを比較し、誤差信号の波形レベルが音声異常検出レベルを超えたときに異常信号を出力する構成としたものである。
【0009】
この発明の請求項3に係る音声符号化・復号化機器の検査装置は、請求項2の構成の誤差評価部には音声異常検出レベルおよび音声異常持続時間レベルを設定し、誤差信号が音声異常検出レベルを超えた時間をカウントし、音声異常持続時間レベルを超えたときに異常信号を出力する構成としたものである。
【0010】
この発明の請求項4に係る音声符号化・復号化機器の検査装置は、請求項2または請求項3の構成の誤差評価部に備えられた音声異常検出レベルは、入力音声の大きさに応じて設定するように構成したものである。
【0011】
この発明の請求項5に係る音声符号化・復号化機器の検査方法は、請求項1の方法において誤差信号が予め設定された異常検出レベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御部を一定時間停止させる方法である。
【0012】
この発明の請求項6に係る音声符号化・復号化機器の検査装置は、請求項2乃至5の構成の推定音声作成部は、誤差信号が所定のレベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御を一定時間停止させるように構成したものである。
【0013】
この発明の請求項7に係る音声符号化・復号化機器の検査方法は、請求項1または請求項6の方法において、音声符号化・復号化機器の符号化・復号化に要する時間の変動に応じて、入力音声と適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動させて複数の音声を作成し、作成した複数の推定音声とサンプリングされた出力音声との差の誤差信号をそれぞれ算出し、算出した複数の誤差信号の最も小さくなる推定音声を選択する方法である。
【0014】
この発明の請求項8に係る音声符号化・復号化機器の検査装置は、請求項2乃至請求項4および請求項6の構成の推定音声作成部は、符号化・復号化機器の符号化・復号化に要する時間変動に応じて、入力音声と適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動させて推定音声を作成するように構成したものである。
【0015】
【発明の実施の形態】
実施の形態1.
図1は実施の形態1の音声符号化・復号化機器の検査装置の構成を示すブロック図、図2は図1の構成の検査装置による検査方法のフローチャートである。図において、1は検査の対象となる音声符号化・復号化機器である。2は入力音声をサンプリングする入力音声検出部、3は出力音声をサンプリングする出力音声検出部である。
【0016】
4はサンプリングされた入力音声から出力音声を推定した推定音声を作成する推定音声作成部であり、適応型ディジタルフィルタ4aと、入力音声および推定音声と出力音声との差が入力されて適応型ディジタルフィルタのフィルタ係数を音声符号化・復号化機器の特性変動に追従するように制御するフィルタ係数制御部4bとで構成されている。5は推定音声と出力音声との差を算出して誤差評価部に出力するとともに、フィルタ係数制御部4bに入力する誤差信号作成部である。6は誤差信号作成部5からの誤差信号を評価する誤差評価部である。
【0017】
次に図2のフローチャートによって実施の形態1の検査方法を説明する。ステップS1において、入力音声検出部2にて入力音声x(n)、出力音声検出部3において出力音声d(n)をそれぞれサンプリングする。n はサンプリングした時刻である。ステップS2において、推定音声作成部4で(式1)によりフィルタ処理を行い入力音声から出力側の音声を推定した推定音声y(n)を算出する。
【0018】
【数1】
【0019】
Wiは i番目の適応型ディジタルフィルタのフィルタ係数、I はフィルタのタップ数、idは時間遅れである。
【0020】
次にステップS3では、誤差信号作成部5において、出力音声d(n)と推定音声y(n)との差 e(n)=d(n)−y(n) を算出し、これを誤差信号e(n)として誤差評価部6に出力するとともに、推定音声作成部4のフィルタ係数制御部4bに入力する。ステップS4では、誤差評価部6において音声符号化・復号化機器の誤差信号eの波形として表示され、波形を監視することで誤差信号eの評価が行われる。
【0021】
ステップ5において、誤差信号作成部5から誤差信号e(n)が入力された、フィルタ係数制御部4bによって出力音声d(n)と推定音声y(n)との差e(n)が最小となるように適応型ディジタルフィルタのフィルタ係数の更新を行い、ステップS1に戻って処理を繰り返す。
【0022】
【数2】
【0023】
次に音声符号化・復号化機器を上記図1の構成において図2のフローチャートにしたがって音声検査を実施した場合の各音声波形の状況について説明する。図3は音声符号化・復号化機器について音声検査を実施した場合の各音声および誤差信号の状況を示すものである。(a)が入力音声x、(b)が出力音声d、(c)が推定音声y、(d)が誤差信号eである。実際には出力音声dは入力音声xより符号化・復号化機器における符号化・復号化する時間の遅れがあるが、図3は入力音声xと出力音声yの時間軸の始点を合わせて表示している。
【0024】
図3の音声検査の例では、時間軸0〜0.8秒の間は誤差信号eは0であり正常であることを示している。時間軸0.8〜1.17秒の間には誤差信号eが現れており異常があることを示している。実際の出力音声dは音声が途切れた状態になっている。音声検査は誤差信号eの振幅を監視することで音声符号化・復号化機器の良否が連続してリアルタイムで検査することができる。
【0025】
検査対象の符号化・復号化機器の符号化・復号化に要する時間が変動する場合でも、時間の変動がサンプルステップ数に換算して、id〜id+I−1の範囲であれば(式1)(式2)の演算によりその時間変動に対応した出力音声dを推定し正確な検査を行うことができる。つまり、検査対象機器の符号化・復号化に要する時間変動がid〜id+I−1の範囲になるようにidとIの値が設定されている。
【0026】
このように入力音声xと出力音声dとを検出し、入力音声xから出力音声dの推定を適応型のディジタルフィルタを用いて行い、出力音声dと推定音声yとを時間領域で比較することで音声検査がリアルタイムで長時間継続して検査できる音声符号化・復号化検査装置が得られる。
【0027】
また、検査対象の符号化・復号化機器の符号化・復号化に要する時間が変動する場合でも、符号化・復号化に要する時間変動がid〜id+I−1の範囲であれば、その時間変動に対応した推定音声yを推定し、正確な検査が実施できる。
【0028】
実施の形態2.
実施の形態1の図1の構成においては、誤差信号eを波形として表示するものであったが、実施の形態2の構成は、実施の形態1の誤差評価部6に音声異常検出レベルを設定した構成としたものである。
【0029】
誤差評価部6では誤差信号作成部5で作成された誤差信号eが、音声異常検出レベルを超えたときに異常信号を出力することにより、必要とする音声異常レベルに対応した音声検査が効率よく実施できる。
【0030】
実施の形態3.
実施の形態2は、実施の形態1の誤差評価部6に音声異常検出レベルを備え、誤差評価部6に誤差信号eが音声異常検出レベルを超えたときに、異常信号を出力する構成であったが、この実施の形態3は、さらに超えた部分の持続時間を検出する構成としたものである。図4に実施の形態2の誤差評価部6に音声異常検出レベルを設定した場合の誤差信号eの例を示す。
【0031】
図4において、音声異常検出レベルは誤差信号eのレベル0.5に設定した場合を示すものであり、誤差評価部6において誤差信号eの振幅を常時監視し、誤差信号eが設定された音声異常検出レベルを超えたサンプルステップ数、すなわち図4に示す音声異常検出レベルの外側にある誤差信号eの点数をカウントし、このカウント数により誤差信号の持続時間が評価され、音声異常の時間を考慮した検査が実施できる。
【0032】
実施の形態4.
実施の形態4は、実施の形態2または実施の形態3の構成の誤差評価部6に設定した音声異常検出レベルを入力音声のレベルに応じて段階的に設定できるように構成したものである。
【0033】
このように構成すると、音声異常検査レベルが検査される符号化・復号化機器の入力音声レベルの変動に関わりなく要求される評価レベルに合わせた検査が実施できるので、広範囲の検査対象機器に適用可能な検査装置が構成できる。
【0034】
実施の形態5.
実施の形態1の図1の音声符号化・復号化機器の検査装置の構成において、フィルタ係数制御部によるフィルタ係数の更新を続行すると、誤差信号が収束し、実施の形態2または実施の形態3における音声異常検出レベルを超えたときの音声異常検出レベルの外側にある誤差信号eが小さくなって的確な音声検査が困難になる可能性がある。この実施の形態5では、図1の構成に音声異常検出レベルを備えた実施の形態2または実施の形態3の構成に加えて、初めて誤差信号eが音声異常検出レベルを超えたとき以後の一定時間、適応アルゴリズムによるフィルタ係数の制御を停止させるように構成したものである。
【0035】
このように適応アルゴリズムによるフィルタ係数の制御を一定時間停止することにより、誤差信号eの収束を防いで音声異常を強調した音声検査が可能な検査装置が得られる。
【0036】
実施の形態6.
検査される符号化・復号化機器の符号化・復号化に要する時間の変動の巾がサンプルステップ数に換算してフィルタタップ数Iを超える場合は正確な検査を行うことが困難になる。この場合はフィルタタップ数Iを大きくすれば解決できるが、フィルタ処理のフィルタ係数更新の演算量が増し、リアルタイムで検査ができなくなる問題点がある。実施の形態6は、この問題点を解決するために推定音声作成部4の入力音声xから推定音声yを推定するときに用いるディジタルフィルタの時間区間を符号化・復号化に要する時間の変動に応じて変動させた構成である。
【0037】
以下具体的な方法について説明する。図5は音声符号化・復号化機器の符号化・復号化に要する時間の変動に応じて入力音声xと適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動させる場合の音声検査方法のフローチャートである。音声検査装置は図1と同一の構成である。ステップS11において、入力音声x(n)を入力音声検出部2において、出力音声d(n)を出力音声検出部3においてそれぞれサンプリングする。nはサンプリングした時刻である。ステップS12において、推定音声作成部4で次に示す(式3)(式4)(式5)によりフィルタ処理を行い、3通りの推定音声yJ、yJ+1、yJ−1を求める。
【0038】
【数3】
【0039】
Jはフィルタ演算時刻の変動量を示す変数であり、初期のフィルタ演算時刻(J=0)から符号化・復号化処理に要する時間の変動に応じて演算に用いる適応型ディジタルフィルタと入力音声xの時間区間を変動させたものである。yJは現在のフィルタ演算時刻での推定音声、yJ+1は現在の演算時刻からサンプルステップを1つ進めた場合の推定音声、yJ−1は現在の演算時刻からサンプルステップを1つだけ遅らせた推定音声である。
【0040】
次にステップ13において、3通りの誤差信号e即ち、
eJ=d(n)−yJ eJ+1=d(n)−yJ+1 eJ−1=d(n)−yJ−1
を算出し、ステップ14で、eJ、eJ+1、eJ−1の内絶対値が最小のものを真の誤差信号e(n)とし、それに応じてフィルタ演算時刻Jを更新する。
【0041】
ステップ15において、誤差評価部6の誤差信号eの大きさを評価して音声検査を実施する。ステップ16においては、算出された誤差信号e(n)をフィルタ係数制御部4bに入力し、出力音声d(n)と推定音声y(n)との差e(n)の2乗平均値を(式2)で演算し、差e(n)が最小となるようにステップS11にもどって処理を繰り返して適応型ディジタルフィルタのフィルタ係数の更新を行う。この実施の形態5における誤差信号eの評価は上記実施の形態1〜4と同様に行われる。
【0042】
次に実施の形態5の演算に用いる適応型ディジタルフィルタと入力音声の時間区間を変動させる処理について説明する。フィルタ演算時刻Jは初期値を0とし、出力音声dは入力音声xに対して時間遅れid+Dだけ変化させたものと仮定し、入力音声xから出力音声dを推定するフィルタ係数は、WD=1、Wi=0(i≠D)が理想的である。図6はこの場合の入力音声x、出力音声d、フィルタ係数を示したものである。図中(1)はyJを求めるためのフィルタ係数および入力音声xの演算区間、(2)はyJ+1を求めるためのフィルタ係数および入力音声の演算区間、(3)はyJ−1を求めるためのフィルタ係数および入力音声xの演算区間である。
【0043】
0≦D<Iの場合、演算区間(1)で理想的なフィルタ係数が実現できるため、演算区間を遅延させる必要はない。時間遅れが変動してD≧Iとなった場合、演算区間(1)(3)では理想的なフィルタ係数が実現できず、演算区間(2)でのみフィルタ係数が実現できる。よって誤差信号eJ+1が最小となり、フィルタ演算時刻Jが1インクリメントされて演算区間が(2)に移動する。同様に時間遅れが変動してD<0となった場合、演算区間(3)のみで理想的なフィルタ係数が実現できるため、誤差信号eJ−1が最小となり、フィルタ演算時刻Jがデクリメントされて演算区間が(3)に移動する。以上のように演算に用いるディジタルフィルタと入力音声xの時間区間は、入力音声xと出力音声y間の時間遅れの変動に応じて移動することになる。
【0044】
このようにこの実施の形態6によれば、検査対象の符号化・復号化機器に要する時間の変動幅が大きい場合でもその変動に応じて演算に用いる適応型ディジタルフィルタと入力音声xの時間区間を変動させることにより、音声の良否をリアルタイムで検査することができる。
【0045】
【発明の効果】
この発明の請求項1に係る音声符号化・復号化機器の検査方法は、音声符号化・復号化機器に入力される入力音声および出力される出力音声をそれぞれサンプリングし、サンプリングした入力音声と、音声符号化・復号化機器の特性変動に追従して制御するフィルタ係数制御部を備えた適応型ディジタルフィルタのフィルタ係数との演算により出力側の音声を推定した推定音声を作成し、この推定音声とサンプリングされた出力音声との差を誤差信号として算出し、算出した誤差信号を出力するとともに、適応型ディジタルフィルタのフィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて誤差信号が最小となるように適応型ディジタルフィルタのフィルタ係数を更新する動作を繰り返し、最小となった誤差信号と予め設定された音声異常検出レベルとを比較することにより、音声符号化・復号化機器を評価する方法であり、符号化・復号化機器がリアルタイムで長時間の音声検査ができ、検査対象機器の符号化・復号化に要する時間変動に対応してリアルタイムに音声検査を行うことができる。
【0046】
この発明の請求項2に係る音声符号化・復号化機器の検査装置は、音声符号化・復号化機器に入力される入力音声をサンプリングする入力音声検出部と、音声符号化・復号化機器から出力される出力音声をサンプリングする出力音声検出部と、音声符号化・復号化機器の特性変動に追従してフィルタ係数を制御するフィルタ係数制御部を備えた適応型ディジタルフィルタで構成され、サンプリングされた入力音声と適応型ディジタルフィルタのフィルタ係数との演算により、出力側の音声を推定した推定音声を作成する推定音声作成部と、推定音声作成部が作成した推定音声と出力音声検出部がサンプリングした出力音声との差の誤差信号を算出し、推定音声作成部にフィードバックするとともに、誤差評価部に出力する誤差信号作成部と、入力された誤差信号の波形レベルと、予め設定された音声異常検出レベルとを比較して音声符号化・復号化機器を評価する誤差評価部とを備え、
推定音声作成部は、誤差信号作成部からの誤差信号をフィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて誤差信号が最小となるように適応型ディジタルフィルタのフィルタ係数を更新し、誤差評価部は、誤差信号作成部から入力された誤差信号の波形レベルと音声異常検出レベルとを比較し、誤差信号の波形レベルが音声異常検出レベルを超えたときに異常信号を出力する構成としたので、符号化・復号化機器がリアルタイムで長時間の音声検査が行うことができ、検査対象機器の符号化・復号化に要する時間変動に対応してリアルタイムに音声検査を行うことができる。
【0047】
この発明の請求項3に係る音声符号化・復号化機器の検査装置は、請求項2の構成の誤差評価部には音声異常検出レベルおよび音声異常持続時間レベルを設定し、誤差信号が音声異常検出レベルを超えた時間をカウントし、音声異常検出レベルを超えた時間をカウントし、音声異常持続時間レベルを超えたときに異常信号を出力する構成としたので、符号化・復号化機器の誤差信号の持続時間を考慮した検査ができる。
【0048】
この発明の請求項4に係る音声符号化・復号化機器の検査装置は、請求項3または請求項4の構成の誤差評価部に備えられた音声異常検出レベルは、入力音声の大きさに応じて設定するように構成したので、符号化・復号化機器入力音声レベルの変動に関わりなく要求される評価レベルに合わせた検査が実施でき、広範囲の検査対象機器に適用可能な検査装置となる。
【0049】
この発明の請求項5に係る音声符号化・復号化機器の検査方法は、請求項1の方法において誤差信号が予め設定されたレベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御を一定時間停止させる方法であり、誤差信号の収束を防いで音声異常をより強調した検査ができる。
【0050】
この発明の請求項6に係る音声符号化・復号化機器の検査装置は、請求項2乃至請求項5の構成の推定音声作成部は、誤差信号が所定のレベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御を一定時間停止させるように構成したので、誤差信号の収束を防いで音声異常をより強調した検査ができる。
【0051】
この発明の請求項7に係る音声符号化・復号化機器の検査方法は、請求項1または請求項6の方法において、音声符号化・復号化機器の符号化・復号化に要する時間変動に応じて、入力音声と適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動させて複数の音声を作成し、作成した複数の推定音声とサンプリングされた出力音声との差の誤差信号をそれぞれ算出し算出した複数の誤差信号の最も小さくなる推定信号を選択する方法であり、音声符号化・復号化機器の符号化・復号化の時間変動が大きい場合においても、リアルタイムで長時間の音声検査が実施できる。
【0052】
この発明の請求項8に係る音声符号化・復号化機器の検査装置は、請求項2乃至請求項4および請求項6の構成の推定音声作成部は、符号化・複合化機器の符号化・復号化に要する時間変動に応じて、入力音声と適応型ディジタルフィルタフィルタ係数の演算に用いる時間区間を変動させて推定音声を推定するように構成したので、符号化・復号化の時間の変動が大きい場合にも、リアルタイムで長時間の音声検査が実施できる。
【図面の簡単な説明】
【図1】 実施の形態1の音声符号化・復号化機器の検査装置の構成を示すブロック図である。
【図2】 図1の構成の検査装置による検査方法のフローチャートである。
【図3】 音声符号化・復号化機器について図2のフローチャートにそって音声検査を実施した場合の各音声および誤差信号の状況を示す図である。
【図4】 実施の形態2の誤差評価部に音声異常検出レベルを設けた場合の誤差信号の状態を示す図である。
【図5】 実施の形態5の適応型ディジタルフィルタの時間区間を符号化・復号化する時間に応じて遅延させる場合の音声検査方法のフローチャートである。
【図6】 適応型ディジタルフィルタの時間区間を符号化・復号化に要する時間の変動に応じて遅延させて音声検査を行う場合の音声波形の状況を示す図である。
【図7】 従来の符号化・復号化機器の品質評価方法のフローチャートである。
【図8】 臨界帯域パワースペクトルのフィルタ処理に用いられる臨界帯域フィルタのフィルタ係数を示す図である。
【符号の説明】
1 音声符号化・復号化機器、2 入力音声検出部、3 出力音声検出部、
4a 適応型ディジタルフィルタ、4b フィルタ係数制御部、4 推定音声作成部、
5 誤差信号作成部、6 誤差評価部。
Claims (8)
- 入力音声を符号化した後に復号化して出力音声を作成する音声符号化・復号化機器、または入力音声を符号化する符号化機器と、符号化した入力音声を復号化して出力音声を作成する復号化機器とで構成される音声符号化・復号化機器の検査方法であって、上記音声符号化・復号化機器に入力される入力音声および出力される出力音声をそれぞれサンプリングし、サンプリングした上記入力音声と、上記音声符号化・復号化機器の特性変動に追従して制御するフィルタ係数制御部を備えた適応型ディジタルフィルタのフィルタ係数との演算により出力側の音声を推定した推定音声を作成し、該推定音声と上記サンプリングされた上記出力音声との差を誤差信号として算出し、上記適応型ディジタルフィルタのフィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて上記誤差信号が最小となるように上記適応型ディジタルフィルタのフィルタ係数を更新する動作を繰り返し、最小となった上記誤差信号と予め設定された音声異常検出レベルとを比較することにより上記音声符号化・復号化機器を評価することを特徴とする音声符号化・復号化機器の検査方法。
- 入力音声を符号化した後に復号化して出力音声を生成する音声符号化・復号化機器、または入力音声を符号化する符号化機器と、符号化した入力音声を復号化して出力音声を作成する復号化機器とで構成される音声符号化・復号化機器の検査装置であって、上記音声符号化・復号化機器に入力される入力音声をサンプリングする入力音声検出部と、上記音声符号化・復号化機器から出力される出力音声をサンプリングする出力音声検出部と、上記音声符号化・復号化機器の特性変動に追従してフィルタ係数を制御するフィルタ係数制御部を備えた適応型ディジタルフィルタで構成され、上記サンプリングされた入力音声と上記適応型ディジタルフィルタのフィルタ係数との演算により、出力側の音声を推定した推定音声を作成する推定音声作成部と、該推定音声作成部が作成した推定音声と上記出力音声検出部がサンプリングした出力音声との差の誤差信号を算出し、上記推定音声作成部にフィードバックするとともに、下記誤差評価部に出力する誤差信号作成部と、入力された誤差信号の波形レベルと、予め設定された音声異常検出レベルとを比較して上記音声符号化・復号化機器を評価する誤差評価部とを備え、上記推定音声作成部は、上記誤差信号作成部からの誤差信号を上記フィルタ係数制御部に入力し、推定音声を出力音声に適応させる適応アルゴリズムを用いて誤差信号が最小となるように上記適応型ディジタルフィルタのフィルタ係数を更新し、上記誤差評価部は、上記誤差信号作成部から入力された上記誤差信号の波形レベルと上記音声異常検出レベルとを比較し、上記誤差信号の波形レベルが上記音声異常検出レベルを超えたときに異常信号を出力することを特徴とする音声符号化・復号化機器の検査装置。
- 誤差評価部には、音声異常検出レベルおよび音声異常持続時間レベルが設定され、誤差信号が上記音声異常検出レベルを超えた時間をカウントし、音声異常持続時間レベルを超えたときに異常信号を出力することを特徴とする請求項2記載の音声符号化・復号化機器の検査装置。
- 誤差評価部に備えられた音声異常検出レベルは、入力音声の大きさに応じて設定することを特徴とする請求項2または請求項3記載の音声符号化・復号化機器の検査装置。
- 誤差信号が予め設定されたレベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御部を一定時間停止させることを特徴とする請求項1記載の音声符号化・復号化機器の検査方法。
- 推定音声作成部は、誤差信号が所定のレベルを超えたときに、適応型ディジタルフィルタのフィルタ係数の制御を一定時間停止させることを特徴とする請求項2乃至請求項4のいずれかに記載の音声符号化・復号化機器の検査装置。
- 音声符号化・復号化機器の符号化・復号化に要する時間の変動に応じて、入力音声と適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動 させて複数の推定音声を作成し、作成した複数の推定音声と上記サンプリングされた出力音声との差のそれぞれの誤差信号を算出し、算出した複数の誤差信号が最も小さくなる推定音声を選択することを特徴とする請求項1または請求項5記載の音声符号化・復号化機器の検査方法。
- 推定音声作成部は、符号化・復号化機器の符号化・復号化に要する時間の変動に応じて、入力音声と適応型ディジタルフィルタのフィルタ係数の演算に用いる時間区間を変動させて推定音声を作成するように構成されていることを特徴とする請求項2〜請求項4および請求項6のいずれかに記載の音声符号化・復号化機器の検査装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000271013A JP3762204B2 (ja) | 2000-09-07 | 2000-09-07 | 音声符号化・復号化機器の検査方法および検査装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000271013A JP3762204B2 (ja) | 2000-09-07 | 2000-09-07 | 音声符号化・復号化機器の検査方法および検査装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002082696A JP2002082696A (ja) | 2002-03-22 |
JP3762204B2 true JP3762204B2 (ja) | 2006-04-05 |
Family
ID=18757358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000271013A Expired - Fee Related JP3762204B2 (ja) | 2000-09-07 | 2000-09-07 | 音声符号化・復号化機器の検査方法および検査装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3762204B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK176170B1 (da) * | 2004-04-28 | 2006-11-13 | Bang & Olufsen As | Fremgangsmåde til objektiv bestemmelse af subjektive egenskaber ved et binauralt lydsignal |
KR101643990B1 (ko) | 2009-11-19 | 2016-07-29 | 도레이 카부시키가이샤 | 폴리아미드이미드 수지 미립자의 제조방법, 폴리아미드이미드 수지 미립자 |
EP3576088A1 (en) * | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
-
2000
- 2000-09-07 JP JP2000271013A patent/JP3762204B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002082696A (ja) | 2002-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nagesh et al. | Evaluation of digital filters for rejecting discrete spectral interference in on-site PD measurements | |
Hu et al. | Evaluation of objective quality measures for speech enhancement | |
EP0856961B1 (en) | Testing telecommunications apparatus | |
KR0161258B1 (ko) | 음성활동 검출 방법 및 장치 | |
EP0766247A2 (en) | Signal restoration using left-sided and right-sided autoregressive parameters | |
EP1611571B1 (en) | Method and system for speech quality prediction of an audio transmission system | |
EP2037449B1 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
JP3762204B2 (ja) | 音声符号化・復号化機器の検査方法および検査装置 | |
Palahin et al. | Modeling of joint signal detection and parameter estimation on the background of non-Gaussian noise | |
Novak et al. | Analysis, synthesis, and classification of nonlinear systems using synchronized swept-sine method for audio effects | |
Narwaria et al. | Non-intrusive speech quality assessment with support vector regression | |
Xu et al. | Coded Speech Quality Measurement by a Non-Intrusive PESQ-DNN | |
EP1628397A1 (en) | Audio quality adjustment device | |
JPH1091237A (ja) | 異常信号検出装置および異常信号源検出装置 | |
US7787975B2 (en) | Restoring audio signals | |
Wegelin et al. | Condition monitoring of power transformers using acoustic signal Prony's analysis | |
He et al. | Quickest detection of unknown power quality events for smart grids | |
RU2829627C1 (ru) | Способ выделения речевого сигнала путем анализа значений параметров гармонических составляющих | |
JPH0784596A (ja) | 符号化音声の品質評価方法 | |
Zasov | Stability Verification of Statistical Methods for Signal Separation | |
JP7631741B2 (ja) | 雑音評価装置、音響特性測定装置、雑音評価方法、音響特性測定方法、および雑音評価プログラム | |
JP3234365B2 (ja) | 応答特性計測装置 | |
Sabiniok et al. | Analysis of application possibilities of Grey System Theory to detection of acoustic feedback | |
Hiramatsu et al. | A study on the blind estimation of reverberation time in room acoustics | |
Li et al. | Sparse linear parameter-varying autoregressive moving average modelling of non-stationary gearbox vibration signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060112 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100120 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100120 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110120 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120120 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |