JPS5857758B2 - 音声ピッチ周期抽出装置 - Google Patents
音声ピッチ周期抽出装置Info
- Publication number
- JPS5857758B2 JPS5857758B2 JP54124052A JP12405279A JPS5857758B2 JP S5857758 B2 JPS5857758 B2 JP S5857758B2 JP 54124052 A JP54124052 A JP 54124052A JP 12405279 A JP12405279 A JP 12405279A JP S5857758 B2 JPS5857758 B2 JP S5857758B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- data
- circuit
- pitch period
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の詳細な説明】
本発明は音声におけるピンチ周期を抽出する装置に関す
るものである。
るものである。
現在音声に関し音声信号に含まれる冗長性を除去し、音
声を特徴パラメータで高能率符号化する分析法及びこの
符号をもとに音声を合成する合成法が開発されている。
声を特徴パラメータで高能率符号化する分析法及びこの
符号をもとに音声を合成する合成法が開発されている。
これらの方法は既に音声研究分野では広く知られた方法
であり、詳しい記述は省略する。
であり、詳しい記述は省略する。
これらの分析で得る音声の特徴パラメータの一つに音声
のピッチ周期(声帯の基本振動周期)がある。
のピッチ周期(声帯の基本振動周期)がある。
ピッチ周期は合成音声の音質を決定する重要なパラメー
タであり、従来より、ピンチ抽出の誤り率の低減をめざ
し、数々の方法が検討されている。
タであり、従来より、ピンチ抽出の誤り率の低減をめざ
し、数々の方法が検討されている。
これらの方法は主に音声信号の相関値による方法、音声
信号から声道のパラメータを抽出した後の波形(残差波
形)の相関値による方法、音声信号のフーリエ変換の対
数の逆フーリエ変換によるケプストラム法などに大別さ
れる。
信号から声道のパラメータを抽出した後の波形(残差波
形)の相関値による方法、音声信号のフーリエ変換の対
数の逆フーリエ変換によるケプストラム法などに大別さ
れる。
これらの方法はハード構成を考えた場合、その演算の複
雑さにより、大規模になり、多くの演算時間を必要とす
るため音声の実時間分析には適さず、もっばらコンピュ
ータによるオフラインの分析に使用されてきた。
雑さにより、大規模になり、多くの演算時間を必要とす
るため音声の実時間分析には適さず、もっばらコンピュ
ータによるオフラインの分析に使用されてきた。
音声分析の応用としては音声を入力とする各種のコント
ロール装置、音声の記録再生装置が考えられるが、全て
実時間による処理でなげればその応用価値はない。
ロール装置、音声の記録再生装置が考えられるが、全て
実時間による処理でなげればその応用価値はない。
したがって実時間で音声分析する方法中でも音声のピッ
チ抽出をより高精度に短時間で簡略な構成で行なえるピ
ッチ抽出法の開発が是非とも必要となる。
チ抽出をより高精度に短時間で簡略な構成で行なえるピ
ッチ抽出法の開発が是非とも必要となる。
本発明の目的は、上記した従来技術の欠点をなくし、音
声分析において、従来に比べより簡略で、抽出精度の高
い実時間のピッチ周期抽出装置を提供するにある。
声分析において、従来に比べより簡略で、抽出精度の高
い実時間のピッチ周期抽出装置を提供するにある。
本発明は、音声のピッチ周期を抽出する手段として、音
声波形をその振幅によりm個(mは3以上の自然数)に
分類符号化し、その符号化された波形の任意の範囲内に
含まれるすべての任意の時間開隔離れたものについて相
関をとり、その任意時間間隔離れた相間値の最大値をと
る時間間隔をピッチ周期とし、従来のピッチ周期抽出法
に比べ抽出精度を落すことなく演算回数の削減を計り、
ハード構成を簡略化するものである。
声波形をその振幅によりm個(mは3以上の自然数)に
分類符号化し、その符号化された波形の任意の範囲内に
含まれるすべての任意の時間開隔離れたものについて相
関をとり、その任意時間間隔離れた相間値の最大値をと
る時間間隔をピッチ周期とし、従来のピッチ周期抽出法
に比べ抽出精度を落すことなく演算回数の削減を計り、
ハード構成を簡略化するものである。
従来のピンチ抽出法として一般的なものに波形の自己相
関関数によりピッチ周期を求める方法がある。
関関数によりピッチ周期を求める方法がある。
今、音声波形をサンプリングした場合、波形の自己相関
関数は(1)式であられされる。
関数は(1)式であられされる。
ここでXtはサンプリングされた離散的波形値、Nは1
分析フレーム周期内の波形サンプル総数、τは任意の時
間間隔、ρ7はτ時間間隔離れた波形の自己相関関数値
である。
分析フレーム周期内の波形サンプル総数、τは任意の時
間間隔、ρ7はτ時間間隔離れた波形の自己相関関数値
である。
当然τはサンプリン数)とすれば(2)式のような離散
値をとる。
値をとる。
(nは1.2.3・・・・・・・・・N、整数値)周知
のごとく、波形の自己相関関数は波形の線形の線形は関
連の度合いを示す尺度であり、波形が周期関数の時には
波形と同じ周期をもつ。
のごとく、波形の自己相関関数は波形の線形の線形は関
連の度合いを示す尺度であり、波形が周期関数の時には
波形と同じ周期をもつ。
今、第1図に示される音声波形の自己相関関数とτとの
関係を図示すると第2図のごとく、音声波形のピンチ周
期とその整数倍の位置に極値をもち、その最大値をとる
τの値が音声波形のピッチ周期を表わす。
関係を図示すると第2図のごとく、音声波形のピンチ周
期とその整数倍の位置に極値をもち、その最大値をとる
τの値が音声波形のピッチ周期を表わす。
以上が自己相関関数によるピッチ抽出の概要である。
この方式では(1)式に示されるごとく、τに関する1
つの自己相関関数値を求めるためにはN−1回の積和演
算が必要となる。
つの自己相関関数値を求めるためにはN−1回の積和演
算が必要となる。
一般に積演算は和演算に比べ4〜5倍の時間を要し、ハ
ード構成では掛算器を必要とする。
ード構成では掛算器を必要とする。
この積演算を削除するために、波形の極性相関によるピ
ンチ抽出方が考えられている。
ンチ抽出方が考えられている。
これは第(1)式において、Xt、Xt+7を波形の極
性(正、負の符号)のみ、すなわち波形の振幅情報を含
まないものに置き換え、Xt−Xt+r の演算を極性
の一致に置き換えたものである。
性(正、負の符号)のみ、すなわち波形の振幅情報を含
まないものに置き換え、Xt−Xt+r の演算を極性
の一致に置き換えたものである。
極性一致をとる演算は簡略なワイヤードロジックに置き
かえることが可能であるため、通常の相関に比べ積演算
の分だけ演算時間を短縮できる。
かえることが可能であるため、通常の相関に比べ積演算
の分だけ演算時間を短縮できる。
しかし、この極性相関によるピッチ抽出はその抽出精度
は低く特に男性の声の場合、ピッチ周期抽出誤りが多い
。
は低く特に男性の声の場合、ピッチ周期抽出誤りが多い
。
この理由はピンチ抽出に用いるサンプルデータ値は極性
のみであり、振幅情報を含んでいないためである。
のみであり、振幅情報を含んでいないためである。
以上により、自己相関関数によるピッチ周期抽出を抽出
精度を落さず簡略なハード構成で、短時間で行うために
は積演算をサンプリングされた波形値をある範囲に分類
し、その分類された値の相関(一致度)をワイヤードロ
ジックによる一致演算に置き換えればよく、極性のみの
相関に比べ、振幅情報をある程度含むためにピッチ周期
抽出の精度は向上する。
精度を落さず簡略なハード構成で、短時間で行うために
は積演算をサンプリングされた波形値をある範囲に分類
し、その分類された値の相関(一致度)をワイヤードロ
ジックによる一致演算に置き換えればよく、極性のみの
相関に比べ、振幅情報をある程度含むためにピッチ周期
抽出の精度は向上する。
第3図は本発明による抽出装置の一実施例である。
第3図において、1はA/Dコンバータ、2はデータバ
ッファメモリ、3はデータメモリ、4はデータ正規化回
路、5はm値分類回路、6は相関回路、7はピッチ周期
カウンタ、8は相関値カウンタ、9はピッチ周期レジス
タ、10は相関値レジスタ、11は比較回路である。
ッファメモリ、3はデータメモリ、4はデータ正規化回
路、5はm値分類回路、6は相関回路、7はピッチ周期
カウンタ、8は相関値カウンタ、9はピッチ周期レジス
タ、10は相関値レジスタ、11は比較回路である。
第3図の動作を説明する。
音声信号はA/Dコンバータ1に入力され、ここでサン
プリングを施され、離散的な信号値時系列に変換され、
順次データバッファメモリ2に、格納される。
プリングを施され、離散的な信号値時系列に変換され、
順次データバッファメモリ2に、格納される。
このデータバッファメモリ2の容量は音声の分析フレー
ム周期(通常20m5ec)分のサンプリングデータを
収納する。
ム周期(通常20m5ec)分のサンプリングデータを
収納する。
このデータバッファメモリ2がいっばいになった時点で
データバッファメモリ2のデータをデータメモリ3に時
系列を保存して転送する。
データバッファメモリ2のデータをデータメモリ3に時
系列を保存して転送する。
(データメモリ3にXl、X2、Xl、・・・・・・・
・・、XNという順にデータが転送される。
・・、XNという順にデータが転送される。
)次にデータメモリ3の各データはデータ正規化回路4
に送られ、データメモリ3内の絶対値の最大値で除算さ
れ、正規化されたデータとなり、データメモリ3に再び
もどされる。
に送られ、データメモリ3内の絶対値の最大値で除算さ
れ、正規化されたデータとなり、データメモリ3に再び
もどされる。
もちろんこの場合データメモリ3の信号時系列は保存さ
れなければならない。
れなければならない。
次にデータメモリ3の正規化されたデータ時系列はm値
分類回路5に送られ、各々のデータはあらかじめ定めら
れたしきい値によりm個の値に分類符号化され、データ
メモリ3にもどされる。
分類回路5に送られ、各々のデータはあらかじめ定めら
れたしきい値によりm個の値に分類符号化され、データ
メモリ3にもどされる。
もちろんこの場合も信号時系列は保存されるのが望まし
い。
い。
m値分類回路はワイヤードロジックで構成されている。
この時点でデータメモリ3の内容はm値に分類符号化さ
れた時系列値となっている。
れた時系列値となっている。
この時系列値を(X11、心、X/3、=・・・・・X
’N )とする。
’N )とする。
次にピッチ周期カウンタTが示す値n=16(τ=16
△T)だけ時間間隔離れた、データメモリ3内の最初の
一組(X/1、X/1−)−16)を選び、相関回路6
に入力する。
△T)だけ時間間隔離れた、データメモリ3内の最初の
一組(X/1、X/1−)−16)を選び、相関回路6
に入力する。
相関回路6はワイヤードロジックで構成され、1組の符
号化データが一致した場合、相関値カウンタ8を1カウ
ントアツプする。
号化データが一致した場合、相関値カウンタ8を1カウ
ントアツプする。
相関回路6はこの(X/1、X’l +1 a )の一
致をみて、一致した場合のみあらかじめ零に設定されて
いる相関値カウンタ8を1カウントアツプする。
致をみて、一致した場合のみあらかじめ零に設定されて
いる相関値カウンタ8を1カウントアツプする。
ピッチ周期レジスタは音声のピッチ周期存在範囲の値を
とる。
とる。
人間音声のピッチ周期存在範囲は2 m sec〜15
m secであるため、サンプリング周波数を8KH
z (△T=125μs)とするとnは16〜120
となる。
m secであるため、サンプリング周波数を8KH
z (△T=125μs)とするとnは16〜120
となる。
説明ではこの値を使用する。次に(X/2、X’2 +
1a )を選択し、同様な動作をくり返す。
1a )を選択し、同様な動作をくり返す。
これらの動作はN−n個くり返された後に、ピンチ周期
カウンタ7と相関値カウンタ8の値はピッチ周期レジス
タ9と相関値レジスタ10にそれぞれ格納される。
カウンタ7と相関値カウンタ8の値はピッチ周期レジス
タ9と相関値レジスタ10にそれぞれ格納される。
この時点で相関値レジスタ10には(1)式のρ16と
等価な値が格納されていることになる。
等価な値が格納されていることになる。
つまり(1)式のXt−Xt+7を相関値回路6の符号
一致論理による符号の一致で置き換え、サムメーション
は相関値カウンタ8のカウントアツプ数に置き換えてい
る。
一致論理による符号の一致で置き換え、サムメーション
は相関値カウンタ8のカウントアツプ数に置き換えてい
る。
次にピンチ周期カウンタ7を1つカウントアツプしn=
17(τ=17△T)とするとともに相関カウンタ8を
零にリセットする。
17(τ=17△T)とするとともに相関カウンタ8を
零にリセットする。
そしてn−16の場合と同様の動作をくり返しn=17
(τ=17△T)の場合の相関値を相関値カウンタ8の
カウンタ値として得る。
(τ=17△T)の場合の相関値を相関値カウンタ8の
カウンタ値として得る。
ここで相関値レジスタ10の値(ここにはτ−16△T
の時の相関値が格納されている。
の時の相関値が格納されている。
)と相関値カウンタ8の値を比較回路11を用い比較し
、相関値カウンタ8の値が大きい場合にはピッチ周期カ
ウンタ7と相関値カウンタ8の値をそれぞれピッチ周期
レジスタ9と相関値レジスタ10に転送する。
、相関値カウンタ8の値が大きい場合にはピッチ周期カ
ウンタ7と相関値カウンタ8の値をそれぞれピッチ周期
レジスタ9と相関値レジスタ10に転送する。
相関値カウンタ8の値が相関値レジスタ10の値に比べ
小さい場合には上述の転送は行なわない。
小さい場合には上述の転送は行なわない。
以下順次ピンチ周期カウンタTの値を1つづつカウント
アンプすると共に相関値カウンタ8を零にリセットしな
がら、同様な動作をくり返してゆく。
アンプすると共に相関値カウンタ8を零にリセットしな
がら、同様な動作をくり返してゆく。
こうしてnを120までカウントアンプを行いながら同
様な動作をくり返してゆくと最終的にはピッチ周期レジ
スタ9には相関値が最大値をとった時のピッチ周期カウ
ンタの値n が保存されていることρmaX になる。
様な動作をくり返してゆくと最終的にはピッチ周期レジ
スタ9には相関値が最大値をとった時のピッチ周期カウ
ンタの値n が保存されていることρmaX になる。
すなわちこの値から音声信号のピッチ周期’rp==
npmax△Tを得ることができる。
npmax△Tを得ることができる。
第4図は本発明の他の実施例である。
第4図において第3図と同一符号は同一物を示す。
第4図は第3図におけるデータ正規化回路4を省略した
ものであり、残りの動作は第3図と同様である。
ものであり、残りの動作は第3図と同様である。
正規化は各個のデータを、分析フレーム周期中の絶対値
の最大値で除算する必要がある。
の最大値で除算する必要がある。
この除算演算回数は分析フレーム周期中のサンプルデー
タ数であり、(1)式の積演算回数に比べ1桁以上少な
いのであるが、1演算に要する時間は積演算に比べ2倍
程かかる。
タ数であり、(1)式の積演算回数に比べ1桁以上少な
いのであるが、1演算に要する時間は積演算に比べ2倍
程かかる。
したがって、第3図においては相関演勲1)式の積演算
を符号の一致演算に置き換えて、演算時間の短縮を計っ
たが、この効果が除算演算時間のために薄らいでしまう
。
を符号の一致演算に置き換えて、演算時間の短縮を計っ
たが、この効果が除算演算時間のために薄らいでしまう
。
第4図は正規化回路を省略することにより、さらに演算
時間の短縮を計ったものである。
時間の短縮を計ったものである。
しかし、ここで正規化回路を省略することはピッチ周期
抽出の精度を落とす。
抽出の精度を落とす。
例えば同じピッチ周期をもつ同じ音声の平均振幅の大小
によるものを3値に分類する場合を考えると、第5図に
示すごとく、振巾小の場合(第5図C)、3値分類され
た値は第5図dのように全て零になり、相関によりピン
チ周期を抽出することが困難であることは明白である。
によるものを3値に分類する場合を考えると、第5図に
示すごとく、振巾小の場合(第5図C)、3値分類され
た値は第5図dのように全て零になり、相関によりピン
チ周期を抽出することが困難であることは明白である。
第6図は本発明の更に他の実施例である。
第6図において、第3図と同一符号は同一物を示す。
第6図において12は双方性並列入力と、一方向性直列
入力を持つシフトレジスタ、13はOR回路、14,1
5,16,17,18はトランスファゲート回路A、B
、C,D、Eである。
入力を持つシフトレジスタ、13はOR回路、14,1
5,16,17,18はトランスファゲート回路A、B
、C,D、Eである。
シフトレジスタ12は1分析フレーム周期のデータ個数
Nだけ集められてデータメモリ3を構成する。
Nだけ集められてデータメモリ3を構成する。
OR回路13はデータメモリ3を構成する各シフトレジ
スタの各直列出力を入力とするOR回路でありこの出力
はトランスフアゲ−)A14を制御する。
スタの各直列出力を入力とするOR回路でありこの出力
はトランスフアゲ−)A14を制御する。
第6図の動作を説明する。
音声信号はA/Dコンバータ1に入力され、サンプリン
グされた後にその値は極性振幅表示に符号化され、デー
タバッファメモリ2に転送される。
グされた後にその値は極性振幅表示に符号化され、デー
タバッファメモリ2に転送される。
データバッファメモリ2が−ばいになった時点で、デー
タバッファメモリ2のデータはデータメモリ3を構成す
るシフトレジスタに並列入力で転送される。
タバッファメモリ2のデータはデータメモリ3を構成す
るシフトレジスタに並列入力で転送される。
この場合転送は一度に各シフトレジスタに入力してもよ
いが、配線数が多くなるために、シフトレジスタの性質
を利用し、第6図における一番左側のシフトレジスタに
入力し、順次各シフトレジスタの内容を並列に右側にシ
フトを繰り返しながら転送するのが望ましい。
いが、配線数が多くなるために、シフトレジスタの性質
を利用し、第6図における一番左側のシフトレジスタに
入力し、順次各シフトレジスタの内容を並列に右側にシ
フトを繰り返しながら転送するのが望ましい。
この場合トランスフアゲ−)B、Dはしゃ断状態にお(
。
。
こうして、データメモリ3を構成するシフトレジスタに
はデータバッファメモリ2の内容が時系列的に記憶され
る。
はデータバッファメモリ2の内容が時系列的に記憶され
る。
(極性振幅表示で、MSBは符号ビットである。
)各シフトレジスタのMSB側出力はすべてOR回路1
3に入力されており、またこのMSB側出力は自分自身
のLSB側入力にトランスファゲートA14を介して接
続されている。
3に入力されており、またこのMSB側出力は自分自身
のLSB側入力にトランスファゲートA14を介して接
続されている。
まず谷シフトレジスタを直列方向に1ビツトシフト(L
SB側からMSB側に向けて)することにより各シフト
レジスタのMSBはおのおののLSBに転送される。
SB側からMSB側に向けて)することにより各シフト
レジスタのMSBはおのおののLSBに転送される。
この時トランスフアゲ−)A14はOR回路13の出力
のいかんにかかわらず導通状態にする。
のいかんにかかわらず導通状態にする。
次に各シフトレジスタのLSBの1ビツトを除く各ビッ
トを直列方向に1ビツトずつシフトしてい(。
トを直列方向に1ビツトずつシフトしてい(。
この時、トランスファレジスタA14の動作はOR回路
13の出力で制御される。
13の出力で制御される。
つまり、OR回路130入力のうち1つでも1があった
場合にはトランスフアゲ−)A14は導通状態となる。
場合にはトランスフアゲ−)A14は導通状態となる。
MSBのLSBへの転送を除いて最初にトランスフアゲ
−)A14が導通状態になった時からあらかじめ決られ
たビット数のシフト分だけ、トランスフアゲ−)A14
を導通状態に置き各レジスタのLSB側に転送する。
−)A14が導通状態になった時からあらかじめ決られ
たビット数のシフト分だけ、トランスフアゲ−)A14
を導通状態に置き各レジスタのLSB側に転送する。
(第6図においては符号ビットを含めて3ビツト転送す
る場合を示している。
る場合を示している。
)この動作により、最初データメモリ3、すなわち各シ
フトレジスタに格納されていたデータは各シフトレジス
タのLSB側3ピットにほぼ正規化されたデータとして
たくわえられることになる。
フトレジスタに格納されていたデータは各シフトレジス
タのLSB側3ピットにほぼ正規化されたデータとして
たくわえられることになる。
(ビット数を減少させた分だけの誤差を伴って)
次にLSB側の3ビツトをトランスファゲートB15を
導通状態にして順次m値分類回路に入力し、あらかじめ
定められたしきい値によりm値に分類し、再びシフトレ
ジスタのLSB側(m+u/2ビットに転送する。
導通状態にして順次m値分類回路に入力し、あらかじめ
定められたしきい値によりm値に分類し、再びシフトレ
ジスタのLSB側(m+u/2ビットに転送する。
(第6図では3ビツトのデータを3値(2ビツト)に分
類し転送する鼾を示している。
類し転送する鼾を示している。
)この時点で各シフトレジスタのLSB側2ビットは3
値に分類され、符号化されたデータとなっている。
値に分類され、符号化されたデータとなっている。
次に3値に分類された各シフトレジスタのLSB側2ビ
ットをトランスファゲートC16を導通させ、順還させ
るとともに、トランスフアゲ−)D17を導通させMS
B側から1ビツト、2ビツト目の2ビツト、3ビツト、
4ビツト目の2ビツトにLSB側の3値分類された2ビ
ツトをそれぞれ転送する。
ットをトランスファゲートC16を導通させ、順還させ
るとともに、トランスフアゲ−)D17を導通させMS
B側から1ビツト、2ビツト目の2ビツト、3ビツト、
4ビツト目の2ビツトにLSB側の3値分類された2ビ
ツトをそれぞれ転送する。
次にトランスフアゲ−)E18をしゃ断状態のまま、M
SB狽lの1ビツト、2ビツト目のデータだけをピッチ
周期カウンタの値n=16(τ=16△T)だけ右にシ
フトする。
SB狽lの1ビツト、2ビツト目のデータだけをピッチ
周期カウンタの値n=16(τ=16△T)だけ右にシ
フトする。
こうすることにより、MSB側の1ビツト、2ビツト目
の2ビツトデータと3ビツト、4ビツト目の2ビツトデ
ータは16時間間隔だけずれた3値分類された2ビツト
データの1組として並ぶことになる。
の2ビツトデータと3ビツト、4ビツト目の2ビツトデ
ータは16時間間隔だけずれた3値分類された2ビツト
データの1組として並ぶことになる。
次にトランスファゲートE18を導通状態におき、シフ
トレジスタのMSB側4ビットのみを右にシフトしなが
ら相関値回路6に入力し、3値分類されたデータの一致
をとる。
トレジスタのMSB側4ビットのみを右にシフトしなが
ら相関値回路6に入力し、3値分類されたデータの一致
をとる。
この時のシフト数はN−n回である。
以下の動作は第3図の動作と同様である。
こうしてまず相関値ρ16の値をうろことができる。
以下同様な動作をn=160まで行なえばピンチ周期レ
ジスタ9にピンチ周期の値をうろことができる。
ジスタ9にピンチ周期の値をうろことができる。
このように第6図においては、第3図における正規化回
路における正規化を行う除算をシフト転送で行うために
第3図回路よりも時間短縮が可能であり、第4図の回路
よりもピンチ周期抽出の精度はあがることになる。
路における正規化を行う除算をシフト転送で行うために
第3図回路よりも時間短縮が可能であり、第4図の回路
よりもピンチ周期抽出の精度はあがることになる。
本発明によれば音声のピッチ周期抽出を高い精度で、簡
略なバード構成で短時間←実時間)で行なうことができ
る。
略なバード構成で短時間←実時間)で行なうことができ
る。
第1図は音声波形図、第2図は音声波形の自己相関関数
値を示す特性図、第3図は本発明の音声ピッチ周期抽出
装置の一実施例を示すブロック図、第4図は本発明の他
の一実施例を示すブロック図、第5図は音声波形と三値
分類された波形を示す波形図、第6図は本発明の他の一
実施例を示すブロック図である。 1:A/Dコンバータ、2:データバソファメモリ、3
:データメモリ、4:データ正規化回路、5:m領分類
回路、6:相関回路、7:ピッチ周期カウンタ、 期レジスタ、 回路、12: 14.15゜ −ト。 8:相関値カウンタ、9:ピツチ周 10:相関値レジスタ、11:比較 シフトレジスタ、13:OR回路、 16.17,18:)ランスファゲ
値を示す特性図、第3図は本発明の音声ピッチ周期抽出
装置の一実施例を示すブロック図、第4図は本発明の他
の一実施例を示すブロック図、第5図は音声波形と三値
分類された波形を示す波形図、第6図は本発明の他の一
実施例を示すブロック図である。 1:A/Dコンバータ、2:データバソファメモリ、3
:データメモリ、4:データ正規化回路、5:m領分類
回路、6:相関回路、7:ピッチ周期カウンタ、 期レジスタ、 回路、12: 14.15゜ −ト。 8:相関値カウンタ、9:ピツチ周 10:相関値レジスタ、11:比較 シフトレジスタ、13:OR回路、 16.17,18:)ランスファゲ
Claims (1)
- 【特許請求の範囲】 I A/Dコンバータ、Nワードのデータバッファメ
モリ、Nワードのデータメモリ、データ値を正規化する
正規化回路、データ値をあらかじめ定められたしきい値
でm個の値(m≧3の自然数)に分類符号化するm値分
類回路を有し、音声信号は該A/Dコンバータを介して
サンプリングと符号化を施され、該バッファメモリに転
送され、該バッファメモリから該データメモリに転送し
たのち、該データメモリ値を該正規化回路を通し正規化
したのち、該データメモリ値を該m値分類回路を通すこ
とにより再符号化したのち、該データメモリ値を用い相
関演算を行い音声信号のピンチ周期を抽出することを特
徴とする音声ピッチ周期抽出装置。 2 前記データメモリに転送された信号を前記正規化回
路を通さずに前記m値分類回路に供給することを特徴と
する特許請求の範囲第1項に記載された音声ピッチ周期
抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP54124052A JPS5857758B2 (ja) | 1979-09-28 | 1979-09-28 | 音声ピッチ周期抽出装置 |
US06/191,291 US4388491A (en) | 1979-09-28 | 1980-09-26 | Speech pitch period extraction apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP54124052A JPS5857758B2 (ja) | 1979-09-28 | 1979-09-28 | 音声ピッチ周期抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5648686A JPS5648686A (en) | 1981-05-01 |
JPS5857758B2 true JPS5857758B2 (ja) | 1983-12-21 |
Family
ID=14875778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54124052A Expired JPS5857758B2 (ja) | 1979-09-28 | 1979-09-28 | 音声ピッチ周期抽出装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4388491A (ja) |
JP (1) | JPS5857758B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59160768A (ja) * | 1983-03-03 | 1984-09-11 | Nippon Denki Sanei Kk | ペン書きオシログラフ |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4658372A (en) * | 1983-05-13 | 1987-04-14 | Fairchild Camera And Instrument Corporation | Scale-space filtering |
US4672667A (en) * | 1983-06-02 | 1987-06-09 | Scott Instruments Company | Method for signal processing |
US4783805A (en) * | 1984-12-05 | 1988-11-08 | Victor Company Of Japan, Ltd. | System for converting a voice signal to a pitch signal |
US4790016A (en) * | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
DE3587251T2 (de) * | 1984-12-20 | 1993-07-15 | Gte Laboratories Inc | Anpassbares verfahren und vorrichtung fuer sprachkodierung. |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
DE3703143A1 (de) * | 1987-02-03 | 1988-08-11 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines audiosignals |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
JP3171840B2 (ja) * | 1988-05-26 | 2001-06-04 | トムソン コンシューマー エレクトロニクス セイルズ ゲゼルシャフト ミット ベシュレンクテル ハフツング | オーデイオ信号の伝送方法及びデコーディング装置 |
US5025471A (en) * | 1989-08-04 | 1991-06-18 | Scott Instruments Corporation | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns |
US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
CN1136536C (zh) * | 1996-01-16 | 2004-01-28 | 雅马哈株式会社 | 音调检测装置 |
US11062094B2 (en) * | 2018-06-28 | 2021-07-13 | Language Logic, Llc | Systems and methods for automatically detecting sentiments and assigning and analyzing quantitate values to the sentiments expressed in text |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6051720B2 (ja) * | 1975-08-22 | 1985-11-15 | 日本電信電話株式会社 | 音声の基本周期抽出装置 |
DE2715411B2 (de) * | 1977-04-06 | 1979-02-01 | Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals |
-
1979
- 1979-09-28 JP JP54124052A patent/JPS5857758B2/ja not_active Expired
-
1980
- 1980-09-26 US US06/191,291 patent/US4388491A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59160768A (ja) * | 1983-03-03 | 1984-09-11 | Nippon Denki Sanei Kk | ペン書きオシログラフ |
Also Published As
Publication number | Publication date |
---|---|
US4388491A (en) | 1983-06-14 |
JPS5648686A (en) | 1981-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dubnowski et al. | Real-time digital hardware pitch detector | |
Guzhov et al. | Esresnet: Environmental sound classification based on visual domain models | |
NL192701C (nl) | Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal. | |
JPS5857758B2 (ja) | 音声ピッチ周期抽出装置 | |
US4038503A (en) | Speech recognition apparatus | |
JPS58100199A (ja) | 音声認識及び再生方法とその装置 | |
CN112633175A (zh) | 复杂环境下基于多尺度卷积神经网络单音符实时识别算法 | |
CN109326270B (zh) | 音频文件的生成方法、终端设备及介质 | |
US4081605A (en) | Speech signal fundamental period extractor | |
CN111341294B (zh) | 将文本转换为指定风格语音的方法 | |
Wilkinghoff et al. | TACos: Learning temporally structured embeddings for few-shot keyword spotting with dynamic time warping | |
JPS61120200A (ja) | 音声認識装置 | |
US4161625A (en) | Method for determining the fundamental frequency of a voice signal | |
CN100559470C (zh) | 在数字音频信号内的微小静电干扰噪声检测 | |
Singh et al. | Application of different filters in mel frequency cepstral coefficients feature extraction and fuzzy vector quantization approach in speaker recognition | |
Osman et al. | A deep learning approach for recognizing the noon rule for reciting Holy Quran | |
JPS62269200A (ja) | 音声ピツチ抽出方式 | |
CN109215633A (zh) | 基于递归图分析的腭裂语音鼻漏气的识别方法 | |
JP3288052B2 (ja) | 基本周波数抽出方法 | |
Sankar | Pitch extraction algorithm for voice recognition applications | |
Hilbish | Multiple fundamental frequency pitch detection for real time MIDI applications | |
Ziwei et al. | Design and study of an automatic composition model based on a bidirectional long-and short-term memory recurrent neural network with a self-attentive mechanism | |
Miller et al. | An adaptive speech recognition system operating in a remote time-shared computer environment | |
Gracelli et al. | Exploring Alternative Data Augmentation Methods in Dysarthric Automatic Speech Recognition | |
JPH02254498A (ja) | 音韻分類記号化装置 |