JPS5950075B2 - 人工音声信号を発生するための方法と装置 - Google Patents
人工音声信号を発生するための方法と装置Info
- Publication number
- JPS5950075B2 JPS5950075B2 JP53072271A JP7227178A JPS5950075B2 JP S5950075 B2 JPS5950075 B2 JP S5950075B2 JP 53072271 A JP53072271 A JP 53072271A JP 7227178 A JP7227178 A JP 7227178A JP S5950075 B2 JPS5950075 B2 JP S5950075B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- filter
- amplitude
- waveform
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000005236 sound signal Effects 0.000 title claims description 12
- 238000000034 method Methods 0.000 title description 11
- 238000012546 transfer Methods 0.000 claims abstract description 12
- 230000000737 periodic effect Effects 0.000 claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims 1
- 230000001755 vocal effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 9
- 238000005259 measurement Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000012372 quality testing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Stereophonic System (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Description
【発明の詳細な説明】
この発明は、音声信号伝送システムに関し、特に電話伝
送システムに関し、そしてそのようなシステムに使用さ
れる装置の性能の客観的評価すなわち人間の話者または
聴者なしに実行される評価に用いるようになる音声信号
を発生するための装置とに関する。
送システムに関し、そしてそのようなシステムに使用さ
れる装置の性能の客観的評価すなわち人間の話者または
聴者なしに実行される評価に用いるようになる音声信号
を発生するための装置とに関する。
音声信号伝送に使用される装置の性能を評価するための
通常の方法は、可能な限り、人間の話者または聴音なし
に実行される客観的測定よりなる。
通常の方法は、可能な限り、人間の話者または聴音なし
に実行される客観的測定よりなる。
事実、主観的測定すなわち人間の話者または聴音または
その両者を伴つて実行される測定の成果は余りにも多く
音声の形式および話者または聴音またはその両者に依存
し、そして試験のために利用されるテキストにさえも依
存する;極めて多数の話者または聴者およびある長さの
テキストを利用することによつてのみ、十分に信頼でき
る成果が得られるようになる;従つて試験は長く、従つ
て経費がかかるようになる。
その両者を伴つて実行される測定の成果は余りにも多く
音声の形式および話者または聴音またはその両者に依存
し、そして試験のために利用されるテキストにさえも依
存する;極めて多数の話者または聴者およびある長さの
テキストを利用することによつてのみ、十分に信頼でき
る成果が得られるようになる;従つて試験は長く、従つ
て経費がかかるようになる。
一般に、客観的測定を実行するための手順は、試験すべ
き装置へ適当な入力信号を送る工程とシステムの出力端
子において受信信号また再建信号のための信号対雑音比
(S/N比)を、入力信号電力と誤差信号電力(誤差信
号は、入力信号と出力信号間の差として定義されるもの
である)との間の比として評価するよう計算する工程と
を備える。
き装置へ適当な入力信号を送る工程とシステムの出力端
子において受信信号また再建信号のための信号対雑音比
(S/N比)を、入力信号電力と誤差信号電力(誤差信
号は、入力信号と出力信号間の差として定義されるもの
である)との間の比として評価するよう計算する工程と
を備える。
そしてその比が高ければ高いほど、評価されたシステム
の質は良いものとなる。もつと屡々用いられる入力信号
は、種々の周波数たとえば800翫ないし1000圧の
範囲の正弦波信号またはホワイトガウシアンノイズまた
はラプラシアンノイズであり、何となればこれらの信号
は、容易に処理でき、従つて特にシシユレーシヨン(模
擬)技術により実行される試験に有効であるからである
。
の質は良いものとなる。もつと屡々用いられる入力信号
は、種々の周波数たとえば800翫ないし1000圧の
範囲の正弦波信号またはホワイトガウシアンノイズまた
はラプラシアンノイズであり、何となればこれらの信号
は、容易に処理でき、従つて特にシシユレーシヨン(模
擬)技術により実行される試験に有効であるからである
。
とにかく、スペクトルおよび振幅特性が、音声信号のそ
れではない上記の種類の信号を用いると、客観的性能評
価と主観的性能評価すなわち真の聴者の受信する真の音
声信号を用いて得られる測定との間に、かなりの差が伴
うようになる。
れではない上記の種類の信号を用いると、客観的性能評
価と主観的性能評価すなわち真の聴者の受信する真の音
声信号を用いて得られる測定との間に、かなりの差が伴
うようになる。
客観的測定と主観的測定との間の差は、デイジタル伝送
システムにおいて一層大きい:最近の研究によると、デ
イジタル伝送システムにおいては、単に信号対雑音比は
もはや十分に意味のあるパラメータではなく、少なくと
も量子化雑音効果と振幅過負荷(または差動システムの
場合はスロープ)によるひずみ効果とを、同様にこれら
の2つのフアクタ(効果)の相対大きさを考慮しながら
区別しなければならないことが明らかとなつ.た。これ
に反し、容易に証明されかつ実験的に立証されたように
、上記の2つのフアクタの統計的特性のため、ホワイト
ノイズまたは正弦波信号のいずれかにより、上記記載の
2つの雑音成分すなわちガウシアンノイズまたはラプラ
シアンノイズ.を正確に区別できないようになる。他方
では、質試験のため音声合成により得られる人工信号を
用いることは容易でなく、何となれば上記の人工信号は
、真の信号に比べ、すべての点で不都合であり、すなわ
ち人工信号は、その合今成方法だけでなく、話者、テキ
スト、言語にも依存するはずであるからである;さらに
音声合成による信号発生は、極めて複雑でかつデリケー
トな工程である。
システムにおいて一層大きい:最近の研究によると、デ
イジタル伝送システムにおいては、単に信号対雑音比は
もはや十分に意味のあるパラメータではなく、少なくと
も量子化雑音効果と振幅過負荷(または差動システムの
場合はスロープ)によるひずみ効果とを、同様にこれら
の2つのフアクタ(効果)の相対大きさを考慮しながら
区別しなければならないことが明らかとなつ.た。これ
に反し、容易に証明されかつ実験的に立証されたように
、上記の2つのフアクタの統計的特性のため、ホワイト
ノイズまたは正弦波信号のいずれかにより、上記記載の
2つの雑音成分すなわちガウシアンノイズまたはラプラ
シアンノイズ.を正確に区別できないようになる。他方
では、質試験のため音声合成により得られる人工信号を
用いることは容易でなく、何となれば上記の人工信号は
、真の信号に比べ、すべての点で不都合であり、すなわ
ち人工信号は、その合今成方法だけでなく、話者、テキ
スト、言語にも依存するはずであるからである;さらに
音声合成による信号発生は、極めて複雑でかつデリケー
トな工程である。
質試験のために人工信号を用いる場合に含まれる問題は
、この発明の目的である方法と装置とにより解決され、
そしてその方法と装置とによると、簡単に統計的特性の
平均的人間音声を備えた人工信号をうることができ、従
つて主観的質測定および客観的質測定の間に良好な相関
関係が得られうるようになる。
、この発明の目的である方法と装置とにより解決され、
そしてその方法と装置とによると、簡単に統計的特性の
平均的人間音声を備えた人工信号をうることができ、従
つて主観的質測定および客観的質測定の間に良好な相関
関係が得られうるようになる。
この発明の特別な目的は、基本的に平均的人間音声の一
時的でかつスペクトル的な特性を模擬する特性の人工信
号を発生するための装置が提供され、そしてその装置に
おいては、音声刺激の特性を模擬する波形が発生され、
つぎにその波形は一度濾過されて位相をひずませること
なく振幅スペクトルが補償され、従つて平坦な振幅スペ
クトルを備えた新しい波形が発生されるようになる;そ
の平坦な振幅スペクトルを備えた平坦スペクトル波形は
音声特性を模擬するためもう一度沢過される。
時的でかつスペクトル的な特性を模擬する特性の人工信
号を発生するための装置が提供され、そしてその装置に
おいては、音声刺激の特性を模擬する波形が発生され、
つぎにその波形は一度濾過されて位相をひずませること
なく振幅スペクトルが補償され、従つて平坦な振幅スペ
クトルを備えた新しい波形が発生されるようになる;そ
の平坦な振幅スペクトルを備えた平坦スペクトル波形は
音声特性を模擬するためもう一度沢過される。
本発明の装置は音声刺激の波形源とその波形のスペクト
ル平坦化を実行できる第1の線形位相デイジタルフイル
タと音声管の平均的伝達機能を実現できる第2のデイジ
タルフイルタとよりなる。
ル平坦化を実行できる第1の線形位相デイジタルフイル
タと音声管の平均的伝達機能を実現できる第2のデイジ
タルフイルタとよりなる。
この発明の目的のシステムを記載する前に若干の理論的
原理について述べなければならない。周知のように、音
声放出は、種々のパラメータにより影響されるようにな
る;そのパラメータには下記がある:音刺激源により発
生される音の形式、音声管(すなわち音声穴と唇間の非
均一音響管)の配置の時間および空間変化、音刺激の非
均一な継続時間、鼻空洞が、多少とも音伝送に関係があ
るという可能性がある。とにかく、音声形式信号を発生
するための装置は、音声コードを模擬する音(刺激)源
および音声管を模擬しかつその共振特性を音源により発
生される音響波へ賦課するフイルタとして作用する伝送
システムにより図式化される。
原理について述べなければならない。周知のように、音
声放出は、種々のパラメータにより影響されるようにな
る;そのパラメータには下記がある:音刺激源により発
生される音の形式、音声管(すなわち音声穴と唇間の非
均一音響管)の配置の時間および空間変化、音刺激の非
均一な継続時間、鼻空洞が、多少とも音伝送に関係があ
るという可能性がある。とにかく、音声形式信号を発生
するための装置は、音声コードを模擬する音(刺激)源
および音声管を模擬しかつその共振特性を音源により発
生される音響波へ賦課するフイルタとして作用する伝送
システムにより図式化される。
音源と伝送システム間の相互作用は無視できる(余りに
も大きい普遍性を損なうことなしに行なうことができる
)と仮定すると、音源を、それがホワイトスペクトル信
号を発生するよう実現させかつフイルタをそれが内部に
音声波形によるスベクトル寄与を放出および伝送へ集中
させるよう実現させることができる。
も大きい普遍性を損なうことなしに行なうことができる
)と仮定すると、音源を、それがホワイトスペクトル信
号を発生するよう実現させかつフイルタをそれが内部に
音声波形によるスベクトル寄与を放出および伝送へ集中
させるよう実現させることができる。
上記の要求を満足するこの発明による装置は、第1図に
示される。
示される。
この図において、参照符号EGは、周期波形発生器を示
し、実音声刺激を模擬する波形たとえば第2図の波形U
nを発生できるものである。
し、実音声刺激を模擬する波形たとえば第2図の波形U
nを発生できるものである。
図示のように、振幅A。および周期Tを有するそのよ
Jうな波形は3つの個別の部分により形成される:すな
わち継続期間T1を有する上昇部分と継続期間T2を有
する降下部分と一定部分との3つである。発生器EGは
、上記の3つの部分を発生し、そしてそれらが相互に完
全に独立したものである1ようにしなければならず、そ
の結果所要に応じて信号Unの形状および継続期間を容
易に変化できる。参照符号F1は、線形位相デイジタル
フイルタを示し、そしてその伝達関数は、基本的に周期
信l号Snの振幅スペクトルの逆値である;このように
して出力端子に、平坦な振幅スペクトルを備える関数が
得られるようになる。
Jうな波形は3つの個別の部分により形成される:すな
わち継続期間T1を有する上昇部分と継続期間T2を有
する降下部分と一定部分との3つである。発生器EGは
、上記の3つの部分を発生し、そしてそれらが相互に完
全に独立したものである1ようにしなければならず、そ
の結果所要に応じて信号Unの形状および継続期間を容
易に変化できる。参照符号F1は、線形位相デイジタル
フイルタを示し、そしてその伝達関数は、基本的に周期
信l号Snの振幅スペクトルの逆値である;このように
して出力端子に、平坦な振幅スペクトルを備える関数が
得られるようになる。
参照符号F2は、第2のデイジタルフイルタであり、音
声管の平均伝達関数を近似できる:そのデイジタルフイ
ルタ;F2の出力端子に、所望の人工信号Snが得られ
るようになる。この伝達関数をきめる方法は、この技術
分野において通常の知識を有するものにとつて周知であ
り、従つてここでは詳細に説明しない;たとえば、伝達
関数を線形予知技術によりき.めることができる。すな
わち、平均の実際の音声を得るために、異なつた話者が
時間で平均化され、線形予知技術によつて元の音声の平
均スペクトルを示す係数が得られ、その係数はデジイタ
ルフイルタの係数である。そのような信号で模擬される
音が音信号(すなわち、音声化音)と非鼻音とである場
合、フイルタF2は、定パラメータ全極フイルタよりな
ることができる。この制限は余りにも高いこの発明の普
遍性をそこなうものではなく、何となればこれらの音が
、音声を構成する音の大きいパーセントを占めているか
らである;他方ではフイルタF2により、信号に固定し
たスベクトル特性を持たせることもできる。この簡略化
はまた、下記の事実により是認される。すなわち多くの
音声処理および音声信号冗長度低減システムは、入力波
形の適合量子化を伴つて動作し、従つて周知のようにそ
のようなシステムはスペクトル変化に対し余り鋭敏でな
くなるという事実により是認される。上記記載のように
、発生すべき信号は、電話システムに挿入された試験装
置に使用しなければならないものであることを考慮する
と、フイルタF2の伝達関数は0Hzから4kHzまで
の周波数帯域幅における音声振幅の平均スペクトルを再
生できるよう選択されることが好ましい。
声管の平均伝達関数を近似できる:そのデイジタルフイ
ルタ;F2の出力端子に、所望の人工信号Snが得られ
るようになる。この伝達関数をきめる方法は、この技術
分野において通常の知識を有するものにとつて周知であ
り、従つてここでは詳細に説明しない;たとえば、伝達
関数を線形予知技術によりき.めることができる。すな
わち、平均の実際の音声を得るために、異なつた話者が
時間で平均化され、線形予知技術によつて元の音声の平
均スペクトルを示す係数が得られ、その係数はデジイタ
ルフイルタの係数である。そのような信号で模擬される
音が音信号(すなわち、音声化音)と非鼻音とである場
合、フイルタF2は、定パラメータ全極フイルタよりな
ることができる。この制限は余りにも高いこの発明の普
遍性をそこなうものではなく、何となればこれらの音が
、音声を構成する音の大きいパーセントを占めているか
らである;他方ではフイルタF2により、信号に固定し
たスベクトル特性を持たせることもできる。この簡略化
はまた、下記の事実により是認される。すなわち多くの
音声処理および音声信号冗長度低減システムは、入力波
形の適合量子化を伴つて動作し、従つて周知のようにそ
のようなシステムはスペクトル変化に対し余り鋭敏でな
くなるという事実により是認される。上記記載のように
、発生すべき信号は、電話システムに挿入された試験装
置に使用しなければならないものであることを考慮する
と、フイルタF2の伝達関数は0Hzから4kHzまで
の周波数帯域幅における音声振幅の平均スペクトルを再
生できるよう選択されることが好ましい。
上記記載の装置は、第3図に示すような周期信号を発生
する。
する。
その周期的構造のため、この信号は、あるこわさのパラ
メータを示す;このこわさが必要でない場合には、信号
へ変化性を導入し、音声特性をよりよく近似させること
ができる。そのような変化性は、スイツチCを介して発
生器EGとフイルタF1との間に挿入された擬似ランダ
ム発生器PS(第1図)により得られ、そしてその擬似
ランダム発生器により信号Unの振幅または周期または
その両方を擬似ランダムに変化させることができる。好
都合なことに、発生器PSは、ある期間の間、前の周期
の信号Snの振幅と周期信号Unの振幅とに基づいて可
変信号Snの振幅を変化させることができる。
メータを示す;このこわさが必要でない場合には、信号
へ変化性を導入し、音声特性をよりよく近似させること
ができる。そのような変化性は、スイツチCを介して発
生器EGとフイルタF1との間に挿入された擬似ランダ
ム発生器PS(第1図)により得られ、そしてその擬似
ランダム発生器により信号Unの振幅または周期または
その両方を擬似ランダムに変化させることができる。好
都合なことに、発生器PSは、ある期間の間、前の周期
の信号Snの振幅と周期信号Unの振幅とに基づいて可
変信号Snの振幅を変化させることができる。
たとえば、変化法則は、下記のようである;すなわちA
n=C.An−,+(1−C). AO(1+P.wn
)ここに: Anは、n番目の周期の所望の信号Snの振幅である;
An−,は、 (n−1)番目の周期の信号Snの振幅
である;AOは、周期信号Snの振幅である; Cは、0と1との間よりなる係数で、振幅コーバリアン
スすなわち信号の引続く周期の間の可能な振幅変化を示
すものである;Pは、振幅A。
n=C.An−,+(1−C). AO(1+P.wn
)ここに: Anは、n番目の周期の所望の信号Snの振幅である;
An−,は、 (n−1)番目の周期の信号Snの振幅
である;AOは、周期信号Snの振幅である; Cは、0と1との間よりなる係数で、振幅コーバリアン
スすなわち信号の引続く周期の間の可能な振幅変化を示
すものである;Pは、振幅A。
の値に対する最大相対変化である;Pの値は、下記のよ
うに選択される、すなわち信号Unに対するスペクトル
特性変化が極めて限定され、その結果フイルタF1にお
ける濾過作用を一層有効にできるよう選択される:Wn
は、非相関ランダム変数である (すなわち″ある瞬間
における値は、前の瞬間の値と相関関係にないというこ
とを示す);それは、範囲−1〜+1の間に均一に分布
した値をとる。
うに選択される、すなわち信号Unに対するスペクトル
特性変化が極めて限定され、その結果フイルタF1にお
ける濾過作用を一層有効にできるよう選択される:Wn
は、非相関ランダム変数である (すなわち″ある瞬間
における値は、前の瞬間の値と相関関係にないというこ
とを示す);それは、範囲−1〜+1の間に均一に分布
した値をとる。
周期変化法則は、たとえば下記の形式である:すなわち
ここに; Tnは、波形の所望のn番目の周期である;Tは、Un
の周期である;ΔTは、Tの周りの最大瞬時変化である
;Ynは、Wnと同様な非相関ランダム変数である。
ここに; Tnは、波形の所望のn番目の周期である;Tは、Un
の周期である;ΔTは、Tの周りの最大瞬時変化である
;Ynは、Wnと同様な非相関ランダム変数である。
容易に擬似ランダム発生器PSを実現させるため、変数
Ynは、瞬間ごとにWnと一致させる。
Ynは、瞬間ごとにWnと一致させる。
この発明により得られる振幅または周期またはその両方
の擬似ランダム変化を備える人工音声信号は、第4図に
示される。そのような装置の動作モードは、単一プロツ
クの動作に関して上記に記載したことから容易に推論で
きる;発生器EGで発生されかつおそらくは発生器PS
で振幅および周期の擬似ランダムな変化を受けるであろ
う周期信号Un(第1図)は、フイルタF1で一度濾過
される。
の擬似ランダム変化を備える人工音声信号は、第4図に
示される。そのような装置の動作モードは、単一プロツ
クの動作に関して上記に記載したことから容易に推論で
きる;発生器EGで発生されかつおそらくは発生器PS
で振幅および周期の擬似ランダムな変化を受けるであろ
う周期信号Un(第1図)は、フイルタF1で一度濾過
される。
上記記載のようにフイルタF1の伝達関数は、基本的に
信号Unの振幅の逆数なので、淵過の結果として平坦な
振,幅スペクトルを備える信号が得られる;つぎにその
信号はフイルタF2で濾過され、電話音声の平均スペタ
トル特性をとるようになる。たとえば第3図および第4
図に示す2つの例のように、フイルタF2の出力端子に
得られる信号は、つぎに図示しない試験すべき装置へそ
の入力信号として送られる。上記記載の事柄は、例によ
り説明したけれども、これに限定されるものでなく、明
らかに、この発明の要旨の範囲内で変形することは可能
である。
信号Unの振幅の逆数なので、淵過の結果として平坦な
振,幅スペクトルを備える信号が得られる;つぎにその
信号はフイルタF2で濾過され、電話音声の平均スペタ
トル特性をとるようになる。たとえば第3図および第4
図に示す2つの例のように、フイルタF2の出力端子に
得られる信号は、つぎに図示しない試験すべき装置へそ
の入力信号として送られる。上記記載の事柄は、例によ
り説明したけれども、これに限定されるものでなく、明
らかに、この発明の要旨の範囲内で変形することは可能
である。
第1図は、この発明の目的である装置のプロツク図、第
2図は、音声刺激を模擬する信号を示す図、第3図およ
び第4図は、人工音声信号の2つの可能な例であり、そ
してそれらの2つの信号は、第2図の波形から得られる
ものである図を示す。 EG・・・・・・波形発生器、F1・・・・・・第1の
デイジタルフイルタ、F2・・・・・・第2のデイジタ
ルフイルタ、PS・・・・・・擬似ランダム発生器、U
n・・・・・・音声刺激を模擬する波形、Sn・・・・
・・可変信号(出力信号)。
2図は、音声刺激を模擬する信号を示す図、第3図およ
び第4図は、人工音声信号の2つの可能な例であり、そ
してそれらの2つの信号は、第2図の波形から得られる
ものである図を示す。 EG・・・・・・波形発生器、F1・・・・・・第1の
デイジタルフイルタ、F2・・・・・・第2のデイジタ
ルフイルタ、PS・・・・・・擬似ランダム発生器、U
n・・・・・・音声刺激を模擬する波形、Sn・・・・
・・可変信号(出力信号)。
Claims (1)
- 【特許請求の範囲】 1 音声伝送システムの一部をなす装置の性能を客観的
に測定する人工音声信号を発生するための装置において
:−音声刺激を模擬し、音源信号として利用される、波
形u_nを発生する波形発生器EGと;−線形位相を備
え、波形発生器EGの後に接続され、該音源信号u_n
の振幅スペクトルの逆値である伝達関数を備える、第1
のデジイタルフイルタF1と;そして−異なつた人間の
話者によつて発生された複数個の音声信号を平均するこ
とによつて得た音声信号の振幅スペクトルと位相を示す
伝達関数を備える第2のディジタルフィルタF2とを設
けており、該第2のフィルタF2は、該第1のフィルタ
の出力信号を受取り、人工音声信号を提供することを特
徴とする人工音声信号を発生する装置。 2 波形発生器EGは、周期波形の発生器であり、そし
て装置PSが提供されて、それにより上記の周期波形の
振幅または周期、または、その両方を擬似ランダム変化
させることを特徴とする特許請求の範囲第1項に記載の
装置。 3 第2のフィルタF2は、0Hzから4kHzの間の
周波数帯域幅における音声振幅の平均スペクトルを再生
するような伝達関数を提供する定パラメータ全極フィル
タであることを特徴とする特許請求の範囲第1項に記載
の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT68420/77A IT1083533B (it) | 1977-06-20 | 1977-06-20 | Procedimento e dispositivo per la generazione di un segnale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di sistemi di trasmissione di segnali vocali |
IT0068420-A/77 | 1977-06-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS547805A JPS547805A (en) | 1979-01-20 |
JPS5950075B2 true JPS5950075B2 (ja) | 1984-12-06 |
Family
ID=11309347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53072271A Expired JPS5950075B2 (ja) | 1977-06-20 | 1978-06-16 | 人工音声信号を発生するための方法と装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US4187397A (ja) |
JP (1) | JPS5950075B2 (ja) |
CH (1) | CH629051A5 (ja) |
DE (1) | DE2826818C2 (ja) |
FR (1) | FR2395564A1 (ja) |
GB (1) | GB2000303B (ja) |
IT (1) | IT1083533B (ja) |
NL (1) | NL181152C (ja) |
SE (1) | SE438386B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL7902238A (nl) * | 1978-04-27 | 1979-10-30 | Kawai Musical Instr Mfg Co | Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument. |
US4374482A (en) * | 1980-12-23 | 1983-02-22 | Norlin Industries, Inc. | Vocal effect for musical instrument |
US4449231A (en) * | 1981-09-25 | 1984-05-15 | Northern Telecom Limited | Test signal generator for simulated speech |
GB2121549B (en) * | 1982-06-01 | 1985-08-29 | Standard Telephones Cables Ltd | Apparatus for determining the loudness rating of a telephone system |
JPS61152800A (ja) * | 1984-12-27 | 1986-07-11 | 日華化学株式会社 | ドライクリ−ニング用洗浄剤 |
US5832431A (en) * | 1990-09-26 | 1998-11-03 | Severson; Frederick E. | Non-looped continuous sound by random sequencing of digital sound records |
JP3167259B2 (ja) * | 1994-05-06 | 2001-05-21 | 三菱電機株式会社 | 音響再生装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB937434A (en) * | 1959-02-24 | 1963-09-18 | Nippon Electric Co | A vowel synthesizer |
US3280266A (en) * | 1963-05-15 | 1966-10-18 | Bell Telephone Labor Inc | Synthesis of artificial speech |
GB1175740A (en) * | 1966-05-18 | 1969-12-23 | Tesla Np | Method and device for Measuring the Reference Equivalent or Articulation of Telephone Sets |
US3549807A (en) * | 1967-09-18 | 1970-12-22 | Bell Telephone Labor Inc | Voiced fricative synthesizer |
FR2045207A5 (ja) * | 1969-06-20 | 1971-02-26 | Anvar | |
DE2028005A1 (de) * | 1970-06-08 | 1971-12-23 | Sotscheck J | Verfahren zur Bestimmung der Sprachqualität einer Übertragungsstrecke |
CA1005913A (en) * | 1971-03-01 | 1977-02-22 | Richard T. Gagnon | Voice synthesizer |
DE2263579A1 (de) * | 1972-12-27 | 1974-07-04 | Philips Patentverwaltung | Schaltungsanordnung zur elektrischen nachbildung von kehlkopfimpulsen |
CH581878A5 (ja) * | 1974-07-22 | 1976-11-15 | Gretag Ag |
-
1977
- 1977-06-20 IT IT68420/77A patent/IT1083533B/it active
-
1978
- 1978-06-06 FR FR7816856A patent/FR2395564A1/fr active Granted
- 1978-06-13 SE SE7806822A patent/SE438386B/sv not_active IP Right Cessation
- 1978-06-16 JP JP53072271A patent/JPS5950075B2/ja not_active Expired
- 1978-06-16 NL NLAANVRAGE7806508,A patent/NL181152C/xx not_active IP Right Cessation
- 1978-06-16 US US05/916,356 patent/US4187397A/en not_active Expired - Lifetime
- 1978-06-19 DE DE2826818A patent/DE2826818C2/de not_active Expired
- 1978-06-19 CH CH666778A patent/CH629051A5/it not_active IP Right Cessation
- 1978-06-19 GB GB7827267A patent/GB2000303B/en not_active Expired
Also Published As
Publication number | Publication date |
---|---|
GB2000303B (en) | 1982-01-27 |
NL181152B (nl) | 1987-01-16 |
NL181152C (nl) | 1987-06-16 |
GB2000303A (en) | 1979-01-04 |
CH629051A5 (it) | 1982-03-31 |
SE7806822L (sv) | 1978-12-21 |
US4187397A (en) | 1980-02-05 |
DE2826818C2 (de) | 1983-02-17 |
SE438386B (sv) | 1985-04-15 |
FR2395564B1 (ja) | 1984-04-27 |
NL7806508A (nl) | 1978-12-22 |
IT1083533B (it) | 1985-05-21 |
DE2826818A1 (de) | 1979-02-08 |
FR2395564A1 (fr) | 1979-01-19 |
JPS547805A (en) | 1979-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dudley | Remaking speech | |
AU670950B2 (en) | Method and apparatus for objective speech quality measurements of telecommunication equipment | |
Habets | Multi-channel speech dereverberation based on a statistical model of late reverberation | |
Richter et al. | Evaluation of a fast HRTF measurement system | |
Moore et al. | Measuring and predicting the perceived quality of music and speech subjected to combined linear and nonlinear distortion | |
Denk et al. | Removing reflections in semianechoic impulse responses by frequency-dependent truncation | |
Jørgensen et al. | Speech intelligibility evaluation for mobile phones | |
JPS5950075B2 (ja) | 人工音声信号を発生するための方法と装置 | |
Antweiler et al. | Perfect sequence lms for rapid acquisition of continuous-azimuth head related impulse responses | |
Liski et al. | Audibility of group-delay equalization | |
Välimäki et al. | Parametric spring reverberation effect | |
Steeneken et al. | Basics of the STI measuring method | |
Edraki et al. | Speaker adaptation for enhancement of bone-conducted speech | |
CN112511941B (zh) | 一种音频输出方法及系统及耳机 | |
Benjamin et al. | The effect of room acoustics on subwoofer performance and level setting | |
Gonzalez et al. | Near-field evaluation of reproducible speech sources | |
Järveläinen et al. | Reverberation modeling using velvet noise | |
de Santis et al. | Perception & thresholds of nonlinear distortion using complex signals | |
Ellaham et al. | Evaluation of the phase-inversion signal separation method when using nonlinear hearing aids | |
Jamieson et al. | Electroacoustic evaluation of assistive hearing devices | |
ASCARI | DSP analysis and psychoacoustic testing on the perception of low frequency transients and quality degradation in small rooms | |
Delebecque et al. | BinauRec: A dataset to test the influence of the use of room impulse responses on binaural speech enhancement | |
Gelen | Convolution An Approach For Pre-auralization Of A Performance Space | |
Pulkki | An Introduction to Sound, Hearing and Perception | |
Mohlin | Blind Estimation of Sound Coloration in Rooms |