JPH07505237A - コード化されたスピーチを送信及び受信する方法 - Google Patents
コード化されたスピーチを送信及び受信する方法Info
- Publication number
- JPH07505237A JPH07505237A JP6517696A JP51769694A JPH07505237A JP H07505237 A JPH07505237 A JP H07505237A JP 6517696 A JP6517696 A JP 6517696A JP 51769694 A JP51769694 A JP 51769694A JP H07505237 A JPH07505237 A JP H07505237A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- reflection coefficient
- calculated
- memory
- reflection coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
コード化されたスピーチを送信及び受信する方法発明の分野
本発明は、コード化されたスピーチを送信する方法であって、スピーチ信号のサ
ンプルを取り出しそしてこれらサンプルから反射係数を計算するような方法に係
る。
又、本発明は、コード化されたスピーチを受信する方法にも関する。
先行技術の説明
テレコミュニケーションシステム、特にGSMシステムのような無線電話システ
ムの無線経路においては、システムに入ってきて送信されるべきスピーチ信号が
予め処理され、即ちフィルタされてデジタル形態に変換されることが知られてい
る。既知のシステムにおいては、信号が、次いで、適当なコード化方法、例えば
、LTP (長期間予測)又はRPE (規則的パルス励起)方法によってコー
ド化される。GSMシステムは、典型的に、これらの組み合わせ、即ちRPE−
LTP方法を使用し、これは、例えば、M、マウリ及びM、B、ポーチ著の「移
動通信用のGSMシステム(The GSM System for Mobi
le Communications)J、1992.49、rue PALA
ISEAU F−91120,第155−162ページに詳細に説明されている
。これらの方法は、GSM仕様rGSM 06゜10.1990年1月、GSM
フルレートスピーチトランスコーディング(FullRate 5peech
Transcoding)、ETSI、93ページ」に詳細に述べられている。
既知の技術の欠点は、使用するコード化方法が大きな送信容量を必要とすること
である。公知技術によるこれらの方法を使用するときには、受信器へ送信される
べきスピーチ信号が完全に送信されねばならず、従って、送信容量が不必要に浪
費されることになる。
発明の要旨
本発明の目的は、テレコミュニケーションシステムにおいてデータを送信するス
ピーチコード化方法であって、スピーチ送信に必要とされる送信速度を低減でき
るか及び/又は所要の送信容量を減少できるようなコード化方法を提供すること
である。
コード化されたスピーチを送信するこの新規な方法は、反射係数の特性を少なく
とも1つの手前の話し手の反射係数の各音響(音)指向特性と比較して、音響を
識別し、識別された音響の識別子を送信し、同じ音響を表す反射係数に対して話
し手指向特性を計算しそしてメモリに記憶し、同じ音響を表す反射係数の上記計
算されてメモリに記憶された特性を、同じ音響を表す反射係数のその後の特性と
比較し、同じ音響を表す反射係数のその後の特性が、メモリに記憶された反射係
数の特性と本質的に異なる場合には、その同じ音響を表す新たな特性をメモリに
記憶しそして送信し、更に、それらを送信する前に、これら特性を送信するとい
う情報を送り、そして同じ音響を表す反射係数のその後の特性が、メモリに記憶
された反射係数の特性と本質的に異ならない場合には、話し手の同じ音響を表す
反射係数の特性と、手前のサンプルから計算された反射係数の特性との間の差を
計算して送信することを特徴とする本発明の方法によって提供される。
更に、本発明は、コード化されたスピーチを受信する方法であって、識別された
音響の識別子を受信し、1つの手前の話し手の記憶された音響指向の反射係数の
特性と、サンプルから計算された反射係数の特性との間の差を受け取り、受信し
た音響識別子に対応する反射係数の話し手指向特性をメモリにおいてサーチして
上記の差に加え、この和から音響発生に使用される新たな反射係数を計算し、そ
して通信用送信器によって送られる新たな特性と、別の通信用送信器によって送
られる同じ音響を表す反射係数の新たな特性との送信情報を受信した場合に、こ
れらの新たな特性をメモリに記憶することを特徴とする方法にも係る。
本発明は、送信については、スピーチ信号をLPG (リニアな予測コード化)
う考え方に基づいている。本発明によれば、送信されるべきスピーチの反射係数
を、同じ音響に対して計算された多数の話し手の各々の以前に受け取った反射係
数と比較することにより、送信されるべきスピーチから音響が識別される。その
後に、反射係数と、それに対する幾つかの特性が、関連する話し手の各音響に対
して計算される。この特性は、話し手の声道をモデリングするロスのない管の物
理的な寸法を表す数値でもよい。その後、これらの特性から、各音響に対応する
反射係数の特性が減算されて、差が与えられ、これが音響の識別子と共に受信器
へ送信される。その前に、各々の音響識別子に対応する反射係数の特性の情報が
受信器へ送信されており、それ故、上記の差と、以前に受け取っている反射係数
の特性との和をとることにより元の音響を再現することができ、従って、送信経
路の情報量が減少される。
コード化されたスピーチを送信及び受信するこのような方法は、送信経路におい
てあまり送信容量が必要とされないという利点がある。というのは、各話し手の
全ての音声特徴を送信する必要はなく、話し手の各音響の識別子と、その話し手
の各音響の以前の反射係数のある特性の特徴、典型的には平均値から話し手の各
個々の音響がずれるところの偏差とを送信すれば充分だからである。従って、本
発明によれば、スピーチ送信に必要な送信容量を全部で約10%減少することが
でき、これは相当の量である。
更に、本発明は、話し手の確認に使用することもでき、これは、話し手の音響指
向の反射係数のある特性、例えば、平均値を前もってメモリに記憶し、そしても
し所望であれば、話し手のある音響の反射係数の特性を、前もって計算された上
記特性と比較することによって話し手を確認するようにして行われる。
本発明に使用されるロスのない管モデルの円筒状部分の断面積は、従来のスピー
チコード化アルゴリズムにおいて形成されるいわゆる反射係数から容易に計算で
きる。又、半径又は直径のような幾つかの他の断面寸法も、この面積から当然決
定して、基準パラメータを構成することもできる。一方、管の断面は、円形では
なくて、他の形状であってもよい。
図面の簡単な説明
以下、添付図面を参照し、本発明の実施例を詳細に説明する。
図1及び2は、次々の円筒状部分より成るロスのない管により形成された話し手
の声道のモデルを示す図である。
図3は、ロスのない管のモデルがスピーチ中にいかに変化するかを示す図である
。
図4は、音響の識別を示すフローチャートである。
図58は、本発明により送信器において音響レベルに基づいてスピーチをコード
化するところを示すブロック図である。
図5bは、本発明により受信器において音響レベルに基づいてスピーチ信号を再
現するところを示すトランザクション図である。
図6は、本発明による方法を実施する通信用送信器を示す図である。
図7は、本発明による方法を実施する通信用受信器を示す図である。
好ましい実施例の詳細な説明
図1には、次々の円筒状部分C1−C8より成り人間の声道のおおよそのモデル
を構成するロスのない管状モデルが斜視図で示されている。図1に示されたこの
ロスのない管状モデルの側面図が図2に示されている。人間の声道とは、一般的
に、人間の声帯、喉頭、咽頭の口、及び唇によって定められた声の通路を指すも
ので、これにより人間がスピーチの音響を発するものである。図1及び2におい
て、円筒状部分C1は、声帯間の声門の直後の声道部分の形状を示しており、円
筒状部分C8は、唇における声道の形状を示しており、そしてそれらの間の円筒
状部分C2−C7は、声門と唇との間の個々の声道部分の形状を示している。
声道の形状は、通常、話をする間に異なる種類の音が発せられるときに連続的に
変化する。同様に、声道の種々の部分を表している個別の円筒状部分C1−C8
の直径及び面積も、話をする間に変化する。しかしながら、本発明者の以前の特
許出願Fl−912088は、比較的多数の瞬時声道形状から計算された声道の
平均形状には各話し手ごとに一定の特性があり、この一定の特性を用いて、テレ
コミュニケーションシステムにおいて音響をよりコンパクトに通信できるか又は
話し手を確認できることを開示している。対応的に、声道のロスのない管状モデ
ルの円筒状部分C1−C8の断面積の瞬時値から長期間にわたって計算された円
筒状部分C1−C8の断面積の平均値も、比較的厳密に一定である。更に、円筒
の断面寸法の値も、実際の声道の値によって決定され、従って、話し手の比較的
正確な一定の特性である。
本発明による方法は、公知技術で良(知られたリニア予想コード化(L P G
)における暫定的な結果として形成されたいわゆる反射係数、即ち声道の形状及
び構造とある接続を有するいわゆるPARCOR係数rhを使用するものである
。
これらの反射係数T、と、声道のロスのない管状モデルの円筒状部分Cにの面積
Axとの間の接続は、次の式(1)に基づくものである。
但し、k=1.2.3・・・である。このような断面積は、反射係数の特性とみ
なすことができる。
本発明に用いられる反射係数を発生するLPC分析は、多数の既知のスピーチコ
ード化方法に使用される。本発明による方法の1つの効果的な実施例は、無線電
話システム、特に、パンヨーロピアンデジタル無線電話システムGSMにおいて
加入者により送られたスピーチ信号をコード化することであると期待される。
GSMの仕様06.10は、このシステムに使用されるLPC−LTP−RPE
(リニア予想コード化−長期間予想−規則的パルス励起)を非常に正確に定義す
る。本発明による方法を、このスピーチコード化方法に関連して使用することが
効果的である。というのは、本発明に必要とされる反射係数は、上記した公知の
LPC−RPE−LPTコード化方法からの暫定的な結果として得られるからで
ある。本発明においては、その方法のステップは、反射係数の計算まではGSM
仕様06.10に合致する上記スピーチコード化アルゴリズムをたどり、これら
ステップの詳細に関する限りは、上記仕様を参照する。以下、これらの方法ステ
ップは、図4のフローチャートを参照して、本発明を理解するのに重要な部分の
みについて一般的に説明する。
図4において、入力信号INは、ブロック10において、サンプリング周波数8
KHzでサンプリングされ、そして8ビツトのサンプルシーケンスSoが形成さ
れる。ブロック11において、サンプルから直流成分が抽出され、コード化にお
いておそらく生じるであろう障害サイドトーンを除去する。その後、サンプル信
号は、ブロック12において、−次のFIR(限定インパルス応答)フィルタに
より高い信号周波数を重み付けすることにより予め強調される。ブロック13に
おいて、サンプルは、160サンプルのフレームにセグメント化され、各フレー
ムの巾は約20m5である。
ブロック14において、実行レベルp=8で自動相関方法により各フレームにお
いてLPG分析を行うことによりスピーチ信号のスペクトルがモデリングされる
。次いで、自動相関関数ACFの値p+1は、次の式(2)によりフレームから
シ笥される。
ACF(k)=Σ5(i)s(i−k) (2)1=1
但し、k=0.1、・・・8である。
自動相関関数に代わって、共分散(co−variance)関数のような他の
適当な関数を使用することもできる。スピーチコード化装置に使用される短期間
分析フィルタの8個のいわゆる反射係数rhの値は、自動相関関数で得た値から
、シューアの反復方法15又は他の適当な反復方法によって計算される。シュー
アの反復方法は、20m5ごとに新たな反射係数を発生する。本発明の1つの実
施例において、係数は16ビツトより成り、それらの数値は8である。もし所望
であれば、シューアの反復方法15を長期間適用することにより、反復係数の数
値を増加することができる。
ステップ16において、円筒状部分により話し手の声道をモデリングするロスな
しの管の各円筒状部分CIの断面積A罠は、各フレームから計算された反射係数
rhから計算される。シューアの反復方法15は、20m5ごとに新たな反射係
数を発生するので、各円筒状部分C工ごとに、毎秒50の断面積が得られる。
ロスなし管の円筒の断面積が計算された後に、ステップ17において、円筒のこ
れらの計算された断面積を、パラメータメモリに記憶された円筒の断面積の値と
比較することにより、スピーチ信号の音響が識別される。この比較動作は、図5
の説明において参照番号60.60A及び61.61Aを参照して詳細に説明す
る。ステップ18において、ロスなし管のモデルの円筒部分Ctの面積の平均値
Ac、aw*が、スピーチ信号から得たサンプルについて計算され、そしてフレ
ーム中に生じた最大断面積AK、maxが、各円筒状部分CKに対して決定され
る。次いで、ステップ19において、計算された平均値が、メモリ、例えば、図
6に示すパラメータ用のバッファメモリ608に記憶される。その後に、バッフ
ァメモリ608に記憶された平均値は、丁度得られたスピーチサンプルの断面積
と比較さ異なるかどうかが計算される。得られたサンプルが既に記憶されている
平均値から著しく異なる場合は、パラメータ、即ち平均値の更新21が行われ、
これは、変更の追従及び更新ブロック611が、図6に示すように、パラメータ
更新ブロック609を制御し、パラメータバッファメモリ608からパラメータ
を読み取ってそれらをパラメータメモリ610に記憶することを意味する。同時
に、これらパラメータは、スイッチ619を経て受信器へ送信され、その構造は
図7に示されている。一方、得られたサンプルが既に記憶されている平均値と著
しく相違しない場合は、図6に示す音響識別から得られた瞬時スピーチ音響のパ
ラメータが減算手段616へ供給される。これは、図4のステップ22において
行われ、減算手段616は、パラメータメモリ610において、同じ音響を表す
以前のパラメータの平均値をサーチし、それらから、丁度得たサンプルの瞬時パ
ラメータを減算して差を形成し、これは、変更の追従及び更新ブロック611に
より制御されるスイッチ619へ送信され(625) 、このスイッチは、ステ
ップ23において、差の信号をマルチプレクサ620 MUXを経て受信器へと
順方向に送信する。この送信は、図6の説明と共に正確に述べる。変更の追従及
び更新ブロック611は、各々の場合に適したやり方で、差の入力信号、即ち更
新パラメータ又は差をマルチプレクサ620及び無線部621へ接続するように
スイッチ619を制御する。
図5aに示す本発明の実施例において、音響レベルに基づいてスピーチをコード
化するのに使用する分析を説明するが、これは、声道をモデリングするロスのな
い管の円筒部分の断面積の平均値を、分析されるべきスピーチ信号から、所定の
音響中に形成される瞬時のロスなし管モデルの円筒状部分の面積により計算する
ように行う。1つの音響の時間巾は、若干長くて、多数の数十の一時的に連続す
るロスなし管モデルを、スピーチ信号に存在する単一の音響から計算できるもの
である。これは、4つの一時的に連続する瞬時ロスなし管モデルS1ないしS4
を示す図3に示されている。図3から、ロスなし管の個々の円筒の半径及び断面
積は時間的に変化することが明らかであろう。例えば、瞬時モデルS1、S2及
びS3は、同じ音響の間に形成されるとおおよそ分類することができ、従ってそ
れらの平均値を計算することができる。ところが、モデルS4は、明らかに異な
るもので別の音響に関連しており、それ故、平均化には組み込まない。
以下、図5aのブロック図を参照して、音響レベルに基づくスピーチのコード化
を説明する。たとえスピーチのコード化を単一の音響により行えたとしても、通
信者が互いに送信しようとする全ての音響をコード化に使用するのが適当である
。例えば、全ての母音及び子音を使用することができる。
スピーチ信号から形成された瞬時のロスなし管モデル59は、この瞬時のロスな
し管モデル59の各円筒部分の断面寸法が既知の話し手の対応する音響の所定の
記憶された限界値内にある場合には、ブロック52において、ある音響に対応す
るように識別することができる。これらの音響指向及び円筒指向の限界値は、図
6の参照番号624により指示されたメモリ手段に含まれたいわゆる音響マスク
を形成するいわゆる定量化テーブル54に記憶される。図5aにおいて、参照番
号60及び61は、識別されるべき瞬時気道モデル59が適合しなければならな
い許容エリア60A及び61A(陰影付けされないエリア)内において上記の音
響指向及び円筒指向の限界値が各音響に対してマスク又はモデルをいかに形成す
るかを示している。図5aにおいて、瞬時声道モデル59は、音響マスク60に
適合するが、音響マスク61には明らかに適合しない。従って、ブロック52は
、ある種の音響フィルタとして作用し、これは、気道モデルを正しい音グループ
a、e、i等に分類する。図6のブロック606において、即ち図5aのステッ
プ52において音が識別された後に、その識別された音as es iSkに対
応するパラメータが、図58のブロック53に対応する図6のバッファメモリ6
08に記憶される。このバッファメモリ608、即ち図5aのブロック53から
、音響パラメータは、更に、図6に示す変更の追従及び更新制御ブロックの制御
のもとて実際のパラメータメモリ55に記憶され、ここで、as ez 1%
kのような各音は、その音に対応するパラメータを有する。又、音響の識別にお
いては、識別されるべき各音に識別子を与えることができ、これにより、各瞬時
の音響に対応するパラメータをパラメータメモリ55.610においてサーチす
ることができる。これらのパラメータは、減算手段616へ供給することができ
、この減算手段は、図5aによれば、音響識別子によりパラメータメモリにおい
てサーチされた音響のパラメータと、その音響の瞬時値との間の差を計算する(
56)。
この差は、図6に示すように更に受信器へ送られ、これについては、図6を参照
して詳細に説明する。
図5bは、本発明により受信器において行われる音響レベルに基づ(スピーチ信
号の再現を示すトランザクション図である。受信器は、送信器の音響識別ユニッ
ト(図6の参照番号606)によって識別された音響の識別子500を受け取り
、その音響識別子500に基づいて、それ自身のパラメータメモリ5o1(図7
の参照番号711)において、その音響に対応するパラメータをサーチし、そし
てそれらを加算器503(図7の参照番号712)へ供給しく502) 、差と
パラメータとの和をとることによって反射係数の新たな特性を形成する。これら
の数値により、新たな反射係数が計算され、そこから新たなスピーチ信号を計算
することができる。加算によりスピーチ信号をこのように形成することは、図7
を参照して説明する。
図6は、本発明の方法を実施する通信用の送信器600を示している。送信され
るべきスピーチ信号は、マイクロホン601を経てシステムへ供給され、そこか
ら電気的形態に変換された信号が前処理ユニット602へ送信され、ここでは信
号がフィルタされてデジタル形態に変換される。次いで、デジタル信号のLPG
分析が、典型的に信号プロセッサにあるLPG分析器603において実行される
。LPG分析は、反射係数605を生じ、これらは、本発明による送信器へ送ら
れる。LPC分析器を通過した情報の残りは、LTP及びRPEコード化のよう
な他の必要なコード化を実行する他の信号処理ユニット604へ供給される。
反射係数605は、音響識別ユニット606へ供給され、該ユニットは、当該音
響を発する話し手の声道の瞬時断面値であって、図5に参照番号59で一例が示
されたように、供給された音響の反射係数から得た値又は他の適当な値を、メモ
リ手段624に予め記憶されている使用可能な音響の音響マスクと比較する。こ
れらマスクは、図5に参照番号60.60A、61及び61Aで示されている。
話し手によって発せられた音響が、音響識別ユニッ)606に送られた情報6゜
5から首尾良く発見された後に、各音響に対応する平均値が音響指向の平均化ユ
ニット607においてその特定の話し手に対して計算される。その話し手の声道
の断面値の音響指向平均値はパラメータバッファメモリ608に記憶され、そこ
からパラメータ更新ブロック609が各折たな音響の平均値をパラメータの更新
時にパラメータメモリ610に記憶する。音響指向平均値を計算した後に、分析
されるべき各音響に対応する値、即ち平均値が計算されたところの一時的な非断
続的な繋がりからの値が、変更の追従及び更新制御ブロック611へ送られる。
このブロックは、パラメータメモリ610に記憶された各音響の平均値を、同じ
音響の以前の値と比較する。丁度到着した以前の音響の値が、以前の音響の平均
値から充分に異なる場合は、パラメータ、即ち平均値の更新が最初にパラメータ
メモリにおいて実行されるが、各音響を発するのに必要な声道の断面の平均値、
即ちパラメータの平均値613であるこれらのパラメータは、スイッチ619を
経てマルチプレクサ620へ送られ、そこから、無線部621及びアンテナ62
2を経て無線経路623へそして更に受信器へ送られる。送信器によって送られ
た情報がパラメータの更新情報より成ることを受信器に知らせるために、変更の
追従及び更新制御ブロック611は、マルチプレクサ620にパラメータ更新フ
ラグ612を送信し、これは、上記ルート621.622.623に沿って更に
受信器へ送られる。
スイッチ619は、追従及び更新制御ブロック611により、パラメータがその
更新時にスイッチ619を経て更に受信器へ送られるように制御される(614
)。
新たなパラメータが、通信がスタートした状態において(受信器へそれまでにパ
ラメータが送られていないことを意味する)受信器へ送られたとき、又は古いパ
ラメータに取って代わる新たなパラメータが受信器へ送られたときには、コード
化された音響の送信が次の音響の到着時に開始される。音響識別ユニット606
で識別された音響のパラメータは、次いで、減算手段616へ送信される。これ
と同時に、音響617の情報は、マルチプレクサ620、無線部621、アンテ
ナ622及び無線経路623を経て受信器へ送られる。この音響情報は、例えば
、固定の二進数を表すビットストリングであってもよい。減算手段616におい
ては、丁度識別された(606)音響のパラメータが、同じ音響を表す以前のパ
ラメータの平均値615から減算され、これら平均値はパラメータメモリ610
においてサーチされたものであり、そして計算された差が、マルチプレクサ62
0を経て、上記ルート621.622.623に沿って更に受信器へ送られる(
625)。以上の説明を注意深く読めば、本発明の方法により得られる効果、即
ち必要とされる送信容量の減少は、減算により正に生じるこの差と、この差の送
信とに基づくものであることが明らかであろう。
図7は、本発明の方法を実施する通信用受信器700を示している。図6の通信
用送信器600により無線経路623−701又は何らかの他の媒体を経て送信
された信号は、アンテナ702により受信され、そこから信号は無線部703へ
送られる。送信器600により送られた信号がLPGコード化以外の方法でコー
ド化された場合には、これがデマルチプレクサ704により受け取られそして他
のデコード即ちLTP及びRPEデコードのための手段705へ送られる。送信
器600によって送られた音響情報は、デマルチプレクサ704によって受け取
られ、そして音響パラメータサーチユニット718へ送られる(706)。更新
されたパラメータの情報も、デマルチプレクサ704 (DEMUX)によって
受け取られ、そして同様に受信されたパラメータ更新フラグ709によって制御
されるスイッチ707へ送られる。送信器600によって送信された減算信号も
スイッチ707に送られる。スイッチ707は、更新されたパラメータ、即ち音
響に対応する新たなパラメータの情報をパラメータメモリ711へ与える(71
0)。丁度到着した音響の平均値と、その同じ音響を表す以前のパラメータとの
間の受信した差は、加算器712へ送られる(708)。従って、音響識別子、
即ち音響情報は、音響パラメータサーチユニット718へ送られており、該ユニ
ットは、パラメータメモリ711に記憶されている音響(の識別子)に対応する
パラメータをサーチしく716) 、これらパラメータは、パラメータメモリ7
11により加算器712へ送られ(717) 、係数の計算が行われる。加算器
712は、差708と、パラメータメモリ711から得た(717)パラメータ
とを加算し、そこから新たな係数、即ち新たな反射係数を計算する。これらの係
数により、元の話し手の声道のモデルが形成され、従って、この元の話し手のス
ピーチに類似したスピーチが形成される。新たに計算された反射係数は、LPG
デコーダ714へ送られ(713)そして更に後処理ユニット715へ送られ、
このユニットは、デジタル/アナログ変換を行いそして増幅したスピーチ信号を
更にスピーカ720へ送り、該スピーカは、元の話し手のスピーチに対応するス
ピーチを再現する。
本発明による上記方法は、実際には、例えば、従来の信号プロセッサを使用する
ことによりソフトウェアによって実施することができる。
添付図面及びそれに関連した上記説明は、本発明の考え方を示すものに過ぎない
。コード化されたスピーチを送信及び受信する本発明の方法は、その細部に関し
て、請求の範囲内で変更し得る。本発明は、主として、無線電話システム、特に
GSM移動電話システムに関して以上に説明したが、本発明の方法は、他の種類
のテレコミュニケーションシステムにも使用することができる。
受信
パラメータメモリ
ー「E:]−、、、−□−1−−
Fl(3,5b
Claims (1)
- 【特許請求の範囲】 1.コード化したスピーチを送信する(600)方法であって、スピーチ信号( IN;601)のサンプルを取り出し(10;602)そしてこれらサンプルか ら反射係数を計算する(603)ような方法において、 反射係数の特性を、少なくとも1つの手前の話し手の反射係数の各記憶された( 624;54)音響指向特性と比較して(17;606)音響を識別し、そして 識別された音響の識別子を送信し(617)、 同じ音響を表す反射係数に対して話し手指向特性を計算し(607)そしてメモ リ(608,609,610)に記憶し、上記音響を表す反射係数の上記計算さ れてメモリ(610)に記憶された特性を、同じ音響を表す反射係数のその後の 特性と比較し(20;611)、そして同じ音響を表す反射係数のその後の特性 が、メモリ(610)に記憶された反射係数の特性と本質的に異なる(21)場 合には、その同じ音響を表す新たな特性をメモリ(610)に記憶し(609) そして送信し(613)、更に、それらを送信する前に、これら特性を送信する という情報(612)を送り、そして同じ音響を表す反射係数のその後の特性が 、メモリ(610)に記憶された反射係数の特性と本質的に異ならない(20) 場合には、話し手の同じ音響を表す反射係数の特性と、手前のサンプルから計算 された反射係数の特性との間の差を計算して送信する(625)ことを特徴とす る方法。 2.コード化したスピーチを受信する(700)方法において、識別された音響 の識別子を受け取り(706;500)、1つの手前の話し手の記憶された音響 指向の反射係数の特性と、サンプルから計算された反射係数の特性との差(70 8)を受け取り、受け取った音響識別子に対応する反射係数の話し手指向の特性 をメモリ(711;501)においてサーチし(718;716)そして上記差 (708)に加え(712;503)、その和から、音響(720)発生に使用 する新たな反射係数(713)を計算し、そして通信用の送信器(600)によ り送られた新たな特性、及び別の通信用送信器によって送られた同じ音響を表す 反射係数の新たな特性(710)の送信の情報(709)を受け取った場合に、 これらの新たな特性をメモリ(711)に記憶することを特徴とする方法。 3.上記特性は、反射係数の平均値である請求項1又は2項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI930493A FI96246C (fi) | 1993-02-04 | 1993-02-04 | Menetelmä koodatun puheen lähettämiseksi ja vastaanottamiseksi |
FI930493 | 1993-02-04 | ||
PCT/FI1994/000051 WO1994018668A1 (en) | 1993-02-04 | 1994-02-03 | A method of transmitting and receiving coded speech |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07505237A true JPH07505237A (ja) | 1995-06-08 |
Family
ID=8537171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6517696A Ceased JPH07505237A (ja) | 1993-02-04 | 1994-02-03 | コード化されたスピーチを送信及び受信する方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5715362A (ja) |
EP (1) | EP0634043B1 (ja) |
JP (1) | JPH07505237A (ja) |
CN (1) | CN1062365C (ja) |
AT (1) | ATE183011T1 (ja) |
AU (1) | AU670361B2 (ja) |
DE (1) | DE69419846T2 (ja) |
DK (1) | DK0634043T3 (ja) |
ES (1) | ES2134342T3 (ja) |
FI (1) | FI96246C (ja) |
WO (1) | WO1994018668A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4343366C2 (de) * | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US6003000A (en) * | 1997-04-29 | 1999-12-14 | Meta-C Corporation | Method and system for speech processing with greatly reduced harmonic and intermodulation distortion |
FR2771544B1 (fr) * | 1997-11-21 | 2000-12-29 | Sagem | Procede de codage de la parole et terminaux pour la mise en oeuvre du procede |
DE19806927A1 (de) * | 1998-02-19 | 1999-08-26 | Abb Research Ltd | Verfahren und Einrichtung zur Übertragung natürlicher Sprache |
US6721701B1 (en) * | 1999-09-20 | 2004-04-13 | Lucent Technologies Inc. | Method and apparatus for sound discrimination |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2632725B1 (fr) * | 1988-06-14 | 1990-09-28 | Centre Nat Rech Scient | Procede et dispositif d'analyse, synthese, codage de la parole |
FI91925C (fi) * | 1991-04-30 | 1994-08-25 | Nokia Telecommunications Oy | Menetelmä puhujan tunnistamiseksi |
DK82291D0 (da) * | 1991-05-03 | 1991-05-03 | Rasmussen Kann Ind As | Styrekredsloeb med timerfunktion for et elektrisk forbrugsapparat |
US5165008A (en) * | 1991-09-18 | 1992-11-17 | U S West Advanced Technologies, Inc. | Speech synthesis using perceptual linear prediction parameters |
AU4678593A (en) * | 1992-07-17 | 1994-02-14 | Voice Powered Technology International, Inc. | Voice recognition apparatus and method |
-
1993
- 1993-02-04 FI FI930493A patent/FI96246C/fi active
-
1994
- 1994-02-03 CN CN94190039A patent/CN1062365C/zh not_active Expired - Fee Related
- 1994-02-03 ES ES94905740T patent/ES2134342T3/es not_active Expired - Lifetime
- 1994-02-03 US US08/313,253 patent/US5715362A/en not_active Expired - Lifetime
- 1994-02-03 JP JP6517696A patent/JPH07505237A/ja not_active Ceased
- 1994-02-03 AT AT94905740T patent/ATE183011T1/de not_active IP Right Cessation
- 1994-02-03 DE DE69419846T patent/DE69419846T2/de not_active Expired - Lifetime
- 1994-02-03 EP EP94905740A patent/EP0634043B1/en not_active Expired - Lifetime
- 1994-02-03 WO PCT/FI1994/000051 patent/WO1994018668A1/en active IP Right Grant
- 1994-02-03 DK DK94905740T patent/DK0634043T3/da active
- 1994-02-03 AU AU59727/94A patent/AU670361B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
DE69419846D1 (de) | 1999-09-09 |
DE69419846T2 (de) | 2000-02-24 |
DK0634043T3 (da) | 1999-12-06 |
CN1103538A (zh) | 1995-06-07 |
FI96246C (fi) | 1996-05-27 |
EP0634043B1 (en) | 1999-08-04 |
US5715362A (en) | 1998-02-03 |
AU5972794A (en) | 1994-08-29 |
FI930493A0 (fi) | 1993-02-04 |
WO1994018668A1 (en) | 1994-08-18 |
ES2134342T3 (es) | 1999-10-01 |
AU670361B2 (en) | 1996-07-11 |
FI930493A (fi) | 1994-08-05 |
EP0634043A1 (en) | 1995-01-18 |
FI96246B (fi) | 1996-02-15 |
ATE183011T1 (de) | 1999-08-15 |
CN1062365C (zh) | 2001-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102254553B (zh) | 语音音节时长的自动归一化 | |
KR101038964B1 (ko) | 에코 제거/억제 방법 및 장치 | |
JP2002533772A (ja) | 可変レートスピーチコーディング | |
JPH09204199A (ja) | 非活性音声の効率的符号化のための方法および装置 | |
JP3189598B2 (ja) | 信号合成方法および信号合成装置 | |
AU668022B2 (en) | Method of converting speech | |
JP2002518694A (ja) | 音声符号化装置及び音声復号化装置 | |
JPH04158397A (ja) | 声質変換方式 | |
JP5027966B2 (ja) | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 | |
AU675322B2 (en) | Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems | |
EP1076895B1 (en) | A system and method to improve the quality of coded speech coexisting with background noise | |
JP2000209663A (ja) | 音声チャネル上で非音声情報を送信する方法 | |
CN111785303A (zh) | 模型训练方法、模仿音检测方法、装置、设备及存储介质 | |
JPH07505237A (ja) | コード化されたスピーチを送信及び受信する方法 | |
US6044147A (en) | Telecommunications system | |
JP3184525B2 (ja) | 話者認識方法 | |
Orphanidou et al. | Voice morphing using the generative topographic mapping | |
JP3515216B2 (ja) | 音声符号化装置 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
JP2006078654A (ja) | 音声認証装置及び方法並びにプログラム | |
AU711562B2 (en) | Telecommunications system | |
WO1998005031A2 (en) | A method and a device for the reduction impulse noise from a speech signal | |
JP3715417B2 (ja) | 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR20150014607A (ko) | 통신 시스템에서 오류 은닉 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A313 | Final decision of rejection without a dissenting response from the applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A313 Effective date: 20040406 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040511 |