JPH03254223A - アナログデータ伝送方式 - Google Patents
アナログデータ伝送方式Info
- Publication number
- JPH03254223A JPH03254223A JP5133490A JP5133490A JPH03254223A JP H03254223 A JPH03254223 A JP H03254223A JP 5133490 A JP5133490 A JP 5133490A JP 5133490 A JP5133490 A JP 5133490A JP H03254223 A JPH03254223 A JP H03254223A
- Authority
- JP
- Japan
- Prior art keywords
- data
- band
- transmission
- neural network
- analog data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Landscapes
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野コ
本発明はアナログデータ伝送方式、特に伝送信号の帯域
制限を行うことによってデータ圧縮し、伝送路の負担を
軽減可能な改良されたアナログデータ伝送方式に関する
。
制限を行うことによってデータ圧縮し、伝送路の負担を
軽減可能な改良されたアナログデータ伝送方式に関する
。
[従来の技術]
近年、音声あるいは画像デー′夕を伝送する必要性が著
しく増大し、例えば電話回線網、テレビ通信システムあ
るいは各種データベースを利用した通信システムとして
極めて多岐に亘る伝送手段が実用化されている。
しく増大し、例えば電話回線網、テレビ通信システムあ
るいは各種データベースを利用した通信システムとして
極めて多岐に亘る伝送手段が実用化されている。
このような伝送情報としてアナログデータを扱う場合、
その帯域が問題となる。
その帯域が問題となる。
伝送路の要求からすれば、アナログデータはできるだけ
狭帯域であることが望ましく、実際上アナログデータは
その保有する帯域が広いにも拘らず伝送路による帯域制
限で一部の特に高帯域成分が捨てられてしまうことが知
られている。
狭帯域であることが望ましく、実際上アナログデータは
その保有する帯域が広いにも拘らず伝送路による帯域制
限で一部の特に高帯域成分が捨てられてしまうことが知
られている。
また、アナログデータを保存するための各種のメディア
として例えば磁気テープなどが用いられるか、このよう
な記憶あるいは伝送メディアに対してもその小型軽量化
の面からアナログデータは常に帯域制限を受けることと
なる。
として例えば磁気テープなどが用いられるか、このよう
な記憶あるいは伝送メディアに対してもその小型軽量化
の面からアナログデータは常に帯域制限を受けることと
なる。
一方、このような帯域制限はアナログデータ自体に対し
ては極めて深刻な特性劣化となり、通常の場合前記帯域
制限は高周波成分に対してデータが欠落する結果を招く
。そして、このような高域遮断されたアナログデータで
は、信号波形の鈍化が生じ、ひいては音がこもるあるい
は立上りのスピード感がなくなるなどの著しい音質劣化
を招くことが知られている。
ては極めて深刻な特性劣化となり、通常の場合前記帯域
制限は高周波成分に対してデータが欠落する結果を招く
。そして、このような高域遮断されたアナログデータで
は、信号波形の鈍化が生じ、ひいては音がこもるあるい
は立上りのスピード感がなくなるなどの著しい音質劣化
を招くことが知られている。
例えば、一般的な音声を例にとると、これらのアナログ
音声データは通常3.4kHzまでの高帯域を有するが
、通常の伝送路によれば例えば帯域0.8kHzに制限
されてしまい、この結果音声の本来前する細い高域成分
が失われて大幅になまった波形に歪む。このような波形
劣化により、音源のピッチを表す基本的な周波数情報は
残るものの、音質的には声色が濁って不愉快にこもった
音になってしまう。また、前述した如く、音の立上りが
鈍くなるので、スピード感も損われる欠点がある。
音声データは通常3.4kHzまでの高帯域を有するが
、通常の伝送路によれば例えば帯域0.8kHzに制限
されてしまい、この結果音声の本来前する細い高域成分
が失われて大幅になまった波形に歪む。このような波形
劣化により、音源のピッチを表す基本的な周波数情報は
残るものの、音質的には声色が濁って不愉快にこもった
音になってしまう。また、前述した如く、音の立上りが
鈍くなるので、スピード感も損われる欠点がある。
更に、子音部の認識が部分的に困難になるだけでなく、
時には母音部においても第2ホルマントの欠落が起り、
誤認識の原因にもなっていた。
時には母音部においても第2ホルマントの欠落が起り、
誤認識の原因にもなっていた。
従って、アナログデータ処理において、伝送路あるいは
伝送機器の要求とデータ品質の要求とが常に矛盾し、こ
れらの調整が極めて困難であった。
伝送機器の要求とデータ品質の要求とが常に矛盾し、こ
れらの調整が極めて困難であった。
従来において、前記帯域制限されたアナログデータの復
元には等花器が用いられている。
元には等花器が用いられている。
すなわち、等花器は帯域制限された例えば音声アナログ
データの明瞭度を上げるために、制限された周波数帯域
の増幅度を上げて、アナログ波形を復元し、これによっ
て等花器の強調増幅作用によりデータ受信側において原
データに近い復元データを得ることができる。
データの明瞭度を上げるために、制限された周波数帯域
の増幅度を上げて、アナログ波形を復元し、これによっ
て等花器の強調増幅作用によりデータ受信側において原
データに近い復元データを得ることができる。
従来における前記等化器による復元技術は例えばそれ以
外にも線形的な手法を用いた信号再生方式としていくつ
か実用化され、いずれも帯域制限を受けている高域成分
の僅かな残留データを利用するものである。
外にも線形的な手法を用いた信号再生方式としていくつ
か実用化され、いずれも帯域制限を受けている高域成分
の僅かな残留データを利用するものである。
[発明が解決しようとする課題]
しかしながら、前記従来における復元技術では必ずしも
十分な品質の受信データを得ることができないという問
題があった。
十分な品質の受信データを得ることができないという問
題があった。
すなわち、等花器を用いた場合、伝送路特性に応じて定
められた等花器の逆特性によって波形が復元できるはず
であるが、この場合には、所望の高帯域において僅かで
もデータが伝送されていることが必要である。すなわち
、完全に高帯域成分のデータが失われている場合には、
従来における等花器はほとんどその機能を果すことがで
きずデータ復元は不可能となる。
められた等花器の逆特性によって波形が復元できるはず
であるが、この場合には、所望の高帯域において僅かで
もデータが伝送されていることが必要である。すなわち
、完全に高帯域成分のデータが失われている場合には、
従来における等花器はほとんどその機能を果すことがで
きずデータ復元は不可能となる。
また、従来における線形的な手法を用いた信号再生方式
においても、例えば音声処理の分野では完全な極零型線
形モデルが未だ発見されておらず、もともとデータ量の
少ない音声しか受信側に得られない状況では実際上デー
タ復元はほとんど不可能であった。
においても、例えば音声処理の分野では完全な極零型線
形モデルが未だ発見されておらず、もともとデータ量の
少ない音声しか受信側に得られない状況では実際上デー
タ復元はほとんど不可能であった。
従来において、音声などに限定して、受信側でのデータ
が完全に欠落した場合においても、スペクトル推定技術
によって失われた高域成分データを修復する技術が提案
されているが、このようなスペクトル推定でも、音声の
子音情報まで推定することは困難であり、更にアナログ
データの保有している位相情報が全く無視されてしまう
ので、音質の変化が生じてしまうという欠点があった。
が完全に欠落した場合においても、スペクトル推定技術
によって失われた高域成分データを修復する技術が提案
されているが、このようなスペクトル推定でも、音声の
子音情報まで推定することは困難であり、更にアナログ
データの保有している位相情報が全く無視されてしまう
ので、音質の変化が生じてしまうという欠点があった。
本発明は上記従来の課題に鑑みなされたものであり、そ
の目的は、高帯域データが完全に欠落した場合において
も、受信側において高い忠実度でデータ復元を可能とし
た改良されたアナログデータ伝送方式を提供することに
ある。
の目的は、高帯域データが完全に欠落した場合において
も、受信側において高い忠実度でデータ復元を可能とし
た改良されたアナログデータ伝送方式を提供することに
ある。
[課題を解決するための手段]
上記目的を達成するために、本発明は、劣悪なアナログ
データが基本的な情報を比較的低帯域に保有しており、
高帯域成分は低帯域成分に比して固有差が少なく、この
結果、低帯域成分から比較的容易に学習できることに着
目したことを特徴とする。
データが基本的な情報を比較的低帯域に保有しており、
高帯域成分は低帯域成分に比して固有差が少なく、この
結果、低帯域成分から比較的容易に学習できることに着
目したことを特徴とする。
このために、本発明では、アナログデータを伝送する際
に伝送されるデータを積極的に帯域制限してしまい、高
帯域成分を自発的に欠落させてしまう。
に伝送されるデータを積極的に帯域制限してしまい、高
帯域成分を自発的に欠落させてしまう。
この結果、データ伝送路あるいは伝送機器は狭帯域で良
いために小型軽量となりあるいは伝送密度を著しく改善
できるという利点を生ずる。
いために小型軽量となりあるいは伝送密度を著しく改善
できるという利点を生ずる。
そして、本発明においては、受信側においてニューラル
ネットワークを用いた復元処理を行い、これによって前
記欠落した高帯域成分を受信時に付加することを特徴と
する。
ネットワークを用いた復元処理を行い、これによって前
記欠落した高帯域成分を受信時に付加することを特徴と
する。
前記ニューラルネットワークは勿論予め処理するアナロ
グデータ毎に学習されており、これによって、受信した
低帯域領域のアナログデータからこれに対応した高帯域
成分をニューラルネットワークで作成して忠実度の高い
復元を行うことができる。
グデータ毎に学習されており、これによって、受信した
低帯域領域のアナログデータからこれに対応した高帯域
成分をニューラルネットワークで作成して忠実度の高い
復元を行うことができる。
すなわち、本発明によれば、前述した如く、アナログデ
ータ中の高帯域成分が比較的固有差か少なく、低帯域成
分から比較的容易に推定可能であることを利用し、高帯
域成分が完全に欠落している状態でもニューラルネット
ワークの学習によって忠実度の高い復元作用を可能とし
た。
ータ中の高帯域成分が比較的固有差か少なく、低帯域成
分から比較的容易に推定可能であることを利用し、高帯
域成分が完全に欠落している状態でもニューラルネット
ワークの学習によって忠実度の高い復元作用を可能とし
た。
勿論、本発明の特徴である前述した高帯域成分の除去は
帯域制限器を用いても良く、あるいは伝送路自体の狭帯
域特性で実現しても良い。
帯域制限器を用いても良く、あるいは伝送路自体の狭帯
域特性で実現しても良い。
[作用]
従って、本発明によれば、音声あるいは画像などのアナ
ログデータは予め送信側あるいは伝送路において積極的
に帯域制限されて送られる。
ログデータは予め送信側あるいは伝送路において積極的
に帯域制限されて送られる。
そして、受信側に設けられているニューラルネットワー
クは予め処理対象となるアナログデータに対してパック
プロパゲーションなどを用いて学習され、ニューラルネ
ットワークの入出力特性が定められる。
クは予め処理対象となるアナログデータに対してパック
プロパゲーションなどを用いて学習され、ニューラルネ
ットワークの入出力特性が定められる。
このよにして学習されたニューラルネットワークに帯域
制限されたアナログデータが供給されると、ニューラル
ネットワークからは低帯域情報から高帯域データを作り
出し、これによって原データに近い受信データを復元す
ることが可能となる。
制限されたアナログデータが供給されると、ニューラル
ネットワークからは低帯域情報から高帯域データを作り
出し、これによって原データに近い受信データを復元す
ることが可能となる。
前記ニューラルネットワークによるデータ復元は受信デ
ータそのものを復元データに変換しても良く、あるいは
失われた高域成分のみを時間差分から復元してこれに受
信データを合成することも可能である。
ータそのものを復元データに変換しても良く、あるいは
失われた高域成分のみを時間差分から復元してこれに受
信データを合成することも可能である。
[実施例]
以下図面に基づいて本発明の好適な実施例を説明する。
第1図には本発明が適用された伝送システムの全体構成
が示されている。
が示されている。
送信されるアナログデータ100は例えば図において帯
域3.4 kHzを有する音声「女性の「あ」」として
示され、この送信アナログデータ100は送信側におい
てローパスフィルタからなる帯域制限器10により帯域
0.8kf(zに狭帯域化される。勿論、この帯域制限
周波数は伝送路あるいは伝送機器によって任意に選択可
能であり、後に詳述する如く、実験によれば帯域周波数
が変化しても、本発明における復元作用に大きな影響は
見られない。
域3.4 kHzを有する音声「女性の「あ」」として
示され、この送信アナログデータ100は送信側におい
てローパスフィルタからなる帯域制限器10により帯域
0.8kf(zに狭帯域化される。勿論、この帯域制限
周波数は伝送路あるいは伝送機器によって任意に選択可
能であり、後に詳述する如く、実験によれば帯域周波数
が変化しても、本発明における復元作用に大きな影響は
見られない。
高帯域成分が除去された波形110は図示の如く基本ピ
ッチのみを残した大幅に情報量の欠落した信号として示
されている。
ッチのみを残した大幅に情報量の欠落した信号として示
されている。
このような狭帯域信号110は実施例において送信機1
2により伝送路14に送り込まれ、受信側では受信機1
6にて受信される。
2により伝送路14に送り込まれ、受信側では受信機1
6にて受信される。
本発明において、このような伝送系に関しては、アナロ
グあるいはデジタル処理でもあるいは有線あるいは無線
を問わず任意に利用可能であり、本発明の特徴は送信側
あるいは伝送器においてアナログ信号の段階で狭帯域制
限を施すことによってアナログデータそのもののデータ
圧縮を可能とすることにある。
グあるいはデジタル処理でもあるいは有線あるいは無線
を問わず任意に利用可能であり、本発明の特徴は送信側
あるいは伝送器においてアナログ信号の段階で狭帯域制
限を施すことによってアナログデータそのもののデータ
圧縮を可能とすることにある。
前記受信機16の出力は第1図において狭帯域化された
信号110とほぼ同一であると考える。
信号110とほぼ同一であると考える。
そして、この受信信号は実施例においてそのまま合成器
20へ供給されると共に、失われた高域成分を復元する
ためにニューラルネットワークにて復元が行われる。
20へ供給されると共に、失われた高域成分を復元する
ためにニューラルネットワークにて復元が行われる。
受信データ200はまずサンプル回路22へ供給され、
サンプリングクロックによってデータのサンプリングが
行われる。実施例において、サンプリングクロックは1
0kHzの周波数を有し、40個で1フレームを形成す
る。すなわち、この40個は、後述するニューラルネッ
トワークが4層パーセプトロン構成を有し、各層が40
個のユニットを有しており、前記40個のサンプリング
データがそれぞれ各入力層のニューラルユニットに割り
付けられる。
サンプリングクロックによってデータのサンプリングが
行われる。実施例において、サンプリングクロックは1
0kHzの周波数を有し、40個で1フレームを形成す
る。すなわち、この40個は、後述するニューラルネッ
トワークが4層パーセプトロン構成を有し、各層が40
個のユニットを有しており、前記40個のサンプリング
データがそれぞれ各入力層のニューラルユニットに割り
付けられる。
以上のようにしてサンプリングされたデータは次に差分
器24へ供給され、実施例においては時間差分値が出力
される。
器24へ供給され、実施例においては時間差分値が出力
される。
勿論、本発明においてサンプリングされた波形データそ
のものをニューラルネットワークに供給することも可能
であるが、実施例においては、高帯域を強調するために
前述した如く時間差分値がニューラルネットワークの人
力データとして用いられる。
のものをニューラルネットワークに供給することも可能
であるが、実施例においては、高帯域を強調するために
前述した如く時間差分値がニューラルネットワークの人
力データとして用いられる。
そして、前記差分データはニューラルネットワーク26
によって所定の変換処理を受ける。
によって所定の変換処理を受ける。
すなわち、二二−ラルネットワーク26は自ら学習によ
って生成した変換規則に従って、受信データと送信デー
タとの誤差を予測し、その値を出力する。
って生成した変換規則に従って、受信データと送信デー
タとの誤差を予測し、その値を出力する。
実施例においては、この予測値は前述した合成器20の
他方の入力に供給され、この結果合成器20は前記受信
データ200をニューラルネットワーク26から得られ
る予測値と合成して図の符号210で示される合成デー
タとして出力する。
他方の入力に供給され、この結果合成器20は前記受信
データ200をニューラルネットワーク26から得られ
る予測値と合成して図の符号210で示される合成デー
タとして出力する。
以上のようにして、本発明によれば送信されるデータは
予めアナログ状態でデータ圧縮を受け、これをニューラ
ルネットワークを用いて受信側にて復元することを特徴
とし、伝送路あるいは伝送機器の負担を軽減しながらか
つ高忠実度のデータ伝送を可能とする利点がある。
予めアナログ状態でデータ圧縮を受け、これをニューラ
ルネットワークを用いて受信側にて復元することを特徴
とし、伝送路あるいは伝送機器の負担を軽減しながらか
つ高忠実度のデータ伝送を可能とする利点がある。
前述したニューラルネットワーク26は周知の如く学習
と実行の2段階のプロセスを有し、本発明によれば、処
理対象となるアナログデータによって復元に必要な変換
規則を学習し、次に前述した如く受信データを入力して
前記学習した変換規則に従った予測値の出力を実行段階
として行う。
と実行の2段階のプロセスを有し、本発明によれば、処
理対象となるアナログデータによって復元に必要な変換
規則を学習し、次に前述した如く受信データを入力して
前記学習した変換規則に従った予測値の出力を実行段階
として行う。
すなわち、学習段階においては、帯域制限を受けて劣化
した受信データから、帯域制限を受ける以前の本来の送
信データと受信データとの誤差を推定する変換規則を経
験的にニューラルネットワークに学習させる。
した受信データから、帯域制限を受ける以前の本来の送
信データと受信データとの誤差を推定する変換規則を経
験的にニューラルネットワークに学習させる。
そして、実行段階では、未知の受信データ入力に対して
、本来の送信データとの推定誤差を出力し、実施例によ
れば前述した如く受信データにこの誤差予測値を加算す
ることによって合成波形を得ることとなる。
、本来の送信データとの推定誤差を出力し、実施例によ
れば前述した如く受信データにこの誤差予測値を加算す
ることによって合成波形を得ることとなる。
以下には前記ニューラルネットワーク26の内容を詳細
に説明する。
に説明する。
第2図には一般的なニューロンのモデルが示され、通常
ユニットと呼ばれるニューロンの動作を情報処理の機能
素子としてモデル化した工学モデルを示す。
ユニットと呼ばれるニューロンの動作を情報処理の機能
素子としてモデル化した工学モデルを示す。
ユニットは入力側からの信号を重み付けによる多数決論
理で処理し、1つの出力信号を発生する。
理で処理し、1つの出力信号を発生する。
そして、この出力信号を次層の複数のユニットの入力信
号として用い、多層階層による学習及び実行処理を行う
。このモデルは、入力信号と重みとの積和演算と、その
積和演算結果に対する閾値処理の2つの処理をニューロ
ンの基本性質として捕えたものである。シグモイド関数
を用いると、ユニットの人出力特性が次のように定式化
される。
号として用い、多層階層による学習及び実行処理を行う
。このモデルは、入力信号と重みとの積和演算と、その
積和演算結果に対する閾値処理の2つの処理をニューロ
ンの基本性質として捕えたものである。シグモイド関数
を用いると、ユニットの人出力特性が次のように定式化
される。
o 、−f−(net −)
(2)1)J J pJf
、 (x)=1/ (1+exp (−x+θ)
)(3) 前述した多数のユニットにニューロン)を相互に結合す
ることによってニューラルネットワークが構成され、そ
の結合形態によってさまざまなバリエーションが生まれ
る。
(2)1)J J pJf
、 (x)=1/ (1+exp (−x+θ)
)(3) 前述した多数のユニットにニューロン)を相互に結合す
ることによってニューラルネットワークが構成され、そ
の結合形態によってさまざまなバリエーションが生まれ
る。
第3図には本発明に係るニューラルネットワークの原理
的な構造が示されており、入力層、2層の中間層及び出
力層の4層からなるネットワーク構造を有する。
的な構造が示されており、入力層、2層の中間層及び出
力層の4層からなるネットワーク構造を有する。
階層ネットワークにおける各ユニットは、人力層から中
間層、中間層から出力層という向きに結合しており、各
層内での結合及び出力層から人力層へと向う結合は存在
しない。
間層、中間層から出力層という向きに結合しており、各
層内での結合及び出力層から人力層へと向う結合は存在
しない。
人力層に人カバターンが与えられると、入力層の各ユニ
ットはその人力信号を中間層へ渡し、中間層の各ユニッ
トは前述した(1)式及び(2)式に基づいて動作し、
出力層の各ユニットに出力信号を供給する。
ットはその人力信号を中間層へ渡し、中間層の各ユニッ
トは前述した(1)式及び(2)式に基づいて動作し、
出力層の各ユニットに出力信号を供給する。
そして、最終的には、ネットワークの出カバターンが出
力層の各ユニットから出力される。
力層の各ユニットから出力される。
従って、このネットワークは、入力を常に前向きに処理
することによって、ユニット間の結合の重みWから決定
される一定の変換規則(データ処理法)を入カバターン
に適応し、出力層にそのパターンを出力する。
することによって、ユニット間の結合の重みWから決定
される一定の変換規則(データ処理法)を入カバターン
に適応し、出力層にそのパターンを出力する。
前述した一般的なニューラルネットワークを動作させる
場合、前述した変換規則を与えなければならず、このた
めにネットワークの学習が必要である。このネットワー
クの学習とは、与えられる個々の入カバターンに対して
、ネットワークが実際に出力する出カバターンと望まし
い出カバターン(教師信号)とが一致するまたは十分に
似ているようなユニット間の結合の重みWの集合を見つ
け出すことである。
場合、前述した変換規則を与えなければならず、このた
めにネットワークの学習が必要である。このネットワー
クの学習とは、与えられる個々の入カバターンに対して
、ネットワークが実際に出力する出カバターンと望まし
い出カバターン(教師信号)とが一致するまたは十分に
似ているようなユニット間の結合の重みWの集合を見つ
け出すことである。
このような階層ネットワークの学習アルゴリズムとして
はルーメルハートらが提案したバックプロパゲーション
法が知られている。バックプロパゲーション法は、階層
ネットワークに実際の出カバターンと望ましい出カバタ
ーン(教師信号)との誤差をフィードバックし、これに
基づいて結合の重みWとバイアス値θとで以下の(4)
式に基づいて適応的に自動調整する。
はルーメルハートらが提案したバックプロパゲーション
法が知られている。バックプロパゲーション法は、階層
ネットワークに実際の出カバターンと望ましい出カバタ
ーン(教師信号)との誤差をフィードバックし、これに
基づいて結合の重みWとバイアス値θとで以下の(4)
式に基づいて適応的に自動調整する。
Δ wo、寥ηδ 、i 、
(4)1)Jl pJ p1 出力層のユニットに関するδ 、は l δ 、 −(t 、−o 、) f 、
(nepj pJ I)j
J中間層のユニットに関するδptは δ−=f−,(net 、)ΣδpkWkjpJ
J pjのように計算される
。
(4)1)Jl pJ p1 出力層のユニットに関するδ 、は l δ 、 −(t 、−o 、) f 、
(nepj pJ I)j
J中間層のユニットに関するδptは δ−=f−,(net 、)ΣδpkWkjpJ
J pjのように計算される
。
以上の結果、ネットワークは入カバターンと出カバター
ンとの間の連合を学習、し、適応的なデータ処理を実現
できるようになる。
ンとの間の連合を学習、し、適応的なデータ処理を実現
できるようになる。
本発明において、前述した第1図から明らかなように、
ニューラルネットワークには帯域制限を受けた受信デー
タの時間差分値が与えられ、その差分値を一定の長さの
フレーム(実施例において40サンプル分)毎にニュー
ラルネットワーク26の人力層の各ユニットに与え、出
力層より出された信号と、之の信号と帯域制限された受
信データの差との数値的隔りを再消化する方向でネット
ワークの結合の重みWの学習が進められる。
ニューラルネットワークには帯域制限を受けた受信デー
タの時間差分値が与えられ、その差分値を一定の長さの
フレーム(実施例において40サンプル分)毎にニュー
ラルネットワーク26の人力層の各ユニットに与え、出
力層より出された信号と、之の信号と帯域制限された受
信データの差との数値的隔りを再消化する方向でネット
ワークの結合の重みWの学習が進められる。
従って、以上の学習を経た後、ニューラルネットワーク
26は帯域制限され高帯域が除去されたデータを復元す
るために最適な結合の重みWを有することとなる。
26は帯域制限され高帯域が除去されたデータを復元す
るために最適な結合の重みWを有することとなる。
t 、) (5)
pJ
(6)
第4図には本実施例におけるニューラルネットワーク2
6のデータ復元作用が示されており、帯域制限された受
信データは以下の条件下で学習及び復元動作が行われる
。
6のデータ復元作用が示されており、帯域制限された受
信データは以下の条件下で学習及び復元動作が行われる
。
サンプリング周波数 : 10kHzフレーム長
:4m5(40個)フレームシフト :
2m5(20個)サンプルポイント数 二6000個
(母音):2000個 (子音十母音) 蓄積フレーム数 :50個(母音)=25個(子
音十母音) 学習効率定数(η) +0.002(母音):0.
004 (子音十母音) 安定化係数(α):o、c+ 構成 、4層バーセプトロン。
:4m5(40個)フレームシフト :
2m5(20個)サンプルポイント数 二6000個
(母音):2000個 (子音十母音) 蓄積フレーム数 :50個(母音)=25個(子
音十母音) 学習効率定数(η) +0.002(母音):0.
004 (子音十母音) 安定化係数(α):o、c+ 構成 、4層バーセプトロン。
(40,40,40,40)
入力信号 : 013kl(z帯域信号の差分希望出
力信号: 0.1ikHz帯域信号と3.4kHz帯域
信帯域差 ここでサンプルポイント数とは、ニューラルネットワー
クの学習に用いたポイントの数を表す。
力信号: 0.1ikHz帯域信号と3.4kHz帯域
信帯域差 ここでサンプルポイント数とは、ニューラルネットワー
クの学習に用いたポイントの数を表す。
ここでは母音のみの場合は初めの0.6秒間を、子音を
含む音節の場合には初めの0,2秒間を学習に用いてい
る。また、蓄積フレーム数とは、学習の際にユニットの
誤差をある一定のフレーム数分たけ蓄積した後、誤差伝
播し、ネットワークの重みの更新を行うので、そのフレ
ームの数を表したものである。ユニットの誤差を蓄積す
ることにより、ネットワークは個々のフレームのデータ
に固執せずに、全データについて広く一般化を行い、最
適解を求めることができる。この値が小さすぎると、ネ
ットワークは個々のデータに依存し易くなり、全データ
に対する最適解の探索に多くの時間を要するようになる
。逆にこの値が大きいと、波形の細かい特徴がとらえに
くくなる。
含む音節の場合には初めの0,2秒間を学習に用いてい
る。また、蓄積フレーム数とは、学習の際にユニットの
誤差をある一定のフレーム数分たけ蓄積した後、誤差伝
播し、ネットワークの重みの更新を行うので、そのフレ
ームの数を表したものである。ユニットの誤差を蓄積す
ることにより、ネットワークは個々のフレームのデータ
に固執せずに、全データについて広く一般化を行い、最
適解を求めることができる。この値が小さすぎると、ネ
ットワークは個々のデータに依存し易くなり、全データ
に対する最適解の探索に多くの時間を要するようになる
。逆にこの値が大きいと、波形の細かい特徴がとらえに
くくなる。
表3・表4に主観評価結果(MOS :MEANOPI
NION 5CORE)を示す。
NION 5CORE)を示す。
表3
文章発声における主観評価結果
(学習話者)
表4 文章発声における主観評価結果
(未学習話者)
この評価では、3.4kHz帯域信号を原音(4点に相
当)と考え、0点(非常に悪い音質)から4点(原音と
同じ)の5段階で10人に音質の評価をしてもらい、そ
の平均の点数をつけである。各帯域の信号と合成音との
比較を行うと、帯域0.8kHzの信号を使って合成し
た信号は、学習話者、未学習話者ともに受信信号である
0、8kHz帯域の信号を上回るのは勿論、2 、0k
Hz帯域の信号よりも良いスコアが得られた。これによ
り、損失情報を予測して信号帯域を拡張した効果が示さ
れた。
当)と考え、0点(非常に悪い音質)から4点(原音と
同じ)の5段階で10人に音質の評価をしてもらい、そ
の平均の点数をつけである。各帯域の信号と合成音との
比較を行うと、帯域0.8kHzの信号を使って合成し
た信号は、学習話者、未学習話者ともに受信信号である
0、8kHz帯域の信号を上回るのは勿論、2 、0k
Hz帯域の信号よりも良いスコアが得られた。これによ
り、損失情報を予測して信号帯域を拡張した効果が示さ
れた。
本実施例においては、0 、11kHz帯域信号を入力
として仮定しているが、伝送路の周波数特性の変動に対
する検討として、学習話者において帯域0.7kHzに
制限された信号をもとに合成した信号についても評価を
行った。その結果を表3の最下掴に併記する。前述した
0、8kHz帯域信号をもとに合成した音に比べ、多少
の劣化はみられるものの、2.0kHz帯域信号に迫る
スコアが得られた。従って、伝送路の周波数特性の多少
の変動にも、本発明で提案した方式が適応できることが
判明した。
として仮定しているが、伝送路の周波数特性の変動に対
する検討として、学習話者において帯域0.7kHzに
制限された信号をもとに合成した信号についても評価を
行った。その結果を表3の最下掴に併記する。前述した
0、8kHz帯域信号をもとに合成した音に比べ、多少
の劣化はみられるものの、2.0kHz帯域信号に迫る
スコアが得られた。従って、伝送路の周波数特性の多少
の変動にも、本発明で提案した方式が適応できることが
判明した。
[発明の効果]
以上説明したように、本発明によれば、アナログデータ
を伝送する際に、送信側あるいは伝送路においてアナロ
グデータの圧縮を帯域制限にて行い、これによって伝送
路及び伝送機器の構成を極めて簡単にすることが可能と
むる。
を伝送する際に、送信側あるいは伝送路においてアナロ
グデータの圧縮を帯域制限にて行い、これによって伝送
路及び伝送機器の構成を極めて簡単にすることが可能と
むる。
また、受信側では、ニューラルネットワークによる予め
さだめられた変換規則に則ったデータ復元が行われ、こ
れによって極めて忠実度の高いデータ受信が可能となる
。
さだめられた変換規則に則ったデータ復元が行われ、こ
れによって極めて忠実度の高いデータ受信が可能となる
。
1fi1図は本発明に係るアナログデータ伝送方式の好
適な実施例を示す概略構成図、 第2図は本発明に用いられるニューロンの原理を示す説
明図、 第3図は本発明に用いられるニューラルネットワークの
階層構造を示す説明図、 第4図は本発明に係るニューラルネットワークの動作を
説明する図である。 10 ・・・ 帯域制限器 14 伝送路 6 ニューラルネットワーク
適な実施例を示す概略構成図、 第2図は本発明に用いられるニューロンの原理を示す説
明図、 第3図は本発明に用いられるニューラルネットワークの
階層構造を示す説明図、 第4図は本発明に係るニューラルネットワークの動作を
説明する図である。 10 ・・・ 帯域制限器 14 伝送路 6 ニューラルネットワーク
Claims (1)
- アナログデータを高帯域成分除去して伝送し、受信側に
おいて予めデータ特性に合せて学習されたニューラルネ
ットワークにて高帯域成分を復元することを特徴とする
アナログデータ伝送方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5133490A JPH03254223A (ja) | 1990-03-02 | 1990-03-02 | アナログデータ伝送方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5133490A JPH03254223A (ja) | 1990-03-02 | 1990-03-02 | アナログデータ伝送方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03254223A true JPH03254223A (ja) | 1991-11-13 |
Family
ID=12884025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5133490A Pending JPH03254223A (ja) | 1990-03-02 | 1990-03-02 | アナログデータ伝送方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03254223A (ja) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002009092A1 (fr) * | 2000-07-21 | 2002-01-31 | Kabushiki Kaisha Kenwood | Dispositif d'interpolation de frequences servant a interpoler une composante de frequence de signal et procede d'interpolation de frequences |
WO2002035517A1 (fr) * | 2000-10-24 | 2002-05-02 | Kabushiki Kaisha Kenwood | Appareil et procédé pour interpoler un signal |
WO2002050814A1 (fr) * | 2000-12-07 | 2002-06-27 | Kabushiki Kaisha Kenwood | Systeme et procede d'interpolation de signaux |
WO2003003345A1 (fr) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Dispositif et procede d'interpolation des composantes de frequence d'un signal |
US7805293B2 (en) | 2003-02-27 | 2010-09-28 | Oki Electric Industry Co., Ltd. | Band correcting apparatus |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP2013515287A (ja) * | 2009-12-21 | 2013-05-02 | マインドスピード テクノロジーズ インコーポレイテッド | 音声帯域拡張方法及び音声帯域拡張システム |
TWI484482B (zh) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
JP2017207765A (ja) * | 2008-12-19 | 2017-11-24 | 株式会社半導体エネルギー研究所 | 液晶表示装置の駆動方法 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
WO2018062021A1 (ja) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | 音声信号処理装置、音声信号処理方法、および制御プログラム |
JP2018120217A (ja) * | 2017-01-20 | 2018-08-02 | 株式会社半導体エネルギー研究所 | 表示システム及び電子機器 |
WO2018138597A1 (ja) * | 2017-01-26 | 2018-08-02 | 株式会社半導体エネルギー研究所 | 半導体装置、及び電子機器 |
JP2018136528A (ja) * | 2017-01-26 | 2018-08-30 | 株式会社半導体エネルギー研究所 | 半導体装置、及び該半導体装置を有する電子機器 |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
WO2021090465A1 (ja) * | 2019-11-08 | 2021-05-14 | 日本電信電話株式会社 | 帯域拡張装置、帯域拡張方法、およびプログラム |
-
1990
- 1990-03-02 JP JP5133490A patent/JPH03254223A/ja active Pending
Cited By (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6879265B2 (en) | 2000-07-21 | 2005-04-12 | Kabushiki Kaisha Kenwood | Frequency interpolating device for interpolating frequency component of signal and frequency interpolating method |
WO2002009092A1 (fr) * | 2000-07-21 | 2002-01-31 | Kabushiki Kaisha Kenwood | Dispositif d'interpolation de frequences servant a interpoler une composante de frequence de signal et procede d'interpolation de frequences |
WO2002035517A1 (fr) * | 2000-10-24 | 2002-05-02 | Kabushiki Kaisha Kenwood | Appareil et procédé pour interpoler un signal |
WO2002050814A1 (fr) * | 2000-12-07 | 2002-06-27 | Kabushiki Kaisha Kenwood | Systeme et procede d'interpolation de signaux |
WO2003003345A1 (fr) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Dispositif et procede d'interpolation des composantes de frequence d'un signal |
US7400651B2 (en) | 2001-06-29 | 2008-07-15 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
US7805293B2 (en) | 2003-02-27 | 2010-09-28 | Oki Electric Industry Co., Ltd. | Band correcting apparatus |
US11300832B2 (en) | 2008-12-19 | 2022-04-12 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
JP2017207765A (ja) * | 2008-12-19 | 2017-11-24 | 株式会社半導体エネルギー研究所 | 液晶表示装置の駆動方法 |
US10578920B2 (en) | 2008-12-19 | 2020-03-03 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
US10254586B2 (en) | 2008-12-19 | 2019-04-09 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
US11899311B2 (en) | 2008-12-19 | 2024-02-13 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
CN103996402A (zh) * | 2009-10-07 | 2014-08-20 | 索尼公司 | 编码设备和编码方法 |
AU2021215291B2 (en) * | 2009-10-07 | 2023-02-23 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
US9208795B2 (en) | 2009-10-07 | 2015-12-08 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
AU2019206091B2 (en) * | 2009-10-07 | 2021-05-13 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
CN102576544A (zh) * | 2009-10-07 | 2012-07-11 | 索尼公司 | 频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序 |
US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
AU2016253695B2 (en) * | 2009-10-07 | 2019-04-18 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP2013515287A (ja) * | 2009-12-21 | 2013-05-02 | マインドスピード テクノロジーズ インコーポレイテッド | 音声帯域拡張方法及び音声帯域拡張システム |
US10546594B2 (en) | 2010-04-13 | 2020-01-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10297270B2 (en) | 2010-04-13 | 2019-05-21 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
TWI484482B (zh) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10224054B2 (en) | 2010-04-13 | 2019-03-05 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US10381018B2 (en) | 2010-04-13 | 2019-08-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10236015B2 (en) | 2010-10-15 | 2019-03-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
US12183353B2 (en) | 2013-12-27 | 2024-12-31 | Sony Group Corporation | Decoding apparatus and method, and program |
US11705140B2 (en) | 2013-12-27 | 2023-07-18 | Sony Corporation | Decoding apparatus and method, and program |
US11507807B2 (en) | 2016-09-27 | 2022-11-22 | Panasonic Intellectual Property Management Co., Ltd. | Audio signal processing device, audio signal processing method, and control program |
CN109791772A (zh) * | 2016-09-27 | 2019-05-21 | 松下知识产权经营株式会社 | 声音信号处理装置、声音信号处理方法以及控制程序 |
CN109791772B (zh) * | 2016-09-27 | 2023-07-04 | 松下知识产权经营株式会社 | 声音信号处理装置、声音信号处理方法以及记录介质 |
WO2018062021A1 (ja) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | 音声信号処理装置、音声信号処理方法、および制御プログラム |
JPWO2018062021A1 (ja) * | 2016-09-27 | 2019-08-08 | パナソニックIpマネジメント株式会社 | 音声信号処理装置、音声信号処理方法、および制御プログラム |
US11676558B2 (en) | 2017-01-20 | 2023-06-13 | Semiconductor Energy Laboratory Co., Ltd. | Display system and electronic device |
JP2018120217A (ja) * | 2017-01-20 | 2018-08-02 | 株式会社半導体エネルギー研究所 | 表示システム及び電子機器 |
JP2018136528A (ja) * | 2017-01-26 | 2018-08-30 | 株式会社半導体エネルギー研究所 | 半導体装置、及び該半導体装置を有する電子機器 |
WO2018138597A1 (ja) * | 2017-01-26 | 2018-08-02 | 株式会社半導体エネルギー研究所 | 半導体装置、及び電子機器 |
US11373612B2 (en) | 2017-01-26 | 2022-06-28 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and electronic device including the semiconductor device |
US11509918B2 (en) | 2017-01-26 | 2022-11-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, and electronic device |
JPWO2018138597A1 (ja) * | 2017-01-26 | 2019-11-14 | 株式会社半導体エネルギー研究所 | 半導体装置、及び電子機器 |
WO2021090465A1 (ja) * | 2019-11-08 | 2021-05-14 | 日本電信電話株式会社 | 帯域拡張装置、帯域拡張方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03254223A (ja) | アナログデータ伝送方式 | |
CN113470667B (zh) | 语音信号的编解码方法、装置、电子设备及存储介质 | |
JP4504414B2 (ja) | 冗長性低減方法 | |
US5532950A (en) | Dynamic digital filter using neural networks | |
CN112567459B (zh) | 声音分离装置、声音分离系统、声音分离方法以及存储介质 | |
JP4810422B2 (ja) | 符号化装置、復号化装置、およびこれらの方法 | |
WO1996016533A2 (en) | Method for transforming a speech signal using a pitch manipulator | |
KR101807961B1 (ko) | Lstm 및 심화신경망 기반의 음성 신호 처리 방법 및 장치 | |
CN111986112B (zh) | 一种软注意力机制的深度全卷积神经网络图像去噪方法 | |
TWI708243B (zh) | 於分散式語音辨識中基於小波轉換之語音特徵壓縮及重建系統與方法 | |
CN116368563B (zh) | 使用深度生成网络的实时数据包丢失隐藏 | |
US20210233547A1 (en) | Method and apparatus for processing audio signal | |
EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
US5692098A (en) | Real-time Mozer phase recoding using a neural-network for speech compression | |
Raj et al. | Multilayered convolutional neural network-based auto-CODEC for audio signal denoising using mel-frequency cepstral coefficients | |
CN118248159A (zh) | 一种基于频率子带的语音增强模型联合训练方法 | |
JPH08123486A (ja) | 時系列信号フィルタ及びその学習方法 | |
Guo et al. | SNR-Adaptive Multi-Layer Semantic Communication for Speech | |
Parisae et al. | Single channel speech enhancement using cnn with frequency dimension adaptive attention based squeeze-tcn | |
Sriraam et al. | Lossless compression of EEG data using neural network predictors | |
EP4481740A1 (en) | Method for speech enhancement | |
Returi et al. | A method of speech signal analysis using multi-level wavelet transform | |
KR102358151B1 (ko) | 컨볼루션 순환신경망을 이용한 잡음 제거 방법 | |
Latypov et al. | Enhanced Step-Wise Approximation to Speech File in a Noisy Environment | |
Srikotr | The improved speech spectral envelope compression based on VQ-VAE with adversarial technique |