JP4170458B2 - 波形信号の時間軸圧縮伸長装置 - Google Patents
波形信号の時間軸圧縮伸長装置 Download PDFInfo
- Publication number
- JP4170458B2 JP4170458B2 JP24151098A JP24151098A JP4170458B2 JP 4170458 B2 JP4170458 B2 JP 4170458B2 JP 24151098 A JP24151098 A JP 24151098A JP 24151098 A JP24151098 A JP 24151098A JP 4170458 B2 JP4170458 B2 JP 4170458B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- waveform
- time
- main
- axis compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の属する技術分野】
本発明は、波形信号の時間軸圧縮伸長装置に関し、さらに詳細には、時間軸上における波形信号の圧縮伸長を滑らかに行うことができるようにした波形信号の時間軸圧縮伸長装置に関する。
【0002】
【従来の技術】
一般に、波形信号を再生する技術として、例えば、録音された波形信号の再生時間を時間軸上で圧縮伸長する時間軸圧縮伸長(以下、「タイムストレッチ」と適宜称する。)技術が音楽制作の分野でも利用されるようになってきている。
【0003】
ところで、例えば、テープレコーダにおいては、テープに録音する際のテープの回転速度とテープを再生する際のテープの回転速度とを異ならせることにより、テープに録音された音声の再生時間を時間軸上で圧縮伸長することができる。
【0004】
即ち、テープの録音時における波形信号が図1に示すものである場合に、再生時におけるテープの回転速度を録音時の回転速度より遅くすることによって再生時間を伸長すると、図1に示す波形信号は、波形が単に比例的に伸長された図2に示すような波形信号として再生されることになってしまい、再生時間が伸長されることにともにない、それと同時に周波数が変化してしまう(周波数が下がる)こととなっていた。
【0005】
このため従来のタイムストレッチ技術においては、波形信号を順次に一時的にデジタルメモリーなどに記録し、一定の区間を間引いたり、あるいは繰り返したりして再生時間を時間軸上で圧縮伸長するようになされている。
【0006】
なお、以下においては、再生時間の時間軸上での圧縮伸長を、適宜に「圧縮伸長」と簡略化して称するものとする。
【0007】
しかしながら、連続する波形信号を間引いたり、あるいは繰り返したりすると、間引きあるいは繰り返しの際における各波形信号のそれぞれの接続点が不連続になるために雑音が発生するという新たな問題が生じるものであった。
【0008】
このため、上記した各波形信号の接続点をクロスフェード(なお、「クロスフェード」とは、複数の波形を連続して再生する際に、ある波形(以下、「第1波形」と称する。)の終わり部分と当該ある波形に続くある波形(以下、「第2波形」と称する。)の始まり部分とをオーバーラップして再生するようにして、このオーバーラップして再生する際に、第1波形のオーバーラップ部分の音量を徐々に減少していくとともに、第2波形のオーバーラップ部分の音量を徐々に増大させていく手法を意味する。)することにより、雑音の発生を抑止しながら各波形の連続性を保とうとする手法が提案されているが、波形信号の揺らぎやリップルの発生を完全には防止することができず、根本的な解決策とはなっていなかった。
【0009】
さらに、複数の楽音が混合した波形信号は周期性が弱くなるため、上記した従来の手法では、間引きあるいは繰り返しの際における各波形信号のそれぞれの接続点においてますます滑らかな接続が難しくなるものであった。
【0010】
ところで、複数の楽音が混合した波形信号は、周波数帯域(band:バンド)によってそれぞれの波形信号特性が異なる場合が多いことが知られている。
【0011】
このため、間引きあるいは繰り返しの際における各波形信号のそれぞれの接続点における不連続性を解決するために、時間軸上で圧縮伸長しようとする波形信号を主要な周波数帯域にそれぞれ分割し、分割したそれぞれの周波数帯域の波形信号を独立に圧縮伸長するようにして、全体として滑らかな時間軸上の圧縮伸縮を行うようにした手法が提案されている。
【0012】
この手法においては、倍音を多数含んだ複雑な波形信号はできるだけ多くの周波数帯域に分割したほうが、より滑らかな時間軸上の圧縮伸長ができることになるものであるが、バンド(周波数帯域)数を増加すると波形信号処理量が膨大になってしまい、安価なシステムを構築することが困難になるという問題点があった。
【0013】
【発明が解決しようとする課題】
本発明は、上記したような従来の技術の有する問題点に鑑みてなされたものであり、その目的とするところは、時間軸上で圧縮伸長しようとする波形信号を主要な周波数帯域にそれぞれ分割し、分割したそれぞれの周波数帯域の波形信号を独立に圧縮伸長するようにして、全体として滑らかな時間軸上の圧縮伸縮を行う処理の際に、分割するバンド(周波数帯域)数の増加に伴う波形信号処理量の増加を抑制するようにして、安価なシステムを構築することを可能にした波形信号の時間軸圧縮伸長装置を提供しようとするものである。
【0014】
【課題を解決するための手段】
上記目的を達成するために、本発明による波形信号の時間軸圧縮伸長装置は、マルチレイトサンプリング技術を応用して、波形信号処理量の増加を抑制するようにしたものである。
【0015】
以下、本発明による波形信号の時間軸圧縮伸長装置の原理を説明するが、本発明による波形信号の時間軸圧縮伸長装置は、人の聴覚が、音量だけでなく周波数軸上でも線形よりも対数に近い尺度で反応する傾向があることを利用したものである。
【0016】
ここで、マルチレイトサンプリング技術とは、波形信号の周波数帯域を上から順に半分づつに分割し、サンプリングレイトもそれに応じて順に半分に落としていくサンプリング方式であり、このため下位のバンドほどサンプリングレイトが低くなるので、全体としての波形信号の処理量を軽減することができる波形信号の処理方式である。
【0017】
そして、従来のマルチレイトサンプリング技術においては、各バンドはオクターブの周波数帯域幅を有するようになされている。
【0018】
しかしながら、波形信号の特性によっては、周波数帯域幅がオクターブではまだ広すぎる場合が多いことに鑑み、本発明による波形信号の時間軸圧縮伸長装置においては、波形信号の周波数帯域を複数のメイン周波数帯域(以下、適宜に「メインバンド」と称する。)に分割し、さらに各メイン周波数帯域をそれぞれを複数のサブ周波数帯域(以下、適宜に「サブバンド」と称する。)に分割するようにしたものである。
【0019】
また、各メイン周波数帯域をそれぞれを複数のサブ周波数帯域に分割する際に、メイン周波数帯域を線形、即ち、等間隔に分割するようにしてもよい。このようにした場合には、あるメイン周波数帯域における複数のサブ周波数帯域は同一のサンプリングレイトであり、かつ、周波数帯域幅も同一であるので、各サブ周波数帯域の処理をソフトウエアで構成するならば共通の処理プログラムルーチンを共用することができるようになる。
【0020】
なお、波形信号によってスペクトルに片寄りがあるので、メイン周波数帯域のサブ周波数帯域への分割数は個々に設定すれば良い。
【0021】
また、波形信号に低い周波数成分が無い場合には、下位のバンドの処理を省略して上位のバンドの処理のみを行うようにし、またその逆に、波形信号に高域成分が無い場合には、上位のバンドの処理を省略して下位のバンドの処理のみを行うようにすると、波形信号の処理量を大幅に節減できるようになる。
【0022】
また、基本周波数が高い波形信号はメインバンドの分割数が少なくて済むので、サンプルレイトを半分に逓減するのを中止して、それを最下位バンドとするようにしてもよい。また、各メインバンド内の分割数、即ち、サブバンド数も少なくて済むようになる。例えば、32kHzサンプリングレイトで2kHzを基本周波数とする14kHzまでの周波数の波形信号成分を処理するには、32kHz、16kHzおよび8kHzのサンプルレイトの3つのメインバンドに分割すればよく、また、各メインバンドにおけるサブバンド数もそれぞれ8、4、2とすれば、当該波形信号の全倍音成分を分離することができるようになる。
【0023】
なお、自然の音声は高域ほど揺らぎが大きいので、上位のメインバンドほどサブバンド数を減らすことができる。従って、各サンプリングレイト段のメインバンドを同じ数のサブバンドに分割すれば、あるメインバンドの信号処理プログラムは他の同じサンプリングレイト段のルーチンを利用でき、プログラムを大幅に短縮することができるようになる。
【0024】
なお、このようにすると、上位のメインバンドの周波数帯域幅が下位のメインバンドに比べて広くなってしまうが、本願出願人による実験の結果、ほとんどの自然音の高域成分は信号レベルが低い上に非周期成分が多いので、上位のメインバンドの周波数帯域幅が下位のメインバンドに比べて広くなっても音質の変化は非常に少ないことが判明した。
【0025】
これとは逆に、下位のメインバンドには自然音の主要な成分が含まれているが、下位のメインバンドは周波数帯域幅が十分に狭いために、時間軸上の圧縮伸長を滑らかに行うことができる。
【0026】
上記したように、上位のメインバンドほど周波数帯域幅を広くし、下位のメインバンドほど周波数帯域幅を狭くするというように、周波数に応じて広狭をつけて周波数帯域を分割すると、周波数帯域の分割を周波数線形で等間隔で細かく分割した場合に比べて、信号処理時間を大幅に短縮することができる。
【0027】
また、上位のメインバンドほど周波数帯域幅を広くすると、鋭い立ち上がりの波形信号に対する応答がよくなる。
【0028】
即ち、本発明においては、こうした聴覚の特性を利用したマルチレイトによる信号処理技術を用いて、高速かつ音質の優れた波形信号の時間上の圧縮伸長を行うようにしたものである。
【0029】
上記した本発明の原理に鑑みて、本発明のうち請求項1に記載の発明は、波形信号を複数のメイン周波数帯域に分割し、かつ、各メイン周波数帯域のそれぞれを複数のサブ周波数帯域に分割した当該複数のサブ周波数帯域毎にそれぞれの波形を表す波形データを記憶した記憶手段と、上記サブ周波数帯域毎に設けられ、各サブ周波数帯域毎の波形データを基に当該波形データが表す波形の時間軸圧縮伸長を行う複数の時間軸圧縮伸長手段と、上記複数の時間軸圧縮伸長手段からの信号を合成する合成手段とを有し、上記複数の時間軸圧縮伸長手段はそれぞれ、波形の時間軸圧縮伸長を行うサブ周波数帯域が属するメイン周波数帯域において上位のメイン周波数帯域ほど高い処理頻度で圧縮伸長の処理を行い、下位のメイン周波数帯域ほど低い処理頻度で圧縮伸長の処理を行うようにしたものである。
【0030】
また、本発明のうち請求項2に記載の発明は、本発明のうち請求項1に記載の発明において、各メイン周波数帯域におけるサブ周波数帯域の帯域数は同一であるようにしたものである。
【0031】
また、本発明のうち請求項3に記載の発明は、本発明のうち請求項2に記載の発明において、上記波形信号の時間軸圧縮伸長装置は所定のソフトウエアを実行することで入力された波形信号に対して圧縮伸長の処理が行われるものであって、あるメイン周波数帯域における時間軸圧縮伸長処理プログラムルーチンを他のメイン周波数帯域の時間軸圧縮伸長処理プログラムルーチンと共用するようにしたものである。
【0032】
また、本発明のうち請求項4に記載の発明は、本発明のうち請求項2または3に記載の発明において、上記波形信号の時間軸圧縮伸長装置は所定のソフトウエアを実行することで入力された波形信号に対して圧縮伸長の処理が行われるものであって、同一のメイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、同一の処理プログラムルーチンを使用するようにしたものである。
【0033】
また、本発明のうち請求項5に記載の発明は、波形信号を複数のメイン周波数帯域に分割し、かつ、各メイン周波数帯域のそれぞれの波形信号を複数のサブ周波数帯域に分割した当該複数のサブ周波数帯域毎にそれぞれの波形を表す波形データを記憶した記憶手段と、上記サブ周波数帯域毎に設けられ、各サブ周波数帯域毎の波形データを基に当該波形データが表す波形の時間軸圧縮伸長を行う複数の時間軸圧縮伸長手段と、上記複数の時間軸圧縮伸長手段からの信号を合成する合成手段とを有し、同一のメイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、同一の処理頻度で圧縮伸長の処理を行うものであり、かつ、各メイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、上位のメイン周波数帯域に属するサブ周波数帯域ほど高い処理頻度で圧縮伸長の処理を行い、下位のメイン周波数帯域に属するサブ周波数帯域ほど低い処理頻度で圧縮伸長の処理を行うようにしたものである。
【0034】
なお、本発明のうち請求項1ならびに請求項5に記載の発明における「処理頻度」とは、例えば、サンプリングレイトとすることができる。
【0035】
【発明の実施の形態】
以下、添付の図面を参照しながら、本発明による波形信号の時間軸圧縮伸長装置の実施の形態の一例を詳細に説明する。
【0036】
図3には、本発明による波形信号の時間軸圧縮伸長装置(以下、適宜に「本発明装置」と称する。)の実施の形態の一例を実現するためのハードウエアのブロック構成図が示されている。
【0037】
即ち、本発明装置は、中央処理装置(CPU)10により全体の動作の制御が行われるものであり、このCPU10には、バスを介して、CPU10が実行するプログラムなどが格納されたリード・オンリ・メモリ(ROM)12と、CPU10がROM12に記憶されたプログラムを実行する際のワーキングエリアなどが設定されたランダム・アクセス・メモリ(RAM)14と、メインバンド数たるマルチレイト分割バンド数や各メインバンドのサブバンド数を設定するための操作子16と、外部のMIDI機器と接続するためのMIDIインターフェース(MIDI interface)18と、後述するフローチャートに示される分析処理や変換合成処理のプログラムを実行するデジタル・シグナル・プロセッサ(DSP)20とが接続されている。
【0038】
また、DSP20には、DSP20がプログラムを実行する際のワーキングエリアなどが設定されたランダム・アクセス・メモリ(RAM)22と、アナログの波形信号をデジタルの波形信号に変換してDSP20へ入力するアナログ/デジタル変換器(A/D)24と、DSP20から出力されたデジタルの波形信号をアナログの波形信号に変換して出力するデジタル/アナログ変換器(D/A)26とが接続されている。
【0039】
ここで、本発明装置においては、DSP20により波形信号の処理が行われるものである。
【0040】
まず、アナログ/デジタル変換器24を介してアナログ/デジタル変換されて入力された波形信号は、図4に示すように、基本の44kHzのサンプルレイトから始めて、22kHz、11kHz、5.5kHz、2.75kHz、1.38kHz、0.68kHzの6個のメインバンドに分割される。そして、各サンプルレイトのメインバンドは、さらに4個のサブバンドに等分割されるものである。
【0041】
なお、図4においては、説明の都合上、14.67kHzから22kHzのバンドの図示は省略した。
【0042】
また、この実施の形態においては、波形信号のピッチを1.5倍まで変化できるように、最上位のメインバンドは7.33kHzからその2倍の14.67kHzに制限している。
【0043】
図5には、DSP20による波形信号の時間軸圧縮伸長処理を実現するための回路のブロック構成図が示されており、当該回路はマルチレイト分析部とマルチレイト合成部とより構成されている。
【0044】
ここで、マルチレイト分析部は、波形信号をメインバンドとサブバンドとに分割するマルチレイト前処理部と、各サブバンドの振幅値と瞬間周波数とを分析するサブバンド分析部と、サブバンド分析部により分析された振幅値と瞬間周波数とを記憶する記憶部とより構成されている。
【0045】
また、マルチレイト合成部は、サブバンド分析部により分析された振幅値と瞬間周波数とを記憶する記憶部(即ち、記憶部は、マルチレイト分析部とマルチレイト合成部との双方の構成要素として用いられる。)と、振幅値と瞬間周波数とから波形信号を生成するためのサブバンド変換合成部と、サンプルレイト変換部とより構成されている。
【0046】
ここで、図6には、マルチレイト前処理部の詳細なブロック構成図が示されており、このマルチレイト前処理部は、低域フィルタとサンプル間引き処理回路と減算器とより構成されている。
【0047】
また、図7には、サブバンド変換合成部の詳細なブロック構成図が示されており、このサブバンド変換合成部は、時間周波数変換処理回路と余弦発振器と乗算器とより構成されている。
【0048】
さらに、図8には、サンプルレイト変換部の詳細なブロック構成図が示されており、このサンプルレイト変換部は、サンプル逓倍回路と低域フィルタとより構成されている。
【0049】
以上の構成において、マルチレイト分析部における分析処理を説明すると、入力される波形信号たる入力信号x(n)は、マルチレイト分析部のマルチレイト前処理部に入力される。そして、マルチレイト前処理部においては、入力信号x(n)を低域フィルタに通過させ、低域フィルタによって入力信号x(n)のうちの下位のバンド(メインバンド)の成分を減算した後の差分が、バンド(メインバンド)0の成分とされる。そして、このバンド(メインバンド)0の成分は、バンド(メインバンド)0のサブバンド分析部に送られることになる。
【0050】
上記と同様な処理により、順に各メインバンドの成分が得られ、各メインバンドのサブバンド分析部へ送られる。
【0051】
各サブバンド分析部における処理においては、メインバンドが4個のサブバンドに分割されて振幅値と瞬間周波数とが分析されるようになされている。
【0052】
なお、分析された各サブバンドの波形データ(振幅値および瞬間周波数)は周波数帯域が制限されているので、大幅に標本化周期を間引き情報量を圧縮して記憶部に記憶することができる。この実施の形態の場合には、最大16分の1まで間引くことができるが、説明を簡略化にするため、圧縮と解凍の処理は省略した。
【0053】
ここで、マルチレイト前処理部の処理を、さらに詳細に説明すると、低域フルタを通過した波形信号は、一周期毎にサンプル間引されて下位のバンド(メインバンド)へ送られることになる。そして、バンド(メインバンド)1では、サンプルレイトはバンド(メインバンド)0の2分の1で同じ処理が実行され、4個のサブバンド分の解析データが上位バンド(メインバンド)の半分の処理時間で計算できることになる。以下、同様にして、バンド(メインバンド)4まで処理を進めていく。最下位のバンド(メインバンド)5は、図9に示すように、サブバンドの帯域幅をバンド(メインバンド)4と同じにするならば、分析されたバンド(メインバンド)の中心周波数が異なるだけで、サブバンドの処理過程はバンド(メインバンド)4の場合と全く同じで良い。また、バンド(メインバンド)4とバンド(メインバンド)5とを併せて、8個のサブバンドを最下位バンド(メインバンド)の処理としてもよい。
【0054】
以上において説明したマルチレイト分析部における分析処理は、入力信号x(n)を刻々実時間で実行しても良いが、入力信号x(n)の一定区間または全部をデジタルメモリにロードして、バンド(メインバンド)0の分析を終了してからバンド(メインバンド)1以下の下位のバンド(メインバンド)を順次に分析していっても良い。
【0055】
また、この実施の形態においては、バンド(メインバンド)の成分を当該バンド(メインバンド)のサンプルレイトで処理して、直接サブバンドの振幅値および瞬間周波数を分析したが、図10に示すように、一旦、サンプルレイトfsの4分の1のexp−j(ws/4)nを乗算して複素成分に分解してから、さらにフィルタでサブバンドに分割してから分析しても良い。このようにすると、サンプルレイトを4分の1に下げることができる。
【0056】
そして、上記したマルチレイト分析部における分析処理をデジタル信号処理プログラムで実行する場合には、マルチレイト前処理は各バンド(メインバンド)で共通化することができ、各バンド(メインバンド)における各サブバンドの分析処理も共通の処理ルーチンで実行することができる。
【0057】
このように、各バンド(メインバンド)におけるマルチレイト前処理のルーチンの共通化を図り、また、各サブバンドの分析処理のルーチンの共通化を図ることにより、デジタル信号処理プログラムの短縮化と高速化とを実現することができる。
【0058】
図11は、上記したマルチレイト分析部における分析処理をDSP20のプログラムで実行する場合のルーチンを示すフローチャートである。
【0059】
このルーチンにおいては、まず、分析区間読み込みの処理を行う(ステップS1102)。即ち、一定の区間の波形信号(入力信号)を分析のために、DSP20のメモリにロードする。
【0060】
次に、バンド(メインバンド)を示す変数Kを0に設定して、バンド0を選択する(ステップS1104)。
【0061】
次に、バンド分割ならびにサンプル逓減の処理を行う(ステップS1106)。即ち、入力された分析区間の波形信号を低域フィルタで高域と低域とに分割する。そして、低域成分はサンプリングを半分に間引いて、下位バンド(メインバンド)へ送る。
【0062】
次に、サブバンドを示す変数Nを0に設定して、サブバンド0を選択する(ステップS1108)。
【0063】
次に、サブバンドNの解析を行う(ステップS1110)。即ち、ステップS1106において分割された高域信号は、さらにサブバンドNに分離され、その波形信号の振幅値と瞬間周波数とに変換される。バンド(メインバンド)のサンプルレイトが半分になるにつれて、分割のための低域フィルタの帯域幅も半分になる。従って、低域フィルタなどの係数も、この分析処理のルーチンと同様に全バンド(メインバンド)で同じものが利用できるようになる。ただし、下位バンド(メインバンド)になるほど、分析の対象になるデータサンプル数が半減する。つまりバンド変数Kによって計算サンプル数を変えるようにして、バンド(メインバンド)のサンプルレイトに対応する数のサンプルを計算する。
【0064】
次に、ステップS1110におけるバンドK、サブバンドNの分析データを所定のメモリ領域に書き込む(ステップS1112)。
【0065】
次に、サブバンドの変数Nを1だけインクリメントして、次のサブバンド処理に移る(ステップS1114)。
【0066】
次に、サブバンドの変数Nが3であるか否かを判断する(ステップS1116)。ここで、ステップS1116の判断結果がNo(否定)、即ち、サブバンドの変数Nが3でなくて全サブバンドの分析が終了していないと判断された場合には、ステップS1110へ戻って次のサブバンドの分析の処理を行う。
【0067】
一方、ステップS1116の判断結果がYes(肯定)、即ち、サブバンドの変数Nが3であり全サブバンドの分析が終了したと判断された場合には、バンド(メインバンド)の変数Kを1だけインクリメントして、次のバンドを指定する(ステップS1118)。
【0068】
次に、バンド(メインバンド)の変数Kが5であるか否かを判断する(ステップS1120)。ここで、ステップS1120の判断結果が否定、即ち、バンド(メインバンド)の変数Kが5でなくて最下位バンド(メインバンド)はないと判断された場合には、ステップS1106へ戻って次のバンド(メインバンド)の分割の処理を行う。
【0069】
一方、ステップS1120の判断結果が肯定、即ち、バンド(メインバンド)の変数Kが5であり最下位バンド(メインバンド)であると判断された場合には、バンド(メインバンド)5に特有の分析処理を行う(ステップS1122)。即ち、最下位バンド(メインバンド)はその上位のバンド(メインバンド)と帯域幅を同じにすれば、上位バンド(メインバンド)と同じルーチンを利用することもできる。ただし、サンプルレイトは同じでバンド(メインバンド)の中心(分析)周波数だけが異なる。つまり、バンド(メインバンド)4とバンド(メインバンド)5とを併せて、8個のサブバンドの最下位バンド(メインバンド)処理になる。
【0070】
次に、全分析区間を完了したか否かを判断する(ステップS1124)。ここで、ステップS1124の判断結果が否定、即ち、全分析区間を完了していないと判断された場合には、ステップS1102へ戻って次の区間の処理を行う。
【0071】
一方、ステップS1124の判断結果が肯定、即ち、全分析区間を完了していると判断された場合には、このルーチンの処理を終了する。
【0072】
次に、マルチレイト合成部における変換合成処理について説明すると、各バンド(メインバンド)の記憶部から読み出された振幅値と瞬間周波数情報とは、サブバンド変換合成部で時間圧縮伸長と周波数変換された後に、加算合成と同じ原理で各バンド(メインバンド)の余弦発振器(サイン波発振器)が倍音を作ることになる。
【0073】
各バンド(メインバンド)の倍音は、サンプルレイト変換部でサンプルレイトを逓倍した後に、上位のバンド(メインバンド)に加算され、順次上位のサンプルレイトに変換合成されていく。この実施の形態においては、波形信号のデータは間引き圧縮されていないので、直接バンド(メインバンド)のサンプルレイトで復号することになる。
【0074】
一方、データが間引かれている場合には、低いサンプルレイトで時間周波数の変換処理をした後に、サンプルレイトを逓倍して倍音の合成をすることもできるものである。
【0075】
なお、マルチレイト合成部における出力シフトレジスタは、サンプルレイトの異なるバンド(メインバンド)間の信号のバッファと同期化のために、一定区間のデータを保持して送出するものである。
【0076】
図12は、上記したマルチレイト合成部における変換合成処理をDSP20のプログラムで実行する場合のルーチンを示すフローチャートである。
【0077】
このルーチンにおいては、まず、合成のために記憶部から一定区間の分析データをDSP20のメモリにロードする(ステップS1202)。
【0078】
次に、バンド(メインバンド)を示す変数Kを0に設定して、バンド0を選択する(ステップS1204)。
【0079】
次に、サブバンドを示す変数Nを0に設定して、サブバンド0を選択する(ステップS1206)。
【0080】
次に、バンド(メインバンド)KのサブバンドNの分析データをもとに、一定区間の波形信号を合成する(ステップS1208)。ここで、一定区間とは、ステップS1202で読み込まれた分析データにより合成できる区間である。バンド(メインバンド)が下位になるに従って、合成サンプル数は半減していくが、波形信号の再生時間は等しいものである。即ち、バンド(メインバンド)数が6個の場合には、最上位バンド(メインバンド)は最下位バンド(メインバンド)の32倍になる。
【0081】
この実施の形態においては、最上位サンプル数の32倍を基本単位またはその整数倍を合成区間とすればよい。この場合には、基本単位は約0.7ミリ秒と十分に短い値となる。
【0082】
変換合成においても、サンプリングレイト、即ち、バンド(メインバンド)が異なっていても同じルーチンが利用できるが、上記した図11のマルチレイト分析部における分析処理において説明したように、サンプリングレイト、即ち、バンド(メインバンド)が半分になるに従って、計算するデータ量も半減する。つまりバンド(メインバンド)の変数Kによって計算サンプル数を変えるようにして、バンド(メインバンド)のサンプルレイトに対応する数のサンプルを計算する。
【0083】
次に、合成された区間の波形信号サンプルデータをバンド(メインバンド)Kの出力レジスタに加算する(ステップS1210)。出力レジスタには、先に合成したサブバンドの合成信号系列が合算されている。この出力レジスタはシフトレジスタになっていて、バンド(メインバンド)Kのサンプルレイトでデータをシフト出力していく。全サブバンドの合成信号が加算された時点で、下位バンド(メインバンド)からの合成信号と加算されてサンプルレイト変換部へ送られる。
【0084】
次に、サブバンドの変数Nを1だけインクリメントして、次のサブバンド処理に移る(ステップS1212)。
【0085】
次に、サブバンドの変数Nが3であるか否かを判断する(ステップS1214)。ここで、ステップS1214の判断結果が否定、即ち、サブバンドの変数Nが3でなくて全サブバンドの分析が終了していないと判断された場合には、ステップS1208へ戻って次のサブバンドの分析の処理を行う。
【0086】
一方、ステップS1214の判断結果が肯定、即ち、サブバンドの変数Nが3であり全サブバンドの分析が終了したと判断された場合には、バンド(メインバンド)の変数Kを1だけインクリメントして、次のバンドを指定する(ステップS1216)。
【0087】
次に、バンド(メインバンド)の変数Kが5であるか否かを判断する(ステップS1218)。ここで、ステップS1218の判断結果が否定、即ち、バンド(メインバンド)の変数Kが5でなくて最下位バンド(メインバンド)はないと判断された場合には、ステップS1206へ戻って次のバンド(メインバンド)の分割の処理を行う。
【0088】
一方、ステップS1218の判断結果が肯定、即ち、バンド(メインバンド)の変数Kが5であり最下位バンド(メインバンド)であると判断された場合には、バンド(メインバンド)5に特有の合成処理を行う(ステップS1220)。即ち、最下位バンド(メインバンド)はその上位のバンド(メインバンド)と帯域幅が同じなので、上位バンド(メインバンド)と同じルーチンを利用することもできる。ただし、サンプルレイトは同じだが、バンド(メインバンド)の中心(合成)周波数だけが異なる。
【0089】
次に、全合成区間を完了したか否かを判断する(ステップS1222)。ここで、ステップS1222の判断結果が否定、即ち、全合成区間を完了していないと判断された場合には、ステップS1202へ戻って次の区間の処理を行う。
【0090】
一方、ステップS1222の判断結果が肯定、即ち、全合成区間を完了していると判断された場合には、このルーチンの処理を終了する。
【0091】
なお、上記した実施の形態においては、本発明を時間軸上の圧縮伸長、即ち、タイムストレッチに適用した場合について説明したが、これに限られるものではないことは勿論であり、分析パラメータや分析された各バンド(メインバンド)の波形データを基に、鍵盤などの指示により音高や時間を変化して瞬時に発音する楽音発生処理に適用してもよいことは勿論である。
【0092】
【発明の効果】
本発明は、以上説明したように構成されているので、時間軸上で圧縮伸長しようとする波形信号を主要な周波数帯域にそれぞれ分割し、分割したそれぞれの周波数帯域の波形信号を独立に圧縮伸長するようにして、全体として滑らかな時間軸上の圧縮伸縮を行うようにする際に、分割するバンド(周波数帯域)数の増加に伴う波形信号処理量の増加を抑制することができ、このため安価なシステムを構築することができるという優れた効果を奏する。
【図面の簡単な説明】
【図1】テープの録音時における波形信号(伸長前の波形信号)を示す波形説明図である。
【図2】テープの回転速度を録音時より遅くした再生時における波形信号(伸長後の波形信号)を示す波形説明図である。
【図3】本発明による波形信号の時間軸圧縮伸長装置の実施の形態の一例を実現するためのハードウエアのブロック構成図である。
【図4】バンド(メインバンド)とサブバンドとの関係を示す波形説明図である。
【図5】DSPによる波形信号の時間軸圧縮伸長処理を実現するための回路のブロック構成図である。
【図6】マルチレイト前処理部の詳細なブロック構成図である。
【図7】サブバンド変換合成部の詳細なブロック構成図である。
【図8】サンプルレイト変換部の詳細なブロック構成図である。
【図9】最下位バンド(メインバンド)のサブバンドの分割処理を示す波形説明図である。
【図10】バンド信号の複素化を示す波形説明図である。
【図11】マルチレイト分析部における分析処理をDSPのプログラムで実行する場合のルーチンを示すフローチャートである。
【図12】マルチレイト合成部における変換合成処理をDSPのプログラムで実行する場合のルーチンを示すフローチャートである。
【符号の説明】
10 中央処理装置(CPU)
12 リード・オンリ・メモリ(ROM)
14 ランダム・アクセス・メモリ(RAM)
16 操作子
18 MIDIインターフェース(MIDI interface)
20 デジタル・シグナル・プロセッサ(DSP)
22 ランダム・アクセス・メモリ(RAM)
24 アナログ/デジタル変換器(A/D)
26 デジタル/アナログ変換器(D/A)
Claims (5)
- 波形信号を複数のメイン周波数帯域に分割し、かつ、各メイン周波数帯域のそれぞれを複数のサブ周波数帯域に分割した該複数のサブ周波数帯域毎にそれぞれの波形を表す波形データを記憶した記憶手段と、
前記サブ周波数帯域毎に設けられ、各サブ周波数帯域毎の波形データを基に該波形データが表す波形の時間軸圧縮伸長を行う複数の時間軸圧縮伸長手段と、
前記複数の時間軸圧縮伸長手段からの信号を合成する合成手段と
を有し、
前記複数の時間軸圧縮伸長手段はそれぞれ、波形の時間軸圧縮伸長を行うサブ周波数帯域が属するメイン周波数帯域において上位のメイン周波数帯域ほど高い処理頻度で圧縮伸長の処理を行い、下位のメイン周波数帯域ほど低い処理頻度で圧縮伸長の処理を行うものである
ことを特徴とする波形信号の時間軸圧縮伸長装置。 - 請求項1に記載の波形信号の時間軸圧縮伸長装置において、
各メイン周波数帯域におけるサブ周波数帯域の帯域数は同一である
ことを特徴とする波形信号の時間軸圧縮伸長装置。 - 請求項2に記載の波形信号の時間軸圧縮伸長装置において、
前記波形信号の時間軸圧縮伸長装置は所定のソフトウエアを実行することで入力された波形信号に対して圧縮伸長の処理が行われるものであって、あるメイン周波数帯域における時間軸圧縮伸長処理プログラムルーチンを他のメイン周波数帯域の時間軸圧縮伸長処理プログラムルーチンと共用する
ことを特徴とする波形信号の時間軸圧縮伸長装置。 - 請求項2または3に記載の波形信号の時間軸圧縮伸長装置において、
前記波形信号の時間軸圧縮伸長装置は所定のソフトウエアを実行することで入力された波形信号に対して圧縮伸長の処理が行われるものであって、同一のメイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、同一の処理プログラムルーチンを使用する
ことを特徴とする波形信号の時間軸圧縮伸長装置。 - 波形信号を複数のメイン周波数帯域に分割し、かつ、各メイン周波数帯域のそれぞれの波形信号を複数のサブ周波数帯域に分割した該複数のサブ周波数帯域毎にそれぞれの波形を表す波形データを記憶した記憶手段と、
前記サブ周波数帯域毎に設けられ、各サブ周波数帯域毎の波形データを基に該波形データが表す波形の時間軸圧縮伸長を行う複数の時間軸圧縮伸長手段と、
前記複数の時間軸圧縮伸長手段からの信号を合成する合成手段と
を有し、
同一のメイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、同一の処理頻度で圧縮伸長の処理を行うものであり、かつ、各メイン周波数帯域に属するサブ周波数帯域の時間軸圧縮伸長手段は、上位のメイン周波数帯域に属するサブ周波数帯域ほど高い処理頻度で圧縮伸長の処理を行い、下位のメイン周波数帯域に属するサブ周波数帯域ほど低い処理頻度で圧縮伸長の処理を行うものである
ことを特徴とする波形信号の時間軸圧縮伸長装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24151098A JP4170458B2 (ja) | 1998-08-27 | 1998-08-27 | 波形信号の時間軸圧縮伸長装置 |
US09/536,386 US6564187B1 (en) | 1998-08-27 | 2000-03-28 | Waveform signal compression and expansion along time axis having different sampling rates for different main-frequency bands |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP24151098A JP4170458B2 (ja) | 1998-08-27 | 1998-08-27 | 波形信号の時間軸圧縮伸長装置 |
US09/536,386 US6564187B1 (en) | 1998-08-27 | 2000-03-28 | Waveform signal compression and expansion along time axis having different sampling rates for different main-frequency bands |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000075862A JP2000075862A (ja) | 2000-03-14 |
JP4170458B2 true JP4170458B2 (ja) | 2008-10-22 |
Family
ID=27615032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24151098A Expired - Fee Related JP4170458B2 (ja) | 1998-08-27 | 1998-08-27 | 波形信号の時間軸圧縮伸長装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6564187B1 (ja) |
JP (1) | JP4170458B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005175674A (ja) * | 2003-12-09 | 2005-06-30 | Nec Corp | 信号圧縮伸張装置および携帯通信端末装置 |
EP1866915B1 (en) * | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
ES2705589T3 (es) | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
USRE47633E1 (en) | 2005-06-22 | 2019-10-01 | Odyssey Wireless Inc. | Systems/methods of conducting a financial transaction using a smartphone |
US8670493B2 (en) | 2005-06-22 | 2014-03-11 | Eices Research, Inc. | Systems and/or methods of increased privacy wireless communications |
US8233554B2 (en) | 2010-03-29 | 2012-07-31 | Eices Research, Inc. | Increased capacity communications for OFDM-based wireless communications systems/methods/devices |
RU2320028C1 (ru) * | 2006-09-27 | 2008-03-20 | Федеральное государственное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный университет кино и телевидения (СПбГУКиТ) | Способ и устройство сжатия спектра речевых сигналов |
US7474974B2 (en) * | 2007-01-31 | 2009-01-06 | Mcgill University | Embedded time domain analyzer for high speed circuits |
US9374746B1 (en) | 2008-07-07 | 2016-06-21 | Odyssey Wireless, Inc. | Systems/methods of spatial multiplexing |
US20100169105A1 (en) * | 2008-12-29 | 2010-07-01 | Youngtack Shim | Discrete time expansion systems and methods |
JP5699418B2 (ja) * | 2009-03-09 | 2015-04-08 | カシオ計算機株式会社 | 楽音発生装置および楽音発生プログラム |
US9093120B2 (en) * | 2011-02-10 | 2015-07-28 | Yahoo! Inc. | Audio fingerprint extraction by scaling in time and resampling |
CN106373590B (zh) * | 2016-08-29 | 2020-04-03 | 湖南理工学院 | 一种基于语音实时时长调整的声音变速控制系统和方法 |
CN112735455B (zh) * | 2019-10-28 | 2024-08-27 | 阿里巴巴集团控股有限公司 | 声音信息的处理方法和装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5754792B2 (ja) | 1974-03-01 | 1982-11-19 | ||
US4876937A (en) | 1983-09-12 | 1989-10-31 | Yamaha Corporation | Apparatus for producing rhythmically aligned tones from stored wave data |
US4805217A (en) | 1984-09-26 | 1989-02-14 | Mitsubishi Denki Kabushiki Kaisha | Receiving set with playback function |
US5347478A (en) | 1991-06-09 | 1994-09-13 | Yamaha Corporation | Method of and device for compressing and reproducing waveform data |
JP3163119B2 (ja) | 1991-07-19 | 2001-05-08 | シャープ株式会社 | 記録再生装置 |
US5412152A (en) | 1991-10-18 | 1995-05-02 | Yamaha Corporation | Device for forming tone source data using analyzed parameters |
US5315057A (en) | 1991-11-25 | 1994-05-24 | Lucasarts Entertainment Company | Method and apparatus for dynamically composing music and sound effects using a computer entertainment system |
US5350882A (en) | 1991-12-04 | 1994-09-27 | Casio Computer Co., Ltd. | Automatic performance apparatus with operated rotation means for tempo control |
KR950009380B1 (ko) | 1992-02-28 | 1995-08-21 | 삼성전자주식회사 | 레이저 디스크 플레이어 가라오케장치 |
US5717818A (en) | 1992-08-18 | 1998-02-10 | Hitachi, Ltd. | Audio signal storing apparatus having a function for converting speech speed |
JP3381074B2 (ja) | 1992-09-21 | 2003-02-24 | ソニー株式会社 | 音響構成装置 |
US5675709A (en) | 1993-01-21 | 1997-10-07 | Fuji Xerox Co., Ltd. | System for efficiently processing digital sound data in accordance with index data of feature quantities of the sound data |
US5611018A (en) | 1993-09-18 | 1997-03-11 | Sanyo Electric Co., Ltd. | System for controlling voice speed of an input signal |
US5511000A (en) | 1993-11-18 | 1996-04-23 | Kaloi; Dennis M. | Electronic solid-state record/playback device and system |
JP3548230B2 (ja) | 1994-05-30 | 2004-07-28 | キヤノン株式会社 | 音声合成方法及び装置 |
KR0129829B1 (ko) | 1994-09-28 | 1998-04-17 | 오영환 | 음향 변속 재생장치 |
JPH08115100A (ja) | 1994-10-13 | 1996-05-07 | Olympus Optical Co Ltd | 音声データ処理装置 |
JPH0916457A (ja) | 1995-06-28 | 1997-01-17 | Fujitsu Ltd | マルチメディアデータ検索システム |
US5809454A (en) | 1995-06-30 | 1998-09-15 | Sanyo Electric Co., Ltd. | Audio reproducing apparatus having voice speed converting function |
US5763800A (en) | 1995-08-14 | 1998-06-09 | Creative Labs, Inc. | Method and apparatus for formatting digital audio data |
US5765129A (en) | 1995-09-14 | 1998-06-09 | Hyman; Gregory E. | Voice recording and playback module |
US5792971A (en) | 1995-09-29 | 1998-08-11 | Opcode Systems, Inc. | Method and system for editing digital audio information with music-like parameters |
JP4132109B2 (ja) | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
JP3220396B2 (ja) | 1996-11-05 | 2001-10-22 | 株式会社河合楽器製作所 | 楽音波形再生装置 |
US5734119A (en) | 1996-12-19 | 1998-03-31 | Invision Interactive, Inc. | Method for streaming transmission of compressed music |
SG65729A1 (en) | 1997-01-31 | 1999-06-22 | Yamaha Corp | Tone generating device and method using a time stretch/compression control technique |
JP3317181B2 (ja) | 1997-03-25 | 2002-08-26 | ヤマハ株式会社 | カラオケ装置 |
JP3399297B2 (ja) | 1997-05-22 | 2003-04-21 | ヤマハ株式会社 | 電子楽器 |
JP3451900B2 (ja) | 1997-09-22 | 2003-09-29 | ヤマハ株式会社 | ピッチ/テンポ変換方法及び装置 |
-
1998
- 1998-08-27 JP JP24151098A patent/JP4170458B2/ja not_active Expired - Fee Related
-
2000
- 2000-03-28 US US09/536,386 patent/US6564187B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6564187B1 (en) | 2003-05-13 |
JP2000075862A (ja) | 2000-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5744742A (en) | Parametric signal modeling musical synthesizer | |
JP4170458B2 (ja) | 波形信号の時間軸圧縮伸長装置 | |
CA2721402C (en) | Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal | |
US5029509A (en) | Musical synthesizer combining deterministic and stochastic waveforms | |
WO1997017692A9 (en) | Parametric signal modeling musical synthesizer | |
JPH07248794A (ja) | 音声信号処理方法 | |
JP3265962B2 (ja) | 音程変換装置 | |
JPWO2003019530A1 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
JPH11513821A (ja) | 逆変換狭帯域/広帯域音声合成 | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
KR20010111630A (ko) | 시간/피치 변환 장치 및 시간/피치 변환 방법 | |
EP1840871B1 (en) | Audio waveform processing device, method, and program | |
JPH04358200A (ja) | 音声合成装置 | |
Ferreira | An odd-DFT based approach to time-scale expansion of audio signals | |
Sanjaume | Audio Time-Scale Modification in the Context of Professional Audio Post-production | |
JP4170459B2 (ja) | 波形信号の時間軸圧縮伸長装置 | |
JP4245114B2 (ja) | 音色制御装置 | |
JPS642960B2 (ja) | ||
JP4226164B2 (ja) | 波形信号の時間軸圧縮伸長装置 | |
JP3246012B2 (ja) | 楽音信号の音源装置 | |
JP2005208627A (ja) | 音声分析合成装置、及びプログラム | |
JPS6091227A (ja) | 音響解析装置の合成装置 | |
JP2009237589A (ja) | 音声分析合成装置、及びプログラム | |
US6418406B1 (en) | Synthesis of high-pitched sounds | |
JP2968630B2 (ja) | 音声開発装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080805 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080807 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110815 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120815 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130815 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |