[go: up one dir, main page]

JPH11305794A - ピッチ検出装置及び情報媒体 - Google Patents

ピッチ検出装置及び情報媒体

Info

Publication number
JPH11305794A
JPH11305794A JP10115659A JP11565998A JPH11305794A JP H11305794 A JPH11305794 A JP H11305794A JP 10115659 A JP10115659 A JP 10115659A JP 11565998 A JP11565998 A JP 11565998A JP H11305794 A JPH11305794 A JP H11305794A
Authority
JP
Japan
Prior art keywords
maximum
local
pitch
point
obtaining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10115659A
Other languages
English (en)
Inventor
Mitsuo Matsumoto
光雄 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP10115659A priority Critical patent/JPH11305794A/ja
Publication of JPH11305794A publication Critical patent/JPH11305794A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 【課題】 音声信号の相関を求めることなく、その音声
波形の特徴から少ない演算量でピッチを検出可能とす
る。 【解決手段】 デジタル音声信号を約30m秒のフレー
ム毎に切り出すバッファメモリ4と、音声信号を低域濾
波するフィルタ回路3と、低域濾波された音声信号波形
からローカルマキシマムとローカルミニマムを検出する
ピークサーチ回路5と、各ローカルマキシマムと各ロー
カルミニマムのうちで振幅の絶対値が最大ものを求め、
これら最大のローカルマキシマムとローカルミニマムか
らそれぞれ所定範囲内に入るローカルマキシマムとロー
カルミニマムを求め、それら各ローカルマキシマム間と
各ローカルミニマム間でそれぞれ求めた時間間隔のヒス
トグラムを共通のものとして求めるデータ分析回路7
と、ヒストグラムの最瀕値を音声信号のピッチとして決
定するピッチ決定回路8とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば歌唱者の声
やコーラスの声の基本周期(ピッチ)、音声の性質変換
の際に好適なものであり、詳しくは、音声信号の相関を
求めることなく、少ない演算量で声の高さに対応するピ
ッチ周波数、或いはその逆数であるピッチ周期を検出す
るピッチ検出装置及びそのピッチ検出を実現するための
プログラムデータを記録若しくは伝送する情報媒体に関
する。
【0002】
【従来の技術】従来より、音声の特徴を抽出する際に
は、音声波形を直接扱う代わりに、周波数スペクトルや
自己相関関数など、スペクトルに関連した特徴に変換し
て扱うことが多い。すなわち、音声波形は、振幅と位相
が時間的にゆるやかに変化する正弦波の和で構成されて
いると考えることができ、また、人間の聴覚による音声
の知覚において重要な特徴は主として振幅情報に含まれ
ており、位相情報は通常重要な役割を果たしていないた
め、当該音声の特徴抽出の際には、音声信号をスペクト
ルに関連した特徴に変換して扱うことが多い。なお、音
声の短時間区間毎の電力スペクトル密度、すなわち短時
間スペクトルは、周波数とともに緩やかに変化する成分
であるスペクトル包絡と、有音声の場合の細かく周期的
に変化する成分と、無音声の場合の非周期的に変化する
成分とに、分解して考えることができる。
【0003】ここで、音声の特徴の一つとして、声の高
さに対応する周波数(ピッチ周波数)、或いはその逆数
である周期(ピッチ周期)があり、当該ピッチを検出す
る手法の代表的なものとしては、いわゆる自己相関法や
変形相関法などが良く知られている。
【0004】
【発明が解決しようとする課題】しかし、それら従来の
ピッチ検出手法は、音声信号の相関を求める必要がある
ので、演算量が膨大となり、また、リアルタイムにピッ
チ周波数やピッチ周期を検出するためには、高速な演算
処理を実行できる高価な演算処理装置が必要となる。
【0005】本発明は、上述の課題に鑑みてなされたも
のであり、音声信号の相関を求めることなく、その音声
波形の特徴から少ない演算量でピッチを検出可能とし、
さらに音声信号が母音又はそれ以外の信号であるかの判
定をも可能とするピッチ検出装置及びそのピッチ検出を
実現するためのプログラムデータを記録若しくは伝送す
る情報媒体の提供を目的とする。
【0006】
【課題を解決するための手段】本発明に係るピッチ検出
装置は、上述の課題を解決するために、デジタル入力さ
れた音声信号を所定の長さの単位時間毎に切り出し、音
声信号から所望の周波数帯域のみを通過させ、所望の周
波数帯域の音声信号波形から複数の極大点と極小点を検
出し、単位時間内の複数の極大点の中から振幅の絶対値
が最大となる極大点を求め、単位時間内の複数の極小点
の中から振幅の絶対値が最大となる極小点を求め、最大
の極大点に対して振幅が所定の範囲内に入る極大点を求
め、最大の極小点に対して振幅が所定の範囲内に入る極
小点を求め、所定の範囲内に入る各極大点間でそれぞれ
時間間隔を求め、所定の範囲内に入る各極小点間でそれ
ぞれ時間間隔を求め、時間間隔のヒストグラムを共通の
ものとして求め、ヒストグラムの最瀕値を音声信号のピ
ッチとして取り出す。
【0007】本発明に係るピッチ検出装置は、上述の課
題を解決するために、デジタル入力された音声信号を所
定の長さの単位時間毎に切り出し、音声信号から所望の
周波数帯域のみを通過させ、所望の周波数帯域の音声信
号波形から複数の極大点と極小点を検出し、単位時間内
の複数の極大点の中から振幅の絶対値が最大となる極大
点を求め、単位時間内の複数の極小点の中から振幅の絶
対値が最大となる極小点を求め、最大の極大点に対して
振幅が所定の範囲よりも大きい極大点を求め、最大の極
大点に対して振幅が所定の範囲よりも小さい極大点を求
め、最大の極小点に対して振幅が所定の範囲よりも大き
い極小点を求め、最大の極小点に対して振幅が所定の範
囲よりも小さい極小点を求め、所定の範囲よりも大きい
各極大点間でそれぞれ時間間隔を求め、所定の範囲より
も小さい各極大点間でそれぞれ時間間隔を求め、所定の
範囲よりも大きい各極小点間でそれぞれ時間間隔を求
め、所定の範囲よりも小さい各極小点間でそれぞれ時間
間隔を求め、時間間隔のヒストグラムを共通のものとし
て求め、ヒストグラムの最瀕値を前記音声信号のピッチ
として取り出す。
【0008】ここで、本発明に係るピッチ検出装置で
は、ヒストグラムの最瀕値とその周辺の値を比較し、比
較結果に基づいて音声の母音/非母音を判定する。
【0009】また、本発明に係る情報媒体は、上述の課
題を解決するために、本発明に係るピッチ検出装置を実
現するためのプログラムデータを記録、若しくは伝送す
る。
【0010】
【発明の実施の形態】以下、本発明に係るピッチ検出装
置及び情報媒体の好ましい実施の形態について、図面を
参照しながら詳細に説明する。
【0011】本発明の第1の実施の形態となるピッチ検
出装置の概略構成を図1に示す。
【0012】この図1において、入力端子1には、アナ
ログ音声信号として例えば図2に示すような波形信号が
供給され、アナログ/デジタル(A/D)変換器2に供
給される。このアナログ/デジタル変換器2は、図2の
アナログ音声信号波形を、例えば44.1kHzのサン
プリング周波数でサンプリング処理してデジタル信号に
変換する。アナログ/デジタル変換器2にてデジタル化
された音声データは、フィルタ回路3に送られる。
【0013】当該フィルタ回路3は、IIR(巡回型)
若しくはFIR(非巡回型)のデジタルフィルタであ
り、例えば図3に示すようなカットオフ周波数が300
Hzの周波数特性を有する低域濾波器(ローパスフィル
タ)である。このフィルタ回路3にて低域濾波を行うこ
とで、図2に示したような波形信号は例えば図4(a)
に示したような高域成分が除去された波形信号となる。
なお、フィルタ回路3の出力は、実際にはデジタルデー
タであるが、該フィルタ処理の結果をわかりやすくする
ために、図4(a)の例ではアナログ波形信号のように
表している。このフィルタ回路3からの出力データは、
バッファメモリ4に送られる。
【0014】該バッファメモリ4は、フィルタ回路3か
らのデータを蓄積し、後段のピークサーチ回路5におけ
る処理単位時間分毎に出力、すなわち処理単位時間分に
対応するサンプル数毎のデータを出力する。本実施の形
態では、該処理単位時間を約30m秒(正確には約29
m秒、サンプル数で表すと1280サンプル毎)のフレ
ームとしている。バッファメモリ4から出力された該フ
レーム(1280サンプル)毎のデータは、ピークサー
チ回路5に送られる。
【0015】このピークサーチ回路5では、バッファメ
モリ4から供給された各サンプルデータを1サンプル毎
に比較し、その比較出力に基づいて、音声データのロー
カルピーク(極大点及び極小点)を抽出する。
【0016】具体的に言うと、該ピークサーチ回路5で
は、音声データの各サンプル毎に、現在の音声データと
その1サンプル前の音声データとを比較し、現在のサン
プル値がその1サンプル前のサンプル値よりも大きいこ
とを示す比較結果が続いた後、現在のサンプル値がその
1サンプル前のサンプル値よりも小さくなったことを示
す比較結果が得られたとき、或いは、現在のサンプル値
がその1サンプル前のサンプル値よりも小さいことを示
す比較結果が続いた後、現在のサンプル値がその1サン
プル前のサンプル値よりも大きくなったことを示す比較
結果が得られたときに、それら比較結果の変化時点を、
音声データのローカルピーク(極大点あるいは極小点)
として検出する。
【0017】すなわち、現在のサンプル値がその1サン
プル前のサンプル値よりも大きいことを示す比較結果が
続いた後、現在のサンプル値がその1サンプル前のサン
プル値よりも小さくなった時点の当該現在のサンプル値
の1つ前のサンプル値が極大点(以下、ローカルマキシ
マムMAと言う)を示し、一方で、現在のサンプル値が
その1サンプル前のサンプル値よりも小さいことを示す
比較結果が続いた後、現在のサンプル値がその1サンプ
ル前のサンプル値よりも大きくなった時点の当該現在の
サンプル値の1つ前のサンプル値が極小点(以下、ロー
カルミニマムMIと言う)を示す。
【0018】したがって、当該ピークサーチ回路5で
は、このようにサンプル比較結果の変化に基づいて、音
声データのローカルマキシマムMAのサンプルデータ、
及びローカルミニマムMIのサンプルデータを検出す
る。このピークサーチ回路5によって検出されたローカ
ルマキシマムMA及びローカルミニマムMIのサンプル
データは符号データ化回路6に送られる。
【0019】符号データ化回路6は、図4(b)及び図
5に示すように、ピークサーチ回路5より供給された各
ローカルマキシマムMAのサンプルデータに対しては正
(+)の符号を付加し、各ローカルミニマムMIのサン
プルデータに対しては負(−)の符号を付加する。な
お、図5には、一例として、ローカルマキシマムMAの
サンプルデータ及び各ローカルミニマムMIのサンプル
データのみを抜き出して示している。この符号データ化
回路6にて符号データ化されたローカルマキシマムMA
及びローカルミニマムMIの各サンプルデータは、デー
タ分析回路7に送られる。
【0020】データ分析回路7では、先ず、正(+)の
符号が付加された各ローカルマキシマム(極大値)MA
の振幅の絶対値と、符号データ化回路6にて負(−)の
符号が付加された各ローカルミニマム(極小値)MIの
振幅の絶対値とを、それぞれ求め、当該フレーム内にお
いてそれら振幅の絶対値が最も大きいローカルマキシマ
ムMAとローカルミニマムMIを求める。なお、図5の
例では、振幅の絶対値が最も大きいローカルマキシマム
MAを特に第1ローカルマキシマムMAGとして表し、
振幅の絶対値が最も大きいローカルミニマムMIを特に
第1ローカルミニマムMIGとして表している。
【0021】次いで、データ分析回路7は、第1ローカ
ルマキシマムMAGに対応して設定される図5中の所定
範囲RT内に、その振幅の値が入っている全てのローカ
ルマキシマムMAと、第1ローカルミニマムMIGに対
応して設定される図5中の所定範囲RU内に、その振幅
の値が入っている全てのローカルミニマムMIを求め
る。
【0022】図5の例では、第1ローカルマキシマムM
AGに対応した所定範囲RT内に、その振幅値が入って
いるローカルマキシマムMAを、特に第2ローカルマキ
シマムMAR(MAR1,MAR2,・・・)として表
しており、また、第1ローカルミニマムMIMに対応し
た所定範囲RU内に、その振幅値が入っているローカル
ミニマムMIを、特に第2ローカルミニマムMIR(M
IR1,MIR2,・・・)として表している。
【0023】ここで、第1ローカルマキシマムMAGに
対応した所定範囲RTは、第2ローカルマキシマムMA
Rを複数個求めることができるような範囲であり、同じ
く、第1ローカルミニマムMIGに対応した所定範囲R
Uは、第2ローカルミニマムMIRを複数個求めること
ができるような範囲である。すなわち、データ分析回路
7では、後述するように、時間間隔の統計的分析を行う
ようにしているので、該統計的分析の精度を高めるに
は、第2ローカルマキシマムMARと第2ローカルミニ
マムMIRがそれぞれ複数個必要になるからである。
【0024】なお、所定範囲RTとしては、図5中の振
幅値0から第1のローカルマキシマムMAGの振幅値ま
での間で任意の範囲に設定することができ、所定範囲R
Uとしては、図5中の振幅値0から第1のローカルミニ
マムMIGの振幅値までの間で任意の範囲に設定するこ
とができる。
【0025】これら所定範囲RTと所定範囲RUの一例
としては、任意フレーム内の全てのローカルマキシマム
MA,ローカルミニマムMIのなかで、例えば音声信号
のピッチを最も特徴的に表すローカルマキシマムMA,
ローカルミニマムMIのみを抜き出すことができるよう
な範囲に設定することが考えられる。例えば振幅の絶対
値が極端に大きなローカルマキシマムMAやローカルミ
ニマムMI、或いは、例えば振幅の絶対値が極端に小さ
なローカルマキシマムMAやローカルミニマムMIをピ
ッチ検出に用いることが好ましくないと考える場合に
は、それら極端に大きなローカルマキシマムMAやロー
カルミニマムMI、及び、極端に小さなローカルマキシ
マムMAやローカルミニマムMIを除外することができ
る所定範囲RTと所定範囲RUを設定しておくことが望
ましい。このような所定範囲RTと所定範囲RUを用い
れば、フレーム内の全てのローカルマキシマムMA及び
ローカルミニマムMIのなかで、ピッチ検出に好適なロ
ーカルマキシマムMA及びローカルミニマMIムのみを
取り出すことが可能となり、正確なピッチの検出ができ
ると共に、フレーム内の全てのローカルマキシマムM
A,ローカルミニマムMIを用いてピッチ検出を行う場
合よりも、遙かに少ない演算量でピッチを検出すること
が可能になる。
【0026】さらに、データ分析回路7では、上述のよ
うにして求めた第1ローカルマキシマムMAG及び全て
の第2ローカルマキシマムMAR(MAR1,MAR
2,MAR3,・・・)を用いて、それら各ローカルマ
キシマム間の時間間隔(例えばサンプル数)を測定し、
同じく、第1ローカルミニマムMIG及び全ての第2ロ
ーカルミニマムMIR(MIR1,MIR2,MIR
3,・・・)を用いて、それら各ローカルミニマム間の
時間間隔(例えばサンプル数)を測定する。
【0027】すなわち、このことを図5の例を用いて説
明すると、データ分析回路7では、第1ローカルマキシ
マムMAG及び第2ローカルマキシマムMARについて
の時間間隔として、第2ローカルマキシマムMAR1か
ら次の第1ローカルマキシマムMAGまでの時間間隔
(サンプル数)TD1、第2ローカルマキシマムMAR
1から第2ローカルマキシマムMAR2までの時間間隔
(サンプル数)TD2、第2ローカルマキシマムMAR
1から第2ローカルマキシマムMAR3までの時間間隔
(サンプル数)TD3、・・・のように、第2ローカル
マキシマムMAR1から他の各第2ローカルマキシマム
MAR又は第1ローカルマキシマムMAGについてそれ
ぞれの時間間隔を求めると共に、同様にして、第1ロー
カルマキシマムMAGから次の第2ローカルマキシマム
MAR2までの時間間隔、第1ローカルマキシマムMA
Gから第2ローカルマキシマムMAR3までの時間間
隔、第1ローカルマキシマムMAGから第2ローカルマ
キシマムMAR4までの時間間隔、・・・のように、第
1ローカルマキシマムMAGから他の各第2ローカルマ
キシマムMARについてそれぞれの時間間隔を求める。
第2ローカルマキシマムMAR2以降の各第2ローカル
マキシマムMAR3,MAR4,MAR5,・・・(M
AR6以降は図示を省略)についても同様にしてそれぞ
れの時間間隔を求める。
【0028】同様に、データ分析回路7では、第1ロー
カルミニマムMIG及び第2ローカルミニマムMIRに
ついての時間間隔として、第2ローカルミニマムMIR
1から次の第1ローカルマキシマムMIGまでの時間間
隔(サンプル数)AD1、第2ローカルミニマムMIR
1から第2ローカルミニマムMIR2までの時間間隔
(サンプル数)AD2、第2ローカルミニマムMIR1
から第2ローカルミニマムMIR3までの時間間隔(サ
ンプル数)、・・・のように、第2ローカルミニマムM
IR1から他の各第2ローカルミニマムMIR又は第1
ローカルミニマムMIGについてそれぞれの時間間隔を
求めると共に、同様にして、第1ローカルミニマムMI
Gから次の第2ローカルミニマムMIR2までの時間間
隔、第1ローカルミニマムMIGから第2ローカルミニ
マムMIR3までの時間間隔、・・・のように、第1ロ
ーカルミニマムMIGから他の各第2ローカルミニマム
についてそれぞれの時間間隔を求める。第2ローカルミ
ニマムMIR2以降の各第2ローカルミニマムMIR
3,MIR4(図示は省略),・・・についても同様に
してそれぞれの時間間隔を求める。
【0029】その後、データ分析回路7では、第1ロー
カルマキシマムMAG及び第2ローカルマキシマムMA
Rを用いて求めた各時間間隔(サンプル数)と、第1ロ
ーカルミニマムMIG及び第2ローカルミニマムMIR
を用いて求めた時間間隔(サンプル数)の両方を用い
て、統計的な分析を行う。
【0030】具体的に言うと、該データ分析回路7で
は、第1ローカルマキシマムMAG及び第2ローカルマ
キシマムMARを用いて求めた各時間間隔(サンプル
数)と、第1ローカルミニマムMIG及び第2ローカル
ミニマムMIRを用いて求めた時間間隔(サンプル数)
の両方を用いて、ヒストグラムを作成し、当該ヒストグ
ラムの最瀕値を求める。
【0031】すなわち、例えば図6に示すように、第1
ローカルマキシマムMAG及び第2ローカルマキシマム
MARを用いて求めた各時間間隔(サンプル数)と、第
1ローカルミニマムMIG及び第2ローカルミニマムM
IRを用いて求めた時間間隔(サンプル数)のうち、最
も発生頻度が高い時間間隔(サンプル数)を求める。図
6の例では、それら両者の時間間隔として、81サンプ
ル分の時間間隔を有するものが2回、82サンプル分の
時間間隔を有するものが2回、83サンプル分の時間間
隔を有するものが3回、・・・、192サンプル分の時
間間隔を有するものが5回、193サンプル分の時間間
隔を有するものが11回、194サンプル分の時間間隔
を有するものが6回、・・・となり、ヒストグラムの最
瀕値としては、193サンプル分の時間間隔を有するも
のが11回であり、したがって、データ分析回路7は、
当該193サンプル分の時間間隔を統計分析結果として
出力する。
【0032】データ分析回路7での統計分析により求め
られた時間間隔出力は、ピッチ決定回路8に送られる。
該ピッチ決定回路8では、データ分析回路7から供給さ
れた時間間隔出力に基づいて、入力音声信号のピッチを
決定する。すなわち、図6に示した統計分析結果を例に
挙げて説明すると、ピッチ決定回路8では、193サン
プル分の時間間隔を、入力端子1に供給された入力音声
信号のピッチ周期として決定する。
【0033】該ピッチ決定回路8にて決定されたピッチ
周期は、出力端子9からピッチ検出結果として出力され
る。
【0034】図1に示した第1の実施の形態のピッチ検
出装置におけるピッチ検出動作の流れをフローチャート
にて表すと、図7に示すようになる。
【0035】この図7において、ステップS1では、入
力端子1に供給された音声信号を、アナログ/デジタル
変換器2にてデジタルデータに変換し、さらにフィルタ
回路3にて所望の周波数帯域のみを取り出す低域濾波を
行った後、バッファメモリ4にて単位時間(フレーム)
毎に切り出す。
【0036】次のステップS2では、ピークサーチ回路
5にて、ローカルマキシマムMA(極大点)とローカル
ミニマムMI(極小点)を抽出し、さらに符号データ化
回路6にてローカルマキシマムMAに正(+)の符号を
付加し、ローカルミニマムMIに負(−)の符号を付加
する符号データ化を行う。
【0037】ステップS3では、データ分析回路7にお
いて、正(+)の符号が付加された各ローカルマキシマ
ムMA(極大値)の振幅の絶対値と、符号データ化回路
6にて負(−)の符号が付加された各ローカルミニマム
MI(極小値)の振幅の絶対値とを、それぞれ求め、当
該フレーム内においてそれら振幅の絶対値が最も大きい
第1ローカルマキシマムMAGと第1ローカルミニマム
MIGを求める。
【0038】ステップS4では、データ分析回路7にお
いて、振幅の絶対値が最大の第1ローカルマキシマムM
AGに対応した所定範囲RT内に、その振幅値が入って
いる全ての第2ローカルマキシマムMARを求め、それ
らの第1ローカルマキシマムMAG及び第2ローカルマ
キシマムMARを用いて各時間間隔(サンプル数)を測
定し、その時間間隔からヒストグラムを作成する。
【0039】ステップS5では、データ分析回路7にお
いて、振幅の絶対値が最大の第1ローカルミニマムMI
Gに対応した所定範囲RU内に、その振幅値が入ってい
る全ての第2ローカルミニマムMIRを求め、それらの
第1ローカルミニマムMIG及び第2ローカルミニマム
MIRを用いて各時間間隔(サンプル数)を測定し、そ
の時間間隔を、ステップS4のヒストグラムに加える。
【0040】ステップS6では、データ分析回路7に
て、ヒストグラムの最瀕値を求め、その後、ピッチ決定
回路8において当該ヒストグラムの最瀕値からピッチ周
期を決定する。
【0041】この第1の実施の形態によれば、音声信号
の相関を求めることなく、その波形の特徴から少ない演
算量で精度の高いピッチ検出が可能である。また、この
第1の実施の形態によれば、全てのローカルマキシマム
MA及びローカルミニマムMIを用いて時間間隔を測定
する場合よりも、少ない演算量でピッチ検出が可能とな
っている。
【0042】次に、本発明の第2のピッチ検出装置が適
用される第2の実施の形態のピッチ検出装置について説
明する。
【0043】この第2の実施の形態のピッチ検出装置で
は、図8に示すように、フレーム内で振幅の絶対値が最
大の第1ローカルマキシマムMAGに対応した所定範囲
RTAよりも、その振幅値が大きいローカルマキシマム
MA(MAB)を求め、それらのローカルマキシマムM
A(MAB)を用いて時間間隔を計測してヒストグラム
を作成し、また、フレーム内で振幅の絶対値が最大の第
1ローカルミニマムMIGに対応した所定範囲RUIよ
りも、その振幅値が大きいローカルミニマムMI(MI
B)を求め、それらのローカルミニマムMI(MIB)
を用いて時間間隔を計測してヒストグラムに加えるよう
にする。
【0044】さらに、第2の実施の形態のピッチ検出装
置では、振幅の絶対値が最大の第1ローカルマキシマム
MAGに対応した所定範囲RTAよりもその振幅値が小
さいローカルマキシマムMA(MAS)を求め、それら
のローカルマキシマムMA(MAS)を用いて時間間隔
を計測してヒストグラムを生成し、また、振幅の絶対値
が最大の第1ローカルミニマムMIGに対応した所定範
囲RUIよりもその振幅値が小さいローカルミニマムM
I(MIS)を求め、それらのローカルミニマムMI
(MIS)を用いて時間間隔を計測して先のヒストグラ
ムに加えるようにする。
【0045】この第2の実施の形態のピッチ検出装置の
概略構成は図1と同様であるため、その図示は省略する
が、当該第2の実施の形態のピッチ検出装置のデータ分
析回路7では、以下のようなことを行っている。
【0046】すなわち、第2の実施の形態のピッチ検出
装置のデータ分析回路7では、図8に示すように、先
ず、正(+)の符号が付加された各ローカルマキシマム
(極大値)MAの振幅の絶対値と、符号データ化回路6
にて負(−)の符号が付加された各ローカルミニマム
(極小値)MIの振幅の絶対値とを、それぞれ求め、当
該フレーム内においてそれら振幅の絶対値が最も大きい
第1ローカルマキシマムMAGと第1ローカルミニマム
MIGを求める。
【0047】次いで、データ分析回路7は、第1ローカ
ルマキシマムMAGに対応して設定される所定範囲RT
Aよりも、その振幅の値が大きい全てのローカルマキシ
マムMAと、第1ローカルミニマムMIGに対応して設
定される所定範囲RUIよりも、その振幅の値が大きい
全てのローカルミニマムMIを求める。図8の例では、
第1ローカルマキシマムMAGに対応した所定範囲RT
Aよりも、その振幅値が大きいローカルマキシマムMA
を、特に第3ローカルマキシマムMAB(MAB1,M
AB2,・・・)として表し、第1ローカルミニマムM
IMに対応した所定範囲RUIよりも、その振幅値が大
きいローカルミニマムMIを、特に第3ローカルミニマ
ムMIB(MIB1,MIB2,・・・)として表して
いる。
【0048】同様に、データ分析回路7は、第1ローカ
ルマキシマムMAGに対応して設定される所定範囲RT
Aよりも、その振幅の値が小さい全てのローカルマキシ
マムMIと、第1ローカルミニマムMIGに対応して設
定される所定範囲RUIよりも、その振幅の値が小さい
全てのローカルミニマムMIを求める。図8の例では、
第1ローカルマキシマムMAGに対応した所定範囲RT
Aよりも、その振幅値が小さいローカルマキシマムMI
を、特に第4ローカルマキシマムMAS(MAS1,M
AS2,・・・)として表し、第1ローカルミニマムM
IMに対応した所定範囲RUIよりも、その振幅値が小
さいローカルミニマムを、特に第4ローカルミニマムM
IS(MIS1,MIS2,・・・)として表してい
る。
【0049】ここで、第1ローカルマキシマムMAGに
対応した所定範囲RTAは、第3ローカルマキシマムM
ABや第4のローカルマキシマムMASを複数個求める
ことができるような範囲であり、同じく、第1ローカル
ミニマムMIMに対応した所定範囲RUIは、第3ロー
カルミニマムMIBや第4のローカルミニマムMISを
複数個求めることができるような範囲である。すなわ
ち、データ分析回路7では、時間間隔の統計的分析を行
うようにしているので、該統計的分析の精度を高めるに
は、第3ローカルマキシマムMAB及び第3ローカルミ
ニマムMIBと第4ローカルマキシマムMAS及び第4
ローカルミニマムMISがそれぞれ複数個必要になるか
らである。
【0050】なお、所定範囲RTAとしては、図8中の
振幅値0から第1のローカルマキシマムMAGの振幅値
までの間で任意の範囲に設定することができ、所定範囲
RUIとしては、図8中の振幅値0から第1のローカル
ミニマムMIGの振幅値までの間で任意の範囲に設定す
ることができる。前述した第1の実施の形態では、図5
の所定範囲RTと所定範囲RUの一具体例として、フレ
ーム内の全てのローカルマキシマムMA,ローカルミニ
マムMIのなかで音声信号のピッチを最も特徴的に表す
ローカルマキシマムMA,ローカルミニマムMIのみを
抜き出すことができるような範囲に設定する例を挙げた
が、この第2の実施の形態の図8に示す所定範囲RT
A,RUIの一具体例としては、例えばフレーム内で最
も多く発生するローカルマキシマムMA,ローカルミニ
マムMIを除外することができるような範囲とすること
が考えられる。すなわち、フレーム内で最も多く発生す
るローカルマキシマムMA,ローカルミニマムMIを使
用すればピッチ検出の精度を上げることはできるが、そ
の演算量は増大する。したがって、それらフレーム内で
最も多く発生するローカルマキシマムMA,ローカルミ
ニマムMIをピッチ検出の演算から除外すれば、ピッチ
検出の精度は多少低下するが演算量を減らすことができ
る。このような所定範囲RTA及び所定範囲RUIを用
いれば、フレーム内の全てのローカルマキシマムMA,
ローカルミニマムMIを用いる場合や、例えばフレーム
内で最も多く発生するローカルマキシマムMA,ローカ
ルミニマムMIを用いる場合よりも、遙かに少ない演算
量でピッチを検出することが可能になる。
【0051】さらに、データ分析回路7では、上述のよ
うにして求めた第1ローカルマキシマムMAG及び全て
の第3ローカルマキシマムMAB(MAB1,MAB
2,MAB3,・・・)を用いて、それら各ローカルマ
キシマム間の時間間隔を測定し、同じく、第1ローカル
ミニマムMIG及び全ての第3ローカルミニマムMIB
(MIB1,MIB2,MIB3,・・・)を用いて、
それら各ローカルミニマム間の時間間隔(例えばサンプ
ル数)を測定する。
【0052】同様に、データ分析回路7は、第1ローカ
ルマキシマムMAG及び全ての第4ローカルマキシマム
MAS(MAS1,MAS2,MAS3,・・・)を用
いて、それら各ローカルマキシマム間の時間間隔を測定
し、同じく、第1ローカルミニマムMIG及び全ての第
4ローカルミニマムMIS(MIS1,MIS2,MI
S3,・・・)を用いて、それら各ローカルミニマム間
の時間間隔(例えばサンプル数)を測定する。
【0053】すなわち、図8の例を用いて説明すると、
この第2の実施の形態のピッチ検出装置のデータ分析回
路7では、第1ローカルマキシマムMAG及び第3ロー
カルマキシマムMABについての時間間隔として、第1
ローカルマキシマムMAGから次の第3ローカルマキシ
マムMAB1までの時間間隔(サンプル数)tdb1、
第1ローカルマキシマムMAGから第3ローカルマキシ
マムMAB2までの時間間隔(サンプル数)tdb2、
第1ローカルマキシマムMAGから第3ローカルマキシ
マムMAB3までの時間間隔(サンプル数)tdb3、
・・・のように、第1ローカルマキシマムMAGから他
の各第3ローカルマキシマムMABについてそれぞれの
時間間隔(サンプル数)を求めると共に、同様にして、
第3ローカルマキシマムMAB1から次の第3ローカル
マキシマムMAB2までの時間間隔(サンプル数)、第
3ローカルマキシマムMAB1から第3ローカルマキシ
マムMAB3までの時間間隔(サンプル数)・・・のよ
うに、第3ローカルマキシマムMAB1から他の各第3
ローカルマキシマムMABについてそれぞれの時間間隔
(サンプル数)を求める。第3ローカルマキシマムMA
B2以降の各第3ローカルマキシマムMAB3,MAB
4,MAB5,・・・(MAB4以降は図示を省略)に
ついても同様にしてそれぞれの時間間隔(サンプル数)
を求める。
【0054】同様に、この第2の実施の形態のピッチ検
出装置のデータ分析回路7では、第1ローカルマキシマ
ムMAG及び第4ローカルマキシマムMASについての
時間間隔(サンプル数)として、第4ローカルマキシマ
ムMAS1から次の第1ローカルマキシマムMAGまで
の時間間隔(サンプル数)tds1、第4ローカルマキ
シマムMAS1から第4ローカルマキシマムMAS2ま
での時間間隔(サンプル数)tds2、第4ローカルマ
キシマムMAS1から第4ローカルマキシマムMAS3
(図示は省略)までの時間間隔(サンプル数)・・・の
ように、第4ローカルマキシマムMAS1から他の各第
1ローカルマキシマムMAG又は第4ローカルマキシマ
ムMASについてそれぞれの時間間隔を求めると共に、
第1ローカルマキシマムMAGから次の第4ローカルマ
キシマムMAS2までの時間間隔(サンプル数)、第1
ローカルマキシマムMAGから第4ローカルマキシマム
MAS(図示は省略)までの時間間隔(サンプル数)・
・・のように、第1ローカルマキシマムMAGから他の
各第4ローカルマキシマムMASについてそれぞれの時
間間隔(サンプル数)を求める。第4ローカルマキシマ
ムMAS2以降の各第4ローカルマキシマムMAS3,
MAS4,MAS5,・・・(MAB3以降は図示を省
略)についても同様にしてそれぞれの時間間隔(サンプ
ル数)を求める。
【0055】また、この第2の実施の形態のピッチ検出
装置のデータ分析回路7では、第1ローカルミニマムM
IG及び第3ローカルミニマムMIBについての時間間
隔として、第1ローカルミニマムMIGから次の第3ロ
ーカルミニマムMIB1までの時間間隔adb1、第1
ローカルミニマムMIGから第3ローカルミニマムMI
B2までの時間間隔adb2、第1ローカルミニマムM
IGから第3ローカルミニマムMIB3(図示は省略)
までの時間間隔・・・のように、第1ローカルミニマム
MIGから他の各第3ローカルミニマムMIBについて
それぞれの時間間隔を求めると共に、同様にして、第3
ローカルミニマムMIB1から次の第3ローカルミニマ
ムMIB2までの時間間隔、第3ローカルミニマムMI
B1から第3ローカルミニマムMIB3(図示は省略)
までの時間間隔・・・のように、第3ローカルミニマム
MIB1から他の各第3ローカルミニマムMIBについ
てそれぞれの時間間隔を求める。第3ローカルミニマム
MIB2以降の各第3ローカルミニマムMIB3,MI
B4,MIB5,・・・(MIB3以降は図示を省略)
についても同様にしてそれぞれの時間間隔を求める。
【0056】同様に、この第2の実施の形態のピッチ検
出装置のデータ分析回路7では、第1ローカルミニマム
MIG及び第4ローカルミニマムMISについての時間
間隔として、第4ローカルミニマムMIS1から次の第
1ローカルミニマムMIGまでの時間間隔ads1、第
4ローカルミニマムMIS1から第4ローカルミニマム
MIS2までの時間間隔ads2、第4ローカルミニマ
ムMIS1から第4ローカルミニマムMIS3までの時
間間隔ads3・・・のように、第4ローカルミニマム
MIS1から他の各第1ローカルミニマムMIG又は第
4ローカルミニマムMISについてそれぞれの時間間隔
を求めると共に、同様にして、第1ローカルミニマムM
IGから次の第4ローカルミニマムMIS2までの時間
間隔、第1ローカルミニマムMIGから第4ローカルミ
ニマムMIS3までの時間間隔・・・のように、第1ロ
ーカルミニマムMIGから他の各第4ローカルミニマム
MISについてそれぞれの時間間隔を求める。第4ロー
カルミニマムMIS2以降の各第4ローカルミニマムM
IS3,MIS4,MIS5,・・・(MIS4以降は
図示を省略)についても同様にしてそれぞれの時間間隔
を求める。
【0057】その後、第2の実施の形態のピッチ検出装
置のデータ分析回路7では、第1ローカルマキシマムM
AG,第3ローカルマキシマムMAB及び第4ローカル
マキシマムMASを用いて求めた各時間間隔と、第1ロ
ーカルミニマムMIG,第3ローカルミニマムMIB及
び第4ローカルミニマムMISを用いて求めた時間間隔
を用いて、統計的な分析を行う。
【0058】具体的に言うと、当該第2の実施の形態の
データ分析回路7では、第1ローカルマキシマムMA
G,第3ローカルマキシマムMAB、及び第4ローカル
マキシマムMASを用いて求めた各時間間隔と、第1ロ
ーカルミニマムMIG,第3ローカルミニマムMIB及
び第4ローカルミニマムMISを用いて求めた時間間隔
のそれぞれを用いて、ヒストグラムを作成し、当該ヒス
トグラムの最瀕値を求める。
【0059】すなわち、第1の実施の形態と同様に、第
1ローカルマキシマムMAG,第3ローカルマキシマム
MAB及び第4ローカルマキシマムMASを用いて求め
た各時間間隔と、第1ローカルミニマムMIG,第3ロ
ーカルミニマムMIB及び第4ローカルミニマムMIS
を用いて求めた時間間隔のうち、最も発生頻度が高い時
間間隔を求める。
【0060】第2の実施の形態のデータ分析回路7での
統計分析により求められた時間間隔出力は、同じく第2
の実施の形態のピッチ決定回路8に送られる。該ピッチ
決定回路8では、データ分析回路7から供給された時間
間隔出力に基づいて、入力音声信号のピッチを決定す
る。
【0061】該ピッチ決定回路8にて決定されたピッチ
周期は、出力端子9から第2の実施の形態のピッチ検出
装置のピッチ検出結果として出力される。
【0062】この第2の実施の形態のピッチ検出装置に
おけるピッチ検出動作の流れをフローチャートにて表す
と、図9に示すようになる。なお、この図9のステップ
S1からステップS3までの処理は、図7のフローチャ
ートのステップS1からステップS3までの処理と同じ
であり、その説明は省略する。
【0063】この図9において、ステップS14では、
データ分析回路7において、振幅の絶対値が最大の第1
ローカルマキシマムMAGに対応した所定範囲RTAよ
りも、その振幅値が大きい全ての第3ローカルマキシマ
ムMABを求め、それら第1ローカルマキシマムMAG
及び第3ローカルマキシマムMABを用いて各時間間隔
を測定し、その時間間隔からヒストグラムを作成する。
【0064】ステップS15では、データ分析回路7に
おいて、振幅の絶対値が最大の第1ローカルマキシマム
MAGに対応した所定範囲RUIよりも、その振幅値が
小さい全ての第4ローカルマキシマムMASを求め、そ
れら第1ローカルマキシマムMAG及び第4ローカルマ
キシマムMASを用いて各時間間隔を測定し、その時間
間隔をステップS14のヒストグラムに追加する。
【0065】ステップS16では、データ分析回路7に
おいて、振幅の絶対値が最大の第1ローカルミニマムM
IGに対応した所定範囲よりも、その振幅値が大きい全
ての第3ローカルミニマムMIBを求め、それら第1ロ
ーカルミニマムMIG及び第3ローカルミニマムMIB
を用いて各時間間隔を測定し、その時間間隔からヒスト
グラムを作成する。
【0066】ステップS17では、データ分析回路7に
おいて、振幅の絶対値が最大の第1ローカルミニマムM
IGに対応した所定範囲よりも、その振幅値が小さい全
ての第4ローカルミニマムMISを求め、それら第1ロ
ーカルミニマムMIG及び第4ローカルミニマムMIS
を用いて各時間間隔を測定し、その時間間隔をステップ
S16のヒストグラムに追加する。
【0067】ステップS18では、データ分析回路7に
て、ヒストグラムの最瀕値を求め、その後、ピッチ決定
回路8において当該ヒストグラムの最瀕値からピッチ周
期を決定する。
【0068】この第2の実施の形態によれば、音声信号
の相関を求めることなく、その波形の特徴から少ない演
算量で精度の高いピッチ検出が可能である。また、この
第2の実施の形態によれば、全てのローカルマキシマム
MA及びローカルミニマムMIを用いて時間間隔を測定
する場合よりも、少ない演算量でピッチ検出が可能とな
っている。
【0069】ところで、本発明の各実施の形態に示した
ピッチ検出装置は、例えばいわゆるカラオケ装置におい
て、歌唱者の声やコーラスの声のピッチを検出する際に
適用可能である。
【0070】すなわち、カラオケ装置においては、歌唱
者による歌の調及び各音の高さを本発明によって検出し
たピッチから求め、本来の楽曲の調及び音の高さからど
れだけ外れているかを、当該歌唱者に示すことができれ
ば、歌の練習にとって非常に有効であると考えられる。
【0071】以下、本発明の第3の実施の形態として、
カラオケ装置に適用可能であって、歌唱者やコーラスの
声のピッチを本発明(第1及び第2の実施の形態)のピ
ッチ検出装置にて検出し、その検出したピッチに基づい
て、歌唱者やコーラスの声の高さの良否を判定する判定
装置の主要部構成を、図10に示す。なお、一般的なカ
ラオケ装置における構成要素については周知であり、こ
の図10ではそれらの図示は省略し、本発明の判定装置
に係る部分のみを示している。また、図10において、
図1と同じ構成要素には同一の指示符号を付している。
【0072】図10において、入力端子1には、歌唱者
やコーラスの声をマイクロホンにて音響/電気変換した
アナログ音声信号が供給される。このアナログ音声信号
は、アナログ/デジタル変換器2にてデジタル信号に変
換され、フィルタ回路3にて低域濾波される。このフィ
ルタ回路3からの出力データが、ピッチ検出装置32に
送られる。
【0073】このピッチ検出装置32は、第1及び第2
の実施の形態のいずれかのピッチ検出装置のバッファメ
モリ4以降の構成を有するものである。該ピッチ検出装
置32にて検出されたピッチは、比較回路33に供給さ
れる。
【0074】一方で、端子30には、当該カラオケ装置
のMIDI(Musical Instrument Digital Interface)
データが供給される。該MIDIデータは、MIDI基
準音抽出回路31に送られる。ここで、このMIDIデ
ータは、カラオケ装置にて再生している伴奏楽曲に関す
るデータであり、本来の楽曲(歌)の調及び音の高さの
データも含まれている。MIDI基準音抽出回路31で
は、供給されたMIDIデータから、本来の楽曲の調及
び音の高さのデータを基準音データ(以下、基準ピッチ
と呼ぶ)として抽出する。この基準ピッチは、比較回路
33に供給される。
【0075】比較回路33では、ピッチ検出装置32か
ら供給される歌唱者の声のピッチと、MIDI基準音抽
出回路31から供給される基準ピッチとを比較し、その
比較結果を出力する。この比較により、歌唱者の調及び
音の高さが、本来の楽曲の調及び音の高さからどれだけ
外れているかを、知ることができる。
【0076】ここで、マイクロホンからの入力とMID
Iデータとから、歌唱者の調及び音の高さが、本来の楽
曲の調及び音の高さからどれだけ外れているかを示す一
例を、図11にて説明する。
【0077】この図11において、MIDIデータは、
図11(a)にて示すように、データDT1,DT2,
DT3,・・・のように単位フレーム毎にデータが供給
され、MIDI基準音抽出回路31では、データDT
1,DT2,DT3,・・・の単位フレーム毎にMID
Iデータから基準ピッチを抽出する。
【0078】また、ピッチ検出装置32では、図11
(b)のように約30m秒毎にマイクロホンからの入力
音声信号のピッチを検出する。
【0079】比較回路33では、ピッチ検出装置32が
約30m秒毎に検出した入力音声信号のピッチと、当該
ピッチ検出装置32にてピッチ検出が行われる30m秒
毎に対応した基準ピッチとを比較し、その比較結果とし
て、「高い」、「低い」、「正しい」のいずれかの比較
結果を出力する。なお、比較結果の「高い」は歌唱者の
声のピッチが基準ピッチよりも高いことを示し、比較結
果の「低い」は歌唱者の声のピッチが基準ピッチよりも
低いことを示し、比較結果の「正しい」歌唱者の声のピ
ッチが基準ピッチと合っていることを示す。
【0080】この比較回路33からの比較結果は、画像
データ生成回路34に送られる。該画像データ生成回路
34は、カラオケ装置に通常備えられている、歌詞やイ
メージ映像を表示する為のモニタに、比較結果に応じた
表示を行わせるための画像データを生成するためのもの
である。
【0081】その比較結果に応じた表示用画像データの
一例としては、文字による「高い」、「低い」、「正し
い」を表示するための画像データや、「高い」、「低
い」、「正しい」に対応するキャラクタを表すための画
像データ等、或いは「高い」、「低い」、「正しい」に
対応するキャラクタの色や明るさを変更するための画像
データなどが考えられ、画像データ生成回路34では、
それらいずれかの画像データを生成する。
【0082】この画像データ生成回路34が生成した画
像データは、例えば図12に示すモニタ画面40上の所
定の領域41上にインポーズ表示される。
【0083】また、ここまでの説明では、比較回路33
が「高い」、「低い」、「正しい」の3種類の比較結果
を出力し、モニタ画面上のそれらに対応する表示を行う
例を述べたが、歌唱者の調及び音の高さが本来の楽曲の
調及び音の高さからどれだけ外れているかを、いわゆる
バーグラフにて表示することも可能である。
【0084】この場合、比較回路33は、歌唱者の調及
び音の高さが本来の楽曲の調及び音の高さから外れてい
る量(レベル)を比較結果として出力し、画像データ生
成回路34ではその比較結果に応じてバーグラフ表示用
画像データを生成する。
【0085】さらに、この第3の実施の形態では、比較
回路33の比較結果に応じた画像データを生成する例を
挙げているが、例えば図13に示すように、「高い」、
「低い」、「正しい」にそれぞれ対応する例えばLED
(発光ダイオード)ランプをモニタ画面40の下などに
設け、これらLEDランプを比較結果に応じて点灯或い
は消灯することで、比較結果に応じた表示を行わせるこ
とも可能である。
【0086】図14には、この第3の実施の形態の判定
装置における音声入力及びMIDIデータ入力から比較
結果の表示出力までの流れを示す。
【0087】この図14において、ステップS41で
は、入力端子1から供給された歌唱者の声の入力音声信
号から、ピッチ検出装置32がピッチを検出する。
【0088】一方、ステップS42では、端子30から
入力されたMIDIデータから、MIDI基準音抽出回
路31が基準ピッチを抽出し、当該基準ピッチと歌唱者
の声から検出したピッチとを、比較回路33にて比較す
る。
【0089】ステップS43では、その比較回路33に
よる比較結果から、「高い」、「低い」、「正しい」の
いずれかを決定する。
【0090】ステップS44では、その比較結果「高
い」、「低い」、「正しい」を歌唱者に知らせるための
表示出力を行う。
【0091】このように第3の実施の形態によれば、相
関を求めることなく、少ない演算量で、精度の高いピッ
チを求めることができ、さらに検出したピッチと基準ピ
ッチとを比較することで、歌唱者の声やコーラスの声の
高さを正しい高さに導くことができ、音声の性質変換が
可能である。
【0092】上述した第3の実施の形態では、第1,第
2の実施の形態のピッチ検出装置を使用して検出したピ
ッチと基準ピッチとを比較し、その比較結果に基づい
て、単に歌唱者の声のピッチが「高い」、「低い」、
「正しい」の何れかであることを、当該歌唱者等に知ら
せることのみ行っているが、本発明の第4の実施の形態
にかかるカラオケ装置においては、例えば伴奏音のピッ
チをシフトして歌唱者等の声のピッチに合わせるような
ことも可能となされている。
【0093】このようなピッチシフトを実現するために
は、マイクロホンから入力された音うち、ある区間(フ
レーム)の音が歌唱者等の声のうちの母音であるのか、
或いは、歌唱者等の声の子音や雑音若しくは無音である
のかを判別することが必要である。すなわち、歌唱者等
の声の母音であると判定されたとき、その母音のピッチ
に基づいて伴奏音のピッチシフトを行うことは有効であ
るが、子音や雑音若しくは無音であると判定されたとき
に、それらの音のピッチに基づいて伴奏音のピッチシフ
トを行うのは好ましくないからである。
【0094】この第4の実施の形態では、前述の第1,
第2の実施の形態のピッチ検出装置において作成したヒ
ストグラムを用いて、マイクロホンから入力された音
が、歌唱者等の声の母音であるのか、或いは、それ以外
の子音や雑音若しくは無音であるのかを判別し、この判
別結果に基づいて、ピッチシフトを行うか否かを決定し
ている。
【0095】図15には、第4の実施の形態のカラオケ
装置の概略構成を示す。なお、この図15の構成は、第
1,第2の実施の形態が適用される第3の実施の形態
に、さらに母音等の判定機能とピッチシフト機能を付加
したものである。なお、図15において、図10と同じ
構成要素には同一の指示符号を付し、それらの説明は省
略する。
【0096】この図15において、端子30から供給さ
れた当該カラオケ装置の伴奏曲のデータを含むMIDI
データは、ピッチシフト回路37に送られる。当該ピッ
チシフト回路37は、伴奏音のピッチをシフト可能なも
のであり、後述する判定制御回路36によってそのピッ
チシフトの有無及びピッチシフト量が制御されるもので
ある。
【0097】判定制御回路36には、ピッチ検出回路3
2にて前述したように生成したヒストグラムのデータ
と、比較回路33から出力される比較結果のデータとが
供給される。当該判定制御回路36では、ヒストグラム
の最瀕値とその周辺の値とを比較し、最瀕値がその周辺
の値に対して、ある閾値以上に大きければ、その区間
(フレーム)は母音であると判断し、一方で、最瀕値が
その周辺の値に対して、ある閾値より小さければ、その
区間(フレーム)は子音若しくは雑音或いは無音である
と判断する。
【0098】また、この判定制御回路36では、母音又
はそれ以外の音の判定結果と、比較回路33からの比較
結果とに基づいて、ピッチシフト回路37におけるピッ
チシフトの有無及びピッチシフト量を制御する制御信号
を生成する。すなわち、当該判定制御回路36は、比較
回路33から供給された比較結果が「正しい」を示して
いるとき、又は、母音又はそれ以外の音の判定結果が子
音若しくは雑音或いは無音であることを示しているとき
にはピッチシフトを行わないようにピッチシフト回路3
7を制御し、一方、比較回路33からの比較結果が「高
い」若しくは「低い」を示しているときで且つ、母音又
はそれ以外の音の判定結果が母音であることを示してい
るときにはピッチシフトを行うようにピッチシフト回路
37を制御する。
【0099】これにより、ピッチシフト回路37から
は、歌唱者等の声のピッチに合った伴奏音のデータが出
力され、この伴奏音のデータは図示しないアンプ等を介
し、端子38からスピーカ等に送られる。
【0100】図16には、この図15のカラオケ装置の
判定制御回路36における処理のフローチャートを示
す。
【0101】図16において、ステップS21では、ヒ
ストグラムの最瀕値とその周辺の値を取り込む。
【0102】次のステップS22では、ヒストグラムの
最瀕値とその周辺の値を比較する。例えば前述の図6の
ヒストグラムを例に挙げて説明すると、最瀕値は193
サンプル分の時間間隔が11回であり、その周辺である
192サンプル分の時間間隔は5回、194サンプル分
の時間間隔は7回となっている。したがって、例えば閾
値が5回であれば最瀕値(11回)の周辺の値(5回及
び7回)は当該閾値以上に大きいことになり、当該フレ
ームは母音であると判断できる。逆に、閾値が例えば6
回や7回以上の値であれば、その区間(フレーム)は子
音、雑音或いは無音であると判断できる。
【0103】ステップS22において、最瀕値の周辺の
値が閾値以上であると判断したときにはステップS23
の処理に進み、閾値より小さいと判断したときにはステ
ップS24の処理に進む。
【0104】ステップS23では、その区間(フレー
ム)が母音であると判定する。
【0105】一方、ステップS24では、その区間は子
音、雑音若しくは無音であると判定する。
【0106】ステップS23の処理後はステップS25
の処理に進み、ステップS24の処理後はステップS2
7の処理に進む。
【0107】ステップS25では、比較回路33の比較
結果が「高い」又は「低い」を示しているか否かを判断
する。このステップS25において、比較結果が「高
い」又は「低い」を示しているときにはステップS26
に進み、「正しい」を示しているときにはステップS2
7に進む。
【0108】ステップS26では、ピッチシフト回路3
7におけるピッチシフト処理を行うように制御し、ステ
ップS27では、ピッチシフト回路37におけるピッチ
シフト処理を行わないように制御する。
【0109】その後、ステップS28では、次のフレー
ムの処理に移行する。
【0110】なお、この第4の実施の形態では、第1,
第2の実施の形態におけるヒストグラムを母音等の判定
の際に使用した例を挙げたが、例えばフレーム内の全て
のローカルマキシマムMA間及びローカルミニマムMI
間の時間間隔から生成したヒストグラムや、音声信号の
零交差(いわゆるゼロクロス)間の時間間隔から生成し
たヒストグラムを使用して母音等の判定を行うようにす
ることも可能である。
【0111】第3や第4の実施の形態では、専用のカラ
オケ装置を例に挙げたが、いわゆるパーソナルコンピュ
ータにて本発明のピッチ検出装置を実現することも可能
である。
【0112】パーソナルコンピュータに本発明を適用し
た第5の実施の形態の概略構成例を図17に示す。本実
施の形態のパーソナルコンピュータは、第1〜第4の実
施の形態の動作を実現するためのアプリケーションデー
タをインストールすることで、第1〜第4の実施の形態
にて説明した検出装置、カラオケ装置の何れの動作も可
能であるが、以下の説明ではその一例として、第3の実
施の形態で述べたような音のピッチの判定機能と第4の
実施の形態で述べたピッチシフトの機能を備えたカラオ
ケ装置をパーソナルコンピュータにて実現する例を挙げ
て説明する。
【0113】この図17において、I/Oポート59
は、例えば外部通信回線と接続される外部端子であり、
このI/Oポート59及び通信回線を介して、後述する
外部のサーバやいわゆる通信カラオケ用放送センタ等に
接続可能となっている。I/Oポート59はI/F回路
60と接続されている。なお、通信カラオケとは、通信
カラオケ用放送センタに複数の楽曲のデータを蓄積して
おき、この放送センタに複数接続されている遠隔地の端
末装置に必要に応じて楽曲のデータを送信して、端末装
置で楽曲の演奏(再生)を可能とするシステムのことで
ある。したがって、この第5の実施の形態ではパーソナ
ルコンピュータを例に挙げたが、該通信カラオケにおけ
る端末装置であってもよい。
【0114】このI/F回路60は、I/Oポート59
を介した外部通信回線と、内部CPU(中央処理ユニッ
ト)54との間のインターフェイスである。
【0115】ここで、本実施の形態のパーソナルコンピ
ュータにて、第3や第4の実施の形態のカラオケ装置の
動作を実現する場合、I/Oポート59には、該パーソ
ナルコンピュータからのデータ要求に応じて、カラオケ
用MIDIデータや第3,第4の実施の形態の動作を実
現するためのアプリケーションデータ(以下、カラオケ
用アプリケーションデータと呼ぶ)が通信回線を介して
供給される。なお、カラオケ用アプリケーションデータ
は、前述した各実施の形態のフィルタ3のデジタルフィ
ルタ係数設定用データや、ピークサーチ回路5における
ピーク検出動作制御用プログラムデータ(ゼロクロス検
出を行う場合にはそのゼロクロス検出動作制御用プログ
ラムデータ)、符号データ化回路6における符号データ
化制御用プログラムデータ、データ分析回路7における
データ分析制御用プログラムデータ、ピッチ決定回路8
におけるピッチ決定動作制御用プログラムデータ、MI
DI基準音抽出回路31における基準ピッチ検出動作用
プログラムデータ、比較回路33における比較制御用プ
ログラムデータ、判定制御回路36における判定制御用
プログラムデータ、ピッチシフト回路37におけるピッ
チシフト用プログラムデータ等を、少なくとも有するも
のである。
【0116】これらカラオケ用MIDIデータやカラオ
ケ用アプリケーションデータは、I/F回路60を介し
てCPU54に送られ、一旦、ハードディスクドライブ
(HDD)56内のハードディスクに記録される。
【0117】なお、カラオケ用MIDIデータやカラオ
ケ用アプリケーションデータは、通信回線ではなく、例
えばいわゆるCD−ROM等の光ディスクやフロッピィ
ディスクに記録された状態で本実施の形態のパーソナル
コンピュータに供給される場合もある。この場合は、該
光ディスクやフロッピィディスクがディスクドライブ6
1に装填され、このディスクドライブ61にて読み出さ
れてCPU54に送られる。もちろん、光ディスクやフ
ロッピィディスクから読み出されたカラオケ用MIDI
データやカラオケ用アプリケーションデータをハードデ
ィスクドライブ56に送って記録させることも可能であ
る。本実施の形態では、データ転送速度を考慮して、カ
ラオケ用MIDIデータやカラオケ用アプリケーション
データをハードディスクドライブ56に記録することと
する。
【0118】CPU54は、例えばマウスやキーボード
からなる操作部55からの操作に応じて、パーソナルコ
ンピュータの全体の動作を制御するものであり、本実施
の形態のようにパーソナルコンピュータをカラオケ装置
として動作させる場合には、先ず、ハードディスクドラ
イブ56に記録(インストール)されたカラオケ用アプ
リケーションデータを読み出し、信号処理回路53に送
る。
【0119】一方、端子50はアナログ音声信号の外部
入力端子であり、この端子50を介して、歌唱者の声を
マイクロホンにて音響/電気変換したアナログ音声信号
が供給される。このアナログ音声信号は、アナログ/デ
ジタル変換器51にてデジタル信号に変換され、信号処
理回路53に送られる。
【0120】信号処理回路53は、第1〜第4の実施の
形態にて説明した各種処理を、カラオケ用アプリケーシ
ョンデータに基づいてソフトウェア上で実現可能な高速
演算処理回路であり、したがって、本実施の形態のよう
にパーソナルコンピュータを第3や第4の実施の形態の
カラオケ装置として動作させた場合、当該信号処理回路
53は、図10のフィルタ回路3及びMIDI基準音抽
出回路31以降の各構成要素、図15の判定制御回路3
6やピッチシフト回路37の構成要素として動作する。
もちろん、信号処理回路53では、カラオケ装置として
通常備えている歌詞やイメージ映像を表示する為の画像
データを生成することも可能である。
【0121】メモリ52は、信号処理回路53での信号
処理に必要なデータや演算途中のデータ、生成した画像
データ等を一時的に蓄えるためのメモリであり、図1の
バッファメモリ4としての機能をも備える。
【0122】信号処理回路53にて第3,第4の実施の
形態の画像データ生成回路34のように生成された画像
データは端子62からモニタに送られ、また、端子50
を介して入力され、アナログ/デジタル変換器51にて
デジタル信号に変換された歌唱者の声や伴奏曲の音声信
号は、デジタル/アナログ(D/A)変換器57にてア
ナログ音声信号に戻され、音声出力端子58から出力さ
れ、スピーカ等に送られる。
【0123】次に、図18には、第6の実施の形態とし
て、外部からの要求に応じてカラオケ用MIDIデータ
やカラオケ用アプリケーションデータを伝送するデータ
伝送装置の概略構成を示す。
【0124】すなわち、第6の実施の形態の伝送装置
は、例えば第5の実施の形態のパーソナルコンピュータ
や通信カラオケ用端末装置に対して、カラオケ用MID
Iデータやカラオケ用アプリケーションデータを伝送す
る、サーバ或いは通信カラオケ用放送センタに適用可能
である。
【0125】この図18において、MIDI格納部70
にはカラオケ用の複数の楽曲のMIDIデータが格納さ
れ、送信プログラム格納部71には予め作成されたカラ
オケ用アプリケーションデータが格納されており、それ
ぞれバスに接続されている。なお、ここではMIDIデ
ータ及びカラオケ用アプリケーションデータがMIDI
格納部70及び送信プログラム格納部71に格納された
例を挙げているが、これらMIDIデータ及びカラオケ
用アプリケーションデータはCD−ROM等の光ディス
クやフロッピィディスクに記録されていてもよく、この
場合の光ディスクやフロッピィディスクは、バスに接続
されたディスクドライブ74に装填される。
【0126】ROM72及びRAM73、並びにハード
ディスクドライブ80は、バスを介してCPU79と接
続され、これらROM72、RAM73、ハードディス
クドライブ80は、CPU79が本実施の形態の伝送装
置を制御する際の各種データを格納或いは記憶するため
のものである。
【0127】I/Oポート78は、外部通信回線と接続
される外部端子であり、このI/Oポート78及び通信
回線を介して、例えば第5の実施の形態のパーソナルコ
ンピュータや通信カラオケ端末装置に接続可能となって
いる。I/Oポート78はI/F回路77と接続されて
いる。
【0128】このI/F回路77は、I/Oポート78
を介した外部通信回線と、内部送受信データ処理回路7
6との間のインターフェイスである。
【0129】以下、この図19のフローチャートを参照
しながら、図18の伝送装置がMIDIデータやカラオ
ケ用アプリケーションデータを通信回線に送信する流れ
を説明する。なお、図19のフローチャートでは、通常
のデータ通信にて行われる、接続管理やトラフィック管
理、さらに情報収集や料金徴収等については省略してい
る。
【0130】この図19のフローチャート及び図18の
伝送装置において、先ず、ステップS51では、外部通
信回線を介して、MIDIデータやカラオケ用アプリケ
ーションデータの送信要求を受信すると、その送信要求
は、送受信データ処理回路76を介してCPU79に送
られる。
【0131】CPU79は、送信要求を受け取ると、ス
テップS52にてカラオケ用アプリケーションデータを
送信プログラム格納部71から読み出し、次いでステッ
プS53にて該送信要求にて要求されている楽曲のMI
DIデータをMIDI格納部70から読み出す。
【0132】これら読み出されたMIDIデータ及びカ
ラオケ用アプリケーションデータは、送受信データ処理
回路76に転送される。この送受信データ処理回路76
では、MIDIデータ及びカラオケ用アプリケーション
データを例えばパケット化し、さらにクロック発振器7
5からの搬送波を変調して、I/F回路77に送る。
【0133】これにより、I/F回路77からは、ステ
ップS55にてパケット化されたMIDIデータ及びカ
ラオケ用アプリケーションデータが送信される。
【0134】その後は、ステップS56にて送信完了の
確認を行う。
【0135】なお、この第6の実施の形態では、MID
I格納部70から読み出したMIDIデータと送信プロ
グラム格納部71から読み出したカラオケ用アプリケー
ションデータをパケット化して通信回線から送信した
が、これらMIDIデータとカラオケ用アプリケーショ
ンデータを、記録可能な光ディスクやフロッピィディス
クに記録し、それら記録可能な光デジタルやフロッピィ
ディスクを利用者に提供することも可能である。この場
合は、MIDI格納部70から読み出したMIDIデー
タと送信プログラム格納部71から読み出したカラオケ
用アプリケーションデータを、例えばディスクドライブ
74に送り、このディスクドライブ74にて記録可能な
光ディスクやフロッピィディスクに記録する。
【0136】ここまでの説明では、本発明を例えばカラ
オケ装置等に適用する例を説明したが、その他、レコー
ディングスタジオにおいて、決められた編集時間内にそ
の編集時間よりも僅かに長い音楽や音声を入れ込む際に
も本発明を適用することが可能である。すなわち、該編
集作業時には、音声信号のピッチ周波数を変更する処理
を行うことになるが、このピッチ周波数の変更に先だっ
て音声信号のピッチ(ピッチ周波数)を検出することが
必要であり、当該ピッチ周波数検出に本発明を適用でき
る。
【0137】
【発明の効果】請求項1に記載の本発明に係るピッチ検
出装置は、音声信号波形から複数の極大点と極小点を検
出し、単位時間内の複数の極大点の中から振幅の絶対値
が最大となる極大点を求め、単位時間内の複数の極小点
の中から振幅の絶対値が最大となる極小点を求め、最大
の極大点に対して振幅が所定の範囲内に入る極大点を求
め、最大の極小点に対して振幅が所定の範囲内に入る極
小点を求め、所定の範囲内に入る各極大点間でそれぞれ
時間間隔を求め、所定の範囲内に入る各極小点間でそれ
ぞれ時間間隔を求め、時間間隔のヒストグラムを共通の
ものとして求め、ヒストグラムの最瀕値を音声信号のピ
ッチとして取り出すようにしているため、音声信号の相
関を求めることなく、その音声波形の特徴から少ない演
算量でピッチを検出可能である。
【0138】請求項2に記載の本発明に係るピッチ検出
装置は、音声信号波形から複数の極大点と極小点を検出
し、単位時間内の複数の極大点の中から振幅の絶対値が
最大となる極大点を求め、単位時間内の複数の極小点の
中から振幅の絶対値が最大となる極小点を求め、最大の
極大点に対して振幅が所定の範囲よりも大きい極大点を
求め、最大の極大点に対して振幅が所定の範囲よりも小
さい極大点を求め、最大の極小点に対して振幅が所定の
範囲よりも大きい極小点を求め、最大の極小点に対して
振幅が所定の範囲よりも小さい極小点を求め、所定の範
囲よりも大きい各極大点間でそれぞれ時間間隔を求め、
所定の範囲よりも小さい各極大点間でそれぞれ時間間隔
を求め、所定の範囲よりも大きい各極小点間でそれぞれ
時間間隔を求め、所定の範囲よりも小さい各極小点間で
それぞれ時間間隔を求め、時間間隔のヒストグラムを共
通のものとして求め、ヒストグラムの最瀕値を前記音声
信号のピッチとして取り出すようにしているため、音声
信号の相関を求めることなく、その音声波形の特徴から
少ない演算量でピッチを検出可能である。
【0139】請求項3に記載の本発明に係るピッチ検出
装置は、ヒストグラムの最瀕値とその周辺の値を比較
し、比較結果に基づいて音声の母音/非母音を判定する
ようにしているため、音声の母音/非母音の判定を小型
の装置及び簡単な処理にて実現できる。
【0140】請求項4に記載の本発明に係る情報媒体
は、音声信号波形から複数の極大点と極小点を検出し、
単位時間内の複数の極大点の中から振幅の絶対値が最大
となる極大点を求め、単位時間内の複数の極小点の中か
ら振幅の絶対値が最大となる極小点を求め、最大の極大
点に対して振幅が所定の範囲内に入る極大点を求め、最
大の極小点に対して振幅が所定の範囲内に入る極小点を
求め、所定の範囲内に入る各極大点間でそれぞれ時間間
隔を求め、所定の範囲内に入る各極小点間でそれぞれ時
間間隔を求め、時間間隔のヒストグラムを共通のものと
して求め、ヒストグラムの最瀕値を音声信号のピッチと
して検出するためのプログラムデータを記録若しくは伝
送し、このプログラムデータを演算装置に供給可能とす
ることで、演算装置において、音声信号の相関を求める
ことなく、その音声波形の特徴から少ない演算量でピッ
チが検出可能となり、さらに歌唱者の声やコーラスの声
の高さを正しい高さに導くことができ、音声の性質変換
を可能とする。
【0141】請求項5に記載の本発明に係る情報媒体
は、音声信号波形から複数の極大点と極小点を検出し、
単位時間内の複数の極大点の中から振幅の絶対値が最大
となる極大点を求め、単位時間内の複数の極小点の中か
ら振幅の絶対値が最大となる極小点を求め、最大の極大
点に対して振幅が所定の範囲よりも大きい極大点を求
め、最大の極大点に対して振幅が所定の範囲よりも小さ
い極大点を求め、最大の極小点に対して振幅が所定の範
囲よりも大きい極小点を求め、最大の極小点に対して振
幅が所定の範囲よりも小さい極小点を求め、所定の範囲
よりも大きい各極大点間でそれぞれ時間間隔を求め、所
定の範囲よりも小さい各極大点間でそれぞれ時間間隔を
求め、所定の範囲よりも大きい各極小点間でそれぞれ時
間間隔を求め、所定の範囲よりも小さい各極小点間でそ
れぞれ時間間隔を求め、時間間隔のヒストグラムを共通
のものとして求め、ヒストグラムの最瀕値を音声信号の
ピッチとして検出するためのプログラムデータを記録若
しくは伝送し、このプログラムデータを演算装置に供給
可能とすることで、演算装置において、音声信号の相関
を求めることなく、その音声波形の特徴から少ない演算
量でピッチが検出可能となり、さらに歌唱者の声やコー
ラスの声の高さを正しい高さに導くことができ、音声の
性質変換を可能とする。
【0142】請求項6に記載の本発明に係る情報媒体
は、ヒストグラムの最瀕値とその周辺の値を比較し、比
較結果に基づいて音声の母音/非母音を判定するための
プログラムデータを記録若しくは伝送し、このプログラ
ムデータを演算装置に供給可能とすることで、演算装置
において、音声の母音/非母音の判定を小型の装置及び
簡単な処理にて実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態のピッチ検出装置の
概略構成を示すブロック図である。
【図2】マイクロホンから入力される原音声信号の波形
を示す波形図である。
【図3】フィルタ回路の周波数特性を示す特性図であ
る。
【図4】フィルタ回路にて低域濾波された後の音声信号
波形と、第1の実施の形態にて音声信号から検出された
ローカルマキシマム及びローカルミニマムを示す波形図
である。
【図5】本発明の第1の実施の形態のピッチ検出装置に
て求めた極大点と極小点を用いた時間間隔の測定の説明
に用いる図である。
【図6】本発明の実施の形態にて求めたヒストグラムの
説明に用いる図である。
【図7】本発明の第1の実施の形態のピッチ検出装置の
動作の流れを示すフローチャートである。
【図8】本発明の第2の実施の形態のピッチ検出装置に
て求めた極大点と極小点を用いた時間間隔の測定の説明
に用いる図である。
【図9】本発明の第2の実施の形態のピッチ検出装置の
動作の流れを示すフローチャートである。
【図10】本発明に係るピッチ検出装置が適用される第
3の実施の形態の判定装置の概略構成を示すブロック図
である。
【図11】本発明の第3の実施の形態の判定装置の動作
説明に用いる図である。
【図12】本発明の第3の実施の形態の判定装置が適用
されるカラオケ装置のモニタ画面の一例を示す図であ
る。
【図13】本発明の第3の実施の形態の判定装置が適用
されるカラオケ装置のモニタ画面の他の例を示す図であ
る。
【図14】本発明の第3の実施の形態の判定装置の動作
の流れを示すフローチャートである。
【図15】本発明に係るピッチ検出装置が適用される第
4の実施の形態の判定装置の概略構成を示すブロック図
である。
【図16】本発明の第4の実施の形態の判定装置の動作
の流れを示すフローチャートである。
【図17】本発明に係るピッチ検出装置が適用される第
5の実施の形態のパーソナルコンピュータの概略構成を
示すブロック図である。
【図18】本発明に係るピッチ検出装置が適用される第
6の実施の形態の伝送装置の概略構成を示すブロック図
である。
【図19】本発明の第6の実施の形態の伝送装置の動作
の流れを示すフローチャートである。
【符号の説明】
2…アナログ/デジタル変換器、3…フィルタ回路、4
…バッファメモリ、5…ピークサーチ回路、6…符号デ
ータ化回路、7…データ分析回路、8…ピッチ検出回
路、32…ピッチ検出装置、33…比較回路、31…M
IDI基準音抽出回路、34…画像データ生成回路、3
6…判定制御回路、37…ピッチシフト回路、51…ア
ナログ/デジタル変換器、52…メモリ、53…信号処
置回路、54…CPU、55…操作部、56…ハードデ
ィスクドライブ、57…デジタル/アナログ変換器、6
0…I/F回路、72…ROM、61…ディスクドライ
ブ、70…MIDI格納部、73…RAM、71…送信
プログラム格納部、74…ディスクドライブ、77…I
/F回路、75…クロック発振器、76…送受信データ
処理回路、80…ハードディスクドライブ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 デジタル入力された音声信号を所定の長
    さの単位時間毎に切り出す単位時間化手段と、 前記音声信号から所望の周波数帯域のみを通過させる帯
    域通過手段と、 前記所望の周波数帯域の音声信号波形から極大点と極小
    点を検出する極大極小点検出手段と、 前記単位時間内の複数の極大点の中から振幅の絶対値が
    最大となる極大点を求める第1の極大点検出手段と、 前記単位時間内の複数の極小点の中から振幅の絶対値が
    最大となる極小点を求める第1の極小点検出手段と、 前記最大の極大点に対して振幅が所定の範囲内に入る極
    大点を求める第2の極大点検出手段と、 前記最大の極小点に対して振幅が所定の範囲内に入る極
    小点を求める第2の極小点検出手段と、 前記所定の範囲内に存在する各極大点間でそれぞれ時間
    間隔を求める極大点間検出手段と、 前記所定の範囲内に存在する各極小点間でそれぞれ時間
    間隔を求める極小点間検出手段と、 前記時間間隔のヒストグラムを共通のものとして求める
    ヒストグラム演算手段と、 前記ヒストグラムの最瀕値を前記音声信号のピッチとし
    て取り出すピッチ取り出し手段とを有することを特徴と
    するピッチ検出装置。
  2. 【請求項2】 デジタル入力された音声信号を所定の長
    さの単位時間毎に切り出す単位時間化手段と、 前記音声信号から所望の周波数帯域のみを通過させる帯
    域通過手段と、 前記所望の周波数帯域の音声信号波形から極大点と極小
    点を検出する極大極小点検出手段と、 前記単位時間内の複数の極大点の中から振幅の絶対値が
    最大となる極大点を求める第1の極大点検出手段と、 前記単位時間内の複数の極小点の中から振幅の絶対値が
    最大となる極小点を求める第1の極小点検出手段と、 前記最大の極大点に対して振幅が所定の範囲よりも大き
    い極大点を求める第2の極大点検出手段と、 前記最大の極大点に対して振幅が所定の範囲よりも小さ
    い極大点を求める第3の極大点検出手段と、 前記最大の極小点に対して振幅が所定の範囲よりも大き
    い極小点を求める第2の極小点検出手段と、 前記最大の極小点に対して振幅が所定の範囲よりも小さ
    い極小点を求める第3の極小点検出手段と、 前記所定の範囲よりも大きい各極大点間でそれぞれ時間
    間隔を求める第1の極大点間検出手段と、 前記所定の範囲よりも小さい各極大点間でそれぞれ時間
    間隔を求める第2の極大点間検出手段と、 前記所定の範囲よりも大きい各極小点間でそれぞれ時間
    間隔を求める第1の極小点間検出手段と、 前記所定の範囲よりも小さい各極小点間でそれぞれ時間
    間隔を求める第2の極小点間検出手段と、 前記時間間隔のヒストグラムを共通のものとして求める
    ヒストグラム演算手段と、 前記ヒストグラムの最瀕値を前記音声信号のピッチとし
    て取り出すピッチ取り出し手段とを有することを特徴と
    するピッチ検出装置。
  3. 【請求項3】 前記ヒストグラムの最瀕値とその周辺の
    値を比較する比較手段と、 前記比較結果に基づいて音声の母音/非母音を判定する
    判定手段とを設けることを特徴とする請求項1または請
    求項2記載のピッチ検出装置。
  4. 【請求項4】 デジタル入力された音声信号を所定の長
    さの単位時間毎に切り出すステップと、 前記音声信号から所望の周波数帯域のみを通過させるス
    テップと、 前記所望の周波数帯域の音声信号波形から複数の極大点
    と極小点を検出するステップと、 前記単位時間内の複数の極大点の中から振幅の絶対値が
    最大となる極大点を求めるステップと、 前記単位時間内の複数の極小点の中から振幅の絶対値が
    最大となる極小点を求めるステップと、 前記最大の極大点に対して振幅が所定の範囲内に入る極
    大点を求めるステップと、 前記最大の極小点に対して振幅が所定の範囲内に入る極
    小点を求めるステップと、 前記所定の範囲内に存在する各極大点間でそれぞれ時間
    間隔を求めるステップと、 前記所定の範囲内に存在する各極小点間でそれぞれ時間
    間隔を求めるステップと、 前記時間間隔のヒストグラムを共通のものとして求める
    ステップと、 前記ヒストグラムの最瀕値を前記音声信号のピッチとし
    て取り出すステップとからなる演算処理を、演算装置に
    対して実行させるプログラムデータを記録、若しくは伝
    送することを特徴とする情報媒体。
  5. 【請求項5】 デジタル入力された音声信号を所定の長
    さの単位時間毎に切り出すステップと、 前記音声信号から所望の周波数帯域のみを通過させるス
    テップと、 前記所望の周波数帯域の音声信号波形から複数の極大点
    と極小点を検出するステップと、 前記単位時間内の複数の極大点の中から振幅の絶対値が
    最大となる極大点を求めるステップと、 前記単位時間内の複数の極小点の中から振幅の絶対値が
    最大となる極小点を求めるステップと、 前記最大の極大点に対して振幅が所定の範囲よりも大き
    い極大点を求めるステップと、 前記最大の極大点に対して振幅が所定の範囲よりも小さ
    い極大点を求めるステップと、 前記最大の極小点に対して振幅が所定の範囲よりも大き
    い極小点を求めるステップと、 前記最大の極小点に対して振幅が所定の範囲よりも小さ
    い極小点を求めるステップと、 前記所定の範囲よりも大きい各極大点間でそれぞれ時間
    間隔を求めるステップと、 前記所定の範囲よりも小さい各極大点間でそれぞれ時間
    間隔を求めるステップと、 前記所定の範囲よりも大きい各極小点間でそれぞれ時間
    間隔を求めるステップと、 前記所定の範囲よりも小さい各極小点間でそれぞれ時間
    間隔を求めるステップと、 前記時間間隔のヒストグラムを共通のものとして求める
    ステップと、 前記ヒストグラムの最瀕値を前記音声信号のピッチとし
    て取り出すステップとからなる演算処理を、演算装置に
    対して実行させるプログラムデータを記録、若しくは伝
    送することを特徴とする情報媒体。
  6. 【請求項6】 少なくとも基準音のピッチデータをも記
    録してなり、 前記演算処理は、前記ヒストグラムの最瀕値とその周辺
    の値を比較するステップと、前記比較結果に基づいて音
    声の母音/非母音を判定するステップとを含むことを特
    徴とする請求項4または請求項5記載の情報媒体。
JP10115659A 1998-04-24 1998-04-24 ピッチ検出装置及び情報媒体 Pending JPH11305794A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10115659A JPH11305794A (ja) 1998-04-24 1998-04-24 ピッチ検出装置及び情報媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10115659A JPH11305794A (ja) 1998-04-24 1998-04-24 ピッチ検出装置及び情報媒体

Publications (1)

Publication Number Publication Date
JPH11305794A true JPH11305794A (ja) 1999-11-05

Family

ID=14668132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10115659A Pending JPH11305794A (ja) 1998-04-24 1998-04-24 ピッチ検出装置及び情報媒体

Country Status (1)

Country Link
JP (1) JPH11305794A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209123A (ja) * 2005-01-28 2006-08-10 Honda Research Inst Europe Gmbh 高調波信号の基本周波数を求める方法
JP2007193294A (ja) * 2005-12-20 2007-08-02 Nippon Telegr & Teleph Corp <Ntt> 予測遅延探索方法、その方法を用いた装置、プログラム、および記録媒体
JP2008197350A (ja) * 2007-02-13 2008-08-28 Yamaha Corp 楽音信号生成装置及びカラオケ装置
JP2009092736A (ja) * 2007-10-04 2009-04-30 Yamaha Corp ピッチ変換装置およびプログラム
US8378198B2 (en) 2010-01-08 2013-02-19 Samsung Electronics Co., Ltd. Method and apparatus for detecting pitch period of input signal

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209123A (ja) * 2005-01-28 2006-08-10 Honda Research Inst Europe Gmbh 高調波信号の基本周波数を求める方法
JP2007193294A (ja) * 2005-12-20 2007-08-02 Nippon Telegr & Teleph Corp <Ntt> 予測遅延探索方法、その方法を用いた装置、プログラム、および記録媒体
JP2008197350A (ja) * 2007-02-13 2008-08-28 Yamaha Corp 楽音信号生成装置及びカラオケ装置
JP2009092736A (ja) * 2007-10-04 2009-04-30 Yamaha Corp ピッチ変換装置およびプログラム
US8378198B2 (en) 2010-01-08 2013-02-19 Samsung Electronics Co., Ltd. Method and apparatus for detecting pitch period of input signal

Similar Documents

Publication Publication Date Title
US7582824B2 (en) Tempo detection apparatus, chord-name detection apparatus, and programs therefor
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
Goto A real-time music-scene-description system: Predominant-F0 estimation for detecting melody and bass lines in real-world audio signals
US5889223A (en) Karaoke apparatus converting gender of singing voice to match octave of song
Marolt A connectionist approach to automatic transcription of polyphonic piano music
US8847056B2 (en) Vocal processing with accompaniment music input
JP4640463B2 (ja) 再生装置、表示方法および表示プログラム
US5703311A (en) Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques
US5939654A (en) Harmony generating apparatus and method of use for karaoke
JP2002116754A (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
WO2009104269A1 (ja) 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体
Marolt SONIC: Transcription of polyphonic piano music with neural networks
US8193436B2 (en) Segmenting a humming signal into musical notes
JP2010025972A (ja) コード名検出装置及びコード名検出用プログラム
CN101093660B (zh) 一种基于双峰值检测的音符切分方法及其装置
JP3996565B2 (ja) カラオケ装置
JP2015082028A (ja) 歌唱合成装置および歌唱合成プログラム
JPH11305794A (ja) ピッチ検出装置及び情報媒体
JP3750533B2 (ja) 波形データ録音装置および録音波形データ再生装置
JP3645364B2 (ja) 周波数検出装置
JPH11175097A (ja) ピッチ検出方法及び装置、判定方法及び装置、データ伝送方法、並びに記録媒体
JP4048249B2 (ja) カラオケ装置
JP2002287744A (ja) 波形データ分析方法、波形データ分析装置およびプログラム
JP3494095B2 (ja) 楽音要素抽出装置及び方法並びに記憶媒体
JP3173310B2 (ja) ハーモニー生成装置