[go: up one dir, main page]

JPH05273964A - Attack time detection device used for automatic music transcription device etc. - Google Patents

Attack time detection device used for automatic music transcription device etc.

Info

Publication number
JPH05273964A
JPH05273964A JP7440992A JP7440992A JPH05273964A JP H05273964 A JPH05273964 A JP H05273964A JP 7440992 A JP7440992 A JP 7440992A JP 7440992 A JP7440992 A JP 7440992A JP H05273964 A JPH05273964 A JP H05273964A
Authority
JP
Japan
Prior art keywords
time
cpu
power spectrum
time series
attack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7440992A
Other languages
Japanese (ja)
Inventor
Shigeaki Komatsu
慈明 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP7440992A priority Critical patent/JPH05273964A/en
Publication of JPH05273964A publication Critical patent/JPH05273964A/en
Pending legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

(57)【要約】 【目的】 本発明はスペクトルの変化を利用することに
より、精度良くアタック時刻の検出ができる装置を提供
することを目的としている。 【構成】 CPUはA/D変換装置により標本化されR
AMに格納されている楽曲信号データに対し一定時間間
隔毎にパワー・スペクトルを算出しパワー・スペクトル
の時系列F1,F2,・・・,FNを算出する(S1)。
次に、CPUは前記パワー・スペクトルに対する時間変
化量の時系列ΔF1,ΔF2,・・・,ΔFNを算出する
(S2)。次に、CPUは各フレーム毎に前記パワー・
スペクトルに対する時間変化量の正の成分の総和を算出
し時系列S1,S2,・・・,SNを算出する(S3)。
次に、CPUは前記時系列S1,S2,・・・,SNの局
所ピークを検出し、前記局所ピークの検出された時刻を
アタック時刻とする(S4)。
(57) [Summary] [Object] An object of the present invention is to provide an apparatus capable of accurately detecting an attack time by utilizing a change in spectrum. [Configuration] The CPU is sampled by an A / D conversion device
A power spectrum is calculated for the music signal data stored in the AM at regular time intervals, and time series F 1 , F 2 , ..., F N of the power spectrum are calculated (S1).
Next, the CPU calculates the time series ΔF 1 , ΔF 2 , ..., ΔF N of the time change amount with respect to the power spectrum (S2). Next, the CPU uses the power
The total of the positive components of the time change amount with respect to the spectrum is calculated to calculate the time series S 1 , S 2 , ..., SN (S3).
Next, the CPU detects the local peaks of the time series S 1 , S 2 , ..., S N and sets the time at which the local peaks are detected as the attack time (S4).

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音響的な楽曲信号に対
して採譜を行なう自動採譜装置に係わり、特に、各音の
立ち上がり時刻(以後、アタック時刻)の検出装置に関
するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an automatic music transcription device for musical notation of an acoustic music signal, and more particularly to a device for detecting the rising time (hereinafter, attack time) of each sound.

【0002】[0002]

【従来の技術】従来、この種の自動採譜装置等に用いら
れるアタック時刻検出装置は、図1に示すように構成さ
れていた。オーディオ・アンプ1は演奏された楽曲信号
を入力とし、この信号を適切な電圧値に増幅する。ロー
パス・フィルター2はオーディオ・アンプ1により増幅
された信号における5.5kHz以下の周波数成分のみを
通過させることにより、標本化時の折返し歪を抑えてい
る。A/D変換装置3はローパス・フィルター通過信号
を、サンプリング周波数12kHz、16ビットのディジ
タル信号に変換する。I/Oポート4はCPU5とA/
D変換装置3、ディスプレイ8とを接続している。CP
U5は楽曲信号データの対数パワーの時間変化量算出処
理、ピーク検出処理等を行ない、RAM6、及びROM
7に接続されている。
2. Description of the Related Art Conventionally, an attack time detection device used for this kind of automatic music notation device has been constructed as shown in FIG. The audio amplifier 1 receives the played music signal as an input and amplifies this signal to an appropriate voltage value. The low-pass filter 2 suppresses aliasing distortion at the time of sampling by passing only the frequency component of 5.5 kHz or less in the signal amplified by the audio amplifier 1. The A / D converter 3 converts the low-pass filtered signal into a 16-bit digital signal with a sampling frequency of 12 kHz. I / O port 4 is connected to CPU 5 and A /
The D conversion device 3 and the display 8 are connected. CP
U5 performs a time variation calculation process of logarithmic power of music signal data, a peak detection process, etc., and a RAM 6 and a ROM.
Connected to 7.

【0003】前記RAM6には、A/D変換装置3によ
り標本化された楽曲信号データ、CPU5により算出さ
れた対数パワーの時間変化量等が格納されるエリアが用
意されている。前記ROM7には、対数パワーの時間変
化量算出ロジック、ピーク検出ロジック等が格納されて
いる。前記ディスプレイ8は処理結果等の表示を行な
う。
The RAM 6 is provided with an area for storing the music signal data sampled by the A / D converter 3 and the time variation of the logarithmic power calculated by the CPU 5. The ROM 7 stores logarithmic power time change amount calculation logic, peak detection logic, and the like. The display 8 displays processing results and the like.

【0004】以下、従来例の動作について図4〜図6を
参照して説明する。
The operation of the conventional example will be described below with reference to FIGS.

【0005】図5は従来例により行なわれる処理を示す
フローチャートである。
FIG. 5 is a flow chart showing the processing performed by the conventional example.

【0006】CPU5は始めに、A/D変換装置3によ
り標本化されRAM6に格納されている楽曲信号データ
1,x2,・・・,xH(Hはデータのサンプル数を示
す)に対して、120ポイント(10msec)間隔に
設定されたフレーム毎に、短時間対数パワーの時系列P
1,P2,・・・,PNを算出する(S51)。
First, the CPU 5 converts the music signal data x 1 , x 2 , ..., X H (H indicates the number of data samples) sampled by the A / D converter 3 and stored in the RAM 6. On the other hand, the time series P of short-time logarithmic power is set for each frame set at 120 point (10 msec) intervals.
1 , P 2 , ..., P N are calculated (S51).

【0007】ここで、短時間対数パワーの時系列算出処
理S51について図6を参照し説明する。まず、CPU
5は楽曲信号データに対して処理を行うフレームの番号
i(以後、フレーム番号)を初期化する(i=0:S6
1)。次に、RAM6に格納されている楽曲信号データ
を入力とし、短時間パワーRiの算出を次式により行う
(S63)。
The short-time logarithmic power time series calculation process S51 will be described with reference to FIG. First, the CPU
5 initializes the frame number i (hereinafter, frame number) for processing the music signal data (i = 0: S6).
1). Next, the music signal data stored in the RAM 6 is input, and the short-time power R i is calculated by the following equation (S63).

【0008】 次に、CPU5は前記短時間パワーRiに対し、次式に
より対数パワーPiを算出し、結果をRAM6に格納す
る(S64)。
[0008] Next, the CPU 5 calculates the logarithmic power P i for the short-time power R i by the following equation and stores the result in the RAM 6 (S64).

【0009】Pi=log(Ri) 次に、CPU5は前記フレーム番号iをインクリメント
し、処理をS62に戻す(S65)。
P i = log (R i ) Next, the CPU 5 increments the frame number i and returns the process to S62 (S65).

【0010】S62では、CPU5は観測位置を示すポ
インター120×iと楽曲信号データのサンプル数Hと
を比較し、120×i>Hの判定が「NO」である場合
以上で説明したS63〜S65の処理を繰り返し、判定
が「YES」である場合に処理S51を終了する(S6
2)。
In S62, the CPU 5 compares the pointer 120xi indicating the observation position with the sample number H of the music signal data, and the judgment of 120xi> H is "NO". S63 to S65 described above. Processing is repeated, and if the determination is “YES”, the processing S51 ends (S6).
2).

【0011】次に、CPU5は前記処理S51で求めら
れ、前記RAM6に格納されている対数パワーの時系列
1、P2,・・・,PNに対する時間変化量の時系列Δ
1,ΔP2,・・・,ΔPNを算出し、RAM6に格納
する(S52)。
[0011] Then, CPU 5 is determined in the processing S51, the time-series P 1, P 2 of the logarithmic power stored in the RAM 6, · · ·, chronological time variation amount with respect to P N delta
P 1 , ΔP 2 , ..., ΔP N are calculated and stored in the RAM 6 (S52).

【0012】次に、CPU5は対数パワーの時間変化量
の時系列ΔP1,ΔP2,・・・,ΔPNの局所ピークを
検出し、局所ピークの検出された時刻をアタック時刻と
する(S53)。
Next, the CPU 5 detects the local peak of the time series ΔP 1 , ΔP 2 , ..., ΔP N of the amount of change in logarithmic power, and sets the time at which the local peak is detected as the attack time (S53). ).

【0013】ここで、局所ピークの検出処理S53につ
いて、図4を使い説明する。まず、CPU5はフレーム
番号iを初期化する(i=0:S41)。
The local peak detection processing S53 will be described with reference to FIG. First, the CPU 5 initializes the frame number i (i = 0: S41).

【0014】次に、CPU5はΔPiが局所ピークであ
るかどうかの判定を行う。判定式は以下のものを使う。
Next, the CPU 5 determines whether ΔP i is a local peak. The following judgment formula is used.

【0015】 ΔPi≧ΔPi-1 AND ΔPi≧△Pi+1 AND ΔPi>(あるしきい値) CPU5は前記判定が「YES」である場合、処理をS
44へ、「NO」である場合、S44をスキップしS4
5へ移行する(S43)。
ΔP i ≧ ΔP i−1 AND ΔP i ≧ ΔP i + 1 AND ΔP i > (certain threshold value) When the determination is “YES”, the CPU 5 executes the process S
44, if "NO", skip S44 and S4
The process proceeds to 5 (S43).

【0016】処理S44ではCPU5は、フレーム番号
iをアタック時刻としてRAM6上の所定のアドレスに
書き込む(S44)。
In process S44, the CPU 5 writes the frame number i as an attack time at a predetermined address on the RAM 6 (S44).

【0017】次に、CPU5はフレーム番号iをインク
リメントし、処理をS42に戻す(i=i+1:S45)。
Next, the CPU 5 increments the frame number i and returns the processing to S42 (i = i + 1: S45).

【0018】S42では、CPU5は全てのフレームに
対してS43〜S45の処理が終了したかどうかの判定
(i>N)を行い、判定が「YES」である場合、全処
理を終了する。
In S42, the CPU 5 determines whether or not the processes of S43 to S45 have been completed for all the frames (i> N). If the determination is "YES", the entire process is completed.

【0019】図7は、処理結果の1例を示す。図7の横
軸はフレーム番号(時間軸)を表わしている。上段のグ
ラフは、前記A/D変換装置3により標本化された楽曲
信号の振幅を縦軸にプロットしたものである。上段にお
いて縦線により印をつけた時刻が、真のアタック時刻で
ある。中段のグラフは、前記処理S52において算出さ
れRAM6に格納されている対数パワーの時間変化量を
縦軸にプロットしたものである。中段において縦線によ
り印をつけた時刻が、従来例により検出されたアタック
時刻である(中段において、横軸に対し水平に引かれた
直線は前記しきい値を示す)。
FIG. 7 shows an example of the processing result. The horizontal axis of FIG. 7 represents the frame number (time axis). The upper graph plots the amplitude of the music signal sampled by the A / D converter 3 on the vertical axis. The time marked by a vertical line in the upper row is the true attack time. The middle graph is a graph in which the amount of change in logarithmic power with time calculated in step S52 and stored in the RAM 6 is plotted on the vertical axis. The time marked with a vertical line in the middle row is the attack time detected by the conventional example (in the middle row, the straight line drawn horizontally with respect to the horizontal axis shows the threshold value).

【0020】[0020]

【発明が解決しようとする課題】しかしながら、上記の
ような自動採譜装置等に用いられるアタック時刻検出装
置においては、楽曲信号の短時間パワーの時間変化量の
ピークを検出することによりアタック時刻の検出を行っ
ていたため、例えば、図7上段に示す2番目のアタック
時刻の様に検出しようとする楽器音の直前の音が強く、
且つ継続時間が長い場合に、検出しようとする楽器音の
アタック時刻における短時間パワーの立ち上がりが完全
に隠されてしまい、その結果アタック時刻が正確に検出
できないという欠点があった(図7中段)。
However, in the attack time detecting device used in the above-mentioned automatic music transcription device or the like, the attack time is detected by detecting the peak of the time change amount of the short time power of the music signal. Since, for example, the sound immediately before the instrument sound to be detected is strong like the second attack time shown in the upper part of FIG. 7,
Moreover, when the duration is long, the short-time power rise at the attack time of the musical instrument sound to be detected is completely hidden, and as a result, the attack time cannot be detected accurately (the middle part of FIG. 7). ..

【0021】本発明は、上述した問題点を解決するもの
で、スペクトルの変化を利用することにより、精度良く
アタック時刻の検出ができる装置を提供することを目的
としている。
The present invention solves the above-mentioned problems, and an object of the present invention is to provide an apparatus capable of accurately detecting the attack time by utilizing the change in spectrum.

【0022】[0022]

【課題を解決するための手段】この目的を達成するため
に請求項1に記載の発明は、音響的な楽曲信号データに
対し一定時間間隔毎にパワー・スペクトルを算出しパワ
ー・スペクトルの時系列F1,F2,・・・,FN(但し
i={Fi1,Fi2,・・・,FiM}は第iフレームの
パワー・スペクトル、Mは周波数帯域分割数を示す。)
を出力する周波数分析手段と、前記パワー・スペクトル
の時間変化量を算出し時系列ΔF1,ΔF2,・・・,Δ
N(但しΔFi={ΔFi1,ΔFi2,・・・,ΔFiM
は第iフレームのパワー・スペクトルの時間変化量を示
す。)を出力する微分手段と、各フレーム毎に前記パワ
ー・スペクトルの時間変化量の正の成分の総和を次式に
より算出し時系列S1,S2,・・・,SNを出力する手
段と、 但し、max(a,b)はa,bの内小さくない方の値 前記時系列S1,S2,・・・,SNの局所ピークを検出
するピーク検出手段とを備えている。
In order to achieve this object, the invention according to claim 1 calculates a power spectrum for acoustic music signal data at regular time intervals and time series of the power spectrum. F 1 , F 2 , ..., F N (where F i = {F i1 , F i2 , ..., F iM } is the power spectrum of the i-th frame, and M is the frequency band division number).
, And a time-series ΔF 1 , ΔF 2 , ..., Δ for calculating the time variation of the power spectrum.
F N (However, ΔF i = {ΔF i1 , ΔF i2 , ..., ΔF iM }
Indicates the time variation of the power spectrum of the i-th frame. ) And a means for outputting the time series S 1 , S 2 , ..., SN by calculating the sum of the positive components of the time change amount of the power spectrum for each frame by the following equation. When, However, max (a, b) comprises a, value the time series of whichever not smaller of b S 1, S 2, ··· , and a peak detection means for detecting the local peak of the S N.

【0023】[0023]

【作用】上記の構成を有する本発明の周波数分析手段
は、音響的な楽曲信号データに対し一定時間間隔毎にパ
ワー・スペクトルを算出しパワー・スペクトルの時系列
1,F2,・・・,FNを出力する。微分手段は前記パ
ワー・スペクトルの時間変化量を算出し時系列ΔF1
ΔF2,・・・,ΔFNを出力する。時系列S1,S2,・
・・,SN算出手段は、各フレーム毎に前記パワー・ス
ペクトルの時間変化量の正の成分の総和を次式により算
出し時系列S1,S2,・・・,SNを出力す 但し、max(a,b)はa,bの内小さくない方の値 ピーク検出手段は前記時系列S1,S2,・・・,SN
局所ピークを検出し、局所ピークの検出された時刻をア
タック時刻とし出力する。
The frequency analyzing means of the present invention having the above configuration calculates the power spectrum for the acoustic music signal data at regular time intervals and calculates the power spectrum time series F 1 , F 2 ,. , F N are output. The differentiating means calculates the time change amount of the power spectrum to obtain a time series ΔF 1 ,
Outputs ΔF 2 , ..., ΔF N. Time series S 1 , S 2 , ...
.., S N calculation means calculates the sum of the positive components of the time change amount of the power spectrum for each frame by the following equation and outputs time series S 1 , S 2 , ..., S N. However, max (a, b) is the smaller value of a and b. The peak detection means detects the local peaks of the time series S 1 , S 2 , ..., SN , and the local peaks are detected. The output time is output as the attack time.

【0024】[0024]

【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0025】図1は本実施例による自動採譜装置のブロ
ック図である。本実施例を構成するオーディオ・アンプ
1は演奏された楽曲信号を入力とし、この信号を適切な
電圧値に増幅する。ローパス・フィルター2はオーディ
オ・アンプ1により増幅された信号における5.5kHz
以下の周波数成分のみを通過させることにより、標本化
時の折返し歪を抑えている。A/D変換装置3はローパ
ス・フィルター通過信号を、サンプリング周波数12kH
z、16ビットのディジタル信号に変換する。I/Oポ
ート4はCPU5と、A/D変換装置3、ディスプレイ
8とを接続している。CPU5は楽曲信号データの周波
数分析処理、ピーク検出処理等を行ない、RAM6、及
びROM7に接続されている。前記RAM6にはA/D
変換装置3により標本化された楽曲信号データ、CPU
5により処理された周波数分析結果、CPU5により検
出されたアタック時刻等が格納されるエリアが用意され
ている。前記ROM7には周波数分析ロジック、ピーク
検出ロジック等が格納されている。前記ディスプレイ8
は処理結果等の表示を行なう。
FIG. 1 is a block diagram of an automatic music transcription device according to this embodiment. The audio amplifier 1 constituting the present embodiment receives the played music signal as an input and amplifies this signal to an appropriate voltage value. Low-pass filter 2 is 5.5kHz in the signal amplified by audio amplifier 1.
The aliasing distortion at the time of sampling is suppressed by passing only the following frequency components. The A / D converter 3 passes the low-pass filter signal to a sampling frequency of 12 kHz.
Convert to z, 16-bit digital signal. The I / O port 4 connects the CPU 5, the A / D conversion device 3, and the display 8. The CPU 5 performs frequency analysis processing of music signal data, peak detection processing, and the like, and is connected to the RAM 6 and the ROM 7. The RAM 6 has an A / D
Music signal data sampled by the converter 3, CPU
An area for storing the frequency analysis result processed by the CPU 5, the attack time detected by the CPU 5, and the like is prepared. The ROM 7 stores frequency analysis logic, peak detection logic and the like. The display 8
Displays the processing result.

【0026】以下、本実施例の動作について図2〜図4
を参照して説明する。
The operation of this embodiment will be described below with reference to FIGS.
Will be described.

【0027】図2は本実施例により行なわれる処理を示
すフローチャートである。
FIG. 2 is a flow chart showing the processing performed by this embodiment.

【0028】CPU5は始めに、A/D変換装置3によ
り標本化されRAM6に格納されている楽曲信号データ
1,x2,・・・,xH(Hはデータのサンプル数)に
対して、120ポイント(10msec)間隔に設定さ
れたフレーム毎に、短時間対数パワー・スペクトルの時
系列F1,F2,・・・,FNを算出する(S1)。
First, the CPU 5 responds to the music signal data x 1 , x 2 , ..., X H (H is the number of data samples) sampled by the A / D converter 3 and stored in the RAM 6. , for each frame set at 120 points (10 msec) intervals, the time series F 1, F 2 of the short-time log power spectrum, ..., and calculates the F N (S1).

【0029】ここで、短時間対数パワー・スペクトルの
時系列算出処理S1について図3を参照し説明する。ま
ず、CPU5は楽曲信号データに対して処理を行うフレ
ームの番号i(以後、フレーム番号)を初期化する(i=
0:S31)。次に、RAM6に格納されている楽曲信
号データを入力とし、短時間スペクトルQi={Qi1
i2,・・・,QiM:Mは周波数帯域分割数を示す。}
を次式に示す離散フーリエ変換より算出する。
Here, the short-time logarithmic power spectrum time series calculation process S1 will be described with reference to FIG. First, the CPU 5 initializes a frame number i (hereinafter referred to as a frame number) for processing music signal data (i =
0: S31). Next, using the music signal data stored in the RAM 6 as an input, the short-time spectrum Q i = {Q i1 ,
Q i2 , ..., Q iM : M indicates the number of frequency band divisions. }
Is calculated by the discrete Fourier transform represented by the following equation.

【0030】 但し、m=1,2,・・・,M 本実施例においては、M=256とした(S33)。[0030] However, m = 1, 2, ..., M In this embodiment, M = 256 (S33).

【0031】次に、CPU5はS33で算出された前記
短時間スペクトルに対し、次式により対数パワー・スペ
クトルFi={Fi1,Fi2,・・・,FiM}を算出し、
結果をRAM6に格納する(S34)。
Next, the CPU 5 calculates a logarithmic power spectrum F i = {F i1 , F i2 , ..., F iM } for the short time spectrum calculated in S33 by the following equation,
The result is stored in the RAM 6 (S34).

【0032】Fim=log(|Qim2) 但し、m=1,2,・・・,M 次に、CPU5は前記フレーム番号iをインクリメント
し、処理をS32に戻す(S35)。
F im = log (| Q im | 2 ) where m = 1, 2, ..., M Next, the CPU 5 increments the frame number i and returns the process to S32 (S35).

【0033】S32では、CPU5は観測位置を示すポ
インター120×iと楽曲信号データのサンプル数Hと
を比較し、120×i>Hの判定が「NO」である場合
以上で説明したS33〜S35の処理を繰り返し、判定
が「YES」である場合、短時間対数パワー・スペクト
ル算出処理S1を終了する(S32)。
In S32, the CPU 5 compares the pointer 120 × i indicating the observation position with the sample number H of the music signal data, and the judgment of 120 × i> H is “NO”. S33 to S35 explained above. If the determination is “YES”, the short time logarithmic power spectrum calculation process S1 is ended (S32).

【0034】次に、CPU5は前記処理S1で求めら
れ、前記RAM6に格納されている対数パワー・スペク
トルの時系列F、F2,・・・,FNに対する時間変化
量の時系列ΔF1,ΔF2,・・・,ΔFN(但しΔFi
{ΔFi1,ΔFi2,・・・,ΔFiM}は第iフレームの
パワー・スペクトルの時間変化量を示す。)を算出し、
前記RAM6に格納する。本実施例では時間変化量とし
て、次式の様な7フレーム分の対数パワー・スペクトル
による線形回帰係数を使用している(S2)。
Next, the CPU 5 obtains the time-series ΔF 1 of the time change amount with respect to the time series F 1 , F 2 , ..., F N of the logarithmic power spectrum stored in the RAM 6 obtained in the process S1. , ΔF 2 , ..., ΔF N (where ΔF i =
{ΔF i1 , ΔF i2 , ..., ΔF iM } indicates the time change amount of the power spectrum of the i-th frame. ) Is calculated,
It is stored in the RAM 6. In this embodiment, a linear regression coefficient based on a logarithmic power spectrum for 7 frames is used as the time variation (S2).

【0035】 次に、CPU5は前記処理S2で求められ、前記RAM
6に格納されている対数パワー・スペクトルに対する時
間変化量の時系列ΔF1,ΔF2,・・・,ΔFNに対し
各フレーム毎に正の成分の総和を次式により算出し、時
系列S1,S2,・・・,SNを算出する(S3)。
[0035] Next, the CPU 5 obtains the RAM in the process S2
For the time series ΔF 1 , ΔF 2 , ..., ΔF N of the time variation with respect to the logarithmic power spectrum stored in 6, the sum of the positive components is calculated for each frame by the following formula, and the time series S 1 , S 2 , ..., SN are calculated (S3).

【0036】 但し、max(a,b)はa,bの内小さくない方の値 次に、CPU5は前記時系列S1,S2,・・・,SN
局所ピークを検出し、局所ピークの検出された時刻をア
タック時刻とする(S4)。
[0036] However, max (a, b) is a value that is not smaller than a and b. Next, the CPU 5 detects the local peaks of the time series S 1 , S 2 , ..., SN , and detects the local peaks. The attacked time is defined as the attacked time (S4).

【0037】ここで、局所ピークの検出処理S4につい
て、図4を使い説明する。まず、CPU5はフレーム番
号iを初期化する(i=0:S41)。
The local peak detection processing S4 will be described with reference to FIG. First, the CPU 5 initializes the frame number i (i = 0: S41).

【0038】次に、CPU5はSiが局所ピークである
かどうかの判定を行う。判定式は以下のものを使う。
Next, the CPU 5 determines whether or not S i is a local peak. The following judgment formula is used.

【0039】 Si≧Si-1 AND Si≧Si+1 AND Si>(あるしきい値) CPU5は前記判定が「YES」である場合処理をS4
4へ、「NO」である場合S44をスキップしS45へ
移行する(S43)。
S i ≧ S i−1 AND S i ≧ S i + 1 AND S i > (certain threshold value) The CPU 5 executes the process in S4 when the determination is “YES”.
If "NO", go to S4 and proceed to S45 (S43).

【0040】CPU5は、処理がS44に移行した場
合、フレーム番号iをアタック時刻としてRAM6上の
所定のアドレスに書き込む(S44)。
When the process proceeds to S44, the CPU 5 writes the frame number i as the attack time at a predetermined address on the RAM 6 (S44).

【0041】次に、CPU5はフレーム番号iをインク
リメントし、処理をS42に戻す(i=i+1:S45)。
Next, the CPU 5 increments the frame number i and returns the processing to S42 (i = i + 1: S45).

【0042】S42では、CPU5は全てのフレームに
対してS43〜S45の処理が終了したかどうかの判定
(i>N)を行い、判定が「NO」である場合S43〜
S45の処理を繰り返し、判定が「YES」である場
合、全処理を終了する(S42)。
In S42, the CPU 5 determines whether or not the processes of S43 to S45 have been completed for all the frames (i> N), and if the determination is "NO", S43 to S43.
If the determination is “YES” by repeating the process of S45, all the processes are finished (S42).

【0043】図7は、処理結果の1例を示す。図7の横
軸はフレーム番号(時間軸)を表わしている。上段のグ
ラフは、前記A/D変換装置3により標本化された楽曲
信号の振幅を縦軸にプロットしたものである。上段にお
いて縦線により印をつけた時刻が、真のアタック時刻で
ある。下段のグラフは、前記処理S3において算出され
RAM6に格納されている時系列S1,S2,・・・,S
Nを縦軸にプロットしたものである。下段において縦線
により印をつけた時刻が、本実施例により検出されたア
タック時刻であり、2番目のアタック時刻に対しても検
出されていることが分かる(下段において、横軸に対し
水平に引かれた直線は前記しきい値を示す)。
FIG. 7 shows an example of the processing result. The horizontal axis of FIG. 7 represents the frame number (time axis). The upper graph plots the amplitude of the music signal sampled by the A / D converter 3 on the vertical axis. The time marked by a vertical line in the upper row is the true attack time. The lower graph shows the time series S 1 , S 2 , ..., S calculated in the process S3 and stored in the RAM 6.
N is plotted on the vertical axis. It can be seen that the time marked with a vertical line in the lower row is the attack time detected by this embodiment, and is also detected for the second attack time (in the lower row, horizontally with respect to the horizontal axis). The drawn straight line indicates the threshold value).

【0044】本発明は、以上詳述した構成に限定される
ものではなく、その主旨を逸脱しない範囲において種々
の変更を加えることができる。
The present invention is not limited to the configuration described in detail above, and various modifications can be made without departing from the spirit of the invention.

【0045】[0045]

【発明の効果】以上説明したことから明かなように、本
発明の自動採譜装置等に用いられるアタック時刻検出装
置によれば、音響的な楽曲信号データに対し一定時間間
隔毎にパワー・スペクトルを算出しパワー・スペクトル
の時系列F1,F2,・・・,FNを出力する周波数分析
手段と、前記パワー・スペクトルの時間変化量を算出し
時系列ΔF1,ΔF2,・・・,ΔFNを出力する微分手
段と、各フレーム毎に前記パワー・スペクトルの時間変
化量の正の成分の総和を次式により算出し時系列S1
2,・・・,SNを出力する手段と、 但し、max(a,b)はa,bの内小さくない方の値 前記時系列S1,S2,・・・,SNの局所ピークを検出
するピーク検出手段とを有し、前記局所ピークの検出さ
れた時刻をアタック時刻とすることにより、精度良くア
タック時刻を検出することができる。
As is apparent from the above description, according to the attack time detection device used in the automatic music transcription device or the like of the present invention, the power spectrum is obtained at regular time intervals with respect to the acoustic music signal data. Frequency analysis means for calculating and outputting time series F 1 , F 2 , ..., F N of the power spectrum, and time series ΔF 1 , ΔF 2 , ... For calculating the time change amount of the power spectrum. , ΔF N and a sum of positive components of the time variation of the power spectrum is calculated for each frame by the following equation to obtain a time series S 1 ,
Means for outputting S 2 , ..., SN , However, max (a, b) has a, value the time series of whichever not smaller of b S 1, S 2, ··· , and a peak detection means for detecting the local peak of the S N, the local By setting the time at which the peak is detected as the attack time, it is possible to detect the attack time with high accuracy.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は、本発明の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing a configuration of the present invention.

【図2】図2は、本発明の動作を示すフローチャートで
ある。
FIG. 2 is a flowchart showing the operation of the present invention.

【図3】図3は、本発明の周波数分析処理の動作を示す
フローチャートである。
FIG. 3 is a flowchart showing the operation of the frequency analysis processing of the present invention.

【図4】図4は、ピーク検出処理の動作を示すフローチ
ャートである。
FIG. 4 is a flowchart showing an operation of peak detection processing.

【図5】図5は、従来例の動作を示すフローチャートで
ある。
FIG. 5 is a flowchart showing an operation of a conventional example.

【図6】図6は、従来例の対数パワー算出処理の動作を
示すフローチャートである。
FIG. 6 is a flowchart showing the operation of a conventional logarithmic power calculation process.

【図7】図7は、アタック時刻検出処理結果を示す説明
図である。
FIG. 7 is an explanatory diagram showing an attack time detection processing result.

【符号の説明】[Explanation of symbols]

1 オーディオ・アンプ 2 ローパス・フィルター 3 A/D変換装置 5 CPU 8 ディスプレイ 1 Audio amplifier 2 Low pass filter 3 A / D converter 5 CPU 8 Display

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 音響的な楽曲信号データに対し一定時間
間隔毎にパワー・スペクトルを算出しパワー・スペクト
ルの時系列F1,F2,・・・,FN(但しFi={Fi1
i2,・・・,FiM}は第iフレームのパワー・スペク
トル、Mは周波数帯域分割数を示す。)を出力する周波
数分析手段と、前記パワー・スペクトルの時間変化量を
算出し時系列ΔF1,ΔF2,・・・,ΔFN(但しΔFi
={ΔFi1,ΔFi2,・・・,ΔFiM}は第iフレーム
のパワー・スペクトルの時間変化量を示す。)を出力す
る微分手段と、各フレーム毎に前記パワー・スペクトル
の時間変化量の正の成分の総和を次式により算出し時系
列S1,S2,・・・,SNを出力する手段と、 但し、max(a,b)はa,bの内小さくない方の値 前記時系列S1,S2,・・・,SNの局所ピークを検出
するピーク検出手段とを有し、前記局所ピークの検出さ
れた時刻をアタック時刻とすることを特徴とする自動採
譜装置等に用いられるアタック時刻検出装置。
1. A power spectrum for acoustic music signal data is calculated at regular time intervals, and time series of power spectrum F 1 , F 2 , ..., F N (where F i = {F i1
F i2 , ..., F iM } indicates the power spectrum of the i-th frame, and M indicates the number of frequency band divisions. ), And a time series ΔF 1 , ΔF 2 , ..., ΔF N (however, ΔF i
= {ΔF i1 , ΔF i2 , ..., ΔF iM } indicates the time variation of the power spectrum of the i-th frame. ) And a means for outputting the time series S 1 , S 2 , ..., SN by calculating the sum of the positive components of the time change amount of the power spectrum for each frame by the following equation. When, However, max (a, b) has a, value the time series of whichever not smaller of b S 1, S 2, ··· , and a peak detection means for detecting the local peak of the S N, the local An attack time detection device used in an automatic music transcription device or the like, wherein an attack time is a time at which a peak is detected.
JP7440992A 1992-03-30 1992-03-30 Attack time detection device used for automatic music transcription device etc. Pending JPH05273964A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7440992A JPH05273964A (en) 1992-03-30 1992-03-30 Attack time detection device used for automatic music transcription device etc.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7440992A JPH05273964A (en) 1992-03-30 1992-03-30 Attack time detection device used for automatic music transcription device etc.

Publications (1)

Publication Number Publication Date
JPH05273964A true JPH05273964A (en) 1993-10-22

Family

ID=13546369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7440992A Pending JPH05273964A (en) 1992-03-30 1992-03-30 Attack time detection device used for automatic music transcription device etc.

Country Status (1)

Country Link
JP (1) JPH05273964A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6801898B1 (en) 1999-05-06 2004-10-05 Yamaha Corporation Time-scale modification method and apparatus for digital signals
US6835885B1 (en) 1999-08-10 2004-12-28 Yamaha Corporation Time-axis compression/expansion method and apparatus for multitrack signals
WO2005081222A1 (en) * 2004-02-20 2005-09-01 Kabushiki Kaisha Kawai Gakki Seisakusho Device for judging music sound of natural musical instrument played according to a performance instruction, music sound judgment program, and medium containing the program
JP2005234303A (en) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd Performance sound determination device, performance sound determination program, and medium recording the program
JP2008518270A (en) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド Method, system and computer program product for detecting notes in an audio signal

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6801898B1 (en) 1999-05-06 2004-10-05 Yamaha Corporation Time-scale modification method and apparatus for digital signals
US6835885B1 (en) 1999-08-10 2004-12-28 Yamaha Corporation Time-axis compression/expansion method and apparatus for multitrack signals
WO2005081222A1 (en) * 2004-02-20 2005-09-01 Kabushiki Kaisha Kawai Gakki Seisakusho Device for judging music sound of natural musical instrument played according to a performance instruction, music sound judgment program, and medium containing the program
JP2005234303A (en) * 2004-02-20 2005-09-02 Kawai Musical Instr Mfg Co Ltd Performance sound determination device, performance sound determination program, and medium recording the program
JP4492932B2 (en) * 2004-02-20 2010-06-30 株式会社河合楽器製作所 Performance sound determination device, performance sound determination program, and medium recording the program
JP2008518270A (en) * 2004-10-29 2008-05-29 ゼンフ・ステューディオズ,インコーポレイテッド Method, system and computer program product for detecting notes in an audio signal

Similar Documents

Publication Publication Date Title
JP2948739B2 (en) Karaoke system user's song scorer
WO2007010638A1 (en) Automatic music transcriptor and program
JP2557201B2 (en) Rotating device inspection device and rotating device inspection method
JP5077847B2 (en) Reverberation time estimation apparatus and reverberation time estimation method
JPH05273964A (en) Attack time detection device used for automatic music transcription device etc.
CN202454260U (en) Speech assessment device utilizing dynamic normalized digital features
JP2932996B2 (en) Harmonic pitch detector
JPH0527751A (en) Tempo extraction device used for automatic music transcription device
JP3232112B2 (en) Measure boundary time extraction device
JP3139803B2 (en) Impulse response measurement device
JPH05127668A (en) Automatic transcription device
JP3611291B2 (en) Loudness evaluation system for unsteady noise
JPH055760Y2 (en)
JP3321841B2 (en) Pitch frequency estimation method and device
JP4760179B2 (en) Voice feature amount calculation apparatus and program
JPH01151400A (en) Method and device for measuring harmonic distortion of speaker
JP2806048B2 (en) Automatic transcription device
JPH0627940A (en) Automatic music transcription device
JP3145955B2 (en) Audio waveform processing device
KR970010947B1 (en) Karaoke scoring system
JP3664812B2 (en) Distortion rate measuring method and apparatus
JP2000097759A (en) Sound field measuring device, its method, and computer readable record medium storing sound field analysis program
JPH04323696A (en) Automatic music transcriber
JP2643202B2 (en) Detection device for steady, transient and uncertain parts of input speech
JPS6138528A (en) Measuring device for reverberation time