JPH07244498A - Basic frequency extractor - Google Patents
Basic frequency extractorInfo
- Publication number
- JPH07244498A JPH07244498A JP3340894A JP3340894A JPH07244498A JP H07244498 A JPH07244498 A JP H07244498A JP 3340894 A JP3340894 A JP 3340894A JP 3340894 A JP3340894 A JP 3340894A JP H07244498 A JPH07244498 A JP H07244498A
- Authority
- JP
- Japan
- Prior art keywords
- fundamental frequency
- voice
- harmonic
- input
- autocorrelation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
(57)【要約】
【目的】 A−b−S手法を導入して、正確な基本周波
数を抽出する。
【構成】 入力音声自己相関関数算出器15で算出した
入力音声の自己相関関数と合成音声自己相関関数算出器
17で算出した合成音声の自己相関関数を誤差算出器1
6により比較し、周波数調整器13で基本周波数を調整
していくことで基本周波数抽出する。
(57) [Abstract] [Purpose] The A-B-S method is introduced to extract an accurate fundamental frequency. An error calculator 1 calculates an autocorrelation function of input speech calculated by the input speech autocorrelation function calculator 15 and an autocorrelation function of synthesized speech calculated by the synthesized speech autocorrelation function calculator 17.
6, and the fundamental frequency is adjusted by the frequency adjuster 13 to extract the fundamental frequency.
Description
【0001】[0001]
【産業上の利用分野】本発明は、ディジタル移動通信な
どに利用し、音声信号を分析および合成する際に必要と
なる基本周波数抽出装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a fundamental frequency extraction device which is used in digital mobile communication or the like and is required when analyzing and synthesizing a voice signal.
【0002】[0002]
【従来の技術】近年、音声信号を分析及び合成する技術
は、データ伝送・蓄積媒体を効率的に活用する情報圧縮
の基礎技術として注目されている。中でも、音声信号の
分析合成処理において重要なパラメータである基本周波
数を誤りなく抽出する基本周波数抽出装置は合成音声の
品質を向上する上で、広く求められている。2. Description of the Related Art In recent years, a technique of analyzing and synthesizing a voice signal has been attracting attention as a basic technique of information compression which efficiently utilizes a data transmission / storage medium. Above all, a fundamental frequency extraction device that extracts a fundamental frequency, which is an important parameter in the analysis and synthesis processing of a speech signal, without error is widely required in order to improve the quality of synthesized speech.
【0003】以下、従来の基本周波数抽出装置について
説明する。図17は、従来の基本周波数抽出装置のブロ
ック図を示す。図17において、41は音声を入力する
音声入力器である。42は自己相関算出器であり、入力
された音声の自己相関関数を算出する。43は誤差関数
算出器であり、求められた自己相関から基本周波数とし
ての確からしさを求める。誤差関数算出器43で求めら
れた誤差関数は、バッファ44にnフレーム分(nは任
意)蓄積される。45は基本周波数抽出器であり、蓄積
されている誤差関数値の和が最小となる周波数を抽出す
る。A conventional fundamental frequency extraction device will be described below. FIG. 17 shows a block diagram of a conventional fundamental frequency extraction device. In FIG. 17, reference numeral 41 is a voice input device for inputting voice. An autocorrelation calculator 42 calculates the autocorrelation function of the input voice. Reference numeral 43 denotes an error function calculator, which obtains the certainty as a fundamental frequency from the obtained autocorrelation. The error function obtained by the error function calculator 43 is accumulated in the buffer 44 for n frames (n is arbitrary). Reference numeral 45 is a fundamental frequency extractor, which extracts the frequency at which the sum of the accumulated error function values is the minimum.
【0004】以上のように構成され基本周波数抽出装置
において、音声入力器41により入力された音声から自
己相関算出器42で自己相関関数が求められる。求めら
れた自己相関関数に基づいて図18に示す誤差関数が誤
差関数算出器43によって求められる。また、図19
(a)に示すように、フレーム毎に求められた誤差関数
はバッファ44にnフレーム蓄積され、この関数の和が
最小となるように推移する図19(b)に示す基本周波
数を基本周波数抽出器45により抽出する。In the fundamental frequency extraction device configured as described above, the autocorrelation calculator 42 obtains the autocorrelation function from the voice input by the voice input device 41. The error function calculator 43 calculates the error function shown in FIG. 18 based on the calculated autocorrelation function. In addition, FIG.
As shown in (a), the error function obtained for each frame is accumulated in the buffer 44 for n frames, and the fundamental frequency extracted from the fundamental frequency shown in FIG. 19 (b) is changed so that the sum of these functions is minimized. It is extracted by the device 45.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上記の
ような従来の基本周波数抽出装置では、入力された音声
信号の位相情報を考慮せずに音声信号を分析・合成する
システムの場合、入力音声信号の波形と合成音声の波形
は、図20および図21に示すように全く異なるため、
これらの波形を直接比較することができず、抽出された
基本周波数の妥当性を確認することが困難である。特に
真の基本周波数に対して整数倍の周波数(倍ピッチ)や
整数分の一の周波数(半ピッチ)を基本周波数として、
誤って抽出することが多いという問題を有していた。However, in the conventional fundamental frequency extraction device as described above, in the case of a system for analyzing and synthesizing an audio signal without considering the phase information of the input audio signal, the input audio signal Since the waveform of and the waveform of the synthesized voice are completely different as shown in FIGS. 20 and 21,
Since it is not possible to directly compare these waveforms, it is difficult to confirm the validity of the extracted fundamental frequency. Especially, the frequency that is an integral multiple of the true fundamental frequency (double pitch) or the frequency that is an integral fraction (half pitch) is the basic frequency,
It had a problem that it was often mistakenly extracted.
【0006】本発明は上記従来の問題を解決するもので
あり、いかなる音声分析合成手法を用いた音声合成器に
おいても正確な基本周波数を抽出する基本周波数抽出装
置を提供することを目的とする。The present invention solves the above-mentioned conventional problems, and an object of the present invention is to provide a fundamental frequency extraction device for extracting an accurate fundamental frequency in a speech synthesizer using any speech analysis and synthesis method.
【0007】また、本発明は高調波周波数毎に音声を合
成するシステムに対して、倍ピッチ、半ピッチ誤りを避
けることを可能とした優れた基本周波数抽出装置を提供
することを目的とする。Another object of the present invention is to provide an excellent fundamental frequency extraction device capable of avoiding double-pitch and half-pitch errors in a system that synthesizes voice for each harmonic frequency.
【0008】[0008]
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、音声を入力する音声入力器と、
前記入力された音声の自己相関関数を算出する入力音声
自己相関算出器と、前記入力された音声の周期を分析し
初期基本周波数を求める初期基本周波数分析器と、前記
初期基本周波数を誤差算出器の出力によって調整し基本
周波数を定める基本周波数調整装置と、前記基本周波数
に従って音声を分析・合成する音声分析合成装置と、前
記合成音声の自己相関関数を算出する合成音声自己相関
算出器と、前記入力音声および合成音声の自己相関関数
の誤差を算出する誤差算出器とを備えてなる構成にし
た。In order to achieve the above object, the invention of claim 1 is a voice input device for inputting voice,
An input speech autocorrelation calculator that calculates an autocorrelation function of the input speech, an initial fundamental frequency analyzer that analyzes the period of the input speech to obtain an initial fundamental frequency, and an error calculator that calculates the initial fundamental frequency. A fundamental frequency adjusting device that determines a fundamental frequency by adjusting the output of the device, a speech analysis and synthesis device that analyzes and synthesizes speech according to the fundamental frequency, a synthesized speech autocorrelation calculator that calculates an autocorrelation function of the synthesized speech, An error calculator for calculating an error of the autocorrelation function of the input voice and the synthesized voice is provided.
【0009】また、請求項2の発明は、前記音声合成手
段が基本周波数に基づいて周波数を高調波帯域に分割す
る高調波帯域分割器と、前記分割された高調波毎に高調
波の振幅を求める高調波振幅算出器と、前記算出された
振幅に従い高調波毎に信号を生成する高調波音源発生器
とから構成され、前記入力音声自己相関算出器と前記合
成音声自己相関算出器とを、前記高調波音源発生器で生
成された全ての高調波を加算することによって第1の合
成音声を生成する第1の高調波音源合成器と、得られた
高調波音源のうち基本周波数を除いた高調波音源を加算
することによって第2の合成音声を生成する第2の高調
波音源合成器とに置き換えてなるものである。[0009] According to a second aspect of the present invention, the voice synthesizing means divides a frequency into harmonic bands based on a fundamental frequency, and a harmonic amplitude for each of the divided harmonics. A harmonic amplitude calculator to be obtained, and a harmonic sound source generator that generates a signal for each harmonic according to the calculated amplitude, the input speech autocorrelation calculator and the synthesized speech autocorrelation calculator, A first harmonic sound source synthesizer that generates a first synthesized voice by adding all the harmonics generated by the harmonic sound source generator, and a fundamental frequency of the obtained harmonic sound source is removed. This is replaced with a second harmonic sound source synthesizer that generates a second synthesized voice by adding harmonic sound sources.
【0010】[0010]
【作用】上記請求項1の構成により、入力音声信号の位
相情報を考慮せずに音声を分析・合成するために入力音
声と合成音声を直接比較することができないシステムに
おいても、自己相関関数を比較することによって抽出さ
れた基本周波数を補正することができる。そして、この
ようなA−b−S手法(合成による分析法)を導入した
閉ループ構造を用いることで、入力音声に最も近い基本
周波数を抽出することができる。According to the structure of claim 1, even in a system in which the input voice and the synthesized voice cannot be directly compared to analyze and synthesize the voice without considering the phase information of the input voice signal, the autocorrelation function is The extracted fundamental frequency can be corrected by comparing. Then, the fundamental frequency closest to the input voice can be extracted by using a closed loop structure in which such an A-B-S method (analysis method by synthesis) is introduced.
【0011】また、請求項2の構成により、入力音声信
号が高城ろ波されている場合、抽出された基本周波数を
基準として分析した周波数特性を持つ合成音声と、この
合成音声から基本周波数成分だけを取り除いた周波数特
性をもつ合成音声の自己相関関数を比較することによっ
て、倍ピッチ、半ピッチ誤りを検出することが可能とな
り、さらに正確な基本周波数を抽出することができる。According to the structure of claim 2, when the input voice signal is filtered by Takashiro, only the synthesized voice having the frequency characteristic analyzed with the extracted fundamental frequency as a reference and the fundamental frequency component from this synthesized voice. By comparing the autocorrelation functions of the synthesized speech having the frequency characteristics with the removed, it is possible to detect double pitch and half pitch errors, and it is possible to extract a more accurate fundamental frequency.
【0012】[0012]
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.
【0013】図1において、11は音声を入力する音声
入力器、12は基本周波数分析器であり、入力音声を分
析して以降の処理における基本周波数の初期値を求め
る。13は周波数調整器であり、基本周波数分析器12
から得られた基本周波数を初期値として、誤差算出器1
6からの出力に応じて調整する。14は音声分析合成器
であり、周波数調整器13により定められた基本周波数
に基づいて音声信号を分析し合成音声を生成する。15
は入力音声自己相関関数算出器であり、入力音声の自己
相関関数を算出する。In FIG. 1, 11 is a voice input device for inputting voice, and 12 is a fundamental frequency analyzer, which analyzes the input voice and obtains an initial value of a fundamental frequency in the subsequent processing. Reference numeral 13 is a frequency adjuster, which is a fundamental frequency analyzer 12
Error calculator 1 with the fundamental frequency obtained from
Adjust according to the output from 6. Reference numeral 14 is a voice analysis / synthesis device, which analyzes a voice signal based on the fundamental frequency determined by the frequency adjuster 13 to generate a synthetic voice. 15
Is an input speech autocorrelation function calculator, which calculates an autocorrelation function of the input speech.
【0014】誤差算出器16は、その誤差算出関数によ
って入力音声自己相関関数算出器15から得られる入力
音声の自己相関関数と、合成音声自己相関関数算出器1
7から得られる合成音声の自己相関関数との誤差を算出
する。合成音声自己相関関数算出器17では、音声分析
合成器14により生成された合成音声の自己相関関数を
求める。The error calculator 16 calculates the input speech autocorrelation function obtained from the input speech autocorrelation function calculator 15 by the error calculation function and the synthesized speech autocorrelation function calculator 1.
The error from the autocorrelation function of the synthetic speech obtained from 7 is calculated. The synthetic speech autocorrelation function calculator 17 obtains the autocorrelation function of the synthetic speech generated by the speech analysis / synthesis unit 14.
【0015】図2は、高調波周波数帯域毎に音声信号を
分析・合成するシステムを用いることによって倍ピッチ
誤りを検出することを可能とする音声分析合成器の構成
を示すブロック図である。FIG. 2 is a block diagram showing the arrangement of a voice analysis / synthesis device that enables detection of double-pitch errors by using a system for analyzing / synthesizing voice signals for each harmonic frequency band.
【0016】図2において、13は周波数調整器であ
り、入力音声信号を分析する際の基本周波数を調整す
る。22は高調波帯域分割器であり、周波数調整器13
で定められた基本周波数に基づいて周波数帯域を分割す
る。23は高調波振幅算出器であり、高調波帯域分割器
22によって分割された周波数帯域毎に高調波スペクト
ルの振幅を算出し、その振幅値および高調波周波数に基
づいて各高調波周波数毎の音源を高調波音源生成器24
で生成する。25は第1の高調波音源合成器であり、高
調波音源生成器24で得られる音源を全て加算して合成
音声aを生成し 合成音声aの自己相関関数aを第1の
自己相関関数算出器26で求める。In FIG. 2, reference numeral 13 is a frequency adjuster, which adjusts the fundamental frequency when analyzing the input voice signal. 22 is a harmonic band divider, which is a frequency adjuster 13
The frequency band is divided based on the fundamental frequency defined in. Reference numeral 23 is a harmonic amplitude calculator, which calculates the amplitude of the harmonic spectrum for each frequency band divided by the harmonic band divider 22, and based on the amplitude value and the harmonic frequency, the sound source for each harmonic frequency. The harmonic source generator 24
Generate with. Reference numeral 25 denotes a first harmonic sound source synthesizer, which adds all the sound sources obtained by the harmonic sound source generator 24 to generate a synthetic speech a. Obtained with the vessel 26.
【0017】27は第2の高調波音源合成器であり、高
調波音源生成器24で得られる音源のうち、基本周波数
音源を除く全ての音源を加算して合成音声bを生成し、
この合成音声bの自己相関関数bを第2の自己相関関数
算出器28で求める。29は誤差算出器であり、自己相
関関数aと自己相関関数bを比較し、周波数調整器13
で定められた基本周波数が倍ピッチであるか否かを判定
する。Reference numeral 27 denotes a second harmonic sound source synthesizer, which adds all the sound sources except the fundamental frequency sound source among the sound sources obtained by the harmonic sound source generator 24 to generate a synthesized voice b,
The autocorrelation function b of the synthesized voice b is obtained by the second autocorrelation function calculator 28. An error calculator 29 compares the autocorrelation function a and the autocorrelation function b, and the frequency adjuster 13
It is determined whether or not the fundamental frequency defined in step 2 is a double pitch.
【0018】以上のように構成された本実施例の基本周
波数抽出装置について、その動作を説明する。The operation of the fundamental frequency extraction device of this embodiment constructed as described above will be described.
【0019】図1において、音声入力器11により入力
された図3に示す音声信号から基本周波数分析器12に
よって以降の処理における基本周波数の初期値が求めら
れる。周波数調整器13では、得られた初期値を基準に
して、音声合成器11で音声信号を分析する際に用いる
基本周波数を定める。音声分析合成器14では、定めら
れた基本周波数に基づいて音声信号を分析し図5に示す
ような合成音声を生成する。入力音声自己相関関数算出
器15によって、図4に示す入力音声の自己相関関数を
算出し、合成音声自己相関関数算出器17によって、図
5に示す合成音声の自己相関関数(図6参照)を求め
る。これらの入力音声、および合成音声の自己相関関数
の誤差を誤差算出器16によって求め、誤差が最小とな
る基本周波数に周波数調整器13により基本周波数を調
整する。In FIG. 1, the fundamental frequency analyzer 12 obtains the initial value of the fundamental frequency in the subsequent processing from the speech signal shown in FIG. The frequency adjuster 13 determines the basic frequency used when the voice synthesizer 11 analyzes the voice signal based on the obtained initial value. The voice analysis / synthesis unit 14 analyzes the voice signal based on the determined fundamental frequency to generate a synthetic voice as shown in FIG. The input speech autocorrelation function calculator 15 calculates the input speech autocorrelation function shown in FIG. 4, and the synthetic speech autocorrelation function calculator 17 calculates the synthesized speech autocorrelation function (see FIG. 6) shown in FIG. Ask. The error of the autocorrelation function of the input voice and the synthesized voice is obtained by the error calculator 16, and the fundamental frequency is adjusted by the frequency adjuster 13 to the fundamental frequency at which the error is minimized.
【0020】次に、高調波周波数帯域毎に音声信号を分
析・合成するシステムを用いることによって倍ピッチ誤
りを検出する場合の動作について、図7の流れ図および
図8〜図12を参照して説明する。Next, the operation in the case of detecting the double pitch error by using the system for analyzing and synthesizing the voice signal for each harmonic frequency band will be described with reference to the flowchart of FIG. 7 and FIGS. 8 to 12. To do.
【0021】まず、図7のステップ31において、基本
周波数抽出アルゴリズムの終了条件(flag←0、し
きい値Em)を設定する。次のステップ32では周波数
調整器13により、入力音声信号を分析する際の基本周
波数を設定する。このときの入力音声のパワー・スペク
トルと基本周波数を図8に示す。ここで定められた周波
数に基づいて周波数帯域を基本高調波帯域分割器22で
図9に示すように分割する(ステップ33)。高調波振
幅算出器23では、分割された周波数帯域毎に、それぞ
れの高調波スペクトルの振幅を算出する(ステップ3
4)。この振幅値および高調波周波数に基づいて各高調
波周波数毎の音源を高調波音源生成器24で図10に示
すように生成する。(ステップ36)。得られた高調波
音源から次の2種類の合成音声を求める。First, in step 31 of FIG. 7, the end condition (flag ← 0, threshold value Em) of the fundamental frequency extraction algorithm is set. In the next step 32, the frequency adjuster 13 sets the fundamental frequency for analyzing the input audio signal. FIG. 8 shows the power spectrum and fundamental frequency of the input voice at this time. Based on the frequency determined here, the frequency band is divided by the fundamental harmonic band divider 22 as shown in FIG. 9 (step 33). The harmonic amplitude calculator 23 calculates the amplitude of each harmonic spectrum for each of the divided frequency bands (step 3).
4). Based on this amplitude value and the harmonic frequency, the harmonic sound source generator 24 generates a sound source for each harmonic frequency as shown in FIG. (Step 36). The following two types of synthesized speech are obtained from the obtained harmonic sound source.
【0022】まず、第1の高調波音源合成器25では、
全ての高調波音源から音声を図11に示すように合成し
(ステップ38)、第2の高調波音源合成器27では、
基本周波数音源を除く全ての音源から音声を図12に示
すように合成する(ステップ39)。ここに得られた2
つの合成音声の自己相関関数を、それぞれの自己相関関
数算出器26、28で求める。(ステップ40、4
1)。First, in the first harmonic sound source synthesizer 25,
Speech is synthesized from all the harmonic sound sources as shown in FIG. 11 (step 38), and in the second harmonic sound source synthesizer 27,
Speech is synthesized from all sound sources except the fundamental frequency sound source as shown in FIG. 12 (step 39). 2 obtained here
The autocorrelation function of each synthetic speech is obtained by the autocorrelation function calculator 26, 28. (Steps 40, 4
1).
【0023】誤差算出器29では、まず、ステップ42
において、2つの自己相関関数の差eを求め、次のステ
ップ43において、その差eをしきい値Emと比較す
る。最後に、ステップ44で、基本周波数抽出アルゴリ
ズム完了フラグがセットされているか否かを判定する。
ステップ43において、e<Emでないと判定された場
合は、基本周波数抽出アルゴリズム完了フラグを「1」
にセットし、基本周波数調整器13で基本周波数を半分
にし、(ステップ37)、上記プロセスをくり返す。ま
た、ステップ44において、flag=1でないと判定
された場合は、基本周波数調整器13で基本周波数を倍
にし(ステップ37)、上記プロセスを繰り返す。ステ
ップ44が真であれば、ステップ45において基本周波
数を2倍して、抽出した基本周波数とする。In the error calculator 29, first, step 42
In, the difference e between the two autocorrelation functions is obtained, and in the next step 43, the difference e is compared with the threshold value Em. Finally, in step 44, it is determined whether the fundamental frequency extraction algorithm completion flag is set.
When it is determined in step 43 that e <Em is not satisfied, the fundamental frequency extraction algorithm completion flag is set to "1".
, The fundamental frequency adjuster 13 halves the fundamental frequency (step 37), and the above process is repeated. When it is determined in step 44 that flag = 1 is not satisfied, the fundamental frequency adjuster 13 doubles the fundamental frequency (step 37), and the above process is repeated. If step 44 is true, the fundamental frequency is doubled in step 45 to obtain the extracted fundamental frequency.
【0024】図13、図14および図15、図16はス
テップ40、41において、それぞれの自己相関関数算
出器26、28で求められた出力波形を示すもので、図
13、図14は基本周波数が正しく抽出されている場合
において得られる自己相関関数を表し、基本周波数を倍
ピッチで誤った場合において得られる自己相関関数を表
す。図15、図16から明らかなように、倍ピッチ誤り
を起こしたときの自己相関関数は、他と比較し、大きく
異なることがわかる。FIGS. 13, 14 and 15, and 16 show the output waveforms obtained by the autocorrelation function calculators 26 and 28 in steps 40 and 41, respectively, and FIGS. 13 and 14 show the fundamental frequency. Represents the autocorrelation function obtained when is correctly extracted, and the autocorrelation function obtained when the fundamental frequency is erroneous in double pitch. As is apparent from FIGS. 15 and 16, the autocorrelation function when a double pitch error occurs is significantly different from the others.
【0025】上記本実施例による基本周波数抽出装置に
おいては、入力音声と合成音声を直接比較することがで
きない音声分析合成器においても、閉ループを構成しA
−b−S手法を導入することが可能になる点で優れた効
果が得られる。In the fundamental frequency extracting apparatus according to the present embodiment, even in the voice analysis / synthesizer which cannot directly compare the input voice and the synthesized voice, a closed loop is formed.
An excellent effect is obtained in that the -bS method can be introduced.
【0026】また、2種類の合成音声の自己相関関数を
比較することで、基本周波数の倍ピッチ抽出誤りを検出
でき、正確な基本周波数を抽出することができる点で優
れた効果が得られる。Further, by comparing the autocorrelation functions of the two types of synthesized speech, the double pitch extraction error of the fundamental frequency can be detected, and an excellent effect is obtained in that the accurate fundamental frequency can be extracted.
【0027】以上のように本実施例によれば、自己相関
関数算出器を設けることにより、音声分析合成器に依存
することなくA−b−S手法を可能とする閉ループ構成
を導入することができ、正確に基本周波数を抽出するこ
とができる。As described above, according to the present embodiment, by providing the autocorrelation function calculator, it is possible to introduce a closed loop configuration that enables the A-B-S method without depending on the voice analysis / synthesis device. Therefore, the fundamental frequency can be accurately extracted.
【0028】[0028]
【発明の効果】以上のように本発明においては、自己相
関関数算出器を設けることにより、音声合成装置に依存
することなくA−b−S手法を可能とする閉ループ構成
を導入することができ、正確に基本周波数を抽出するこ
とができる優れた基本周波数抽出装置を実現できる。As described above, in the present invention, by providing the autocorrelation function calculator, it is possible to introduce a closed loop configuration that enables the A-B-S method without depending on the speech synthesizer. Therefore, it is possible to realize an excellent fundamental frequency extracting device that can accurately extract the fundamental frequency.
【0029】また、本発明においては、2種類の高調波
音源合成器、および自己相関関数算出器を設けることに
より、基本周波数の倍ピッチ抽出誤りを検出し、正確に
基本周波数を抽出することができる優れた基本周波数抽
出装置を実現できる。Further, in the present invention, by providing two kinds of harmonic sound source synthesizers and an autocorrelation function calculator, a double pitch extraction error of the fundamental frequency can be detected and the fundamental frequency can be accurately extracted. An excellent fundamental frequency extraction device that can be realized can be realized.
【図1】本発明の実施例における基本周波数抽出装置の
ブロック図FIG. 1 is a block diagram of a fundamental frequency extraction device according to an embodiment of the present invention.
【図2】本発明の実施例における音声分析合成器の構成
を示すブロック図FIG. 2 is a block diagram showing a configuration of a voice analysis / synthesis device according to an exemplary embodiment of the present invention.
【図3】本実施例における入力音声の波形図FIG. 3 is a waveform diagram of an input voice in this embodiment.
【図4】本実施例における入力音声の自己相関関数を表
す図FIG. 4 is a diagram showing an autocorrelation function of input speech in the present embodiment.
【図5】本実施例における合成音声の波形図FIG. 5 is a waveform diagram of synthesized speech in this embodiment.
【図6】本実施例における合成音声の自己相関関数を表
す図FIG. 6 is a diagram showing an autocorrelation function of synthesized speech in the present embodiment.
【図7】本実施例における基本周波数抽出装置の動作手
順を示す流れ図FIG. 7 is a flowchart showing an operation procedure of the fundamental frequency extraction device in the present embodiment.
【図8】本実施例における入力音声のパワー・スペクト
ルと基本周波数を表す図FIG. 8 is a diagram showing a power spectrum and a fundamental frequency of input speech in the present embodiment.
【図9】本実施例における基本周波数に基づく高調波帯
域の分割を表す図FIG. 9 is a diagram showing division of a harmonic band based on a fundamental frequency in the present embodiment.
【図10】本実施例における各高調波音源の波形図FIG. 10 is a waveform diagram of each harmonic sound source in this embodiment.
【図11】本実施例における高調波音源合成器25によ
る合成音声の波形図FIG. 11 is a waveform diagram of synthesized speech by the harmonic sound source synthesizer 25 in the present embodiment.
【図12】本実施例における高調波音源合成器27によ
る合成音声の波形図FIG. 12 is a waveform diagram of synthesized speech by the harmonic sound source synthesizer 27 in the present embodiment.
【図13】本実施例における基本周波数が正しいときの
自己相関関数算出器26の出力波形図FIG. 13 is an output waveform diagram of the autocorrelation function calculator 26 when the fundamental frequency is correct in the present embodiment.
【図14】本実施例における基本周波数が正しいときの
自己相関関数算出器28の出力波形図FIG. 14 is an output waveform diagram of the autocorrelation function calculator 28 when the fundamental frequency is correct in the present embodiment.
【図15】本実施例における基本周波数が誤ったときの
自己相関関数算出器26の出力波形図FIG. 15 is an output waveform diagram of the autocorrelation function calculator 26 when the fundamental frequency is incorrect in the present embodiment.
【図16】本実施例における基本周波数が誤ったときの
自己相関関数算出器28の出力波形図FIG. 16 is an output waveform diagram of the autocorrelation function calculator 28 when the fundamental frequency is incorrect in the present embodiment.
【図17】従来の基本周波数抽出装置のブロック図FIG. 17 is a block diagram of a conventional fundamental frequency extraction device.
【図18】従来の誤差関数を表す説明図FIG. 18 is an explanatory diagram showing a conventional error function.
【図19】従来の累積誤差と基本周波数を表す説明図FIG. 19 is an explanatory diagram showing a conventional accumulated error and a fundamental frequency.
【図20】従来の入力信号の波形を示す図FIG. 20 is a diagram showing a waveform of a conventional input signal.
【図21】従来の合成音声信号の波形を示す図FIG. 21 is a diagram showing a waveform of a conventional synthesized speech signal.
11 音声入力器 12 基本周波数分析器 13 周波数調整器 14 音声分析合成器 15 入力音声自己相関関数算出器 16 誤差算出器 17 合成音声自己相関関数算出器 22 高調波帯域分割器 23 高調波振幅算出器 24 高調波音源生成器 25 第1の高調波音源合成器 26 第1の自己相関関数算出器 27 第2の高調波音源合成器 28 第2の自己相関関数算出器 29 誤差算出器 41 音声入力器 42 自己相関算出器 43 誤差関数算出器 44 バッファ 45 基本周波数抽出器 11 voice input device 12 fundamental frequency analyzer 13 frequency adjuster 14 voice analysis synthesizer 15 input voice autocorrelation function calculator 16 error calculator 17 synthetic voice autocorrelation function calculator 22 harmonic band divider 23 harmonic amplitude calculator 24 Harmonic Source Generator 25 First Harmonic Source Synthesizer 26 First Autocorrelation Function Calculator 27 Second Harmonic Source Synthesizer 28 Second Autocorrelation Function Calculator 29 Error Calculator 41 Voice Input Device 42 autocorrelation calculator 43 error function calculator 44 buffer 45 fundamental frequency extractor
Claims (2)
力された音声の自己相関関数を算出する入力音声自己相
関算出手段と、前記入力された音声の周期を分析し初期
基本周波数を求める初期基本周波数分析手段と、前記初
期基本周波数を誤差算出手段の出力によって調整し基本
周波数を定める基本周波数調整装置と、前記基本周波数
に従って音声を分析・合成する音声分析合成装置と、前
記合成音声の自己相関関数を算出する合成音声自己相関
算出手段と、前記入力音声および合成音声の自己相関関
数の誤差を算出する誤差算出手段とを備える基本周波数
抽出装置。1. A voice input means for inputting voice, an input voice autocorrelation calculating means for calculating an autocorrelation function of the input voice, and an initial stage for obtaining an initial fundamental frequency by analyzing a cycle of the input voice. A fundamental frequency analyzing means, a fundamental frequency adjusting device for determining the fundamental frequency by adjusting the initial fundamental frequency by the output of the error calculating means, a voice analysis / synthesizing device for analyzing and synthesizing a voice according to the fundamental frequency, and a self-synthesizing voice A fundamental frequency extraction device comprising: synthetic speech autocorrelation calculation means for calculating a correlation function; and error calculation means for calculating an error of the autocorrelation function of the input speech and the synthesized speech.
て周波数を高調波帯域に分割する高調波帯域分割手段
と、前記分割された高調波毎に高調波の振幅を求める高
調波振幅算出手段と、前記算出された振幅に従い高調波
毎に信号を生成する高調波音源発生手段とから構成さ
れ、前記入力音声自己相関算出手段と前記合成音声自己
相関算出手段とを、前記高調波音源発生手段で生成され
た全ての高調波を加算することによって第1の合成音声
を生成する第1の高調波音源合成手段と、得られた高調
波音源のうち基本周波数を除いた高調波音源を加算する
ことによって第2の合成音声を生成する第2の高調波音
源合成手段とに置き換えてなる請求項1記載の基本周波
数抽出装置。2. A harmonic band dividing means for dividing the frequency into harmonic bands based on a fundamental frequency by the voice synthesizing means, and a harmonic amplitude calculating means for obtaining an amplitude of the harmonic for each of the divided harmonics. A harmonic sound source generating means for generating a signal for each harmonic according to the calculated amplitude, and the input sound autocorrelation calculating means and the synthesized sound autocorrelation calculating means are First harmonic sound source synthesizing means for generating a first synthesized voice by adding all generated harmonic waves, and adding a harmonic sound source excluding the fundamental frequency of the obtained harmonic sound sources The fundamental frequency extraction device according to claim 1, wherein the fundamental frequency extraction device is replaced with a second harmonic sound source synthesizing means for generating a second synthetic voice.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3340894A JPH07244498A (en) | 1994-03-03 | 1994-03-03 | Basic frequency extractor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3340894A JPH07244498A (en) | 1994-03-03 | 1994-03-03 | Basic frequency extractor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07244498A true JPH07244498A (en) | 1995-09-19 |
Family
ID=12385776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3340894A Pending JPH07244498A (en) | 1994-03-03 | 1994-03-03 | Basic frequency extractor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07244498A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4755585B2 (en) * | 2003-03-31 | 2011-08-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method for complex frequency extraction of frequency and time domains for speech signals, distributed speech recognition system and computer readable medium |
CN103337244A (en) * | 2013-05-20 | 2013-10-02 | 北京航空航天大学 | Outlier modification algorithm in isolate syllable fundamental frequency curve |
-
1994
- 1994-03-03 JP JP3340894A patent/JPH07244498A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4755585B2 (en) * | 2003-03-31 | 2011-08-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Method for complex frequency extraction of frequency and time domains for speech signals, distributed speech recognition system and computer readable medium |
CN103337244A (en) * | 2013-05-20 | 2013-10-02 | 北京航空航天大学 | Outlier modification algorithm in isolate syllable fundamental frequency curve |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6691083B1 (en) | Wideband speech synthesis from a narrowband speech signal | |
US10430154B2 (en) | Tonal/transient structural separation for audio effects | |
CN102568474B (en) | Signal processing apparatus and signal processing method | |
US5774836A (en) | System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator | |
US20080288258A1 (en) | Method and apparatus for speech analysis and synthesis | |
Zhou et al. | Music onset detection based on resonator time frequency image | |
KR20140080429A (en) | Apparatus and Method for correcting Audio data | |
JP2012226106A (en) | Music-piece section detection device and method, program, recording medium, and music-piece signal detection device | |
US8073687B2 (en) | Audio regeneration method | |
Ganseman et al. | Source separation by score synthesis | |
Liao et al. | EVA-GAN: Enhanced various audio generation via scalable generative adversarial networks | |
JP2016006536A (en) | Complex acoustic resonance speech analysis system | |
US4845753A (en) | Pitch detecting device | |
JPH07244498A (en) | Basic frequency extractor | |
EP1436805A1 (en) | 2-phase pitch detection method and appartus | |
US10636438B2 (en) | Method, information processing apparatus for processing speech, and non-transitory computer-readable storage medium | |
JP2003140671A (en) | Mixed sound separation device | |
US7366661B2 (en) | Information extracting device | |
KR20020084199A (en) | Linking of signal components in parametric encoding | |
de León et al. | A complex wavelet based fundamental frequency estimator in singlechannel polyphonic signals | |
Martin et al. | Exemplar-based Assignment of Large Missing Audio Parts using String Matching on Tonal Features. | |
JP2003076385A (en) | Method and device for signal analysis | |
JP3521821B2 (en) | Musical sound waveform analysis method and musical sound waveform analyzer | |
JP2806048B2 (en) | Automatic transcription device | |
Simsek et al. | Frequency estimation for monophonical music by using a modified VMD method |