JPH0944186A - Noise suppressor - Google Patents
Noise suppressorInfo
- Publication number
- JPH0944186A JPH0944186A JP7194580A JP19458095A JPH0944186A JP H0944186 A JPH0944186 A JP H0944186A JP 7194580 A JP7194580 A JP 7194580A JP 19458095 A JP19458095 A JP 19458095A JP H0944186 A JPH0944186 A JP H0944186A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- onset
- time
- signal
- offset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Noise Elimination (AREA)
Abstract
(57)【要約】
【目的】 雑音が混在した音響信号から雑音を抑制する
雑音抑制装置を提供する。
【構成】 信号の時間分割手段100は入力信号を短時
間セグメントに分割しピッチ抽出手段200は入力信号
のピッチを抽出する。周波数帯域分割手段400は短時
間信号を周波数分割しエネルギーまたは実効値の算出手
段600は周波数分割手段の出力のエネルギーまたは実
効値を算出する。特徴量の算出手段800は特徴量を計
算し重み値の算出手段900は信号の重み値を算出す
る。乗算手段910は入力信号の周波数と重み値を乗算
し総和手段930は乗算手段910の出力を時間と周波
数にわたり総和する。
(57) [Abstract] [Purpose] To provide a noise suppression device that suppresses noise from an acoustic signal in which noise is mixed. A signal time division means 100 divides an input signal into short time segments, and a pitch extraction means 200 extracts the pitch of the input signal. The frequency band dividing means 400 frequency-divides the short time signal, and the energy or effective value calculating means 600 calculates the energy or effective value of the output of the frequency dividing means. The feature amount calculation means 800 calculates the feature amount, and the weight value calculation means 900 calculates the signal weight value. The multiplying means 910 multiplies the frequency of the input signal by the weight value, and the summing means 930 sums the output of the multiplying means 910 over time and frequency.
Description
【0001】[0001]
【産業上の利用分野】本発明は、音声などの音響信号の
周波数成分を人間の聴覚特性をもちいて重み付けするこ
とにより、雑音が混在した音響信号から目的音を抽出装
置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus for extracting a target sound from an audio signal containing noise by weighting the frequency components of the audio signal such as voice using human auditory characteristics.
【0002】[0002]
【従来の技術】複数の信号が混合した音響信号や雑音が
混在する音響信号からひとつの音響信号だけを取り出す
技術は数種にわたる。例えば、複数のマイクロフォンを
配列しマイクロフォンに到達する信号の時間差や位相
差、レベル差を利用して信号を分離するものもある。特
開平1-118900はその一例である。図1はこの従来の雑音
抑圧装置の構成図を示すものであり、1は音声信号入力
用の接話マイク、2は雑音成分信号入力用のセンサマイ
ク、3及び4はローパスフィルタ、5はバンドパスフィ
ルタバンク、10iから10Nは雑音除去回路、11i
から11Nは位相差検出補正回路、12iから12Nは
レベル差検出補正回路である。バンドパスフィルタバン
クにより分析された時間信号とそれを整流平滑したスペ
クトル信号を用いて雑音の除去を行うものである。しか
し、この手法ではモノーラルの信号に複数の音響信号が
混在する時には信号の分離ができない。また、雑音の性
質や信号の性質が既知の場合櫛形フィルタや自己相関を
用いた信号分離も試みられている。しかし、混在信号が
既知でない時この手法では信号の分離ができない。2. Description of the Related Art There are several types of techniques for extracting only one acoustic signal from acoustic signals in which a plurality of signals are mixed and acoustic signals in which noise is mixed. For example, there is a method in which a plurality of microphones are arranged and the signals are separated by utilizing the time difference, phase difference, and level difference of the signals reaching the microphones. Japanese Patent Laid-Open No. 1-118900 is one example. FIG. 1 is a block diagram of this conventional noise suppressor, in which 1 is a close-talking microphone for inputting a voice signal, 2 is a sensor microphone for inputting a noise component signal, 3 and 4 are low-pass filters, and 5 is a band. Pass filter bank, 10i to 10N are noise elimination circuits, 11i
To 11N are phase difference detection and correction circuits, and 12i to 12N are level difference detection and correction circuits. Noise is removed by using a time signal analyzed by a bandpass filter bank and a spectrum signal obtained by rectifying and smoothing the time signal. However, this method cannot separate signals when a plurality of acoustic signals are mixed in a monaural signal. In addition, when noise properties and signal properties are known, signal separation using comb filters and autocorrelation has also been attempted. However, when the mixed signal is not known, this method cannot separate the signals.
【0003】ところで、最近音の知覚的な側面に注目し
て音響信号の分離が試みられている。このような手法は
モノーラル信号に複数の信号が混在しているときでも有
効で信号の性質も未知でよく音声が楽器音といった調波
構造をもつ信号の分離に有効な手段である。知覚的な音
の統合のための音響信号の物理的な特徴はBregma
nらによって心理学的に調べられている。人間が音を群
化する際周波数成分の高調波関係の有無、周波数成分の
振幅変化の共通性のずれ、音の時間的な連続性などの特
徴が重要なてがかりになっていることがわかっている
(A.S.Bregman Auditory Scene Analysis,Mit Press(19
90))。By the way, recently, attention has been paid to the perceptual aspect of sound to attempt separation of acoustic signals. Such a method is effective even when a plurality of signals are mixed in a monaural signal, and the characteristics of the signal are unknown, and it is an effective means for separating a signal having a harmonic structure such as an instrument sound. The physical features of acoustic signals for perceptual sound integration are Bregma
It is examined psychologically by N. et al. When humans group sounds, it turns out that features such as the presence or absence of harmonic relationships of frequency components, deviation of commonality of amplitude changes of frequency components, and temporal continuity of sounds are important clues. Have (ASBregman Auditory Scene Analysis, Mit Press (19
90)).
【0004】Brownらは、この特徴を利用して、信
号分離を試みている(G.J.Brown M.P.Cooke (1992) A
Computational model of auditory scene analysis, P
roceedings of International Conference on Spoken L
anguage Processing(ICSLP))。システムは、まず人間
の聴覚的特性を模擬したモデルによって周波数解析に相
当する処理を行う。次に周波数成分を抽出し、それらの
立ち上がり時刻のずれ、および高調波という特徴に基づ
いて、ヒューリスティクスを用いて主要な領域をグルー
プ化し、これを目的音声とみなして音響信号を再合成す
る仕組みになっている。しかし、この手法では抽出する
目的信号と除去する信号が周波数上で重なるとき信号が
欠落するため不明瞭な音声信号しか抽出できなかった。
また、その信号の欠落を補償するためDPを用いた信号
の補間(M.P.Cooke(1993) Computational auditory sc
ene analysis: Exploiting principles of perceived c
ontinuity Speech Communication 13 391-399)やHM
Mをもちいた補間(M.P.Cooke(1994) Learning to rec
ognise speech in noisy environments, Proceedings o
f ATR Workshop on A Biological Framework for Speec
h Perception and Producton)が試みられているが、一
度落ちた情報を再現するためには膨大な計算が必要にも
かかわらず効果は小さい。Brown et al. Attempted signal separation by utilizing this feature (GJ Brown MPCooke (1992) A
Computational model of auditory scene analysis, P
roceedings of International Conference on Spoken L
anguage Processing (ICSLP)). The system first performs a process corresponding to frequency analysis using a model simulating human auditory characteristics. Next, frequency components are extracted, major regions are grouped using heuristics based on the characteristics of their rising times and harmonics, and this is regarded as the target voice, and the acoustic signal is resynthesized. It has become. However, in this method, only the unclear voice signal can be extracted because the signal is dropped when the target signal to be extracted and the signal to be removed overlap in frequency.
Moreover, in order to compensate for the loss of the signal, signal interpolation using DP (MPCooke (1993) Computational auditory sc
ene analysis: Exploiting principles of perceived c
ontinuity Speech Communication 13 391-399) and HM
Interpolation using M (MPCooke (1994) Learning to rec
ognise speech in noisy environments, Proceedings o
f ATR Workshop on A Biological Framework for Speec
h Perception and Producton) has been tried, but the effect is small even though enormous calculation is required to reproduce the information once dropped.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上記の
従来の構成では、 (1)抽出すべき信号の性質が既知でなければならな
い。 (2)複数のマイクロフォンが必要である。 (3)S/Nが改善されても、音声の認識にとって重要
な音響信号も欠落する。 (4)信号の特徴がロバストに抽出されなければならな
いので、計算量が膨大になる。という問題点を有してい
た。However, in the above-mentioned conventional configuration, (1) the nature of the signal to be extracted must be known. (2) Multiple microphones are required. (3) Even if the S / N is improved, the acoustic signal important for voice recognition is also lost. (4) Since the characteristics of the signal must be robustly extracted, the amount of calculation becomes enormous. Had the problem.
【0006】本発明は上記従来の課題を解決するもので
パラメータの抽出が不確かであっても抽出すべき信号が
含まれている見込みの大きさに従って入力信号の重みづ
けをすることで完全に抽出すべき信号を欠落されること
がなく音声の明瞭さを損なわず雑音の低減を実現するこ
とを目的としている。The present invention solves the above-mentioned conventional problems. Even if the parameter extraction is uncertain, the input signal is weighted according to the likelihood that the signal to be extracted is included. It is intended to realize noise reduction without impairing the intelligibility of the voice without the signal to be lost.
【0007】[0007]
【課題を解決するための手段】この目的を達成するため
に本発明の雑音抑制装置は、音響信号を時間分割する信
号の時間分割手段と、前記信号の時間分割手段による短
時間セグメントの信号のピッチを抽出するピッチ抽出手
段と、前記ピッチ抽出手段によって求められたピッチを
格納する第1の記憶手段と、前記信号の時間分割手段の
出力信号を複数の周波数帯域に分割する周波数帯域分割
手段と、前記周波数帯域分割手段の出力を格納する第2
の記憶手段と、前記第1の記憶手段の出力のエネルギー
を算出するエネルギー算出手段と、前記エネルギー算出
手段の出力を格納する第3の記憶手段と、前記第3の記
憶手段と前記第1の記憶手段の出力から特徴量の算出を
行う特徴量の算出手段と、ある時間区間のある周波数帯
域の信号の重み値の算出を行う重み値の算出手段と、前
記第3の記憶手段の出力と前記重み値の算出手段の積を
算出する乗算手段と、前記乗算手段の出力を格納する第
4の記憶手段と、前記第4の記憶手段の出力の総和を算
出する総和手段を有している。In order to achieve this object, a noise suppressing apparatus of the present invention is a signal time division means for time division of an acoustic signal, and a signal of a short time segment by the time division means of the signal. Pitch extraction means for extracting a pitch, first storage means for storing the pitch obtained by the pitch extraction means, and frequency band division means for dividing the output signal of the time division means for the signal into a plurality of frequency bands A second for storing the output of the frequency band dividing means
Storage means, energy calculation means for calculating the energy of the output of the first storage means, third storage means for storing the output of the energy calculation means, third storage means and the first storage means. A feature amount calculation unit that calculates a feature amount from the output of the storage unit, a weight value calculation unit that calculates a weight value of a signal in a certain frequency band in a certain time section, and an output of the third storage unit. It has multiplication means for calculating the product of the weight value calculation means, fourth storage means for storing the output of the multiplication means, and summing means for calculating the sum of the outputs of the fourth storage means. .
【0008】[0008]
【作用】本発明は前記構成により、人間の聴覚が聴感上
の雑音抑制のために利用している音の物理的な特徴を用
いて入力信号の周波数の重みづけを行うことにより雑音
が混在した音響信号から雑音を抑制することにより目的
の音響信号を抽出することができる。According to the present invention, noise is mixed by weighting the frequency of the input signal by using the physical characteristics of the sound used by the human auditory sense to suppress the noise in hearing. A target acoustic signal can be extracted by suppressing noise from the acoustic signal.
【0009】[0009]
【実施例】まず本発明の実施例に共通の構成図を図2に
示す。DESCRIPTION OF THE PREFERRED EMBODIMENTS First, FIG. 2 shows a configuration diagram common to the embodiments of the present invention.
【0010】図2において、100は入力信号を短時間
セグメントに分割する時間分割手段、200は入力信号
のピッチを抽出するしピッチ抽出手段、400は短時間
信号を周波数分割する周波数帯域分割手段、600はエ
ネルギーまたは実効値の算出手段、800は特徴量を計
算する特徴量算出手段、900は重み値算出手段、91
0は入力信号の周波数と重み値を乗算する乗算手段、9
30は乗算手段910の出力を時間と周波数にわたり総
和する総和手段である。In FIG. 2, 100 is a time dividing means for dividing the input signal into short time segments, 200 is a pitch extracting means for extracting the pitch of the input signal, 400 is a frequency band dividing means for frequency dividing the short time signal, Reference numeral 600 is energy or effective value calculation means, 800 is a characteristic amount calculation means for calculating a characteristic amount, 900 is a weight value calculation means, 91
0 is a multiplication means for multiplying the frequency of the input signal by the weight value, 9
30 is a summing means for summing the outputs of the multiplying means 910 over time and frequency.
【0011】以下それぞれの具体的な実施例について説
明する。 (実施例1)図3は本発明の第1の実施例における雑音
抑制装置の構成を示す構成図である。Each specific embodiment will be described below. (Embodiment 1) FIG. 3 is a configuration diagram showing a configuration of a noise suppression device according to a first embodiment of the present invention.
【0012】図3において、1000は信号の時間切り
出しを行う信号の時間分割手段、1001はピッチ抽出
手段、1002は第1の記憶手段、1003は周波数帯
域分割フィルタ、1004は第2の記憶手段、1005
はエネルギーの算出手段、1006は第3の記憶手段、
1007は特徴量の算出手段、1008は重み値の算出
手段、1009は乗算手段、1010は第4の記憶手
段、1011は総和手段である。In FIG. 3, 1000 is a signal time division means for performing time division of a signal, 1001 is a pitch extraction means, 1002 is a first storage means, 1003 is a frequency band division filter, and 1004 is a second storage means. 1005
Is energy calculation means, 1006 is third storage means,
Reference numeral 1007 is a feature amount calculation means, 1008 is a weight value calculation means, 1009 is a multiplication means, 1010 is a fourth storage means, and 1011 is a summing means.
【0013】以上のように構成された雑音抑制装置の動
作について説明する。信号の時間分割手段1000は音
響信号を時間T毎にδtの時間セグメントに分割する。
入力信号が音声信号であるので、δtは13ms、Tは
26msとする。前記信号の時間分割手段1000の形
状をハニング窓とすると前記信号の時間分割手段W(t
+kT)は(数1)で表すことができる。The operation of the noise suppressor configured as above will be described. The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T.
Since the input signal is a voice signal, δt is 13 ms and T is 26 ms. If the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t
+ KT) can be expressed by (Equation 1).
【0014】[0014]
【数1】 [Equation 1]
【0015】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), Si
g (t + kT) is represented by (Equation 2).
【0016】[0016]
【数2】 [Equation 2]
【0017】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチは、ケプストラム法、
自己相関法などを用いて抽出される。抽出されたピッチ
をf p(kT)とする。第1の記憶手段1002は前記
ピッチ抽出手段1001で求められたfp(kT)を格
納する。また、周波数帯域分割フィルタ1003はSi
g(t+kT)を20Hzの周波数帯域にN分割する。
前記周波数帯域分割フィルタ1003の出力をSig
(t+kT,fm)と記述する(m=1,2,・・・・
N)。fmは帯域の中心周波数である。N個の狭帯域信
号Sig(t+kT,fm)は第2の記憶手段1004
に格納される。エネルギーの算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。The pitch extracting means 1001 uses Sig (t + k
Extract the pitch of T). The pitch is the cepstrum method,
It is extracted using an autocorrelation method or the like. Extracted pitch
F p(KT). The first storage means 1002 is
F obtained by the pitch extracting means 1001pRank (kT)
Pay. Further, the frequency band division filter 1003 is made of Si.
Divide g (t + kT) into N frequency bands of 20 Hz.
The output of the frequency band division filter 1003 is Sig.
(T + kT, fm)) (M = 1, 2, ...
N). fmIs the center frequency of the band. N narrowband signals
No. Sig (t + kT, fm) Is the second storage means 1004
Stored in. In the energy calculation means 1005, each S
ig (t + kT, fm) Energy is calculated. Said
The N outputs of the energy calculation means 1005 are Ene
(KT, fm). Ene (kT, fm) Is (number
Calculated in 3).
【0018】[0018]
【数3】 (Equation 3)
【0019】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。このうちピッチを除く特徴量に
ついて前記特徴量の算出手段1007で算出する。N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 1007
Calculates the feature amount of Sig (t + kT, f m ). In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts. Of these, the feature amount excluding the pitch is calculated by the feature amount calculation means 1007.
【0020】図4は本実施例における特徴量の算出手段
1007の詳細図である。1101はオンセットの算出
手段、1102はオフセットの算出手段、1103は連
続性の算出手段、1104は調波性の算出手段、110
5はオンセットの同期性の算出手段、1106はオフセ
ットの同期性の算出手段である。FIG. 4 is a detailed diagram of the feature amount calculating means 1007 in this embodiment. 1101 is an onset calculation means, 1102 is an offset calculation means, 1103 is a continuity calculation means, 1104 is a harmonicity calculation means, 110
Reference numeral 5 is an onset synchronism calculating means, and 1106 is an offset synchronism calculating means.
【0021】オンセットの算出手段1101では前記第
3の記憶手段1006の出力の時間的な変化に基づきオ
ンセットを定める。つまり、現時刻のエネルギーが前記
時刻のエネルギーに対しある閾値以上に増加したときオ
ンセットであると判断する。The onset calculation means 1101 determines the onset based on the temporal change of the output of the third storage means 1006. That is, when the energy at the current time has increased by a certain threshold value or more with respect to the energy at the time, it is determined to be onset.
【0022】オフセットの算出手段1102では前記第
3の記憶手段の出力の時間的な変化に基づきオフセット
を定める。つまり、現時刻のエネルギーが前記時刻のエ
ネルギーに対しある閾値以上に減少したときオフセット
であると判断する。The offset calculation means 1102 determines the offset based on the temporal change of the output of the third storage means. That is, when the energy at the current time has decreased by a certain threshold value or more with respect to the energy at the time, it is determined to be an offset.
【0023】連続性の算出手段1103では前記第3の
記憶手段1006の出力の時間的な変化に基づき前時刻
の信号と現時刻の信号が連続であるかどうかを決定す
る。つまり、現時刻のエネルギーが前記時刻のエネルギ
ーに対しある閾値以下で増減したとき連続であると判断
する。The continuity calculating means 1103 determines whether the signal at the previous time and the signal at the present time are continuous based on the temporal change of the output of the third storage means 1006. That is, it is determined that the energy at the current time is continuous when the energy at the current time increases or decreases below a certain threshold with respect to the energy at the time.
【0024】調波性の算出手段1104ではSig(t
+kT,fm)がピッチfp(kT)に対して調波関係で
あるとき調波的であるとする。つまりピッチの整数倍の
周波数に相当するfmがピッチに対し調波的であると判
断される。オンセットの同期性の算出手段1105では
Sig(t+kT,fm)でのオンセットがピッチf
p(kT)のオンセット時刻を基準に同時であるとき同
期的であるとする。オフセットの同期性の算出手段11
06ではSig(t+kT,fm)でのオフセットがピ
ッチfp(kT)のオフセット時刻を基準に同時である
とき同期的であるとする。In the harmonic calculation means 1104, Sig (t
+ KT, f m ) is harmonic when it has a harmonic relationship with the pitch f p (kT). That is, it is determined that f m, which corresponds to a frequency that is an integral multiple of the pitch, is harmonic to the pitch. In the onset synchronism calculation means 1105, the onset at Sig (t + kT, f m ) is performed at the pitch f.
It is assumed that they are synchronous when they are simultaneously based on the onset time of p (kT). Offset synchronism calculation means 11
In 06, it is assumed that the offsets at Sig (t + kT, f m ) are synchronous when they are simultaneously based on the offset time of the pitch f p (kT).
【0025】図3の重み値の算出手段1008では、各
特徴量(ピッチ、オンセット、オフセット、オンセット
の同期性、オフセットの同期性、調波性、連続性)を組
み合わせてSig(t+kT,fm)での重み値w(k
T,fm)を算出する。各特徴量のうち継時的特徴に関す
るものと周波数的特徴に関するものに分類しそれぞれの
統合を行う。前記オンセット、前記オンセットの同期
性、前記オフセット、前記オフセットの同期性、前記連
続性を統合して前記継時的特徴とする。また、前記ピッ
チ、前記調波性を統合して前記周波数的特徴とする。The weight value calculating means 1008 shown in FIG. 3 combines Sig (t + kT, pitch, onset, offset, synchronism of onset, synchronism of offset, harmonicity, continuity) of each feature quantity. weight value w (k at f m)
T, f m ) is calculated. The feature quantities are classified into those relating to the continuous features and those relating to the frequency features, and the respective features are integrated. The onset, the synchronism of the onset, the offset, the synchronism of the offset, and the continuity are integrated into the continuous characteristic. Further, the pitch and the harmonic property are integrated to form the frequency characteristic.
【0026】以下にSig(t+kT,fm)における
各特徴量の統合方法の一例を示す。前記周波数的特徴及
び前記継時的特徴は論理式(数4)(数5)によって表
現できる。An example of a method of integrating the feature amounts in Sig (t + kT, f m ) will be shown below. The frequency characteristic and the successive characteristic can be expressed by logical expressions (4) and (5).
【0027】[0027]
【数4】 (Equation 4)
【0028】[0028]
【数5】 (Equation 5)
【0029】このとき、S(t+kT,fm)の重み値
w(kT,fm)は(数6)となる。At this time, the weight value w (kT, f m ) of S (t + kT, f m ) becomes (Equation 6).
【0030】[0030]
【数6】 (Equation 6)
【0031】論理値を(表1)のように割り当てる。Logical values are assigned as in (Table 1).
【0032】[0032]
【表1】 [Table 1]
【0033】あるS(t+kT,fm)に対し、(表
2)のような論理値が割り当てられたとき、重み値w
(kT,fm)は(数7)となる。When a logical value as shown in (Table 2) is assigned to a certain S (t + kT, f m ), the weight value w
(KT, f m ) becomes (Equation 7).
【0034】[0034]
【表2】 [Table 2]
【0035】[0035]
【数7】 (Equation 7)
【0036】図3の乗算手段1009はSig(t+k
T,fm)と重み値w(kT,fm)を乗算する。前記乗
算手段1009の出力は第4の記憶手段1010に格納
される。総和手段1011は全てのk,mについて、w
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。The multiplication means 1009 shown in FIG. 3 uses Sig (t + k
T, f m ) is multiplied by the weight value w (kT, f m ). The output of the multiplication means 1009 is stored in the fourth storage means 1010. The summing means 1011 is w for all k and m.
(KT, f m ) × Sig (t + kT, f m ) is summed.
The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0037】なお、各特徴量のうち調波性かまたは連続
性が含まれていれば全ての特徴量を用いる必要はない。
また、前記特徴量(ピッチ、オンセット、オフセット、
オンセットの同期性、オフセットの同期性、調波性、連
続性)以外の特徴量を新たに組み合わせてもよい。ま
た、前記信号の時間分割手段1000の時間幅δtや分
割の時間周期Tは前記δt=13ms、T=26msに
限ったものではなく、形状もハニング窓に限ったもので
はない。また、前記ピッチ抽出手段1001は、ケプス
トラム法、自己相関法に限ったものではない。また、前
記周波数帯域分割フィルタ1003の周波数帯域は20
Hzに限ったものではない。また、前記調波性の算出手
段1104において、調波的と判断するものはピッチの
整数倍に限ったものでなく、偶数倍や奇数倍でもよく、
また、それらの周波数を中心に幅をもたせてもよい。ま
た、前記オンセットの同期性の算出手段1105におい
て、同期的と判断する時間のずれは0でなくてもよい。
つまり、ピッチ帯域でオンセットが検出された時刻の前
後でも同期的であると判断してもよい。また、前記オフ
セットの同期性の算出手段1106において、同期的と
判断する時間のずれは0でなくてもよい。つまり、ピッ
チ帯域でオフセットが検出された時刻の前後でも同期的
であると判断してもよい。また、前記重み値の算出手段
1008において、各特徴量を論理値(0,1)以外で
表現してもよく、また、特徴量の統合による重み値の算
出方法も論理積や論理和に限ったものではない。また、
オンセットやオフセットや連続性の判断に使うエネルギ
ーの差の算出は隣あう時間セグメントの比較に限らず時
間が離れていたり複数の時間セグメントの比較を行って
もよい。It should be noted that it is not necessary to use all the feature amounts if each feature amount includes harmonicity or continuity.
Further, the feature amount (pitch, onset, offset,
A feature amount other than onset synchronism, offset synchronism, harmonicity, and continuity) may be newly combined. The time width δt of the signal time division means 1000 and the time period T of division are not limited to δt = 13 ms and T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 1001 is not limited to the cepstrum method and the autocorrelation method. In addition, the frequency band of the frequency band division filter 1003 is 20.
It is not limited to Hz. Further, in the harmonic calculation unit 1104, what is determined to be harmonic is not limited to an integer multiple of the pitch, and it may be an even multiple or an odd multiple.
Moreover, you may give width | variety centering on those frequencies. Further, in the onset synchronism calculation means 1105, the time lag for determining that the synchronization is synchronous may not be zero.
That is, it may be determined that the onset is synchronous even before and after the time when the onset is detected in the pitch band. Further, in the offset synchronism calculation means 1106, the time lag for determining that it is synchronous may not be zero. That is, it may be determined that the pitch band is synchronous before and after the time when the offset is detected. Further, in the weight value calculation means 1008, each feature amount may be expressed by a value other than the logical value (0, 1), and the method of calculating the weight value by integrating the feature amounts is not limited to the logical product or the logical sum. Not a thing. Also,
The calculation of the difference in energy used for determining the onset, offset, and continuity is not limited to the comparison of adjacent time segments, and the time may be separated or a plurality of time segments may be compared.
【0038】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、また、エネルギーの算出手段1006は実効
値算出手段をもちいてもよい。As in Embodiment 9 described later, the frequency band division filter 1003 may use Fourier transform, and the energy calculating means 1006 may use effective value calculating means.
【0039】(実施例2)以下本発明の信号分離装置に
おける一実施例について図面を参照しながら説明する。(Embodiment 2) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0040】本実施例の主たる構成図は、第1の実施例
と同様、図3である。以上のように構成された雑音抑制
装置の動作について説明する。The main block diagram of this embodiment is FIG. 3 as in the case of the first embodiment. The operation of the noise suppression device configured as above will be described.
【0041】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるので、δtは13ms、Tは26ms
とする。前記信号の時間分割手段の形状をハニング窓と
すると前記信号の時間分割手段W(t+kT)は(数
1)で表すことができる。The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms, T is 26 ms
And When the shape of the time division means of the signal is a Hanning window, the time division means W (t + kT) of the signal can be expressed by (Equation 1).
【0042】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), Si
g (t + kT) is represented by (Equation 2).
【0043】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は本実施例における前記ピッチ抽出手段1001の詳細
図である。図5において、1200は第1のピッチ抽出
手段、1201は第2のピッチ抽出手段、1202は第
nのピッチ抽出手段(n=2,3,・・・・・)、12
03はピッチの推定値の算出手段である。第1のピッチ
抽出手段1200によってピッチfp1(kT)が、第2
のピッチ抽出手段1201によってピッチfp2(kT)
が、第nのピッチ抽出手段1202によってピッチfpn
(kT)が計算されたとする。このときピッチの推定値
の算出手段1203によってピッチの推定値fp(k
T)は(数8)で求められる。The pitch extraction means 1001 extracts the pitch of Sig (t + kT) using a plurality of extraction methods. FIG.
FIG. 4 is a detailed view of the pitch extracting means 1001 in this embodiment. In FIG. 5, reference numeral 1200 is a first pitch extracting means, 1201 is a second pitch extracting means, 1202 is an nth pitch extracting means (n = 2, 3, ...), 12
Reference numeral 03 is a means for calculating the estimated value of the pitch. The pitch f p1 (kT) is calculated by the first pitch extracting means 1200 as the second pitch
By the pitch extracting means 1201 of the pitch f p2 (kT)
But the pitch f pn by the pitch extraction unit 1202 of the n
It is assumed that (kT) is calculated. At this time, the estimated pitch value f p (k
T) is calculated by (Equation 8).
【0044】[0044]
【数8】 (Equation 8)
【0045】図3において、第1の記憶手段1002
は、前記ピッチ抽出手段1001で求められたピッチf
p(kT)を格納する。In FIG. 3, the first storage means 1002
Is the pitch f obtained by the pitch extracting means 1001.
Store p (kT).
【0046】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギーの算出手段1005では各
Sig(t+kT,fm)のエネルギーを算出する。前
記エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。The frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The output of the frequency band division filter 1003 is Si
It is described as g (t + kT, f m ) (m = 1, 2, ...
・ N). f m is the center frequency of the band. The N narrow band signals Sig (t + kT, f m ) are stored in the second storage means 100.
Stored in 4. The energy calculating means 1005 calculates the energy of each Sig (t + kT, f m ). The N outputs of the energy calculating means 1005 are Ene
Described as (kT, f m ). Ene (kT, f m ) is calculated by (Equation 3).
【0047】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。このうちピッチを除く特徴量に
ついて前記特徴量の算出手段1007で算出する。N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 1007
Calculates the feature amount of Sig (t + kT, f m ). In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts. Of these, the feature amount excluding the pitch is calculated by the feature amount calculation means 1007.
【0048】図4は、前記特徴量の算出手段1007の
詳細図である。1101はオンセットの算出手段、11
02はオフセットの算出手段、1103は連続性の算出
手段、1104は調波性の算出手段、1105はオンセ
ットの同期性の算出手段、1106はオフセットの同期
性の算出手段である。FIG. 4 is a detailed diagram of the feature amount calculating means 1007. 1101 is an on-set calculation means, 11
Reference numeral 02 is an offset calculation means, 1103 is a continuity calculation means, 1104 is a harmonicity calculation means, 1105 is an onset synchronism calculation means, 1106 is an offset synchronism calculation means.
【0049】オンセットの算出手段1101では前記第
3の記憶手段1006の出力の時間的な変化に基づきオ
ンセットを定める。つまり、現時刻のエネルギーが前記
時刻のエネルギーに対しある閾値以上に増加したときオ
ンセットであると判断する。The onset calculation means 1101 determines the onset based on the temporal change of the output of the third storage means 1006. That is, when the energy at the current time has increased by a certain threshold value or more with respect to the energy at the time, it is determined to be onset.
【0050】オフセットの算出手段1102では前記第
3の記憶手段の出力の時間的な変化に基づきオフセット
を定める。つまり、現時刻のエネルギーが前記時刻のエ
ネルギーに対しある閾値以上に減少したときオフセット
であると判断する。The offset calculating means 1102 determines the offset based on the temporal change of the output of the third storage means. That is, when the energy at the current time has decreased by a certain threshold value or more with respect to the energy at the time, it is determined to be an offset.
【0051】連続性の算出手段1103では前記第3の
記憶手段1006の出力の時間的な変化に基づき前時刻
の信号と現時刻の信号が連続であるかどうかを決定す
る。つまり、現時刻のエネルギーが前記時刻のエネルギ
ーに対しある閾値以下で増減したとき連続であると判断
する。The continuity calculating means 1103 determines whether the signal at the previous time and the signal at the current time are continuous based on the temporal change of the output of the third storage means 1006. That is, it is determined that the energy at the current time is continuous when the energy at the current time increases or decreases below a certain threshold with respect to the energy at the time.
【0052】調波性の算出手段1104ではSig(t
+kT,fm)がピッチfp(kT)に対して調波関係で
あるとき調波的であるとする。つまり、ピッチの整数倍
の周波数に相当するfmがピッチに対し調波的であると
判断される。In the harmonic calculation means 1104, Sig (t
+ KT, f m ) is harmonic when it has a harmonic relationship with the pitch f p (kT). That is, it is determined that f m, which corresponds to a frequency that is an integral multiple of the pitch, is harmonic with respect to the pitch.
【0053】オンセットの同期性の算出手段1105で
はSig(t+kT,fm)でのオンセットがピッチfp
(kT)のオンセット時刻を基準に同時であるとき同期
的であるとする。In the onset synchronism calculation means 1105, the onset at Sig (t + kT, f m ) is performed at the pitch f p.
It is assumed to be synchronous when they are simultaneously based on the onset time of (kT).
【0054】オフセットの同期性の算出手段1106で
はSig(t+kT,fm)でのオフセットがピッチfp
(kT)のオフセット時刻を基準に同時であるとき同期
的であるとする。In the offset synchronism calculation means 1106, the offset at Sig (t + kT, f m ) is the pitch f p.
It is assumed that they are synchronous when they are simultaneously based on the offset time of (kT).
【0055】図3の重み値の算出手段1008では、各
特徴量(ピッチ、オンセット、オフセット、オンセット
の同期性、オフセットの同期性、調波性、連続性)を組
み合わせてSig(t+kT,fm)での重み値w(t
+kT,fm)を算出する。各特徴量のうち継時的特徴に
関するものと周波数的特徴に関するものに分類しそれぞ
れの統合を行う。前記オンセット、前記オンセットの同
期性、前記オフセット、前記オフセットの同期性、前記
連続性を統合して前記継時的特徴とする。また、前記ピ
ッチ、前記調波性を統合して前記周波数的特徴とする。The weight value calculating means 1008 in FIG. 3 combines the respective feature amounts (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) and Sig (t + kT, weight value w (t at f m)
+ KT, f m ) is calculated. The feature quantities are classified into those relating to the continuous features and those relating to the frequency features, and the respective features are integrated. The onset, the synchronism of the onset, the offset, the synchronism of the offset, and the continuity are integrated into the continuous characteristic. Further, the pitch and the harmonic property are integrated to form the frequency characteristic.
【0056】以下にSig(t+kT,fm)における
前記各特徴量の統合方法の一例を示す。An example of a method of integrating the above feature amounts in Sig (t + kT, f m ) will be shown below.
【0057】前記周波数的特徴及び前記継時的特徴は論
理式(数4)(数5)によって表現できる。The frequency characteristic and the successive characteristic can be expressed by logical expressions (Equation 4) and (Equation 5).
【0058】このとき、Sig(t+kT,fm)の重
み値w(kT,fm)は(数6)となる。At this time, the weight value w (kT, f m ) of Sig (t + kT, f m ) becomes (Equation 6).
【0059】論理値を(表1)のように割り当てる。あ
るSig(t+kT,fm)に対し、(表2)のような
論理値が割り当てられたとき、重み値w(kT,fm)
は(数7)となる。Logical values are assigned as in (Table 1). When a logical value as shown in (Table 2) is assigned to a certain Sig (t + kT, f m ), a weight value w (kT, f m ).
Becomes (Equation 7).
【0060】図3の乗算手段1009はSig(t+k
T,fm)と重み値w(kT,fm)を乗算する。前記乗
算手段1009の出力は第4の記憶手段1010に格納
される。総和手段1011は全てのk,mについて、w
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。The multiplication means 1009 in FIG. 3 uses Sig (t + k
T, f m ) is multiplied by the weight value w (kT, f m ). The output of the multiplication means 1009 is stored in the fourth storage means 1010. The summing means 1011 is w for all k and m.
(KT, f m ) × Sig (t + kT, f m ) is summed.
The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0061】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量(ピッチ、オンセット、
オフセット、オンセットの同期性、オフセットの同期
性、調波性、連続性)以外の特徴量を新たに組み合わせ
てもよい。また、前記信号の時間分割手段1000の時
間幅δtや分割の時間周期Tは前記δt=13ms、T
=26msに限ったものではなく形状もハニング窓に限
ったものではない。また、前記ピッチ抽出手段1001
は、ケプストラム法、自己相関法に限ったものではな
い。また、前記周波数帯域分割フィルタ1003の周波
数帯域は20Hzに限ったものではない。また、前記調
波性の算出手段1104において調波的と判断するもの
はピッチの整数倍に限ったものでなく、ピッチの偶数倍
や奇数倍でもよく、また、それらの周波数を中心に幅を
もたせてもよい。また、前記オンセットの同期性の算出
手段1105において同期的と判断する時間のずれは0
でなくてもよい。つまり、ピッチ帯域でオンセットが検
出された時刻の前後でも同期的であると判断してもよ
い。また、前記オフセットの同期性の算出手段1106
において同期的と判断する時間のずれは0でなくてもよ
い。つまり、ピッチ帯域でオフセットが検出された時刻
の前後でも同期的であると判断してもよい。また、前記
重み値の算出手段1008において各特徴量を論理値
(0,1)以外で表現してもよく、また、前記特徴量の
統合による重み値の算出方法も論理積や論理和に限った
ものではない。It should be noted that it is not necessary to use all the feature quantities if the harmonic content or the continuity is included in each of the feature quantities. Further, the characteristic amount (pitch, onset,
Offset, onset synchronism, offset synchronism, harmonicity, continuity) may be newly combined. Further, the time width δt of the time division means 1000 of the signal and the time period T of the division are δt = 13 ms, T
= 26 ms and the shape is not limited to the Hanning window. Also, the pitch extracting means 1001
Is not limited to the cepstrum method and the autocorrelation method. The frequency band of the frequency band division filter 1003 is not limited to 20 Hz. Further, what is determined to be harmonic by the harmonic calculation unit 1104 is not limited to an integral multiple of the pitch, and may be an even multiple or an odd multiple of the pitch. You may give it. Further, there is no time lag when the onset synchronism calculation means 1105 determines that it is synchronous.
It does not have to be. That is, it may be determined that the onset is synchronous even before and after the time when the onset is detected in the pitch band. Also, the offset synchronism calculation means 1106.
In the above, the time lag determined to be synchronous does not have to be 0. That is, it may be determined that the pitch band is synchronous before and after the time when the offset is detected. Further, each feature amount may be expressed by the weight value calculating means 1008 other than the logical value (0, 1), and the method of calculating the weight value by integrating the feature amounts is not limited to the logical product or the logical sum. Not a thing.
【0062】また、オンセットやオフセットや連続性の
判断に使うエネルギーの差の算出は隣あう時間セグメン
トの比較に限らず時間が離れていたり複数の時間セグメ
ントの比較を行ってもよい。Further, the calculation of the energy difference used for determining the onset, the offset, and the continuity is not limited to the comparison of the adjacent time segments, and the time may be separated or a plurality of time segments may be compared.
【0063】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、また前記エネルギーの算出手段1005は実
効値算出手段をもちいてもよい。As in Embodiment 9 described later, the frequency band division filter 1003 may use Fourier transform, and the energy calculating means 1005 may use effective value calculating means.
【0064】(実施例3)以下本発明の信号分離装置に
おける一実施例について図面を参照しながら説明する。(Embodiment 3) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0065】本実施例においても主の構成図は図3であ
る。以下、本実施例の動作について説明する。Also in this embodiment, the main configuration is shown in FIG. The operation of this embodiment will be described below.
【0066】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状はハニン
グ窓とすると信号の時間分割手段W(t+kT)は(数
1)で表すことができる。The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms and T is 26 ms. When the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t + kT) can be expressed by (Equation 1).
【0067】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), S
ig (t + kT) is represented by (Equation 2).
【0068】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチはケプストラム法、自
己相関法などを用いて抽出される。第1の記憶手段10
02は前記ピッチ抽出手段1001で求められたピッチ
fp(kT)を格納する。また、周波数帯域分割フィル
タ1003はSig(t+kT)を20Hzの周波数帯
域にN分割する。前記周波数帯域分割フィルタ1003
の出力をSig(t+kT,fm)と記述する(m=
1,2,・・・・N)。fmは帯域の中心周波数であ
る。N個の狭帯域信号Sig(t+kT,fm)は第2
の記憶手段1004に格納される。エネルギーの算出手
段1005では各Sig(t+kT,fm)のエネルギ
ーを算出する。前記エネルギーの算出手段1005のN
個の出力をEne(kT,fm)と記述する。Ene
(kT,fm)は(数3)で算出される。The pitch extracting means 1001 uses Sig (t + k
Extract the pitch of T). The pitch is extracted using a cepstrum method, an autocorrelation method, or the like. First storage means 10
02 stores the pitch f p (kT) obtained by the pitch extracting means 1001. Further, the frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The frequency band division filter 1003
Is described as Sig (t + kT, f m ) (m =
1, 2, ... N). f m is the center frequency of the band. The N narrowband signals Sig (t + kT, f m ) are the second
Stored in the storage means 1004. The energy calculating means 1005 calculates the energy of each Sig (t + kT, f m ). N of the energy calculating means 1005
Each output is described as Ene (kT, f m ). Ene
(KT, f m ) is calculated by (Equation 3).
【0069】N個のEne(kT,fm)は第3の記憶
手段1006に格納される。特徴量の算出手段1007
はSig(t+kT,fm)の特徴量を算出する。本実
施例では特徴量として、ピッチ、オンセット、オンセッ
トの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 1007
Calculates the feature amount of Sig (t + kT, f m ). In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts.
【0070】図6は本実施例における特徴量の算出手段
1007の詳細図である。図6において、1301はピ
ッチの評価測度の算出手段、1302はオンセットの評
価測度の算出手段、1303はオフセットの評価測度の
算出手段、1304は連続性の評価測度の算出手段、1
305は調波性の評価測度の算出手段、1306はオン
セットの同期性の評価測度の算出手段、1307はオフ
セットの同期性の評価測度の算出手段である。また、評
価測度としてSig(t+kT,fm)で各特徴量が存
在する確からしさを用いる。FIG. 6 is a detailed diagram of the feature amount calculating means 1007 in this embodiment. In FIG. 6, 1301 is a pitch evaluation measure calculation means, 1302 is an onset evaluation measure calculation means, 1303 is an offset evaluation measure calculation means, 1304 is a continuity evaluation measure calculation means, 1
Reference numeral 305 is a harmonic evaluation evaluation measure calculation means, 1306 is an onset synchronization evaluation evaluation measure calculation means, and 1307 is an offset synchronization evaluation evaluation measure calculation means. In addition, the probability that each feature quantity is present in Sig (t + kT, f m ) is used as the evaluation measure.
【0071】以下で各特徴量の評価測度の算出手段につ
いて詳細に説明する。ピッチの評価測度の算出手段13
01において、fp(kT)に対しピッチが存在しうる
範囲を確率的に定義しSig(kT,fm)にピッチが
存在する確からしさを算出する。図7はピッチが存在し
うる周波数の確率分布の一例である。fp(kT)に対
してピッチが存在する確からしさがガウス分布をすると
するとSig(kT,fm)にピッチが存在する確から
しさRel_pitch(kT,fm)は分布の分散をσとす
ると(数9)によって与えられる。The means for calculating the evaluation measure of each feature will be described in detail below. Pitch evaluation measure calculation means 13
In 01, the range in which the pitch can exist with respect to f p (kT) is stochastically defined, and the probability that the pitch exists in Sig (kT, f m ) is calculated. FIG. 7 is an example of a probability distribution of frequencies in which pitch may exist. If the probability that the pitch exists for f p (kT) has a Gaussian distribution, the probability that the pitch exists for Sig (kT, f m ) Rel_pitch (kT, f m ) is the distribution variance σ. It is given by (Equation 9).
【0072】[0072]
【数9】 [Equation 9]
【0073】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when a harmonic compound sound composed of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0074】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。オンセットの確から
しさは前記第3の記憶手段1006の出力によって算出
される。以下に算出方法の一つの例を挙げる。心理学的
に連続にこえるか新たに音が加わったかという判断基準
が丁度変化する音の大きさが調べられている(1994年日
本音響学会秋期研究発表会稿論集2-7-18)。前記エネル
ギーの算出手段1005の出力を用いて現観測時刻のエ
ネルギーとそれより前の時刻までのエネルギーの平均か
ら前記オンセットの確からしさを定める。図10はオン
セットの確からしさの算出方法のための説明図である。
前記前時刻までのエネルギーの平均は現観測周波数とそ
の周波数に近接する2つの周波数帯域における約200
ms区間(16個のセグメント)のセグメントの平均と
する。Sig(kT,fm)の前記オンセットの確から
しさRel_on(EDif)は(数10)で算出される。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. In the onset evaluation measure calculation means 1302, the human perception is assured that this change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Based on the above, this is the onset certainty. The probability of onset is calculated from the output of the third storage means 1006. An example of the calculation method will be given below. The size of the sound that changes just the criterion that psychologically exceeds the continuity or whether a new sound is added is being investigated (Proceedings of the Autumn Meeting of the Acoustical Society of Japan, 1994 2-7-18). Using the output of the energy calculating means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy up to the time before it. FIG. 10 is an explanatory diagram for a method of calculating the probability of onset.
The average of the energies up to the previous time is about 200 in the current observation frequency and two frequency bands close to that frequency.
The average of the segments in the ms section (16 segments) is used. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0075】[0075]
【数10】 (Equation 10)
【0076】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまではピッチ帯域でのみ計算される。
図10及び図11は図8の信号に対する前記オンセット
の確からしさを説明する説明図である。図12において
時刻k=2でピッチ帯域の前記オンセットの確からしさ
が1.0となり閾値0.8を越えたので時刻k=2から
全周波数帯域で前記オンセットの確からしさの計算を始
める。次に、(k,m)=(2,1)と(2,3)で前
記オンセットの確からしさ1.0が算出できたとする。
この時図13のように(k,m)=(2,1)と(2,
3)に前記オンセットの確からしさ1.0を割り当て
る。FIG. 11 is a diagrammatic representation of (Equation 10). The onset certainty is calculated only in the pitch band until the onset is detected in the pitch band.
10 and 11 are explanatory views for explaining the certainty of the onset with respect to the signal of FIG. In FIG. 12, at time k = 2, the probability of the onset in the pitch band becomes 1.0 and exceeds the threshold value 0.8. Therefore, from time k = 2, the calculation of the probability of the onset in the entire frequency band is started. Next, it is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3).
At this time, as shown in FIG. 13, (k, m) = (2, 1) and (2,
The probability of onset 1.0 is assigned to 3).
【0077】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1303
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the energy calculating means 1005. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0078】[0078]
【数11】 [Equation 11]
【0079】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。The accuracy of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIG. 14 and FIG.
FIG. 5 is an explanatory diagram for explaining the probability of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0080】連続性の評価測度の算出手段1304では
音の大きさが時間的に変化したときそれが一つの信号の
時間変化である確からしさを指標とする。連続性の確か
らしさは前記第3の記憶手段1006の出力によって算
出される。図16は前記連続性の確からしさの算出方法
のための説明図である。図16において、現観測時刻を
含む現観測時刻以前約200ms区間(16個のセグメ
ント)の現観測セグメントのエネルギーの平均と現観測
周波数とその周波数に隣接する2つの周波数帯域におけ
る現観測時刻を含まない現観測時刻より前の約200m
s区間(16個のセグメント)のエネルギーの平均から
前記連続性の確からしさを決定する。前記連続性の確か
らしさRel_con(EDif)は(数12)で定義する。In the continuity evaluation measure calculating means 1304, when the loudness of the sound changes with time, the certainty that it is the change with time of one signal is used as an index. The probability of continuity is calculated from the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for the method of calculating the probability of continuity. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. About 200m before the current observation time
The certainty of the continuity is determined from the average of the energy in the s section (16 segments). The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0081】[0081]
【数12】 (Equation 12)
【0082】図17は(数12)を図式化したものであ
る。前記連続性の確からしさはオンセットが検出された
後オフセットが検出されるまで計算される。図18は図
8の信号に対する前記連続性の確からしさを説明する説
明図である。時刻k=2でオンセットが時刻k=6でオ
フセットが検出されたとき、時刻k=3から5までの間
前記連続性の確からしさが計算され各(k,m)での連
続性の確からしさが図18のように算出される。FIG. 17 is a schematic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the certainty of the continuity at each (k, m) is calculated. Likelihood is calculated as shown in FIG.
【0083】調波性の評価測度の算出手段1305では
Sig(t+kT,fm)がfp(kT)に対して知覚上
調波関係である確からしさをもって調波性の確からしさ
とする。ピッチの整数倍の周波数区間を中心に主観的に
調波性を感じる周波数分布を人間の心理測定関数から定
める。心理測定関数は電子情報通信学会論文誌'94/5Vo
l.J77-ANo.5 731-740に掲載のデータを参考に決める。
周波数帯域の中心周波数fmでの前記ピッチfp(kT)
のp倍(pは整数)の周波数からのずれuが(数13)
で求められる。In the calculation unit 1305 of the evaluation measure of harmonic properties, the probability that Sig (t + kT, f m ) is perceptually harmonic with respect to f p (kT) is regarded as the certainty of harmonic properties. A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. Psychological measurement functions are published in IEICE Transactions '94 / 5Vo
l. Determine based on the data published in J77-A No. 5 731-740.
The pitch f p (kT) at the center frequency f m of the frequency band
The deviation u from the frequency of p times (p is an integer) is (Equation 13)
Is required.
【0084】[0084]
【数13】 (Equation 13)
【0085】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned probability of harmonicity
_harm (u) is defined using u as in (Equation 14).
【0086】[0086]
【数14】 [Equation 14]
【0087】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0088】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に定義する。Sig(t+kT,fm)でオ
ンセットが検出されたときそれと最も近いピッチのオン
セット時刻の差をv(ms)とすると、前記オンセット
の同期性の確からしさRel_sync(kT,fm)は(数
15)で記述できる。The onset synchronicity evaluation measure calculating means 1306 judges that the onset at Sig (t + kT, f m ) is subjectively simultaneous on the basis of the onset time of f p (kT). The synchronicity is determined based on the time distribution. Perceptual onset synchronism is defined with reference to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740. When the difference between the onset time at which the onset is detected at Sig (t + kT, f m ) and the closest pitch is v (ms), the certainty of the onset synchronism Rel_sync (kT, f m ) is It can be described by (Equation 15).
【0089】[0089]
【数15】 (Equation 15)
【0090】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0091】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0092】図3の重み値の算出手段1008では評価
関数に前記各特徴(ピッチ、オンセット、オフセット、
オンセットの同期性、オフセットの同期性、調波性、連
続性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。In the weight value calculating means 1008 shown in FIG. 3, the above-mentioned features (pitch, onset, offset,
Enter the certainty about onset synchrony, offset synchrony, harmonicity, and continuity, and enter Sig (t + k
The weight value w (t + kT, f m ) at T, f m ) is calculated.
【0093】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
調波性の確からしさを統合して前記周波数的確からしさ
とする。Of the characteristic amounts, the certainty values are classified into those relating to the temporal certainty and those relating to the frequency certainty, and the respective certainty values are integrated. The accuracy of the onset, the accuracy of the synchronization of the onset, the accuracy of the offset, the accuracy of the synchronization of the offset, and the accuracy of the continuity are integrated into the continuous accuracy. . Further, the certainty of the pitch and the certainty of the harmonic property are integrated to obtain the certainty in terms of frequency.
【0094】図3において乗算手段1009はSig
(t+kT,fm)と重み値w(kT,fm)を乗算す
る。前記乗算手段1009の出力は第4の記憶手段10
10に格納される。総和手段1011は全てのk,mに
ついて、w(kT,fm)×Sig(t+kT,fm)を
総和する。前記総和手段1011の出力は雑音が抑制さ
れた音響信号となっている。In FIG. 3, the multiplication means 1009 is Sig.
(T + kT, f m ) is multiplied by the weight value w (kT, f m ). The output of the multiplication means 1009 is the fourth storage means 10
10 is stored. The summing means 1011 sums w (kT, f m ) × Sig (t + kT, f m ) for all k, m. The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0095】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく形状もハニン
グ窓に限ったものではない。また、前記ピッチ抽出手段
1001はケプストラム法、自己相関法に限ったもので
はない。また、前記周波数帯域分割フィルタ1003の
周波数帯域は20Hzに限ったものではない。また、ピ
ッチが存在する確からしさの算出においてガウス分布以
外の分布で定義してもよい。また、オンセット時刻の判
断に用いる閾値は0.8以外でもよい。また、オフセッ
ト時刻の判断に用いる閾値は0.9以外でもよい。ま
た、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記連続性の
確からしさの算出方法は(数12)に限らない。また、
前記調波性の確からしさの算出方法は(数13)および
(数14)に限らない。また、オンセットの同期性の確
からしさの算出方法やオフセットの同期性の確からしさ
の算出方法は(数15)に限らない。Note that it is not necessary to use all the feature quantities if the harmonic or the continuity is included in each of the feature quantities. Further, a feature amount other than the feature amount may be newly combined. Also, the signal time division means 10
The time width δt of 00 and the division time period T are δt = 13.
ms, T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 1001 is not limited to the cepstrum method and the autocorrelation method. The frequency band of the frequency band division filter 1003 is not limited to 20 Hz. Further, in the calculation of the probability that the pitch exists, it may be defined by a distribution other than the Gaussian distribution. Further, the threshold value used for determining the onset time may be other than 0.8. Further, the threshold value used for determining the offset time may be other than 0.9. In addition, the calculation method of the probability of the onset is (Equation 1
It is not limited to 0). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). Also,
The method of calculating the probability of harmonicity is not limited to (Equation 13) and (Equation 14). Further, the method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15).
【0096】なお、後述する実施例9のように、前記周
波数帯域分割フィルタ1003はフーリエ変換をもちい
てもよく、またエネルギーの算出手段1006は実効値
算出手段をもちいてもよい。The frequency band division filter 1003 may use Fourier transform, and the energy calculating means 1006 may use effective value calculating means, as in the ninth embodiment described later.
【0097】(実施例4)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 4) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0098】本実施例も主なる構成図は図3である。本
実施例の動作に付いて説明する。The main block diagram of this embodiment is also shown in FIG. The operation of this embodiment will be described.
【0099】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状をハニン
グ窓とすると前記信号の時間分割手段W(t+kT)は
(数1)で表すことができる。The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms and T is 26 ms. When the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t + kT) can be expressed by (Equation 1).
【0100】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), S
ig (t + kT) is represented by (Equation 2).
【0101】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図2
4は前記ピッチ抽出手段1001の詳細図である。図2
4において、3810は第1のピッチ抽出手段、382
0は第2のピッチ抽出手段、3830はピッチの推定値
の算出手段である。第1のピッチ抽出手段3810によ
ってピッチfp1(kT)が、第2のピッチ抽出手段38
20によってピッチf p2(kT)が計算されたとする。
このとき、ピッチの推定値の算出手段3830によって
ピッチの推定値fp(kT)は(数16)で求められ
る。Pitch extraction means 1001 uses a plurality of extraction methods
Is used to extract the pitch of Sig (t + kT). FIG.
4 is a detailed view of the pitch extracting means 1001. FIG.
4, 3810 is the first pitch extracting means, 382.
0 is the second pitch extraction means, 3830 is the estimated pitch value
Is a calculation means of. By the first pitch extracting means 3810
The pitch fp1(KT) is the second pitch extraction means 38
20 by pitch f p2It is assumed that (kT) is calculated.
At this time, the pitch estimation value calculation means 3830
Estimated value f of pitchp(KT) is calculated by (Equation 16)
You.
【0102】[0102]
【数16】 (Equation 16)
【0103】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp1(kT)
とfp2(kT)とfp(kT)を格納する。In FIG. 3, the first storage means 1002 stores f p1 (kT) obtained by the pitch extraction means 1001.
And f p2 (kT) and f p (kT) are stored.
【0104】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギーの算出手段1005では各
Sig(t+kT,fm)のエネルギーを算出する。前
記エネルギーの算出手段1005のN個の出力をEne
(kT,fm)と記述する。Ene(kT,fm)は(数
3)で算出される。The frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The output of the frequency band division filter 1003 is Si
It is described as g (t + kT, f m ) (m = 1, 2, ...
・ N). f m is the center frequency of the band. The N narrow band signals Sig (t + kT, f m ) are stored in the second storage means 100.
Stored in 4. The energy calculating means 1005 calculates the energy of each Sig (t + kT, f m ). The N outputs of the energy calculating means 1005 are Ene
Described as (kT, f m ). Ene (kT, f m ) is calculated by (Equation 3).
【0105】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量として、ピッチ、オンセット、オン
セットの同期性、オフセット、オフセットの同期性、連
続性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 10
07 calculates the feature amount of Sig (t + kT, f m ).
In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts.
【0106】図6は本実施例における特徴量の算出手段
1007の詳細図である。図6において、1301はピ
ッチの評価測度の算出手段、1302はオンセットの評
価測度の算出手段、1303はオフセットの評価測度の
算出手段、1304は連続性の評価測度の算出手段、1
305は調波性の評価測度の算出手段、1306はオン
セットの同期性の評価測度の算出手段、1307はオフ
セットの同期性の評価測度の算出手段である。また、評
価測度としてSig(t+kT,fm)で各特徴量が存
在する確からしさを用いる。FIG. 6 is a detailed diagram of the feature amount calculation means 1007 in this embodiment. In FIG. 6, 1301 is a pitch evaluation measure calculation means, 1302 is an onset evaluation measure calculation means, 1303 is an offset evaluation measure calculation means, 1304 is a continuity evaluation measure calculation means, 1
Reference numeral 305 is a harmonic evaluation evaluation measure calculation means, 1306 is an onset synchronization evaluation evaluation measure calculation means, and 1307 is an offset synchronization evaluation evaluation measure calculation means. In addition, the probability that each feature quantity is present in Sig (t + kT, f m ) is used as the evaluation measure.
【0107】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段1
301は、前記ピッチ抽出手段1001で計算されたf
p1(kT)とfp2(kT)の差からピッチfp(kT)
の確からしさを決定する。fp1(kT)とfp2(kT)
の差が0の時ピッチは正確に抽出されたとしピッチfp
(kT)の確からしさは1とする。fp1(kT)とfp2
(kT)の差が大きくなると確からしさは減少する。ピ
ッチの確からしさが図3900のようにfp1(kT)−
fp2(kT)の値によってガウス分布するとするとピッ
チの確からしさRel(fp1(kT)−fp2(kT))
が(数17)で決定される。The means for calculating the feature quantity evaluation measure will be described in detail below. Pitch evaluation measure calculation means 1
301 is f calculated by the pitch extracting means 1001.
From the difference between p1 (kT) and f p2 (kT), the pitch f p (kT)
Determine the certainty of. f p1 (kT) and f p2 (kT)
When the difference between the two is 0, it is assumed that the pitch is accurately extracted and the pitch f p
The probability of (kT) is 1. f p1 (kT) and f p2
The probability decreases as the difference in (kT) increases. The probability of pitch is f p1 (kT) − as shown in FIG. 3900.
If the Gaussian distribution is used according to the value of f p2 (kT), the pitch accuracy Rel (f p1 (kT) −f p2 (kT))
Is determined by (Equation 17).
【0108】[0108]
【数17】 [Equation 17]
【0109】同時に、図26のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)にピッチが存在
する確からしさを算出する。ピッチの推定値fp(k
T)に対してピッチが存在する確からしさがガウス分布
をするとすると、Sig(kT,fm)にピッチが存在
する確からしさRel_pitch(kT,fm)は分散をσ
とすると(数9)によって与えられる。At the same time, the range in which a certain pitch can exist is stochastically defined with respect to the estimated value f p (kT) of the pitch obtained as shown in FIG. 26, and it is confirmed that the pitch exists in Sig (kT, f m ). Calculate the likelihood. Estimated value of pitch f p (k
If the probability that the pitch exists with respect to T) has a Gaussian distribution, the probability that the pitch exists in Sig (kT, f m ) Rel_pitch (kT, f m ) is σ
Then, it is given by (Equation 9).
【0110】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when a harmonic compound sound composed of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0111】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギーの算出手段1005の出力を用いて現観測時
刻のエネルギーとそれより前の時刻までのエネルギーの
平均から前記オンセットの確からしさを定める。図10
はオンセットの確からしさの算出方法のための説明図で
ある。前記前時刻までのエネルギーの平均は現観測周波
数とその周波数に近接する2つの周波数帯域における約
200ms区間(16個のセグメント)のセグメントの
平均とする。Sig(kT,fm)の前記オンセットの
確からしさRel_on(EDif)は(数10)で算出され
る。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. In the onset evaluation measure calculation means 1302, the human perception is assured that this change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Based on the above, this is the onset certainty. The probability of the onset is calculated from the output of the third storage unit 1006. An example of the calculation method will be given below. The loudness of the sound that changes just the psychologically continuous judgment or whether a new sound is added is being investigated (19
Proceedings of the 94th Autumn Meeting of ASJ 2-7-18). Using the output of the energy calculating means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy up to the time before it. FIG.
FIG. 6 is an explanatory diagram for a method of calculating the probability of onset. The average of the energy up to the previous time is the average of the segment of about 200 ms section (16 segments) in the current observation frequency and two frequency bands close to the current frequency. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0112】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまではピッチ帯域でのみ計算される。図1
2及び図13は図8の信号に対する前記オンセットの確
からしさを説明する説明図である。図12において時刻
k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時図
2700のように(k,m)=(2,1)と(2,3)
に前記オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). Onset certainty is calculated only in the pitch band until the onset is detected in the pitch band. FIG.
2 and 13 are explanatory views for explaining the certainty of the onset with respect to the signal of FIG. In FIG. 12, at time k = 2, the probability of the onset in the pitch band becomes 1.0 and exceeds the threshold value 0.8. Therefore, from time k = 2, the calculation of the probability of the onset in the entire frequency band is started. It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). At this time, as shown in FIG. 2700, (k, m) = (2,1) and (2,3)
Is assigned to the onset certainty of 1.0.
【0113】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1303
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the energy calculating means 1005. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0114】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。The probability of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIG. 14 and FIG.
FIG. 5 is an explanatory diagram for explaining the probability of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0115】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16はオンセットの確からしさの
算出方法のための説明図である。図16において、現観
測時刻を含む現観測時刻以前約200ms区間(16個
のセグメント)の現観測セグメントのエネルギーの平均
と現観測周波数とその周波数に隣接する2つの周波数帯
域における現観測時刻を含まない現観測時刻より前の約
200ms区間(16個のセグメント)のエネルギーの
平均から前記連続性の確からしさを決定する。前記連続
性の確からしさRel_con(EDif)は(数12)で定
義する。The continuity evaluation measure calculating means 1304 uses as an index the certainty that, when the loudness of the sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated by the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for a method of calculating the probability of onset. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. The certainty of the continuity is determined from the average of the energies of about 200 ms section (16 segments) before the current observation time which is not present. The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0116】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the continuity of each (k, m) is calculated. Probability is calculated as shown in FIG.
【0117】調波性の評価測度の算出手段1305で
は、前記Sig(t+kT,fm)が前記fp(kT)に
対して知覚上調波関係である確からしさをもって調波性
の確からしさとする。ピッチの整数倍の周波数区間を中
心に主観的に調波性を感じる周波数分布を人間の心理測
定関数から定める。心理測定関数は電子情報通信学会論
文誌'94/5Vol.J77-ANo.5 731-740に掲載のデータを参
考に決める。周波数帯域の中心周波数fmでの前記ピッ
チfp(kT)のp倍(pは整数)の周波数からのずれ
uが(数13)で求められる。In the calculation unit 1305 of the evaluation measure of the harmonic property, the probability that the Sig (t + kT, f m ) has a perceptual harmonic relationship with the f p (kT) is regarded as the certainty of the harmonic property. . A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. The psychometric function is determined by referring to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740. A deviation u from a frequency that is p times (p is an integer) the pitch f p (kT) at the center frequency f m of the frequency band is obtained by (Equation 13).
【0118】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned probability of harmonicity
_harm (u) is defined using u as in (Equation 14).
【0119】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0120】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に定義する。Sig(t+kT,fm)でオ
ンセットが検出されたときそれと最も近いピッチのオン
セット時刻の差をv(ms)とすると、前記オンセット
の同期性の確からしさRel_sync(kT,fm)は、
(数15)で記述できる。The onset synchronicity evaluation measure calculating means 1306 judges that the onset at Sig (t + kT, f m ) is subjectively simultaneous with the onset time of f p (kT) as a reference. The synchronicity is determined based on the time distribution. Perceptual onset synchronism is defined with reference to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740. When the difference between the onset time at which the onset is detected at Sig (t + kT, f m ) and the closest pitch is v (ms), the certainty of the onset synchronism Rel_sync (kT, f m ) is ,
It can be described by (Equation 15).
【0121】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0122】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0123】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力しSig(t+kT,
fm)での重み値w(t+kT,fm)を算出する。In the weight value calculating means 1008 shown in FIG. 3, the reliability of each feature (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) is assigned to the evaluation function. Input Sig (t + kT,
weight value w (t + kT at f m), calculates the f m).
【0124】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
ピッチの変動の範囲の確からしさ、前記調波性の確から
しさを統合して前記周波数的確からしさとする。Among the feature amounts, the ones are classified into those relating to the continuous likelihood and those relating to the frequency certainty, and the respective likelihoods are integrated. The accuracy of the onset, the accuracy of the synchronization of the onset, the accuracy of the offset, the accuracy of the synchronization of the offset, and the accuracy of the continuity are integrated into the continuous accuracy. . Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated into the certainty of the frequency.
【0125】図3において、乗算手段1009はSig
(t+kT,fm)と重み値w(kT,fm)を乗算す
る。前記乗算手段1009の出力は第4の記憶手段10
10に格納される。総和手段1011は全てのk,mに
ついて、w(kT,fm)×Sig(t+kT,fm)を
総和する。前記総和手段1011の出力は雑音が抑制さ
れた音響信号となっている。In FIG. 3, the multiplication means 1009 is Sig.
(T + kT, f m ) is multiplied by the weight value w (kT, f m ). The output of the multiplication means 1009 is the fourth storage means 10
10 is stored. The summing means 1011 sums w (kT, f m ) × Sig (t + kT, f m ) for all k, m. The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0126】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また前記特徴量以外の特徴量を新たに組み
合わせてもよい。また、前記信号の時間分割手段100
0の時間幅δtや分割の時間周期Tは前記δt=13m
s、T=26msに限ったものではなく形状もハニング
窓に限ったものではない。また、前記ピッチ抽出手段1
001はケプストラム法、自己相関法に限ったものでは
ない。また、前記周波数帯域分割フィルタ1003の周
波数帯域は20Hzに限ったものではない。また、ピッ
チが存在する確からしさの算出においてガウス分布以外
の分布で定義してもよい。また、オンセット時刻の判断
に用いる閾値は0.8以外でもよい。また、オフセット
時刻の判断に用いる閾値は0.9以外でもよい。また、
前記オンセットの確からしさの算出方法は(数10)に
限らない。また、前記オフセットの確からしさの算出方
法は(数11)に限らない。また、前記連続性の確から
しさの算出方法は(数12)に限らない。また、前記調
波性の確からしさの算出方法は(数13)および(数1
4)に限らない。また、オンセットの同期性の確からし
さの算出方法やオフセットの同期性の確からしさの算出
方法は(数15)に限らない。It is not necessary to use all of the feature quantities if the harmonic content or the continuity is included in the feature quantities. Further, a feature amount other than the feature amount may be newly combined. Also, the signal time division means 100
The time width δt of 0 and the time period T of division are δt = 13 m.
s, T = 26 ms, and the shape is not limited to the Hanning window. Also, the pitch extracting means 1
001 is not limited to the cepstrum method and the autocorrelation method. The frequency band of the frequency band division filter 1003 is not limited to 20 Hz. Further, in the calculation of the probability that the pitch exists, the distribution may be defined by a distribution other than the Gaussian distribution. Further, the threshold value used for determining the onset time may be other than 0.8. Further, the threshold value used for determining the offset time may be other than 0.9. Also,
The method of calculating the certainty of the onset is not limited to (Equation 10). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). In addition, the calculation method of the above-mentioned probability of harmonicity is expressed by (Equation 13) and (Equation 1)
It is not limited to 4). Further, the method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15).
【0127】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換を用いてもよく、
またエネルギーの算出手段1006は実効値算出手段を
用いてもよい。As in the ninth embodiment, the frequency band dividing filter 1003 may use Fourier transform,
Further, the energy calculating means 1006 may use an effective value calculating means.
【0128】(実施例5)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 5) An embodiment of the signal separating apparatus of the present invention will be described below with reference to the drawings.
【0129】本発明の第5の実施例における主な構成図
は図3である。以上のように構成された雑音抑制装置の
動作について説明する。The main block diagram of the fifth embodiment of the present invention is shown in FIG. The operation of the noise suppression device configured as above will be described.
【0130】信号の時間分割手段1000は音響信号を
時間T毎にδtの時間セグメントに分割する。入力信号
が音声信号であるのでδtは13ms、Tは26msと
する。前記信号の時間分割手段1000の形状はハニン
グ窓とすると前記信号の時間分割手段W(t+kT)は
(数1)で表すことができる。The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms and T is 26 ms. When the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t + kT) can be expressed by (Equation 1).
【0131】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), Si
g (t + kT) is represented by (Equation 2).
【0132】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は本実施例における前記ピッチ抽出手段1001の詳細
図である。図5において、1200は第1のピッチ抽出
手段、1201は第2のピッチ抽出手段、1202は第
nのピッチ抽出手段、1203はピッチの推定値f
p(t)の算出手段である。第1のピッチ抽出手段12
00によってピッチfp1(kT)が、第2のピッチ抽出
手段1201によってピッチfp2(kT)が、第nのピ
ッチ抽出手段1202によってピッチfpn(kT)が計
算されたとする。このとき、ピッチの推定値fp(t)
の算出手段1203によってピッチの推定値fp(k
T)は(数8)で求められる。The pitch extraction means 1001 extracts the pitch of Sig (t + kT) using a plurality of extraction methods. FIG.
FIG. 4 is a detailed view of the pitch extracting means 1001 in this embodiment. In FIG. 5, 1200 is the first pitch extracting means, 1201 is the second pitch extracting means, 1202 is the nth pitch extracting means, 1203 is the estimated pitch value f.
It is a means for calculating p (t). First pitch extracting means 12
00 by the pitch f p1 (kT) is the pitch f p2 the second pitch extracting means 1201 (kT) is the pitch f pn (kT) is calculated by the pitch extraction unit 1202 of the n. At this time, the estimated pitch value f p (t)
The pitch estimation value f p (k
T) is calculated by (Equation 8).
【0133】また、fp1(kT)からfpn(kT)の分
散Vpitch(kT)を(数18)で求める。Also, the variance V pitch (kT) of f pn (kT) is calculated from f p1 (kT) by (Equation 18).
【0134】[0134]
【数18】 (Equation 18)
【0135】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp(kT)
と分散Vpitch(kT)を格納する。In FIG. 3, the first storage means 1002 stores f p (kT) obtained by the pitch extraction means 1001.
And the variance V pitch (kT).
【0136】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。The frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The output of the frequency band division filter 1003 is Si
It is described as g (t + kT, f m ) (m = 1, 2, ...
・ N). f m is the center frequency of the band. The N narrow band signals Sig (t + kT, f m ) are stored in the second storage means 100.
Stored in 4. In the energy calculation means 1005, each S
The energy of ig (t + kT, f m ) is calculated. The N outputs of the energy calculating means 1005 are converted into Ene (k
T, f m ). Ene (kT, f m ) is (Equation 3)
Is calculated.
【0137】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 10
07 calculates the feature amount of Sig (t + kT, f m ).
In this embodiment, as the feature amount, pitch, onset, onset synchronism, offset, offset synchronism,
Calculate continuity and harmonicity.
【0138】図6は図3の特徴量の算出手段1007の
詳細図である。図6において、1301はピッチの評価
測度の算出手段、1302はオンセットの評価測度の算
出手段、1303はオフセットの評価測度の算出手段、
1304は連続性の評価測度の算出手段、1305は調
波性の評価測度の算出手段、1306はオンセットの同
期性の評価測度の算出手段、1307はオフセットの同
期性の評価測度の算出手段である。また、評価測度とし
てSig(t+kT,fm)で各特徴量が存在する確か
らしさを用いる。FIG. 6 is a detailed diagram of the feature amount calculation means 1007 of FIG. In FIG. 6, 1301 is a pitch evaluation measure calculation unit, 1302 is an onset evaluation measure calculation unit, 1303 is an offset evaluation measure calculation unit,
Reference numeral 1304 denotes a continuity evaluation metric calculation unit, 1305 denotes a harmonic evaluation metric calculation unit, 1306 denotes an onset synchronicity evaluation metric calculation unit, and 1307 denotes an offset synchronism evaluation metric calculation unit. is there. In addition, the probability that each feature quantity is present in Sig (t + kT, f m ) is used as the evaluation measure.
【0139】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段
は、前記ピッチ抽出手段1001で計算された分散V
pitch(kT)から推定されたピッチfp(kT)の確か
らしさを決定する。Vpitch(kT)が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。Vpitch(kT)が大きくなると確からし
さは減少する。ピッチの確からしさが図4100のよう
にVpitch(kT)の値によってガウス分布するとする
とピッチの確からしさRel(Vpitch(kT))が
(数19)で決定される。The means for calculating the evaluation measure of the feature quantity will be described in detail below. The means for calculating the pitch evaluation measure is the variance V calculated by the pitch extracting means 1001.
The probability of the pitch f p (kT) estimated from the pitch (kT) is determined. When V pitch (kT) is 0, it is assumed that the pitch is accurately extracted, and the probability of the pitch f p (kT) is 1. The probability decreases as V pitch (kT) increases. If the pitch accuracy is Gaussian distributed according to the value of V pitch (kT) as shown in FIG. 4100, the pitch accuracy Rel (V pitch (kT)) is determined by (Equation 19).
【0140】[0140]
【数19】 [Equation 19]
【0141】同時に、図28のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)がピッチである
確からしさを算出する。ピッチの推定値fp(kT)に
対してピッチが存在する確からしさがガウス分布をする
とするとSig(kT,fm)にピッチが存在する確か
らしさRel_pitch(kT,fm)は(数20)で与え
られる。At the same time, the range in which a certain pitch can exist is stochastically defined with respect to the estimated value f p (kT) of the pitch obtained as shown in FIG. 28, and the probability that Sig (kT, f m ) is the pitch To calculate. If the probability that the pitch exists with respect to the estimated value f p (kT) of the pitch has a Gaussian distribution, the probability that the pitch exists in Sig (kT, f m ) Rel_pitch (kT, f m ) is ( Equation 20). ) Is given.
【0142】[0142]
【数20】 (Equation 20)
【0143】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when the harmonic compound sound consisting of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0144】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギー算出手段1005の出力を用いて現観測時刻
のエネルギーとそれより前の時刻までのエネルギーの平
均から前記オンセットの確からしさを定める。図10は
オンセットの確からしさの算出方法のための説明図であ
る。前記前時刻までのエネルギーの平均は現観測周波数
とその周波数に近接する2つの周波数帯域における約2
00ms区間(16個のセグメント)のセグメントの平
均とする。Sig(kT,fm)の前記オンセットの確
からしさRel_on(EDif)は(数10)で算出され
る。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. In the onset evaluation measure calculation means 1302, the human perception is assured that this change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Based on the above, this is the onset certainty. The probability of the onset is calculated from the output of the third storage unit 1006. An example of the calculation method will be given below. The loudness of the sound that changes just the psychologically continuous judgment or whether a new sound is added is being investigated (19
Proceedings of the 94th Autumn Meeting of ASJ 2-7-18). Using the output of the energy calculation means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy before the current time. FIG. 10 is an explanatory diagram for a method of calculating the probability of onset. The average of the energies up to the previous time is about 2 in the current observation frequency and two frequency bands close to that frequency.
The average of the segments in the 00 ms section (16 segments) is used. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0145】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). The onset certainty is calculated only in the pitch band until an onset is detected in the pitch band. 12 and 13 are explanatory views for explaining the certainty of the onset for the signal of FIG. In FIG. 12, at time k = 2, the probability of the onset in the pitch band becomes 1.0 and exceeds the threshold value 0.8. Therefore, from time k = 2, the calculation of the probability of the onset in the entire frequency band is started. It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). This time,
As shown in FIG. 13, the probability of onset 1.0 is assigned to (k, m) = (2, 1) and (2, 3).
【0146】前記オフセットの評価測度の算出手段13
03においてオフセットの確からしさが算出される。二
つの信号から一方の信号が除かれたとき音の大きさには
変化がある。そこで前記エネルギーの算出手段1005
の出力を用いてオフセットを定める。前記オフセットの
確からしさRel_off(EDif)は前記オンセットの確
からしさの算出方法と同様に(数11)で与えられる。The offset evaluation measure calculating means 13
At 03, the probability of offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the energy calculating means 1005
The output is used to determine the offset. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0147】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。The probability of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIG. 14 and FIG.
FIG. 5 is an explanatory diagram for explaining the probability of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0148】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は前記連続性の確からしさの
算出方法のための説明図である。図16において、現観
測時刻を含む現観測時刻以前約200ms区間(16個
のセグメント)の現観測セグメントのエネルギーの平均
と現観測周波数とその周波数に隣接する2つの周波数帯
域における現観測時刻を含まない現観測時刻より前の約
200ms区間(16個のセグメント)のエネルギーの
平均から前記連続性の確からしさを決定する。前記連続
性の確からしさRel_con(EDif)は(数12)で定
義する。The continuity evaluation measure calculating means 1304 uses as an index the certainty that, when the loudness of the sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated by the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for the method of calculating the probability of continuity. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. The certainty of the continuity is determined from the average of the energies of about 200 ms section (16 segments) before the current observation time which is not present. The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0149】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき時刻k=3から5までの間
前記連続性の確からしさが計算され各(k,m)での連
続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset at time k = 2 and the offset is detected at time k = 6, the probability of continuity is calculated from time k = 3 to 5 and the probability of continuity at each (k, m) is calculated. Is calculated as shown in FIG.
【0150】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。In the calculation unit 1305 of the evaluation measure of harmonic properties, the probability that Sig (t + kT, f m ) is perceptually harmonic with respect to f p (kT) is regarded as the certainty of harmonic properties. A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. Psychological measurement functions are published in IEICE Transactions '94 /
5Vol.J77-A No.5 Determined by referring to the data published in 731-740. The pitch f p (k at the center frequency f m of the frequency band
The deviation u from the frequency that is p times (T is p) (p is an integer) is (Equation 1)
Required in 3).
【0151】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned harmonic probability
_harm (u) is defined using u as in (Equation 14).
【0152】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0153】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に前記同期性の確からしさの分布Rel_syn
c(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。The onset synchronicity evaluation measure calculating means 1306 judges that the onset at Sig (t + kT, f m ) is subjectively simultaneous on the basis of the onset time of f p (kT). The synchronicity is determined based on the time distribution. The perceptual onset synchrony is based on the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740.
c (kT, f m ) is defined by (Equation 15). Sig (t +
When the onset is detected at kT, f m ) and the difference in the onset time of the pitch closest to it is v (ms), the certainty of the onset synchronism Rel_sync
(KT, f m ) can be described by (Equation 15).
【0154】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0155】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0156】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。In the weight value calculation means 1008 shown in FIG. 3, the reliability of each feature (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) is assigned to the evaluation function. Input, Sig (t + k
The weight value w (t + kT, f m ) at T, f m ) is calculated.
【0157】前記各特徴量のうち継時的確からしさに関
するものと周波数的確からしさに関するものに分類しそ
れぞれの確からしさの統合を行う。前記オンセットの確
からしさ、前記オンセットの同期性の確からしさ、前記
オフセットの確からしさ、前記オフセットの同期性の確
からしさ、前記パワーの連続性の確からしさを統合して
前記継時的確からしさとする。また、前記ピッチの確か
らしさ、前記ピッチの変動の範囲の確からしさ、前記調
波性の確からしさを統合して前記周波数的確からしさと
する。[0157] Of the above feature amounts, the ones are classified into those related to the continuous certainty and those related to the frequency certainty, and the respective certainties are integrated. The onset accuracy, the onset synchronization accuracy, the offset accuracy, the offset synchronization accuracy, and the power continuity accuracy are integrated into the continuous accuracy. And Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated into the certainty of the frequency.
【0158】図3において、前記乗算手段1009はS
ig(t+kT,fm)と重み値w(kT,fm)を乗算
する。前記乗算手段1009の出力は第4の記憶手段1
010に格納される。総和手段1011は全てのk,m
について、w(kT,fm)×Sig(t+kT,fm)
を総和する。前記総和手段1011の出力は雑音が抑制
された音響信号となっている。In FIG. 3, the multiplication means 1009 is S
ig (t + kT, f m ) is multiplied by the weight value w (kT, f m ). The output of the multiplication means 1009 is the fourth storage means 1
It is stored in 010. The summing means 1011 is for all k and m
With respect to w (kT, f m ) × Sig (t + kT, f m ).
Sum up. The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0159】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また前記特徴量以外の特徴量を新たに組み
合わせてもよい。また、前記信号の時間分割手段100
0の時間幅δtや分割の時間周期Tは前記δt=13m
s、T=26msに限ったものではなく、形状もハニン
グ窓に限ったものではない。また、前記ピッチ抽出手段
1001はケプストラム法、自己相関法に限ったもので
はない。また、前記周波数帯域分割フィルタ1003の
周波数帯域は20Hzに限ったものではない。また、ピ
ッチが存在する確からしさの算出においてガウス分布以
外の分布で定義してもよい。また、オンセット時刻の判
断に用いる閾値は0.8以外でもよい。また、オフセッ
ト時刻の判断に用いる閾値は0.9以外でもよい。ま
た、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記連続性の
確からしさの算出方法は(数12)に限らない。また、
前記調波性の確からしさの算出方法は(数13)および
(数14)に限らない。また、オンセットの同期性の確
からしさの算出方法やオフセットの同期性の確からしさ
の算出方法は(数15)に限らない。Note that it is not necessary to use all the feature amounts if the harmonic or the continuity is included in each of the feature amounts. Further, a feature amount other than the feature amount may be newly combined. Also, the signal time division means 100
The time width δt of 0 and the time period T of division are δt = 13 m.
It is not limited to s, T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 1001 is not limited to the cepstrum method and the autocorrelation method. The frequency band of the frequency band division filter 1003 is not limited to 20 Hz. Further, in the calculation of the probability that the pitch exists, it may be defined by a distribution other than the Gaussian distribution. Further, the threshold value used for determining the onset time may be other than 0.8. Further, the threshold value used for determining the offset time may be other than 0.9. In addition, the calculation method of the probability of the onset is (Equation 1
It is not limited to 0). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). Also,
The method of calculating the probability of harmonicity is not limited to (Equation 13) and (Equation 14). Further, the method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15).
【0160】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換を用いてもよく、
またエネルギーの算出手段1006は実効値算出手段を
用いてもよい。The frequency band division filter 1003 may use Fourier transform as in the ninth embodiment.
Further, the energy calculating means 1006 may use an effective value calculating means.
【0161】(実施例6)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 6) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0162】第6の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるのでδtは13ms、Tは26m
sとする。前記信号の時間分割手段1000の形状はハ
ニング窓とすると前記信号の時間分割手段W(t+k
T)は(数1)で表すことができる。FIG. 3 shows the main configuration of the sixth embodiment.
It is. The operation of the noise suppression device configured as above will be described. The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms, T is 26 m
Let s. If the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t + k).
T) can be represented by (Equation 1).
【0163】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とするとSi
g(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), Si
g (t + kT) is represented by (Equation 2).
【0164】ピッチ抽出手段1001はSig(t+k
T)のピッチを抽出する。ピッチはケプストラム法、自
己相関法などを用いて抽出される。第1の記憶手段10
02は前記ピッチ抽出手段1001で求められたピッチ
fp(kT)を格納する。また、前記周波数帯域分割フ
ィルタ1003はSig(t+kT)を20Hzの周波
数帯域にN分割する。前記周波数帯域分割フィルタ10
03の出力をSig(t+kT,fm)と記述する(m
=1,2,・・・・N)。fmは帯域の中心周波数であ
る。N個の狭帯域信号Sig(t+kT,fm)は第2
の記憶手段1004に格納される。エネルギーの算出手
段1005では各Sig(t+kT,fm)のエネルギ
ーを算出する。前記エネルギーの算出手段1005のN
個の出力をEne(kT,fm)と記述する。Ene
(kT,fm)は(数3)で算出される。The pitch extracting means 1001 uses Sig (t + k
Extract the pitch of T). The pitch is extracted using a cepstrum method, an autocorrelation method, or the like. First storage means 10
02 stores the pitch f p (kT) obtained by the pitch extracting means 1001. The frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The frequency band division filter 10
The output of 03 is described as Sig (t + kT, f m ) (m
= 1, 2, ... N). f m is the center frequency of the band. The N narrowband signals Sig (t + kT, f m ) are the second
Stored in the storage means 1004. The energy calculating means 1005 calculates the energy of each Sig (t + kT, f m ). N of the energy calculating means 1005
Each output is described as Ene (kT, f m ). Ene
(KT, f m ) is calculated by (Equation 3).
【0165】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 10
07 calculates the feature amount of Sig (t + kT, f m ).
In this embodiment, as the feature amount, pitch, onset, onset synchronism, offset, offset synchronism,
Calculate continuity and harmonicity.
【0166】図6は本実施例における特徴量の算出手段
1007の詳細図である。1301はピッチの評価測度
の算出手段、1302はオンセットの評価測度の算出手
段、1303はオフセットの評価測度の算出手段、13
04は連続性の評価測度の算出手段、1305は調波性
の評価測度の算出手段、1306はオンセットの同期性
の評価測度の算出手段、1307はオフセットの同期性
の評価測度の算出手段である。また、評価測度としてS
ig(t+kT,fm)で各特徴量が存在する確からし
さを用いる。FIG. 6 is a detailed diagram of the feature amount calculation means 1007 in this embodiment. 1301 is a pitch evaluation measure calculation means, 1302 is an onset evaluation measure calculation means, 1303 is an offset evaluation measure calculation means, 13
Reference numeral 04 is a continuity evaluation measure calculation means, 1305 is a harmonic evaluation measure calculation means, 1306 is an onset synchronization evaluation measure calculation means, and 1307 is an offset synchronization evaluation measure calculation means. is there. In addition, as an evaluation measure, S
Probability that each feature quantity is present is used as ig (t + kT, f m ).
【0167】以下で前記特徴量の評価測度の算出手段に
ついて詳細に説明する。ピッチの評価測度の算出手段1
301において、fp(kT)に対しピッチが存在しう
る範囲を確率的に定義しSig(kT,fm)がピッチ
である確からしさを算出する。図7はピッチが存在しう
る周波数の確率分布の一例である。fp(kT)に対し
てピッチが存在する確からしさがガウス分布をするとす
るとSig(kT,fm)にピッチが存在する確からし
さRel_pitch(kT,fm)は(数9)によって与え
られる。The means for calculating the feature quantity evaluation measure will be described in detail below. Pitch evaluation measure calculation means 1
In 301, a range in which a pitch can exist with respect to f p (kT) is stochastically defined, and the probability that Sig (kT, f m ) is the pitch is calculated. FIG. 7 is an example of a probability distribution of frequencies in which pitch may exist. If the probability that the pitch exists for f p (kT) has a Gaussian distribution, the probability that the pitch exists for Sig (kT, f m ) Rel_pitch (kT, f m ) is given by ( Equation 9). .
【0168】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when a harmonic compound sound composed of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0169】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギーの算出手段1005の出力を用いて現観測時
刻のエネルギーとそれより前の時刻までのエネルギーの
平均から前記オンセットの確からしさを定める。図10
はオンセットの確からしさの算出方法のための説明図で
ある。前記前時刻までのエネルギーの平均は、現観測周
波数とその周波数に近接する2つの周波数帯域における
約200ms区間(16個のセグメント)のセグメント
の平均とする。Sig(kT,fm)の前記オンセット
の確からしさRel_on(EDif)は(数10)で算出さ
れる。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. In the onset evaluation measure calculation means 1302, the human perception is assured that this change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Based on the above, this is the onset certainty. The probability of the onset is calculated from the output of the third storage unit 1006. An example of the calculation method will be given below. The loudness of the sound that changes just the psychologically continuous judgment or whether a new sound is added is being investigated (19
Proceedings of the 94th Autumn Meeting of ASJ 2-7-18). Using the output of the energy calculating means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy up to the time before it. FIG.
FIG. 6 is an explanatory diagram for a method of calculating the probability of onset. The average of the energy up to the previous time is the average of the segments of about 200 ms section (16 segments) in the current observation frequency and two frequency bands close to the current frequency. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0170】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). The onset certainty is calculated only in the pitch band until an onset is detected in the pitch band. 12 and 13 are explanatory views for explaining the certainty of the onset for the signal of FIG. In FIG. 12, at time k = 2, the probability of the onset in the pitch band becomes 1.0 and exceeds the threshold value 0.8. Therefore, from time k = 2, the calculation of the probability of the onset in the entire frequency band is started. It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). This time,
As shown in FIG. 13, the probability of onset 1.0 is assigned to (k, m) = (2, 1) and (2, 3).
【0171】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1303
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the energy calculating means 1005. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0172】オフセットの確からしさはオンセットが検
出されてからピッチ帯域でオフセットが検出されるまで
ピッチ周波数帯域のみ計算される。図14及び図15は
図8の信号に対する前記オフセットの確からしさを説明
する説明図である。図14において時刻k=6でピッチ
帯域の前記オフセットの確からしさが1.0となりある
閾値0.9を越えたので時刻k=6において前記オフセ
ットの確からしさを全周波数帯域について算出する。
(k,m)=(6,1)と(6,3)で前記オフセット
の確からしさ1.0を算出できたとすると図16のよう
に前記オフセットの確からしさを割り当てる。The probability of offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. 14 and 15 are explanatory views for explaining the certainty of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands.
If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0173】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。The continuity evaluation measure calculating means 1304 uses as an index the certainty that when a loudness of a sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated by the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for a method of calculating the likelihood of continuity. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. About 20 before the current observation time
The probability of the continuity is determined from the average of the energies in the 0 ms section (16 segments). The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0174】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the continuity of each (k, m) is calculated. Probability is calculated as shown in FIG.
【0175】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでのピッチfp(kT)
のp倍(pは整数)の周波数からのずれuが(数13)
で求められる。In the calculation unit 1305 of the evaluation measure of harmonic property, the likelihood of Sig (t + kT, f m ) being a perceptual harmonic relationship with f p (kT) is regarded as the certainty of harmonic property. A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. Psychological measurement functions are published in IEICE Transactions '94 /
5Vol.J77-A No.5 Determined by referring to the data published in 731-740. Pitch f p (kT) at the center frequency f m of the frequency band
The deviation u from the frequency of p times (p is an integer) is (Equation 13)
Is required.
【0176】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned probability of harmonicity
_harm (u) is defined using u as in (Equation 14).
【0177】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0178】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。The onset synchronicity evaluation measure calculating means 1306 judges that the onset at Sig (t + kT, f m ) is subjectively simultaneous on the basis of the onset time of f p (kT). The synchronicity is determined based on the time distribution. Perceptual onset synchronism is the distribution of certainty of synchronism Rel_sync based on the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740.
(KT, f m ) is defined by (Equation 15). Sig (t +
When the onset is detected at kT, f m ) and the difference in the onset time of the pitch closest to it is v (ms), the certainty of the onset synchronism Rel_sync
(KT, f m ) can be described by (Equation 15).
【0179】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0180】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0181】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。In the weight value calculating means 1008 shown in FIG. 3, the reliability of each feature (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) is assigned to the evaluation function. Input, Sig (t + k
The weight value w (t + kT, f m ) at T, f m ) is calculated.
【0182】前記各特徴量のうち継時的確からしさに関
するものと周波数的確からしさに関するものに分類しそ
れぞれの確からしさの統合を行う。前記オンセットの確
からしさ、前記オンセットの同期性の確からしさ、前記
オフセットの確からしさ、前記オフセットの同期性の確
からしさ、前記パワーの連続性の確からしさを統合して
前記継時的確からしさとする。また、前記ピッチの確か
らしさ、前記ピッチの変動の範囲の確からしさ、前記調
波性の確からしさを統合して前記周波数的確からしさと
する。Of the above feature amounts, the certainty values are classified into those relating to continuous certainty and those relating to frequency certainty, and the respective certaintyes are integrated. The onset accuracy, the onset synchronization accuracy, the offset accuracy, the offset synchronization accuracy, and the power continuity accuracy are integrated into the continuous accuracy. And Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated into the certainty of the frequency.
【0183】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。FIG. 29 is a flowchart relating to the calculation of the evaluation value. At the time when the onset is detected, the continuous certainty is given by the product of the certainty of the onset and the certainty of the synchronism, and is calculated by (Equation 21).
【0184】[0184]
【数21】 (Equation 21)
【0185】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ(数
22)で算出される。In the time from the detection of the onset to the detection of the offset, the continuous probability Rel
_t (kT, f m ) is given by the product of the continuous certainty of the previous time and the certainty of the continuity of the previous time, and is calculated by (Equation 22).
【0186】[0186]
【数22】 (Equation 22)
【0187】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は(数23)で表現できる。FIG. 30 shows an example of the distribution of the successive probability. Also, the frequency accuracy Rel_f (k
T, f m ) can be expressed by (Equation 23).
【0188】[0188]
【数23】 (Equation 23)
【0189】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
fm)とする。The importance of the continuous certainty and the frequency certainty is g_t (kT, f m ), g_f (kT,
f m) to.
【0190】本実施例では評価関数にλ−ファジィ積分
を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。In this embodiment, λ-fuzzy integration is used as the evaluation function. At this time, the comprehensive evaluation value w (kT, f m ) can be calculated by (Equation 24).
【0191】[0191]
【数24】 (Equation 24)
【0192】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。FIG. 31 shows an example of the calculation result of the comprehensive evaluation value. However, g_t (kT, f m) = g_f (kT, f m),
λ = 0.
【0193】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段190の出力は第4の記憶手段1010に格
納される。総和手段1011は全てのk,mについてw
(kT,fm)×Sig(t+kT,fm)を総和する。
前記総和手段1011の出力は雑音が抑制された音響信
号となっている。The multiplication means 1009 of FIG. 3 uses Sig (t + k
T, f m ) is multiplied by the evaluation value w (kT, f m ). The output of the multiplication means 190 is stored in the fourth storage means 1010. The summing means 1011 is w for all k and m.
(KT, f m ) × Sig (t + kT, f m ) is summed.
The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0194】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段1001はケプストラム法、自己相関法に限ったもの
ではない。また、前記周波数帯域分割フィルタ1003
の周波数帯域は20Hzに限ったものではない。また、
前記オンセットの確からしさの閾値は0.8に限らな
い。また、前記オフセットの確からしさの閾値は0.9
に限らない。また、前記オンセットの確からしさの算出
方法は(数7)に限らない。また、前記オフセットの確
からしさの算出方法は(数11)に限らない。また、前
記連続性の確からしさの算出方法は(数12)に限らな
い。また、前記調波性の確からしさの算出方法は(数1
3)および(数14)に限らない。また、オンセットの
同期性の確からしさの算出方法やオフセットの同期性の
確からしさの算出方法は(数15)に限らない。また、
総合評価値の算出方法はλ−ファジィ積分に限らず、菅
野積分、ショケ積分、逆菅野積分など他の手段でもよ
い。Note that it is not necessary to use all the feature quantities if the harmonic content or the continuity is included in the feature quantities. Further, a feature amount other than the feature amount may be newly combined. Also, the signal time division means 10
The time width δt of 00 and the division time period T are δt = 13.
ms, T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 1001 is not limited to the cepstrum method and the autocorrelation method. In addition, the frequency band division filter 1003
The frequency band of is not limited to 20 Hz. Also,
The threshold of the probability of the onset is not limited to 0.8. Further, the threshold of the certainty of the offset is 0.9
Not limited to The method of calculating the probability of the onset is not limited to (Equation 7). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). In addition, the method of calculating the above-mentioned probability of harmonicity is
It is not limited to 3) and (Equation 14). Further, the method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15). Also,
The method for calculating the comprehensive evaluation value is not limited to λ-fuzzy integration, and other means such as Sugeno integration, Choquet integration, and inverse Sugeno integration may be used.
【0195】なお、実施例9のように、前記周波数帯域
分割フィルタ1003はフーリエ変換をもちいてもよ
く、またエネルギーの算出手段1006は実効値算出手
段をもちいてもよい。As in the ninth embodiment, the frequency band division filter 1003 may use Fourier transform, and the energy calculation means 1006 may use effective value calculation means.
【0196】(実施例7)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 7) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0197】第7の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるので、δtは13ms、Tは26
msとする。前記信号の時間分割手段1000の形状は
ハニング窓とすると、前記信号の時間分割手段W(t+
kT)は(数1)で表すことができる。The main block diagram of the seventh embodiment is shown in FIG.
It is. The operation of the noise suppression device configured as above will be described. The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms and T is 26
ms. If the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t +).
kT) can be expressed by (Equation 1).
【0198】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), S
ig (t + kT) is represented by (Equation 2).
【0199】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図2
4は前記ピッチ抽出手段1001の詳細図である。図2
4において、3810は第1のピッチ抽出手段、382
0は第2のピッチ抽出手段、3830はピッチの推定値
fp(t)の算出手段である。第1のピッチ抽出手段3
810によってピッチfp1(kT)が、第2のピッチ抽
出手段3820によってピッチfp2(kT)が計算され
たとする。このとき、ピッチの推定値fp(t)の算出
手段3830によって、ピッチの推定値fp(kT)は
(数8)で求められる。The pitch extraction means 1001 extracts the pitch of Sig (t + kT) using a plurality of extraction methods. FIG.
4 is a detailed view of the pitch extracting means 1001. FIG.
4, 3810 is the first pitch extracting means, 382.
Reference numeral 0 is a second pitch extracting means, and 3830 is a means for calculating an estimated pitch value f p (t). First pitch extracting means 3
Pitch f p1 (kT) by 810, the pitch f p2 the second pitch extracting means 3820 (kT) is calculated. At this time, the calculating means 3830 of the estimated value of the pitch f p (t), the estimated value of the pitch f p (kT) is calculated by equation (8).
【0200】図3において、第1の記憶手段1002
は、前記ピッチ抽出手段1001で求められたfp1(k
T)とfp2(kT)とfp(kT)を格納する。In FIG. 3, the first storage means 1002
Is f p1 (k obtained by the pitch extracting means 1001)
T), f p2 (kT) and f p (kT) are stored.
【0201】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。周波数帯域分割フィルタ1003の出力をSig
(t+kT,fm)と記述する(m=1,2,・・・・
N)。fmは帯域の中心周波数である。N個の狭帯域信
号Sig(t+kT,fm)は、第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。The frequency band division filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The output of the frequency band division filter 1003 is Sig.
It is described as (t + kT, f m ) (m = 1, 2, ...
N). f m is the center frequency of the band. The N narrow band signals Sig (t + kT, f m ) are stored in the second storage means 100.
Stored in 4. In the energy calculation means 1005, each S
The energy of ig (t + kT, f m ) is calculated. The N outputs of the energy calculating means 1005 are converted into Ene (k
T, f m ). Ene (kT, f m ) is (Equation 3)
Is calculated.
【0202】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では、特徴量として、ピッチ、オンセット、オ
ンセットの同期性、オフセット、オフセットの同期性、
連続性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 10
07 calculates the feature amount of Sig (t + kT, f m ).
In this embodiment, as the feature amount, pitch, onset, onset synchronism, offset, offset synchronism,
Calculate continuity and harmonicity.
【0203】図6は図本実施例の特徴量の算出手段10
07の詳細図である。1301はピッチの評価測度の算
出手段、1302はオンセットの評価測度の算出手段、
1303はオフセットの評価測度の算出手段、1304
は連続性の評価測度の算出手段、1305は調波性の評
価測度の算出手段、1306はオンセットの同期性の評
価測度の算出手段、1307はオフセットの同期性の評
価測度の算出手段である。また、評価測度としてSig
(t+kT,fm)で各特徴量が存在する確からしさを
用いる。以下で各特徴量の評価測度の算出手段について
詳細に説明する。FIG. 6 is a diagram. FIG. 6 is a diagram showing the feature quantity calculating means 10 of this embodiment.
It is a detailed view of 07. 1301 is a pitch evaluation measure calculation means; 1302 is an onset evaluation measure calculation means;
Reference numeral 1303 denotes a means for calculating an offset evaluation measure, 1304.
Is a continuity evaluation metric calculation means, 1305 is a harmonic evaluation metric calculation means, 1306 is an onset synchronicity evaluation metric calculation means, and 1307 is an offset synchronicity evaluation metric calculation means. . In addition, as an evaluation measure, Sig
The probability that each feature quantity exists at (t + kT, f m ) is used. The calculation means of the evaluation measure of each feature will be described in detail below.
【0204】ピッチの評価測度の算出手段は前記ピッチ
抽出手段1001で計算されたfp1(kT)とfp2(k
T)の差からピッチfp(kT)の確からしさを決定す
る。fp1(kT)とfp2(kT)の差が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。fp1(kT)とfp2(kT)の差が大きく
なると確からしさは減少する。ピッチの確からしさが図
25のようにfp1(kT)−fp2(kT)の値によって
ガウス分布するとするとピッチの確からしさRel(f
p1(kT)−fp2(kT))が(数17)で決定され
る。The means for calculating the pitch evaluation measure is f p1 (kT) and f p2 (k) calculated by the pitch extracting means 1001.
The probability of the pitch f p (kT) is determined from the difference of T). When the difference between f p1 (kT) and f p2 (kT) is 0, the pitch is accurately extracted, and the probability of the pitch f p (kT) is 1. The probability decreases as the difference between f p1 (kT) and f p2 (kT) increases. If the probability of pitch is Gaussian distributed by the value of f p1 (kT) −f p2 (kT) as shown in FIG. 25, the probability of pitch Rel (f
p1 (kT) -f p2 (kT)) is determined by (Equation 17).
【0205】同時に、図26のように、得られたピッチ
の推定値fp(kT)に対しあるピッチが存在しうる範
囲を確率的に定義しSig(kT,fm)がピッチであ
る確からしさを算出する。ピッチの推定値fp(kT)
に対してピッチが存在する確からしさがガウス分布をす
るとするとSig(kT,fm)にピッチが存在する確
からしさRel_pitch(kT,fm)は(数9)で与え
られる。At the same time, as shown in FIG. 26, the range in which a certain pitch can exist is stochastically defined with respect to the obtained estimated value f p (kT) of the pitch, and Sig (kT, f m ) is the pitch. Calculate the likelihood. Estimated value of pitch f p (kT)
Assuming that the probability that the pitch exists has a Gaussian distribution, the probability that the pitch exists in Sig (kT, f m ) Rel_pitch (kT, f m ) is given by ( Equation 9).
【0206】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when the harmonic compound sound consisting of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0207】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。前記オンセットの評価測度の算出手段1302で
はこの変化が一つの音の時間変化ではなく図9(b)の
ように異なるもう一つの信号が加わったために起こった
ものであるという確からしさを人間の知覚に基づき定め
これをオンセットの確からしさとする。前記オンセット
の確からしさは前記第3の記憶手段1006の出力によ
って算出される。以下に算出方法の一つの例を挙げる。
心理学的に連続にきこえるか新たに音が加わったかとい
う判断基準が丁度変化する音の大きさが調べられている
(1994年日本音響学会秋期研究発表会稿論集2-7-18)。
前記エネルギー算出手段1005の出力を用いて現観測
時刻のエネルギーとそれより前の時刻までのエネルギー
の平均から前記オンセットの確からしさを定める。図1
0はオンセットの確からしさの算出方法のための説明図
である。前記前時刻までのエネルギーの平均は現観測周
波数とその周波数に近接する2つの周波数帯域における
約200ms区間(16個のセグメント)のセグメント
の平均とする。Sig(kT,fm)の前記オンセット
の確からしさRel_on(EDif)は(数10)で算出さ
れる。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. The onset evaluation measure calculation means 1302 confirms that the change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Determined based on perception, this is the onset certainty. The probability of the onset is calculated from the output of the third storage unit 1006. An example of the calculation method will be given below.
The volume of the sound that changes just the criterion for psychological continuity or whether a new sound is added is being investigated (Proceedings of the Autumn Meeting of the Acoustical Society of Japan, 1994 2-7-18).
Using the output of the energy calculation means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy before the current time. FIG.
0 is an explanatory diagram for a method of calculating the probability of onset. The average of the energy up to the previous time is the average of the segment of about 200 ms section (16 segments) in the current observation frequency and two frequency bands close to the current frequency. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0208】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまでピッチ帯域でのみ計算される。図12
及び図13は図8の信号に対する前記オンセットの確か
らしさを説明する説明図である。図12において時刻k
=2でピッチ帯域の前記オンセットの確からしさが1.
0となり閾値0.8を越えたので時刻k=2から全周波
数帯域で前記オンセットの確からしさの計算を始める。
(k,m)=(2,1)と(2,3)で前記オンセット
の確からしさ1.0が算出できたとする。この時、図1
3のように(k,m)=(2,1)と(2,3)に前記
オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). Onset certainty is calculated only in the pitch band until the onset is detected in the pitch band. FIG.
13 and FIG. 13 are explanatory diagrams for explaining the certainty of the onset with respect to the signal of FIG. Time k in FIG.
= 2, the probability of the onset of the pitch band is 1.
Since it becomes 0 and exceeds the threshold value 0.8, the calculation of the probability of the onset is started from the time k = 2 in the entire frequency band.
It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). At this time, FIG.
As in 3, the onset certainty of 1.0 is assigned to (k, m) = (2, 1) and (2, 3).
【0209】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1303
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the energy calculating means 1005. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0210】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。The accuracy of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIG. 14 and FIG.
FIG. 5 is an explanatory diagram for explaining the probability of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0211】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。The continuity evaluation measure calculating means 1304 uses as an index the certainty that, when the loudness of the sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated by the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for a method of calculating the likelihood of continuity. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. About 20 before the current observation time
The probability of the continuity is determined from the average of the energies in the 0 ms section (16 segments). The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0212】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the continuity of each (k, m) is calculated. Probability is calculated as shown in FIG.
【0213】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5 731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。In the calculation unit 1305 of the evaluation measure of harmonic property, the probability that Sig (t + kT, f m ) has a perceptual harmonic relationship with f p (kT) is regarded as the certainty of harmonic property. A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. Psychological measurement functions are published in IEICE Transactions '94 /
5Vol.J77-A No.5 Determined by referring to the data published in 731-740. The pitch f p (k at the center frequency f m of the frequency band
The deviation u from the frequency that is p times (T is p) (p is an integer) is (Equation 1)
Required in 3).
【0214】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned harmonic accuracy
_harm (u) is defined using u as in (Equation 14).
【0215】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0216】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5731-740に掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とすると
前記オンセットの同期性の確からしさRel_sync(k
T,fm)は(数15)で記述できる。Onset synchronicity evaluation measure calculation means 1306 determines that the onsets at Sig (t + kT, f m ) are subjectively simultaneous based on the onset time of f p (kT). The synchronicity is determined based on the time distribution. The perceptual onset synchronism is the distribution of the certainty of the synchronism, Rel_sync, with reference to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5731-740.
(KT, f m ) is defined by (Equation 15). Sig (t +
When the onset is detected at kT, f m ) and the difference in the onset time of the closest pitch is v (ms), the certainty of the onset synchronism Rel_sync (k
T, f m ) can be described by (Equation 15).
【0217】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0218】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0219】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。
前記各特徴量のうち継時的確からしさに関するものと周
波数的確からしさに関するものに分類しそれぞれの確か
らしさの統合を行う。前記オンセットの確からしさ、前
記オンセットの同期性の確からしさ、前記オフセットの
確からしさ、前記オフセットの同期性の確からしさ、前
記パワーの連続性の確からしさを統合して前記継時的確
からしさとする。また、前記ピッチの確からしさ、前記
ピッチの変動の範囲の確からしさ、前記調波性の確から
しさを統合して前記周波数的確からしさとする。In the weight value calculation means 1008 shown in FIG. 3, the reliability of each feature (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) is assigned to the evaluation function. Input, Sig (t + k
The weight value w (t + kT, f m ) at T, f m ) is calculated.
Among the respective feature amounts, the certainty values are classified into those relating to the continuous certainty and those relating to the frequency certainty, and the respective certainty is integrated. The onset accuracy, the onset synchronization accuracy, the offset accuracy, the offset synchronization accuracy, and the power continuity accuracy are integrated into the continuous accuracy. And Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated into the certainty of the frequency.
【0220】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。FIG. 29 is a flow chart regarding the calculation of the evaluation value. At the time when the onset is detected, the continuous certainty is given by the product of the certainty of the onset and the certainty of the synchronism, and is calculated by (Equation 21).
【0221】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ(数
22)で算出される。In the time from the detection of the onset to the detection of the offset, the successive probability Rel
_t (kT, f m ) is given by the product of the continuous certainty of the previous time and the certainty of the continuity of the previous time, and is calculated by (Equation 22).
【0222】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は(数23)で表現できる。FIG. 30 shows an example of the distribution of the above-mentioned successive probability. Also, the frequency accuracy Rel_f (k
T, f m ) can be expressed by (Equation 23).
【0223】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
fm)とする。The importance of the continuous certainty and the frequency certainty is g_t (kT, f m ), g_f (kT,
f m) to.
【0224】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。In this embodiment, λ-fuzzy integration is used as the evaluation function. At this time, the comprehensive evaluation value w (kT, f m ) can be calculated by (Equation 24).
【0225】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。FIG. 31 shows an example of the calculation result of the comprehensive evaluation value. However, g_t (kT, f m) = g_f (kT, f m),
λ = 0.
【0226】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段190の出力は第4の記憶手段1010に格
納される。総和手段1011は全てのk,mについて、
w(kT,fm)×Sig(t+kT,fm)を総和す
る。前記総和手段1011の出力は雑音が抑制された音
響信号となっている。The multiplication means 1009 of FIG. 3 uses Sig (t + k
T, f m ) is multiplied by the evaluation value w (kT, f m ). The output of the multiplication means 190 is stored in the fourth storage means 1010. The summing means 1011 is for all k and m,
Sum up w (kT, f m ) × Sig (t + kT, f m ). The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0227】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記信号の時間分割手段10
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段1001は、ケプストラム法、自己相関法に限ったも
のではない。また、前記周波数帯域分割フィルタ100
3の周波数帯域は20Hzに限ったものではない。ま
た、前記オンセットの確からしさの閾値は0.8に限ら
ない。また、前記オフセットの確からしさの閾値は0.
9に限らない。また、前記オンセットの確からしさの算
出方法は(数10)に限らない。また、前記オフセット
の確からしさの算出方法(数11)に限らない。また前
記連続性の確からしさの算出方法は(数12)に限らな
い。また、前記調波性の確からしさの算出方法は(数1
3)(数14)に限らない。またオンセットの同期性の
確からしさの算出方法やオフセットの同期性の確からし
さの算出方法は(数15)に限らない。It is not necessary to use all of the feature quantities if the harmonic content or the continuity of the feature quantities is included. Further, a feature amount other than the feature amount may be newly combined. Also, the signal time division means 10
The time width δt of 00 and the division time period T are δt = 13.
ms, T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 1001 is not limited to the cepstrum method and the autocorrelation method. In addition, the frequency band division filter 100
The frequency band of 3 is not limited to 20 Hz. Further, the threshold of the probability of the onset is not limited to 0.8. Also, the threshold of the certainty of the offset is 0.
It is not limited to 9. The method of calculating the probability of onset is not limited to (Equation 10). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). In addition, the method of calculating the above-mentioned probability of harmonicity is
3) Not limited to (Equation 14). The method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15).
【0228】なお、実施例9のように、前記周波数帯域
フィルタ1003はフーリエ変換をもちいてもよく、ま
たエネルギーの算出手段1006は実効値算出手段をも
ちいてもよい。As in the ninth embodiment, the frequency band filter 1003 may use Fourier transform, and the energy calculating means 1006 may use effective value calculating means.
【0229】(実施例8)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 8) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0230】第8の実施例における主たる構成図は図3
である。以上のように構成された雑音抑制装置の動作に
ついて説明する。信号の時間分割手段1000は音響信
号を時間T毎にδtの時間セグメントに分割する。入力
信号が音声信号であるので、δtは13ms、Tは26
msとする。前記信号の時間分割手段1000の形状は
ハニング窓とすると、前記信号の時間分割手段W(t+
kT)は(数1)で表すことができる。The main block diagram of the eighth embodiment is shown in FIG.
It is. The operation of the noise suppression device configured as above will be described. The signal time division means 1000 divides the acoustic signal into time segments of δt for each time T. Since the input signal is a voice signal, δt is 13 ms and T is 26
ms. If the shape of the signal time division means 1000 is a Hanning window, the signal time division means W (t +).
kT) can be expressed by (Equation 1).
【0231】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), S
ig (t + kT) is represented by (Equation 2).
【0232】ピッチ抽出手段1001は複数の抽出方法
を用いてSig(t+kT)のピッチを抽出する。図5
は前記ピッチ抽出手段1001の詳細図である。図5に
おいて、1200は第1のピッチ抽出手段、1201は
第2のピッチ抽出手段、1202は第nのピッチ抽出手
段、1203はピッチの推定値fp(t)の算出手段で
ある。第1のピッチ抽出手段1200によってピッチf
p1(kT)が、第2のピッチ抽出手段1201によって
ピッチfp2(kT)が、第nのピッチ抽出手段1202
によってピッチfpn(kT)が計算されたとする。この
とき、ピッチの推定値fp(t)の算出手段1203に
よって、ピッチの推定値fp(kT)は(数8)で求め
られる。The pitch extraction means 1001 extracts the pitch of Sig (t + kT) using a plurality of extraction methods. FIG.
FIG. 3 is a detailed view of the pitch extracting means 1001. In FIG. 5, reference numeral 1200 is a first pitch extraction means, 1201 is a second pitch extraction means, 1202 is an nth pitch extraction means, 1203 is a pitch estimated value f p (t) calculation means. The pitch f by the first pitch extracting means 1200.
p1 (kT) is the second pitch extraction means 1201 and the pitch f p2 (kT) is the nth pitch extraction means 1202.
Assume that the pitch f pn (kT) is calculated by. At this time, the estimated value f p calculation means 1203 (t) of the pitch, the estimated value of the pitch f p (kT) is calculated by equation (8).
【0233】また、fp1(kT)からfpn(kT)の分
散Vpitch(kT)を(数18)で求める。Also, the variance V pitch (kT) of f pn (kT) is calculated from f p1 (kT) by (Equation 18).
【0234】図3において、第1の記憶手段1002は
前記ピッチ抽出手段1001で求められたfp(kT)
と分散Vpitch(kT)を格納する。In FIG. 3, the first storage means 1002 stores f p (kT) obtained by the pitch extraction means 1001.
And the variance V pitch (kT).
【0235】また、周波数帯域分割フィルタ1003は
Sig(t+kT)を20Hzの周波数帯域にN分割す
る。前記周波数帯域分割フィルタ1003の出力をSi
g(t+kT,fm)と記述する(m=1,2,・・・
・N)。fmは帯域の中心周波数である。N個の狭帯域
信号Sig(t+kT,fm)は第2の記憶手段100
4に格納される。エネルギー算出手段1005では各S
ig(t+kT,fm)のエネルギーを算出する。前記
エネルギー算出手段1005のN個の出力をEne(k
T,fm)と記述する。Ene(kT,fm)は(数3)
で算出される。The frequency band dividing filter 1003 divides Sig (t + kT) into N frequency bands of 20 Hz. The output of the frequency band division filter 1003 is Si
It is described as g (t + kT, f m ) (m = 1, 2, ...
・ N). f m is the center frequency of the band. The N narrow band signals Sig (t + kT, f m ) are stored in the second storage means 100.
Stored in 4. In the energy calculation means 1005, each S
The energy of ig (t + kT, f m ) is calculated. The N outputs of the energy calculating means 1005 are converted into Ene (k
T, f m ). Ene (kT, f m ) is (Equation 3)
Is calculated.
【0236】前記N個のEne(kT,fm)は第3の
記憶手段1006に格納される。特徴量の算出手段10
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量としてピッチ、オンセット、オンセ
ットの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 1006. Feature amount calculation means 10
07 calculates the feature amount of Sig (t + kT, f m ).
In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts.
【0237】図6は図3の特徴量の算出手段1007の
詳細図である。1301はピッチの評価測度の算出手
段、1302はオンセットの評価測度の算出手段、13
03はオフセットの評価測度の算出手段、1304は連
続性の評価測度の算出手段、1305は調波性の評価測
度の算出手段、1306はオンセットの同期性の評価測
度の算出手段、1307はオフセットの同期性の評価測
度の算出手段である。また、評価測度としてSig(t
+kT,fm)で各特徴量が存在する確からしさを用い
る。FIG. 6 is a detailed diagram of the feature amount calculating means 1007 of FIG. 1301 is a pitch evaluation measure calculation means, 1302 is an onset evaluation measure calculation means, 13
Reference numeral 03 is an offset evaluation measure calculation unit, 1304 is a continuity evaluation measure calculation unit, 1305 is a harmonic evaluation measure calculation unit, 1306 is an onset synchronization evaluation measure calculation unit, and 1307 is an offset. Is a means of calculating an evaluation measure of synchronism. Also, as an evaluation measure, Sig (t
+ KT, f m ) The probability that each feature quantity exists is used.
【0238】以下で各特徴量の評価測度の算出手段につ
いて詳細に説明する。前記ピッチの評価測度の算出手段
は、前記ピッチ抽出手段1001で計算された分散V
pitch(kT)から推定されたピッチfp(kT)の確か
らしさを決定する。Vpitch(kT)が0の時ピッチは
正確に抽出されたとしピッチfp(kT)の確からしさ
は1とする。Vpitch(kT)が大きくなると確からし
さは減少する。ピッチの確からしさが図27のようにV
pitch(kT)の値によってガウス分布するとすると、
ピッチの確からしさRel(Vpitch(kT))が(数
19)で決定される。The calculation means of the evaluation measure of each feature will be described in detail below. The pitch evaluation measure calculation means is the variance V calculated by the pitch extraction means 1001.
The probability of the pitch f p (kT) estimated from the pitch (kT) is determined. When V pitch (kT) is 0, it is assumed that the pitch is accurately extracted, and the probability of the pitch f p (kT) is 1. The probability decreases as V pitch (kT) increases. The pitch accuracy is V as shown in Fig. 27.
If Gaussian distribution is used depending on the value of pitch (kT),
The certainty of the pitch Rel (V pitch (kT)) is determined by (Equation 19).
【0239】同時に、図28のように得られたピッチの
推定値fp(kT)に対しあるピッチが存在しうる範囲
を確率的に定義しSig(kT,fm)がピッチである
確からしさを算出する。ピッチの推定値fp(kT)に
対してピッチが存在する確からしさがガウス分布をする
とするとSig(kT,fm)にピッチが存在する確か
らしさRel_pitch(kT,fm)は(数20)で与え
られる。At the same time, with respect to the estimated value f p (kT) of the pitch obtained as shown in FIG. 28, the range in which a certain pitch can exist is stochastically defined, and the probability that Sig (kT, f m ) is the pitch. To calculate. If the probability that the pitch exists with respect to the estimated value f p (kT) of the pitch has a Gaussian distribution, the probability that the pitch exists in Sig (kT, f m ) Rel_pitch (kT, f m ) is ( Equation 20). ) Is given.
【0240】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when a harmonic composite sound composed of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0241】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。オンセットの評価測度の算出手段1302ではこ
の変化が一つの音の時間変化ではなく図9(b)のよう
に異なるもう一つの信号が加わったために起こったもの
であるという確からしさを人間の知覚に基づき定めこれ
をオンセットの確からしさとする。前記オンセットの確
からしさは前記第3の記憶手段1006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。前記
エネルギー算出手段1005の出力を用いて現観測時刻
のエネルギーとそれより前の時刻までのエネルギーの平
均から前記オンセットの確からしさを定める。図10は
オンセットの確からしさの算出方法のための説明図であ
る。前記前時刻までのエネルギーの平均は現観測周波数
とその周波数に近接する2つの周波数帯域における約2
00ms区間(16個のセグメント)のセグメントの平
均とする。Sig(kT,fm)の前記オンセットの確
からしさRel_on(EDif)は(数10)で算出され
る。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. In the onset evaluation measure calculation means 1302, the human perception is assured that this change is not due to the time change of one sound but due to the addition of another different signal as shown in FIG. 9B. Based on the above, this is the onset certainty. The probability of the onset is calculated from the output of the third storage unit 1006. An example of the calculation method will be given below. The loudness of the sound that changes just the psychologically continuous judgment or whether a new sound is added is being investigated (19
Proceedings of the 94th Autumn Meeting of ASJ 2-7-18). Using the output of the energy calculation means 1005, the probability of the onset is determined from the average of the energy at the current observation time and the energy before the current time. FIG. 10 is an explanatory diagram for a method of calculating the probability of onset. The average of the energies up to the previous time is about 2 in the current observation frequency and two frequency bands close to that frequency.
The average of the segments in the 00 ms section (16 segments) is used. Sig (kT, f m) the probability Rel _on the onset of (E Dif) is calculated by the equation (10).
【0242】図11は(数10)を図式化したものであ
る。前記オンセットの確からしさはピッチ帯域でオンセ
ットが検出されるまでピッチ帯域でのみ計算される。図
12及び図13は図8の信号に対する前記オンセットの
確からしさを説明する説明図である。図12において時
刻k=2でピッチ帯域の前記オンセットの確からしさが
1.0となり閾値0.8を越えたので時刻k=2から全
周波数帯域で前記オンセットの確からしさの計算を始め
る。(k,m)=(2,1)と(2,3)で前記オンセ
ットの確からしさ1.0が算出できたとする。この時、
図13のように(k,m)=(2,1)と(2,3)に
前記オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). The onset certainty is calculated only in the pitch band until an onset is detected in the pitch band. 12 and 13 are explanatory views for explaining the certainty of the onset for the signal of FIG. In FIG. 12, at time k = 2, the probability of the onset in the pitch band becomes 1.0 and exceeds the threshold value 0.8. Therefore, from time k = 2, the calculation of the probability of the onset in the entire frequency band is started. It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). This time,
As shown in FIG. 13, the probability of onset 1.0 is assigned to (k, m) = (2, 1) and (2, 3).
【0243】オフセットの評価測度の算出手段1303
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記エネルギーの算出手段1005の出
力を用いてオフセットを定める。前記オフセットの確か
らしさRel_off(EDif)は前記オンセットの確から
しさの算出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1303
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the energy calculating means 1005. The offset probability Rel_off (E Dif ) is given by ( Equation 11) as in the method of calculating the onset reliability.
【0244】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図214及び図
15は図8の信号に対する前記オフセットの確からしさ
を説明する説明図である。The certainty of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIGS. 214 and 15 are explanatory views for explaining the probability of the offset with respect to the signal of FIG.
【0245】図14において時刻k=6でピッチ帯域の
前記オフセットの確からしさが1.0となりある閾値
0.9を越えたので時刻k=6において前記オフセット
の確からしさを全周波数帯域について算出する。(k,
m)=(6,1)と(6,3)で前記オフセットの確か
らしさ1.0を算出できたとすると図15のように前記
オフセットの確からしさを割り当てる。In FIG. 14, at time k = 6, the probability of the offset in the pitch band is 1.0, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. . (K,
If m) = (6,1) and (6,3) can calculate the offset certainty of 1.0, the offset certainty is assigned as shown in FIG.
【0246】連続性の評価測度の算出手段1304で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段1006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントのエネルギーの平均と現
観測周波数とその周波数に隣接する2つの周波数帯域に
おける現観測時刻を含まない現観測時刻より前の約20
0ms区間(16個のセグメント)のエネルギーの平均
から前記連続性の確からしさを決定する。前記連続性の
確からしさRel_con(EDif)は(数12)で定義す
る。The continuity evaluation measure calculating means 1304 uses as an index the certainty that, when the loudness of the sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated by the output of the third storage unit 1006. FIG. 16 is an explanatory diagram for a method of calculating the likelihood of continuity. In FIG. 16, the average of the energy of the current observation segment in about 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are included. About 20 before the current observation time
The probability of the continuity is determined from the average of the energies in the 0 ms section (16 segments). The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0247】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the continuity of each (k, m) is calculated. Probability is calculated as shown in FIG.
【0248】調波性の評価測度の算出手段1305で
は、Sig(t+kT,fm)が前記fp(kT)に対し
て知覚上調波関係である確からしさをもって調波性の確
からしさとする。ピッチの整数倍の周波数区間を中心に
主観的に調波性を感じる周波数分布を人間の心理測定関
数から定める。心理測定関数は電子情報通信学会論文
誌'94/5Vol.J77-ANo.5 731-740に掲載のデータを参考
に決める。周波数帯域の中心周波数fmでの前記ピッチ
fp(kT)のp倍(pは整数)の周波数からのずれu
が(数13)で求められる。The calculation unit 1305 of the evaluation measure of the harmonic property determines the probability of the harmonic property by the probability that Sig (t + kT, f m ) is perceptually harmonic with respect to the f p (kT). A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. The psychometric function is determined by referring to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740. Deviation u from the frequency of p times (p is an integer) the pitch f p (kT) at the center frequency f m of the frequency band
Is calculated by (Equation 13).
【0249】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned harmonic accuracy
_harm (u) is defined using u as in (Equation 14).
【0250】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0251】オンセットの同期性の評価測度の算出手段
1306では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5 731-740に掲載のデ
ータを参考に前記同期性の確からしさの分布Rel_syn
c(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。Onset synchronicity evaluation measure calculation means 1306 determines that the onset at Sig (t + kT, f m ) is subjectively simultaneous based on the onset time of f p (kT). The synchronicity is determined based on the time distribution. The perceptual onset synchrony is based on the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5 731-740.
c (kT, f m ) is defined by (Equation 15). Sig (t +
When the onset is detected at kT, f m ) and the difference in the onset time of the pitch closest to it is v (ms), the certainty of the onset synchronism Rel_sync
(KT, f m ) can be described by (Equation 15).
【0252】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0253】オフセットの同期性の評価測度の算出手段
1307は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1307 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0254】図3の重み値の算出手段1008では、評
価関数に各特徴(ピッチ、オンセット、オフセット、オ
ンセットの同期性、オフセットの同期性、調波性、連続
性)についての確からしさを入力し、Sig(t+k
T,fm)での重み値w(t+kT,fm)を算出する。In the weight value calculating means 1008 shown in FIG. 3, the reliability of each feature (pitch, onset, offset, onset synchronism, offset synchronism, harmonicity, continuity) is assigned to the evaluation function. Input, Sig (t + k
The weight value w (t + kT, f m ) at T, f m ) is calculated.
【0255】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記パワーの連続性の確からしさを統合して前記
継時的確からしさとする。また、前記ピッチの確からし
さ、前記ピッチの変動の範囲の確からしさ、前記調波性
の確からしさを統合して前記周波数的確からしさとす
る。[0255] Of the characteristic amounts, the ones are classified into those related to the continuous certainty and those related to the frequency certainty, and the respective certainties are integrated. The onset accuracy, the onset synchronization accuracy, the offset accuracy, the offset synchronization accuracy, and the power continuity accuracy are integrated into the continuous accuracy. And Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated into the certainty of the frequency.
【0256】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。FIG. 29 is a flow chart regarding the calculation of the evaluation value. At the time when the onset is detected, the continuous certainty is given by the product of the certainty of the onset and the certainty of the synchronism, and is calculated by (Equation 21).
【0257】オンセットが検出された後オフセットが検
出されるまでの時間では前記継時的確からしさRel_t
(kT,fm)は前時刻の前記継時的確からしさと前時
刻との前記連続性の確からしさとの積で与えられ(数2
2)で算出される。In the time from the detection of the onset to the detection of the offset, the continuous certainty Rel_t is set.
(KT, f m ) is given by the product of the continuous probability of the previous time and the probability of the continuity of the previous time (Equation 2).
Calculated in 2).
【0258】図4400は前記継時的確からしさの分布
の一例である。また前記周波数的確からしさRel
_f(kT,fm)は(数23)で表現できる。FIG. 4400 is an example of the distribution of the above-mentioned successive probability. Also, the frequency accuracy Rel
_f (kT, f m) can be expressed by equation (23).
【0259】前記継時的確からしさと前記周波数的確か
らしさの重視度をg_t(kT,fm),g_f(kT,
fm)とする。The importance of the continuous certainty and the frequency certainty is g_t (kT, f m ), g_f (kT,
f m) to.
【0260】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。In this embodiment, λ-fuzzy integration is used as the evaluation function. At this time, the comprehensive evaluation value w (kT, f m ) can be calculated by (Equation 24).
【0261】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。FIG. 31 shows an example of the calculation result of the comprehensive evaluation value. However, g_t (kT, f m) = g_f (kT, f m),
λ = 0.
【0262】図3の乗算手段1009はSig(t+k
T,fm)と前記評価値w(kT,fm)を乗算する。前
記乗算手段1009の出力は第4の記憶手段1010に
格納される。総和手段1011は全てのk,mについ
て、w(kT,fm)×Sig(t+kT,fm)を総和
する。前記総和手段1011の出力は雑音が抑制された
音響信号となっている。The multiplication means 1009 of FIG. 3 uses Sig (t + k
T, f m ) is multiplied by the evaluation value w (kT, f m ). The output of the multiplication means 1009 is stored in the fourth storage means 1010. The summing means 1011 sums w (kT, f m ) × Sig (t + kT, f m ) for all k, m. The output of the summing means 1011 is an acoustic signal in which noise is suppressed.
【0263】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また、前記ピッチ抽出手段1001
はケプストラム法、自己相関法に限ったものではない。
また、前記周波数帯域分割フィルタ1003の周波数帯
域は20Hzに限ったものではない。また、前記オンセ
ットの確からしさの閾値は0.8に限らない。また、前
記オフセットの確からしさの閾値は0.9に限らない。
また、前記オンセットの確からしさの算出方法は(数1
0)に限らない。また、前記オフセットの確からしさの
算出方法は(数11)に限らない。また、前記調波性の
確からしさの算出方法は(数13)(数14)に限らな
い。また、オンセットの同期性の確からしさの算出方法
やオフセットの同期性の確からしさの算出方法は(数1
5)に限らない。また、ピッチが存在する確からしさの
算出においてガウス分布以外の分布で定義してもよい。Note that it is not necessary to use all the feature quantities if the harmonic content or the continuity is included in each of the feature quantities. Further, a feature amount other than the feature amount may be newly combined. Also, the pitch extracting means 1001
Is not limited to the cepstrum method and the autocorrelation method.
The frequency band of the frequency band division filter 1003 is not limited to 20 Hz. Further, the threshold of the probability of the onset is not limited to 0.8. Further, the threshold value of the certainty of the offset is not limited to 0.9.
In addition, the calculation method of the probability of the onset is (Equation 1
It is not limited to 0). The method of calculating the certainty of the offset is not limited to (Equation 11). Further, the method of calculating the probability of harmonicity is not limited to (Equation 13) and (Equation 14). In addition, the method of calculating the onset synchronicity probability and the method of calculating the offset synchronism probability are described in (Equation 1)
It is not limited to 5). Further, in the calculation of the probability that the pitch exists, it may be defined by a distribution other than the Gaussian distribution.
【0264】なお、実施例9のように、前記周波数帯域
フィルタ1003はフーリエ変換をもちいてもよく、ま
たエネルギーの算出手段1006は実効値算出手段を用
いてもよい。As in the ninth embodiment, the frequency band filter 1003 may use Fourier transform, and the energy calculating means 1006 may use an effective value calculating means.
【0265】(実施例9)以下本発明の信号分離装置に
おける一実施例について、図面を参照しながら説明す
る。(Embodiment 9) An embodiment of the signal separation device of the present invention will be described below with reference to the drawings.
【0266】図32は本発明の第9の実施例における雑
音抑制装置の構成を示す構成図である。図32におい
て、9000は信号の時間切り出しを行う信号の時間分
割手段、9001はピッチ抽出手段、9002は第1の
記憶手段、9003はフーリエ変換手段、9004は第
2の記憶手段、9005は実効値算出手段、9006は
第3の記憶手段、9007は特徴量の算出手段、900
8は重み値の算出手段、9009は乗算手段、9010
はフーリエ逆変換手段、9011は第4の記憶手段、9
012は総和手段である。FIG. 32 is a block diagram showing the structure of the noise suppressing apparatus according to the ninth embodiment of the present invention. In FIG. 32, reference numeral 9000 is a signal time division means for performing time division of a signal, 9001 is a pitch extraction means, 9002 is a first storage means, 9003 is a Fourier transform means, 9004 is a second storage means, and 9005 is an effective value. Calculation means, 9006 is third storage means, 9007 is feature amount calculation means, 900
8 is a weight value calculation means, 9009 is a multiplication means, 9010
Is the inverse Fourier transform means, 9011 is the fourth storage means, 9
012 is a summing means.
【0267】以上のように構成された雑音抑制装置の動
作について説明する。信号の時間分割手段9000は音
響信号を時間T毎にδtの時間セグメントに分割する。
入力信号が音声信号であるので、δtは13ms、Tは
26msとする。前記信号の時間分割手段9000の形
状はハニング窓とすると、前記信号の時間分割手段W
(t+kT)は(数1)で表すことができる。The operation of the noise suppressor configured as above will be described. The signal time division means 9000 divides the acoustic signal into time segments of δt for each time T.
Since the input signal is a voice signal, δt is 13 ms and T is 26 ms. If the shape of the signal time division means 9000 is a Hanning window, then the signal time division means W will be described.
(T + kT) can be expressed by (Equation 1).
【0268】前記信号の時間分割手段W(t+kT)の
出力信号をSig(t+kT)(t=0〜δt)とす
る。入力音声をSpeech(t+kT)とすると、S
ig(t+kT)は(数2)で表される。The output signal of the signal time division means W (t + kT) is Sig (t + kT) (t = 0 to δt). If the input voice is Speech (t + kT), S
ig (t + kT) is represented by (Equation 2).
【0269】ピッチ抽出手段9001はSig(t+k
T)のピッチを抽出する。ピッチは、ケプストラム法、
自己相関法などを用いて抽出される。第1の記憶手段9
002は前記ピッチ抽出手段9001で求められたピッ
チfp(kT)を格納する。また、フーリエ変換手段9
003はSig(t+kT)をフーリエ変換する。この
時の周波数分解能は20Hzとする。前記フーリエ変換
手段9003の出力をSig(t+kT,fm)と記述
する(m=1,2,・・・・N)。fmは周波数であ
る。N個の周波数サンプル点Sig(t+kT,fm)
は、第2の記憶手段9004に格納される。実効値算出
手段9005では、各Sig(t+kT,f m)の実効
値を算出する。前記実効値算出手段9005のN個の出
力をEne(kT,fm)と記述する。Ene(kT,
fm)は(数25)で算出される。The pitch extracting means 9001 uses Sig (t + k
Extract the pitch of T). The pitch is the cepstrum method,
It is extracted using an autocorrelation method or the like. First storage means 9
002 is the pitch obtained by the pitch extraction means 9001.
Chi fpStore (kT). Also, the Fourier transform means 9
003 Fourier transforms Sig (t + kT). this
The frequency resolution at that time is 20 Hz. Fourier transform
The output of the means 9003 is Sig (t + kT, fm) And description
(M = 1, 2, ... N). fmIs the frequency
You. N frequency sampling points Sig (t + kT, fm)
Are stored in the second storage means 9004. RMS value calculation
In the means 9005, each Sig (t + kT, f m) Effective
Calculate the value. N output of the effective value calculation means 9005
Force is Ene (kT, fm). Ene (kT,
fm) Is calculated by (Equation 25).
【0270】[0270]
【数25】 (Equation 25)
【0271】前記N個のEne(kT,fm)は第3の
記憶手段9006に格納される。特徴量の算出手段90
07はSig(t+kT,fm)の特徴量を算出する。
本実施例では特徴量としてピッチ、オンセット、オンセ
ットの同期性、オフセット、オフセットの同期性、連続
性、調波性を算出する。The N pieces of Ene (kT, f m ) are stored in the third storage means 9006. Feature amount calculation means 90
07 calculates the feature amount of Sig (t + kT, f m ).
In the present embodiment, pitch, onset, onset synchronism, offset, offset synchronism, continuity, and harmonicity are calculated as feature amounts.
【0272】[0272]
【数26】 (Equation 26)
【0273】図5は本実施例の特徴量の算出手段900
7の詳細図である。1201はピッチの評価測度の算出
手段、1202はオンセットの評価測度の算出手段、1
203はオフセットの評価測度の算出手段、1204は
連続性の評価測度の算出手段、1205は調波性の評価
測度の算出手段、1206はオンセットの同期性の評価
測度の算出手段、1207はオフセットの同期性の評価
測度の算出手段、また、評価測度としてSig(t+k
T,fm)で各特徴量が存在する確からしさを用いる。
以下で各特徴量の評価測度の算出手段について詳細に説
明する。FIG. 5 is a characteristic amount calculation means 900 of this embodiment.
FIG. 7 is a detailed view of FIG. 1201 is a pitch evaluation measure calculation means; 1202 is an onset evaluation measure calculation means;
Reference numeral 203 is an offset evaluation measure calculating means, 1204 is a continuity evaluation measure calculating means, 1205 is a harmonic evaluation measure calculating means, 1206 is an onset synchronization evaluation measure calculating means, 1207 is an offset. Of the evaluation measure of the synchronism of Sig (t + k)
The probability that each feature quantity exists in T, f m ) is used.
The calculation means of the evaluation measure of each feature will be described in detail below.
【0274】ピッチの評価測度の算出手段1201にお
いて、fp(kT)に対しピッチが存在しうる範囲を確
率的に定義しSig(kT,fm)がピッチである確か
らしさを算出する。図7はピッチが存在しうる周波数の
確率分布の一例である。前記fp(kT)に対してピッ
チが存在する確からしさがガウス分布をするとすると前
記Sig(kT,fm)にピッチが存在する確からしさR
el_pitch(kT,fm)は(数9)によって与えられ
る。The pitch evaluation measure calculation means 1201 stochastically defines the range in which the pitch can exist with respect to f p (kT), and calculates the probability that Sig (kT, f m ) is the pitch. FIG. 7 is an example of a probability distribution of frequencies in which pitch may exist. If the probability that the pitch exists with respect to f p (kT) has a Gaussian distribution, the probability that the pitch exists with Sig (kT, f m ) R
el_pitch (kT, fm) is given by (Equation 9).
【0275】図8は2つの成分から成る調波複合音が時
刻k=2からk=6まで持続した時のスペクトル図であ
る。この信号に関して以下の各確からしさの算出手段に
ついて説明する。FIG. 8 is a spectrum diagram when a harmonic compound sound composed of two components continues from time k = 2 to k = 6. With respect to this signal, the following means for calculating each likelihood will be described.
【0276】図9は音の大きさの変化に対する聴覚知覚
に関する模式図である。図9(a)のように一つの信号
にもう一つの信号が加わったとき音の大きさには変化が
ある。前記オンセットの評価測度の算出手段1202で
はこの変化が一つの音の時間変化ではなく図9(b)の
ように異なるもう一つの信号が加わったために起こった
ものであるという確からしさを人間の知覚に基づき定め
これをオンセットの確からしさとする。前記オンセット
の確からしさは第3の記憶手段9006の出力によって
算出される。以下に算出方法の一つの例を挙げる。心理
学的に連続にきこえるか新たに音が加わったかという判
断基準が丁度変化する音の大きさが調べられている(19
94年日本音響学会秋期研究発表会稿論集2-7-18)。実効
値算出手段9005の出力を用いて現観測時刻の実効値
とそれより前の時刻までの実効値の平均から前記オンセ
ットの確からしさを定める。図10はオンセットの確か
らしさの算出方法のための説明図である。前記前時刻ま
での実効値の平均は、現観測周波数とその周波数に近接
する2つの周波数帯域における約200ms区間(16
個のセグメント)のセグメントの平均とする。Sig
(kT,fm)の前記オンセットの確からしさRel_on
(EDif)は(数10)で算出される。FIG. 9 is a schematic diagram relating to auditory perception with respect to changes in loudness. When another signal is added to one signal as shown in FIG. 9A, there is a change in the loudness of the sound. The onset evaluation measure calculation means 1202 confirms that the change is not caused by the time change of one sound but by the addition of another different signal as shown in FIG. 9B. Determined based on perception, this is the onset certainty. The probability of the onset is calculated by the output of the third storage means 9006. An example of the calculation method will be given below. The loudness of the sound that changes just the psychologically continuous judgment or whether a new sound is added is being investigated (19
Proceedings of the 94th Autumn Meeting of ASJ 2-7-18). Using the output of the effective value calculation means 9005, the certainty of the onset is determined from the average of the effective values at the current observation time and the effective values up to the previous time. FIG. 10 is an explanatory diagram for a method of calculating the probability of onset. The average of the effective values up to the previous time is about 200 ms interval (16 ms) in the current observation frequency and two frequency bands close to that frequency.
Number of segments). Sig
Probability of the onset of (kT, f m ) Rel_on
(E Dif ) is calculated by ( Equation 10).
【0277】図11は(数10)を図式化したものであ
る。オンセットの確からしさはピッチ帯域でオンセット
が検出されるまでピッチ帯域でのみ計算される。図12
及び図13は図8の信号に対する前記オンセットの確か
らしさを説明する説明図である。図12において時刻k
=2でピッチ帯域の前記オンセットの確からしさが1.
0となり閾値0.8を越えたので時刻k=2から全周波
数帯域で前記オンセットの確からしさの計算を始める。
(k,m)=(2,1)と(2,3)で前記オンセット
の確からしさ1.0が算出できたとする。この時図27
00のように(k,m)=(2,1)と(2,3)に前
記オンセットの確からしさ1.0を割り当てる。FIG. 11 is a diagrammatic representation of (Equation 10). Onset certainty is calculated only in the pitch band until the onset is detected in the pitch band. FIG.
13 and FIG. 13 are explanatory diagrams for explaining the certainty of the onset with respect to the signal of FIG. Time k in FIG.
= 2, the probability of the onset of the pitch band is 1.
Since it becomes 0 and exceeds the threshold value 0.8, the calculation of the probability of the onset is started from the time k = 2 in the entire frequency band.
It is assumed that the onset certainty factor 1.0 can be calculated by (k, m) = (2, 1) and (2, 3). Figure 27 at this time
As in 00, (k, m) = (2, 1) and (2, 3) are assigned the onset certainty of 1.0.
【0278】オフセットの評価測度の算出手段1203
においてオフセットの確からしさが算出される。二つの
信号から一方の信号が除かれたとき音の大きさには変化
がある。そこで前記実効値の算出手段9005の出力を
用いてオフセットを定める。前記オフセットの確からし
さRel_off(EDif)は前記オンセットの確からしさの算
出方法と同様に(数11)で与えられる。Offset evaluation measure calculation means 1203
At, the accuracy of the offset is calculated. There is a change in loudness when one signal is removed from the two signals. Therefore, the offset is determined by using the output of the effective value calculation means 9005. Likelihood Rel_ off of the offset (E Dif) is given by the same method of calculating the likelihood of the onset (11).
【0279】前記オフセットの確からしさはオンセット
が検出されてからピッチ帯域でオフセットが検出される
までピッチ周波数帯域のみ計算される。図14及び図1
5は図8の信号に対する前記オフセットの確からしさを
説明する説明図である。図14において時刻k=6でピ
ッチ帯域の前記オフセットの確からしさが1.0となり
ある閾値0.9を越えたので時刻k=6において前記オ
フセットの確からしさを全周波数帯域について算出す
る。(k,m)=(6,1)と(6,3)で前記オフセ
ットの確からしさ1.0を算出できたとすると図15の
ように前記オフセットの確からしさを割り当てる。The probability of the offset is calculated only in the pitch frequency band from the detection of the onset to the detection of the offset in the pitch band. FIG. 14 and FIG.
FIG. 5 is an explanatory diagram for explaining the probability of the offset with respect to the signal of FIG. In FIG. 14, the probability of the offset in the pitch band is 1.0 at time k = 6, which exceeds a certain threshold value 0.9. Therefore, at time k = 6, the accuracy of the offset is calculated for all frequency bands. If the probability of offset 1.0 can be calculated by (k, m) = (6, 1) and (6, 3), the probability of offset is assigned as shown in FIG.
【0280】連続性の評価測度の算出手段1204で
は、音の大きさが時間的に変化したときそれが一つの信
号の時間変化である確からしさを指標とする。前記連続
性の確からしさは前記第3の記憶手段9006の出力に
よって算出される。図16は連続性の確からしさの算出
方法のための説明図である。図16において、現観測時
刻を含む現観測時刻以前約200ms区間(16個のセ
グメント)の現観測セグメントの実効値の平均と現観測
周波数とその周波数に隣接する2つの周波数帯域におけ
る現観測時刻を含まない現観測時刻より前の約200m
s区間(16個のセグメント)の実効値の平均から前記
連続性の確からしさを決定する。前記連続性の確からし
さRel_con(EDif)は(数12)で定義する。[0280] The continuity evaluation measure calculating means 1204 uses as an index the certainty that, when the loudness of the sound changes with time, it is the change with time of one signal. The certainty of the continuity is calculated from the output of the third storage unit 9006. FIG. 16 is an explanatory diagram for a method of calculating the likelihood of continuity. In FIG. 16, the average of the effective values of the current observation segment in the approximately 200 ms interval (16 segments) before the current observation time including the current observation time, the current observation frequency, and the current observation time in two frequency bands adjacent to the frequency are shown. About 200m before the current observation time not included
The certainty of the continuity is determined from the average of the effective values in the s section (16 segments). The probability of continuity Rel_con (E Dif ) is defined by ( Equation 12).
【0281】図17は(数12)を図式化したものであ
る。前記連続性の確からしさは、オンセットが検出され
た後オフセットが検出されるまで計算される。図18は
図8の信号に対する前記連続性の確からしさを説明する
説明図である。時刻k=2でオンセットが時刻k=6で
オフセットが検出されたとき、時刻k=3から5までの
間前記連続性の確からしさが計算され、各(k,m)で
の連続性の確からしさが図18のように算出される。FIG. 17 is a diagrammatic representation of (Equation 12). The likelihood of continuity is calculated until the offset is detected after the onset is detected. FIG. 18 is an explanatory diagram for explaining the certainty of the continuity with respect to the signal of FIG. When the onset is detected at the time k = 2 and the offset is detected at the time k = 6, the certainty of the continuity is calculated from the time k = 3 to 5, and the continuity of each (k, m) is calculated. Probability is calculated as shown in FIG.
【0282】調波性の評価測度の算出手段1205で
は、Sig(t+kT,fm)がfp(kT)に対して知
覚上調波関係である確からしさをもって調波性の確から
しさとする。ピッチの整数倍の周波数区間を中心に主観
的に調波性を感じる周波数分布を人間の心理測定関数か
ら定める。心理測定関数は電子情報通信学会論文誌'94/
5Vol.J77-ANo.5731-740に掲載のデータを参考に決め
る。周波数帯域の中心周波数fmでの前記ピッチfp(k
T)のp倍(pは整数)の周波数からのずれuが(数1
3)で求められる。In the harmonic measure evaluation measure calculation means 1205, the probability that Sig (t + kT, f m ) has a perceptual harmonic relationship with f p (kT) is regarded as the accuracy of harmonic. A frequency distribution that subjectively senses harmonics is determined from a human psychological measurement function centering on a frequency section that is an integral multiple of the pitch. Psychological measurement functions are published in IEICE Transactions '94 /
5 Determine based on the data published in Vol.J77-A No.5731-740. The pitch f p (k at the center frequency f m of the frequency band
The deviation u from the frequency that is p times (T is p) (p is an integer) is (Equation 1)
Required in 3).
【0283】前記調波性の確からしさの分布関数Rel
_harm(u)はuを用いて(数14)のように定義す
る。Distribution function Rel of the above-mentioned harmonic probability
_harm (u) is defined using u as in (Equation 14).
【0284】図19は(数14)を図式化したものであ
る。図20は図8の信号に対する前記調波性の確からし
さを説明する説明図である。図20ではピッチの確から
しさを1としている。FIG. 19 is a diagrammatic representation of (Equation 14). FIG. 20 is an explanatory diagram for explaining the certainty of the harmonic property with respect to the signal of FIG. In FIG. 20, the probability of pitch is 1.
【0285】オンセットの同期性の評価測度の算出手段
1206では、Sig(t+kT,fm)でのオンセッ
トがfp(kT)のオンセット時刻を基準に主観的に同
時であると判断される時間分布に基づき同期性の確から
しさとする。知覚上のオンセットの同期性は電子情報通
信学会論文誌'94/5Vol.J77-ANo.5731-740に掲載のデー
タを参考に前記同期性の確からしさの分布Rel_sync
(kT,fm)を(数15)で定義する。Sig(t+
kT,fm)でオンセットが検出されたときそれと最も
近いピッチのオンセット時刻の差をv(ms)とする
と、前記オンセットの同期性の確からしさRel_sync
(kT,fm)は、(数15)で記述できる。The onset synchronicity evaluation measure calculating means 1206 judges that the onset at Sig (t + kT, f m ) is subjectively simultaneous on the basis of the onset time of f p (kT). The synchronicity is determined based on the time distribution. The perceptual onset synchronism is the distribution of the certainty of the synchronism, Rel_sync, with reference to the data published in IEICE Transactions '94 / 5 Vol.J77-A No.5731-740.
(KT, f m ) is defined by (Equation 15). Sig (t +
When the onset is detected at kT, f m ) and the difference in the onset time of the pitch closest to it is v (ms), the certainty of the onset synchronism Rel_sync
(KT, f m ) can be described by (Equation 15).
【0286】図21は(数15)を図式化したものであ
る。図22は図8の信号に対する前記オンセットの同期
性の確からしさを説明する説明図である。FIG. 21 is a diagrammatic representation of (Equation 15). FIG. 22 is an explanatory diagram for explaining the certainty of the onset synchronism with respect to the signal of FIG.
【0287】オフセットの同期性の評価測度の算出手段
1207は前記オンセットの同期性の評価測度と同様な
方法により算出できる。Sig(t+kT,fm)での
オフセットがfp(kT)のオフセット時刻を基準に主
観的に同時であると判断される時間分布に基づき前記オ
フセットの同期性の確からしさとする。図23は図8の
信号に対する前記オフセットの同期性の確からしさを説
明する説明図である。The offset synchronism evaluation measure calculating means 1207 can be calculated by the same method as the onset synchronism evaluation measure. The synchronism of the offset is determined based on the time distribution in which the offset at Sig (t + kT, f m ) is subjectively judged to be simultaneous based on the offset time of f p (kT). FIG. 23 is an explanatory diagram for explaining the certainty of the synchronization of the offset with respect to the signal of FIG.
【0288】図32の重み値の算出手段9008では、
評価関数に前記各特徴(ピッチ、オンセット、オフセッ
ト、オンセットの同期性、オフセットの同期性、調波
性、連続性)についての確からしさを入力し、Sig
(t+kT,fm)での重み値w(t+kT,fm)を算
出する。The weight value calculation means 9008 shown in FIG.
Probability about each of the above characteristics (pitch, onset, offset, synchronism of onset, synchronism of offset, harmonicity, continuity) is input to the evaluation function, and Sig is set.
(T + kT, f m) weight values w (t + kT, f m ) at is calculated.
【0289】各特徴量のうち継時的確からしさに関する
ものと周波数的確からしさに関するものに分類しそれぞ
れの確からしさの統合を行う。前記オンセットの確から
しさ、前記オンセットの同期性の確からしさ、前記オフ
セットの確からしさ、前記オフセットの同期性の確から
しさ、前記パワーの連続性の確からしさを統合して、前
記継時的確からしさとする。また、前記ピッチの確から
しさ、前記ピッチの変動の範囲の確からしさ、前記調波
性の確からしさを統合して、前記周波数的確からしさと
する。[0289] Of the feature amounts, the ones are classified into those related to the continuous certainty and those related to the frequency certainty, and the respective certainties are integrated. The on-set accuracy, the on-set synchronization accuracy, the offset accuracy, the offset synchronization accuracy, and the power continuity accuracy are integrated to obtain the continuous accuracy. Let's be like Further, the certainty of the pitch, the certainty of the range of variation of the pitch, and the certainty of the harmonic property are integrated to be the frequency certainty.
【0290】図29は評価値の計算に関する流れ図であ
る。オンセットが検出された時刻では前記継時的確から
しさは前記オンセットの確からしさと前記同期性の確か
らしさの積で与えられ(数21)で算出される。FIG. 29 is a flow chart regarding the calculation of the evaluation value. At the time when the onset is detected, the continuous certainty is given by the product of the certainty of the onset and the certainty of the synchronism, and is calculated by (Equation 21).
【0291】オンセットが検出された後オフセットが検
出されるまでの時間では、前記継時的確からしさRel
_t(kT,fm)は前時刻の前記継時的確からしさと前
時刻との前記連続性の確からしさとの積で与えられ、
(数22)で算出される。In the time from the detection of the onset to the detection of the offset, the continuous probability Rel
_t (kT, f m ) is given by the product of the continuous certainty of the previous time and the certainty of the continuity with the previous time,
It is calculated by (Equation 22).
【0292】図30は前記継時的確からしさの分布の一
例である。また前記周波数的確からしさRel_f(k
T,fm)は、(数23)で表現できる。FIG. 30 shows an example of the distribution of the successive probability. Also, the frequency accuracy Rel_f (k
T, f m ) can be expressed by (Equation 23).
【0293】前記継時的確からしさと、前記周波数的確
からしさの重視度をg_t(kT,f m),g_f(kT,
fm)とする。[0293] The continuous accuracy and the frequency accuracy are
The importance of karasashi is g_t (kT, f m), G_f (kT,
fm).
【0294】本実施例では、評価関数にλ−ファジィ積
分を用いる。このとき、総合評価値w(kT,fm)は
(数24)で計算できる。In this embodiment, λ-fuzzy integration is used as the evaluation function. At this time, the comprehensive evaluation value w (kT, f m ) can be calculated by (Equation 24).
【0295】図31は総合評価値の算出結果の一例であ
る。ただし、g_t(kT,fm)=g_f(kT,fm)、
λ=0である。FIG. 31 shows an example of the calculation result of the comprehensive evaluation value. However, g_t (kT, f m) = g_f (kT, f m),
λ = 0.
【0296】図32の乗算手段9009はSig(t+
kT,fm)と前記評価値w(kT,fm)を乗算する。
前記乗算手段190の出力は、第4の記憶手段9010
に格納される。フーリエ逆変換手段9011は全ての
k,mについて、w(kT,fm)×Sig(t+k
T,fm)をフーリエ逆変換する。前記フーリエ逆変換
手段9011の出力は雑音が抑制された音響信号となっ
ている。The multiplication means 9009 in FIG. 32 is Sig (t +
kT, f m) and the evaluation value w (kT, multiplying f m).
The output of the multiplication means 190 is the fourth storage means 9010.
Stored in. The inverse Fourier transform means 9011 uses w (kT, f m ) × Sig (t + k) for all k and m.
Inverse Fourier transform of T, f m ). The output of the inverse Fourier transform means 9011 is an acoustic signal in which noise is suppressed.
【0297】なお、前記各特徴量のうち前記調波性かま
たは前記連続性が含まれていれば全ての特徴量を用いる
必要はない。また、前記特徴量以外の特徴量を新たに組
み合わせてもよい。また。前記信号の時間分割手段90
00の時間幅δtや分割の時間周期Tは前記δt=13
ms、T=26msに限ったものではなく、形状もハニ
ング窓に限ったものではない。また、前記ピッチ抽出手
段9001はケプストラム法、自己相関法に限ったもの
ではない。また、前記フーリエ変換手段9003と前記
フーリエ逆変換手段9010の周波数分解能は20Hz
に限ったものではない。また、前記オンセットの確から
しさの閾値は0.8に限らない。また、前記オンセット
の確からしさの閾値は0.9に限らない。また、前記オ
ンセットの確からしさの算出方法は(数10)に限らな
い。また、前記オフセットの確からしさの算出方法は
(数11)に限らない。また、前記連続性の確からしさ
の算出方法は(数12)に限らない。また、前記調波性
の確からしさの算出方法は(数13)および(数14)
に限らない。また、オンセットの同期性の確からしさの
算出方法やオフセットの同期性の確からしさの算出方法
は(数15)に限らない。また、総合評価値の算出方法
はλ−ファジィ積分に限らず、菅野積分、ショケ積分、
逆菅野積分など他の手段でもよい。Note that it is not necessary to use all the feature quantities if the harmonic or the continuity is included in the feature quantities. Further, a feature amount other than the feature amount may be newly combined. Also. Time division means 90 for the signal
The time width δt of 00 and the division time period T are δt = 13.
ms, T = 26 ms, and the shape is not limited to the Hanning window. The pitch extracting means 9001 is not limited to the cepstrum method and the autocorrelation method. The frequency resolution of the Fourier transform means 9003 and the inverse Fourier transform means 9010 is 20 Hz.
It is not limited to. Further, the threshold of the probability of the onset is not limited to 0.8. Further, the threshold of the probability of the onset is not limited to 0.9. The method of calculating the probability of onset is not limited to (Equation 10). The method of calculating the certainty of the offset is not limited to (Equation 11). The method of calculating the certainty of continuity is not limited to (Equation 12). In addition, the calculation method of the probability of the above-mentioned harmonic property is (Equation 13) and (Equation 14)
Not limited to Further, the method of calculating the certainty of onset synchronism and the method of calculating the certainty of offset synchronism are not limited to (Equation 15). Further, the calculation method of the comprehensive evaluation value is not limited to λ-fuzzy integration, but Sugeno integration, Choquet integration,
Other means such as inverse Sugano integral may be used.
【0298】図33は前記構成によって得られた出力信
号のS/N比と残差を示す図である。図33の(A)は
入力信号のS/N比と残差、(B)はλ=−0.9のと
きのS/N比と残差、(C)はλ=0.9のときのS/
N比と残差である。図10000のように(B)(C)
とも(A)に比べてS/N比が増加し残差が減少してお
り、前記構成の効果が確認できる。FIG. 33 is a diagram showing the S / N ratio and the residual of the output signal obtained by the above configuration. 33 (A) is an S / N ratio and residual of the input signal, (B) is S / N ratio and residual when λ = −0.9, and (C) is λ = 0.9. S /
N ratio and residual. As shown in Fig. 10000 (B) (C)
In both cases, the S / N ratio is increased and the residual is decreased as compared with (A), and the effect of the above-mentioned configuration can be confirmed.
【0299】[0299]
【発明の効果】以下のように本発明は、信号の時間分割
手段、ピッチ抽出手段、第1の記憶手段、周波数帯域分
割手段、第2の記憶手段、エネルギーまたは実効値の算
出手段、第3の記憶手段、特徴量の算出手段、重み値の
算出手段、乗算手段、第4の記憶手段、総和手段を設け
ることにより、人間の聴覚が聴感上の雑音抑制のためい
利用している音の物理的な特徴を用いて入力信号の周波
数の重みづけを行うことにより雑音が混在した音響信号
から雑音を抑制することにより目的の音響信号を抽出こ
とができる優れた雑音抑制装置を実現するものである。As described below, the present invention provides the signal time division means, pitch extraction means, first storage means, frequency band division means, second storage means, energy or effective value calculation means, and third means. By providing the storage means, the feature amount calculation means, the weight value calculation means, the multiplication means, the fourth storage means, and the summation means, It realizes an excellent noise suppression device that can extract the target acoustic signal by suppressing the noise from the acoustic signal in which the noise is mixed by weighting the frequency of the input signal using physical characteristics. is there.
【図1】従来例における雑音抑制装置の構成を示すブロ
ック図FIG. 1 is a block diagram showing a configuration of a noise suppression device in a conventional example.
【図2】本発明の雑音抑制装置の構成図FIG. 2 is a block diagram of a noise suppression device of the present invention.
【図3】本発明の雑音抑制装置の実施例1及び実施例2
および実施例3および実施例4および実施例5および実
施例6および実施例7および実施例8における構成図FIG. 3 is a first embodiment and a second embodiment of the noise suppression device of the invention.
And configuration diagrams in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8.
【図4】本発明の雑音抑制装置の実施例1および実施例
2における特徴量の算出手段の一例を示す図FIG. 4 is a diagram showing an example of feature amount calculation means in Embodiments 1 and 2 of the noise suppression apparatus of the present invention.
【図5】本発明の雑音抑制装置の実施例2および実施例
5および実施例8および実施例9におけるピッチ抽出手
段の一例を示す図FIG. 5 is a diagram showing an example of pitch extracting means in the noise suppressing device according to the second and fifth embodiments and the eighth and ninth embodiments of the present invention.
【図6】本発明の雑音抑制装置の実施例3および実施例
4および実施例5および実施例6および実施例7および
実施例8における特徴量の算出手段の一例を示す図FIG. 6 is a diagram showing an example of a feature amount calculation means in a noise suppressing device according to the third and fourth embodiments, the fifth and sixth embodiments, and the seventh and eighth embodiments.
【図7】本発明の雑音抑制装置の実施例3および実施例
6および実施例9におけるピッチが存在する周波数の確
率分布の一例を示す図FIG. 7 is a diagram showing an example of a probability distribution of frequencies at which pitches exist in the noise suppressing device of the third embodiment, the sixth embodiment, and the ninth embodiment.
【図8】本発明の雑音抑制装置の実施例3および実施例
4およぴ実施例5および実施例6および実施例7および
実施例8および実施例9における動作の説明のための図FIG. 8 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4, and Example 5 and Example 6 and Example 7 and Example 8 and Example 9;
【図9】本発明の雑音抑制装置の実施例3および実施例
4および実施例5および実施例6および実施例7および
実施例8および実施例9においてオンセットである判断
の基準を説明するための音の大きさの変化に対する聴覚
知覚に関する模式図FIG. 9 is a graph for explaining the criteria for determining the onset in the noise suppressing device of the present invention in the third and fourth embodiments, the fifth and sixth embodiments, the sixth and seventh embodiments, and the eighth and ninth embodiments. Schematic diagram of auditory perception for changes in loudness of human
【図10】本発明の雑音抑制装置の実施例3および実施
例5および実施例6および実施例7および実施例8およ
び実施例9において、オンセットの確からしさの算出方
法の説明図FIG. 10 is an explanatory diagram of a method for calculating the probability of onset in the third and fifth embodiments of the present invention, the fifth embodiment, the sixth embodiment, the seventh embodiment, the eighth embodiment, and the ninth embodiment.
【図11】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数10)を図式化
した図FIG. 11 is a diagram schematically showing (Equation 10) in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9 of the noise suppressing device of the present invention.
【図12】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 12 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9;
【図13】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 13 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9.
【図14】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 14 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9.
【図15】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 15 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9.
【図16】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9において、連続性の確からし
さの算出方法の説明図FIG. 16 is a diagram for explaining a method of calculating the likelihood of continuity in the third and fourth embodiments, the fifth embodiment, the sixth embodiment, the seventh embodiment, the eighth embodiment, and the ninth embodiment of the noise suppressing device of the present invention. Figure
【図17】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数12)を図式化
した図FIG. 17 is a diagram schematically showing (Equation 12) in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9 of the noise suppressing device of the present invention.
【図18】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 18 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9.
【図19】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数14)を図式化
した図FIG. 19 is a diagram schematically showing (Equation 14) in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9 of the noise suppression device of the invention.
【図20】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 20 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9;
【図21】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における(数15)を図式化
した図FIG. 21 is a diagram schematically showing (Equation 15) in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9 of the noise suppression device of the invention.
【図22】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 22 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9;
【図23】本発明の雑音抑制装置の実施例3および実施
例4および実施例5および実施例6および実施例7およ
び実施例8および実施例9における動作の説明のための
図FIG. 23 is a diagram for explaining the operation of the noise suppression device of the present invention in Example 3 and Example 4 and Example 5 and Example 6 and Example 7 and Example 8 and Example 9;
【図24】本発明の雑音抑制装置の実施例4および実施
例7におけるピッチ抽出手段の一例を示す図FIG. 24 is a diagram showing an example of pitch extracting means in Embodiment 4 and Embodiment 7 of the noise suppressing device of the invention.
【図25】本発明の雑音抑制装置の実施例4および実施
例7におけるピッチの確からしさの分布の一例を示す図FIG. 25 is a diagram showing an example of a pitch certainty distribution in Embodiments 4 and 7 of the noise suppression apparatus of the present invention.
【図26】本発明の雑音抑制装置の実施例4および実施
例7において、ピッチの推定値に対しピッチが存在する
確率分布の一例を示す図FIG. 26 is a diagram showing an example of a probability distribution in which a pitch exists with respect to an estimated pitch value in Embodiments 4 and 7 of the noise suppression apparatus of the present invention.
【図27】本発明の雑音抑制装置の実施例5および実施
例8において、ピッチの推定値に対する確からしさの確
率分布の一例を示す図FIG. 27 is a diagram showing an example of a probability distribution of probability with respect to an estimated value of pitch in the fifth and eighth embodiments of the noise suppressing device of the present invention.
【図28】本発明の雑音抑制装置の実施例5および実施
例8において、ピッチの推定値に対しピッチが存在する
確率分布の一例を示す図FIG. 28 is a diagram showing an example of a probability distribution in which the pitch exists with respect to the estimated value of the pitch in the fifth and eighth embodiments of the noise suppressing device of the present invention.
【図29】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9において、評価値の
計算の一例を示す流れ図FIG. 29 is a flow chart showing an example of evaluation value calculation in Embodiment 6 and Embodiment 7 and Embodiment 8 and Embodiment 9 of the noise suppressing device of the present invention.
【図30】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9における動作の説明
のための図FIG. 30 is a diagram for explaining the operation of the noise suppression device of the present invention in the sixth and seventh embodiments and the eighth and ninth embodiments.
【図31】本発明の雑音抑制装置の実施例6および実施
例7および実施例8および実施例9における動作の説明
のための図FIG. 31 is a diagram for explaining the operation of the noise suppression device of the present invention in Embodiment 6 and Embodiment 7 and Embodiment 8 and Embodiment 9;
【図32】本発明の実施例9における雑音抑制装置の構
成を示す構成図FIG. 32 is a configuration diagram showing a configuration of a noise suppression device according to a ninth embodiment of the present invention.
【図33】本発明の実施例9における雑音抑制装置によ
る効果を示す図FIG. 33 is a diagram showing an effect of the noise suppression device according to the ninth embodiment of the present invention.
1 音声入力用の接話マイク 2 雑音成分信号入力用のセンサマイク 3 ローパスフィルタ 4 ローパスフィルタ 5 バンドパスフィルタバンク 10iから10N 雑音除去回路 11iから11N 位相差検出補正回路 12iから12N レベル差検出補正回路 100 信号の時間分割手段 200 ピッチ抽出手段 300 第1の記憶手段 400 周波数帯域分割手段 500 第2の記憶手段 600 エネルギーまたは実効値の算出手段 700 第3の記憶手段 800 特徴量の算出手段 900 重み値の算出手段 910 乗算手段 920 第4の記憶手段 930 総和手段 3810 第1のピッチ抽出手段 3820 第2のピッチ抽出手段 3830 ピッチの推定値の算出手段 1000 信号の時間分割手段 1001 ピッチ抽出手段 1002 第1の記憶手段 1003 周波数帯域分割フィルタ 1004 第2の記憶手段 1005 エネルギーの算出手段 1006 第3の記憶手段 1007 特徴量の算出手段 1008 重み値の算出手段 1009 乗算手段 1010 第4の記憶手段 1011 総和手段 1101 オンセットの算出手段 1102 オフセットの算出手段 1103 連続性の算出手段 1104 調波性の算出手段 1105 オンセットの同期性の算出手段 1106 オフセットの同期性の算出手段 1200 第1のピッチ抽出手段 1201 第2のピッチ抽出手段 1202 第nのピッチ抽出手段 1203 ピッチの推定値の算出手段 1301 ピッチの評価測度の算出手段 1302 オンセットの評価測度の算出手段 1303 オフセットの評価測度の算出手段 1304 連続性の評価測度の算出手段 1305 調波性の評価測度の算出手段 1306 オンセットの同期性の評価測度の算出手段 1307 オフセットの同期性の評価測度の算出手段 9000 信号の時間分割手段 9001 ピッチ抽出手段 9002 第1の記憶手段 9003 フーリエ変換手段 9004 第2の記憶手段 9005 実効値算出手段 9006 第3の記憶手段 9007 特徴量の算出手段 9008 重み値の算出手段 9009 乗算手段 9010 フーリエ逆変換手段 9011 第4の記憶手段 9012 総和手段 1 Close-talking microphone for voice input 2 Sensor microphone for noise component signal input 3 Low-pass filter 4 Low-pass filter 5 Band-pass filter bank 10i to 10N Noise removal circuit 11i to 11N Phase difference detection correction circuit 12i to 12N Level difference detection correction circuit 100 signal time division means 200 pitch extraction means 300 first storage means 400 frequency band division means 500 second storage means 600 energy or effective value calculation means 700 third storage means 800 feature amount calculation means 900 weight values Calculation means 910 multiplication means 920 fourth storage means 930 summation means 3810 first pitch extraction means 3820 second pitch extraction means 3830 pitch estimated value calculation means 1000 signal time division means 1001 pitch extraction means 1002 first The memory hand 1003 frequency band division filter 1004 second storage means 1005 energy calculation means 1006 third storage means 1007 characteristic amount calculation means 1008 weight value calculation means 1009 multiplication means 1010 fourth storage means 1011 summation means 1101 onset Calculation means 1102 Offset calculation means 1103 Continuity calculation means 1104 Harmonicity calculation means 1105 Onset synchronization calculation means 1106 Offset synchronization calculation means 1200 First pitch extraction means 1201 Second pitch extraction Means 1202 Pitch extracting means 1203 Pitch estimation value calculating means 1301 Pitch evaluation measure calculating means 1302 Onset evaluation measure calculating means 1303 Offset evaluation measure calculating means 1304 Continuity evaluation measure calculation Means 1305 Harmonic evaluation measure calculation means 1306 Onset synchronicity evaluation measure calculation means 1307 Offset synchronism evaluation measure calculation means 9000 Signal time division means 9001 Pitch extraction means 9002 First storage means 9003 Fourier transform means 9004 Second storage means 9005 Effective value calculation means 9006 Third storage means 9007 Feature amount calculation means 9008 Weight value calculation means 9009 Multiplying means 9010 Fourier inverse transform means 9011 Fourth storage means 9012 Summing means
Claims (10)
段と、前記信号の時間分割手段による短時間セグメント
の信号のピッチを抽出するピッチ抽出手段と、前記ピッ
チ抽出手段によって求められたピッチを格納する第2の
記憶手段と、前記信号の時間分割手段の出力信号を複数
の周波数帯域に分割する周波数帯域分割手段と、前記周
波数帯域分割手段の出力を格納する第3の記憶手段と、
前記第3の記憶手段の出力のエネルギーまたは実効値を
算出するエネルギーまたは実効値算出手段と、前記エネ
ルギーまたは実効値または実効値算出手段の出力を格納
する第4の記憶手段と、前記第4の記憶手段と前記第2
の記憶手段の出力から特徴量の算出を行う特徴量の算出
手段と、ある時間区間のある周波数帯域の信号の重み値
の算出を行う重み値の算出手段と、前記第3の記憶手段
の出力と前記重み値の算出手段の積を算出する乗算手段
と、前記乗算手段の出力を格納する第4の記憶手段と、
前記第4の記憶手段の出力の総和を算出する総和手段と
を備えたことを特徴とする雑音抑制装置。1. A signal time division means for time-dividing an acoustic signal, a pitch extraction means for extracting a signal pitch of a short time segment by the signal time division means, and a pitch obtained by the pitch extraction means. Second storage means for storing, frequency band division means for dividing the output signal of the time division means for the signal into a plurality of frequency bands, and third storage means for storing the output of the frequency band division means,
Energy or effective value calculation means for calculating the energy or effective value of the output of the third storage means, fourth storage means for storing the output of the energy or effective value or effective value calculation means, and the fourth Storage means and the second
Of the characteristic amount from the output of the storage unit, a weight value calculating unit that calculates the weight value of the signal of a certain frequency band in a certain time section, and an output of the third storage unit. And multiplication means for calculating the product of the weight value calculation means, and fourth storage means for storing the output of the multiplication means,
And a summing means for calculating a sum of outputs of the fourth storage means.
重み値を決定することを特徴とする請求項1記載の雑音
抑制装置。2. The noise suppression device according to claim 1, wherein the weight value calculation means determines the weight value depending on the presence or absence of the feature amount.
特徴量の評価尺度とすることを特徴とする請求項1記載
の雑音抑制装置。3. The noise suppression device according to claim 1, wherein the feature quantity calculation means uses the likelihood of the feature quantity as an evaluation measure of the feature quantity.
算により統合することにより重み値を算出することを特
徴とする請求項2記載の雑音抑制装置。4. The noise suppression device according to claim 2, wherein the weight value calculation means calculates the weight value by integrating the evaluation measures of the feature quantities by multiplication.
ァジィ積分により統合することにより重み値を算出する
ことを特徴とする請求項2記載の雑音抑制装置。5. The noise suppression device according to claim 2, wherein the weight value calculation means calculates the weight value by integrating the evaluation measures of the feature quantity by fuzzy integration.
を用い複数の出力の平均値をピッチとして用いることを
特徴とする請求項2記載の雑音抑制装置。6. The noise suppressing apparatus according to claim 2, wherein the pitch extracting means uses a plurality of pitch extracting methods and uses an average value of a plurality of outputs as a pitch.
の出力からピッチの確からしさを算出することを特徴と
する請求項3記載の雑音抑制装置。7. The noise suppressing apparatus according to claim 3, wherein the feature quantity calculating means calculates the pitch certainty from the outputs of the plurality of pitch extracting means.
法により推定されたピッチによりピッチを推定すること
を特徴とする雑音抑制装置。8. A noise suppressing apparatus, wherein the pitch extracting means estimates the pitch from the pitches estimated by a plurality of different pitch estimating methods.
定法により推定されたピッチの差から推定されたピッチ
の確からしさを求めることを特徴とする雑音抑制装置。9. A noise suppression apparatus, wherein the feature amount calculation means obtains the probability of pitch estimated from the difference between pitches estimated by two different pitch estimation methods.
推定法により推定されたピッチの分散から推定されたピ
ッチの確からしさを求めることを特徴とする雑音抑制装
置。10. A noise suppression apparatus, wherein the feature amount calculation means obtains the probability of pitch estimated from the variance of pitches estimated by a plurality of different pitch estimation methods.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7194580A JPH0944186A (en) | 1995-07-31 | 1995-07-31 | Noise suppressor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7194580A JPH0944186A (en) | 1995-07-31 | 1995-07-31 | Noise suppressor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0944186A true JPH0944186A (en) | 1997-02-14 |
Family
ID=16326913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7194580A Pending JPH0944186A (en) | 1995-07-31 | 1995-07-31 | Noise suppressor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0944186A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004086362A1 (en) * | 2003-03-26 | 2004-10-07 | Kabushiki Kaisha Kenwood | Speech signal compression device, speech signal compression method, and program |
JP2005070779A (en) * | 2003-08-25 | 2005-03-17 | Microsoft Corp | Method and device for robust voice recognition using front end based on harmonic model |
JP2008203879A (en) * | 2005-09-02 | 2008-09-04 | Nec Corp | Noise suppressing method and apparatus, and computer program |
JP2009063700A (en) * | 2007-09-05 | 2009-03-26 | Nippon Telegr & Teleph Corp <Ntt> | Audio signal section estimation apparatus, method, program, and recording medium recording the same |
JP2011203500A (en) * | 2010-03-25 | 2011-10-13 | Toshiba Corp | Apparatus and method for determination of sound information |
JP2013534651A (en) * | 2010-07-12 | 2013-09-05 | オーディエンス,インコーポレイテッド | Monaural noise suppression based on computational auditory scene analysis |
-
1995
- 1995-07-31 JP JP7194580A patent/JPH0944186A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004086362A1 (en) * | 2003-03-26 | 2004-10-07 | Kabushiki Kaisha Kenwood | Speech signal compression device, speech signal compression method, and program |
JP2005070779A (en) * | 2003-08-25 | 2005-03-17 | Microsoft Corp | Method and device for robust voice recognition using front end based on harmonic model |
JP2008203879A (en) * | 2005-09-02 | 2008-09-04 | Nec Corp | Noise suppressing method and apparatus, and computer program |
JPWO2007026691A1 (en) * | 2005-09-02 | 2009-03-26 | 日本電気株式会社 | Noise suppression method and apparatus, and computer program |
US9318119B2 (en) | 2005-09-02 | 2016-04-19 | Nec Corporation | Noise suppression using integrated frequency-domain signals |
JP2009063700A (en) * | 2007-09-05 | 2009-03-26 | Nippon Telegr & Teleph Corp <Ntt> | Audio signal section estimation apparatus, method, program, and recording medium recording the same |
JP2011203500A (en) * | 2010-03-25 | 2011-10-13 | Toshiba Corp | Apparatus and method for determination of sound information |
JP2013534651A (en) * | 2010-07-12 | 2013-09-05 | オーディエンス,インコーポレイテッド | Monaural noise suppression based on computational auditory scene analysis |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4177755B2 (en) | Utterance feature extraction system | |
KR101122838B1 (en) | Method and apparatus for separating sound-source signal and method and device for detecting pitch | |
CA2215746C (en) | Method and apparatus for separation of sound source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor | |
US8065115B2 (en) | Method and system for identifying audible noise as wind noise in a hearing aid apparatus | |
KR100911679B1 (en) | How to segment an audio signal into an auditory event | |
US7508948B2 (en) | Reverberation removal | |
US6804643B1 (en) | Speech recognition | |
CA2448182C (en) | Segmenting audio signals into auditory events | |
US20100185439A1 (en) | Segmenting audio signals into auditory events | |
EP0625774A2 (en) | A method and an apparatus for speech detection | |
JP2004531767A5 (en) | ||
JP2000515987A (en) | Voice activity detector | |
US4091237A (en) | Bi-Phase harmonic histogram pitch extractor | |
EP1093112B1 (en) | A method for generating speech feature signals and an apparatus for carrying through this method | |
Denbigh et al. | Pitch extraction and separation of overlapping speech | |
US11622208B2 (en) | Apparatus and method for own voice suppression | |
Kumar | Spectral subtraction using modified cascaded median based noise estimation for speech enhancement | |
JPH0944186A (en) | Noise suppressor | |
Lee et al. | Cochannel speech separation | |
JP2005266797A (en) | Method and apparatus for separating sound-source signal and method and device for detecting pitch | |
CN115762576A (en) | Directional microphone array voice distortion detection and repair method, device and system | |
JP2002507776A (en) | Signal processing method for analyzing transients in audio signals | |
CN119207456B (en) | Audio noise reduction method, electronic device and storage medium | |
JP2880683B2 (en) | Noise suppression device | |
RU2364957C1 (en) | Determination method of parameters of lined voiced sounds spectrums and system for its realisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20031216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040803 |