JPS6039938A - Complementary speech detector - Google Patents
Complementary speech detectorInfo
- Publication number
- JPS6039938A JPS6039938A JP59144547A JP14454784A JPS6039938A JP S6039938 A JPS6039938 A JP S6039938A JP 59144547 A JP59144547 A JP 59144547A JP 14454784 A JP14454784 A JP 14454784A JP S6039938 A JPS6039938 A JP S6039938A
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- zero
- energy
- crossing
- slope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/34—Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
- H03G3/342—Muting when some special characteristic of the signal is sensed which distinguishes it from noise, e.g. using speech detector
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
本発明はディジタル通信システムに関し、特にかゝるシ
ステムにおける音声(スピーチ)信号の検出に関するも
のである。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to digital communication systems, and more particularly to the detection of speech signals in such systems.
ディジタル通信システムにおいては、アナログスピーチ
信号は例えばサンプル間隔が125μsの8KHz の
サンプル速度でパルスコード変調(PCM)される。米
国およびカナダにおいてはサンプルはlt法PCMコー
ドに従って直列8ビツトにディジタル化される。CCI
T ’I’基準に従うヨーロッパ諸国では同様なA法
コードが守られている。4ビツトのコードが提案されて
いる。これらのコードは、信号レベルの正常な範囲を越
えるSN比を最適にする一方で符号化速度を最小にする
ために、はy対数的である。各サンプルの第1ビツトは
サンプルの極性を示す祠号ピットである。In digital communication systems, analog speech signals are pulse code modulated (PCM), for example, at a sample rate of 8 KHz with a sample interval of 125 μs. In the United States and Canada, samples are digitized serially to 8 bits according to the LT method PCM code. C.C.I.
Similar A-law codes are followed in European countries that follow the T 'I' standard. A 4-bit code has been proposed. These codes are y-logarithmic in order to minimize encoding speed while optimizing signal-to-noise ratio over the normal range of signal levels. The first bit of each sample is a symbol pit indicating the polarity of the sample.
サンプルの引続くピットはサンプルのレベルヲ表すすレ
ベルビットである。Successive pits in the sample are level bits that represent the level of the sample.
スピーチと無声(サイレント)期間を区別するためにい
わゆる「スピーチ検出器」あるいは「サイレント検出器
」を用いることは知られている。It is known to use so-called "speech detectors" or "silence detectors" to distinguish between speech and periods of silence.
このようなサイレント期間に同じチャンネルでデータあ
るいは他のスピーチを伝送することが可能で力)す、こ
れはチャンネル容4?1をより充分に利用することを可
能にする。It is possible to transmit data or other speech on the same channel during such silent periods, which allows the channel capacity to be utilized more fully.
I) CMはスピーチとバックグラウンドノイズ(例え
ば話者と同室で発生されるノイズ)の両方をディジタル
化する。バックグラウンドノイズに加えて、通信システ
ム自体がシステムノイズを発生し、このノイズはP C
M信号と同じチャンネルで伝送される。ノ・イズが存在
しない場合はスピーチとザイレンスは草純プIレベル検
出器により区別できる。しかし、実際には低レベルのス
ピーチは高レベルのバックグラウンドノイズおよびシス
テムノイズと同じ大きさを有することがあり、スピーチ
をノイズから区別するためにはより高性能な手段を用い
ることが要求される。I) CM digitizes both speech and background noise (eg, noise generated in the same room as the speaker). In addition to background noise, the communication system itself generates system noise, and this noise
It is transmitted on the same channel as the M signal. In the absence of noise, speech and silence can be distinguished by a simple P-I level detector. However, in reality, low-level speech can have the same magnitude as high-level background and system noise, requiring the use of more sophisticated means to distinguish speech from noise. .
弁明の概要
本発明の一面においては、通信チャンネルによって搬送
される波形中にスピーチ信号が検出された時にフラグ信
号が供給される。その波形のエネルギレベルとゼロ交差
速度が算出され、このエネルギレベル+i 高:to
、J: ヒ低エネルギスレッショルドと比較される。も
しエネルギレベルが高エネルギスレッショルドと等しい
かそれより大きい場合はフラグ信号が供給される。これ
に対して、もしエネルギレベルカ低エネルギスレッショ
ルドヨリ低い場合は、フラグ信号は禁止される。もしエ
ネルギレベルが低エネルギスレッショルトト智シ℃ζか
あるいは大きい場合は、波形の114’i+同的に分離
されたエネルギレベル間の差が算出される。このレベル
差は波形のエネルギ1.4斜(スロープ)を表わしてい
る。このエネルギスロープは紅εいてスロープスレッシ
ョルドと比較され、もしスロープがスロープスレッショ
ルドと等しいかこれより大きい場合はフラグ信号を発生
する。もしスロープがこのスレッショルドより低い場合
は、ゼロ交差速朗がゼロ交差スレッショルドと比較され
る。このゼロ交差速度がゼロ交差スレッショルドと等し
いかこれより大きい場合はフラグ信号が発生される。ゼ
ロ交差速度がゼロ交差スレッショルドより低い場合はフ
ラグ信号は禁市される。Summary of Defense In one aspect of the invention, a flag signal is provided when a speech signal is detected in a waveform carried by a communication channel. The energy level and zero crossing speed of the waveform are calculated, and this energy level + i high: to
, J: is compared to the low energy threshold. If the energy level is equal to or greater than the high energy threshold, a flag signal is provided. On the other hand, if the energy level is below the low energy threshold, the flag signal is inhibited. If the energy level is above or above the low energy threshold, then the difference between 114'i of the waveform plus the identically separated energy levels is calculated. This level difference represents the 1.4 slope of the energy of the waveform. This energy slope is then compared to a slope threshold and a flag signal is generated if the slope is equal to or greater than the slope threshold. If the slope is below this threshold, the zero crossing speed is compared to the zero crossing threshold. A flag signal is generated if the zero-crossing velocity is greater than or equal to the zero-crossing threshold. If the zero-crossing speed is less than the zero-crossing threshold, the flag signal is inhibited.
実施例の説明
本発明を他の諸口的、利点および可能性とともに十分に
理解するために、添何図面を参照して本発明の実施例を
以下に詳細に説明する。DESCRIPTION OF EMBODIMENTS In order to fully understand the invention together with other advantages and possibilities, embodiments of the invention will now be described in detail with reference to the accompanying drawings, in which: FIG.
本発明の特徴として、3つのパラメータ、すなワチ、エ
ネルギレベル、エネルギレベルの短期間の変化あるいは
エネルギのエンベロープ(包絡線)スロープの短期間の
変化、およびゼロ交差速度が該当のチャンネルから収集
され、スピーチヲハックグラウンドおよびシステムノイ
ズから検出するために相補的態様で用いられる。As a feature of the invention, three parameters are collected from the relevant channels: energy level, short-term change in energy level or short-term change in energy envelope slope, and zero-crossing velocity. , used in a complementary manner to detect speech from hacking ground and system noise.
これらのパラメータは1つのタイムスロット内の多数の
PCN4サンプルから集められる。各サンプルのエネル
ギレベルはそのサンプルの直線的値を2乗した値の関数
である。しかし、PCM非直線性サンプルの大きさは、
スピーチ検出の目的に対しては、エネルギレベルの満足
できる近似である。These parameters are collected from multiple PCN4 samples within one time slot. The energy level of each sample is a function of the linear value of that sample squared. However, the size of the PCM nonlinearity sample is
For speech detection purposes, it is a satisfactory approximation of the energy level.
本発明によれば、各サンプルの大ぎさはエネルギレベル
およびスロープを算出するために用いられる。これは非
直線性コードから直線性コードへの変換を回避できる。According to the invention, the magnitude of each sample is used to calculate the energy level and slope. This can avoid converting non-linear codes to linear codes.
時間と近似エネルギレベル間の差異は最小であり、本発
明の説明および特¥1゛請求の範囲においては区別され
ない。The differences between time and approximate energy levels are minimal and are not distinguished in the description and claims of the invention.
エネルギレベルE (m)は8mSのタイムスロット内
の64サンプルのすべての大きさを加算し、この相をサ
ンプルの数で除ずことによって得られる。E(m)は、
1紹の16のサンプルに対応する2mSの幅でよいスラ
イドする窓によって更新される。パラメータの更新は集
められたサンプルの最新の16ザンブルを加算し、そし
て最も古い16サンプルを取り除くことによって行なわ
れる。The energy level E (m) is obtained by adding the magnitudes of all 64 samples within an 8 mS time slot and dividing this phase by the number of samples. E(m) is
Updated by a sliding window with a width of 2 mS, corresponding to 16 samples in one introduction. Parameter updates are performed by adding the latest 16 samples of the collected samples and removing the oldest 16 samples.
E (m)は通信の4支術分野において用いられる基準
エネルギレベルであるodBmoを基準とする。高位お
よび低位のエネルギスレッショルドTHnおよび1’H
Lが用いられる。もしE(m)がi’llH(1’ux
(= −30d13mo )と等しいかまたはこれより
大きい場合は、信号はスピーチと判定される。これに対
してもしE (nl)がTHL (THL =−s o
dBmo)より小さい場合は、信号は常にサイレント
と判定される。Tl且Iと1’TIL間のエネルギ差が
20 dBであると、スピーチとノイズとの区別は困難
であり、そしてエネルギスロープ(BS )およびゼロ
交差速度(Z CR)のパラメータが有効となる。この
範囲のスピーチは低レベルであり、通常はスピーチ発声
の開始時あるいは減衰時における鼻音のあるいは貼擦音
のあるいはその他の低レベルのスピーチの音素である。E (m) is based on odBmo, which is a standard energy level used in the four branches of communication. High and low energy thresholds THn and 1'H
L is used. If E(m) is i'llH(1'ux
(=-30d13mo) or greater than this, the signal is determined to be speech. On the other hand, if E (nl) is THL (THL = -s o
dBmo), the signal is always determined to be silent. With an energy difference of 20 dB between Tl and 1'TIL, it is difficult to distinguish between speech and noise, and the parameters of energy slope (BS) and zero crossing rate (ZCR) become effective. Speech in this range is low level, typically nasal or phricate or other low level speech phonemes at the onset or decay of the speech utterance.
6dBあるいはそれ以上の急峻なエネルギスロープ(E
S)はスピーチを正確に表わすことが判明している。ス
ロープは時間的に分離された2つの(例えば2 ms
離れた)タイムスロット、例えばtrnとt(m−32
)のltMsエネルギレベル■シ間の差であり、それ故
E S = E (m) −E (m −32)である
。μ法コードおよびA法コードは、低信号レベルにおい
てははy対数的であるため、差ESもはy対数的である
。低いスロープはスピーチあるいはサイレンスに関して
不明瞭である。A steep energy slope (E
S) has been found to accurately represent speech. The slopes are two temporally separated (e.g. 2 ms
distant) time slots, e.g. trn and t(m-32
) is the difference between the ltMs energy levels ■ and therefore E S = E (m) − E (m −32). Since the μ law code and the A law code are y-logarithmic at low signal levels, the difference ES is also y-logarithmic. Low slopes are ambiguous with respect to speech or silence.
もし6dBより小さいスロープが測定された場合は、チ
ャンネルのゼロ交差速度(z c rt )がその後ノ
イズからスピーチを区別するために用いられる。If a slope of less than 6 dB is measured, the channel zero-crossing rate (z crt ) is then used to distinguish speech from noise.
すでに述べたように、ノイズはバックグラウンドノイズ
とシステムノイズのいずJしかに分類できる。バンクグ
ラウンドノイズは話者の位置で発生され、通常低周波で
ある。システムノイズは通信システムのチャンネル内で
発生1−る。バックグラウンドノイズとは対照的にシス
テムノイズはチャンネルのバンド[1]にわたってより
ランダムに分布する傾向にあり、通常低レベルである。As already mentioned, noise can be classified into either background noise or system noise. Bank ground noise is generated at the speaker's location and is usually of low frequency. System noise occurs within the channels of a communication system. In contrast to background noise, system noise tends to be more randomly distributed across the band [1] of the channel and is usually of low level.
低レベルの摩擦音および鼻声音スピーチはバックグラウ
ンドノイズよりも高い周波数成分を含む傾向がある。一
定の時間期間内におけるゼロ交差の数(すなわち、ゼロ
交差速度)の4数によって信号のスペクトル特性の良好
な4Fi示を得ることができる。連続するPCMサンプ
ルの0号ビットの極性の変化はゼロ交差を表わす。正常
な低システムノイズ条件の下では1つのスレッショルド
を越えるゼロ交差速度(ZCR)(例えば16ms当り
50のゼロ交差)はスピーチを表わす。高システムノイ
ズ条件下では高ゼロ交差速度はスピーチあるいはシステ
ムノイズのいずれかを表わす。スピーチを正常なあるい
は高レベルシステムノイズと区別するため、本発明では
修正ゼロ交差速度(MZCR)と称する手法がとられる
。とのMZCR手法には2つの観点が存在する。第1は
、高レベルシステムノイズがチャンネルに存在するか否
かの決定が行なわれろ。存在する場合には検出器は正常
な「Z CRモード」から1MZcRモードー1に切換
えられる。Low-level fricative and nasal speech tends to contain higher frequency components than background noise. A good 4Fi indication of the spectral characteristics of a signal can be obtained by the number of zero crossings within a fixed time period (ie, the zero crossing rate). A change in polarity of the zero bit of successive PCM samples represents a zero crossing. Under normal, low system noise conditions, a zero crossing rate (ZCR) above one threshold (eg, 50 zero crossings per 16 ms) is indicative of speech. Under high system noise conditions, high zero crossing rates represent either speech or system noise. To distinguish speech from normal or high level system noise, the present invention employs a technique referred to as Modified Zero Crossing Rate (MZCR). There are two aspects to the MZCR method. First, a determination is made whether high level system noise is present in the channel. If present, the detector is switched from the normal "Z CR mode" to 1MZcR mode-1.
高レベルシステムノイズの決定は検出器により表示され
るサイレント期間中のピークZCR,を測定することに
よって行なわれる。バックグラウンドノイズおよびスピ
ーチはサイレント期間中は冨与しないため、十分な数の
ゼロ交差数は高レベルシステムノイズが原因とみなすこ
とができる。クロックは0.25秒間隔でパルスを発生
ずる。0.25秒間において8mS当り少(とも25の
ゼロ交差があるというピークZCI(の読みが得られた
場合は、カウンタはその計数値を1だけ減少される。Determination of high level system noise is done by measuring the peak ZCR, during the silent period displayed by the detector. Since background noise and speech are not enriched during silent periods, a sufficient number of zero crossings can be attributed to high level system noise. The clock generates pulses at 0.25 second intervals. If a peak ZCI reading of less than 25 zero crossings per 8 mS is obtained for 0.25 seconds, the counter is decremented by one.
もし0.25秒間にピークZCRが13m5当り25の
ゼロ交差数に達しない場合は適応カウンタばその計数値
を1だけ増加する。If the peak ZCR does not reach 25 zero crossings per 13 m5 in 0.25 seconds, the adaptive counter increases its count by 1.
もし適応カウンタが−4に達すると、高レベルのシステ
ムノイズが存在するものと想定され、スピーチ検出器は
彼達するM Z CItモードに切換えられる。If the adaptive counter reaches -4, it is assumed that there is a high level of system noise and the speech detector is switched to its M Z CIt mode.
もし適応カウンタが3に達すると、低レベルシステムノ
イズのみが存在し、スピーチ検出器は正常なZCRモー
ドに切換えられる。モードは025秒の計数の完了時に
のみ変化する。もしカウンタがいずれのレベルにも到達
しな−・場合は検出器のモードは変化せず、それ以前の
025秒間に継続していたいずれかのモードに維持され
る。If the adaptive counter reaches 3, only low level system noise is present and the speech detector is switched to normal ZCR mode. The mode changes only upon completion of the 025 second count. If the counter does not reach any level, the detector mode does not change and remains in whatever mode it was in for the previous 025 seconds.
スピーチあるいはバックグラウンドノイズがZ Cit
モード選択に影響しないようにするため、エネルギレベ
ルが−60dBmoを越える、あるいはエネルギスロー
プが6dB またはそれ以上である期間の最初にカウン
タをゼロにリセットし、これらのいずれかの状態の間は
リセット状態に保持する。Speech or background noise is Z Cit
To avoid influencing mode selection, the counter is reset to zero at the beginning of any period in which the energy level exceeds -60 dBmo or the energy slope is 6 dB or greater, and remains in the reset state during any of these conditions. to hold.
周波数成分がスピーチと同じ周波数帯域に拡がっている
高レベルシステムノイズが存在するためM Z Cl(
、モードにおいてはスピーチの検出はZCrtモードに
おけるよりも幾分困兼である。しかし、システムノイズ
の周波数スペクトルはより密集している7T擦音スピー
チよりもランダムであることが見出されている。M Z Cl(
, mode, speech detection is somewhat more difficult than in ZCrt mode. However, the frequency spectrum of the system noise has been found to be more random than the more dense 7T fricative speech.
MZCRモードにおいてはその目セ嚢とするところはシ
ステムノイズに寄与するゼロ交差を放棄することである
。それ故、二重スレッショルド技術が用いられる。In MZCR mode, the objective is to discard zero crossings that contribute to system noise. Therefore, a dual threshold technique is used.
ランダムシステムノイズによる隣接ビットの反転シーケ
ンスは狭帯域スピーチによるビット反転シーケンスより
短いことが見出された。ビット反転シーケンスはPCM
ザンプルの連続的なビット反転の数である。MZCRモ
ード期間においてビヨルドTH+(例えばTH1= q
連続符号ビット反転)と比較される。TH+より短い長
さを有する灼シーケンスは主トして高レベルシステムノ
イズに起因するものとみなされ、拒否される。’I’
H+と同しかそれ以上の長シーケンスは累算される。累
積さ第1たシーケンスの数が舘2のスレッショルドl’
)12(例えばTH2−12長シ一ケンス/16m5)
K等しいかそれより大きい場合には、スピーチとみなさ
れる。It has been found that adjacent bit reversal sequences due to random system noise are shorter than bit reversal sequences due to narrowband speech. The bit reversal sequence is PCM
is the number of consecutive bit flips in the sample. During the MZCR mode period, Bjord TH+ (for example, TH1= q
(continuous sign bit reversal). Burn sequences with lengths shorter than TH+ are considered to be primarily due to high level system noise and are rejected. 'I'
Sequences as long as H+ or longer are accumulated. The number of accumulated first sequences is threshold l'
)12 (e.g. TH2-12 length sequence/16m5)
If it is equal to or greater than K, it is considered speech.
MZCRはZCR,よりスピーチに対しより厳格な要件
を有している。これは高レベルシステムノイズが時々ス
ピーチ検出器を無効にする可能性を減少させるために必
要である。したがってM 7. CRは通常のZ CR
よりもサイレント期間を不正イi/I’、に表わす可能
性がある。このためM Z CIt七−ドにおいてはハ
ングオーバーを通常のZ CRモードにおける32m5
に対して64rnsに増すことがよ〜・0このハングオ
ーバーの増加によりオーバーヘッドが幾分増すが、スピ
ーチの早過ぎるクリツピング第1図はプログラムの流れ
図であり、マイクロプロセサとの絹合せにより本発明の
実施に適するものである。このプログラムはデータをサ
ンプル毎の基準で蓄積し、かつパラメータをウィンド(
窓)毎の基準で算出し、更新しなければならない。この
プログラムは「割込ハンドラの実行」および「主プログ
ラム」と本発明では称する2つの部分に時間的に分けら
れている。MZCR has more stringent requirements for speech than ZCR. This is necessary to reduce the possibility that high level system noise will sometimes override the speech detector. Therefore M7. CR is normal Z CR
There is a possibility that the silent period is incorrectly expressed as i/I'. For this reason, in MZ CIt7, the hangover is
This increase in hangover adds some overhead, but premature clipping of speech. It is suitable for implementation. This program accumulates data on a sample-by-sample basis and sets parameters on a window (
It must be calculated and updated on a per-window basis. This program is temporally divided into two parts, referred to in the present invention as "execution of interrupt handler" and "main program".
[割込ハンドラの実行1部は割込パルスによって開始さ
れる。割込パルスはサンプリング速度に同期している。[The first part of the interrupt handler's execution is initiated by an interrupt pulse. The interrupt pulse is synchronized to the sampling rate.
8 K 1−1z のサンプリング速度に対しては割込
パルスの間隔は125m5 である。For a sampling rate of 8 K 1-1z the interval between the interrupt pulses is 125 m5.
[割込ハンドラの実行」部はインテル8085Aマイク
ロプロセサで実行する場合は約86m5 の長さである
。この期間中スピーチデータサンプルが蓄積され、エネ
ルギレベルは累積され、Z CIt−あるいはIVI
Z Cl(がチェックされる。「割込ハンドラの実行」
部の終了後「主プログラム」を再開し、次の割込パルス
が発生ずる約39m5 後まで、再び例示のプログラム
の実行を継続する。The [Interrupt Handler Execution] section is approximately 86m5 long when executed on an Intel 8085A microprocessor. During this period speech data samples are accumulated and energy levels are accumulated and Z CIt- or IVI
Z Cl( is checked. "Execute interrupt handler"
After the completion of the section, the "main program" is restarted, and execution of the exemplary program is continued again until about 39 m5 after the next interrupt pulse occurs.
主プログラムは2msのウィンド毎の基準で機能を実行
する。主プログラム期間においてエネルギレベル、ZC
Rおよびエネルギスロープパラメータは6新しい2mS
ウィンド毎に集められ、かつ更新される。スピーチ検
出論理はこの主プログラムの期間中に実行される。シス
テムノイズは測定され、その検出は状況に応じてz c
itモードあるいはMZCRモードに適応される。主
プログラムは割込み基準でないいくつかの実行可卵なコ
ードセグメントに分離し得る。The main program executes functions on a 2 ms window-by-window basis. Energy level, ZC during the main program period
R and energy slope parameters are 6 new 2mS
Collected and updated for each window. Speech detection logic is executed during this main program. The system noise is measured and its detection is situationally z c
It is applicable to it mode or MZCR mode. The main program may be separated into several executable code segments that are not interrupt-based.
プログラムの初期設定はプリンタ構体の設定、割込許可
および入出力の初期設定を含む。待ち(ウェイティング
)ループは主プログラムと割込ハンドラ間の実行タイミ
ングを詳1整するウィンド同期機構となっている。The initial settings of the program include printer structure settings, interrupt permissions, and input/output initial settings. The waiting loop is a window synchronization mechanism that precisely adjusts the execution timing between the main program and the interrupt handler.
上述したように、本発明はプログラマプルマイクロプロ
セザを用いて実施することができる。あるいは専用の(
デジケーテツド)論理回路が使用できる。As mentioned above, the invention can be implemented using a programmable microprocessor. Or a dedicated (
(digitized) logic circuits can be used.
第2図はスピーチ検出論理を実行するのに適した論理回
路のブロック図である。通信チャンネルの直列データの
流れは既知の態様で一連の並列8ビツトバイトに変換す
る変換回路42に結合される。入力回路10はそれぞれ
E (m) 、 E S (m) 。FIG. 2 is a block diagram of logic circuitry suitable for implementing speech detection logic. The serial data stream of the communication channel is coupled to a conversion circuit 42 which converts it into a series of parallel 8-bit bytes in a known manner. The input circuits 10 have E (m) and E S (m), respectively.
Z CIt (m)およびM Z CR(m)に対する
パラメータ更新回路11,12.1!lおよび14を含
んでいる。Parameter update circuits 11, 12.1 for Z CIt (m) and M Z CR (m)! 1 and 14.
1) CM符号器に対する入力回路100更新回路11
.12,13.14を同期させるためタイミングマーカ
ーが供給される。E (m)回路11およびES (m
)回路12の場合は各バイトの第1ビツトは無視され、
大きさを表わすビットだけが回路11.12によって処
理される。1) Input circuit 100 update circuit 11 for CM encoder
.. Timing markers are provided to synchronize 12, 13, and 14. E (m) circuit 11 and ES (m
) For circuit 12, the first bit of each byte is ignored;
Only the bits representing the magnitude are processed by circuit 11.12.
E (m)更新回路11の目的しまsmsの時間期間(
64サンプル)の間2ms 毎に更新して平均エネルギ
E (m)を得ることにある。連続する16のサンプル
の大きさを表わすビットは2MmWされる。この和は2
ms の間に集計されたエネルギに対応し、こ、hは一
時的に記憶される。最も新しい4つの2mSの和は加算
され、その結果である和は64で除される。この商はE
(m)回路11の出力であり、この実行の目的である
2m54σに更新された64ザンプルの平均エネルギを
表わしている。E (m) The purpose of the update circuit 11 is the time period of the SMS (
64 samples) every 2 ms to obtain the average energy E (m). The bit representing the magnitude of 16 consecutive samples is 2 MmW. This sum is 2
Corresponding to the energy aggregated during ms, this and h are temporarily stored. The four most recent 2 mS sums are added and the resulting sum is divided by 64. This quotient is E
(m) Output of circuit 11, representing the average energy of 64 samples updated to 2m54σ, which is the purpose of this run.
B S (m)更新回路120目的はエネルギエンベロ
ープのスロープES(m)を決定することである。The purpose of the B S (m) update circuit 120 is to determine the slope of the energy envelope ES(m).
この回路はすでに得られている8msの平均エネルギ値
を用いてもよい。回路12は前以って、例えば64m5
以前に得られた8rns 平均エネルギ値から最も新し
い8.ms平均エネルギ値を減算する。E S (m)
回路12の出力は差の絶対値を表わしかつこの実行の目
的である2mS 毎に更新されたエネルギスロープを表
わしている。This circuit may use the 8 ms average energy value already obtained. The circuit 12 is pre-constructed, e.g. 64m5
The latest 8 rns average energy value obtained previously. Subtract the ms average energy value. E S (m)
The output of circuit 12 represents the absolute value of the difference and represents the energy slope updated every 2 mS, which is the purpose of this implementation.
Z CR(m)回路16の目的はゼロ交差速度(ZCl
()を決定することである。各バイトの%性ビットのみ
が考慮される。8つの連続する2msの時間期間の12
8の極性ビットが一時的K FjJ憤される。回路13
の出力は8つの最新の2msの時間期間の極性ビット反
転の金側数であり、21’TIS毎に更新された16m
5 の時間フレームに対するゼロ交差速i1i (Z
CR)を表わしている。The purpose of the Z CR(m) circuit 16 is to determine the zero crossing speed (ZCl
() is to be determined. Only the %ness bit of each byte is considered. 12 of 8 consecutive 2ms time periods
The polarity bit of 8 is temporarily set. circuit 13
The output of is the gold side number of polarity bit reversals for the eight most recent 2ms time periods, updated every 21'TIS 16m
The zero-crossing speed i1i (Z
CR).
M Z CIt (m)更新回路140目的は修正され
たゼロ交差速度を提供することにある。回路14もまた
記憶された極性ビットを用いるが、すべての極性ビット
の反転を計数する代りに1つのシーケンスの一部をなす
極性反転のみが数えられる。1つのシーケンスにおいて
は各極性ビットはその直前の極性ビットとは異なってい
る。各シーケンスにおける極性ビット反転の数はスレッ
ショルド’r H+と比較される。例えば16m5期間
内に9より少ない反転を有するシーケンスは拒否されろ
。The purpose of M Z CIt (m) update circuit 140 is to provide a modified zero-crossing speed. Circuit 14 also uses stored polarity bits, but instead of counting all polarity bit reversals, only those polarity reversals that are part of a sequence are counted. Each polarity bit in a sequence is different from the previous polarity bit. The number of polarity bit reversals in each sequence is compared to a threshold 'r H+. For example, sequences with fewer than 9 reversals within a 16m5 period should be rejected.
16m5期間内に9つまたはそれ以上の極性反転を有す
るシーケンスの数が加算される。この累績さ」tたシー
ケンスの和が修正ゼロ交差速度を表わす。The number of sequences with 9 or more polarity reversals within a 16m5 period is added. The sum of this cumulative sequence represents the modified zero-crossing velocity.
回路11,12.13および14からの各更油パラメー
タを表わすディジタル信号は対応するスレッショルドと
比較されるコンパレータに供給される。Digital signals representing each oil change parameter from circuits 11, 12, 13 and 14 are fed to a comparator where they are compared to a corresponding threshold.
E(m)更ル「回路11からのE (m)を秋ゎす信号
はコンパレータ15および18に供給される。もしE
(m)が高いスレッショルド’I’ I−I Hに等し
いかまたはこれより大きい場合は、コンパレータ15は
出力を供給する。この出力はORゲート16からフラグ
スイッチ17をオンにする信号を供給させ、これはスピ
ーチの存在を指示する。もしE (m)が低いスレッシ
ョルド′I″It、より小さい場合は、コンパレータ1
8は遅復旧タイマー2oにより遅延された後フラグスイ
ッチ17をオフにする信号を供給してフラグ信号を禁止
し、これによってスピーチの不存在を指示する。THH
は例えば−50d13m。E(m) change The signal from circuit 11 that turns off E(m) is supplied to comparators 15 and 18. If E(m)
If (m) is equal to or greater than the high threshold 'I' I-I H, comparator 15 provides an output. This output causes OR gate 16 to provide a signal that turns on flag switch 17, which indicates the presence of speech. If E (m) is less than the lower threshold ′I″It, then comparator 1
8 supplies a signal that turns off the flag switch 17 after being delayed by the slow recovery timer 2o to inhibit the flag signal, thereby indicating the absence of speech. THH
For example, -50d13m.
でよく、’I”HLは−50dHmoでよい。フラグス
イッチ17はフリップフロップ回路でよい。遅復旧タイ
マーはアップ/ダウンカウンタでよい。'I'HL may be -50 dHmo. The flag switch 17 may be a flip-flop circuit. The slow recovery timer may be an up/down counter.
もしE (m)がスレッショルド′l″Hriと’l’
Hh、の間にある場合は、コンパレーク18はA N
I)ゲート21に信号を与える。ANDゲート21はコ
ンパレータ18および01(ゲート220両方から信号
を受信した時にのみ出力信号を発生する。0几ゲート2
2は後述のように、予め定められたES(m)。If E (m) is the threshold 'l''Hri and 'l'
If it is between Hh, the comparator 18 is A N
I) Give a signal to gate 21. AND gate 21 generates an output signal only when it receives signals from both comparators 18 and 01 (gate 220).
2 is a predetermined ES (m) as described later.
Z CH,(+n)あるいはMZCR(m)レベルに応
答して信号を供給する。ANDゲート21の出力は信号
に応答してフラグスイッチ17をオンにするO Rゲー
ト16の入力に与えられる。A signal is supplied in response to the Z CH, (+n) or MZCR (m) level. The output of AND gate 21 is applied to the input of OR gate 16 which turns on flag switch 17 in response to a signal.
ES (m)更新回路12の出力はコンパレーク23に
与えられる。もしE S (m)がE S (m)スレ
ッショルド(E S (m) l’ H= 6 dB
)に等しいかあるいはこれより大きい場合、コンパレー
タ25はフラグスイッチ17をオンにする信号をORゲ
ート22に供給する。The output of the ES (m) update circuit 12 is given to a comparator 23 . If E S (m) is E S (m) threshold (E S (m) l' H= 6 dB
), the comparator 25 provides a signal to the OR gate 22 that turns on the flag switch 17.
もしE S (m)がその対応するスレッショルドより
低い場合は、コンパレータ23はANDゲート240入
力の1つに信号を与える。ANDゲート24はその他方
の入力がORゲート25から信号を受信したときのみO
Rゲート19に信号を供給する。この(JRゲート25
は、コンパレータ68または69からの信号によって指
示されるM2’、CRまたはZCR要件が満たされる場
合にのみ、信号を供給する。ANDゲート24あるいは
コンパレータ18のいずれからも信号がない場合は、0
11Lゲート19は信号を供給せず、フラグスイッチ1
7はオフ処されない。A N I)ゲート24からの信
号が存在しない場合は、コンパレータ18からの信号に
応答して01(、ゲート19はフラグスイッチ17をオ
フにする。If E S (m) is lower than its corresponding threshold, comparator 23 provides a signal to one of the AND gate 240 inputs. AND gate 24 is turned ON only when the other input receives a signal from OR gate 25.
A signal is supplied to the R gate 19. This (JR Gate 25
provides a signal only if the M2', CR or ZCR requirements as dictated by the signal from comparator 68 or 69 are met. 0 if there is no signal from either AND gate 24 or comparator 18.
11L gate 19 does not provide a signal and flag switch 1
7 is not treated as off. If the signal from gate 24 is not present, gate 19 turns off flag switch 17 in response to the signal from comparator 18.
E (m)がその2つのスレッショルドの間に在り、B
S (m)がそのスレッショルドより低い場合には、
論理回路はZ CRモードかMZCRモードのいずれか
となるように選択する。もしE S (m)がスレッシ
ョルドより低い場合は、コンパレータ2ろは、ライン2
7上に約0.25秒間隔で一連のパルスを発生ずる増分
タイマー26を使用h]能にする。これらのパルスはコ
ンパレーク28に対する何月1百]能信号として作用す
る。この間に、Z CI(、(m) ’9i新回路13
の出力はピークZCR,回路39に結合される。このビ
ークZCR回路29は複数の7.CR(m)から、コン
パレーク28へ供給されるビークZCRを表わす信号を
、発生ずる。E (m) lies between the two thresholds, and B
If S (m) is lower than that threshold, then
The logic circuit is selected to be in either ZCR mode or MZCR mode. If E S (m) is lower than the threshold, comparator 2 lowers line 2
An incremental timer 26 is used which generates a series of pulses approximately 0.25 seconds apart on the clock. These pulses act as a signal to the comparator 28. During this time, Z CI (, (m) '9i new circuit 13
The output of is coupled to peak ZCR, circuit 39. This beak ZCR circuit 29 has a plurality of 7. From CR(m), a signal representative of the peak ZCR is generated which is supplied to the comparator 28.
コンパレータ28はカウンタ30に結合された2つの出
力を有している。もしピークZCRが時間増分期間にお
いてスレッショルドに等しいかこれを越える場合、コン
パレータ28の一出力はカウンタ60を1つだけ減少さ
せる。他方、ピークZCRがスレッショルドよす小すい
場合ば、コンパレータ2Bの他方の出力がカウンタ30
を1つだけ増加する。カウンタ60はそれぞれZCRモ
ードセレクタスイッチ36に結合された出力を有するコ
ンパレータ61、ろ2に接続されている。Comparator 28 has two outputs coupled to counter 30. If the peak ZCR is equal to or exceeds the threshold during the time increment period, one output of comparator 28 decrements counter 60 by one. On the other hand, if the peak ZCR is smaller than the threshold, the other output of the comparator 2B is
Increase by one. Counter 60 is connected to comparator 61, filter 2, each having an output coupled to ZCR mode selector switch 36.
カウンタ60のカウント値が低いスレッショルド(例え
ば−4)に到つネすると、コンパレータ31はモードス
イッチ33を動作させてMZCRモードを表わす信号を
供給するとともに、ノ・ングオーバ一時間セレクタ64
によってタイマー20のノ\ングオーバ一時間をセット
する。他方、カウント値が高いスレッショルド(例えば
+6)に鈴すると、コンパレークろ2はモードスイッチ
33を作動してZ CRモードを指示する信号を供給す
るとともに、ハングオーバ一時間セレクタ35によって
タイマー20のハングオーバ一時間をセットする。各コ
ンパレータ61.32の出力はORゲート66の別個の
入力に結合されている。コンパレータ31あるいは32
からの信号によりOR,ゲート36は遅延回路37を介
してカウンタ3oにリセット信号を供給する。モードセ
レクタスイッチ63はフリップフロップ回路でよい。When the count value of counter 60 reaches a low threshold (e.g. -4), comparator 31 operates mode switch 33 to provide a signal indicative of the MZCR mode, and also activates mode switch 33 to provide a signal representing the MZCR mode.
The timer 20 is set for one hour over time. On the other hand, when the count value reaches a high threshold (for example, +6), the comparator 2 operates the mode switch 33 to supply a signal instructing the ZCR mode, and the hangover one hour selector 35 sets the hangover one hour of the timer 20. Set. The output of each comparator 61.32 is coupled to a separate input of an OR gate 66. Comparator 31 or 32
The OR gate 36 supplies a reset signal to the counter 3o via the delay circuit 37. The mode selector switch 63 may be a flip-flop circuit.
モードセレクタスイッチろ3の出力はコンパレーク38
および69の使用可能端子に結合されている。コンパレ
ータ68および39のうちの一方のみが一時期に使用可
能にされる。モードセレクタスイッチ33がZ CRモ
ード信号を供給すると、コンパレーク68は使用可nP
になる。Z CI’(、(m)を表わす信号ばZ CI
t (m)更新回路13からコンハL/−夕38に供給
される。Z CR(m)がスレッショルド(例えば16
m5間に50のゼロ交差)と等しいかまたはこれを越え
る場合は、コンパレーク68は、モードセレクタスイッ
チ66によって使用可能であると、ゲート22,21.
16を介してフラグスイッチ17をオンにする信号を供
給する。Z CR(m)がこのスレッショルドより小さ
い場合は、コンパレータ38はゲート25゜24.19
およびハングオーバータイマー20を介してフラグスイ
ッチ17をオフにする信号を供給する。通常のZCRモ
ードの間ではノ・ングオーバータイマー20はハングオ
ーバ一時間七しクタ35によって32m5 にセットさ
れる。The output of mode selector switch ro 3 is comparator 38
and 69 available terminals. Only one of comparators 68 and 39 is enabled at a time. When the mode selector switch 33 supplies the ZCR mode signal, the comparator 68 becomes usable nP.
become. The signal representing Z CI'(, (m) is Z CI
t (m) is supplied from the update circuit 13 to the controller L/-38. Z CR(m) is the threshold (e.g. 16
(50 zero crossings between m5), the comparator 68 is enabled by the mode selector switch 66 and the gates 22, 21 .
16, a signal is supplied to turn on the flag switch 17. If Z CR(m) is less than this threshold, comparator 38
and supplies a signal to turn off the flag switch 17 via the hangover timer 20. During normal ZCR mode, the no-hangover timer 20 is set to 32m5 by the hangover timer 35.
モードセレクタスイッチ33がMZCR,モード信号を
供給すると、コンパレータ39は使用可能になる。M
Z CR(m) (TI−hに等しいかまたはこれを越
えるビット反転シーケンスの数)を表わす信号はM Z
CR(m)更新回路14からコンパレータ69に供給
される。M Z CR(nl)がスレッショルドTH2
に等しいかこれを越える場合は、コンパレーク39は、
モードセレクタスイッチ33によって使用可能であると
、ゲート22,21.16を介してフラグスイッチ17
をオンにする信号を発生する。M Z CR(m)がこ
のスレッショルドより小さい場合は、コンパレーク69
はゲート25゜24.19およびハングオーバータイマ
ー20を介してフラグスイッチ17をオフ処してフラグ
信号を禁止する信号を供給する。I’vl z CRモ
ード期間中、ハングオーバータイマー2oはハングオー
バ一時間セレクタ34により64m5 にセットされる
。When the mode selector switch 33 supplies the MZCR, mode signal, the comparator 39 is enabled. M
The signal representing ZCR(m) (the number of bit-reversal sequences equal to or exceeding TI-h) is MZ
It is supplied from the CR(m) update circuit 14 to a comparator 69. M Z CR (nl) is threshold TH2
If it is equal to or exceeds , then the comparator 39 is
When enabled by the mode selector switch 33, the flag switch 17 is
Generates a signal to turn on. If M Z CR(m) is less than this threshold, comparator 69
provides a signal via gate 25.24.19 and hangover timer 20 that turns off flag switch 17 and inhibits the flag signal. During the I'vl z CR mode, the hangover timer 2o is set to 64m5 by the hangover hour selector 34.
Z CR(m)モード期間中はハングオーバ一時間は例
えば32m5 の短い遅延に設定されるが、M Z C
It (m)モード期間中はハングオーバータイマーは
例えば64m5の長い遅延にセットされる。During the ZCR(m) mode, the hangover hour is set to a short delay of, for example, 32m5, but the
During It (m) mode, the hangover timer is set to a long delay, for example 64m5.
タイマー26およびピークZCR回路29をリセットす
る手段が設けられている。コンパレーク31.32.1
5および23の出力はORゲート400Å力に結合され
ろ。高E (m)、高E S (rn)あるいは完了し
たピークZ CItカウントおよびモード選択を指示す
るこれらコンパレータの1つからの信号の存在によりタ
イマー26およびピークZ CR回路29をリセットす
る。増分カウンタ26の出力は遅延回路41を介してO
Rゲート400Å力に結合される。タイマー26および
ピークZ CR回路29は増分タイマー26の時間期間
の終了後リセットされる。Means are provided for resetting timer 26 and peak ZCR circuit 29. Compa Lake 31.32.1
The outputs of 5 and 23 are combined into an OR gate 400A. The presence of a signal from one of these comparators indicating high E (m), high E S (rn) or completed peak Z CIt count and mode selection resets timer 26 and peak Z CR circuit 29. The output of the increment counter 26 is output via a delay circuit 41 to O
R gate coupled to 400 Å force. Timer 26 and peak Z CR circuit 29 are reset after the expiration of the incremental timer 26 time period.
前述の説明において用いられた特定のスレッシヨルド値
および時間期間は最適化のための多くの客観的および主
観的試験によって見出された。性能の若干の低下を伴な
うならば、他の値および時間期間に置きかえることがで
きる。さらに、本発明は8ピツ)PCMシステムを用い
て説明されたが、4ビットPCMシステムを含む他のシ
ステムによっても容易に適用可能である。The specific threshold values and time periods used in the foregoing discussion were found through numerous objective and subjective tests for optimization. Other values and time periods can be substituted with some degradation in performance. Furthermore, although the invention has been described using an 8-bit PCM system, it is readily applicable with other systems, including 4-bit PCM systems.
本発明の現在好ましいと考えられる実施例について説明
し、図示したが、特許請求の範囲によって定義された本
発明の範囲を逸脱することなく種々の変更および変形が
なし得ることは当該技術分野における技術渚にとっては
自明である。While the presently preferred embodiment of the invention has been described and illustrated, it will be apparent to those skilled in the art that various changes and modifications can be made without departing from the scope of the invention as defined by the claims. For Nagisa, this is obvious.
第1図は本発明の実施に適するプログラムの流れ図、第
2図は本発明の実施に適する論理回路図である。
10 :入力回路
11〜14:パラメータ更新回路
15.18.23:コンパレータ
16.19,22.25 : ortゲート17 :フ
ラグスイッチ
20 :遅復旧タイマー
21.24:ANDゲート
26 :増分タイマー
28 :コンパレータ
29 :ピークZCR回路
30 :カウンタ
51.32:コンパレータ
33 :モードセレクタスイッチ
34 :ハングオーバ一時間セレクタ
36.40:(JRゲート
38.39:コンパレータ
同 風 間 弘 志′で 1FIG. 1 is a flowchart of a program suitable for implementing the present invention, and FIG. 2 is a logic circuit diagram suitable for implementing the present invention. 10: Input circuits 11 to 14: Parameter update circuits 15.18.23: Comparators 16.19, 22.25: Ort gate 17: Flag switch 20: Late recovery timer 21.24: AND gate 26: Incremental timer 28: Comparator 29: Peak ZCR circuit 30: Counter 51.32: Comparator 33: Mode selector switch 34: Hangover one hour selector 36.40: (JR gate 38.39: Comparator Hiroshi Kazama 1)
Claims (10)
ーチ信号を検出したときにフラグ信号を拐供する方法に
おいて、 前記チャンネルによって搬送される波形に結合する段階
と、 前記波形のエネルギレベルおよびゼロ交差速度を算出す
る段階と、 前記エネルギレベルを高いおよび低いエネルギスレッシ
ョルドと比較する段階と、 前記エネルギレベルが前記高いエネルギスレッショルド
に等しいかあるいはこれより大きい場合に、フラグ信号
を提供する段階と、 前記エネルギレベルが前記低いエネルギスレッショルド
より低い場合に、フラグ信号を禁止する段階と、 前記エネルギレベルが前記低いエネルギスレッショルド
に等しいかあるいはこれより大きい場合゛に、継続する
段階と、 前記波形の時間で区分されたエネルギレベル凹の差すな
わちエネルギスロープを算出する段階と、前記エネルギ
スローフヲスロープスレツショルドと比較する段階と、 前記スロープが前記スロープスレッショルドに等しいか
あるいはこれを越えるときに、フラグ信号を提供する段
階と、 前記スロープが前記スレッショルドより低℃・場合に継
続する段階と、 前記ゼロ交差速度をゼロ交差スレッショルドと比較する
段階と、 ゼロ交差速度が前記ゼロ交差スレッショルドに等しいか
あるいはこれを越える場合に、フラグ信号を提供する段
階と、 前記ゼロ交差速度が7!lfi記ゼロ交差スレツシヨル
ドより低いときに、フラグ信刊を禁止する段階とからな
ることを特徴とするコンブリメンタリスビーチ検出方法
。(1) A method for providing a flag signal upon detection of a speech signal in a waveform carried by a communication channel, comprising the steps of: coupling to the waveform carried by the channel; and determining the energy level and zero-crossing velocity of the waveform. calculating; comparing the energy level to high and low energy thresholds; providing a flag signal if the energy level is equal to or greater than the high energy threshold; inhibiting a flag signal if the energy level is less than the lower energy threshold; continuing if the energy level is equal to or greater than the lower energy threshold; calculating a level dip difference or energy slope; comparing said energy slope to a slope threshold; and providing a flag signal when said slope is equal to or exceeds said slope threshold. , continuing if the slope is below the threshold; comparing the zero-crossing rate to a zero-crossing threshold; and setting a flag if the zero-crossing rate is equal to or exceeds the zero-crossing threshold. providing a signal, the zero crossing speed being 7! A method for detecting a conbrimentalis beach, comprising the steps of: prohibiting flag transmission when the lfi is below a zero-crossing threshold.
ゼロ交差スレッショルドより低い時に経過する時間期間
の終端まで遅延される特許請求の範囲第1項記載の方法
。2. The method of claim 1, wherein inhibiting the flag signal is delayed until the end of a time period that elapses when the zero-crossing rate is less than the zero-crossing threshold.
波形中にディジタル化されたスピーチ信号を検出したと
きにフラグ信号を袂供する方法において、 前記チャンネルによって搬送される波形に結合する段階
と、 前記1α列ビットを並列バイトに変換する段階と、前記
波形の1タイムスロツト中のエネルギレベルを複数のバ
イトの2進加算によって算出する段階と、 複数のタイムスロットの平均エネルギレベルを高いおよ
び低いエネルギスレッショルドと比較する段階と、 前記エネルギレベルが前記高いエネルギスレッショルド
に等しいかあるいはこれより大きい場合にフラグ信号を
提供する段階と、 前記−r−ネルギレペルカ前記低いエネルギスレッショ
ルドより似い場合にフラグ信号を禁止する段階と、 前記エネルギレベルが前記イ丘いエネルギスレッショル
ドに等しいかあるいはこれより大きい場合に継続する段
階と、 2つのタイムスロットの時間区分されたエネルギレベル
間の差すなわちエネルギスロープを算出する段階と、 前記エネルギスローフヲスロープスレツショルドと比較
する段階と、 前記スローフカ前記スロープスレツショルトニ等しいか
あるいはこれを越えるときに、フラグ信号を提供する段
階と、 前記スロープが前記スレッショルドより低い場合に継続
する段階と、 前記バイトの極性ビットの反転を計数することによって
前記波形のゼロ交差速度を算出する段階と、 pt前記ゼロ交差速度をゼロ交差スレッショルドと比較
する段階と、 ゼロ交差速度が前記ゼロ交差スレッショルドに等しいか
あるいはこれを越える場合に、フラグ信号を提イエ(す
る段階と、 前記ゼロ交差速度が前記ゼロ交差スレッショルドより低
いときに、フラグ信号を禁止する段階とからなることを
特徴とするコンプリメンタリスピーチ検出方法。(3) A method for providing a flag signal upon detection of a digitized speech signal in a waveform of serial bits carried by a communication channel, comprising the steps of: coupling to the waveform carried by the channel; converting bits into parallel bytes; calculating the energy level during a time slot of said waveform by binary addition of a plurality of bytes; and comparing the average energy level of the plurality of time slots with high and low energy thresholds. providing a flag signal if the energy level is equal to or greater than the higher energy threshold; and inhibiting the flag signal if the energy level is more similar than the lower energy threshold. , continuing if said energy level is equal to or greater than said high energy threshold; and calculating a difference or energy slope between the time-segmented energy levels of two time slots; comparing the slope to a slope threshold; providing a flag signal when the slope equals or exceeds the slope; continuing if the slope is less than the threshold; calculating the zero-crossing rate of the waveform by counting the reversals of polarity bits of the bytes; pt comparing the zero-crossing rate to a zero-crossing threshold; and whether the zero-crossing rate is equal to the zero-crossing threshold. A complementary speech detection method comprising the steps of: providing a flag signal when the zero-crossing rate exceeds the zero-crossing threshold; and disabling the flag signal when the zero-crossing rate is lower than the zero-crossing threshold.
ゼロ交差スレッショルドより低い時に経過する時間期間
の終端まで遅延される特許請求の範囲第3項記載の方法
。4. The method of claim 3, wherein inhibiting the flag signal is delayed until the end of a time period that elapses when the zero-crossing rate is less than the zero-crossing threshold.
後書算出される特許請求の範囲第6項記載の方法。5. The method of claim 6, wherein the average energy level is calculated after each time slot.
のディジタル化された波形中にディジタル化されたスピ
ーチ信号を検出したときにクラブ信号を提供する方法に
お〜・て、 前記チャンネルによって搬送される波形に結合する段階
と、 前記直列ビットを並列バイトに変換する段階と、前記バ
イトの極性ビットの変化から、エネルギレベル間高いエ
ネルギスレッショルドヨリ低りかつエネルギスロープが
エネルギスロープスレッショルドより小さくなる複数の
時間期間のそれぞれの間においてゼロ交差のピーク数を
算出する段階と、 ビークゼロ交差がピークゼロ交差スレッショルドより小
さくなる時間期間の数をカウントに加算する段階と、 前記ビークゼロ交差が前記ピークゼロ交差スレッショル
ドに等しいかあるいはこれより大きくなる時間期間の数
を前記カウントから減算する段階と、 前記カウントが所定の負の数に等しいかあるいはこれよ
り小さいときに、高レベルシステムノイズ状態を指示す
る段階と、 前記カウントが所定の正の数に等しいかあるいはこれよ
り太きいときに、低レベルシステトノイズ状態を指示す
る段階と、 前記バイトの極性の2進加算によって1タイムスロット
間に集計された前記波形の平均エネルギレベルを算出す
る段階と、 検数のタイムスロットの平均エネルギレベルを高いおよ
び低いエネルギスレッショルドと比較する段階と、 前記エネルギレベルが前記高いエネルギスレッショルド
に等しいかあるいはこれより太きいときに、フラグ信号
を提供する段階と、 前記エネルギレベルが前記低いエネルギスレッショルド
より低い場合に、フラグ信号を禁止する段階と、 2つのタイムスロットの時間的に区分されたエネルギレ
ベル間の差、すなわちエネルギスロープを算出する段階
と、 前記エネルギスロープをスロープスレッショルドと比較
する段階と、 前記スローフが前記スロープスレツショルトニ等しいか
あるいはこれを越える場合に、フラグ細分を提供する段
階と、 高システムノイズ状態が指示された場合に、第1の引続
くビット反転スレッショルドに等しいかあるいはこれよ
り太きい引続くビット反転を有する長いビット反転シー
ケンスの数を算出および計数する段階と、 集計された長いビット反転シーケンスの数を第2のビッ
ト反転シーケンススレッショルドと比較する段階と、 前記長いビット反転シーケンスの数が前記第2のビット
反転シーケンススレッショルドに等しいかあるいはこh
より大きい3y合にフラグ信号を保持する段階と、 前記長いビット反転シーケンスの数が前記第2のビット
反転シーケンススレッショルドより小さい場合にフラグ
信号を禁止する段階とを有し、低システムノイズ状態が
指示された場合に、前記波形のゼロ交差速度を算出し、
ゼロ交差スレッショルドと比較する段階と、 前記ゼロ交差速度が前記ゼロ交差スレッショルドに等し
いかあるいはこれを越える場合に、フラグ信号を保持す
る段階と、 前記ゼロ交差速度が前記ゼロ交差スレッショルドより低
い場合に、フラグ信号を禁止する段階とを有する ことを特徴とするコンプリメンクリスピーチ検出方法。(6) A method for providing a club signal upon detecting a digitized speech signal in a digitized waveform of serial bits carried by a communication channel, comprising the steps of: converting the serial bits into parallel bytes; and from the change in the polarity bits of the bytes, a plurality of time periods during which energy levels are lower than a high energy threshold and the energy slope is less than the energy slope threshold. calculating a peak number of zero crossings during each of the following steps: adding to a count the number of time periods during which the peak zero crossing is less than a peak zero crossing threshold; subtracting a number of time periods from said count that is greater than said count; indicating a high level system noise condition when said count is less than or equal to a predetermined negative number; indicating a low level system noise condition when equal to or greater than a positive number; and determining the average energy level of said waveform aggregated over one time slot by binary addition of the polarities of said bytes. calculating, and comparing an average energy level of a time slot of a count with high and low energy thresholds, and providing a flag signal when the energy level is equal to or greater than the high energy threshold. disabling a flag signal if the energy level is below the lower energy threshold; and calculating a difference between the temporally spaced energy levels of two time slots, i.e., an energy slope. comparing the energy slope to a slope threshold; providing a flag subdivision if the slope is equal to or exceeds the slope threshold; calculating and counting the number of long bit-flip sequences having successive bit-flips equal to or greater than a successive bit-flip threshold of the second bit-flip sequence; comparing the number of long bit-flip sequences to a threshold; and determining whether the number of long bit-flip sequences is equal to or less than the second bit-flip sequence threshold
retaining a flag signal when the number of long bit-flip sequences is less than the second bit-flip sequence threshold, and inhibiting the flag signal if the number of long bit-flip sequences is less than the second bit-flip sequence threshold; calculate the zero-crossing speed of the waveform if
comparing to a zero-crossing threshold; maintaining a flag signal if the zero-crossing rate is equal to or exceeds the zero-crossing threshold; and if the zero-crossing rate is less than the zero-crossing threshold; and inhibiting a flag signal.
前記ゼロ交差スレッショルドより低い時に経過する時間
期間の終端まで芥延される特許請求の範囲第6項記載の
方法。7. The method of claim 6, wherein the prohibition of the flag is deferred until the end of a period of time that elapses when the zero-crossing rate is less than the zero-crossing threshold.
計算される特許請求の範囲第7項記載の方法。8. The method of claim 7, wherein the average energy level is recalculated after each time slot.
ーチ信号な検出した時にフラグ信号を提供する装置にお
いて、 前記チャンネルによって搬送される波形に結合するため
の手段と、 前記波形のエネルギレベルおよびゼロ交差速度を算出す
るための手段と、 前記エネルギレベルを高いおよび低いエネルギスレッシ
ョルドと比較するだめの手段と、前記エネルギレベルが
前記高いエネルギスレッショルドに等しいかあるいはこ
」1より大きい場合にフラグ信号を提供するための手段
と、前記エネルギレベルが前記低いエネルギスレッショ
ルドより低い場合にフラグ信号を禁止するための手段と
、 前記エネルギレベルが前記低いエネルギスレッショルド
に等しいかあるいを」、こ牙1よりも大きいjメツ。 合に継続するための手段と、 前記波形の時間で区分されたエネルギレベル間の差、す
なわちエネルギスロープを算出するための手段と、 前記エネルギスロープをスロープスレッショルドと比較
するだめの手段と、 前記スローフカAjl 記スlj −ブスレッショルト
ニ等しいかあるいはこれを越えるときに、フラグ信号を
提供するだめの手段と、 前記スロープが前記スレッショルドより低い場合に、継
続するための手段と、 前記ゼロ交差速度をゼロ交差スレッショルドと比較する
ための手段と、 ゼロ文差速rq゛カ前記ゼロ交差スレッショルドに等し
いかあるいはこれを越える場合にフラグ信号を提供する
ための手段と、 前記ゼロ交差速度が前記ゼロ交差スレッショルドより低
いときにフラグ信号を禁止するための手段 とを四備することを特徴とするコンプリメンタリスピー
チ検出装置。(9) An apparatus for providing a flag signal upon detection of a speech signal in a waveform carried by a communication channel, comprising: means for coupling to the waveform carried by the channel; and an energy level and zero-crossing rate of the waveform. means for comparing said energy level with a high and a low energy threshold; and means for providing a flag signal if said energy level is equal to or greater than said high energy threshold. means for inhibiting a flag signal if said energy level is less than said lower energy threshold; and said energy level is equal to or greater than said lower energy threshold; . means for calculating a difference between time-divided energy levels of the waveform, ie, an energy slope; means for comparing the energy slope with a slope threshold; means for providing a flag signal when the slope is equal to or exceeds the threshold; and means for continuing when the slope is less than the threshold; means for comparing to a zero-crossing threshold; means for providing a flag signal if the zero-crossing speed rq is equal to or exceeds the zero-crossing threshold; and means for inhibiting the flag signal when the signal is lower than the flag signal.
前記ゼロ交差スレッショルドより低い時に経過する時間
期間の終端まで遅延される特許請求の範囲第9項記載の
装置。 (【l) 前記平均エネルギレベルは各タイムスロット
の後で再計算される特許請求の範囲第10項記載の装置
。10. The apparatus of claim 9, wherein said flag signal 70 is delayed until the end of a time period that elapses when said zero crossing speed is less than said zero crossing threshold. 11. The apparatus of claim 10, wherein: (l) the average energy level is recalculated after each time slot.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US51357883A | 1983-07-14 | 1983-07-14 | |
US513578 | 1983-07-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6039938A true JPS6039938A (en) | 1985-03-02 |
Family
ID=24043858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59144547A Pending JPS6039938A (en) | 1983-07-14 | 1984-07-13 | Complementary speech detector |
Country Status (3)
Country | Link |
---|---|
JP (1) | JPS6039938A (en) |
BE (1) | BE900155A (en) |
IT (1) | IT1209561B (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2384670A (en) * | 2002-01-24 | 2003-07-30 | Motorola Inc | Voice activity detector and validator for noisy environments |
-
1984
- 1984-06-25 IT IT8421581A patent/IT1209561B/en active
- 1984-07-13 BE BE2/60458A patent/BE900155A/en not_active IP Right Cessation
- 1984-07-13 JP JP59144547A patent/JPS6039938A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2384670A (en) * | 2002-01-24 | 2003-07-30 | Motorola Inc | Voice activity detector and validator for noisy environments |
GB2384670B (en) * | 2002-01-24 | 2004-02-18 | Motorola Inc | Voice activity detector and validator for noisy environments |
Also Published As
Publication number | Publication date |
---|---|
IT1209561B (en) | 1989-08-30 |
IT8421581A0 (en) | 1984-06-25 |
BE900155A (en) | 1984-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US3985956A (en) | Method of and means for detecting voice frequencies in telephone system | |
US4410763A (en) | Speech detector | |
US3712959A (en) | Method and apparatus for detecting speech signals in the presence of noise | |
CA1039420A (en) | Detector for coded speech signals | |
US4745392A (en) | Noise reduction in signal transmission system over building power distribution wiring | |
EP0092611B1 (en) | Speech analysis system | |
JPS6039938A (en) | Complementary speech detector | |
US4469916A (en) | Method and apparatus for detecting signalling and data signals on a telephone channel | |
US4090133A (en) | Digital time interval sensor using a free running counter and a cycle counter with only the latter being reset at each event | |
EP0047589B1 (en) | Method and apparatus for detecting speech in a voice channel signal | |
JPS59501731A (en) | Multiple simultaneous tone decoder | |
GB2292870A (en) | Synchronization of digital telemetry | |
EP0049059B1 (en) | Pulse code demodulator for frequency shift keyed data | |
SU1506564A2 (en) | Identifier of channel activity in delta-modulation system | |
SU1003327A1 (en) | Pulse duration discriminator | |
SU953658A1 (en) | Speech signal formant amplitude and frequency analyzer | |
JPS5834986B2 (en) | Adaptive voice detection circuit | |
SU834907A1 (en) | Device for analysis of pulse trains | |
SU942001A1 (en) | Device for sorting numbers | |
SU978188A1 (en) | Device for discriminating speech signal clipped envelope | |
SU439818A1 (en) | Device for determining the histogram of the first derivative of the signal | |
US6580792B1 (en) | Signal detector with automatic gain control | |
SU924854A1 (en) | Analogue-digital converter | |
Thorvaldsen | Construction of an Automatic Data Collecting System | |
SU1379605A1 (en) | Rolled stock length pickup |