DE2613258A1 - System zur automatischen spracherkennung - Google Patents
System zur automatischen spracherkennungInfo
- Publication number
- DE2613258A1 DE2613258A1 DE19762613258 DE2613258A DE2613258A1 DE 2613258 A1 DE2613258 A1 DE 2613258A1 DE 19762613258 DE19762613258 DE 19762613258 DE 2613258 A DE2613258 A DE 2613258A DE 2613258 A1 DE2613258 A1 DE 2613258A1
- Authority
- DE
- Germany
- Prior art keywords
- decision
- signal
- signals
- correlation data
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
PATENTANWALT
DIPL-ING.
DIPL-ING.
6 Frankfurt am Main 70
Schneckenhofstr. 27 - Tel. 617079
Schneckenhofstr. 27 - Tel. 617079
26. März 1976 ROCKWELL INTERNATIONAL CORPORATION Gzw/goe
System zur automatischen Spracherkennung.
Die Erfindung betrifft ein System zur Spracherkennung gemäß dem Gattungsbegriff des Hauptanspruches, insbesondere ein System,
das fähig ist, Schlüsselworte in einer kontinuierlich gesprochenen Sprache zu erkennen.
Es sind bereits zahlreiche Spracherkennungs-Systeme für die Anwendung
in der Datenverarbeitung, der Kommunikation und der industriellen MaschiVensteuerung vorgeschlagen worden.
Die US-PS Nr. 3,775,627 und Nr. 3,582,559 beschreiben Worterkennungs-Systeme,
die diskrete Worte erkennen können, die jedoch nur bei Isolierten sprachlichen Äußerungen arbeitsfähig sind, und die
funktionell nicht in der Lage sind, Schlüsselwörter bei einer kontinuierlich gesprochenen Sprache zu erkennen.
Die US-PS 3,588,363 beschreibt ein Worterkennungs-System, das auf einer Folge von phonetischen Ereignis-Anzeigen basiert. Dieses
System ist zwar anwendbar bei einzelnen sprachlichen Äußerungen, ist jedoch funktionell nicht in der Lage, bei einer kontinuier-
609884/0999
lieh gesprochenen Sprache verwendet zu werden, da das Ton-Erkennungsnetzwerk
zu Beginn jedes Wortes zurückgestellt werden muß.
Die US-PS'en 3,557,310 und 3,688,126 beschreiben ein Worterkennungs-System
mit einem begrenzten Vokabular (festgelegt auf zwei Worte). Keines dieser beiden Systeme wird einem Schlüsselwort
in einer kontinuierlich gesprochenen Sprache gerecht.
In der US-PS 3,499,989 wird ein System zur Anzeige von Pormanten
im Sprachsignal (Pole in der Vokal-Übertragungsfunktion) beschrieben.
Dieses System sieht jedoch eine Sprachanalyse, aber keine Klassifikation von sprachlichen Äußerungen vor.
Die US-PS 3,428,748 beschreibt ein System zum Klassifizieren von
Vokalen, wobei eine Entscheidung über vokale und nicht vokale Töne getroffen wird. Dieses System ist gleich
dem System nach der US-PS 3,499,989 ein Sprach-Analysator und ist nicht fähig, eine Klassifikation von Äußerungen durchzuführen.
.Die US-PS'en 3.129,287 und 3,742,143 beschreiben Wor.terkennungs-Systeme
mit einem beschränkten Vokabular, die nicht fähig sind, der Erkennung eines Schlüsselwortes gerecht zu werden.
Das System gemäß der US-PS 3,198,884 ist auf die Erkennung von einzelnen Ziffern abgestellt. Dieses System sieht über" einen
Segmentierungsvorgang eine akustische Zeitregistrierung vor. Diese Segmentierungsvorgänge eröffnen die Möglichkeit Tür yPehler
und sind ungeeignet zur Erkennung von Schlüsselworten.
Das System gemäß der US-PS 3,7^2,146 ist auf die Klassifikation
von Vokalen gerichtet und besitzt keine Vorkehrungen zum Kombinieren dieser Ereignisse für die Anzeige eines Schlüsselwortes.
In dem Artikel von G. L. Clapper, mit dem Titel "Automatic Word Recognition", Seiten 57-69 des IEEE-Spectrum, August 1971, wird
ein System für die Erkennung einzelner Worte beschrieben. Da dieses System auf Grenzinformationen von Worten beruht, ist durch
dieses System eine Erkennung von Schlüsselworten unmöglich.
Das asynchrone Anzeigen von Schlüsselworten in einer kontinuierlichen
Sprache setzt voraus, daß in dem Erkennungsverfahren keine
Synchronisationspunkte verwendet werden. Aus zwei Gründen ist eine asynchrone Anzeige bei der Klassifikation von kontinuierlichen
Sprachsignalen im Speziellen wünschenswert. Zunächst wird die Dauer eines Schlüsselwortes in einer kontinuierlichen Spra-
dem ehe durch die Sprachgeschwindigkeit und die Stärke, die/Schlüssel
wort als Teil der gesprochenen Nachricht mitgegeben wird, Zum zweiten ist die Stellung derselben phonetischen Elemente über
609884/0999
eine Anordnung von verschiedenen Äußerungen desselben Schlüsselverwendet
wortes nichtlineaj/. Dieser zweite Grund vermindert die Verwendbarkeit
der linearen Zeitnormierung, die sich als sehr nützlich
bei der Erkennung von einzelnen Worten erwiesen hat.
Viele der vorstehend erläuterten bekannten Spracherkennungs-Systeme
als auch andere ähnliche Systeme sehen Synchronisationspunkte in dem Erkennungsverfahren vor, übliche bekannte Verfahren
leiten die Synchronisationspunkte von vorklassierenden Segmentierungsverfahren ab. Segmentierungsverfahren besitzen
zwei natürliche Wachteile. Zunächst sinkt die Leistungsfähigkeit rapide ab, wenn in dem Signal Rauschen enthalten ist. Ein
synchrones Verfahren, das von Hause aus verrauscht ist, ist für ein System zum Erfassen eines Schlüsselwortes kein optimales Verfahren,
weil eine ausgelassene Segmentierungsgrenze trotz einer
perfekten Erlcennungs logik des Schlüsselwortes verhindern kann.
Keines der oben beschriebenen Systeme ist fähig, in einer kontinuierlichen
Sprache ein oder mehrere Schlüsselwörter zu erfassen. Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren
anzugeben, das die Erkennung von Schlüsselwörtern in einer kontinuierlichen Sprache gewährleistet. Die Lösung dieser Aufgabe
gelingt gemäß den kennzeichnenden Merkmalen des Hauptanspruches.
609884/0999
Die Erfindung bezieht sich somit auf ein neues asynchrones Anzeigesystem,das
fähig ist, eine unbegrenzte Anzahl von Schlüsselwörtern in einer kontinuierlichen Sprache zu erfassen, wobei das
System keine Isolierung bzw. Segmentierung von Worten erfordert. Bei einer bevorzugten Ausführungsform wird mittels eines Sprach-Prozessors'
aus einem eingangsseitigen kontinuierlichen Sprachsignal eine Vielzahl von analogen Sprachparameter extrahiert und
mittels eines STV-Generatorkreises selektiv in digitalisierte Zeit-Spektral-Matrix-Sprachsignalabtastwerte umgewandelt. In
einem asynchronen Korrelationskreis werden Polgen der digitalisierten
Sprachsignalabtastwerte kontinuierlich mit gespeicherten Spektral-Bezugs-Abdeckschablonen, die vorbestimmten zu erkennenden
Schlüsselwörtern entsprechen, korreliert, um korrelierte Daten zu erzeugen. Diese korrelierten Daten setzen einen Ent»
scheidungsfunktions-Kreis in die Lage, für jedes der vorgewählten erfaßten Schlüsselworte ein Entscheidungs-Ausgangssignal zu erzeugen.
Es ist ein Ziel der vorliegenden Erfindung, ein neues,asynchrones
Spracherkennungssystem zu entwickeln; ein anderes Ziel der Erfindung ist es, ein System zu entwickeln, das zur Erkennung
von Schlüsselworten in fortlaufender Sprache befähigt ist. Ein weiteres Ziel der Erfindung ist ein System zur Erkennung von
Schlüsselworten in fortlaufender Sprache durch Anwendung einer fortlaufenden asynchronen Korrelationsverarbeitung.
Anhand von in der Zeichnung dargestellten Ausführungsbeispielen wird die Erfindung näher erläutert.
■-/-609884/0999
Es zeigen:
Fig. 1 ein vereinfachtes Blockschaltbild einer bevorzugten Ausführungsform der Erfindung;
Fig. 2 ein Blockschaltbild des Sprach-Prozessors der Fig. Ij
Fig. 3 ein Blockschaltbild des STV-Generators der Fig. 1;
Fig. k Impulsdiagramme zur Erläuterung der Arbeitsweise des
STV-Generators nach Fig. 3;
Fig. 5 ein Blockschaltbild des asynchronen Korrelationskreises
nach Fig. Ij
Fig. 6 ein Blockschaltbild der zentralen Steuerung der Fig. 5;
Fig. 7 ein Impulsdiagramm zur Erläuterung der Arbeitsweise
der zentralen Steuerung nach Fig. 6;
Fig. 8 ein Blockschaltbild der Maskeneinheit nach Fig. 5;
Fig. 9 die Adressenpositionen in dem Maskenspeicher nach den
Fig. 5 und 8;
Fig. 10 ein Blockschaltbild der Speichereinheit mit direktem Zugriff gemäß Fig. 5 J
Fig. HA und 113 die STV-Adressenposition in den Speicher der
Fig. 5 und 10 während der gewählten Zustände "LOAD" und "RUN"j
Fig. 12 verschiedene Typen von Korrelationsoperationen, durchgeführt
durch einige der verschiedenen Konfigurationen, die in der arithmetischen Strang-Einheit der Fig. 5
verwendet werden könnenj -/-
609884/0999
Fig» 13A und 13B zwei verschiedene Verwirklichungen der Vergleichsfunktion
gemäß Fig. 5 und 12;
Fig. 14A, 14B und I1IC drei verschiedene Realisierungsmöglichkeiten
für den Schwellwertfunktions-Änderer nach Fig. 5 und 12;
Fig. 15A und 15B zwei verschiedene Realisierungsmöglichkeiten
für den Gewichts-Funktion-Änderer der Fig. 5 und 12;
Fig. 16 ein Blockschaltbild des Summen-Akkumulators der Fig. 5
und 12;
Fig. 17 die Arbeitsweise der von Eins verschiedenen arithmetischen
Strang-Einheit 151 für eine Maske X mit der Länge von l6 Worten;
Fig. 18 ein Blockschaltbild eines ersten Teils der Entscheidungsfunktion nach Fig. 1;
Fig. 19 ein Blockschaltbild eines zweiten Teiles der Entscheidungsfunktion
nach Fig. 1, und
Fig. 20 ein Blockschaltbild eines alternativen zweiten Teiles der Entscheidungsfunktion nach Fig. 1, die anstelle der
Anordnung nach Fig. 19 verwendbar ist.
609884/0999
Die Fig. 1 zeigt ein vereinfachtes Blockschaltbild eines bevorzugten
Ausführungsbeispiels der Erfindung zum Erfassen eines oder mehrerer Schlüsseiworte in einer am Eingang anliegenden
kontinuierlichen Sprache. Ein Sprach-Prozessor 11, der im wesentlichen ein Spektral-Analysierer ist, führt in dem kontinuierlichen
breitbandigen Eingangs-Sprachsignal N analoge spektrale Bestimmung durch, um in N-Kanälen analoge Sprechparameter S. bis
S„ zu erzeugen. Diese spektralen Bestimmungen können der Energie
von Bandpässen entsprechen, deren Grenzen jeweils um 200 Hz auseinanderliegen. Jeder der N-Kanäle der analogen Sprachparameter
werden mittels eines STV-Generators 13 zeit-multiplext
und digitalisiert, um ein jeder lO-Millisekunden-(msec)-Periode Spektral-Zeit-Vektor-(STV)-Daten mit N-Kornponenten zu erzeugen.
Diese STV-Daten des STV-Generators 13 werden in einem asynchronen Korrelationskreis 15 gespeichert, zusammen mit einer vorbestimmten
Anzahl von vorher empfangenen STV-Daten, um so eine Folge von gespeicherten STV-Daten zu erzeugen. Zu jedem Zeitpunkt,
in dem ein neuer STV-Wert erhalten wird, wird der älteste gespeicherte STV-Wert aus der Folge entfernt. Die Folge der gespeicherten
STV-Daten formt im wesentlichen ein Spektogramm, wobei die Frequenzkomponenten jeder der STV-Daten beispielsweise
entlang einer vertikalen Frequenzachse angeordnet sind und wobei die STV-Daten entlang einer horizontalen Zeitachse in Abständen
S09884/0999
— ο —
von 10 msec, angeordnet sind. Werden also STV-Daten jede 10 msec,
entnommen, dann entsteht ein Muster, das das Spektogramm bildet.
Der asynchrone Korrelationskreis 15 bewirkt kontinuierlich eine asynchrone Korrelation hinsichtlich der Folge der STV-Daten, die
von dem STV-Generator 13 erzeugt werden. Um diese kontinuierliche asynchrone Korrelation durchzuführen, werden die ankommenden
digitalisierten Sprachparameter in der Folge der aufeinanderfolgenden STV-Daten selektiv mit intern gespeicherten Bezugs-Maskenschablonen
oder Masken (gezeigt in Fig» 9) in dem Korrelationskreis 15 korreliert. Die gespeicherten Masken entsprechen Unterelementen
der Schlüsselwortäußerung. Typischerweise stellen diese Unterelemente ein Paar von Phonemen ("dyads" oder
zwei phonetische Ereignisse) und/oder ein Triplet von Phonemen ("triads" oder drei phonetische Ereignisse) dar. Ein "dyad" oder
"triad" ist in jeder Maske gespeichert. Im Mittel sind in dem vorliegenden System für die Anzeige des gewünschten Schlüsselwortes
sechs Masken notwendig.
Es sollte angemerkt werden, daß die englische Sprache ein phonetisches
Alphabet besitzt, das aus phonetischen Symbolen aufgebaut ist, die ihrerseits diese phonetischen Ereignisse darstellen.
In der englischen Sprache sind ungefähr 44 phonetische Ereignisse
bzw. Erscheinungen vorhanden. Diese phonetischen Er-
609884/0999
eignisse schließen auch beispielsweise die Vokale ee, üb, uu, er, ah usw. ein, dh. "stops", die eine Person durchführt,
indem sie in bestimmten Positionen t, k, g, b usw. und bei anderen Konsonanten die stimmhafte Aussprache
abschließt.
Die gespeicherten Masken können eine verschiedene Länge aufweisen*
Typischerweise können sie in der Länge von 1 bis 16 STV-Daten schwanken, wobei im Mittel eine Maske eine Länge von ungefähr
10 STV-Daten hat.
Jede der gespeicherten Masken wird periodisch mit einer entsprechend
langen Folge von aufeinanderfolgenden STV-Daten verglichen, zwecks Identifizierung bzw. Korrelierung der "dyad"- und "triad"-Tongruppen.
Die am nahe kommendste Korrelation zwischen jeder Maske und der entsprechenden STV-FoIge wird durch ein entsprechendes
Korrelationszeichen angezeigt. Auf diese weise wird periodisch einsMessung für die Schlüsselwort-Wahrscheinlichkeit für
jedes der gewünschten Schlüsselworte berechnet.
Die Ausgangs-Korrelationszeichen zwischen der gespeicherten Maske und den in Parametern aufgelösten Sprachsignalen oder STV-Daten
gehen in die ausgangsseitige Korrelationsinformation des Korrelationskreises 15 ein. Diese ausgangsseitige Korrelation^-Information
wird durch den Entscheidungs-Punktions-Kreis 17, der ein
-/-609884/099S
Rechner oder eine spezielle Logik sein kann, in ein Gesamt-Xhnlichkeitsmaß
kombiniert. Die Entscheidungsfunktion 17 besitzt intern Schwellwerte für dieses Ähnlichkeitsmaß, um für jedes
Schlüsselwort, das erfaßt wurde, ein das Erscheinen anzeigendes Entscheidungs-Ausgangssignal zu erzeugen. Die unter der Entscheidungsfunktion
vorgenommene Kombination der Korrelationsdaten berücksichtigt sowohl die zeitliche Folge der Unterelemente des
Schlüsselwortes als auch die Veränderbarkeit der Gliederungsrate (articulation rate).
Ein System-Zeitgenerator 19 erzeugt über interne, nicht dargestellte
Teilerstufen ausgangsseitig Taktzeitimpulse von 1 MHz, 100 KHz und 100 Hz, die selektiv an die Kreise der Pig. I angelegt
sind, damit sie in der oben beschriebenen Weise arbeiten können. Im folgenden sollen die Komponenten der Fig. 1 in größeren
Einzelheiten erläutert werden, damit die Erfindung besser verständlich ist.
Die Fig. 2 zeigt ein Blockschaltbild des Sprach-Prozessors 11 der Fig. 1. Das eingangsseitige kontinuierliche Sprachsignal
wird gesteuert verstärkt durch einen automatischen Verstärkungssteuerkreis 21, bevor es an die Vor-Anhebestufen 23 angelegt
wird. Diese Vor-Anhebestufen 23 heben das Frequenzspektrum des
Signals von dem Schaltkreis 21 beispielsweise um 6 Decibel pro Oktave an, bevor das resultierende vorangehobene Signal an einen
6 0 988 h /0999
Spektralanalysator 25 gelangt. Der Spektralanalysator 25 kann
eine Filterbank von nicht-dargestellten aufeinanderfolgenden 200 Hs-Bandpaß-Filtern aufweisen, zwecks Trennung der verschiedenen
Frequenzkomponenten in dem vorangehobenen Signal.
Die verschiedenen getrennten Frequenskomponenten des Spektralanalysators
25 durchlaufen zunächst eine Gleichrichtung mittels der Dioden 27\ - 27K und werden anschließend mittels Tiefpaßfilter
29,, - 29K gefiltert, bevor sie an übliche logarithmische
Verstärker 31-j - 31K angelegt werden, die die analogen Sprechparameter
S. - S-. erzeugen. Die Ausgangssignale von vorbestimmten
der Filter 29-j - 29K können weiterhin an einen Grundzug-Herausnehmer
33, der lineare oder nicht-lineare Funktionen dieser vorgewählten Filter-Ausgangssignale erzeugt, angelegt werden,
zwecks Erzeugung der analogen Sprechparameter SK+.. - S . Eine
vorbestirnmte Anzahl und Kombination von analogen Sprechparametern
der logarithmischen Verstärker 31-, - 31K und des Grundzug-Herausnehmers
33 kann in der nachfolgenden Signalverarbeitung verwendet werden» Zum Zweck der vorliegenden Beschreibung ist
angenommen, daß die gesamte Anzahl der analogen Sprechparameter, die behandelt werden, N ist, wobei N = 16 ist. Die spektralen
Bestimmungswerte oder analogen Sprechparameter S^ - S.g (da
N=l6) des Sprach-Prozessors 11 werden an den STV-Generator 13 angelegt, zwecks Erzeugung einer entsprechenden STV-Information.
609884/0999
In Pig. 3 ist ein Blockschaltbild eines derartigen STV-Cenerators
13 dargestellt. Bei der Erklärung der Arbeitsweise des Schaltkreises 13 der Pig. 3 wird weiterhin auf die Impulsdiagramme
der Fig. 4 Bezug genommen. Das 100-Hz-Signal (Kurve 41) von dem
System-Zeitgenerator 19 wird mittels eines Differenziergliedes und eines negativen Begrenzers 43 differenziert bzw. nach dem
Negativen hin begrenzt zwecks Erzeugung eines Lade-Start-Impulses (SOL), dargestellt in der Kurve 45 der Fig. 3. Dieser SOL-Impuls
setzt das Flip-Flop 47 zwecks Anschaltung des Pulsgatters 49.
Das Pulsgatter 49 schaltet das UND-Gatter 51 an, damit dieses
eine vorbestimmte Zahl von 100 KHz-Impulsen des System-Zeitgensrators
19 durchläßt, und zwar als eine 100 KHz-Folge von 16 Impulsen,
dargestellt durch die Kurve 53. Diese 100 KHz-Impulsfolge
wird mittels eines Verzögerungskreises 55 um 5 Mikrosekunden ( ,usec) verzögert, bevor sie als verzögerte 100 KHz-Folge von
16 Impulsen (Kurve 57) an den Zähleingang (C) des Zählers 59 angelegt wird, damit seine Zählfolge eingeleitet wird. Der Zählstand
des Zählers 59 wird als Ausgangssignal an einen Vergleicher 61 geführt, indem er mit einem Zählstand N = 16 verglichen wird.
Erreicht daher der Zählstand des Zählers 6l den Wert 16, dann erzeugt der Vergleicher einen Lade-Löschimpuls 63, der dazu verwendet
wird, den Zähler 59 auf den Zählstand Null zurückzustellen und das Flip-Flop 47 zu löschen, damit verhindert wird, daß irgendwelche
nachfolgenden Impulse das UND-Gatter 51 passieren und vom Zähler 59 gezählt werden. Der Lade-Löschimpuls 63 wird
6U9884/0999 "'"
mittels eines Verzögerungskreises 65 um 10 Mlkrosekunden verzögert
zwecks Erzeugung eines Lade-Ende-Impulses 67 (EOL)» Die
SOL- und EOL-Impulse werden an eine zentrale Steuereinheit 87
in Fig. 5 angelegt, deren Arbeitsweise im nachfolgenden beschrieben
wird.
Die 100 KHz-Impulsfolge 53 des UND-Gatters 51 wird an den Schaltschritt-Eingang
eines N bzw. -16-kanaligen Multiplexers69 angelegt.
Der Multiplexer 69 schaltet bei jedem der 16 Impulse der 100 KHz-Impulsfolge
um eine Position weiter. Die analogen Sprechparameter S. *" S £ des Sprachprozessors 11 (Fig. 2) werden parallel an den
.-.Multiplexer 69 angelegt. Mit jedem der an dem Schaltschritt-Eingang
angelegten Impulsen der ΐβ Impulse der 100 KHs-Impulsfolge
führt der Multiplexer 69 hinsichtlich der S^ - S ,--Eingangssignale
einen Zeit-Multiplexvorgang durch, so daß sie nacheinander
(ADC)
an einen Analog/Digital-Umsetzer 73/angelegt werden. Der Multiplexer
erzeugt weiterhin Abtastimpulse 71, die an den Analog/ Digital-Umsetzer 73 angelegt werden, damit dieser Umsetzer in
der Lage ist, nacheinander die nacheinander erscheinenden spektralen-Vergleichssignale
S1 - S.g zu digitalisieren. Die l6 nacheinander
erzeugten digitalisierten spektralen Vergleiche bilden einen spektralen Zeitvektor (STV). Jede 10 msec, wird ein
neuer spektraler Zeitvektor erzeugt. Diese 10 msec.-Periode ist
die Zwischenimpuls-Periode der 100 Hz-Impulse des System-Zeit-
609884/0999
Generators 19. Nachdem eip neuer STV mittels des Analog/Digitäl-Umsetzers
erzeugt ist, wird der Multiplexer 69 zwecks Vorbereitung des Startes des nächsten Ladezustandes durch den EOL-Impuls
in seine anfängliche Schaltschritt-Position zurückgestellt.
Jeder der digitalisferten S1-S g Spektral- Schätzwerte ist ein
binäres Wort, das z.B» aus 6 Bits bestehen kann. Es soll an dieser
Stelle klargestellt werden, daß der Begriff "Wort" im vorliegenden Zusammenhang ein binäres Wort bedeutet, während der Begriff
"Schlüsselwort" ein Wort des Wörterbuches bedeutet, das in dem eingangsseitigen Sprachsignal erfaßt werden soll.
Die spektralen Schätzwerte oder analogen Sprechparameter S1 bis S1^ werden nacheinander herausgegeben, weil der Analog/
Digital-Umsetzer 73 annähernd 10 ,usec benötigt, um pro Abtastwert
eine Analog/Digital-Umwandlung durchzuführen. Daher dauert es annähernd l60 ,usec, bis alle 16 Kanäle der seriell dargestellten
Sprechparameter S1 - S1^ digitalisiert sind. Wie bereits
oben erwähnt wurde, enthalten die 16 aufeinanderfolgend erzeugten digitalisierten Spektral-Bestimmungswerte S.-S.g einen spektralen
Zeitvektor (STV). In dem vorliegenden Beispiel besteht daher jeder STV aus einer seriellen Folge von 16 binären Worten,
wobei jedes Wort 6 Bit lang ist. Nachdem jeder der spektralen Bestimmungswerte S1-S^ digitalisiert ist, erzeugt der Analog/
609884/0999
Digital-Umsetzer 73 ein Daten-Verfügbarkeitssignal 75, das an- zeigt,
daß die STV-Daten für die Benutzung bereitstehen.
In Fig. 5 werden die STV-Daten und Daten zur Verfügung stellende
Signale nach Fig. 3 an einen Speicher mit direktem Zugriff 8l
(RAM) und eine RAM-Steuerung 83 in einer RAM-Einheit 85, die später noch erläutert wird, angelegt, während die SOL- und EOL-Impulse
des STV-Generators 13 der Fig. 3 an die Zentralsteuerung 87 angelegt werden. Die Zentralsteuerung 87 erzeugt Lade-
und Laufgatter, die die Dauer der entsprechenden Lade-und Lauf-Arbeitszustände
steuern. Zu diesem Zeitpunkt erscheint es zweckmäßig, das Blockschaltbild der Zentralsteuerung 87 in Fig. 6
und die Impulsediagramme der Fig. 7 zu erläutern, damit die Arbeitsweise
der Zentralsteuerung .besser verständlich ist.
In Fig. 6 setzt der SOL-Impuls 45 (Fig. 3, 4 und 7) ein Ladein
Betrieb
Flip-Flop 89,/zwecks Starten des Lade-Arbeitszustandes durch Erzeugung
eines "!"-Zustandes an seinem Q-Ausgang, der dem Last-Gatter
91 der Fig. 7 entspricht. Ungefähr I60 usec. später
löscht der EOL-Impuls 67 (Fig. 3, 4 und 7) das Lade-Flip-Flop
89, um das Lade-Tor zu beenden, und damit das Ende des Lade-Arbeitszustandes herbeizuführen. Zur selben Zeit, zu der der
EOL-Impuls das Lade-Flip-Flop 89 löscht, setzt er das Lauf-Flipin Gang
Flop 93/i um den Lauf-Arbeitszustand zu starten, indem an seinem
Flop 93/i um den Lauf-Arbeitszustand zu starten, indem an seinem
Q-Ausgang ein "!"-Zustand erzeugt wird, der dem Lauf-Tor 95
609884/0999
entspricht. Nach ungefähr 7 msec, wird ein "Ende des Laufes"-Impuls
(EOR) oder Bit 97 vom Zustand des binär "1" von dem Maskenkreis 99 in Fig. 5 angelegt, um das Lauf-Flip-Flop zu löschen
und das Lauftor 95 zu beenden und damit das Ende des Lauf-Arbeitszustandes
herbeizuführen. Die Dauer der Lade- und Lauf-Arbeits· zustände wird von der Dauer der entsprechenden Lade- und Lauf-Torsignale
91 und 95 bestimmt. Während jedes Ladezustandes wird ©in neuer STV-Wert erzeugt, während alle Korrelationen innerhalb
des Lauf-Zustandes durchgeführt werden. Wie aus der Kurve 95 hervorgeht, liegt zwischen dem Ende des Lauf-Tores und dem nächsten
SOL-Impuls Jl5 eine Zeit von ungefähr 2,84 msec. Diese Zeit
von 2,84 msec, erlaubt eine zusätzliche Verzögerung bis zu 2,84 msec, bevor der EOR-Impuls angelegt wird, um das Lauf-Tor 95
zu beenden, sofern das System einen längeren Lauf-Arbeitszustand erfordert. Das Lauf-Tor 95 und die 1 MHz-Taktimpulse werden an
die Eingänge eines UND-Gatters 96 angelegt. Zusätzlich wird ein
Trainer-Kommandeosignal (von dem Trainer Io5 in Fig. 5) vom
Zustand binär "1" an den invertierenden Eingang des UND-Gatters 96 angelegt. Dieses Trainer-Kommandosignal vom Zustand "1" wird
nur deshalb angelegt, um das UND-Gatter 96 abzuschalten, wenn der Trainer Io5 die Speicherung Von neuen Masken-Daten in der
Maskeneinheit 91 (Fig. 5) wünscht. Die Arbeitsweise des Trainers Io5 und der Maskeneinheit 99 werden später in Verbindung mit
der Fig. 8 erläutert.
609884/0999
Wenn kein Trainer-Kommandosignal vom Zustand "1" an das UND-Gatter
96 angelegt ist, dann ist das UND-Gatter nicht mehr länger
in dem abgeschalteten Zustand. Dadurch ist es der Zentralsteuerung 87 möglich, Signale zu erzeugen, die die Speichereinheit
85 und die Maskeneinheit 99 .derart betätigen, daß sie gleichzeitig einen Lese-Vorgang durchführen. Dieser Lese-Vorgang
tritt nur auf, wenn ein Lauf-Torsignal, jedoch kein Trainer-Kommando signal an das UND-Gatter 96 angelegt ist. Wenn das Lauf-Torsignal
95 während eines Lesevorganges an das UND-Gatter 96
angelegt ist, dann ist das UND-Gatter 96 durch das Lauf-EPorsignal
derart angeschaltet, daß es die 1 MHz-Taktimpulse als Zählircpulse
durchläßt. Dese Zählimpulse werden mittels eines Verzögerungskreises 98 ebenfalls um ungefähr 100 Nano-Sekunden (nsec) zur
Erzeugung von Lese-Impulsen verzögert. Diese Zähl- und Leseimpulse werden sowohl an den Speicher 85 als auch an die Maskeneinheit
99 (Fig. 8 und lo) angelegt, derart, daß sie gleichzeitig eine
Ausgabe; der- entsprechenden Inhalte bewirken zwecks Durchführung
einer später noch zu erläuternden Korrelation. Aus dem vorhergehenden ist ersichtlich, daß die Zentralsteuerung 87 immer dann
keine Zähl- und Leseimpulse erzeugt, wenn das UND-Gatter durch Anlegen des Trainer-Kommandosignals mit dem Zustand "1" an seinen
invertierenden Eingang abgeschaltet ist.
Wie aus der Pig. 5 hervorgaht, werden die Zähl- und Leseimpulse der Zentraisteuerung 87 an eine Masken-Speichersteuerung lol
609884/ÖS99
und an einen Masken-Speicher Io3 in der Maskeneinheit 99 angelegt,
damit die Masken-Speichersteuerung lol in der Lage ist, die Lese-Schreib-Vorgänge
des Masken-Speichers Io3 zu steuern. Dieser Maskenspebher Io3 kann ein Kernspeicher sein, mit Wort-Adress-Stellen,
die bei der Stelle D beginnen und sich nacheinander bis zu dem Ende des letzten gespeicherten Wortes fortsetzen. Verbunden
mit der Maskeneinheit 99 ist ferner der Trainer Io5, der ein logischer Schaltkreis oder ein Computer sein kann. Der Trainer
Io5 trainiert oder steuert die Maskeneinheit 99 derart, daß sie irgendwelche gewünschte Dyaden und/oder Triaden speichert, die
ein oder mehrere gewünschte Schlüsselworte enthalten können. Damit die Wirkungsweise der Maskeneinheit 99 besser verständlich
ist, soll Bezug auf die Fig. 8 genommen werden.
Aus Pig« 8 geht hervor, daß immer dann, wenn der Trainer Io5
wünscht, daß neue Daten in den Maskenspeicher Io3 eingeschrieben werden müssen, er ein Trainer-Kommandosignal vom Zustand "1"
sowohl an den Wahlschalter Io7 in der Masken-Speichersteuerung
lol als auch an den invertierenden Eingang des im vorstehenden erläuterten UND-Gatters 96 (Fig. 6) sendet. Wie oben erwähnt,
schaltet die Umkehrung des Zustandes "1" des Trainer-Kommandosignals das UND-Gatter 96 ab. Zur selben Zeit steuert der "1"-Zustand
des Trainer-Kommandosignals den Wahlschalter Io7 derart,
daß es nut? Trainer-Adressen möglich ist, durch den Schreib-Eingang des Schalters Io7 zu dem Maskenspeicher Io3 zu gelangen.
609884/0999
Jedes Schreib-Kommando von dem Drainer Io5 schaltet den Maskenspeicher
Io3 derartig an, daß Masken-Daten von dem Trainer Io5
zusammen mit den zugeordneten Trainer-Adressen in den Masken-Speicher io3 eingeschrieben werden.
Wenn kein Trainer-Kommandosignal vom Zustand "1" an den Wahlschalter
Io7 angelegt ist (bzw. an das UND-Gatter 9β der Fig. 6),
dann gelangen intern in der Masken-Speichersteuerung lol erzeugte
Adressen durch einen Lese-Eingang des Wahlschalters Io7 hindurch zu dem Maskenspeicher Io3 zu dem Zweck einer Lese-Operation.
Diese Lese-Operation kann nur dann auftreten, wenn kein Trainer-Kommandosignal vom Zustand "1" an den Wahlschalter Io7
(und das UND-Gatter 95 in Fig. 6) angelegt ist. Während eines Lesevorganges werden Lese- und Zählimpulse der Zentralsteuerung
87 (Fig. 6) an den Maskenspeicher Io3 und an den Zähleingang
eines Zählers Io9 angelegt. Zu jedem Zeitpunkt, zu dem ein Impuls
von dem Zähler Io9 gezählt wird, wird eine interne Adresse erzeugt, die über den Leseeingang des Wahlschalters Io7 als
Lese-Adresse zu dem Maskenspeicher Io3 gelangt. Die Leseimpulse, die, wie im Zusammenhang mit der Fig. 6 erläutert wurde, um
IOD nsec. verzögerte Zählimpulse sind, schalten den Maskenspeicher
Io3 derart an, daß er nacheinander während des Lauf-Zustandes
seinen Inhalt ausliest. Ss soll darauf hingewiesen werden, daß dadurch, daß die Verzögerung von 100 nsec. zwischen den entsprechenden
Zähl- und Leseimpulsen vorhanden ist, jede interne
3 09884/0999
Adresse des Zählers Io9 In einem stabilisierten Zustand ist,
bevor der Leseimpuls den Masken-Speicher Io3 anweist, nacheinander
seinen Inhalt auszulesen * Zu jedem Zeitpunkt, zu dem ein Leseimpuls an den Maskenspeicher Io3 angelegt ist, wird ein Wort
von 18 Bits, das an einer Adressenstelle gespeichert ist, die zu diesem "Zeitpunkt intern durch den Zähler Io9 adressiert ist,
aus dem Maskenspeicher Io3 ausgelesen.
Dieses Wort von 18 Bits kann nacheinander folgende Informationen enthalten: 6 Bits mit Informationen r. über die Amplitude,
5 Bits mit Informationen θ über die Schwellwerte,
5 Bits mit Informationen w. über die Bewertung und zwei Signale von je 1 Bit. Das erste Signal von 1 Bit ändert
sich von dem Zustand binär "0" zu einem Zustand binär "1", d.h. dem Signal "Ende der Maske" (EOM) an dem Ende jeder während
des Lauf-Zustandes aus dem Maskenspeicher Io3 ausgelesenen Masken.
Das zweite Signal von 1 Bit ändert sich von dem Zustand binär "0" zu dem Zustand binär "1", d.h. dem Signalende des
Laufes (EOR), nachdem während des Lauf-Zustandes alle Masken aus dem Maskenspeicher Io3 ausgelesen sind. Dieses Signal EOR wird
dazu verwendet, den Zähler Io9 zurückzustellen und, wie im vorstehenden
erwähnt, das Flip-Flop 93 (Fig. 6) zurückzustellen,um
damit den Lauf-Torimpuls und den Lauf-Zustand zu beenden. Der Zähler Io9 wird deshalb zurückgestellt, damit sichergestellt ist,
daß zu Beginn des nächsten Lauf-Zustandes die internen Adressen des Zählers Io9 wieder bei Null beginnen.
609884/0999
Wie es aus den Fig. 5 und 8 hervorgeht, ist der Maskenspeicher
Io3 in der Lage, 8192 Worte von 18 Bits zu speichern. Diese Speicherfähigkeit des Maskenspeichers Io3 ist in der Pig. 9 dargestellt.
Im speziellen zeigt die Fig. 9 verschiedene beispielhafte Adressenstellen des Maskenspeichers Io3. Es soll in Erinnerung
gerufen werden, daß die gespeicherten Masken von verschiedener Länge sein können, und daß sie in der Länge von 1 bis 16
STV-Daten variieren können. Es ist weiterhin sich zu vergegenwärtigen,
daß jede STV-Information als Beispiel auf eine Länge von
l6 Worten festgelegt wurde, wobei jedes Wort 6 Bits umfaßte.
Daher kann für eine in jeder Maske des Maskenspeichers lo.3 gespeicherte
Dyade oder Triade die Maske in der Länge von 16 V/orten bis zu 256 Worten schwanken.
Bei der Erzeugung jeder der in Fig. 9 dargestellten, in dem Speicher
Io3 zu speichernden Masken bestimmt eine geübte Person,
die angemessene Kenntnisse von akustischer Phonetik hat, die Länge jeder Maske, durch Beobachtung der Trainings-Spektrogramme,
so daß diese Person das erfindungsgemäße System trainieren kann, indem sie die Arbeitsweise des Trainers Io5 der Fig. 5 steuert.
Γη einigen Fällen v/erden eine Vielzahl von Masken pro Dyade oder
Triade verwendet, und zwar im Hinblick auf eine freie Variations- und den Zwischensprecher-Effekt. Bei der Erzeugung einer derartigen
Maskenvielfalt, untersucht die geschulte Person die Spek-
609884/0999 -'"
trogramme derart, daß sie vielleicht 10 Masken-Abtastwerte einer Dyade oder Triade findet und sie dann typischerweise gruppiert,
z.B. in Drei-Masken-Untergruppen, um so die Spanne für die freie Variation und den Zwischensprecher-Effekt für diese Dyade oder
Triade vorzugeben.
Der Begriff "freie Veränderung" kann definiert werden als das Äußerungsbild von verschiedenen phonetischen Darstellungen bzw.
Tönen, die dieselbe semantische Information tragen. Dieser Begriff berücksichtigt die Tatsache, daß es an sich immer einen
idealen Weg gibt, um etwas zu sagen. Jede Person hat nun im Sprechen eine Reihe Abweichung von diesem idealen Weg. Diese
freie Veränderung kann verursacht werden durch Dialekt, ProsodLe (eine emotionale Äußerung durch den Sprecher) oder durch Satzbetonungen.
Drei Typen von freien Veränderungen, die auftreten können, sind: Der Austausch eines Tones für einen anderen
("da" oder "tha" für "the"), das Weglassen einer Silbe ("pat" anstelle von "part") und das Einfügen eines Tones in das Schlüsselwort
(indem man " "uh" am Ende von "park" hinzuführt). Der Zwischensprecher-Effekt oder die Zwischensprecher-Veränderung
ist dadurch definiert, daß die Äußerungen desselben Tones durch verschiedene Sprecher In verschiedenen charakteristischen Resonanzen
für dasselbe phonetische Ereignis zum Ausdruck kommen.
609884/0999
Nachdem die oben genannten 10 Masken-Abtastwerte in drei Masken-Untergruppen
aufgeteilt sind5 werden die Komponenten in den Masken jeder der drei Masken-Untergruppen geraittelt«, um auf diese
Weise eine einzelne Maske für die betreffende Dyade oder Triade in dieser Untergruppe festzulegen= Die Vielfalt von drei Masken
für eine Dyade oder Triade ist dann seriell in dem Speicher Io3 gespeichert, und zwar in benachbarten Stellenjr sie? wird nachfolgend
in paralleler Arbeitsweise behandelte
Ss ist in Erinnerung zu rufen, daß es ungeähr hh verschiedene
Töne oder phonetische Ereignisse in der englischen Sprache gibt und daß das Erkennungssystem gemäß der Erfiödung auf Dyaden und/
oder Triaden basiert,, xtfobei eine Dyade zwei phonetische Ereignisse
und eine Triade drei phonetische Ereignisse beinhaltet. Aus diesem Grunde können ungefähr 1936 verschiedene Dyaden und/
oder Triaden vorkommen. Wenn in dem System nach der Erfindung 500 bis 700 Dyaden und/oder Triaden verwendet werden, dann können
über 90# der Schlüsselworte eines Standards-Englisch-Wörterbuches
in genügender Weise erkannt werden.
Bei Speicherung von 1 Dyade oder Triade in jeder Maske des Maskenspeichers
103 kann das System gemäß der Erfindung ein unbegrenztes Vokabular haben, wenn genügend Masken benutzt werden,
und das System ist groß genug ausgelegt, daß ein Entscheidungs-
609884/0999
Ausgang für jedes der gewünschten Schlüsselworte errechnet wird.
Auf diese Weise besitzt die Erfindung die Fähigkeit der Erkennung eines unbegrenzten Vokabulars in kontinuierlicher Sprache, Die
Erfindung kann jedoch auch bei folgenden beispielhaften Anwendungen für ein Erkennen von einem begrenzten Vokabular eingerichtet
sein: Gepäck-Zielsteuerungj Zip-Code-Benutzung; Eingabe
von Fernsteuerungsdaten üder ein Telefon; z.B. für Verkaufs-Order; stimmverstärkte Worterkennung zur Steuerung der Arbeitsweise
von Maschinen in einer Fabrik oder der internen Arbeitsweise eines Flugzeuges, und ausgewähltes Wort-Beobachten oder
Vorsortieren von Sprachinhalten, indem das System so ausgebildet ist, daß es eine begrenzte Anzahl von interessierenden Schlüsselworten
in Nachrichtensendungen erkennt. Bei der Anwendung in der Erkennung eines begrenzten Vokabulars können die Masken in dem
Maskenspeicher 103 zusammen in Reihe gruppiert werden, um so das Schlüsselwort oder die Schlüsselworte, die zu erkennen sind,
zu bestimmen, jedoch ist dies, absolut gesehen, nicht notwendig. Es ist dabei verständlich, daß der Unterschied zwischen der Fähigkeit
des Erkennens eines unbegrenzten und der Fähigkeit der Erkennung eines begrenzten Vokabulars allein in dem Aufwand zur Realisierung
des Systems liegt.
Da, wie im vorstehenden in der Diskussion im Zusammenhang mit der Fig. 8 festgestellt wurde, jedes Wort aus dem Masken-Speicher Io3
609884/0999
in einer Mikrosekunde ausgelesen werden kann - entsprechend den
angelegten 1 MHz-Zähl- und Leseimpulsen - so dauert es 8192,usec»
oder 8,192 msec, um alle Worte aus dem Speicher IO3 auszulesen,
wenn dieser Speicher gefüllt ist. In der Fig. 9 sind jedoch nur ungefähr 7000 Worte von 18 Bits, die in dem Speicher IO3 gespeichert
sind, dargestellt, wobei es dem Speicher IO3 möglich ist,
zusätzliche 1192 Worte von 18 Bits in den verbleibenden 1,192 msec, zu speichern, wenn es die Arbeitsweise des Systems erfordert.
In Fig. 9 sind M-Kasken im gespeicherten Sustand im Speicher 103
dargestellt. Die Wortlänge jeder Maske ist direkt unter der Maskennummer
angezeigt, während die Adress-Stellen des Wortes in jeder Maske durch den zugeordneten Zahlenbereich angezeigt sind.
Beispielsweise ist die Maske 2 ein Wort mit einer Länge von 128 Bits, wobei diese Worte in den Adressenstellen 257 bis 38A untergebracht
sind (entsprechend den Adressenstellen in binärer Schreibweise von: 0000100000001 bis 0000110000000). Das EOM-Signal vom
Zustand 11I" ist enthalten in dem Wort 000000000000000010, das
auf jede der Masken folgt, um das Ende der betreffenden Maske anzuzeigen. Beispielsweise kann das binäre Wort 000000000000000010
EO
dass das/5-Signal vom Zustand "1" enthält, an der Adressenstelle 385 (binäre Adressenstelle 0000110000001) gefunden werden, die das Ende der Maske 2 folgt. Das Signal EOR mit dem Zustand
dass das/5-Signal vom Zustand "1" enthält, an der Adressenstelle 385 (binäre Adressenstelle 0000110000001) gefunden werden, die das Ende der Maske 2 folgt. Das Signal EOR mit dem Zustand
609884/0999
binär "1" ist in dem Wort 000000000000000001 enthalten, das in der Adressenstelle 7000 steht (binäre Adress-Stelle
1101101011000), also eine Adressenstelle, die auf das EOM-Signal
folgt, das auf die letzte Maske (Maske M) folgt, die in dem Speicher 103 gespeichert ist. Es sei in Erinnerung gerufen, daß dieses
EOR-Signal in Fig. 6 dazu benutzt wird, das Lauf-Fllp-Flop
93 zurückzusetzen, um auf diese Weise das Lauf-Torsignal zu beenden,
und es wird in Fig. 8 dazu verwendet, den Zähler Io9 zurückzustellen.
Es sei nun auf die Fig. 5 zurückgegangen; wie bereits vorher erwähnt,
werden die STV-Daten und die Daten, die von den Signalen
des Analog/Digital-Umsetzers 73 (Fig. 3) zur Verfügung gestellt werden, an den Speicher 81 und die Speichersteuerung 83 in der
Speichereinheit 85 angelegt. Zusätzlich wird das EOL-Signal
von dem Verzögerungskreis 65 (Fig. 3), die EOM-Signale von
dem Maskenspeicher 103, das Lade-Gattersignal und die Zählimpulse der Zentralsteuerung 87 angelegt, während die Lese-Impulse
der Zentralsteuerung 87 an den
Speicher 81 angelegt werden. Damit die Arbeitsweise der Speichereinheit
85 besser verständlich ist, sollen nunmehr die Figuren 10, HA und HB näher erläutert werden.
Der Speicher 8l mit direktem Zugriff in Fig. 10 (und Fig. 5) entspricht einem Spektrogramm, bei dem die Frequenzkomponenten
609884/0999
in den Speicher gespeicherten STV-Daten vertikal entlang einer vertikalen
Frequenzachse angeordnet sind, wobei benachbarte Daten der gespeicherten STV-Datenfolge durch eine Zeitspanne von 10
msec, entlang einer orthogonalen Zeitachse voneinander getrennt
sind. Jede 10 msec, wird ein neuer STV-Wert in dem Speicher 81
gespeichert. Auf diese Weise wird ein Muster entwickelt, das das Spektrogramm bildet.*Der Speicher 8l kann ein Festkörper-Speicher
sein mit einer Wortlänge, die zwischen einer und Io24 Stellen
feld-wählbar ist» Der Speicher 8l muß im Betriebszustand eine
Speicher-Wortlänge aufweisen, die mindestens so lang ist, wie die
längste Maske, die in dem Maskenspeicher Io3 gespeichert ist.
Jede Maske hat, wie die Fig. 9 zeigt, eine Wortlänge, die gleich
ist einigen integralen Vielfachen von 16 Worten, da jede Maske in der Länge zwischen 1 und 16 STV-Werten aufnimmt und jeder
STV-Wert in der Länge 16 digitalisierte spektrale Bestimmungswerte
oder Worte aufweist. Da die längste in Fig. 9 gezeigte Maske (Maske 1) 256 Wörter lang ist, oder im Äquivalenten die Länge
von 16 STV-Daten aufweist, soll im folgenden angenommen werden, daß die Wortlänge des Speichers 81 so gewählt wurde, daß
zu irgendeiner gegebenen Zeit der Speicher 8l 256 Worte oder
16 STV-Werte speichert.
609884/0999
Die Adressenstellen für diese ίβ STV-Daten, die in dem Speicher
8l während verschiedener Lade- und Laufzuständen gespeichert worden sind, sind in den Fig. HA und HB dargestellt. Für den
oder Rollover-Adressierung Speicher 81 wird dabei die MODULO-Adressierung/oder Adressierung
durch überspeichern verwendet. Die Adressenstellen für die 256
Worte sind'in dem Bereich 0 bis 255 des Speichers 81 gespeichert. Da 255 die Adressenstelle mit der höchsten Nummer ist, wird die
Adressierung als MODULO 255-Adressierung bezeichnet. Bei der MODULO-255-Adressierung gleicht der Speicher 8l, wenn er adressiert
ist, arbeitsmäßig einem Kreis, so wie es in den Fig. HA und HB dargestellt ist. Wenn, sowohl in dem Lade- als in dem
Lauf-Zustand die Adressenstelle 255 erreicht ist, dann beginnt die nächste Adresse in diesem Arbeitszustand mit Null und steigt
in der gemäß der Fig» HA und HB gezeigten Pfeilrichtung an.
Die Fig. HA zeigt STV-Daten 1 bis 16, wobei der Wert STV 1 in
den Lade-Adress-Stellen ο bis 15, der Viert STV 2 in den Lade-Adress-Stellen
16-31, der Wert STV 3 in den Lade-Adress-Stellen 32-47... und der Wert STVI6 in den Lade-Adress-Stellen 24o-255
gespeichert sind. In Fig. HA ist der Wert STV 1 der älteste STV-Wert, da er zuerst gespeichert wurde, während der Wert STV
16 der neueste-Wert von STV ist, da er zuletzt gespeichert wurde.
Während des sechzehnten Lade-Zustandes werden die digitalisierten spektralen Bestimmungswerte oder Frequenzkomponenten-Worte von
609884/0999
STV l6 nacheinander in den Lade-Adress-Stellen 24o~255 gespeichert.
Der erste digitalisierte spektrale Bestiinmungswert von · STV i6 wurde in die Lade««Adress-Stellen 2*lo zu Beginn des sech- .
zehnten Lade-Zustandes geschrieben, und der letzte oder sechzehnte
digitalisierte spektrale Bestimmungswert von STV 16 vmrde
am Ende des sechzehnten Lade-Zustandes in die Lade-Adress-Stelle
255 geschrieben.
Da der Speicher 81 256 Worte in 256 Adressenstellen speichert,
muß ein synchroner Lade-Zähler 121, der während des Lade-Zustandes
Lade-Adressen an den Speicher anlegt, vergleichsweise 256
Adress-Zählstände oder Lade-Adressen besitzen. Diese 256 Adressen-Zählstände
haben einen Bereich von O (00000000) bis 255 (11111111). Für die nachstehende Erläuterung sei angenommen,
daß der letzte Zählstand oder die Lade-Adresse des synchronen Zähbrs 121 einen Wert von 255 gehabt hat, so wie es in Fig. HA
an dem Ende des sechzehnten Lade-Zustandes dargestellt ist. Dieser Zählstand von 255 wird mit einer festen Zahl W„ in einem Vergleicher
123 verglichen. Der Vergleicher 123 kann aus UND-Gattern
aufgebaut sein. Die Zahl ¥„ ist derartig feld-vorgewählt,
daß sie gleich ist der letzten oder der größten Lade-Adresse, die von dem Lade-Zähler 121 benötigt wird, wobei diese Zahl in dem
vorliegenden Beispiel 255 ist. Wenn der Zählstand des Zählers 121 den Wert von W ,d.h. 255» erreicht, dann erzeugt der.Vergleicher
609884/0999
123 ein Signal vom Zustand binär "1" und legt dieses Signal an
den Rückstelleingang des Zählers 121 an. Der synchrone Zähler 121 arbeitet derart, daß, wenn immer ein Signal vom Zustand "1"
an seinen Rückstelleingang angelegt wird, das nächste eine Information enthaltendes Signal 75 (Pig. 1O das von dem Analog/
Digital-Umsetzer 73 in Fig. 3 an den Zähleingang angelegt ist, den Ladezähler 121 auf den Adressenzählstand 0 (00000000) zurückstellt*
Während des nächsten, also z.B. des siebzehnten Lade-Zustandes, wird das Ladesignal 91 (Fig. 7) von dem Lade-Flip-Flop 89 (Fig.6)
an einen Wahlschalter 125 angelegt, derart, daß die Speichersteue-
RAM
rung/83 in dem Lade-Zustand arbeitet. Während dieses siebzehnten Lade-Zustandes werden die 16 Daten enthaltenden Impulse 75 von dem Analog/Digital-Umsetzer 73 (Fig. 3), die also während der Erzeugung der Werte STV 17 auftreten, an den Zähleingang des Lade-Zählers* 121 angelegt. Da im vorstehenden erläutert wurde, daß an dem Ende des sechzehnten Lade-Zustandes der Zählstand des Zählers 121 den Wert von 255 besessen hat, stellt der erste eine Information tragende Impuls während des nächsten oder siebzehnten Lade-Zustandes den Zähler 121 auf den Zählstand 0 zurück, so wie es in Fig. HB zu Beginn des siebzehnten Lade-Zustandes dargestellt ist. Jeder der verbleibenden fünfzehn Informationen tragenden Impulse veranlaßt den Zähler 121 seine ausgangsseitige
rung/83 in dem Lade-Zustand arbeitet. Während dieses siebzehnten Lade-Zustandes werden die 16 Daten enthaltenden Impulse 75 von dem Analog/Digital-Umsetzer 73 (Fig. 3), die also während der Erzeugung der Werte STV 17 auftreten, an den Zähleingang des Lade-Zählers* 121 angelegt. Da im vorstehenden erläutert wurde, daß an dem Ende des sechzehnten Lade-Zustandes der Zählstand des Zählers 121 den Wert von 255 besessen hat, stellt der erste eine Information tragende Impuls während des nächsten oder siebzehnten Lade-Zustandes den Zähler 121 auf den Zählstand 0 zurück, so wie es in Fig. HB zu Beginn des siebzehnten Lade-Zustandes dargestellt ist. Jeder der verbleibenden fünfzehn Informationen tragenden Impulse veranlaßt den Zähler 121 seine ausgangsseitige
609884/0999
ΐ S 1^ ^
53-- τ '■-.•.-η.π ST-ji
, Sssftl^iraZn^ngSl^S^tQ Sin ^V-J"Ζ5^ Zulu -'BΧΠΘΞ?
O-Li. C ί j
. ?Ξ G1 =.— ■ T
ist zu ersehen, daß am Ende des siebzehnten Lade-Zustandes der STV-WSrt 17 in die Lade-Adress-Stelle 0-15 eingeschrieben worden
ist, die vorher von dem Wert STV-I ..elegt war, der der älteste
gespeicherte STV-Wert an dem Ende des sechzehnten Lade-Zustandes war, wogegen die STV-Werte 2-16 in den Adressenstellen verbleiben,
die sie am Ende des sechzehnten Ladezustandes belegt hatten. Während des achtzehnten Lade-Zustandes (nicht dargestellt) wird der
Viert STV-2 entfernt, während der Wert STV-18 in die Speicher-Adress-Stellen
16-31 eingeschrieben v/ird. Es ist daraus ersichtlich, daß jede 10 msec, ein neuer STV-Wert in dem Speicher 8l
abgespeichert wird, wogegen der älteste STV-Wert aus dem Speicher he-r.ausfällt. Man kann daher sagen, daß zu einem bestimmten Zeitpunkt
der Speicher 0,16 Sekunden oder l60 msec von digitalisierten spektralen Bestimmungswerten oder Zeitabcastwerten einer
durch Parameter dargestellten kontinuierlichen Sprache enthält.
Wie es im Zusammenhang mit der Fig. 6 erläutert wurde, beendet
die Erzeugung des EOL-Impulses (Fig. 3) das Lade-Signal 91 zwecks
Beendigung des Lade-Zustandes und erzeugt das Lauf-Signal 95, das
den Lauf-Zustand startet. Der EOL-Impuls gelangt weiterhin durch
das ODER-Gatter 129 hindurch zu dem Ladeeingang eines Lauf-Zählers
131. Der Lauf-Zähler 131 ist ein voreingestellter Zähler, der mittels des EOL-Impulses in der Lage ist, die Strom-Einstelladresse
einzuladen, d.h. an seinem Ausgang bereitzustellen.
609884/0999
Die Strom-Voreinstell-Adresse kann aufgefaßt werden als die letzte
Lade-Adresse, die von dem Lade-Zähler 121 an den Voreinstell-Adresselngang
des Zählers 131 zu der Zeit angelegt wirds zu der
der EOL-Inpuls erzeugt wird. Diese Voreinstell-Adresse erseheint
an dem Ausgang des Lauf-Zählers 13I0 bevor der Zähler 131 während des folgenden Lauf-Zustandes anfängte zu zählen.
Herrn bei der Beendigung des Ladezustandes das Lade-Signal 91 mittels
dss EOL-Impulses beendet ist8 dann beginnt die Speicher»
Steuerung S3, in dem Lauf-Zustand zu arbeiten & Wenn durch den
Trainer Ic5 kein Trainer-Komraandosignal vom Zustand "1" erzeugt
wirdj so "iie es früher in Verbindung mit der Pig. 6 erläutert
vjurdes. darm ?:5-r-len die Lsse- bzw0 die Zahl-Impulse der Zentralsteuerung
87 (Pigo 6) an den Speicher 81 bzw» an den Zähleingang
des Lauf-Zählers 131 angelegt.
Der erste 1 MHz-Zählimpuls, der während des Lauf-Zustandes erscheint,
verändert den ausgangsseitigen, die Lauf-Adresse darstellenden Zählstand des Lauf-Zählers 31 um einen Betrag von
Eins. Dadurch ist die erste Lauf-Adresse, die am Ausgang des Zählers 131 zu Beginn des Lauf-Zustandes erscheint, um Eins
größer als die Strom-Voreinstell-Adresse (oder die letzte Lade-Adresse in dem ersten Ladezustand). Beispielsweise ist., wie in
Fig. HA dargestellt, der letzte Lade-Adressen-Zählstand an dem
.609884/0999
In ds i·: sechzehnten Lade-Zustand.es gleich 255. Während des sechiiehnt-■
Lauf· Zustandes startet die Lauf-Adresse des Zählers 131
mit s.i.se!n LaufrAdressen-Zählstandj der um Eins größer ist als
die \'i---zte Lade-Adresse von 255, nämlich Null. Jeder der nachfolgende.
1 ■'iH'c-Zählimpulse j, die innerhalb der Zeitperiode auftreten,
Ln der- eine Maske aus dem Speicher ausgelesen wird, veranlaßt de η Zähler 131, seinen ausgai.gsssitigen Lauf-Adressenzählstand.
um einen Betrag von Eins zu erhöhen.
Jeder Lauf-Adressenzählstand des Lauf-Zählers 131 wird in einem
Vergleicher 133 mit der Zahl W verglichen, die in dem vorliegenden
Beispiel gleich 255 ist. Erreicht der Lauf-Adressenzählstand vor dem Ende der Maske nicht den Zählstand 255, dann geht ein
EOM-Impuls oder ein Signal, das mit einer derartigen Maske verbunden
ist j durch das ODER-Gatter 129 durch, damit der Zähler
131 sein Ausgangssignal, nänlich die Strom-Voreinstell-Adresse
einlädt. Auf diese Weise starten die Lauf-Adressen, die nacheinander
erscheinen, wenn die folgende Maske ausgelesen wird, mit einem Adressen-Zählstand, der um Eins größer 1st als die Strom-Voreinstell-Adresse,
wobei sie bis zu dem Ende der folgenden Maske zunehmen» Wenn andererseits der Lauf-Adressenzählstand
des Zählers .131 vor dem Ende einer Maske den Wert 255 erreicht, dann erzeugt der Vergleicher 133 ein Signal vom Zustand binär
!tl" -na legt dieses Signal an dem Rückstelleingang des Lauf-
609884/0999
Zählers 131 an. Dieses Signal vom Zustand "1" stellt den Zähler 131 auf den Adressen-Zählstand Null mittels des nächsten auftretenden
1 MHz-Zählimpulses zurück. Dadurch kann der Lauf-Zähler
131 von seiner Strom-Voreinstell-Adresse bis zu einem Zählstand
von 255 aufwärts zählen und dann von dem Zählstand Null aufwärts bis zu dem Ende der Maske, wo zu diesem Zeitpunkt ein
EOM- Impuls erzeugt wird, den Zählvorgang fortsetzen.
Wie es oben gezeigt wurde, gelangt an dem Ende jeder aus dem Maskenspeicher
Io3 (Fig. 8) ausgelesenen Maske ein EOM-Impuls durch
das ODER-Gatter 129 zu dem Lade-Eingang des Laufzählers 131. Jeder EOM-Impuls arbeitet derart, .so ivie es auch der EOL-Irapuls
an dem Ende des vorhergehenden Ladezustandes tut, daß der Zähler 131 die voreingestellte Adresse'an seinen Ausgang abgibt, bevor
mit dem Auslesen der nächsten Maske begonnen wird.
Der erste 1 MHz-Zählimpuls, der während der Zeit erscheint, in der die nächste Maske desselben Lauf-Zustandes ausgelesen
wird, beeinflußt den Lauf-Adressenzählstand dahingehend, daß er um Eins größer ist als die Strom-Voreinstelladresse. Während
irgendeines gegebenen Lauf-Zustandes ist die voreingestellte Adresse für jede ausgelesene Maske dieselbe. Während des folgenden
Lauf-Zustandes ist die Voreinstell-Adresse für diesen folgenden Laufzustand von derjenigen des vorhergehenden Lauf-Zu-
609884/0999
Standes um einen Zählstand von 16 verschieden. Beispielsweise ist, so wie es in den Fig- 11A und liB gezeigt ist, die Voreinstelladresse
(oder die letzte Lade-Adresse) an dem Ende des sechzehnten Ladezustandes und damit während des sechzehnten
Lauf-Zustandes, gleich dem Wert von 255, während die Voreinstell-Adresse
unmittelbar bevor und während des siebzehnten Lauf-Zustandes gleich 15 ist. In gleicher V/eise besitzen die Voreinstell-Adressen
für den achtzehnten, neunzehnten und zwanzigsten Lauf-Zustand (nicht gezeigt) den VJert von 31, ^7 bzw, 63.
Aus der vorstehenden Beschreibung der Arbeitsweise des Lauf-Zählers
131 ist entnehnibar, daß während eines gegebenen Laufzustandes
der erste EOL-Impuls die Strom-Voreinstelladresse für die ersten
während dieses gegebenen Laufzustandes auszulesenden Maske in den Zähler 131 einlädt, und daß der EOM-Impuls entsprechend die
Strom-Voreinstelladresse für die nachfolgende während des gegebenen Lauf-Zustandes aus dem Speicher Io3 auszulesenden Maske in
den Zähler 131 einlädt. Auf diese Weise wird zu Beginn irgendeines gegebenen Laufzustandes und zu Beginn jeder während des
Lauf-Zustandes ausgelesenen Maske die geeignete Voreinstell-Adresse in den Lauf-Zähler 131 eingeladen. Dadurch ist sichergestellt,
daß der Speicher 81 geeignet adressiert ist, wenn eine neue Maske während irgendeines gegebenen Laufzustandes aus dem
Masken-Speicher Io3 ausgelesen wird. Auf diese Weise kann ein
609884/0999
geeignetes Zeitverhalten in der Korrelation jeder der in dem Speicher Io3 gespeicherten Masken mit den im Speicher 81 gespeicherten
STV-Werten erzielt werden.
Der Grund dafür, daß während des 'Laufzustandes die Lauf-Adressen
bei einem Zählstand beginnen, der um Eins größer ist als die letzte Lade-Adresse in dem ersten Lade-Zustand, liegt darin, daß
die Folge der STV-WErte, die. mit jeder gespeicherten Maske zu korrelieren sind, bei dem ältesten STV-Wert beginnt und sich
bis zum neuesten STV-WErt fortsetzt, Es wurde weiter oben gezeigt in Verbindung mit Fig. HA, daß der Viert STV-16 der
neueste STV-Wert ist, der in dem Speicher 81 nach dem sechzehnten Lade-Zustand gespeichert wird, und daß der Wert STV-16
im Speicher an den Lade-Adresspositionen 2^o bis 255 abgespeichert
ist. Dadurch beginnen während des sechzehnten Lauf-Zustandes die Lauf-Adressen für jede Maske bei Null und steigen
nacheinander bis zu dem Ende dieser Maske an, wobei danach die Lauf-Adressen für die folgende Maske bei Null beginnen und
nacheinander bis zu dem Ende der folgenden Maske ansteigen usw. In gleicher Weise, wie es bei Fig. HB gezeigt ist, starten
während des sechzehnten Lauf-Zustandes die Lauf-Adressen für jede Maske bei 16, was um Eins größer ist als die letzte Lade-Adresse
von 15, die am Ende des siebzehnten Lade-Zustandes auftritt
und bis zum Ende der Maske anwächst, usw.
609884/0999
Während eines Lauf-Zustandes werden die Lauf-Adressen des Laufzählers
131 über einen Lauf-Eingang des Wahlschalters 125 an
den Speicher 81 angelegt, da während des Laufzustandes kein Lade-Signal an dem Schalter 125 anliegt.
Es soll nochmals in Erinnerung gerufen werden, daß die Lese-Impulse,
die an dem Speicher 81 anliegen, um 100 nsec. verzögerte Zähl-Impulse sind. Dadurch sind die Laufadressen, die während des
Lauf-Zustandes erscheinen, in einem stabilen Zustand, bevor die Lesesignale oder Impulskommandos den Speicher 8l veranlassen,
nacheinander Worte auszulesen,und zwar eine solche Anzahl, die
gleich der Zahl von Worten ist, die eine Maske enthält, die zu dieser Zeit aus dem Maskenspeicher Io3 ausgelesen wird.
Jedesmal, wenn während des Lauf-Zustandes einer Lauf-Adresse und ein Lese-Impuls an dem Speicher 81 anliegen, wird ein Wort
von einer Länge von 6 Bits aus dem Speicher 8l ausgelesen. Die 6-Bit-Wörter, die während des Lauf-Zustandes aus dem Speicher
81 ausgelesen werden, werden als das x.-Signal bezeichnet.
Zurückblickend auf die Fig. 5 soll weiterhin in Erinnerung gerufen
v/erden, daß der Speicher 81 während des Lade-Zustand-Teiles
jede 10 msec, mit Daten aufgefüllt wird, indem der neueste STV-WErt gespeichert wird, während der älteste STV-Wert heraus-
609884/0999
- 1*0 -
fällt. Weiterhin werden während des Lauf-Zustand-Telles jede
10 msec, alle Wortkomponenten in jeder Maske des Maskenspeichers
Io3 (Fig. 8 und 5) mit dem entsprechenden Wortkomponenten, die
im Speicher 8l gespeichert sind, korreliert, indem eine Folge von Korrelationsfunktionen errechnet wird auf einer Komponente
durch Komponentenbasis und indem alle diese Korrelationsfunktio- nen aufsummiert werden, urn so für jede Maske ein Korrelations-Datensignal
zu erzeugen. Zur Durchführung dieser Korrelation werden, wie es in der Fig. 5 angezeigt ist, das x.-Signal des
Speichers 8l zusammen mit den r., Θ., w. EOM- und EOR-Signale
des Maskenspeichers Io3 an die arithmetische-Informationsquellen-Einheit
151 (pipeline) angelegt, die nunmehr näher erläutert werden soll.
Diese arithmetische Informationsquellen-Einheit 151 führt eine Reihe von mathematischen Operationen bei der Korrelierung des
x.-Signales mit den Ausgangssignalen der Maskenspeicher-Einheit
Io3 durch. Die Informationsquellen-Einheit 151 ist für vieraufeinanderfolgende
arithmetische Funktionen ausgelegt, die jeweils von der benachbarten arithmetischen Funktion durch Halte-Register getrennt
gehalten werden. Im einzelnen besteht die arithmetische Informationsquellen-Einheit 151 aus einem Vergleichs- oder Ähnlichkeits-Funktionskreis
153, aus Halteregistern 155> 159 und l63» aus Schwellwerk und Wertungsfunktions-Änderern 157 und 161,
609884/0999
- kl -
wie aus einem Summenakkumulator 165. Die Halteregister 155, 159
und l63 werden zweckmäßig aus üblichen Kreisen aufgebaut, wie sie aus dem Stand der Technik bekannt sind. Bei der Realisierung des
Vergleichsfunktionskreises 153 und der Schellwert- und Wertungsfunktlonsänderer
157 und I6I sind jedoch verschiedene Wege möglich,
und zwar abhängig von dem Typ der Korrelation, der in der arithmetischen Informationsquellen-Einheit 151 benutzt wird.
Die verschiedenen Realisierungsmöglichkeiten der Schaltkreise 153, 157 und 161, ebenso wie die Realisierung des Suminenakkunrulators
165 wird später noch erläutert. Derzeit soll nur eine generelle
Diskussion der Arbeitsweise der Schaltkreise der arithmetischen Informationsquellen-Einheit 151 gegeben werden.
Bei jedem 1 MHz-Lese-Impuls während des Lauf-Zustandes wird aus
dem Speicher 8l ein 6-Bit-Wort x. und ein 18-Bit-Wort (bestehend
aus dem 6-Bit-Wort r. , dem 5~Bit-Wort Θ. , dem 5-Bit-V/ort w.
und dem EOM- und EOR-Signal, die jeweils aus einem Bit bestehen)
aus dem Maskenspeicher Io3 ausgelesen. Die x,- und r.-Worte werden
von der Vergleichs funktion 153 dazu benutzt, um ein c.-Wort
zu erzeugen. Dieses e.-Wort kann in der Länge bis zu 12 Bits schwanken, abhängig von dem Typ der Korrelations-Operation,
die von der arithmetischen Informationsquellen-Einheit 151 durchgeführt wird. Die c., Θ. und w.-Worte sowie die EOM- und EOR-Bits
werden während jeder 1 MHz-Taktimpulsperiode in das Halte-Register
155 eingetaktet und dort zeitlich gespeichert.
-/-6U9884/0999
Die c. und θ -Worte des Halteregisters 155 werden selektiv von
dem Schwellwert-Funktionsänderer 157 dazu benutzt, um ein t.-Wort
zu erzeugen, das bis zu 12 Bits in der Breite schwanken kanrs
abhängig von dem Typ der Korrelations-Operation, die von der Informationsquellen-Einheit 151 durchgeführt wird. Das t.-Wort
des Punktionsänderers 157 und das w.-Wort sowie die EOM- und
EOR-Bits des Halteregisters 155 werden während jeder 1 MHz-Taktimpulsperiode
in das Halteregister 159 eingetaktet und zeitlich in Ihm gespeichert.
Die t.- und w.-Worte des Halte-Registers 159 itferden selektiv von
dem Wertungsfunktions-Änderer 161 dazu benutzt, ein m.-Wort zu erzeugen, das bis zu 12 Bits in der Breite schwanken kann, je
nach dem, welcher Typ von Korrelations-Operation von der Informationsquellen-Einheit
151 durchgeführt wird. Das m.-Wort des Funktions-Änderers 161 und die EOM- und EOR-Bits des Halte-Registers
159 v/erden während jeder 1 MHz-Taktimpulsfolge in das Halte-Register I63 eingetaktet und dor*t zeitlich gespeichert.
Bei jedem 1 MHz-Taktimpulszeltpunkt während des Lauf-Torsignals v/erden die Daten in einem neuen m.-Wort an den Summenakkumulator
165 angelegt, und zu dem addiert, was vorher bereits akkumuliert worden ist. Jede neue Datensumme ist ein 18-Bit-Korrelations-Datenwort
d, die als Ausgangssignal der arithmetischen
609884/0999
Informationsquellen-Einheit 151 erzeugt worden ist. Ära Ende
jeder der aus dem Maskenspeicher Io3 ausgelesenen Masken wird ein EOM-Signal vom Zustand "1" von dem Halteregister 163 über
einen 100 nsec.-Verzögerungskreis 167 an den Summenakkumulator 165 angelegt, um den Akkumulator 165 für den Start der nächsten
Maske zu löschen*
Individuelle Korrelations-Operationen zwischen den Bezugs-Maskenschablonen
(ausgelesen aus dem Speicher Io3) und der digitalisierten in Parameter aufgelösten kontinuierlichen Sprache
(ausgelesen aus dem Speicher 8l) werden unter Benutzung einer Unterscheidungsfunktion (discriminant function)errechnet. Die
arithmetische Informationsquellen-Einheit 151 kann so ausgelegt werden, daß sie irgendeine von vielen verschiedenen Typen von
UniBrscheidungsfunktionen oder Korrelations-Operationen durchführt.
Verschiedene UnterscheidungsEudlrtionen und ihre zugeordneten mathematischen
Operationen sind in Fig» 12 für einen jeden von 5 beispielshaften Typen von arithmetischen Informationsquellen-Einheiten
151 mathematisch dargestellt. Diese 5 Typen von Unterscheidungsfunktionen
sind:
609884/0999
Typ Unterscheidunffsfunktion (Discriminant Function)
Nr. 1 Schwellwert«Entfernungsfunktion
(Threshold Distance Function) Nr. 2 Ungewichteter Absolutwert der Entfernungsfunktion
(Unweighted Absolute Value Distance Function) Nr. 3 Gewichteter Absolutwert der Entfernungsfunktion
(Weighted Absolute Value Distance Function) Nr. k Euklidische quadratische Abstands-Funktion
(Euclidean Distance Squared Function) Nr. 5 Skalar-Produkt einer Funktion mit 2 Vektoren
(Dot Product of Two Vectors Function)
Zum Zwecke der folgenden Diskussion in Bezug auf die Fig. 5 und 12 soll sich r. auf die Komponenten einer gegebenen Maske ausge-.
drückt als Vektoren und x. auf die entsprechenden, dem Vergleich unterworfenen Komponenten der digitalisierten in Parametern aufgelösten
Sprachsignale beziehen.
Das Maß zum Messen des Grades der Übereinstimmung zwischen zwei Vektoren r. und x., die einen Gewichtsvektor w. und einen Schwellwertvektor
0. besitzen, kann im allgemeinen ausgedrückt werden als yL .,
d -J
d -J
609884/0999
wobei P1 = FCr1, X1 Q1),
η = die Zahl der Komponenten oder Wörter in der gegebenen Maske
und i = 1, 2 ..., η ist.
und i = 1, 2 ..., η ist.
Die Vektoren lassen sich schreiben:
ri = ri» r2» '·*» rn
ri = ri» r2» '·*» rn
Xj. = X., *2* ♦·'» X n
9I = Ql>
g2> ·"» θη
Zusätzlich soll angenommen werden, daß die Komponenten voneinander
unabhängig sind.
Die Unterscheidungsfunktion für die Lösung von d in der obigen allgemeinen Gleichung oder in Fig. 12 kann Schwellwerte Θ. aufweisen
oder auch nicht, und das Gewicht w., das jeder Dimension
zugeordnet ist, kann einheitlich sein. Beispielswelse kann, wie in Fig. 12 zu ersehen ist, der ungevrichtete Absolutwert der .Entfernungsfunktion
vom Typ 2 nur Vektoren x^ und r. aufweisen,
wobei
Pi
und w. = 1.
GU9884/Ü999
In gleicher Weise ist die euklidische quadratische Abstandsfunktion
vom Typ 4 erfüllt unter Verwendung von
F. = (x. - r. ) , wobei w. = 1 ist,
und das Skalar-Produkt der beiden Vektorfunktionen vom Typ 5 ist erfüllt unter Verwendung von
. = xArAt wobei w. = 1 ist.
Andererseits sieht der gewichtete Absolutwert der Distanzxunkt.ion
vom Typ 3 Vektoren x., r. und w. vor, wenn auch
P1 = Jx1 - r
Die Schwellwerts-Entfernungsfunkiton vom Typ 1 sieht alle Vektoren
x. , r. Θ. und v/. vor, wobei
P1 = P (
- r.
Der Minimalwert von d in der Gleichung d =
oder am Ausgang des SummenτAkkumulators I65 entspricht der nahekommendsten
Übereinstimmung in der Korrelation von x. und r..
609884/0999
Wie es in Fig. 12 gezeigt ist, kann für die meisten Vergleichsfunktionen c. die Beziehung zwischen x. und r. ausgedrückt werl
ι χ %
den in Termaic. = x. - r. , wie in Fig. 12 für die Funktionentypen
1 bis k dargestellt ist. Indem man diese verschiedenen Ausdrücke anstelle von x. und r. einführt, wird die Unabhängigkeitsfunktion
wesentlich verändert. Die im vorhergehenden postulierte Annahme der Unabhängigkeit zwischen zwei einzelnen
Komponenten von x. und r. ist nicht mahr länger notwendig. Die
neue Annahme ist, daß der Betrag von x. - r. (mit i = 1, 2 ...
n) unabhängig ist. Die frühere Annahme ist in der Erkennung von Mustern weit verbreitet, wenngleich sie offensichtlich keine
Gültigkeit hat. Mit der neuen Annahme existiert jedoch ein größerer Grad von Gültigkeit. Angenommen ist nur, daß das Zwischenmerkmal-Rauschen
(interfeature noise) unabhängig ist.
Die Vergleichs-Funktionen 153 für die Typen 1 bis H haben jeweils
die Eigenschaft, daß die Differenzen Jx. - r. klein sein sollen
im Hinblick auf eine gute Übereinstimmung, und daß nur einige große Differentiale eine schlechte Metrik verursachen.
Eine Veränderung in dem Schwellwertsfunktions-Änderer 157 zu der
Vergleichs funktion vom Typ 1 "begrenzt das Ausmaß, bis zu dem eine
einzelne Komponente das übereinstimmungsmaß abwerten kann. Solch
eine Grenze stellt üblicherweise einen Schwellwert dar, der entsprechend in der Schwellwert-Entfernungs funktion vom Typ 1 dargestellt ist. -/-
G09884/0999
Um nunmehr im einzelnen die fünf obengenannten beispielhaften
Typen von arithmetischen Informationsquellen-Einheiten 151 zu
besehreiben, soll erneut Bezug genommen werden auf die Fig. 12 als auch auf die beiden Typen von Vergleichsfunktionen 153
dargestellt in den Fig. 13A und 13B, auf die drei Typen von
Schwellwertfunktions-Snderer 157, dargestellt in den Fig. 14A,
l4B und lACj auf zwei- Typen von Gewichtsfunktions-Snderern
161, dargestellt in den Fig. 15A und 15B sowie auf den Summen-Akkumulator
l65, dargestellt in der Fig. l6.
Beim Typ Nr. 1 kann die "Schwellwert~Entfernungsfunktion"-Cpera~
tion definiert werden als die Summe i-gewichteten (w.) absoluten
Werten der Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei die Differenzen kleiner sind als der
vorgewählte Wert der Schwelle der Größe O^ und wobei i = 1, 2 ...
η ist. Diese erste Funktion kann ausgedrückt werden durch: η
2_, -ι / -1--1
I = I
- r
e.
wobei i = 1, 2 ... η und η = der Zahl von Worten in einer gegebenen
Maske ist. Es ist ersichtlich, daß in dieser Funktion vom Typ 1 sowohl die Schwel1werte θ. als auch die Gewichte w verwendet
werden.
609884/0999
Bei der Erläuterung der Arbeitsweise der Schwellwertentfernungs-Punktion
der arithmetischen Informationsquellen-Einheit vom Typ
Nr. 1 soll nunmehr auf den spezifischen Vergleichsfunktionskreis 153A in der Pig. 13A, auf den spezifischen Schwellwert-Funktions-Änderer
157A der Fig. 1^A, auf den spezifischen Gewichtsfunktions-Änderer
lölA in Fig. 15A als auch auf den Summenakkumulator
165 der Fig. :l6 Bezug genommen werden.
Der Vergleichsfunktionskreis 153A der Fig. 13A erzeugt Werte c^ ,
d.h. die absoluten Werte der Differenz zwischen entsprechenden Komponenten von den zwei Zahlen oder Größen x. und r.. Im einzelnen
wird das 6-Bit-Slgnal x. direkt an einen Kombinations~
kreis 2ol angelegt, während von dem 6~Bit-Signal r. zunächst
mittels logischer Inverter oder NAND-Gatter 2o3 bis 2o8 das
Komplement gebildet wird, bevor es an den Kombinationskreis 2ol angefegt wird. Damit der Kombinierer 2ol in der Lage ist, als
Ausgangssignal das arithmetische Zweier-Komplement zu erzeugen, wird ferner eine binäre "1" an den Kombinierer 2ol zwecks Addition
zu dem Komplementärsignal von r.« gelegt. Die Signale χ. , rT und "1" werden in dem Kombinierer 2ol summiert, der ein Ausgangssignal
von 6 Bits erzeugt, die entsprechend an die zugeordneten ersten Eingänge von Exklusiv-ODER-Gatter 211-216 angelegt
werden. Ein Übertrags-Ausgangsbit von dem Kombinierer 2ol wird durch ein NAND-Gatter 219 logisch invertiert, bevor es an
609884/0999
die zweiten Eingänge der Exklusiv-ODER-Gatter 211-216 angelegt wird. Ein Übertrags-Ausgangssignal vom Zustand "1" von dem Kombinierer
2ol wird durch das NAND-Gatter 219 invertiert, um die Exklusiv-ODER-Gatter 211-216 zu veranlassen, als Wiederholer
der zugeordneten Bits, die an ihren ersten Eingängen anliegen, zu arbeiten. Umgekehrt wird ein Übertrags-Ausgangssignal des
Kombinierers 2öl vom Zustand "0" durch das NAND-Gatter 219 invertiert,
damit es die Exklusiv-ODER-Gatter 211-216 veranlaßt,
als Inverter für die zugeordneten Bits, die an ihren ersten Eingängen anliegen, zu arbeiten.
Das 6-Bit-Ausgangssignal der Exklusiv-ODER-Gatter 211-216 wird
in einem zweiten Kombiniererkreis 221 mit einer zweiten 6-Bit-Zahl
summiert, die aus 5 Bits mit dem Wert "0" und dem 1-Bit-Ausgangssignal
des NAND-Gatter 219 besteht. Daher ist diese zweite 6-Bit-Zahl entweder 000000 (Null) oder 000001 (Eins),
je nach dem, ob das Bit des übertrag-Ausganges den Wert binär
"1" oder "0" besitzt. Ein Übertrag-Ein-Bit vom Zustand "0"
(d.h. kein Übertrag-Ein) wird durch den Kombinierer 221 dahingehend
verwendet, daß die beiden Eingangssignale von jeweils 6-Bit aufaddiert werden. Das Ausgangssignal des Kombinierers
ist ein 6-Bit-Wort c., das gleich dem absoluten Wert der Differenz
zwischen jeder der entsprechenden Komponenten von x. und F., ist»
609884/0999
Zur Erläuterung der arithmetischen Zweior-Komplement-Arbeitsweise
der Vergleichsfuntion 153A der Fig. 13A soll zuerst angenommen
werden, daß x± = 5 (oder 000101) und r± = 3 (oder 000011) für
einen ersten Zeitpunkt sei. In diesem Fall erzeugt die Addition von 00000 (oder 1) zu 111100 (das Komplement von r^, oder rT)
den Wert von 111101 (rT + Dj die in dem Kombinierer 2ol gebildete Summe von 000101 (X1) und 111101 (F^ + 1) ist 000010 (oder 2)
mit einem Übertragsausgang von Eins; die Inversion des Übertrags-Ausganges
1 durch das NAND-Gatter 219 veranlaßt die Exklusiv-ODER-Gatter 211-216, an ihren Ausgängen ihre Eingänge vom Wert
000010 zu wiederholen und bewirkt, daß der Wert 000000 in dem Kombinierer 221 zu dem Ausgangssignal 000010 der Gatter 211-216
addiert wird, zwecks Erzeugung eines 6-Bit c.-Ausgangssignaln,
das zu dieser Zeit den Wert von 000010 (oder 2) hat.
Es sei nun angenommen, daß x. = 3 (oder 000011) und r = 5 !
(000101) ist. In diesem zweiten Fall erzeugt die Addition von 000001 (oder 1) zu 111010 (r^) den Wert von 111011 (F^ +1);
in dem Kombinierer 2ol ist die Summe von 000011 (x.) und 111011 (rT + 1) = 111110 mit einem Übertragsausgang von Null} die Invertierung
des Null-Übertragsausganges durch das NAND-Gatter veranlaßt die Exklusiv-ODER-Gatter 211-216, ihre Eingangssignale
vom Wert 111110 zu invertieren, um das Signal 000001 zu erzeugen,
und es wird weiterhin veranlaßt, daß der Wert vonOOOOOl in dem Kombinierer 221 zu dein Signal 000001 addiert wird, um ein 6~Bit-Ausgangssignal
für c. mit dem Wert 000010 (oder 2) zu erzeugen.
609884/0999 ~'~
Der Vergleichsfunktionskreis 157A der Fig. 13A hat die Eigenschaft,
daß er verlangt5 daß der Wert von c„ 6 oder die Differenz
Ix1 - r^ I klein sein muß,, damit eine gute Übereinstimmung zwischen
Xj und r, zu erzielen ist,, und daß bereits einige große
Differenzen eins schlechte Übereinstimmung verursachen können.
Das Ausgangssignal c - von dem Vergleichsfunktionskreis 153A
der Flg. 13A v;ird in der Amplitude mit einem Schwellwertsignal Θ. in dem Schwellwertfunktions-Ä'nderer 157A9 der in Pig. I1IA
dargestellt ist, verglichen. Der Schwellwertfunktions-Änderer
157A enthält einen Vergleicher 225, der ein 1-Bit-t.-Signal
vom Zustand binär "1" (t4 = 1) erzeugt, immer dann, wenn die
Amplitude von c. größer ist als der Schwellwert Θ.. Immer dann,
wenn c. gleich oder kleiner als -der Schwellwert G. ist, wird ein
t^Sfenal von Zustand binär "0" (t± = 0) erzeugt.
Wie es in dem spezifischen Gewiehtsfunktions-Ä'nderer 16IA der
Fig. 15A dargestellt ist, wird das t.-Ausgangssignal des Schwellwert
funktions-Änderers 157A der Fig. 14A in einem Multiplizierer
229 mit der 5-Bit-Gewichtsinformation w. multipliziert, wodurch
ein 5-Bit-Ausgangswort m. gebildet wird. Dieses m.-Ausgangswort
von dem Multiplizierer 229 wird an den Summen-Akkumulator 165 der Fig. l6 angelegt.
609884/0999
In Fig. l6 löst das Lauf-Torsignal von B1Ig. 6 ein UND-Gatter
aus, derart, daß es während des Lauf-Zustandes über einen 100 nsec.-Verzögerungskreis 235 1 MHz-Taktimpulse an den Takteingang
eines Schieberegisters 237 durchlaßt. Es sei daran erinnert ( siehe Fig. 5 ), daß zu jeder 1 MHz-Taktimpulszeit ein neues
m.-Wort in dein Halteregister 163 gespeichert und an den Summen-Akkumulator
I65 angelegt wird. Jedes m.-Wort des Halteregisters I63 wird in einem Kombinationskreis 239 zu dem, was bereits vorher
akkumuliert worden ist, hinzuaddiert, und ist nunmehr an dem Ausgang des Schieberegisters 237, um eine neue Summe zu erzeugen.
Nachdem jede Summe sich stabilisiert hat, taktet 100 nsee, verzögerter 1 MHz-Taktimpuls von dem Verzögerungskreis 235 diese
neue Summe In das Schieberegister 237· Das Register 237 enthält an seinem Ausgang eine laufende Gesamtsumme der vorher erzeugten
m.-Worte für eine gegebene Maske, die aus dem Maskenspeicher Io3 ausgelesen ist, (Fig. 5). Diese laufende Gesamtsumme
von m.-Worten an dem Ausgang des Schieberegisters ist d, wobei
und 1=1, 2 ... n, und η = die Anzahl der Worte in einer gegebenen
Maske ist. Daraus ist ersichtlich, daß zu jedem Zeitpunkt ein neues in^-Signal, das an den Eingang des Summen-Akkumulators
609884/0999
165 angelegt ist, in dem Kombinierer 235 zu demjenigen hinzuaddiert
wird, was vorher in dem Register 237 für die zugeordnete Kacke akkumuliert worden ist, wobei es als ein neuer d-Wert
an dem Ausgang des Summen-Akkumulators 165 erscheint.
Andern Ende jeder Maske gelangt ein EOM-Bit von dem Halte-Register
163 durch einen 500 nsec.-Verzögerungskreis 2^11 zu dem
Rückstelleingang des Schieberegisters 237· Dieses verzögerte EOM-Bit stellt alle Q-Ausgänge (nicht gezeigt) der Register
auf den binären Zustand "0", so daß das Register 237 beim Start der nächsten Maske gelöscht ist.
In Bezug auf die Maske 2 soll numehr die akkumulierende Arbeitsweise
des Summen-Akkumulators 165 erläutert werden. So wie es
in Fig. 9 dargestellt ist, ist die Maske 2 acht STV-Werte lang
und enthält 128 V/orte in diesen 8-STV-Werten. Daher werden, wenn die Maske 2 nacheinander aus dem Maskenspeicher io3 ausgelesen
wird, insgesamt 128 m.-Worte erzeugt. Daher kann das Schieberegister
237 die Summe dieser 128 m.-..Worte speichern, bevor
ein verzögertes EOM-Signal von dem Verzögerungskreis 2*il das
Schieberegister für das nachfolgende m.-Wort der Maske 3 löscht. Wenn in dem obengenannten Beispiel die Summe von 90 m.-Worten
in dem Register 237 gespeichert ist, dann wird das 91» m.-Wort zu dieser Summe hinzugezählt, und, nachdem das Register 237 erneut
getaktet wurde, speichert dieses Register diese Summe von *
—/— 609884/0999
91 m.-Worten. Es ist daher ersichtlich, daß ein neues d-Ausgangs·
signal, d.h. eine laufende Summe von m.-Worten jede 10 msec, als Antwort auf das Anlegen von jeweils eines neuen m.-Wortes
an den Kombinierer 239 erzeugt wird. Jedes dieser d-Ausgangssigiiale
kann beispielsweise ein 18-Bit-Wort sein. Während jedes Lauf-Zustandes werden daher für die Maske 2 durch das Register
237 insgesamt 128 d-Worte bzw. Ausgangssignale erzeugt. Jedoch wird, wie später gezeigt werden wird, nur das letzte oder das
größte dieser 128 d-Worte (d2) nachfolgend als das Masken-2-Korrelations-Datensignal
verwendet.
Zurück zur Fig. 12; der Typ Nr. 2, die Betragsnorm, kann definiert
werden als die Summe von i-absoluten Wertender Differenzen
zwischen entsprechenden Komponenten der Größen x. und r.,
wobei i = 1, 2 ... η ist. Diese zweite Punktion läßt sich ausdrücken
durch:
d- \ ν - r
— J· Aj — J. j
— J· Aj — J. j
wobei i = 1, 2 ... η und η = der Anzahl von Worten in einer gegebenen
Maske ist.
Es ist ersichtlich, daß in dieser Punktion vom Typ Nr. 2 die gewichteten
Worte w. vom gleichen Gewicht sind und daß der Schwellwert 9. nicht verwendet wird.
609884/0999
In der Darstellung der Betragsnorm der arithmetischen Informationsquellen-Einheit
vom Typ Nr. 2 können die spezifische Vergleichsfunktion 153A der Fig. 13A, der spezifische Schwellwertfunktions-Änderer
157C der Fig. 14C, der spezifische Gewichtsfunk ti ons -Anderer l6lB der Fig. 15B und der Summeη-Akkumulator
165 der Fig. l6 verwendet werden. Die Vergleichsfunktion 153A
der Fig* 13A und der 'Summenakkumulator I65 der Fig. l6 wurden
bereits im vorhergehenden erläutert. Die Fig. 1^C zeigt an, daß
der Schwellwertfunktions-Änderer 157C als eine gerade Leitung
2^5 dargestellt ist. Daher wird der Schwellwert θ in dem Schwellwertfunktions-A'nderer
157C der Fig. 1^C nicht verwendet, und
daher ist t. = c.» Der Gewichtsfunktions-Ä'nderer I6IB der Fig.
15B zeigt ebenfalls eine durchgezogene Linie 247, um darzustellen,
daß das Gewicht, daß jeder -Komponente oder Dimension des Signales tj zugeordnet ist, gleich ist. Daher ist m. = t. = c. ,
wobei jedes der m. und t.-Worte ein 6-Bit-Wort ist, da jeder
Wert von c. ein 6-Bit-Wort ist.
Bei der spezifischen Darstellung der Betragsnorm von dem Typ Nr.2
kann die arithmetische Infomationsquellen-Einheit 15I der Fig,
vereinfacht werden, indem die Halte-Register 155, 159 und 163
s.owie die Schwellwert- und Gewichtsfunktions-Änderer 157 und
161 weggelassen werden, und indem» das c.-Wort (von dem Vergleichs-Funktionskreis
153A der Fig. 13A) und das EOM-Bit (von dem Masken-
609884/0999
speicher Io3) direkt an den Summen-Akkumulator I65 angelegt werden,
und in dem entsprechend die EOM- und EOR-Bits (von dem Mas» kenspeicher Io3) an die verbleibenden Plätze, angezdgt in Fig,5,
angelegt werden.
Zurück zur Fig. 12; die gewichtete Betragsnorm vom Typ Nr. 3 kann definiert werden als die Summe der i-gewichteten (w )-abso~
luten Werte der Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei i = 1, 2 ... η ist. Diese dritte
Funktion kann ausgedrückt werden durch die Beziehung:
n_
w.
"i
xi - ri
wobei i = 1, 2 ... η und η = der Zahl der V/orte in einer gegebenen
Maske ist.
Es ist ersichtlich, daß in diesem Funktionstyp Nr. 3 die Schwellwert-Worte
Θ. nicht verwendet werden.
Bei der Darstellung der gewichteten Betragsnorm der arithmetischen
Informationsquellen-Einheit vom Typ Nr. 3 können die spezifische Vergleichsfunktion 153A der Fig. 13A, der spezifische
Scliwellwertfunktions-Änderer 157C der Fig. l4C, der spezifische
Gewichtsfunktions-Änderer I6IA der Fig. 15A und der Summen-Akkumulator
165 der Fig. l6 verwendet werden. Alle diese Kreise
609884/0999
sind bereits im vorstehenden erläutert worden und bedürfen daher keiner v/eiteren Erläuterung. Wie #doch aus Fig. 12 hervorgeht,
sind die Bit-Längen für die Worte c., t^t m^ und d bei dam Punktionstyp
Nr. 3 = 6, 6, 11 und 18. Es sei angemerkt, daß sich der Punktionstyp Nr. 3 von dem Funktionstyp Nr. 1 dadurch unterscheidet,
daß keine Schwelle θ vorgesehen ist. Bei der Darstellung dieses Funktionstyps Nr. 3 kann daher die arithmetische Informationsquellen-Einheit
151 der Fig. 5 vereinfacht v/erden, indem man den Schwellwertfunktions -Änderer 157 und die Halte-Register 159
wegläßt, und indem man die c. - und w.-Worte des Halte-Registers
155 direkt an den Gewichtsfunktions-Änderer l6l anlegt (da t. =
c. und w. = w. ist), und indem die EOM- und EOR-Worte des Halte-Registers
155 direkt an das Halte-Register I63 angelegt werden.
Zurück zur Pig. 12; der Punktionstyp Nr. 4, die euklidische quadratische
Abstandsfunktion kann definiert werden als die Summe der Quadrate der i-Differenzen zwischen entsprechenden Komponenten
der Größen x. und r., wobei i = 1, 2 ... η ist. Diese vierte
Punktion kann ausgedrückt werden durch die Beziehung:
wobei i = 1, 2 ... η und η die Anzahl der Worte in einer gegebenen
Maske ist.
609884/0999
Es ist ersichtlich, daß in diesem Funktionstyp Nr. l\ jedes der
gewlchteten Worte w. vom gleichen Gewicht sind, und daß keine
Schwellwert-Worte Θ.verwendet werden.
Für die Darstellung der euklidischen quadratischen Abstandsfunktion
der arithmetischen Informationsquellen-Einheit vom Typ Nr. k
können die spezifische Vergleichs funktion 153A der Fig. 13A, der spezifische Schwellwertfunktions-Änderer 157B der Fig. 1^B,
der spezifische Gewichtsfunktions-Änderer l6lB der Fig. 15B ui:d der Summen-Akkumulator I65 der Fig. 16 verwendet werden. Es wird
dabei nunmehr nur noch der Schwellwertfunktions-Änderer 157B in der Fig. l4B im einzelnen erläutert, da die verbleibenden,
im vorstehenden aufgezählten Kreise bereits vorher erläutert worden sind.
Der Schwellwertfunktions-Änderer 157B der Fig. 14B enthält einen
quadrierenden bzw. multiplizierenden Schaltkreis 2^9, der, da
keine Sehwellwerte Θ. verwendet werden, das 6-Bit-Eingangssignal
c. quadriert, indem es dieses mit sich selbst multipliziert, um dadurch,ein 12-Bit-Ausgangssignal t. zu erzeugen, das = c^· c,
ρ
oder c. ist. Wie in Fig. 12 angedeutet, sind die Bit-Längen für die Worte m. bzw. d in dem Funktionstyp Nr. 4 gleich 12 bzw. 18.
oder c. ist. Wie in Fig. 12 angedeutet, sind die Bit-Längen für die Worte m. bzw. d in dem Funktionstyp Nr. 4 gleich 12 bzw. 18.
609884/0999
Für die spezifische Darstellung des Funktionstyps Nr. H, der
euklidischen quadratischen Abstandsfunktion, kann die arithmetische Informationsquellen-Einheit 151 der Fig. 5 dadurch vereinfacht
werden, indem man den Gewichtsfunktions-Änderer l6l und
die Halteregister 163 wegläßt, und indem man direkt die t.-Worte
und das EOM-Bit des Halteregisters 159 direkt an den Summen-Akkumulator
165 anlegt, und indem man die EOM- und EOR-Bits
des Halteregisters 159 an die verbleibenden Stellen, angezeigt in Fig. 5, anlegt.
Zurück zur Fig. 12; der Funktionstyp Nr. 5, die Funktion des Skalar-Produktes.von zwei Vektoren, kann aufgefaßt werden durch
die Summe der !-Produkte von entsprechenden Komponenten der
Größen x. und r., wobei i =1, 2 ... η ist. Diese fünfte Funktion
kann ausgedrückt werden durch:
a Λ
41
4t
wobei i = 1, 2 ... η und η die Zahl der V/orte in einer gegebenen
Maske ist.
Es ist ersichtlich, daß in diesem Funktionstyp Nr. 5 die gewichteten
Worte w. vom gleichen Gewicht sind, und daß keine Schwellwert-Worte
0. verwendet werden.
609884/0999
- 6l -
Bei der Darstellung der Punktion des Skalar-Produktes von zwei
Vektoren der arithmetischen Informationsquellen-Einheit vom Typ
Nr. 5 kann die spezifische Vergleichs funktion 153B dor Fig. 13B,
der spezifische Schwellwertfunktions-Änderer 157C der Fig. l4C,
der spezifische Gewichtsfunktions-Xnderer l6lB der Fig. 15B und
der Summe η-Akkumulator 165 der Fig. 16 verwendet werden. Dabei
soll nur die Vergleichsfunktion 153B der Fig. 13B im einzelnen diskutiert werden, da der Rest der oben bezeichneten Schaltkreise·
bereits im vorstehenden diskutiert worden ist.
Die Vergleichsfunktion 153B der Fig. d 3B enthält sinen Multiplizierer
251, der entsprechende Komponenten der x. und r^-Worte
miteinander multipliziert, um ein 12-Bit-Wort oA zu erzeugen. In
diesem Fall ist c. gleich dem Produkt x.»r.. Wie in Fig. 12 dargestellt
ist», sind die Bit-Längen für den Typ Nr. 5 für jedes
der Worte t., m. und d gleich 12, 12 bzw. 18.
Für die spezifische Darstellung des Funktionstyps Nr. 5, dem skalaran Produkt von zwei Vektorfunktionen, kann die arithmetische
Informationsquellen-Einheit 151 der Fig. 5 dadurch vereinfacht werden, indem die Halte-Register 155, 159 und I63 sowie
die Schwellwert- und Gewichtsfunktions-Veränderer 157 und I6I
weggelassen werden, und indem das t.-Wort (von der Vergleichsfunktion 153B der Fig. 13B) und das EOM-BIt (von dem Maskenspeicher
Io3) direkt an den Summen-Akkumulator l65 angelegt werden,
609884/0999
sowie indem die EOM- und EOr-Bits (von dem Maskenspeicher I03)
an die in Pig» 5 angezeigten verbleibenden Plätze angelegt werden,
Die korrelierende Ai-beitsweise der arithmetischen Informationsquellen-Einheit
151 soll nunniahr weiter analysiert v/erden. Im
einzelnen soll die korrelierende Arbeitsweise der Einheit 151 vom Typ Nr. 1 (Fig. 12) in Verbindung mit z.B. einer l6-Wortelangen
Maske X unter Bezugnahme auf die Fig. 17 analysiert werden, da diese Einheit vom Typ Nr. 1 sowohl Schwellwerte Θ. als
auch Gewichte w. benutzt. Es sei jedoch betonts daß von der gegebenen
Information eine ähnliche Analyse mit bekannten Mittein
für die anderen Typen von arithmetischen Informationsquellen-Einheiten 151 (Fig. 12) durchgeführt werden können.
Es sei nun angenommen, wie es in der Fig. 17 zum Ausdruck kommt, daß die Größen x^, r., Θ. und w. für die l6-Wort-lange Maske X
ihre entsprechenden angezeigten Werte während der l6 aufeinanderfolgenden Perioden von 1 MHz^Zählimpulsen (von der Zentralsteuerung
87) erzeugen. In dieser 16-Wort-langen Maske ist i = 1, 2
... 16. .Es ist ersichtlich, daß jedes der c^-Worte ( von der
Vergleichsfunktion 153A der Fig. 13A) gleich dem Absolutwert der
Differenz zwischen den entsprechenden x^- und r.-Worten ist. Immer
dann, wenn die Werte dieser e.^-Worte die entsprechenden
Schwellwerte 9. übersteigen, sind die t.-Worte (von dem Schwell-
609884/0999
wertfunktions-Änderer 157A der Pig* l4A) gleich 1* Für alle anderen
Werte von c. und O sind die Werte für die t.-Worte gleich O,
Die Multiplikationen der entsprechenden Werte der tj~ und w. V/orte
erzeugen die m.-Worte (von dem Gewichtsfunktions-A'nderer
l6lA der Pig. 15A). Immer dann, wenn ein t.-Wort gleich 1 ist,
ist der Wert des zugeordneten resultierenden in^-Wortes gleich dem
V/ert des zugeordneten Gewichtwortes w. . Wenn ein t.-Wort gleich 0 ist, dann ist das zugeordnete resultierende m.-Wort gleich 0.
Die Aufsummierung oder die laufende Summe der vorher akkumulierten
m.-Worte mit dem V/ert des neuesten m. -Wortes ist dargestellt,
und zwar mit einer Endsumme an dem Ausgang des Summen-Akkumulators 165 der Fig* 6, dar während der letzten oder der l6, Zählimpulsperiode
für die Maske X den V/ert von 31 hat. Diese Endsumme von 31 ist das Ausgangs-Korrelations-Datenslgnal d, für
die Maske X.
Zurück zur Fig. 5» die d-Werte des Summeη-Akkumulators I65 in
der arithmetischen Informationsquellen-Einheit 15I werden über
eine zusammengesetzte Leitung 3ol an den "Daten-Ein"-Eingang
eines "first-in, first-out" Datenspeicherkreises 3o3 (FIFO)
angelegt. Dieser FIFO-Datenspeicherkreis 3o3 kann aus einer Anordnung
von 18 parallel arbeitenden FIFO-Schieberegistern (nicht dargestellt) bestehen, und zwar von einem Typ, wie sie von der
Firma Fairchild mit der Teile-Nr. A7K3341191 hergestellt werden.
609884/0999
Jedes FIFO-Schieberegister in dem Kreis 3o3 hat "Dafcen-Ein"^
"Fensterimpuls-Ein" und "Fensterimpuls-Aus"-Eingänge und einen
"Daten-Aus"-Aus gang.
Die 18 Bits in jedem der d-Werte, die von dem SummenTAkkumulator
165 erzeugt werden, v/erden an die entsprechenden "Daten-Ein"-Eingange
der 18 FIFO-Schieberegister in dem Kreis 3o3 angelegt.
Alle 18 "Fensterimpuls-Ein"-Eingänge sind untereinander verbunden, damit sie gemeinsam jedes EOM-Bit von dem Halte-Register
163 empfangen können. Dadurch schaltet jedes EOM-Bit die 18 FIFO-Schieberegister
derart an, daß sie nur die 18 Bit in dem letzten d-Wort, die erzeugt werden, bevor das EOM-Bit eintrifft,, empfängt. Es ist daher ersichtlich, daß für jede Maske, die aus
dem Maskenspeicher 303 ausgelesen wird, nur die 18 Bits in einem
d-Wort in den Kreis 3o3 verschoben werden. Das d-Wort, das in
dem Kreis 3o3 für jede Maske gespeichert ist, ist dasjenige vom gröfatcn Viert und entspricht damit der letzten akkumulierten
Summe, die in dem Summen-Akkumulator I65 erzeugt worden ist, bevor
dieser Akkumulator I65 durch das verzögerte EOM-ßit von dem
Verzögerungskreis I67 gelöscht wurde.
Die Anordnung der FIFO-Schieberegister in dem Kreis 303 verschiebt
intern parallel die 18 Bits in jedem empfangenen d-Wort in die erste freie Stelle. Dadurch ist es dem Kreis 3o3 möglich, für
609884/0999
jede Maske, die während des Lauf-Zustandes aus dem Maskenspeicher Io3 ausgelesen wird, nacheinander ein d~Wort zu speichern.
Wie es kurz in Verbindung mit den Fig. 18 und 19 in größeren Einzelheiten erläutert werden solj, wird das EOR (Ende des Laufs)-Bit
von dem Halte-Register 163 an die Entscheidungsfunktion 17 angelegt» Als Antwort auf jedes EOR-Bit erzeugt die Entscheidungsfunktion 1?' eine Folge von FIFO-Ausgangs-Fensterimpulsen. Alle
"Fensterimpuls-Aus"-Ausgänge des Kreises 3o3 sind ζugammerM-:eschaltet, damit sie gemeinsam jeden FIFO-Ausgangs-Fensterimpuls erhalten»
Auf diese Weise veranlaßt jede der Folge von FIFO-Ausgangs-Fensterimpulsen
alle 18 FIFO-Schieberegister gemeinsam ein zugeordnetes l8-3it langes Korrelatlons-Datenwort d fiL- eine
zugeordnete Maske, die vorher aus dem Maskenspeicher Io3 ausgelesen
worden ist, auszulesen. Da, wie in Fig. 9 angezeigt, M-verschiedene
Masken in dem Maakenspeicher Io3 abgespeichert sind,
sind M-verschiedene Korrelat!ons-Datenworte (d , d? ... d ) vorhanden,
die nacheinander aus dem FIFO-Kreis 3° 3 ausgelesen werden. Die Folge der Korrelations-Datenworte werden der Entscheidungsfunktion 17 zugeführt. Unter Bezugnahme auf die Fig. 18 und 19
soll nun die Arbeitsweise dieser Entscheidungsfunktion 17
einzelnen näher erläutert werden.
609884/0999
Die Fig. l8 zeigt einen ersten Teil der Entscheidungsfunktion 17. Während des Betriebes setzt das EOR-Bit von dem Halte-Register
163 (Fig. 5) ein Flip-Flop 311, derart, daß sein Q-Ausgang ein Signal mit dem Zustand "1" führt. Dieses Signal vom Zustand "1"
schaltet ein UND-Gatter 313 an, das 100 KHz-Taktimpulse (von dem Systemzeitgenerator 19 der Fig. 1) an den Zähleingang eines
Zählers 315 und an einen 100 nsec.-Verzögerungskreis 317 durchläßt.
Jeder 100 KHz-Impuls von dem UND-Gatter 313 wird durch den
Zähler 315 gezählt zwecks Erzeugung eines Adressen-Zählstandes,
der an den Adress-Eingang eines Demultiplexers 319 angelegt vird. Jeder der 100 KHz-Impulse, die mittels des Zählers 315 gezählt
werden, werden ferner mittels des Verzögerungskreises 317 um
100 nsec. verzögert zwecks Erzeugung eines FIFO~Ausgangs-Fensterimpulses.
Das Ausgangssignal des Verzögerungskreises 317 bildet daher eine Folge von FIFO-Ausgangs-Fensterimpulsen, die den FIB1O-Datenspeicher-Schaltkreis
3o3 (Fig. 5) derart anschalten, daß er nacheinander l8 Bit-breite FIFO-Korrelations-Datensignale d*-d
ι m
ausliest und sie an den Demultiplexer 319 anlegt.
Jeder Adressenzählstand von dem Zähler 315 ist in einem stabilisierten
Zustand, bevor eines der zugeordneten Datensignale d^-d
an den Demultiplexer 319 angelegt werden. Die FIFO-Ausgangs-Fensterimpulse
des Verzögerungskreises 317 werden weiterhin an
den Demultiplexer 319 angelegt. Der Demultiplexer 319 kann aus
609884/0999
einem Satz von elektronischen Schaltern bestehen, die nacheinander
von den Adressen des Zählers 315 adressiert werden, damit die seriell erzeugten d.-d -Eingangs-Datensignale in parallele
Ausgangssignale d.-d umgewandelt werden. Zur selben Zeit wandelt der Demultiplexer 319 die Folge der FIFO-Ausgangs-Fensterimpulse
des Verzögerungskreises 317 in parallele Ausgangs-Fenstersignale, Fenster, bis Fenster .
1 m
Jeder Ausgangs-Adress-Zählstand des Zählers 315 wird an einen
Eingang eines Vergleichers 321 angelegt. Die Zahl M, die gJeich
der Zahl der in dem Maskenspeicher· Io3 (Fig. 5) gespeicherten
Masken ist, wird an den zweiten Eingang des VcrgIeichers 321
angelegt. Wenn der Adress-Zählstand des Zählers 315 gleich der Zahl M ist, erzeugt der Vergleicher 321 einen Anschalt-Impuls,
der das Flip-Flop 311 zurückstellt, damitteine 100 KHz-Impulse
mehr das UND-Gatter 313 passieren können. De.-1 Anschalt-Impuls
stellt ferner den Zähler 315 auf den Zählstand Null zurück. Da:; Flip-Flop 311 und der Zähler 315 verbleiben in diesem zurückgestellten
Zustand, bis aufgrund des folgenden EOR-Bits neue FIFO-Korrelations-Datensignale
demultiplext werden. Die Masken-Korre» lations-Datensignale d.-d , die Fensterimpuls-Signale, bis
und der Anschalt-Impuls werden an einen zweiten Teil de*· Entscheidungsfunktion
17 angelegt, so wie es in der Fig. 19 dargestellt ist.
60988-4/0999
Die Flg. 19 zeigt den zweiten Teil der Entscheidungsfunktion 17,
und zwar für den Fall von vier Masken, d.h. M = 4♦ Natürlich
kann die Verwirklichung auch leicht nach höheren Werten hin a.usgedehnt
vier den, z.B. auf den Fall von 27 Masken, d.h. M = 27. Um innerhalb einer Abtastperiode mehr als 27 Masken zu korrelieren,
können eine vorbestimmte Anzahl von asynchronen Korrelationskreisen 15 (Fig. 5) parallel arbeiten, um gleichzeitig eine
vergleichbare Zahl von parallelen Strömen von Ausgangs-Korrelationsdaten
zu erzeugen. Wenn jedoch, wie es in Fig. 1 dargestellt ist, nur ein asynchroner Korrelationskreis benutzt wird,
dann können innerhalb einer Abtastperiode mehr als 27 Masken dadurch korreliert v/erden, indem man grundsätzlich innerhalb
der gewählten Abtastperiode die Zeit, die für jede Masken-Korrelation notwendig ist, senkt. In diesen letzteren Fall können,
Ka3ken um das System der Erfindung auf-beispielsweise mindestens 500/
auszudehnen, die folgenden Änderungen gemacht werden: Gef-enwärtiger
Stand der Technik, schnellere Speicher können für den Speicher 8l mit direktem Zugriff und den Maskenspeicher Io3 verwendet
werden; die Wort-Speicherkapazität des Maskenspeichers Io3 kann auch beispielsweise 131072 V/orte ausgedehnt werden;
es kann anstelle des dargestellten 1 MHz-Taktes ein 10 MHz-Takt verwendet werden, um die Worte aus den Speichern 8l und Io3 auszulesen
und um die anderen Zeitoperationen in dem System durchzuführen; schließlich kann eine Abtastzeit von 20 msec, anstelle
609884/0999
von 10 msec, in dem System verwendet werden, Indem man eine
Abtastfrequenz von 50 Hz anstelle der dargestellten 100 Hz verwendet.
Natürlich kann auch eine Kombination dieser beiden Fälle dazu verwendet v/erden, die Anzahl von Maskenkorrelationen
innerhalb einer Abtastpsriode zu erhöhen. Es ist daher ersichtlich,
daß mittels der obengenannten Maßnahmen das System der Erfindung leicht so ausgelegt v/erden kann, daß es mit irgendeiner
gewünschten Anzahl von Masken arbeiten kann.
Es sei in Erinnerung gerufen, daß die V/orte in jeder Maske des Maskenspeichers Io3 fortlaufend mit den zugeordneten STV-Werten,
d.h. den digitalisierten Sprachwerten, die in dem Speicher Sl (Fig. 5) gespeichert sind, verglichen werden; daß ferner ein
Korrelations-Datensignal d die Summe dieser Vergleiche für eine gegebene Maske darstellt; daß ferner ein Korrelations-Datensignal
d. - d für jede Maske 1 - M des Speichers Io3 erzeugt wird;
und daß schließlich die relative Amplitude jedes dieser Signole d. - d ein Maß für die Über eins timmung zwischen Masken In dem
Speicher Io3 und den zugeordneten Sprachsignalen, gespeichert in dem Speicher 8l, sind.
Wie es bereits oben beschrieben wurde, repräsentieren die Masken in dem Maskenspeicher Io3 (Fig. 5) jeweils einen dyadischen oder
triadischen phonetischen Ton. Für den Fall der vier Masken, der
609884/0999
in der Pig. 19 dargestellt ist, sei angenommen, daß das Schlüsselwort
"Los Angeles" angezeigt werden soll. Phonetisch läßt, sich das Schlüsselwort "Los Angeles" in die Tongruppen "Los",
"An", "ge" und "les" zerlegen. Zum Zwecke der nachfolgenden Beschreibung
soll, wenn die Masken 1 bis 4 den Tongruppen "Los", "An", "ge" und "les" entsprechen.
Während jeder 10 meec.-Periode werden neue Masken-Korrelationsdatonsignale
d. , do, d, und dj, erzeugt und über eine zusammengesetzte
Leitung entsprechend an Pufferregister 331, 333 und 335 sowie an einen Kombinationskreis 337 angelegt. Jede 10 msec,
wird mittels dar Fensterimpulse 1 bis 3 der neueste Wert von d, , d~ und d-, in die Register 331, 333 und 335 eingeschoben bzw.
dort gespeichert. Die Pufferregister 331, 333, und 335 können jeweils aus 18 parallelen, nicht dargestellten Schieberegistern
bestehen, v/obei jedes Schieberegister 128 in Reihe geschaltete Flip-Flops (nicht dargestellt) besitzt. Daher kann jedes der
Puffer-Register 331, 333 und 335 für einen gegebenen Zeitpunkt 128 benachbarte verschiedene Werte für die zugeordnete Größe
d enthalten. Beispielsweise enthält das Puffer-Register 331
Werte
128 aufeinanderfolgaxe/des Korrelations-Signals d1 für die Maske Da jede 10 msec, ein anderer Wert von d. erzeugt wird, sind die Register 331 (als auch jedes der Register 33 und 335) zeitlich gesehen 1280 msec. lang.
128 aufeinanderfolgaxe/des Korrelations-Signals d1 für die Maske Da jede 10 msec, ein anderer Wert von d. erzeugt wird, sind die Register 331 (als auch jedes der Register 33 und 335) zeitlich gesehen 1280 msec. lang.
609884/0999
Verbunden mit den Puffer-Registern 331, 333 und 335 sind Beobachtungsfenster,
die innerhalb der zugeordneten Register 331, 333 und 335 entsprechend den Zeiten des Erscheinens der phonetischen
Töne in dem gewünschten Schlüsselwort, das in diesem Beispiel "Los Angeles" ist, zeitlich untereinander angeordnet
sind. Da beispielsweise der Ton "Los" vor dem Ton "An" erscheint, ist das Fenster in dem Register 331 rechts neben dem Fenster in
dem Register 333 angeordnet. Da in gleicher Weise der Ton "An" vor dem Ton "ge" erscheint, ist das Fenster in dem Register 333
rechts nebem dem Fennter 335 angeordnet. Da der Ton "les" zuletzt
in dem Wort "Los Angeles" erscheint, wird er direkt an den Kombinierer 337 angelegt.
Jedes der Beobachtungsfenster in den Registern 331, 333 und 335 kann, zeitlich gesehen, eine Länge aufweisen, die zwischen 30
und 200 msec, liegt. Die Länge oder die Zeitdauer eines Beobachtungsfensters
wird grundsätzlich von dem Betrag der Änderungen in der Sprachgeschwindigkeit (rate of speech) für die zugeordnete
Dyade oder Triade bestimmt. Je mehr Variationen in der Sprachgeschwindigkeit vorhanden sind, je länger ist das Fenster.
Andererseits werden die Grenzen des Fensters (oder das Nahekommen der Fenster untereinander) von dem Trainingssatz der Äußerungen
bestimmt. Eine Grenze des Fensters wird durch den nächstliegenden Zeitpunkt bestimmt, bei dem die Maske und die folgende
609884/0999
benachbarte Maske immer zusammen beobachtet werden können, wogegen die andere Grenze durch den entferntest liegenden Zeitpunkt
bestimmt wird, bei dem sie immer abseits beobachtet werden. Bei der Bestimmung der Länge und der Grenzen der Beobachtungsfenster
für ein gewünschtes Schlüsselwort, untersucht die Person, die den Trainer Io5 (Pig, 5) trainiert, alle verwendeten Trainingsdaten,
und mißt statistisch die Bereiche jeder der Zeitänderungen bzw. Änderungen der entsprechenden Masken untereinander. Man erhält jedes
Fenster aus den Trainingsdaten, indem man für den zugeordneten Dyaden- öder den Triaden-Ton in jedem gewünschten Schlüsselwort
den Bereich oder die Extremwerte der zeitlichen Änderungen in der Sprachgeschwindigkeit beobachtet und indem man an jedem Ende
des Bereiches einen Zuschlag von 20 % hinzufügt. Jedes Fenster ist dadurch der empirische Bereich dieser Veränderungen, der ausgedehnt
worden ist, um begrenzten zusätzlichen Abweichungen, die in den Trainingsdaten gefunden werden, Genüge zu tun.
Jedes der Fenster in Fig. 19 bezieht sich auf die letzte Maske. Wie aus Fig. 19 für den Fall von vier Masken hervorgeht, bezieht
sich jedes der Fenster für die Pufferregister 331, 533 und 335
auf die Maske 4 oder mehr im einzelnen auf das gerade anstehende Masken-Jj-Korrelationsdatensignal dj.. Je weiter das Fenster in
dem Pufferregister von dem laufenden d^-Wert für die letzte Maske (Maske k) entfernt liegt, je weiter ist das Beobachtungs-
-/-609884/0999
fenster. Beispielsweise ist in dem Puffer-Register 331 das Fenster
zwischen den Masken 1 und 4 das breiteste, weil es zeitlich gesehen am weitesten von dem laufenden dj,-Wert entfernt ist.
Andererseits ist in dem Pufferregister 335 das Fenster zwischen den Masken 3 und 4 das schmälste, weil es zeitlich gesehen am
nächsten zu dem laufenden d^-Wert liegt.
Die Fenster in den Puffer-Registern 331, 333 und 335 sind stationär,
wenn die Korrelationswerte d. - d-, durch die Puffer hindurchgeschoben
werden. Die verschiedenen d~V.Terte (vond., dp und d,),
die in den Fenstern der Pufferregister 331, 333 und 335 enthalten sind, werden entsprechend auf da?; Maximum, d.h. einen Peak
ansprechende Detektoren 339, 3^1 und 3l\J>
angelegt. Jeder Peak-Detektor erfaßt innerhalb des ihm zugeordneten Fensters das Maximum
des d-Wertes. Die beste Übereinstimmung zwischen einer Maske und dem spekfcrografischen Signal, das in dem Speicher 8l gespeichert
ist, wird durch diesen Peak-Wrt angezeigt, der also eine
nahe Korrelation zwischen dieser Maske und ihrem zugeordneten Teil des gewünschten Schlüsselwortes anzeigt. Wie bereits oben
herausgestellt wurde, ermöglicht es eine geeignete Breite und eine geeignete Anordnung der Fenster untereinander, daß die Peaks
für die zugeordneten Komponenten eines gewünschten Schlüsselwortes gleichzeitig erzeugt werden, wenn das gewünschte Schlüsselwort
auftritt« Der laufende Wert von d^ zusammen mit den Maximal-
609884/0999
werten von d., dp und d,, die innerhalb ihrer zugeordneten Fenster
erzeugt werden, werden in einem Kombinationskreis 337 aufsummiert, um ein Schluß-Entscheidungsfunktionssignal zu erzeugen.
Aufgrund dieser Darstellung ist ersichtlbh, daß das Schluß-Entscheidungsfunktionssignal
die Summe des vorliegenden Korrelationswertes für die letzte Maske (Maske 4) und die Maximal-Vier te,
die, zurückschauend, in den Fenstern von vorhergehenden Masken vorhanden waren. Dabei wird jede 10 msec, ein neuer Wert der
Sohluß-Entscheidungsfunktion errechnet.
Die Amplitude jedes Schluß-Entscheidungsfunktionssignals ist
kennzeichnend dafür, ob in der zu analysierenden Sprache ein gewünschtes Schlüsselwort enthalten ist oder nicht. Um daher bestimmen
zu können, ob ein gewünschtes Schlüsselwort vorhanden ist
oder auch nicht, wird jedes Schluß-Entscheidungsfunktionssignal
und ein Entscheidungs-Schwellwertsignal 0 an das Schwellwertgatter 3^5 angelegt. Das Entscheidungs-Schwellwertsignal 0 wird
empirisch beim Trainieren des Trainers Io5 (Fig. 5) abgeleitet. Aufgrund des Anlegens des Anschalt-Signals des Vergleichers 321
(Fig. 18) erzeugt das Schwellwert-Gatter 3^5 ein Entscheidungs-Aus
gangs signal. Dieses Entscheidungs-Ausgangssignal ist ein Signal vom Zustand binär "1",immer dann, wenn das Schluß-Entscheidungs
funktionssignal größer als die Ertscheidungsschwelle 0 ist;
in allen anderen Fällen hat es den Zustand binär "0". Jede
609884/0999
• ^ - 75 -
10 msec, wird ein neuer Wert des Entscheidungs-Ausgangssignals
errechnet, indem eine neu entwickelte Schluß-Entscheidungsfunktion mit der Ent s ehe i dungs schwel le 0 verglichen wird. Ein Entscheidungs-Ausgangssignal
am Schwellwertgatter 3^5 vom Zustand
binär "1" zeigt an, daß die korrelierten Werte der Sprach-Eingangssignale und der Masken, die dieses Schlüsselwort ausmachen,
in richtiger Weise erfaßt worden sind mit den geeigneten Peak-Werten und daß das gewünschte Schlüsselwort erfaßt worden ist.
Dieses Entscheldungs-Ausgangssignal vom Zustand "1" kann dazu verwendet werden, mittels eines nicht gezeigten Ausgangskreises
eine Glocke ertönen zu lassen, ein Licht einzuschalten, bestimmte Kontrolleinrichtungen anzuschalten, die eine vorbestimmte Funktion
ausüben, z»ß. das Starten oder Beenden der Arbeltsweise einiger anderer nicht dargestellter Einrichtungen. Entsprechend der
Plazierung und der Breite der Fenster in dem Schaltkreis gemäß Fig. 19 können die'Masken-Korrelationen in einer Art und Welse
kombiniert werden, die einer großen Änderungsbreite in der Sprachgeschwindigkeit
angepaßt ist.
Es soll erwähnt werden, daß der Schaltkreis nach Fig. 19 gerade ein gegebenes Schlüsselwort erkennen kann. Wenn weitere Schlüsselworte
erfaßt werden sollen, ist für jedes zusätzliche zn erfassende Schlüsselwort ein zusätzlicher Schaltkreis ähnlich demjenigen
in Fig. 19 notwendig. In diesem Fall werden die geeigneten Signale der Korrelations-Datensignale A1 - dm in Verbindung
609884/0999
mit jedem zusätzlichen, auszuwählenden Schlüsselwort verwendet werden, mit einem Puffer-Register, das allen, und zwar den letzten
Masken der Maskengruppe, die mit irgendeinem gegebenen Schlüsselwort verbunden ist, zugeordnet ist, und mit den Penstern in den
Puffer-Registern, die in geeigneter Weise angeordnet sind, und
die die geeigneten Abmessungen haben. Indem man kontinuierlich die Masken-Korrelationsdaten des Demultimplexers 319 (Fig. 18)
in einer selektiven Art und V/Eise kombiniert, so wie es oben angeführt ist, kann irgendeine gegebene Zahl von Schlüsselworten
durch das gesamte System erfaßt werden.
Werden beispielsweise drei Masken-Vielfache verwendet, und zwar im Hinblick auf die freie Variation und den Zwischensprechereffekt
(wie oben diskutiert), dann kann ,jede der drei Masken in Reihe (oder auch parallel) mit den Ausgangssignalen des Speichers 81
korreliert werden. Die Korrelationsdatensignale von diesen drei Masken-Vielfachen können dann gleichzeitig an einen Maximumoder
Peak-Detektor (nicht gezeigt) angelegt werden, der ähnlich den Peak-Detektoren 339j 3^1 und 3^3 ist, wobei der Maximum-Maskenkorrelationswert
d der drei beispielsweise als einer der d-Werte an den Schaltkreis nach Pig. 19 angelegt wird. Indem
Vielfach-Hasken verwendet werden, ist das System gemäß der Erfindung
nicht nur aufnahmefähig hinsichtlich einer großen Anzahl von verschiedenen Sprechern, sondern kann auch eine breite freie
609884/Q999
Variation in der phonetischen Transkription der zu erfassenden Schxüsselworte zulassen.
Die Fig. 20 zeigt ein Blockschaltbild einer anderen Ausführungsform des zweiten Teiles der Entseheidungsfunktion 17 nach Fig.1,
die anstelle der Anordnung nach Fig. 19 verwendet werden kann. Der in Fig. 2o dargestellte Schaltkreis bezieht sich ebenso wie
der Schaltkreis nach Fig. 19 beispielhaft auf einen k-Maskenfall.
Es ist offensichtlich, daß der Schaltkreis nach Flg. 2o in Übereinstimmung mit der hier gegebenen Lehr^ für die Benutzung von
mähr als 4 Masken ausgedehnt werden kann. Der Schaltkreis nach
Fig. 2o hatj ebenso wie derjenige nach Fig. 19» nur die Fähigkeit,
ein Schlüsselwort zu erfassen. Damit das System der Erfindung in der Lage ist, irgendeine gegebene Zahl von Schlüsselworten zu
erfassen, müssen in dem System eine entsprechende Anzahl von Schaltkreisen, ähnlich demjenigen gemäß Fig. 2o, vorgesehen
werden.
Es sei in Erinnerung gerufen, daß in dem Schaltkreis der Fig. 19 die Fenster der Pufferregister 331, 333 und 335 in Bezug gesetzt
wurden zu dem laufenden Masken-Korrelations-Datensignal d^, das
von der letzten Maske, im dargestellten Beispiel die Maske 4,
abgeleitet wurde. In dem Schaltkreis der Fig. 2o wird jedes Fenster bezogen auf das Korrelations-Datensignal, das von der fol-
609884/0999
genden benachbarten Maske und nicht von der letzten Maske abgeleitet
wird.
In Fig. 2o werden die Masken-1-Korrelations-Datansignale d nacheinander
jede 10 msec, durch die zugeordneten Fenster-1-Signale
in ein Puffer-Register 351 eingetaktet. Das Register 351 hat ein Beobachtungsfenster, das im wesentlichen die ganze Speicherkapazität
des Registers 351 umfaßt. Jede 10 msec, erfaßt ein Maximum«
Detektor 353 den Peak-Wert d. des Beobachtungsfensters des Registers
351· Jedes Peak-Ausgangssignal d. des Maximum-Detektors
353 wird in einem Kombinationskreis 355 mit einem zugehörigen Masken-2-Korrelations-Datensignal dp summiert, zwecks Erzeugung
eines ersten Entseheidungs-Funktionssignals für die Masken 1 und
2. Jede 10 msec, wird eine neue erste Entscheidungsfunktion
erzeugt.
Die nacheinander erzeugte erste Entscheidungsfunktions-Signale
des Kombinierers 355 werden mittels der zugehörigen Fenster-2-Signale in ein Puffer-Register 357 eingetaktet. Gleich dom Register
351 hat das Register 357 ein Beobachtungsfenster, das im wesentlichen die gesamte Speicherkapazität des Registers 357 umfaßt.
Jede 10 msec, erfaßt ein Maximum-Detektor 359 den Peak-Wert des" ersten-Entscheidungsfunktionssignals, das innerhalb
des Beobachtungsfensters des Registers 357 gespeichert ist. Jede
609884/0999
Peak-Erste-Entscheidungsfunktlon des Maximum-Detektors 359 wird
in einem Kombinierer-Kreis J>6± mit einem zugeordneten Masken-3-Korrelations-Datensignal
d-, auf summiert, zwecks Erzeugung eines zweiten Entscheidungs-Punktionssignals für die Masken 1,
2 und 3» Jede 10 msec, wird eine neue zweite Entscheidungsfunktion erzeugt*
2 und 3» Jede 10 msec, wird eine neue zweite Entscheidungsfunktion erzeugt*
Die nacheinander erzeugten zweiten Entscheidungs-Punktionssignale des Kombinierers 361 werden mittels zugeordneter Fenster-3-Signale
in ein Puffer-Register 363 eingetaktet. Gldch den Registern
351 und 357 hat das Puffer-Register 363 Beobachtungsfenster,
das im wesentlichen die gesamte Speicherkapazität des Registers 363 ausmacht. Es ist daher ersichtlich, daß, obgleich die Register 351, 357 und 363 der Fig. 2o ähnlich zu den Registern 331, 333 und 335 der Fig. 19 sind, und hinsichtlich der Speicherkapazität wesentlich kleiner als die Register der Fig. 19 sind.
das im wesentlichen die gesamte Speicherkapazität des Registers 363 ausmacht. Es ist daher ersichtlich, daß, obgleich die Register 351, 357 und 363 der Fig. 2o ähnlich zu den Registern 331, 333 und 335 der Fig. 19 sind, und hinsichtlich der Speicherkapazität wesentlich kleiner als die Register der Fig. 19 sind.
Jede 10 msec, erfaßt ein Maximum-Detektor 365 den Peak-Wert des
zweiten Entscheidungs-Funktionssignales, das innerhalb des Beobachtungsfensters in dem Speicher 363 gespeichert ist. Jede Peak-Zweite-Entscheidungsfunktion von dem Maximum-Detektor 365 wird in einem Kombinationskreis 367 mit einem zugeordneten Masken-VierT Korrelations-Datensignal du aufsummiert, zwecks Erzeugung eines dritten Entscheidungs-Funktionsignales für die Masken 1, 2, 3
zweiten Entscheidungs-Funktionssignales, das innerhalb des Beobachtungsfensters in dem Speicher 363 gespeichert ist. Jede Peak-Zweite-Entscheidungsfunktion von dem Maximum-Detektor 365 wird in einem Kombinationskreis 367 mit einem zugeordneten Masken-VierT Korrelations-Datensignal du aufsummiert, zwecks Erzeugung eines dritten Entscheidungs-Funktionsignales für die Masken 1, 2, 3
609884/0999
und H. Da In der Fig, 20 nur ein Fall für vier Masken dargestellt
ißt, ist dieses dritte Entsheidungs-Funktionssignal das Schluß-Ertscheidungs-Funktionssignalo
Es ist daher ersichtlich, daß der Kreis nach Fig. 20 den die Entscheidung treffenden Maximaiwert
oder die Ents cheidungs funktion üüer das Zeitfenst-er zwischen
zwei benachbarte Masken piaziert und diesen Wert au der Entscheidungsfunktion
der folgenden Maske addiert, usw.. Auf diese Art und weise wird die Schluß-Entscheidungsfunktion nacheinander in
dem Schaltkreis nach Pig. 2o akkumuliert, und nicht am Ende wie in Fig. 19.
Die Schluß-Entscheidungsfunktion des Kombinierers 367 wird mit
der empirisch abgeleiteten Entscheidungsschwelle 0 in einem Schwellwertgatter 369 verglichen, zwecks Erzeugung eines Entscheidungs-Ausgangssignals
immer dann, wenn das Ansehaltsignal
des Vergleichers 321 an das Gatter 369 angelegt ist. Ein Entscheidungs-Ausgangssignal
vom Zustand binär "1" zeigt an5 daß ein vorbestimmtes Schlüsselwort erscheint, d.h. erfaßt wurdes
während ein Entscheidungs-Funktionssignai vom Zustand binär "0" das Gegenteil anzeigt. Das Entscheidungs-Ausgangssignal vom Zustand
"1" kann dazu verwendet werden, irgendeine Funktion auszuüben, so wie es in Besug auf die Fig. 19 bereits erläutert wurde.
Immer dann, wenn es gewünscht wird, daß zusätzliche Schlüsselworte
durch das System erfaßt werden sollen, dann sind ent-
609384/0999
sprechend dem vorher Gesagten für jedes zusätzliche Schlüsselwort ein zusätzlicher Kreis nach Fig. 2o bei der Realisierung
des Systems notwendig.
Da bei der Verwirklichung gemäß Fig. 20 jedes der Fenster in
den Puffer-Registern 351, 357 und 363 sich jeweils auf die folgende
benachbarte Maske und nicht, wie in Fig. 19, auf die letzte Maske besieht, besitzt die Verwirklichung gemäß Fig. 2o gegenüber
der Verwirklichung gemäß Fig. 19 verschiedene Vorteile.
Zunächst sind die Puffer-Register 351, 357 und 3o3 der Fig. 20
verhältnismäßig kurz in der Länge, da jedes Fenster im wesentlichen
die gesamte Speicherkapazität umfaßt. Anders ausgedrückt, der Schaltkreis nach Fig. 19 benötigt eine relativ große Speicherkapazität
für jedes der Register 331, 333 und 335, da jedes Fenster nur einen kleinen Teil der Speicherkapazität des zugeordneten
der Register 331, 333 und 335 verwendet. Mit anderen Worten, in Fig. 20 ist gegenüber Fig. 19 eine geringere Puffer-Speicherkapazität
notwendig, da der Speicherumfang, der in Fig.2o notwendig ist, nur der maximal zwischen zwei benachbarten Masken
auftretenden Zeit entspricht, und nicht der maximalen Zeit zwischen der ersten und der letzten Maske nach Fig« 19. Daher ist für den
Schaltkreis nach Fig. 2o ein geringerer Betrag an hardware im Vergleich zu der Fig, 19 notwendig.
609884/0999
Zum Zweiten sind die Fenster der Register in Fig. 2o jeweils von derselben Länge und schmaler als diejenigen der Register der
Fig. 19» In B1Ig. 19 müssen die Fenster länger und langer gemacht
werden, da sie immer weiter von der letzten Maske entfernt liegen. Wie in Fig. 19 gezeigt, erfordert das Register 331 ein
längeres Fenster als das Register·333, das seinerseits ein längeres
Fenster als das Register 335 erfordert. Bas ist bedingt durch die Tatsache, daß die Veränderungen in dem zeitlichen Auftreten umso größer sind, je größer der zeitliche Abstand eines
Fensters von den Korrelationsdaten der letzten Maske ist. In Fig. 2o wird die Variation innerhalb eines Wortes gemessen, wogegen
in Fig. 19 die Variation quer über das Wort gemessen wird.
Die Variation der Maske 1 in Bezug auf die Maske 2 ist viel weniger als die Variation von Maske 1 in Bezug auf die letzte
Maske4 Dadurch ist der Schaltkreis nach Fig. 2o für denseiben
Bereich von Worten wie der Schaltkreis nach Fig. 19 empfänglich, jedoch mit viel schmaleren Fenstern.
Zum Dritten ist anzumerken, daß der Schaltkreis nach Fig. 2o genauer als derjenige nach Fig. 19 ist, weil die Fenster in Fig.2o
schmaler als diejenigen in Fig. 19 sind. Die Fenäer in Fig.
müssen langer sein, damit sie die geforderte Information aufnehmen
können. Je breiter jedoch ein Fenster ist, umso mehr Werte sind in ihm gespeichert. Daher ist die Chance, eine falsche
609884/0999
Schlüsselwort-Erfassung zu erhalten, indem der falsche Wert aufgenommen
wird, größer. Umgekehrt, wenn ein schmaleres Fenster gemäß Fig* 2o verwendet wird, ist die Beschreibung der zeitlichen
Zusammenhänge in den Schlüsselwort-Äußerungen genauer, d.h. die Wahrscheinlichkeit einer Fehlbetätigung wird reduziert.
Die Erfindung bezieht sich somit auf ein System zum asynchronen Erfassen von einem oder mehreren Schlüsselworten in einer kontinuierlichen
Sprachinformation, wobei das Eingangs-Sprachsignal mittels eines Sprach-Prozessors in eine Vielzahl von analogen
Sprach-Parameter verwendelt wird, die Sprach-Parameter selektiv mittels eines STV-Generators in digitalisierte Sprach-Abtastwerte
oderSTVs-Werte umgewandelt werden, folgen der digitalisierten
Sprachabtastwerte kontinuierlich in einem asynchronen Korrelationskreis mit Unterelementen von einem oder mehrerer Schlüsselworte
korreliert werden, um Korrelationsdaten zu erzeugen, wobei diese Korrelationsdaten selektiv einen Entscheidungs-Funktionsschaltkreis
befähigen, für jedes vorbestimmte Schlüsselwort, das erfaßt worden ist, ein vorbestimmtes Entscheidungs-Ausgangssignal
zu erzeugen.
Es sei betont, daß im Vorstehenden Ausführungsbeispiele beschrieben
worden sind, und daß viele Veränderungen gemacht werden kön-
609884/0999
nen, ohne daß das Wesen der Erfindung verlassen wird* Beispielsweise
kann das System nach Fig. 1 mit verschiedenen logischen Schaltkreisen und Zeitsignalen verwirklicht werden, es kann mit
seriellen Daten anstelle von parallelen Daten oder umgekehrt arbeiten, und es kann, wie im Vorstehenden bereits angedeutet,
sowohl bei der begrenzten, als auch bei der unbegrenzten Schlüsselworte/rfassung mit einer vorbestimmten Anzahl von Masken
arbeiten.
609884/0999
Claims (1)
- PatentansprücheIy System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, gekennzei chnet durch :einen Prozessor, der auf ein kontinuierliches Sprachsignal anspricht und von ihm kontinuierlich eine Vielzahl von Sprach· Parameter erzeugt, eine Generatoranordnung, die auf die Vielzahl der Sprach-Parameter anspricht, um periodisch digitalisierte Sprach-Abtastwerte davon zu erzeugen, eine Korreiationsanordnung, die auf eine vorbestimmte Folge der digitalisierten Sprach-Abtastwerte anspricht und eine Vielzahl von Korrelations-Datensignalen erzeugt und eine Ent seht;! dungs· Anordnung für jedes gewünschte Schlüsselwort, das jeweils auf zugeordnete der Korrelationsdatensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungsausgangssignals immer dann, vienn ein zugeordnetes Schlüsselwort erfaßt worden ist.2. System nach Anspruch !,dadurch gekennzeichnet, daß der Prozessor einmal Eingangsmittel zum Aufteilen des kontinuierlichen Sprachsignals in eine Vielzahl von vorbestimmten Prequenzkomponenten und zum anderen Parameter-Mittel enthält, die auf die Vielzahl der vorgewählten Frequenzkomponenten ansprechen und eine Vielzahl von Sprach-Parameter erzeugen.609884/09993. System nach Anspruch 2,dadurch gekennzeichnet, daß die Parameter-Mittel zunächst erste Mittel enthalten, die auf die Vielzahl der vorgewählten Frequenzkomponenten ansprechen und eine Vielzahl von zugeordneten angezeigten Signalen erzeugen, und die zum anderen zweite Mittel besitzen, die auf die Vielzahl der zugeordneten angezeigten Signale ansprechen, um eine Vielzahl von Sprachparameter zu erzeugen»4. System nach Anspruch 2, d a d u r c h gekennzeichnet, daß die Generator-Anordnung zunächst Mittel enthält, die auf die Vielzahl der Sprachparameter ansprechen, um Zeitmultiplex-Sprachparameter zu erzeugen, und die weiterhin Umwandlungsmittel aufweisen, die digitalisierte Sprach-Abtastwerte als Antwort auf die Zeitmultiplex-Sprachparameter erzeugen«5. System nach Anspruch 4,dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Pblgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes, zweite Speichermittel, zum Speichern vorbestimmter digitalisierter Informationseinheiten, die jeweils Unterelementen609884/0999von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriübszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist«System nach Anspruch 5, d.a durch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermittel zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine vorbestimmte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fanster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu «.erzeugen,6Ü9884/0999ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signals der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion und ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entseheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.7. System nach Anspruch '!,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln .zum Speichern entsprechender Polgen von vorbestimmten der» Korrelations-Datensignale, wo- · bei jedes Speichermittel ein zugeordnetes Fenster- besitzt, das eine vorbestimmte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Erzeugung des Spitzenwertes der Signale innerhalb dieser Fenster,6Ü9884/0999ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.8. System nach Anspruch ^,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: Eine vorbestimmte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Sgnaleinheit ein Speicherkreis zum Speichern einer Folge von Signalen enthält, und dieser Speicherkreis ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicherkapazität des Speichers umfaßt, und der ferner einen Maximum-Detektor aufweist, der mit diesem Fenster des Speicherkreises verbunden ist zwecks Erfassen des Spitzenwertes der in dem Fenster gespeicherten Signale und der einen Kombinierer aufweist, zwecks Erzeugung eines Summsn-Auagangssignales, dadurch, daß der Spitzenwert dieses609884/0999Maximum-Detektors mit einem vorbestimmten der Korrelations-Datensignale aufsummiert wird, unddaß die Entscheidungsmittel ein Sehwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, wie eine Folge von einem ersten vorausgewählten Korrelations-Datensignalspeicher, eine Folge der summierten Ausgangssignale Jedes Kombinierers der ersten N-I Kombinierer, angelegt an und gespeichert in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der summierten Ausgangs signale der N-ten Korn ünierer angelegt sind, wobei das Schwellwert-Gatter ein Anzeige-Entschei dungs-Aus.gangssignal erzeugt, imner dann, wenn die Amplitude eines summierten Ausgangssignales des N-ten Kombinierers ein Entscheidungs-Schwellvrertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssipjnales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit diesen Entscheidungsmitteln verbunden ist.9. System nach Anspruch 8, dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,-/-809884/0999zweite Speichermittel zum Speiehern vorausgewahlter digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren Jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherte Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.10« System nach Anspruch 2, dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes, zweite Speichermittel zum Speichern vorausgevrählter digitalisierter Informationseinheiten, die jeweils Unterelementen609884/0999von mindestens einemvorausgewähllim Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zv/ecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherte Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastv/erten ist.11, System nach Anspruch 10, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermittel zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das einevorausgewählte Folg^von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb de.r Fenster die Spitzenwerte der Signale zu erzeugen,609884/0999 ~f~ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entseheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheldungöriiit^el zugeordnet ist, ist.12. System nach Anspruch 10t dadurch gekennzeichnet, daft die Entscheidungsmittel enthalten: eine vcTciisgevjätirte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufv:eist, das im wesentlichen die gesamte Signalspeicher—Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem vorausgewäüten der Korrelations-Datensignale, und609884/0999daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorausgezahlten Korrelations-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das S-chwellwer-t-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet s wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Einfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist»13. System nach Anspruch 2, dadurch gekennzeichnet, daß die Enfcscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine vorausgezahlte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,609884/0999eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignals kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet 1st, ist.System nach Anspruch 2, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: einevorausgewäMfc Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes609884/09997613258der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignals durch Kombination des Spitzenwertes des Maximum-Detektors mit einem vorausgezahlten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorausgezahlten KorrcO.ationc-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten K-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signalejnheiten, und an das eine Folge der Ausgangssignale der IT-ten Kombinierer angelegt ist, wobei das Scnwellv/ert-Gatter ein Anzeige-Eritschoidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.15. System nach Anspruch 1, dadurch gekennzeichnet, daß die Generator-Anordnung zunächst Mittel enthält, die auf die Vielzahl der analogen Sprachpararaeter ansprechen, Ur1: Zeitmultiplex analoge Sprachparameter zu er-■ ■, -; qzeugen, und die weiterhin Umwandlungsmittel aufweisen, die digitalisierte Sprach-Abtastwerte als Antwort auf die Zeitmultiplex analogen Sprachparameter erzeugen.l6« System nach Anspruch 15,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korreltations-Datensignale, wobei jedes Speicherniittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Erzeugung des Spitzenwertes der Signale innerhalb dieser Fenster,ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-609884/0999- 99 -Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheigungs51.Lt te In verbunden ist.17. System nach Anspruch 15, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, viobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentliehen die gesamte Signalspeicher,Kapazität umfaßt,einen Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spxtzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinlerer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsraittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelations-Datensignalen speichert, eine Folge von Ausgangs Signalen der Kombinierer in den ersten N- 1 Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Aus-609884/0999gangssignale der N-ten der Kombinierer angelegt int, wobei das Schwellwert-Gatter ein Anzeige-Entscheldungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs.Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.18. System nach Anspruch 15, d a d u r c h gekennzeichnet, daß die Korrelationsinittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten ßetriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,zweite Speichermittel, zum Speichern ausgewählten digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprpch-Abi'.pstwerten zwecks Erzeugung eines korrcs-pondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.19. System nach Anspruch 18,dadurch gekennzeichnet,-daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von ausgewählten der Korrelations-Datensignale, wobei jedes Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Entwicklung des Spitzenwert-Signals innerhalb dieser Fenster,ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der609884/0999Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.2o. System nach Anspruch 18, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von ih Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignaler. durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorbestimmten Korreltions-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die ange-609884/0999- tee -legt und gespeichert sind in dem Speicherkreis der fegenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignals der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entseheidungs· Ausgangssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.21. System nach Anspruch !,dadurch geken nzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,zweite Speichermittel, zum Speichern ausgewählter digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem ausgewählten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entprechenden Folge von digitali-609884/0999sierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.22, System nach Anspruch 21,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Polgen von ausgewählten, der Korrelations- Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations- Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermitteln verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maxlmum-De-tektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion und609884/0999ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs· Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist,23· System nach Anspruch 21,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelations-Datensignalen speichert, eine Folge von Aus--/-609884/0999j rsgangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind In dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungs m _ittcln verbunden ist.24. System nach Anspruch !,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln, zum Speichern entsprechender Polgen von ausgewählten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermitteln verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,609884/0999ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung dLnev Schluß-Entscheidungsfunktion undein SchweUwert-Gatter zum Erzeugen eines AnzeigerEntscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion an Ent sehe i dungs-S chwe Uwe rtsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangs signale fs kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.25. System nach Anspruch 1, dadurch gekennzeichnet, daß die Entschexdungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentliehen die gesamte Signalspeicher-Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelati-ons-Datensignale, und609884/0999daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelatbns-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt .ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.26. System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, dadurch gekennzeichnet, daß das System enthält:Eingangsmittel zum Zerlegen eines kontinuierlichen Eingangs-Sprachsignales in eine Vielzahl von Frequenz-Komponenten, Parameter-Mittel zum Erzeugen einer Vielzahl von analogen Sprechparametern in Antwort auf die Vielzahl der Frequenzkomponenten,609884/0999Generator-Mittel zum periodischen Erzeugen digitalisierter Sprach-Abtastwerte der Vielzahl der analogen Sprach-Parame.ter, erste Speichermittel zum Speichern von Polgen der periodisch erzeugten digitalisierten Sprach-Abtastwerte, zweite Speichermittel zum Speichern vorgewählter digitalisierter Informations-Einheiten, die repräsentativ sind für Unterelemente von mindestens einem ausgewählten Schlüsselwort >Mittel zum Korrelieren jeder der gespeicherten Informationseinheiten mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten während eines Lese-Betriebszustandes zur Erzeugung eines entsprechenden Korrelat!ons-Datensignals für jede gespeicherte Informations-Einheit, und ein Entscheidungsmittel für jedes gewünschte Schlüsselwort, wobei jedes Entscheidungsmittel auf das zugeordnete der Korrelations-Datensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungsausgangssignales, immer dann, wenn das zugeordnete Schlüsselwort erfaßt worden ist.27. System nach Anspruch 26, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster609884/0999besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen,die mit diesen Speichermitteln verbunden sind, umfaßt,eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittelnverbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, undein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungs funkt ion ein Ents chei dungs -Schwel lv/ertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.28. System nach Anspruch 26, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte—/ — 609884/0999Signalspeicher-Kapazität umfaßt,einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählte der Korrelations-Datensignale,, und daß die Entscheidungsmittel weiterhin ein Schwel.lwert<-Gatter aufweisen, an das die erste der in Reihe geschalteten Sig-naleinheiten, die eine Folge von ersten ausgewählte Korrelations-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinieser, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge von Ausgangssignalen der N-ten der Kombinierer· angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.609884/099929» System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, dadurch gekennzeichnet, daß das System enthält:erste Mittel, die auf das kontinuierliche Sprachsignal ansprechen und periodisch von ihm eine Vielzahl von digitalisierten Sprachparametern erzeugen,Korrelations-Mittel, die auf vorbestimmte Polgen der digitalisierten Sprach-Abtastwerte ansprechen und eine Vielzahl von Korrelations-Datensignalen erzeugen, und ein Entscheidungs-Mittel für jedes gewünschte Schlüsselwort, wobei jedes Entscheidungsmittel auf entsprechende der Korrelations-Datensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn das zugeordnete Schlüsselwort erfaßt worden ist.609884/0999
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US56456475A | 1975-04-02 | 1975-04-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2613258A1 true DE2613258A1 (de) | 1976-10-21 |
DE2613258C2 DE2613258C2 (de) | 1987-04-30 |
Family
ID=24254975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2613258A Expired DE2613258C2 (de) | 1975-04-02 | 1976-03-27 | Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache |
Country Status (7)
Country | Link |
---|---|
US (1) | US4081607A (de) |
JP (1) | JPS51117802A (de) |
BR (1) | BR7600292A (de) |
CA (1) | CA1056504A (de) |
DE (1) | DE2613258C2 (de) |
FR (1) | FR2306481A1 (de) |
GB (1) | GB1508741A (de) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4227176A (en) * | 1978-04-27 | 1980-10-07 | Dialog Systems, Inc. | Continuous speech recognition method |
US4771401A (en) * | 1983-02-18 | 1988-09-13 | Houghton Mifflin Company | Apparatus and method for linguistic expression processing |
US4674066A (en) * | 1983-02-18 | 1987-06-16 | Houghton Mifflin Company | Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words |
JPS6057475A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | パタ−ン認識方式 |
JPS60249194A (ja) * | 1984-05-25 | 1985-12-09 | 株式会社日立製作所 | 会話型音声入出力方式 |
US5218668A (en) * | 1984-09-28 | 1993-06-08 | Itt Corporation | Keyword recognition system and method using template concantenation model |
US4783758A (en) * | 1985-02-05 | 1988-11-08 | Houghton Mifflin Company | Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words |
GB8613327D0 (en) * | 1986-06-02 | 1986-07-09 | British Telecomm | Speech processor |
US5765131A (en) * | 1986-10-03 | 1998-06-09 | British Telecommunications Public Limited Company | Language translation system and method |
US4896358A (en) * | 1987-03-17 | 1990-01-23 | Itt Corporation | Method and apparatus of rejecting false hypotheses in automatic speech recognizer systems |
GB2207783B (en) * | 1987-08-07 | 1991-05-22 | Casio Computer Co Ltd | Recording/reproducing apparatus with voice recognition function |
US4980917A (en) * | 1987-11-18 | 1990-12-25 | Emerson & Stern Associates, Inc. | Method and apparatus for determining articulatory parameters from speech data |
US5231671A (en) * | 1991-06-21 | 1993-07-27 | Ivl Technologies, Ltd. | Method and apparatus for generating vocal harmonies |
US5428708A (en) * | 1991-06-21 | 1995-06-27 | Ivl Technologies Ltd. | Musical entertainment system |
US6046395A (en) * | 1995-01-18 | 2000-04-04 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6094476A (en) * | 1997-03-24 | 2000-07-25 | Octel Communications Corporation | Speech-responsive voice messaging system and method |
US6336092B1 (en) | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
US6490561B1 (en) * | 1997-06-25 | 2002-12-03 | Dennis L. Wilson | Continuous speech voice transcription |
FI973093L (fi) * | 1997-07-23 | 1999-01-24 | Nokia Mobile Phones Ltd | Menetelmä telepalvelun ohjaamiseksi ja päätelaite |
US6871180B1 (en) * | 1999-05-25 | 2005-03-22 | Arbitron Inc. | Decoding of information in audio signals |
US6876991B1 (en) | 1999-11-08 | 2005-04-05 | Collaborative Decision Platforms, Llc. | System, method and computer program product for a collaborative decision platform |
US6711558B1 (en) | 2000-04-07 | 2004-03-23 | Washington University | Associative database scanning and information retrieval |
US8095508B2 (en) * | 2000-04-07 | 2012-01-10 | Washington University | Intelligent data storage and processing using FPGA devices |
US7139743B2 (en) * | 2000-04-07 | 2006-11-21 | Washington University | Associative database scanning and information retrieval using FPGA devices |
US7716330B2 (en) | 2001-10-19 | 2010-05-11 | Global Velocity, Inc. | System and method for controlling transmission of data packets over an information network |
US20090161568A1 (en) * | 2007-12-21 | 2009-06-25 | Charles Kastner | TCP data reassembly |
US20090106251A1 (en) * | 2001-10-24 | 2009-04-23 | Harris Scott C | Web based communication of information with reconfigurable format |
US7711844B2 (en) * | 2002-08-15 | 2010-05-04 | Washington University Of St. Louis | TCP-splitter: reliable packet monitoring methods and apparatus for high speed networks |
US10572824B2 (en) | 2003-05-23 | 2020-02-25 | Ip Reservoir, Llc | System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines |
JP2006526227A (ja) | 2003-05-23 | 2006-11-16 | ワシントン ユニヴァーシティー | Fpgaデバイスを使用するインテリジェントデータ記憶および処理 |
US7602785B2 (en) | 2004-02-09 | 2009-10-13 | Washington University | Method and system for performing longest prefix matching for network address lookup using bloom filters |
US8670428B2 (en) * | 2004-03-18 | 2014-03-11 | Qualcomm Incorporated | Signal acquisition in peer-to-peer communications |
US7672845B2 (en) * | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
CA2577891A1 (en) * | 2004-08-24 | 2006-03-02 | Washington University | Methods and systems for content detection in a reconfigurable hardware |
JP2008532177A (ja) | 2005-03-03 | 2008-08-14 | ワシントン ユニヴァーシティー | 生物学的配列類似検索を実行するための方法および装置 |
US7702629B2 (en) * | 2005-12-02 | 2010-04-20 | Exegy Incorporated | Method and device for high performance regular expression pattern matching |
US7954114B2 (en) | 2006-01-26 | 2011-05-31 | Exegy Incorporated | Firmware socket module for FPGA-based pipeline processing |
US7636703B2 (en) * | 2006-05-02 | 2009-12-22 | Exegy Incorporated | Method and apparatus for approximate pattern matching |
US7921046B2 (en) | 2006-06-19 | 2011-04-05 | Exegy Incorporated | High speed processing of financial information using FPGA devices |
US7840482B2 (en) * | 2006-06-19 | 2010-11-23 | Exegy Incorporated | Method and system for high speed options pricing |
JP5705395B2 (ja) * | 2006-07-21 | 2015-04-22 | テクトロニクス・インターナショナル・セールス・ゲーエムベーハー | 信号分析装置 |
WO2008022036A2 (en) * | 2006-08-10 | 2008-02-21 | Washington University | Method and apparatus for protein sequence alignment using fpga devices |
US8326819B2 (en) | 2006-11-13 | 2012-12-04 | Exegy Incorporated | Method and system for high performance data metatagging and data indexing using coprocessors |
US7660793B2 (en) | 2006-11-13 | 2010-02-09 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
US8374986B2 (en) | 2008-05-15 | 2013-02-12 | Exegy Incorporated | Method and system for accelerated stream processing |
US8036891B2 (en) * | 2008-06-26 | 2011-10-11 | California State University, Fresno | Methods of identification using voice sound analysis |
CA3184014A1 (en) | 2008-12-15 | 2010-07-08 | Exegy Incorporated | Method and apparatus for high-speed processing of financial market depth data |
JP6045505B2 (ja) | 2010-12-09 | 2016-12-14 | アイピー レザボア, エルエルシー.IP Reservoir, LLC. | 金融市場における注文を管理する方法および装置 |
TWI406266B (zh) | 2011-06-03 | 2013-08-21 | Univ Nat Chiao Tung | 語音辨識裝置及其辨識方法 |
US9990393B2 (en) | 2012-03-27 | 2018-06-05 | Ip Reservoir, Llc | Intelligent feed switch |
US11436672B2 (en) | 2012-03-27 | 2022-09-06 | Exegy Incorporated | Intelligent switch for processing financial market data |
US10650452B2 (en) | 2012-03-27 | 2020-05-12 | Ip Reservoir, Llc | Offload processing of data packets |
US10121196B2 (en) | 2012-03-27 | 2018-11-06 | Ip Reservoir, Llc | Offload processing of data packets containing financial market data |
US9336302B1 (en) | 2012-07-20 | 2016-05-10 | Zuci Realty Llc | Insight and algorithmic clustering for automated synthesis |
US10102260B2 (en) | 2012-10-23 | 2018-10-16 | Ip Reservoir, Llc | Method and apparatus for accelerated data translation using record layout detection |
US9633093B2 (en) | 2012-10-23 | 2017-04-25 | Ip Reservoir, Llc | Method and apparatus for accelerated format translation of data in a delimited data format |
US10146845B2 (en) | 2012-10-23 | 2018-12-04 | Ip Reservoir, Llc | Method and apparatus for accelerated format translation of data in a delimited data format |
WO2015164639A1 (en) | 2014-04-23 | 2015-10-29 | Ip Reservoir, Llc | Method and apparatus for accelerated data translation |
US10942943B2 (en) | 2015-10-29 | 2021-03-09 | Ip Reservoir, Llc | Dynamic field data translation to support high performance stream data processing |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
WO2018119035A1 (en) | 2016-12-22 | 2018-06-28 | Ip Reservoir, Llc | Pipelines for hardware-accelerated machine learning |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN109447886B (zh) * | 2018-10-08 | 2023-04-11 | 陕西师范大学 | 结合emd-21嵌入的带恢复多载体密图分存方法 |
US10629226B1 (en) * | 2018-10-29 | 2020-04-21 | Bestechnic (Shanghai) Co., Ltd. | Acoustic signal processing with voice activity detector having processor in an idle state |
CN112735469B (zh) * | 2020-10-28 | 2024-05-17 | 西安电子科技大学 | 低内存语音关键词检测方法、系统、介质、设备及终端 |
CN113269305B (zh) * | 2021-05-20 | 2024-05-03 | 郑州铁路职业技术学院 | 一种加强记忆的反馈语音强化方法 |
CN114817456B (zh) * | 2022-03-10 | 2023-09-05 | 马上消费金融股份有限公司 | 关键词检测方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2326517A1 (de) * | 1972-05-26 | 1973-12-06 | Ibm | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1172244A (en) * | 1966-03-16 | 1969-11-26 | Emi Ltd | Improvements relating to Voice Operated Apparatus |
FR2074813A1 (de) * | 1970-01-30 | 1971-10-08 | Lannionnais Electronique | |
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
JPS5419722B2 (de) * | 1971-09-23 | 1979-07-17 | ||
US3883850A (en) * | 1972-06-19 | 1975-05-13 | Threshold Tech | Programmable word recognition apparatus |
GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
-
1975
- 1975-11-28 CA CA240,708A patent/CA1056504A/en not_active Expired
-
1976
- 1976-01-08 GB GB675/76A patent/GB1508741A/en not_active Expired
- 1976-01-19 BR BR7600292A patent/BR7600292A/pt unknown
- 1976-02-02 FR FR7602831*[A patent/FR2306481A1/fr active Granted
- 1976-02-26 JP JP51021745A patent/JPS51117802A/ja active Granted
- 1976-03-27 DE DE2613258A patent/DE2613258C2/de not_active Expired
- 1976-11-01 US US05/737,809 patent/US4081607A/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2326517A1 (de) * | 1972-05-26 | 1973-12-06 | Ibm | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern |
Also Published As
Publication number | Publication date |
---|---|
FR2306481A1 (fr) | 1976-10-29 |
FR2306481B1 (de) | 1981-12-18 |
JPS5721720B2 (de) | 1982-05-08 |
GB1508741A (en) | 1978-04-26 |
AU8730675A (en) | 1977-06-09 |
US4081607A (en) | 1978-03-28 |
CA1056504A (en) | 1979-06-12 |
DE2613258C2 (de) | 1987-04-30 |
BR7600292A (pt) | 1976-10-05 |
JPS51117802A (en) | 1976-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2613258A1 (de) | System zur automatischen spracherkennung | |
DE2918533C2 (de) | ||
DE2934489C2 (de) | ||
DE3236834C2 (de) | Verfahren und Gerät zur Sprachanalyse | |
DE3236832C2 (de) | Verfahren und Gerät zur Sprachanalyse | |
DE3339288C2 (de) | ||
DE3510660C2 (de) | ||
DE3337353C2 (de) | Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells | |
DE2953262C2 (de) | ||
DE60018886T2 (de) | Adaptive Wavelet-Extraktion für die Spracherkennung | |
DE2820645A1 (de) | Vorrichtung und verfahren zur spracherkennung | |
DE69321656T2 (de) | Verfahren zur Spracherkennung | |
DE3236885A1 (de) | Verfahren und geraet zur sprachanalyse | |
DE2659083C2 (de) | Verfahren und Vorrichtung zur Sprechererkennung | |
DE2240557A1 (de) | Spracherkennungsvorrichtung zum steuern von maschinen | |
DE2825186A1 (de) | Verfahren zur verringerung der falschanzeige in spracherkennungsverfahren fuer kontinuierliche sprachsignale | |
DE19942178C1 (de) | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung | |
DE2524804A1 (de) | Verfahren und vorrichtung zur automatischen spracherkennung | |
DE2825110A1 (de) | Verfahren zur erkennung kontinuierlicher sprachsignale | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
DE4031638C2 (de) | ||
DE112018007846T5 (de) | Gesprochene-sprache-separationseinrichtung, gesprochene-sprache-separationsverfahren, gesprochene-sprache separationsprogramm und gesprochene-sprache-separationssystem | |
DE3149134C2 (de) | Verfahren und Vorrichtung zur Bstimmung von Endpunkten eines Sprachausdrucks | |
DE2752607A1 (de) | Verfahren zur erkennung von sprache | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OI | Miscellaneous see part 1 | ||
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10L 1/00 |
|
8128 | New person/name/address of the agent |
Representative=s name: GOERTZ, H., DIPL.-ING. FUCHS, J., DR.-ING. DIPL.-I |
|
8125 | Change of the main classification |
Ipc: G10L 9/08 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition |