[go: up one dir, main page]

DE3211313C2 - - Google Patents

Info

Publication number
DE3211313C2
DE3211313C2 DE3211313A DE3211313A DE3211313C2 DE 3211313 C2 DE3211313 C2 DE 3211313C2 DE 3211313 A DE3211313 A DE 3211313A DE 3211313 A DE3211313 A DE 3211313A DE 3211313 C2 DE3211313 C2 DE 3211313C2
Authority
DE
Germany
Prior art keywords
signal
frame
reference word
signals
speech pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE3211313A
Other languages
English (en)
Other versions
DE3211313A1 (de
Inventor
Cory Scott Brookline Mass. Us Myers
Frank Christopher Madison N.J. Us Pirz
Lawrence Richard Berkeley Heights N.J. Us Rabiner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Publication of DE3211313A1 publication Critical patent/DE3211313A1/de
Application granted granted Critical
Publication of DE3211313C2 publication Critical patent/DE3211313C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Image Analysis (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Erkennung eines Sprachmusters als Kette vorbestimmter Bezugswörter nach dem Oberbegriff des Anspruchs 1.
Bei der Nachrichtenübertragung, Datenverarbeitung und in Steuersystemen ist es häufig erwünscht, Sprache als direkte Eingabe für Anfragen, Kommandos, Daten oder andere Informationen zu benutzen. Spracherkennungsgeräte vermeiden manuell betätigte Einrichtungen und geben Personen die Möglichkeit, mit automatischen Einrichtungen in Wechselwirkung zu treten, während sie gleichzeitig andere Aktivitäten entfalten. Die Unterschiedlichkeit von Sprachmustern von Sprecher zu Sprecher und selbst für einen bestimmten Sprecher haben jedoch die Genauigkeit der Spracherkennung eingeschränkt. Als Folge davon sind Spracherkennungseinrichtungen nur unter besonderen Umgebungsbedingungen erfolgreich gewesen.
Spracherkennungssysteme sind generell in der Lage, Sprachsignale in Gruppe von vorgegebenen akustischen Merkmalen zu transformieren. Die akustischen Merkmale der Sprachsignale werden mit gespeicherten Sätzen von vorher gewonnenen akustischen Merkmalen verglichen, die Bezugswörter identifizieren. Das Sprachsignal ist identifiziert, wenn mit den gespeicherten Merkmalen einer besonderen Bezugswortfolge entsprechend vorgegebenen Erkennungskriterien übereinstimmen. Die Genauigkeit einer solchen Erkennung hängt in hohem Maße von den gewählten Merkmalen und den vorgeschriebenen Erkennungskriterien ab. Beste Ergebnisse werden erzielt, wenn die Bezugsmerkmale und die Sprachmerkmale von der gleichen Person gewonnen werden und das zu erkennende Sprachmuster mit bestimmten Pausen zwischen den einzelnen Wörtern gesprochen wird.
Die Erkennung kontinuierlicher Sprachmuster kann durch Vergleichen der Folge von Sprachmustern mit jeder möglichen Kombination von Bezugswort-Merkmalssignalmustern erfolgen, die aus der kontinuierlichen Sprache abgeleitet werden. Solche Anordnungen machen jedoch eine zeitraubende Prüfung aller möglichen Bezugswort-Kombinationen und eine umfangreiche Suche unter der großen Anzahl von Bezugswortkombinationen erforderlich. Es ist bekannt, daß die Anzahl möglicher Folgen exponentiell mit der Anzahl von Wörtern in der Folge ansteigt. Demgemäß ist es im allgemeinen unpraktisch, eine solche umfangreiche Suche selbst für eine begrenzte Anzahl von Wörtern in einem Sprachmuster durchzuführen.
Es lassen sich semantische und syntaktische Regeln ableiten, um die Anzahl von möglichen Folgen bei einer Suche einzuschränken, derart, daß bestimmte Klassen von Informationen sich leicht analysieren lassen. In der US-PS 41 56 868 ist beispielsweise eine auf einer syntaktischen Analyse beruhende Erkennungsanordnung offenbart, bei der ein Sprachmuster nur mit syntaktisch möglichen Bezugsmustern verglichen wird. Die Erkennung von Folgen gesprochener Wörter, die nicht zueinander in Beziehung stehen, beispielsweise eine Folge von gesprochenen Zahlen, läßt sich jedoch nicht verbessern, indem man solche Einschränkungen hinsichtlich des Sinnzusammenhangs einführt.
In den US-PS 40 49 913 und 40 59 725 sind Erkennungssysteme für kontinuierliche Sprache beschrieben, bei denen die Ähnlichkeit zwischen individuellen Bezugswort- Merkmalsmustern und den Merkmalen aller möglichen Intervalle der Sprachmuster berechnet werden. Aus den Ähnlichkeitswerten werden Teilerkennungsergebnisse für jedes Bezugswort-Merkmalsmuster abgeleitet. Sowohl die Teilähnlichkeitswerte als auch die Teilerkennungsergebnisse werden in einer Tabelle abgespeichert. Die Erkennungsergebnisse aus der Tabelle werden zur Lieferung der Bezugswortfolge entnommen, die dem Sprachmuster entspricht. Alle möglichen Teilmusterkombinationen aus der Tabelle, die kontinuierliche Muster bilden, werden gewählt. Die gewählten Muster, für die die Ähnlichkeit ein Maximum ist, werden dann ausgewählt. Obzwar diese Systeme sich bei der Erkennung kontinuierlicher Sprache als wirksam erwiesen haben, ist die Signalverarbeitung zur Gewinnung der Bezugsmuster und der Teilmuster-Ähnlichkeitswerte für viele Anwendungen zu kompliziert und unwirtschaftlich.
In der US-PS 43 49 700 ist eine Analysiereinrichtung für kontinuierliche Sprache offenbart, die eine Sprachäußerung als eine Folge von Bezugswörtern erkennen kann, für die akustische Merkmalssignale gespeichert sind. Abhängig von der Sprachäußerung und den akustischen Bezugswortmerkmalen wird wenigstens eine Bezugswortfolge als Kandidat für die Sprachäußerung erzeugt. Dazu werden aufeinanderfolgende Wortpositionen der Sprachäußerung definiert. In jeder Wortposition werden partielle Kandidatenfolgen erzeugt, indem Bezugswörter bestimmt werden, die Sprachäußerungsabschnitten entsprechen, und Bezugswörter, die eine vorgeschriebene Ähnlichkeit mit ihren Sprachäußerungsabschnitten haben, mit gewählten partiellen Kandidatenfolgen der vorhergehenden Wortposition kombiniert werden. Die bestimmten Sprachäußerungsabschnitte können einen vorbestimmten Bereich des Sprachäußerungsabschnittes für die Kandidatenserie der vorhergehenden Wortposition überlappen, um der Koartikulation und Unterschieden zwischen akustischen Merkmalen der Sprachäußerung und denjenigen für isoliert gesprochene Bezugswörter Rechnung zu tragen.
Die Analysiereinrichtung nach der vorgenannten US-PS 43 49 700 verringert die Signalverarbeitungskomplizierheit wesentlich, indem bestimmte Kandidaten- Teilwortserien für jedes aufeinanderfolgende Intervall der unbekannten Sprachäußerung gewählt wird. Außerdem ist die Erkennung bei Vorhandensein einer Koartikulation verbessert. Die Auswahl bestimmter Kandidaten für jede Wortposition schließt jedoch andere mögliche Bezugswortfolgen- Kandidaten aus der Überlegung aus, wenn die Erkennung über die Wortpositionen fortschreitet. Demgemäß ist die Genauigkeit der Erkennung bei längeren Sprachäußerungen begrenzt.
Der Erfindung liegt die Aufgabe zugrunde, ein verbessertes Verfahren zur Erkennung kontinuierlicher Sprachmuster bereitzustellen, das bei hoher Genauigkeit der Erkennung nur begrenzte Anforderungen an den Umfang er erforderlichen Signalverarbeitung stellt.
Zur Lösung der Aufgabe geht die Erfindung aus vom Verfahren nach dem auf der genannten US-PS 43 49 700 beruhenden Oberbegriff des Anspruchs 1.
Die Lösung ist im Kennzeichnungsteil des Anspruchs 1 angegeben.
Weiterbildungen der Erfindung sind Gegenstand der Unteransprüche.
Nachfolgend wird die Erfindung anhand der Zeichnungen beschrieben. Es zeigen:
Fig. 1 graphisch ein Erkennungsverfahren für kontinuierliche Sprache zur Erläuterung der Erfindung;
Fig. 2 und 3 ein Blockschaltbild einer Spracherkennungsschaltung zur Erläuterung der Erfindung;
Fig. 4 ein genaueres Blockschaltbild sowie eine Steuereinrichtung für die Schaltung nach Fig. 2 und 3;
Fig. 5 ein genaueres Blockschaltbild einer Rahmenfolge-Logikschaltung für die Schaltung gemäß Fig. 2 und 3;
Fig. 6 ein allgemeines Flußdiagramm zur Erläuterung des Spracherkennungsverfahrens nach der Erfindung;
Fig. 7 bis 12 genauere Flußdiagramme zur Erläuterung der Spracherkennungsanordnungen nach der Erfindung.
Bei der Erkennung kontinuierlicher Sprache, beispielsweise eines verbundenen Sprachmusters, wird eine Zeitrahmenfolge akustischer Merkmalssignale
R V =R V (1), R V (2) . . . R V (M V ) (1)
für jedes Wort eines Satzes von Bezugswörtern gespeichert. Die Merkmale lassen sich ableiten aus einer spektralen, vorhersagenden oder anderen Analyseart von Aussprachen jedes Bezugswortes R V , 1v V in bekannter Art. Eine Zeitrahmenfolge akustischer Merkmalsignale
T = T(1), T(2), . . . T(N m ) (2)
wird aus einer ähnlichen Analyse eines Sprachmusters abgeleitet. Generell werden alle möglichen Ketten von Bezugswörtern synthetisiert, und die Folge von Merkmalssignalen für jede Kette wird mit der Merkmalssignalfolge des Sprachmusters oder der Sprachäußerung verglichen. Die am besten korrespondierende Kette wird als die Sprachäußerung identifiziert. Da die Rate der Sprache stark schwankt, können bekannte Verfahren der dynamischen Programmierung verwendet werden, um die Merkmale der Bezugswortkette mit den Merkmalen der Sprachäußerung zeitlich auszurichten. Auf diese Weise wird ein verhältnismäßig genaues Maß für die Korrespondenz zwischen den Bezugswortketten und der Sprachäußerung gewonnen.
Jede Bezugswortkette ist eine Verknüpfung von Bezugswörtern
R S = R v R v ² . . . ⊕R v Lmax (3)
Die akustischen Merkmalssignale der Kette R S werden durch eine sogenannte dynamische Zeitverkettung (DTW) mit den Merkmalssignalen der Sprachäußerung verknüpft, um das minimale DTW-Abstandssignal zwischen den Bezugswortketten- Merkmalssignalen
R S = R v ¹(1), R v ¹(2), . . ., R v ¹(M v ₁), R v ²(1),
R v ²(2), . . . R v ²(M v ₂), . . . R vLmax (1),
R vLmax (2) . . ., R vLmax (M vLmax ) (4)
sowie dem Sprachmuster-Merkmalssignal
T = T (1), . . . T (2), . . . T(n), . . . T(N m) (5)
zu erzeugen.
Das kumulative, durch die zeitliche Verkettung der Kette R S mit den Sprachmuster-Merkmalssignalen T gewonnene Abstandssignal beträgt
wobei w(n) der Verkettungsfaktor zwischen den Merkmalssignalen T und R S ist und d(T(n), R S(w(n)))=d(n, w(n)) der örtliche Abstand zwischen den Merkmalssignalen des Rahmens n des Sprachmusters T und des Rahmens m=w(n) der Kette R S ist. w(n) ist üblicherweise so begrenzt, daß die Endpunkte des Sprachmusters mit den Endpunkten der Kette zusammenfallen, und die Steigerung des Verkettungsfaktors w(n) ist so gewählt, daß sie dem Bereich der erwarteten Sprachmusterrahmen entspricht. Die direkte Anwendung der dynamischen Sprachverkettung auf alle möglichen Ketten R S führt zu einem unwirtschaftlichen und zeitaufwendigen Umfang der Signalverarbeitung selbst für eine mäßige Anzahl von Bezugswörtern.
Entsprechend der Erfindung wird die dynamische Zeitverkettung in aufeinander folgende Stufen unterteilt, so daß die Signalverarbeitung wesentlich verringert ist. Die Anzahl von Ketten R S , die als Kandidaten für das Sprachmuster betrachtet werden, ist jedoch nicht beschränkt, wodurch die Erkennungsgenauigkeit nicht beeinträchtigt ist. Fig. 1 erläutert die Stufenverarbeitung. Die horizontale Achse in Fig. 1 entspricht den aufeinander folgenden Rahmen 1, 2 . . . n . . . N m des Sprachmusters. Jeder ist ein Sprachmustersegment die durch Begrenzung der akustischen Zeitausrichtung definiert sind. Die vertikale Achse ist in Stufen L=1, 2 . . . L max unterteilt, wobei L max die größte erwartete Anzahl von Wörtern in dem Sprachmuster ist. Jede Stufe auf der vertikalen Achse ist in Rahmen von Bezugswörtern unterteilt. Für jedes Bezugswort hat die Stufe L=M w Rahmen. Die Anzahl der Rahmen ist im allgemeinen verschieden für jedes Bezugswort, da die Bezugswortmuster unterschiedliche Dauer haben. Die Merkmalssignale jedes Bezugsworts R v werden zeitlich verkettet mit dem Sprachmustersegment, das bei den Anfangsrahmen der Stufe beginnt.
Für jedes Bezugswort führen die möglichen Zeitausrichtungswege zwischen dem Bezugswort und dem Mustersegment für die Stufe über Punkte (n, m) entsprechend dem Ausdruck
wobei 1 n N m die Sprachmusterrahmen sind, 1 m M w die Bezugswortrahmen für die Stufe sind und D A (n, m) das akkumulierte Abstandssignal entlang dem Weg am Punkt n, m ist. (n, m) ist der örtliche Abstand zwischen den Sprachmuster-Merkmalssignalen beim Musterrahmen n und dem Bezugswort-Merkmalssignal beim Bezugswortrahmen m. Der am weitesten rechts stehende Ausdruck in Gleichung (7) stellt den akkumulierten Abstand zum Musterrahmen n-1 und zum Bezugswort-R S -Rahmen dar, nämlich m-Ij m-I₁. Der Rahmen I₁ ist so gewählt, daß er dem zulässigen Unterschiedsbereich für die Sprachrate entspricht. Er wird üblicherweise auf 1 gesetzt, wenn w(n-1)=w(n-2) gilt und im anderen Fall auf 0. I₂ wird in typischer Weise auf 2 gesetzt. Demgemäß erstreckt sich j über den Bereich von m-2 bis m-1, wenn w(n-1)= w(n-2) und im anderen Fall über den Bereich von m-2 bis m. Dynamische Zeitverkettungsanordnungen sind genauer beschrieben in dem Aufsatz "Minimum Prediction Residual Applied to Speech Recognition" von F. Itakura, IEEE Transactions on Acoustics, Speech and Signal Processing, Band ASSP-23, S. 67-72, Februar 1975, und in einem Aufsatz "Considerations in Dynamic Time Warping Algorithms for Discrete Word Recognition" von L. R. Rabiner, A. E. Rosenberg und S. E. Levinson, IEEE Transactions on Acoustics, Speech and Signal Processing, Band ASSP-26, S. 575-582, Dezember 1978.
Der Weganfangsrahmen und der Wegendrahmen sowie der kumulative Abstand zwischen dem Bezugswort und den Sprachmustermerkmalen auf jedem Weg werden bestimmt durch das dynamische Zeitverkettungsverfahren gemäß Gleichung (7). Die Endrahmen der Stufe entsprechen den möglichen Weganfangsrahmen der nächsten Stufe. Für jeden Stufenendrahmen werden der minimale kumulative Abstand bis dahin, das dem minimalen kumulativen Abstandssignal entsprechende Bezugswort und der Stufenanfangsrahmen für den minimalen kumulativen Abstandsweg gespeichert. Nach Beendigung der Verarbeitung für die letzte Stufe wird die am dichtesten korrespondierende Folge aus den gespeicherten Abstandssignalen, den Bezugsworten, den Stufenendrahmen und den Stufenanfangsrahmen rekonstruiert.
Gemäß Fig. 1 ist das dynamische Zeitverkettungsverfahren auf den Bereich erwarteter Sprachrahmen beschränkt, um eine unnötige Verarbeitung zu vermeiden. Beispielsweise kann der Anfangsrahmen des Sprachmusters in Fig. 1 akustisch nicht dem Endrahmen eines der Bezugswörter entsprechen. Auf ähnliche Weise sind andere Bereiche in Fig. 1 akustisch nicht möglich. Folglich kann die DTW-Verarbeitung auf den Bereich akustisch wahrscheinlicher Sprachrahmen beschränkt werden, ohne an Erkennungsgenauigkeit zu verlieren. In Fig. 1 ist die DTW-Verarbeitung für eine Eingangsäußerung von 4 Wörtern beschränkt auf den durch die Linien 101, 102, 103 und 104 begrenzten Bereich. Die äußersten Punkte des zulässigen Bereichs entsprechen den Endpunkten der möglichen Bezugswortketten sowie des Sprachmusters. Das durch die Linien 101, 102, 103, 104 begrenzte Parallelogramm stellt eine 2 : 1-Beschleunigung und eine 2 : 1-Reduzierung der Sprachrate zwischen den Bezugswortketten und dem Sprachmuster dar. Diese Begrenzungslinien sind durch die Bereichsbeschränkungen gemäß Fig. 7 festgelegt. Der Bereich für die DTW-Verarbeitung gemäß Fig. 1 ist zwar für die Zwecke der vorliegenden Erfindung geeignet, es sei aber darauf hingewiesen, daß andere, bekannte Beschränkungsanordnungen in Verbindung mit der Erfindung gewählt werden können.
Fig. 1 zeigt graphisch den stufenförmigen Erkennungsprozeß für ein Sprachmuster, das aus der gesprochenen 4-Wort-Binärzahlfolge 1001 besteht. Das Flußdiagramm in Fig. 6 zeigt die Operationsfolge für die Stufenaufbauanordnung. Nach Speicherung der akustischen Merkmalssignale für jedes Bezugswort, das heißt 0 und 1, wird die im Kästchen 601 angegebene Analyse des Sprachmusters durchgeführt. Bei der Analyse wird die dem Sprachmuster entsprechende Folge von akustischen Merkmalen erzeugt. Die Wortstufe wird dann zu Anfang auf die Stufe L=0 (Kästchen 603) gesetzt, für die ein einzelner Musterbeginnrahmen N=1 vorhanden ist.
Die Verarbeitung der ersten Stufe wird durch Einleitung der Einspeicherung für das Abstandssignal und der Anfangsrahmensignale der Stufe L+1=1 entsprechend dem Kästchen 605 begonnen. Die erste Stufe in Fig. 1 erstreckt sich von der Abszisse 150 zur Linie 160. Die Linien entsprechen dem Anfangs- und Endrahmen der Bezugswörter auf der Stufe L=1. Das Ende der Stufe L=0 entsprechend der Abszisse 150 wird abgetastet (Kästchen 607), um den ersten Anfangsrahmen festzustellen. Nach Feststellung des Anfangsrahmens n=1 bei der Abtastung wird entsprechend der Operation im Kästchen 607 die dynamische Zeitverkettung der Sprachmustermerkmale mit den Bezugswortmerkmalen für die Stufe L+1=1 begonnen.
Bei dem zeitlichen Verkettungsverfahrensschritt werden zuerst die Merkmalssignale des Bezugswortes "Null" vom Bezugswortrahmen m=1 zum Rahmen M dynamisch zeitverkettet mit den Sprachmuster-Merkmalssignalen, und zwar beginnend beim Musterrahmen n=1. Auf diese Weise werden die zulässigen Wege in dem durch die Linien 101, 104, und 160 begrenzten Bereich, der das Sprachmustersegment für die erste Stufe darstellt, erzeugt. Die Wege 110-1 und 110-2 mit den Endpunkten nk werden entsprechend der Darstellung in Fig. 1 bestimmt. Die Endpunkte für diese Wege sowie die Korrespondenzen für den kumulativen Abstand entlang dieser Wege und das Bezugswort-Identifiziersignal "Null" werden gespeichert. Wege, die am Endpunkt n enden, können ebenfalls für das Bezugswort "Null" festgestellt werden. Diese Wege haben jedoch kumulative Abstände, die größer sind als diejenigen, welche später für das Bezugswort "Eins" bestimmt werden.
Anschließend werden die Merkmalssignale des Bezugswortes "Eins" von den Rahmen m=1 bis M=M dynamisch zeitverkettet mit den Sprachmuster-Merkmalssignalen, beginnend beim Musterrahmen n=1. Entsprechend der Darstellung in Fig. 1 werden Wege 110-3, 110-4, 110-5 und 110-6 für das Bezugswort 1 erzeugt. Die Endpunkte nkk und n dieser Wege werden zusammen mit den kumulativen Wegabständen und dem Bezugswort-Identifizierungssignal "Eins" gespeichert. Für das Bezugswort "Eins" können auch Wege mit den Endpunkten n und n gewonnen worden sein. Es ist jedoch nur der Weg zu einem Endpunkt mit dem minimalen kumulativen Abstand in Fig. 1 dargestellt. Wenn ein Weg für das Bezugswort "Null" und ein Weg für das Bezugswort "Eins" am gleichen Endpunkt zusammenlaufen, wird der Weg mit dem kleineren kumulativen Abstand gewählt. Demgemäß werden nur Wege des Bezugswortes "Null", die an den Punkten n und n enden, zurückbehalten, während nur Wege für das Bezugswort "Eins", die an den Punkten n bis n enden, festgehalten bleiben. Auf diese Weise werden alle möglichen Kombinationen von Bezugswort-Merkmalssignalen für das Sprachmuster ausgewertet. Am Ende der dynamischen Zeitverkettung für die Stufe L+1=1 wird die Stufe L verglichen mit der maximalen Stufe L max =4, wie in dem Entscheidungskästchen 611 gezeigt ist. Als Ergenis des Vergleichs wird die Stufe von L=0 auf L=1 weitergeschaltet. Dann tritt man erneut über das Entscheidungskästchen 611 in das Kästchen 605 ein, so daß die Abstands- und Anfangsrahmenspeicherung für die Stufe L+1=2 eingeleitet wird. Die Abtastung nach dem ersten Anfangsrahmen der Stufe L=1 entsprechend dem Kästchen 607 führt zur Feststellung des Rahmens n als Anfangsrahmen für die dynamische Zeitverkettung der Stufe L+1=2.
Bei der DTW-Verarbeitung der zweiten Stufe (Kästchen 609) liegt die Folge von Bezugswort-Merkmalssignalrahmen zwischen den Linien 160 und 170. Es sind nur DTW-Verarbeitungswege in demjenigen Bereich zugelassen, der durch die Segmentlinien 160, 101, 170, 103 und 104 begrenzt ist. Die Anfangsrahmen für die Verarbeitung auf der zweiten Stufe entsprechen den Endrahmen der Wege für die erste Stufe, um die Kontinuität aufrecht zu erhalten. Die Merkmalssignale für das Bezugswort "Null", beginnend auf der Linie 160, werden dynamisch verkettet mit den Merkmalssignalen des Sprachmusters, beginnend beim Rahmen n. Wie in Fig. 1 dargestellt, werden unter anderem die DTW-Wege 120-5, 120-7, 120-8, 120-9 und 120-10 erzeugt. Die Endpunkte nk, nk und n für diese Wege werden zusammen mit den kumulativen Abständen vom Anfangspunkt des Sprachmusters zu diesen Endpunkten sowie dem Null-Bezugswort-Identifizierungssignal und den Anfangsrahmen der zweiten Stufe (L+1=2) für die bestimmten Wege gespeichert.
Die Merkmalssignale für das Bezugswort "Eins" zwischen den Linien 160 und 170 werden dann zeitlich verkettet mit den Sprachmuster-Merkmalssignalen, beginnend beim Rahmen n, um die Wege der zweiten Stufe für das Bezugswort "Eins" zu bestimmen. Unter anderem werden die Wege 120-1, 120-2, 120-3, 120-4 und 120-6 gebildet. Für die Endpunkte nkkk und n werden die kumulativen Abstände vom Anfangsrahmen des Sprachmusters, das Identifiziersignal für das Bezugswort "Eins" und die Rahmen entlang der Linie 160, von der die Wege ausgehen, gespeichert. Bei Beendigung des Zeitausrichtungsverfahrens (Kästchen 609) der zweiten Stufe (L+1=2) sind alle Zweiwort-Teilketten innerhalb des zulässigen Bereichs ausgewertet worden, und die Signale, die die möglichen Kandidatenketten definieren gespeichert. Man tritt dann erneut in das Entscheidungskästchen 611 ein. Da die letzte Stufe L max =4 noch nicht verarbeitet ist, wird die Stufe L weitergeschaltet auf 2 (Kästchen 615).
Es wird jetzt in das Kästchen 605 eingetreten und mit der Speicherung für die nächste Stufe L+1=3 begonnen. Die Stufe L=2 wird abgetastet (Kästchen 607), um den Endrahmen n als Anfangsrahmen für die Zeitausrichtungsverarbeitung der dritten Stufe (L+1=3) festzustellen. Während der Verarbeitung der dritten Stufe (Kästchen 609) werden die Bezugswort-Merkmalssignale auf der dritten Stufe zwischen den Linien 170 und 180 wiederholt. Die dynamische Zeitverkettung der Bezugswort-Merkmalssignale mit den Sprachmuster-Merkmalssignalen, beginnend beim Rahmen n auf der Linie 170 führt zu besten Abstandswegen 130-1, 130-3, 130-4, 130-5 und 130-6 für das Bezugswort "Null" und besten Abstandswegen 130-2 für das Bezugswort "Eins". Die anderen möglichen Wege von den Anfangsrahmen auf der Linie 170 sind ungültig, da sie außerhalb des durch die Linien 170, 101, 102, 180 und 103 definierten Bereichs liegen oder kumulative Abstände haben, die zu groß sind, um diese Wege in Betracht zu ziehen. Mit der Speicherung der kumulativen Abstandssignale, der Bezugswort-Identifizierungssignale und der Anfangsrahmensignale für die zulässigen Endpunkte sind alle möglichen Ketten der drei Bezugswörter am Ende der dritten Stufe identifiziert.
Es wird dann erneut in das Endscheidungskästchen 611 eingetreten und als Ergebnis entsprechend dem Kästchen 615 der Pegelindex geändert auf L=3. Wie oben mit Bezug auf die Verarbeitung der vorhergehenden Stufe erwähnt, wird gemäß Kästchen 605 die Abstandsignal- und Rahmenspeicherung für die Stufe L+1=4 begonnen. Die gespeicherten Rahmensignale für die Stufe L=3 werden gemäß Kästchen 607 abgetastet, und der Anfangsrahmen n wird als erster Rahmen für die dynamische Zeitverkettung der Stufe L+1=4 gewählt. Es wird dann gemäß Kästchen 609 die DTW-Verarbeitung der vierten Stufe durchgeführt.
Wie in Fig. 1 gezeigt, führt die dynamische Zeitverkettung der vierten Stufe zwischen den Bezugswort-Merkmalssignalen und den Sprachmuster-Merkmalssignalen zu einem einzigen Weg 140-1 zwischen dem Rahmen n auf der Linie 180 und dem Rahmen N₁ auf der Linie 190. Nach der DTW-Verarbeitung der vierten Stufe wird der Schnittpunkt des dynamischen Zeitverkettungswegs mit dem Sprachmuster-Endrahmen N festgestellt und die Stufenverarbeitungskästchen 611 beendet. Man tritt dann in das Kästchen 613 ein, und es wird die beste Bezugswortkette aus den gespeicherten Stufendaten rekonstruiert. Demgemäß ermöglichen nach Fig. 1 die gespeicherten Stufenendpunkte nkk eine Rückverfolgung der Wege 140-1, 130-5, 120-8 und 110-5 durch die Stufen 4, 3, 2 und 1. Auf diese Weise wird die Binärfolge 1001 als Sprachmuster gewählt. Wenn auf irgendeiner Stufe mehr als ein Weg beim Endrahmen N m endet, kann die am dichtesten entsprechende Bezugswortkette durch einen Vergleich der kumulativen Abstände für die möglichen Zeitausrichtungswege in Fig. 1 gewählt werden. Alternativ wird die Bezugswortkette mit einer bestimmten Anzahl von Ziffern ausgewählt.
Der Bereich zulässiger Ausrichtungswege im Beispiel nach Fig. 1 ist so festgelegt, daß nur Sprachmuster mit einer vorbestimmten Anzahl von verbundenen Wörtern durch Angleichen des Endrahmens N m an die letzten Bezugswort-Endrahmen auf der Linie 190 angenommen werden. Diese Anordnung läßt sich leicht so abändern, daß Sprachmuster mit weniger Wörtern angenommen werden, indem der zulässige Bereich so ausgedehnt wird, daß er einen Extrempunkt für jede Stufe enthält, der oberhalb der Grenzlinie 104 für die minimale Sprachrate liegt. Gemäß Fig. 1 können Sprachmuster mittels Bezugswortketten von 2 oder 3 Wörtern verarbeitet werden, indem der dynamische Zeitverkettungsbereich bis zu den gestrichelten Verlängerungen der Linien 104, 170 und 180 sowie der gestrichelten Linie 105 ausgedehnt wird. Der vergrößerte Bereich ermöglicht eine Erkennung von verbundenen Wortmustern unterschiedlicher Länge mit der Einschränkung, daß die Maximalzahl von Wörtern in einem Sprachmuster vorgeschrieben ist.
Bei dem in Fig. 1 gezeigten Beispiel schneidet der Endpunkt des Wegs 140-1 der vierten Stufe der Linie, die den Endrahmen N des Sprachmusters definiert. Eine solche Forderung kann die Auswahl der Kandidaten-Bezugswortketten unzulässig beschränkten. Eine Anordnung, bei der ein Endbereich von mehreren Rahmen definiert ist, ermöglicht eine gewisse Fehlergrenze bei der Bestimmung des Endrahmens des Sprachmusters. Demgemäß kann in Fig. 1 ein Endbereich zwischen den Linien 192 und 194 einen geeigneten Sprachmuster-Endpunktbereich bilden. Die Linie 102 wird zur gestrichelten Linie 109 zwecks Anpassung an den größeren Bereich von Sprachmuster-Endrahmen verschoben.
In bekannter Weise führt die zeitliche Ausrichtung von verbundenen Sprachmustern mit Verknüpfungen von isolierten Bezugswortmustern im allgemeinen aufgrund einer Koartikulation bei den Sprachmustern mit verbundenen Wörtern zu Fehlern. Diese Fehler können Fehlanpassungen in den Anfangs- und Endbereichen von Wörtern zugeordnet sein, da die Bezugswörter im allgemeinen verlängert sind, wenn sie getrennt gesprochen werden. Die in Fig. 1 gezeigte Anordnung kann so abgeändert werden, daß sie einer solchen Koartikulation Rechnung trägt, indem die Auswahl der am besten übereinstimmenden Anfangs- und Endrahmen an den Grenzen jeder Stufe zugelassen wird. Demgemäß werden die Zeitausrichtungsanordnungen dicht bei den Stufengrenzen zur Anpassung an Koartikulationseinflüsse eingestellt.
Die Sprachmuster-Anfangsrahmen auf jeder Stufe gemäß Fig. 1 entsprechen den auf der vorhergehenden Stufe erzeugten Endrahmen und sind unabhängig von der Größe der akkumulierten Abstände, die den Endpunkten der vorhergehenden Stufe zugeordnet sind. Die Erkennungsanordnung kann so modifiziert werden, daß die Signalverarbeitungsanforderungen weiter verringert sind, und zwar durch eine Begrenzung der Anfangsrahmen entsprechend einem vorgeschriebenen Bereich des besten mittleren kumulativen Abstands, der bei der Verarbeitung der vorhergehenden Stufe bestimmt worden ist. Die Genauigkeit der sich dann ergebenden Erkennung bleibt durch eine solche Beschränkung im wesentlichen unbeeinflußt, da nur die am wenigsten wahrscheinlichen Kandidaten aus der Betrachtung ausgeschieden werden.
Die Fig. 2 und 3 zeigen ein genaueres Blockschaltbild einer Erkennungseinrichtung für kontinuierliche Sprache als Ausführungsbeispiel der Erfindung. In Fig. 2 kann der Bezugswort-Merkmalssignalspeicher 205 ein integrierter, programmierbarer Festwertspeicher (ROM) sein, der eine Vielzahl von Schablonensignalen speichert. Jedes Schablonensignal stellt eine Folge von akustischen Merkmalen eines Bezugswortes dar. Diese akustischen Merkmale werden aus isolierten Aussprachen des Wortes mit Hilfe einer linearen Voraussageanalyse bekannter Art abgeleitet. Obzwar lineare Voraussageparameter als Merkmalssignale bei der Schaltungsanordnung nach Fig. 2 und 3 verwendet werden, sei darauf hingewiesen, daß andere akustische Merkmale in Verbindung mit der Erfindung benutzt werden können, beispielsweise Spektral- oder Formatparameter. Die Aussprache jedes Bezugswortes ist in M Rahmen unterteilt, und für jeden Rahmen wird ein Merkmalssignal (p+1)-ter Ordnung erzeugt. Das Merkmalssignal entspricht den autokorrelierten linearen Voraussagekoeffizienten des Sprachsignals. Die Bezugswortschablone wird dann durch das Signal gemäß Gleichung (1) dargestellt. Die Schablonensignale für die Bezugswörter w₁, w₂, . . . w m werden im Merkmalsspeicher 205 abgelegt und durch ein Schablonen-Wortnummernsignal w vom Wortzähler 220 adressiert, der binäre Vor/Rückwärtszähler enthalten kann. Zur Erläuterung wird angenommen, daß die Erkennungseinrichtung gemäß Fig. 2 und 3 in der Lage ist, Folgen von gesprochenen Zahlen zu erkennen. Demgemäß besteht der Bezugswortsatz aus den Ziffern 0 bis 9.
Der Sprachmuster-Merkmalssignalgenerator 201 in Fig. 2 nimmt ein Sprachsignal von einem elektroakustischen Wandler 200 auf und wandelt es in eine Folge von akustischen Merkmalssignalen des gleichen Typs um, wie sie im Bezugsmerkmalssignalspeicher 105 abgelegt sind. Für jeden Rahmen des Sprachsignals vom Wandler 200 wird eine lineare Voraussagecodier-Analyse durchgeführt, um ein Merkmalssignal (p+1)-ter Ordnung für den Rahmen zu bilden. Durch die Analyse erhält man die Folge von Sprachmuster-Merkmalssignalen gemäß Gleichung (2). Diese Merkmalssignale T(n) werden sequentiell zum Merkmalssignalspeicher 203 übertragen, wo sie Rahmen für Rahmen gespeichert werden. Der Merkmalsgenerator 201 kann ein Generator mit linearen Voraussagekoeffizienten sein, der in der US-PS 40 92 493 beschrieben ist, oder irgendein anderer LPC-Generator bekannter Art.
Die Zeitausrichtungsverarbeitung wird im DTW-Prozessor 207 für jede Stufe entsprechend den Sprachmuster-Merkmalen aus dem Speicher 203 und den Bezugswortmerkmalen aus dem Speicher 205 durchgeführt. Die im Prozessor 207 erzeugten kumulativen Abstandssignale d s werden in den Abschnitt 110-2 des Stufenspeichers 210 eingegeben, der eine Vielzahl von RAM-Speichern umfassen kann. Der Stufenspeicher wird gemeinsam durch die Sprachmuster-Rahmennummer und die Stufe adressiert. Der Abschnitt 210-1 speichert die vom DTW-Prozessor 207 bei der dynamischen Zeitverkettungsverarbeitung gewonnenen Anfangsrahmennummern SFN. Der Abschnitt 210-3 speichert die Bezugswort-Identifiziersignale w, die der Verarbeitung zugeordnet sind. Die Verarbeitungsergebnisse, die durch die Signale und adressiert werden, werden als Anfangsrahmensignal SN, kumulatives Abstandssignal und Bezugswort-Identifiziersignal auf den Leitungen 211-1, 211-2 bzw. 211-3 zur Verfügung gestellt.
Die Rahmenfolgelogik 307 in Fig. 3 liefert die Folge von Sprachmusterrahmen n, die das Auslesen der Sprachmuster- Merkmalssignale aus dem Speicher 203 steuert, und erzeugt außerdem Steuersignale, die die Arbeitsweise des DTW-Prozessors 207 bestimmen. Der Rückwärtsverfolgespeicher 260 in Fig. 2 tritt bei Beendigung der Verarbeitung der letzten Stufe in Tätigkeit und speichert die bei der Stufenverarbeitung bestimmten DTW-Wege derart, daß die am genausten entsprechende Bezugswortkette gewählt werden kann.
Zur Erläuterung wird angenommen, daß der Spracherkenner gemäß Fig. 2 und 3 zur Identifizierung eines Sprachmusters benutzt wird, das aus einer Folge von gesprochenen Zahlen mit einer maximalen Länge von 5 Ziffern bestehen. Es sei jedoch darauf hingewiesen, daß der Spracherkenner zur Erkennung gesprochener Wörter oder Phrasen beliebiger Zeichen und einer Länge von mehr als 5 Wörtern benutzt werden kann. Das zur Erläuterung gewählte Sprachmuster ist die Ziffernfolge "4453", die sich über 128 Rahmen erstreckt. Vor Zuführung des Sprachmusters zum elektroakustischen Wandler 200 wird das Signal "Start" durch den Signalgenerator 204 unter Steuerung eines externen Bauteils, beispielsweise des Schalters 206, erzeugt.
Das Signal "Start" wird dem Steuergerät 350 zugeführt, das genauer in Fig. 4 dargestellt ist. Das Steuergerät gemäß Fig. 4 weist eine Folge-Steuerschaltung 400 auf, die generell die zeitliche Folge von Operationen der Erkennungsschaltung gemäß Fig. 2 und 3 bestimmen kann, und Steuergeräte 410, 420, 430, 440 und 450, die eine individuelle, durch die Folgesteuerschaltung 400 gewählte Betriebsweise bestimmen. Jede Steuerschaltung in Fig. 4 ist ein Mikrocomputer bekannter Art, beispielsweise der in dem Aufsatz "Let a Bipolar Processor Do Your Control and Take Advantage of Its High Speed" von Stephen Y. Lau beschriebenen Art, der auf den S. 128-139 von "Electronic Design", Nr. 4, 15. Februar 1979, erschienen ist. In bekannter Weise erzeugt ein Steuergerät dieser Art ein oder mehrere gewählte Ausgangssignale unter Ansprechen des Zustands der zugeführten Signale. Jede Steuerschaltung beinhaltet einen Festwertspeicher, in welchem ein Befehlssatz gespeichert ist, der die Betriebsweise bestimmt.
Das Signal "Start" vom Generator 204 wird der Folgesteuerschaltung 400 zugeführt, die daraufhin einen Steuerimpuls SA und ein Steuersignal A erzeugt. Der Steuerimpuls SA wird dem Merkmalssignalgenerator 201 in Fig. 2 und dem Bedingungsgenerator 201 zugeführt, um eine Folge von Sprachmuster-Merkmalssignalen T(n) und Rahmenadressiersignale FSA unter Ansprechen auf das Sprachmustersignal vom Wandler 200 zu erzeugen. Die Rahmenadressiersignale werden zum Adresseneingang des Merkmalssignalspeichers 203 über ein UND-Gatter 222 und ein ODER-Gatter 226 zugeführt, während das Steuersignal A betätigt ist.
Das Flußdiagramm gemäß Fig. 7 zeigt die Sprachmusteranalyseoperation. Wenn das Signal "Start" gemäß Kästchen 700 vorliegt, wird der Steuerimpuls SA erzeugt, und die Sprachmuster-Merkmalssignale werden entsprechend dem Kästchen 710 erzeugt und gespeichert. Bei Beendigung der Sprachmusteranalyse und Einspeicherung der Merkmalssignale in den Speicher 203 wird der Steuerimpuls EA vom Generator 201 erzeugt, und der Sprachmuster-Endrahmen N m =128 wird vom Generator 201 zum Rahmenzähler 230 gegeben. Die Folgesteuerschaltung 400 in Fig. 4 erzeugt Steuerimpulse SBO und SLJM unter Ansprechen auf den Impuls EA. Diese Signale leiten die Stufenverarbeitung für die erste Stufe entsprechend dem Kästchen 720 in Fig. 7 ein.
Der Steuerimpuls SBO wird dem Einstelleingang des Rückverfolgungszählers 240 in Fig. 2 zugeführt, der dadurch auf 0 zurückgestellt wird. Der Impuls SLJM durchläuft das ODER-Gatter 467, und das Signal SLJ von diesem Gatter wird dem Stufenzähler 250 zugeführt. Dieser wird dadurch auf 0 zurückgestellt, so daß sein Ausgangssignal L=0 und sein Ausgangssignal L+1=1 ist. Der Zähler 250 weist eine Zählschaltung, eine Addierschaltung und eine Komparatorschaltung bekannter Art auf.
Der Impuls EA am Ende der Sprachmusteranalyse veranlaßt außerdem die Steuerschaltung 400, den Steuerimpuls SI zu erzeugen, wie im Flußdiagramm gemäß Fig. 8 gezeigt. Der Steuerimpuls SI versetzt die Erkennungsschaltung gemäß Fig. 2 und 3 in die Lage, in die erste Einleitungsbetriebsweise überzugehen, in der die Speicherstellen der Stufe L+1=1 des Pegelspeichers 210 voreingestellt werden. Auf diese Weise wird der Pegelspeicher 210 vor der dynamischen Zeitverkettung der Sprachmuster-Merkmalssignale des ersten Stufensegments mit den Bezugswort- Merkmalssignalen der ersten Stufe in Betrieb genommen. Gemäß Kästchen 810 in Fig. 8 wird die Sprachmuster-Rahmenadresse für die Stufe L+1=1 des Speichers 210 zu Anfang auf den ersten Rahmen n s =1 eingestellt. Die Abstandssignalspeicherstelle für den ersten Rahmen wird auf den größtmöglichen Zahlencode LPN eingestellt, der in der Schaltung gemäß Fig. 2 und 3 verfügbar ist, und die Anfangsrahmenstelle, die dem Sprachmusterrahmen n s =1 zugeordnet ist, wird entsprechend dem Kästchen 820 auf 0 eingestellt. Die Sprachmuster-Rahmennummer wird weitergeschaltet (Kästchen 830), und dann wird wiederum über das Entscheidungskästchen 840 in das Kästchen 820 eingetreten, so daß das nächste Sprachmuster-Rahmenabstandssignal und die Anfangsrahmennummer-Speicherstelle voreingestellt werden können. Die Speicherbetriebs-Einleitungsoperation läuft weiter, bis die Sprachmuster-Rahmennummer größer als der maximale Sprachmuster-Rahmen N m =128 ist. Zu diesem Zeitpunkt wird der Steuerimpuls EI erzeugt.
Zu Beginn der Betriebseinleitung wird der Steuerimpuls SI von der Steuerung 400 dem Stufeneinleitungs-Steuergerät 410 zugeführt. Das von der Steuerung 410 erzeugte Steuersignal I gelangt zu ODER-Gattern 231 und 254 in der Stufenspeicher- Adressierlogik 290. Unter Ansprechen auf das Steuersignal I wird ein UND-Gatter 233 betätigt. Auf entsprechende Weise wird das UND-Gatter 256 durch das Ausgangssignal des ODER-Gatters 254 in Tätigkeit gesetzt. Dann wird in der Steuerung 410 der Steuerimpuls SN1I erzeugt, so daß das Signal SN1 vom ODER-Gatter 461 zum Rückstelleingang des Rahmenzählers 230 übertragen wird. Dieser wird dadurch in seinen ersten Zustand gebracht, in welchem der Ausgang n s auf 1 eingestellt ist. Das Signal n s =1 durchläuft das UND-Gatter 233 und das ODER- Gatter 238, so daß die Sprachmuster-Rahmenstelle ñ=1 des Stufenspeichers 210 adressiert wird. Der Stufenzähler 250 war vorher zurückgestellt worden, so daß sein Ausgangssignal L+1=1 ist. Das Signal L+1=1 durchläuft das UND-Gatter 256 und das ODER-Gatter 259, wodurch die Stufe =1 des Speichers 210 adressiert wird. Auf diese Weise werden die Speicherstellen des ersten Sprachmusterrahmens für die Stufe 1 im Speicher 210 ausgewählt.
Der Speicher 210, der RAM-Speicher und programmierbare integrierte ROM-Speicher aufweisen kann, ist in drei Abschnitte unterteilt. Der Zeitausrichtungsweg-Anfangsrahmen SN für die gewählte Adresse wird im Abschnitt 210-1 gespeichert. Der kumulative Abstand , der durch die dynamische Zeitverkettung für den adressierten Rahmen gewonnen worden ist, wird im Abschnitt 210-2 gespeichert, und das Bezugswort-Identifiziersignal , das durch die dynamische Zeitverkettung für den adressierten Rahmen erhalten worden ist, wird im Abschnitt 210-3 gespeichert.
Wenn der Sprachmusterrahmen n s =1 der Stufe L+1=1 im Speicher 210 adressiert wird, durchläuft ein Codesignal 0 das UND-Gatter 274 und das ODER-Gatter 286 unter Ansprechen auf das Signal I. Am Informationseingang des Speicherabschnitts 210-1 erscheint ein Signal 0. Das durch das Signal I vorbereitete UND-Gatter 284 läßt das LPN-Signal zum Informationseingang des Speicherabschnitts 210-2 über das ODER-Gatter 282 durchlaufen. Die Steuerung 410 bleibt in Betrieb und erzeugt das Signal WLSI, und das Schreibsignal WLS wird an den Schreibbetätigungseingang des Speichers 210 über das ODER-Gatter 465 angelegt. Dadurch werden ein Code 0 und ein Code LPN in die Speicherstellen =1, =1 der Stufenspeicherabschnitte 210-1 bzw. 210-2 eingegeben.
Es wird dann in der Steuerung 410 der Steuerimpuls IN1I erzeugt und über das ODER-Gatter 463 dem Rahmenzähler 230 zugeführt. Dieser wird weitergeschaltet. Er liefert das Signal n s =2, das bewirkt, daß die Speicherstellen des zweiten Sprachmusterrahmens im Stufenspeicher 210 (=1, =2) adressiert werden. Das nächste WLS-Signal von der Steuerung 410 stellt die Speicherstellen SN (2) und (2) auf 0 bzw. LPN ein. Die Folge von Impulsen IN1I und WLSI der Steuerung 410 wiederholt sich mit einer vorbestimmten Rate, um die Rahmenstellen 1 bis N(m) der Stufe L+1=1 voreinzustellen. Der Ausgang NMS des Rahmenzählers 230 wird betätigt, wenn dessen Zustand n s =N m erreicht ist. Unter Ansprechen auf das Signal NMS vom Zähler 230 erzeugt die Steuerung 410 einen Steuerimpuls EI, der die Betriebseinleitung der ersten Stufe beendet, nachdem die Stellen =1, =N m der Speicherabschnitte 210-1 und 210-2 auf 0 bzw. LPN eingestellt sind.
Die dynamische Zeitverkettung für jede Stufenverarbeitung wird mit dem niedrigsten Endrahmen der vorhergehenden Stufe begonnen, nachdem der höchste Endrahmen der vorhergehenden Stufe festgestellt und gespeichert ist. Folglich werden die =0 Stellen im Stufenspeicherabschnitt 210-1 beginnend beim Rahmen n s =1 abgetastet, um den ersten Rahmen festzustellen, in welchem sich ein von 0 abweichend bewerteter Anfangsrahmen befindet. Die Stufe =0 entspricht dem Anfang des Sprachmusters und besitzt einen von 0 abweichend bewerteten Anfangsrahmen SN=1 für den Rahmen n s =1. Im Stufenspeicher 210 sind die Eintragungen für L=0 fest und befinden sich in einem Nurlese-Speicherabschnitt. Die Stelle n s =1 des Abschnitts 210-1 ist dauernd auf SN=1 eingestellt, und die entsprechende Stelle im Abschnitt 10-2 ist dauernd auf =0 eingestellt. Alle anderen Rahmenstellen für die Stufe L=0 im Abschnitt 210-1 sind dauernd auf SN=0 und alle anderen Stellen im Abschnitt 210-2 auf =LPN eingestellt.
Die Abtastbetriebsweise wird unter Ansprechen auf einen Impuls EI von der Steuerung 410 gestartet. Dieser Impuls veranlaßt die Steuerschaltung 400, den Steuerimpuls SB zu erzeugen. Unter Ansprechen auf den Impuls SB erzeugt die Abtaststeuerung 420 ein Signal BB, das über ein ODER- Gatter 469 als Signal B zu ODER-Gattern 231 und 252 in der Stufenspeicher-Adressierlogik 290 für die Dauer der Abtastung geführt wird. Das Ausgangssignal des ODER- Gatters 231 bereitet das UND-Gatter 233 vor, so daß die Folge von n s -Abtastadressensignalen vom Rahmenzähler 230 über das ODER-Gatter 238 an den -Adresseneingang des Stufenspeichers 210 angelegt werden kann. Das Ausgangssignal des ODER-Gatters 252 bereitet das UND-Gatter 258 vor, so daß das L=0-Signal das UND-Gatter 258 sowie das ODER-Gatter 259 durchläuft und als -Adresseneingang dem Stufenspeicher 210 zugeführt werden kann.
Die Abtaststeuerung 420 erzeugt außerdem Impulse BD und SNM am Beginn der Abtastbetriebsweise. Der Impuls SNM setzt entsprechend dem Indexeinstellkästchen 910 in Fig. 9 den Rahmenzähler auf den Sprachmuster-Endpunktzustand (n s =n m ). Die Adressenlogik 209 wählt dann den Rahmen n s =n m der Stufe L=0, und es werden die Signale SN=0 und =LPN für den Rahmen N m dem Gatter 335 bzw. dem Teiler 355 zugeführt. Das Signal SN=0 gelangt an einen Eingang eines Komparators 338. Unter Ansprechen auf dieses Signal bleibt der Komparator 338 abgeschaltet. Demgemäß bleibt auch das Signal DMTA am Ausgang des UND-Gatters 381 abgeschaltet (Kästchen 912). Die Abtaststeuerung 420 erzeugt dann den Impuls DN 1, der den Zähler 230 entsprechend dem Kästchen 914 rückwärts schaltet. Das Signal NSO bleibt für n s =n m abgeschaltet (Kästchen 916). Das Signal n s wird im Komparator 385 mit 0 verglichen, wenn das Signal BD vorhanden ist. Auf diese Weise wird der Rahmenzähler wiederholt rückwärts geschaltet, bis n s =1 ist.
Das Signal SN=1 für n s =1 betätigt den Ausgang des Komparators 338. Das Signal für L=0, n s =1 vom Abschnitt 210-2 des Stufenspeichers 210 ist 0. Der Teiler 335 bildet das Signal (1)/1=0, das im Komparator 305 mit dem vorher im Zwischenspeicher 309 abgelegten Signal LPN verglichen wird. Das Signal DMT wird betätigt, und das Gatter 381 liefert ein betätigtes Signal DMTA über das UND-Gatter 359 an den Zwischenspeicher 360. Dadurch wird das Signal n s =1 in den Zwischenspeicher 350 gebracht (Kästchen 920). Das Signal DMTA wird außerdem der Steuerung 420 zugeführt, die das Signal BD ausschaltet und das Signal BU einschaltet. Die Abtaststeuerung 420 liefert dann das Signal SN 1B, das das ODER-Gatter 461 als Impuls SN 1 durchläuft und den Rahmenzähler 230 auf seinen Anfangszustand n s =1 zurückstellt (Kästchen 922). Auf diese Weise werden die Sprachmuster-Rahmenstellen n s =1 der Stufe L 0 im Speicher 210 gewählt. Das Abstandssignal =0 für die gewählte Rahmenstelle vom Stufenspeicherabschnitt 210-2 steht dann auf der Leitung 211-2 zur Verfügung und wird von dort über den Teiler 335 und das Gatter 304 einem Eingang des Komparators 305 in Fig. 3 zugeführt. Das andere Eingangssignal des Komparators 305 vom Multiplizierer 303 ist zu diesem Zeitpunkt größer als 0, so daß das Signal DMT vom Komparator 305 eingeschaltet wird. Dieses Signal gelangt zum Gatter 381. Da das Signal SN=1 vom Speicherabschnitt 210-1 am Komparator 338 vorhanden ist, wird das Signal DMTA eingeschaltet, und der Zwischenspeicher 370 wird über das UND-Gatter 368 eingestellt. Die Abtaststeuerung 420 erzeugt dann unter Ansprechen auf das Signal DMTR vom Zwischenspeicher 370 den Steuerimpuls EB. Dieser Impuls EB beendet die Abtastoperation und veranlaßt das Folgesteuergerät 400, die Impulse FSL und SC zu erzeugen.
Der Impuls FSL gelangt zur Rahmenfolgelogik 307, so daß der augenblickliche SN-Code (n s =1) vom Stufenspeicherabschnitt 210-1 in die Rahmenfolgelogik 207 eingegeben wird. Auf diese Weise wird die dynamische Zeitverkettung für die erste Stufe beim Rahmen n =1 eingeleitet. Der Impuls SC veranlaßt die DTW-Steuerung 430, die Steuersignalfolge zu erzeugen, die die Schaltung gemäß Fig. 2 und 3 veranlaßt, die dynamische Zeitverkettung der Sprachmuster- Segmentmerkmalssignale der ersten Stufe mit den Bezugswort-Merkmalssignalen vom Rahmen SN=1 der ersten Stufe durchzuführen.
Das Flußdiagramm gemäß Fig. 10 erläutert die dynamischen Zeitverkettungsvorgänge. Wie oben erwähnt, bewirkt die dynamische Zeitverkettungsverarbeitung, daß die Zeitausrichtungs-Wegendpunkte für die Stufe L=1 bestimmt und die kumulativen Abstandssignale, die Identifizierungssignale für das beste Bezugswort und die Anfangsrahmensignale für diese Endpunkte im Pegelspeicher 210 gespeichert werden. Gemäß Fig. 10 wird entsprechend dem Kästchen 1101 zu Anfang ein Merkzeichen (flag) gesetzt, das dann bei Feststellung eines gültigen Stufenendrahmens zurückgestellt wird. Entsprechend dem Kästchen 1005 wird das erste Bezugswort w₀ (Null) gewählt, und der Anfangsrahmen für die dynamische Zeitverkettung wird auf den Anfangsrahmen SN=1 eingestellt, der bei der unmittelbar vorhergehenden Abtastbetriebsweise bestimmt worden ist (Kästchen 1010). Der Anfangsrahmen des Bezugswortes "Null" ist der Rahmen n=1. Dann wird die dynamische Zeitverkettung der Sprachmuster-Merkmalssignals mit den Bezugswort-Merkmalssignalen gemäß Kästchen 1015 gestartet.
Die DTW-Verarbeitung erfolgt entsprechend dem allgemeinen, in Gleichung (7) dargestellten Verfahren. Entsprechend der Erfindung werden die Bezugswortrahmen jeder Stufe in drei Abschnitte unterteilt, nämlich einen Anfangsabschnitt δ R 1, einen Endabschnitt δ R 2 und den Abschnitt zwischen dem Anfangs- und dem Endabschnitt. Wie oben mit Bezug auf Gleichung (7) erwähnt, werden die zulässigen Bezugswortrahmen so gewählt, daß sie möglichen akustischen Bedingungen genügen. Bei dem mittleren Segment einer Stufe werden die Sprachraten-Einschränkungen gemäß Gleichung (7) befolgt. Die akustischen Bezugswortmerkmale im Speicher 205 werden von getrennt gesprochenen Mustern des Wortes abgeleitet. Benachbarte Wörter in Sprachmustern mit verbundenen Wörtern werden im allgemeinen koartikuliert. Demgemäß wird der Bereich der Bezugswortrahmen in den Anfangs- und Endsegmenten so eingestellt, daß der Koartikulation Rechnung getragen ist. Im Anfangsabschnitt wird die Wahl der Bezugsrahmen für den letzten Ausdruck in Gleichung (7) über den Bereich der Rahmen von δ R 1 ausgedehnt. Für das Segment w R 1 ist I₂=m und I₁ ist 1 für w(n-1) = w(n-2) oder im anderen Fall 0. Entsprechend wird im Endsegment die Wahl der Rahmen über den Bereich δ R 2 hinaus ausgedehnt. Im Segment δ R 2 ist I₁=1, wenn w(n-1) = w(n-2) und 0 im Bezugswort-Endrahmen mk. Auf diese Weise wird die zeitliche Ausrichtung der Sprachmustermerkmale zu den Bezugsmerkmalen bei Vorhandensein einer Koartikulation genauer gemacht. In typischer Weise ist δ R 1=4 und δ R 2=6 für durch einen Sprecher erzeugte Bezugsmerkmalssignalschablonen. Der Wert δ R 1 wird auf 0 und w R 2 auf 4 für sprecherunabhängige Bezugsmuster gesetzt.
Die dynamische Zeitverkettung gemäß Kästchen 1015 wird über den Bereich 1 m M von Bezugswortrahmen für jeden aufeinander folgenden Sprachmusterrahmen n durchgeführt. Die Rahmenauswahl bei den im DTW-Prozessor 207 durchgeführten dynamischen Zeitverarbeitungsoperationen wird durch die Rahmenfolgelogik 307 gesteuert, die genauer in Fig. 5 dargestellt ist.
Bei dem Ausführungsbeispiel nach Fig. 2-5 liefert die DTW-Prozessorsteuerung 430 Steuerimpulse SW 1 und FSR sowie ein Steuersignal C unter Ansprechen auf einen Impuls SC von der Folgesteuerung 400. Durch den Impuls SW 1 wird der Wortzähler 220 in Fig. 2 auf seinen Zustand w=w₀ zurückgestellt. Der Impuls FSR stellt den Zähler 505 auf seinen Anfangszustand zurück. Der Zähler 505 speichert die Zahl der Sprachmusterrahmen der bereits verarbeiteten Stufe. Der Sprachmuster-Anfangsrahmen im Zwischenspeicher 501 wird durch den Impuls FSR zum Zähler 503 übertragen. Der Ausgang n des Zählers 503 liefert das Eingangssprachmuster- Rahmensignal für die DTW-Verarbeitung. Das Signal FSR stellt außerdem das Flipflop 370 über das ODER-Gatter 369 ein. Dadurch wird das Signal DMTR am Anfang jeder DTW-Abtastung eingestellt.
Das Signal C von der Steuerung 430 wird ODER-Gattern 251 und 252 der Stufenspeicher-Adressierlogik 290 zugeführt. Das Rahmensignal n vom Zähler 503 durchläuft dann das UND-Gatter 236 zum -Adresseneingang des Speichers 210. Abhängig vom Ausgangssignal des ODER-Gatters 252 überträgt das UND-Gatter 258 das Stufensignal L vom Stufenzähler 250 zum -Adresseneingang des Speichers 210. Am Anfang der DTW-Verarbeitung für die Stufe liefert der anfängliche Sprachmustersegment-Rahmen vom Zähler 503 in Fig. 5 das Sprachmustersegment-Rahmenadressensignal r für den Sprachäußerungs- Merkmalsignalspeicher 203 über das UND-Gatter 224 und das ODER-Gatter 226. Die dem Rahmensignal n entsprechende Sprachmuster-Merkmalssignale werden dem Eingang des DTW-Prozessors 207 zugeführt. Dieser wird zu Anfang so voreingestellt, daß er das erste Bezugswort-Rahmensignal an seinem Ausgang (M L ) für den unteren Grenzwert des Bereichs liefert. Dieses Signal M L =1 gelangt zum Komparator 524 in Fig. 5, der feststellt, ob die Verarbeitung im Anfangssegment w R 1 der Stufe stattfindet. In typischer Weise wird δ R 1 auf 4 Rahmen eingestellt. Für 1 M L R 1 wird der Ausgang des Komparators 524 betätigt und ein Signal vom UND-Gatter 530 geliefert, wenn der augenblickliche Sprachmusterrahmen ein Endrahmen der vorhergegenden Stufe ist und das Signal DMTR vom Flipflop 370 betätigt ist. Das Signal DMTR ist vorhanden, wenn der Sprachsegmentrahmen innerhalb des Bereichs von Endrahmen der vorhergehenden Stufe liegt. Dies ist dann die Kontinuität der dynamischen Zeitverkettungswege von Stufe zu Stufe.
Die DTW-Verarbeitung wird durch einen Steuerimpuls DST von der DTW-Steuerung 430 eingeleitet. Das Bezugswort- Rahmensignal M H vom Prozessor 207 wird zur Adressierung des Bezugswort-Merkmalsignalspeichers 205 benutzt, so daß die Bezugsmerkmale der erforderlichen Rahmen für das gewählte Wort w dem DTW-Prozessor gemäß Gleichung (7) zugeführt werden. Wenn das Bezugswort-Rahmensignal M L den Wert δ R 1 übersteigt, wird der Ausgang des Komparators 524 abgeschaltet, und das Signal R 1 wird vom DTW-Prozessor getrennt. Demgemäß werden die Einschränkungen der DTW-Verarbeitung gemäß Gleichung (7) so geändert, daß sie den akustischen Bedingungen für das mittlere Segment entsprechen.
Das Bezugswort-Endrahmensignal M vom Speicher 205 entspricht dem Endrahmen des adressierten Bezugswortes und wird dem Subtrahierer 515 sowie dem Komparator 520 in der Rahmenfolge-Logikschaltung gemäß Fig. 5 zugeführt. Das Signal M H für die obere Grenze des Bezugswort-Rahmenbereichs bei der gerade ausgeführten dynamischen Zeitverkettung wird vom Prozessor 207 zum Subtrahierer 515 und zum Komparator 520 gegeben. Wenn das Differenzsignal M - M H vom Subtrahierer 515 gleich oder kleiner als das Signal δ R 2 entsprechend dem Endsegment der Stufe ist, so wird der Ausgang R 2 des Komparators 518 betätigt. Das Signal R 2 gelangt an einen der Steuereingänge des Prozessors 207, so daß die dynamischen Zeitverkettungseinschränkungen unter Anpassung an das Endsegment der Stufenverarbeitung geändert werden.
Während der Operation des Prozessors 207 wird das Signal d′, das den Abstand zwischen den augenblicklichen Bezugswortmerkmalen und den Sprachmustersegment-Merkmalen bis zum Rahmen (n) der Stufe darstellt, mit einem Schwellenwert T(n) verglichen, wie im Entscheidungskästchen 1020 in Fig. 10 angegeben. Der Schwellenwert T(n) ist das Ausgangssignal des Festwertspeichers 509 und wird auf das größte Abstandssignal eingestellt, das für ein gültiges Kandidatenbezugswort im augenblicklichen Rahmen erwartet wird. Für den Fall, daß das Abstandssignal d′ vom Prozessor 207 den Schellenwert T übersteigt, wird die Abstandsverarbeitung für das Bezugswort abgebrochen. Es erfolgt dann ein Eintreten in das Indexkästchen 1050, und das nächste Bezugswort wird gewählt. Entsprechend dem Entscheidungskästchen 1055 wird dann bestimmt, ob alle Bezugswörter für die Stufe verarbeitet worden sind. Wenn nicht verarbeitete Bezugswörter vorhanden sind, wird entsprechend dem Kästchen 1015 die dynamische Zeitverkettung erneut gestartet, und zwar nachdem der Sprachäußerungsrahmen für die Verarbeitung auf den Anfangsrahmen zurückgestellt ist, der bei der vorhergehenden Abtastoperation (Kästchen 1010) bestimmt worden ist.
Unter Bezugsnahme auf Fig. 2 und 5 wird das Signal d′ vom DTW-Prozessor 207 an einen Eingang des Komparators 511 geliefert, der die Schwellenwertentscheidung gemäß Kästchen 1020 durchführt. Wie oben erwähnt, wird der Zähler 505 am Anfang der Abstandsverarbeitung durch das Signal FSR auf 1 zurückgestellt. Der Zähler 505 wird durch das Signal FSI weitergeschaltet, nachdem ein Sprachsegmentrahmen n entsprechend dem Kästchen 1015 verarbeitet worden ist. Das Rahmenausgangssignal des Zählers 505 adressiert den Festwertspeicher (ROM) 509, und das maximale Abstandsschwellenwertsignal T(n) vom Speicher 509 wird zum anderen Eingang des Komparators 511 geführt. Wenn das Signal d′(n) das dem Rahmen im Festwertspeicher 509 zugeordnete Schwellenwertsignal übersteigt, so wird das Abbruchsignal AB vom Komparator 511 eingeschaltet und der Steuerung 430 zugeführt. Diese erzeugt dann einen Impuls IW 1, der den Wortzähler 220 in Fig. 2 weiterschaltet, sowie einen Impuls FSR, der den Zähler 505 zurückstellt und das Rahmensignal im Zwischenspeicher 501 zum Zähler 503 überträgt. Die Schaltung gemäß Fig. 2 und 3 wird dadurch so eingestellt, daß sie die Stufen-DTW- Verarbeitung für das nachfolgende Bezugswort durchführt.
Bei der Verarbeitung der ersten Stufe für das Sprachmuster 4453 wird das mit dem Rahmen n=1 beginnende Sprachmustersegment zuerst dynamisch mit dem Bezugswort "Null" im Prozessor 207 zeitverkettet. Bei der Verarbeitung der ersten Stufe erfolgt jedoch für alle Bezugswörter mit Ausnahme von "Vier" ein Abbruch ohne Erzeugung von Zeitausrichtungswegen, und zwar wegen der Unähnlichkeit des Bezugsmerkmalssignals mit den Sprachmustersegment- Merkmalssignalen des ersten Wortes. Während der DTW- Verarbeitung für das Bezugswort "Null" übersteigt ein Abstandssignal d′(n) das Schwellenwertsignal T(n) vor der Feststellung eines DTW-Ausrichteweg-Endpunktes. Das Signal AB vom Komparator 511 wird betätigt, und unter Ansprechen auf das Signal AB erzeugt die DTW-Steuerung 430 in Fig. 4 Steuerimpulse IW 1 und FSR. Der Impuls IW 1 schaltet den Wortzähler 220 in Fig. 2 weiter, und dessen Ausgangssignal w adressiert die Merkmalssignale für das Bezugswort "Eins" im Speicher 205. Der Impuls FSR stellt den Zähler 505 auf seinen Anfangszustand zurück und bewirkt, daß das Rahmensignal im Zwischenspeicher 501 zum Zähler 503 übertragen wird. Auf diese Weise wird die dynamische Zeitverkettung des Anfangssegmentes des Sprachmusters mit dem Bezugswort "Eins" gestartet. Während der DTW-Zeitausrichtung für das Bezugswort "Eins" wird der Komparator 511 wieder betätigt und die Verarbeitung abgebrochen, ohne einen Zeitausrichtungs-Endpunkt zu erreichen. Die dynamische Zeitverkettung der Bezugswörter "Zwei" und "Drei" führt ebenfalls zu Abbruchsignalen AB, da die Abstandssignale d′ vom Prozessor 207 das Schwellenwertsignal T(n) vom Festwertspeicher 509 übersteigen, bevor ein Zeitausrichtungsweg-Endpunkt erzeugt wird.
Nach Beendigung der DTW-Verarbeitung für das Bezugswort "Drei" erzeugt das DTW-Steuergerät 430 die Impulse FSR und IW 1. Der Impuls IW 1 schaltet den Wortzähler 220 weiter, so daß die Merkmalssignale für das Bezugswort "Vier" im Speicher 205 adressiert werden. Der Impuls FSR stellt den Zähler 503 auf den anfänglichen DTW-Verarbeitungsrahmen n=1 im Zwischenspeicher 501 ein und stellt den Zähler 505 auf 1 zurück. Es wird dann das Rahmensignal n=1 vom Zähler 503 an den Sprachmuster-Merkmalsspeicher 203 und den Stufenspeicher 210 angelegt. Die Merkmalssignale des Sprachmustersegments für die Stufe 1 werden dann entsprechend der Adressierung durch den Zähler 503 dem DTW-Prozessor 207 zur Verfügung gestellt, und der Stufenspeicher 210 wird in die Lage versetzt, die Zeitausrichtungsweg- Ergebnisse für das Bezugswort "Vier" aufzunehmen.
Der Prozessor 207 kann dann die Merkmalssignale des gewählten Bezugswortes (Vier) für die Rahmen 1m M mit den Merkmalssignalen des Sprachmusters für den im Zähler 503 gespeicherten Rahmen n zeitlich verketten. Die zeitliche Verkettung für den Rahmen n=1 wird unter Ansprechen auf das Signal DST von der Steuerung 430 gestartet.
Der DTW-Prozessor 207 kann eine Anordnung enthalten, wie sie in der Veröffentlichung "Microproducts Hardware System Reference" der Data General Corporation, Westboro, Massachusetts, 1979, beschrieben ist, oder andere Prozessorsysteme bekannter Art. Die Operationsfolge des Prozessors 207 wird durch die permanent im Festwertspeicher des Prozessors abgelegten Befehle bestimmt. Der Prozessor 207 führt entsprechend gespeicherten Befehlen die dynamischen Zeitverkettungsoperationen nach Gleichung (7) für jeden Sprachmusterrahmen n durch. Jede Rahmen-Zeitausrichtoperation wird durch das Signal DST gestartet. Die Auswahl der Bezugswortrahmen für die zeitliche Ausrichtung erfolgt gemäß Gleichung (7) unter Abänderung abhängig von den Signalen R 1 und R 2.
Der Prozessor 207 liefert das Signal d′ entsprechend dem Wegabstand der augenblicklichen Stufe für den Rahmen n 1, das Signal M I , das dem Bezugswortrahmen der unteren Grenze entspricht, das Signal M H , das dem Bezugswortrahmen der oberen Grenze entspricht, das Signal SFN, das dem Anfangsrahmen des Ausrichtungswegs entspricht, und das Signal d s , das dem kumulativen Abstand des Zeitausrichtungswegs von dem Sprachmustersegment-Anfangsrahmen entspricht.
Am Ende der DTW-Operation des Prozessors 207 für den Rahmen n=1 legt der Prozessor das Signal DDN an die DTW- Steuerung 430. Das Signal d′ vom Prozessor 207 wird mit dem Signal T(n) für den Rahmen 1 vom Festwertspeicher 509 im Komparator 511 verglichen. Für d′ (1)<T (1) wird der Ausgang AB des Komparators abgeschaltet. Zu diesem Zeitpunkt wird der Bezugswortrahmen der oberen Grenze für die Zeitverkettung M H vom Prozessor 207 ausgegeben und im Komparator 520 mit dem Endrahmen M des Bezugsworts w₄ aus dem Speicher 205 verglichen. Der Ausgang EP des Komparators 520 bleibt abgeschaltet, da M H M ist. Unter Ansprechen auf das Signal DDN und die abgeschalteten Signale EP und AB erzeugt die Steuerung 430 das Signal FSI, das die Zähler 503 und 505 auf den Zustand n=2 weiterschaltet, und außerdem das Signal DST, um die DTW- Operation für den Rahmen n=2 im Prozessor 207 zu starten.
Im Flußdiagramm gemäß Fig. 10 wird entsprechend dem Entscheidungskästchen 1020 d′ mit T n bei jeder Zeitverkettungsoperation verglichen und in das Entscheidungskästchen 1025 eingetreten, um den oberen Bezugsrahmen M H mit dem Bezugswort-Endrahmen M zu vergleichen. Wenn das Entscheidungskästchen 1025 mit der Angabe "Nein" verlassen wird, tritt man in das Entscheidungskästchen 1040 ein. Dort wird das Bezugswort-Rahmensignal M L der unteren Grenze mit dem Bezugswort-Endrahmen M verglichen, und der Sprachmusterrahmen n wird mit dem Sprachmuster- Endrahmen N M verglichen. Wenn entweder M=M oder n N M ist, so ist das Ende des Sprachmustersegments für die Stufe erreicht. Die Zeitausrichtungsoperationen für das Bezugswort werden dann entsprechend dem Index- Abänderungskästchen 1050 beendet, wie oben beschrieben. Im anderen Fall wird der Sprachmusterrahmen n entsprechend dem Index-Kästchen 1045 weitergeschaltet.
Wenn der Stufen-Wegabstand d′(n) bis zu und einschließlich des Rahmens n kleiner als der im Festwertspeicher 509 festgelegte Schwellenwert T(n) ist (Entscheidungskästchen 1020) und der Bezugsrahmen M H der oberen Grenze gleich oder größer als der letzte Bezugswortrahmen M ist (Entscheidungskästchen 1025), so ist ein gültiger Zeitausrichtungsweg festgestellt worden. Das kumulative Wegabstandssignal d s (n) vom Prozessor 207 wird dann mit dem kumulativen Abstandssignal verglichen, das vorher an der n-ten Rahmenstelle des Stufenspeichers abgelegt worden ist. Wenn d s (n)<(n) ist, ersetzt das kumulative Abstandssignal d s (n) vom Prozessor das Abstandssignal (n) im Speicherabschnitt 210-2, beginnend mit dem Rahmensignal SFN(n) vom Prozessor, das das Signal SN(n) im Speicherabschnitt 210-1 ersetzt hat. Die Ersetzung gemäß Kästchen 1035 findet statt, da der zuletzt bestimmte Weg einem besseren Bezugswort-Kandidatenweg entspricht, der beim Rahmen n endet. Wenn jedoch d s (n) - (n) ist, so ist der vorher bestimmte Weg der bessere Kandidat, und es wird aus dem Kästchen 1030 in das Entscheidungskästchen 1040 eingetreten.
Bei dem Ausführungsbeispiel ist M H M beim Rahmen n=29 der ersten Stufe und d s (29=15,2 ist kleiner als (29)=LPN. Demgemäß wird (29) zu 15,2 und SN (29) wird 1. Nach der Ersetzung gemäß Kästchen 1035 wird der Bezugsrahmen M L der unteren Grenze vom DTW-Prozessor mit dem Bezugswort-Endrahmen M verglichen, und der Sprachmusterrahmen n wird mit dem Sprachmuster-Endrahmen N m gemäß Entscheidungskästchen 1040 verglichen, um festzustellen, ob die Grenzen des Sprachmustersegments der Stufe erreicht worden sind. Wenn die untere Grenze M L M oder n N m ist, so ist die Stufen-DTW-Verarbeitung für das Bezugswort "Vier" beendet, und man tritt in das Indexkästchen 1050 ein. Im anderen Fall wird der Sprachmusterrahmen weitergeschaltet (Kästchen 1045), und die Zeitverkettung für den nächsten Rahmen wird begonnen.
Bei der Schaltung nach Fig. 2 und 3 wird die dynamische Zeitverkettung der Merkmale des Bezugswortes "Vier" mit den Sprachmustermerkmalen für aufeinander folgende Rahmen nach n=1 im Prozessor 207 durchgeführt. Am Ende der DTW-Operation für den Rahmen n=29 wird das Bezugsrahmensignal M H der oberen Grenze vom Prozessor 207 gleich dem Signal M vom Bezugsmerkmalsspeicher 205, was bedeutet, daß ein Endpunkt erreicht ist.
Die Signale M H und M gelangen zum Komparator 520, der jetzt betätigt wird. Das Signal EP vom Komparator 520 wird der DTW-Steuerung 430 zugeführt. Unter Ansprechen auf das Signal EP schaltet die Steuerung 430 das Signal C aus und das Signal E ein. Dann wird der Komparator 301 in Fig. 3 unter Ansprechen darauf betätigt, daß das akkumulierte Abstandssignal d s (29)=15,2 vom Prozessor 207 kleiner als das akkumulierte Abstandssignal =LPN ist, das für den Rahmen 29 im Speicherabschnitt 210-2 der Stufe L+1=1 abgelegt ist. Das Ausgangssignal SFN des DTW-Prozessors 207 ist 1 entsprechend dem Anfangsrahmen der ersten Stufe. Das Ausgangssignal d s des Prozessors ist 15,2 entsprechend dem kumulativen Abstand, und zwar bis zum Endpunkt n=29 der Stufe 1. Das Signal SFN=1 wird dem Eingang des Speicherabschnitts 210-1 über das UND-Gatter 272 und das ODER-Gatter 286 zugeführt, und das Signal d s =15,2 gelangt über das UND-Gatter 280 und das ODER-Gatter 282 an den Eingang des Speicherabschnitts 210-2. Das Ausgangssignal w=4 des Wortzählers 220 wird an den Eingang des Stufenspeicherabschnitts 210-3 über das UND-Gatter 281 angelegt.
Unter Ansprechen darauf, daß das Signal D S eingeschaltet ist, wird das Signal WLSC von der Steuerung 430 als Signal WLS an den Schreibbetätigungseingang des Speichers 210 über das ODER-Gatter 465 angelegt. Auf diese Weise werden das Bezugswort-Identifiziersignal w=4, das kumulative Abstandsignal d s =15,2 und der Anfangsrahmencode SFN=1 in die Stellen =29, =1 des Stufenspeichers 210 eingschrieben. Das Signal WLSC stellt außerdem das Abbruch-Flipflop 290 zurück. Nach dem Ende des Schreibimpulses WLS liefert die Steuerung 430 den Impuls FSI zur Weiterschaltung der Zähler 503 und 505 in Fig. 5. Das Signal E ist ausgeschaltet, und das Signal C ist eingschaltet. Das Signal DST von der Steuerung 430 wird dem Prozessor 207 zugeführt, um die dynamische Zeitverkettung für den Sprachmusterrahmen n=30 zu starten.
Die dynamische Zeitverkettung für jeden der Rahmen 29-40 führt zu einer Endrahmen-Erzeugung für die Stufe L+1=1. Die Beendigung der Zeitverkettung für jeden Rahmen wird durch das Signal DDN vom Prozessor 207 angezeigt. Die gleichzeitige Einschaltung des Ende- Signals DDN vom Prozessor 207, des Endrahmensignals EP vom Komparator 520 der Rahmenfolgelogik und des Signals DS vom Komparator 301 leitet die Einspeicherung des akkumulierten Abstandssignals des Endrahmensweges, des Anfangsrahmen-Wegsignals SFN und des Bezugswort- Identifizierungssignals w im Stufenspeicher 210 ein, wie mit Bezug auf den Sprachmusterrahmen 29 beschrieben. Die DTW-Verarbeitung des Bezugswortes "Vier" für die Rahmen n=29 bis n=40 führt zu Zeitausrichtungswegen, die vom Anfangsrahmen SFN=1 ausgehen.
In der Tabelle 1 sind das Wortidentifizierungssignal , das kumulative Abstandssignal und das Anfangsrahmensignal SN aufgeführt, die im Stufenspeicher 210 als Ergebnis der Verarbeitung der Rahmen n=29 bis n=40 für die erste Stufe abgelegt worden sind.
Tabelle 1
Während der dynamischen Zeitverkettung der Merkmale des Bezugswortes "Vier" und des Segments der ersten Stufe für den Rahmen n=41 übersteigt das Signal d′ vom Prozessor 207 das maximale, im Festwertspeicher 509 erzeugte Schwellenwertsignal ohne Erzeugung eines Endpunktsignals EP. Demgemäß wird ein Abbruchsignal AB vom Komparator 511 erhalten. Dieses Signal veranlaßt die Steuerung 430, den Wortzähler 220 mit Hilfe des Impulses IW 1 weiterzuschalten, und stellt den Zähler 503 auf den Anfangsrahmen im Zwischenspeicher 501 mit Hilfe des Signals FSR zurück, so daß die dynamische Zeitverkettung für das Bezugswort "Fünf" begonnen wird.
Die dynamische Zeitverkettung der akustischen Bezugswortmerkmale mit den Sprachmustersegmentmerkmalen der ersten Stufe entsprechend dem Flußdiagramm in Fig. 10 wird wiederholt für die Bezugswörter "Fünf", "Sechs", "Sieben", "Acht" und "Neun". Bei dem Ausführungsbeispiel hört jeweils die DTW-Verarbeitung für diese Bezugswörter über das Entscheidungskästchen 20 wegen der Unähnlichkeit zwischen dem Bezugswort und den Sprachmustermerkmalssignalen auf. Demgemäß gibt Tabelle 1 die Zeitausrichtungswege an, die bei der DTW-Verarbeitung der ersten Stufe bestimmt worden sind. Jedesmal dann, wenn der Bezugswortindex gemäß Kästchen 1050 weitergeschaltet worden ist, wird gemäß Kästchen 1055 bestimmt, ob das letzte Bezugswort verarbeitet worden ist. Nach der Verarbeitung der Merkmale des letzten Bezugswortes wird das Abbruchmerkzeichen gemäß Entscheidungskästchen 1060 überprüft. Wenn - wie beim Ausführugsbeispiel - das Abbruchmerkzeichen zurückgestellt ist, wurde ein gültiger Zeitausrichtweg bestimmt, und die Stufe L wird entsprechend dem Indexkästchen 1065 weitergeschaltet. Wenn das Abbruchmerkzeichen gesetzt bleibt, ist kein gültiger Weg für diese Stufe bestimmt worden. Demgemäß ist kein möglicher Zeitausrichtweg für die nachfolgende Stufe vorhanden. Wenn die erste Stufe keinen gültigen Weg hat, tritt man über das Entscheidungskästchen 1075 in das Wiederholungskästchen 1080 ein, und der Sprecher wird gebeten, seine Sprachäußerung zu wiederholen. Das Signal RPT wird durch die Folgesteuerschaltung 400 unter Ansprechen auf das Signal ABFF vom Flipflop 291 erzeugt. Das Signal RPT veranlaßt den Nachrichten-Synthetisierer 295, eine synthetisierte Nachricht zu erzeugen, die den Sprecher veranlaßt, sein Sprachmuster zu wiederholen. Wenn bei den nachfolgenden Stufen kein gültiger Weg vorhanden ist, werden die Sprachmuster-Kandidaten auf der Grundlage der bereits gespeicherten Wegsignale ausgewertet. Für das Sprachmuster 4453 wird die Stufe L auf L=1 weitergeschaltet, und man tritt über das Entscheidungskästchen 1070 in die Bereichseinstell-Betriebsweise ein, die im Flußdiagramm gemäß Fig. 11 dargestellt ist.
Wie oben beschrieben, kann das für die Zeitausrichtung auf jeder Stufe gewählte Spachmustersegment über den gesamten Bereich von Endrahmen erstreckt werden, die für die vorhergehende Stufe bestimmt worden sind. Es wurde jedoch gefunden, daß die Endrahmen an den äußersten Enden eines Stufen-Sprachmustersegments im allgemeinen sehr große kumulative Abstandssignale haben. Demgemäß sind die über diese Endpunkte erzeugten Wege sehr unwahrscheinlich. Der Bereich der Anfangsrahmen SN wird für jede Stufe beschränkt auf
um diese sehr unwahrscheinlichen Wege zu eleminieren. MT ist ein fester Bereichsfaktor und d p /n d das normierte, minimale, kumulative Abstandssignal, das bei der Verarbeitung der vorhergehenden Stufe erhalten worden ist. Im einzelnen werden die Endpunkte einer Stufe nach der DTW-Verarbeitung der Stufe abgetastet, um den minimalen, normalisierten, kumulativen Abstand und den entsprechenden Endpunkt n p zu bestimmen. Es wird dann dieser Abstandswert d p /n d benutzt, um den Bereich des Anfangsrahmens für die DTW-Verarbeitung der nachfolgenden Stufe zu begrenzen. Die Bestimmung des minimalen, normalisierten Abstandssignals und des ihm entsprechenden Rahmens ist im Flußdiagramm gemäß Fig. 11 dargestellt und wird mit der Schaltung gemäß Fig. 2 und 3 unter Steuerung des Bereichssteuergeräts 440 durchgeführt. Die Bereichseinstelloperationen werden abhängig vom Signal EC von der Steuerung 430 eingeleitet, das bei der Bestimmung der DTW-Stufenverarbeitungsbetriebsweise auftritt. Unter Ansprechen auf das Signal EC erzeugt die Folgesteuerschaltung 400 den Startimpuls SD. Dieser wird der Bereichssteuerung 440 zugeführt, die zu Anfang die Impulse SN 1D, SLPN und das Steuersignal BF erzeugt. Der Impuls SN 1D stellt über das ODER-Gatter 461 den Anfangsrahmenzähler 230 zurück, so daß das Signal n s =1 entsprechend dem Index-Einstellkästschen 1110 in Fig. 11 ist. Der Impuls SLPN von der Steuerung 440 führt ein Signal d p =LPN in den Zwischenspeicher 309 ein, während der Impuls SLT 1 ein Signal 1 in den Zwischenspeicher 320 gibt (Index-Einstellkästchen 1120). Das ODER-Gatter 469 liefert ein Signal B an die Adressenlogik 290 in Fig. 2, und zwar unter Ansprechen auf das Signal BF von der Steuerung 440. Das Signal B bereitet das UND-Gatter 233 über das ODER-Gatter 231 und außerdem das UND-Gatter 258 über das ODER-Gatter 252 vor. Auf diese Weise werden das Abtast-Rahmenausgangssignal des Anfangsrahmenzählers 230 als Signal und das Stufensignal L=1 vom Stufenzähler 250 als Signal an die Adresseneingänge des Stufenspeichers 210 geliefert. Der Komparator 311 vergleicht das normalisierte, kumulative Abstandsausgangssignal (n s )/n s vom Teiler 335, Abschnitt 210-2, entsprechend dem Entscheidungskästchen 1130 mit dem Ausgangssignal (d p /n d) des Zwischenspeichers 309. Der Teiler 335 kann eine integrierte, arithmetische Prozessoreinheit enthalten. Falls das Signal (n s /n s kleiner als das Ausgangssignal d p /n d des Zwischenspeichers 309 ist, wird der Ausgang DL des Komparators 311 eingeschaltet. Dadurch wird das Signal (n s /n s vom Speicherabschnitt 210-2 in den Zwischenspeicher 309 gegeben, während entsprechend dem Kästchen 1140 der entsprechende Rahmen n s in den Zwischenspeicher 320 gegeben wird. Bei Abwesenheit eines Signals DL vom Komparator 311 bleibt der Inhalt der Zwischenspeicher 309 und 320 unverändert. Die Steuerung 440 erzeugt dann den Impuls IN 1D, der dem Anfangsrahmenzähler 230 über das ODER-Gatter 463 zugeführt wird, um entsprechend dem Index-Kästchen 1150 den Abtastrahmen n s weiterzuschalten. Wenn der weitergeschaltete Rahmen n s der Endrahmen des Sprachmusters ist (Entscheidungskästchen 1160), so liefert der Anfangsrahmenzähler 230 das Signal NMS, um die Bereichseinstelloperation zu beenden, indem die Bereichssteuerung 430 veranlaßt wird, das Endesignal ED zu erzeugen. Während der Folge von Bereichsabtastoperationen wird der Wert n s vom Rahmenzähler 230 über das UND-Gatter 324 und das ODER-Gatter 326 einem Eingang des Subtrahierers 330 zugeführt. Dieser erzeugt das Signal Nm-n d. Der Komparator 332 liefert das Signal DE, wenn das Signal n d entsprechend dem Entscheidungskästchen 1170 im Endrahmenbereich δ END liegt. Wenn das Signal DE eingeschaltet ist, stellt der Minimalabstandsrahmen n d einen gültigen Endrahmen für die Verarbeitung der Stufe dar, und die Verarbeitung wird beendet. Für die Stufe L=1 ist das minimale, normierte Abstandssignal im Zwischenspeicher 309 aus Tabelle 1 und der zugehörige n d-Rahmen ist 33. Folglich wird das Signal DE am Ausgang des Komparators 332 nicht eingeschaltet, und es wird die Einleitungsbetriebsweise entsprechend dem Flußdiagramm in Fig. 8 gestartet. Das Signal ED von der Bereichssteuerung 440 und das Signal vom Komparator 332 werden am Ende der Bereichseinstellbetriebsweise der Folgesteuerung 400 zugeführt. Diese startet die Einleitungsbetriebsweise für die zweite Stufe durch Erzeugung des Steuerimpulses SI, der die Stufen- Betriebseinleitungssteuerung 410 aktiviert. In der Steuerung 410 werden unter Ansprechen auf den Impuls SI das Steuersignal I und der Steuerimpuls SN 1I erzeugt. Wie oben mit Bezug auf die Betriebseinleitung der ersten Stufe beschrieben worden ist, veranlaßt das Signal I die Stufenspeicher-Adressierlogik 290. Rahmenabtastsignale vom Rahmenzähler 230 und das Stufensignal L+1=2 vom Stufenzähler 250 den Adresseneingängen des Stufenspeichers 210 zuzuführen. Das Signal bereitet außerdem die Gatter 274 und 284 vor, wodurch ein LPN-Code dem Eingang des Stufenspeicherabschnitts 210-2 und ein Null-Code dem Eingang des Stufenspeicherabschnitts 210-1 zugeführt werden. Der Rahmenzähler 230 wird durch den Impuls SN 1 vom ODER-Gatter 461 entsprechend dem Index-Einstellkästchen 810 in Fig. 1 auf den Zustand n s =1 zurückgestellt. Die Rahmenstellen n s der zweiten Stufe für die Stufe L+1=2 werden dann entsprechend dem Kästchen 820, 830 und 840 nacheinander abgeändert. Zu Anfang adressiert das Signal n s =1 vom Rahmenzähler 230 den ersten Sprachäußerungsrahmen n s =1 der Stufe L+1=2 im Speicher 210. Der Code LPN wird in den Abschnitt 210-2 und der Code "Null" in den Speicherabschnitt 210-1 eingegeben, und zwar unter Ansprechen auf den Schreibbetätigungsimpuls WLS, der aus dem Ausgangssteuerimpuls WLSI der Steuerung 410 abgeleitet wird. Dann wird entsprechend dem Index-Kästchen 830 in Fig. 8 durch einen Impuls IN 1I von der Steuerung 410 der Rahmenzähler 230 weitergeschaltet. Das Einschreiben wird für die nachfolgenden Signale n s vom Rahmenzähler 230 wiederholt, solange das Signal n s den Sprachmuster-Endrahmen N m nicht übersteigt (Entscheidungskästchen 840). Wenn n s =n m ist, wird das Signal NMS vom Rahmenzähler 230 eingeschaltet. Die Steuerung 410 liefert dann den Ende-Impuls EI, um die Einleitungsbetriebsweise zu beenden. Die im Flußdiagramm gemäß Fig. 9 dargestellte Abtastbetriebsweise wird unter Steuerung der Abtaststeuerung 420 durchgeführt. Die Steuerung 420 wird durch einen Steuerimpuls SB von der Folgesteuerschaltung 400 durch den Ende-Impuls EI aktiviert. Am Anfang der Abtastbetriebsweise wird die Adressierlogik 290 veranlaßt, das Signal n s vom Rahmenzähler 230 und das Signal L vom Stufenzähler 250 mittels des Signals BB vom Steuergerät 420 an die Adresseneingänge des Stufenspeichers 230 anzulegen. Der Impuls SNM stellt den Rahmenzähler 230 auf den Zustand n s =n m ein (Indexkästchen 910). Die Signale (N m ) und SN (N m ) vom Stufenspeicher 210 werden dem Teiler 355 bzw. dem UND-Gatter 335 zugeführt. Das Signal MT ist dauernd auf 1,2 eingestellt. Der Teiler 335 erzeugt das Signal (Nm)/N m =LPN/128, das mit dem Ausgangssignal des Multiplizierers 303 (1,2 d p /n d=0,458) verglichen wird. Das Signal â(Nm)/N m übersteigt das Multipliziererausgangssignal. Das Signal DMT vom Komparator 305 wird nicht eingeschaltet, und das Signal DMTA vom UND-Gatter 381 bleibt abgeschaltet (Entscheidungskästchen 912). Unter Ansprechen auf das abgeschaltete DMTA-Signal vom UND-Gatter 381 liefert die Steuerung 420 einen Impuls DN 1, der den Rahmenzähler 230 zurückschaltet. Das Rückschalten des Zählers findet unter Ansprechen auf ein abgeschaltetes DMTA-Signal für die aufeinander folgenden Rahmen N m , N m-1 usw. statt, bis ein Rahmen n s erreicht ist, für den gilt: d(n s )/n s 0,458. Dies findet statt im Rahmen n s =39, für den gilt: SN (39)≠0 und d(ns)/n s =0,426. Es wird dann das Signal DMTA vom Gatter 381 eingeschaltet. Das Signal n s =39 wird unter Ansprechen auf die Signale DMTA und BD in den Zwischenspeicher 350 eingegeben (Kästchen 920). Das Signal n s wird über das Gatter 383 einem Eingang des Komparators 385 zugeführt. Falls n<0 ist, wird das Signal NS 0 betätigt. Unter Ansprechen auf das Signal NSO erzeugt die Abtaststeuerung 420 ein Signal RPT. Das Signal RPT schaltet den Nachrichten-Synthetisierer 295 ein, und der Sprecher wird aufgefordert, seine Sprachäußerung zu wiederholen. In der Steuerung 420 wird durch das Signal DMTA das Signal BD abgeschaltet und das Signal BU eingeschaltet. Der über das ODER-Gatter 461 von der Steuerung 420 zugeführte Impuls SN 1B stellt entsprechend dem Index-Einstellkästchen 922 in Fig. 9 den Zähler 230 in den Zustand n s =1 zurück, so daß die Signale (1) und SN (1) auf den Leitungen 211-2 bzw. 211-1 zur Verfügung stehen. Entsprechend dem Entscheidungskästchen 924 wird das Signal (n s )/MD mit dem Bereichseinstellfaktor (MT) · (dp/n d) verglichen, und der Anfangsrahmen SN(n s ) wird mit Null verglichen, um festzustellen, ob der augenblickliche Abtastrahmen n s innerhalb des vorgeschriebenen Bereichs liegt. Das während der Verarbeitung der Stufe 1 gewonnene, minimale, normierte Abstandssignal wird im Zwischenspeicher 309 in Fig. 3 abgelegt. Das Signal wird im Multiplizierer 303 mit dem Bereichsfaktor MT=1,2 multipliziert, und das Ausgangssignal des Multiplizierers wird einem Eingang des Komparators 305 zugeführt. Das Signal (d) (1)/1=LPN vom Teiler 355 gelangt an den anderen Eingang des Komparators 305. Der Ausgang des Komparators 305 wird nicht betätigt. Das Signal SN (1)=0 wird einem Eingang des Komparators 338 über das UND-Gatter 335 und das ODER-Gatter 337 zugeführt. Der Ausgang des Kompaators 338 wird nicht betätigt, weil das Signal SN nicht größer als Null ist. Demgemäß bleibt das Signal DMTA vom UND-Gatter 381 abgeschaltet. Zu diesem Zeitpunkt erzeugt die Steuerung 420 das Signal IN 1B, das den Rahmenzähler 230 über das ODER-Gatter 463 weiterschaltet. Auf diese Weise wird das Signal n s vom Rahmenzähler 230 entsprechend dem Index-Änderungskästchen 930 in Fig. 9 auf Zwei eingestellt. Die Signale vom Stufenspeicherabschnitt 210-2 haben den Wert LPN, bis der Rahmen n s =29 erreicht ist. Das Signal (n s )/n s für den Rahmen n s =29 ist 15,2/29=0,524, und das entsprechende SN-Signal ist Eins. Wenn die Stellen n s =29 des Stufenspeichers 210 adressiert werden, bleibt der Komparator 305 abgeschaltet, und der Komparator 338 wird betätigt. Das Signal DMTA bleibt abgeschaltet, und der Rahmenzähler 230 wird auf n s =30 weitergeschaltet. Beim Rahmen n s =31 wird das Signal DMTA vom UND-Gatter 331 unter Ansprechen auf SN (31)=1 und = 0,423 der Steuerung 420 zugeführt, und die Abtastbetriebsweise der zweiten Stufe wird durch Erzeugung des Signals EB in der Steuerung 420 beendet. Der Impuls EB veranlaßt die Folgesteuerschaltung 400, die Steuerimpulse FSL und SC zu erzeugen. Der Impuls FSL stellt das Abbruch- Flipflop 291 ein und überträgt den Code n s =31 in den Zwischenspeicher 501 in Fig. 5. In diesem Rahmen wird die dynamische Zeitverkettungsverarbeitung der zweiten Stufe gestartet. Das Signal SC veranlaßt die DTW-Steuerung 440, die DTW-Verarbeitung für die zweite Stufe entsprechend dem Flußdiagramm in Fig. 10 einzuleiten. Bei der DTW-Verarbeitung der zweiten Stufe erstreckt sich der Bereich der Sprachmustersegment-Anfangsrahmen vom Rahmen n s =31 zum Rahmen n s =39. Zu Anfang werden die Steuerimpulse SW 1 und FSR sowie das Steuersignal C von der Steuerung 430 unter Ansprechen auf den Impuls SC von der Folgesteuerschaltung 400 geliefert. Der Impuls SW 1 stellt entsprechend dem Index-Kästchen 1005 in Fig. 10 den Wortzähler 220 auf w=w₀ zurück. Der Impuls FSR überträgt den Code n s =31 vom Zwischenspeicher 501 zum Zähler 503 (Kästchen 1010) und stellt den Zähler 505 auf Eins zurück. Das Signal C veranlaßt die Adressierlogik 290, das Rahmensignal vom Zähler 503 und das Stufensignal L=1 vom Stufenzähler 250 an die Adressensteuereingänge und des Stufenspeichers 210 anzulegen. Es wird dann das Signal DST von der Steuerung 430 an den DTW-Prozessor 207 gegeben, um die dynamische Zeitverkettung zwischen den Sprachmustersegment-Merkmalssignalen des Rahmens 31 im Speicher 203 und den Merkmalssignalen für das Bezugswort Null im Bezugswortspeicher 205 zu starten. Die Zeitausrichtungsverarbeitung des Prozessors 207 schreitet entsprechend dem Kästchen 1015 in Fig. 10 weiter, wie mit Bezug auf die Verarbeitung der ersten Stufe beschrieben worden ist. Wegen der Unähnlichkeit der Merkmalssignale für das Bezugswort "Null" mit dem Sprachmustersegment der zweiten Stufe wird die dynamische Zeitverkettung entsprechend dem Entscheidungskästchen 1020 abgebrochen, bevor entsprechend dem Entscheidungskästchen 1025 ein Endpunkt erreicht ist. Demgemäß werden keine Abstandssignale oder Anfangsrahmensignale für das Bezugswort "Null" im Stufenspeicher 210 abgelegt. Unter Ansprechen auf das Signal AB vom Komparator 511 und das Signal DDN vom Prozessor 207 zum Zeitpunkt des Abbruchs erzeugt der Prozessor 430 dem Impuls IW 1. Dieser schaltet entsprechend dem Index-Kästchen 1050 den Wortzähler 220 weiter, so daß die DTW-Verarbeitung für das Bezugswort "Eins" gestartet werden kann. Es wird das Signal FSR erzeugt und der Zähler 503 auf den Anfangsrahmencode n=31 sowie der Zähler 505 auf den ersten Zustand zurückgestellt. Die DTW-Verarbeitung für das Bezugswort "Eins" wird ausgehend vom Rahmen n=31 für jeden Sprachmusterrahmen unter Ansprechen auf nachfolgende Startimpulse DST von der Steuerung 430, Ende-Impulse DDN vom Prozessor 207 und Weiterschaltimpulse FSI von der Steuerung 430 durchgeführt. Die Operationen folgen der Schleife mit dem Kästchen 1015, den Entscheidungskästchen 1020, 1025 und 1040 sowie dem Index-Änderungskästchen 1045 in Fig. 10, bis der Sprachmusterrahmen 71 verarbeitet wird. Beim Rahmen 71 ist das Bezugswort-Rahmensignal M H für die obere Grenze vom DTW-Prozessor 207 größer als der Bezugswort-Endrahmen M²₁ für das Bezugswort "Eins". Das Signal EP, nämlich die Endrahmenangabe, wird vom Komparator 520 in Fig. 5 entsprechend dem Entscheidungskästchen 1025 erzeugt. Das Signal EP wird durch die Steuerung 430 erzeugt und dann in das Entscheidungskästchen 1030 eingetreten. Das kumulative Abstandssignal für den Rahmen 71 im Stufenspeicherabschnitt 210-2 wird zum Komparator 301 gegeben und das kumulative DTW-Abstandssignal d s vom Prozessor 207 wird dem anderen Eingang des Komparators 301 zugeführt. Das Signal d s =41,2 ist kleiner als =LPN. Das Signal E verändert die Adressierlogik 290 so, daß der Rahmen n=71 der Stellen für die Stufe L+1=2 im Stufenspeicher 210 adressiert werden. Das Signal DS vom Komparator 301 wird eingeschaltet, und die Steuerung 430 erzeugt das Signal WLSC. Es werden dann das kumulative Abstandssignal d s (71)=41,2 und der Anfangsrahmencode SN (71)=38 über die UND-Gatter 280 bzw. 274 in den Stufenspeicher 210 gegeben, und zwar unter Ansprechen auf das Schreibbetätigungssignal WLS. Das Identifiziersignal für das Bezugswort "Eins" wird über das UND-Gatter 281 in den Stufenspeicher 210 gegeben. Wenn die Einspeicherung der Signale d s und SFN entsprechend dem Kästschen 1035 beendet ist, wird wiederum in das Kästchen 1015 für den Rahmen n=72 eingetreten, und zwar über das Entscheidungskästchen 1040 und das Indexkästchen 1045. Auf entsprechende Weise wird ein Impuls EP für jeden der Sprachmusterrahmen 72 und 73 erzeugt. Das kumulative Abstandssignal d s =35,2 für den Rahmen n=72 und der Anfangsrahmencode SFN=38 vom Prozessor 207 werden in die Stufe L+1=2 des Speichers 210 eingegeben. Für den Sprachmusterrahmen 73 werden das kumulative Abstandssignal d s =39,1 und das Signal SFN=38 vom Prozessor 207 in die Stufe L+1=2 des Speichers entsprechend dem Kästchen 1035 eingechrieben. Nach der Verarbeitung für den Rahmen n=73 führt die dynamische Zeitverkettung entsprechend dem Kästchen 1015 zu einem Abbruchsignal AB vom Komparator 511 (Entscheidungskästchen 1020). Bei Erzeugung des Signals AB wird der Wortzähler 220 entsprechend dem Indexkästchen 1050 durch das Signal IW 1 weitergeschaltet. Der Zähler 503 wird entsprechend dem Kästchen 1010 auf den Rahmen n=31 zurückgestellt, und die dynamische Zeitverkettung für das Bezugswort "Zwei" wird unter Steuerung der Steuerschaltung 430 gestartet. Die DTW-Verarbeitung des Bezugswortes "Zwei" für die zweite Stufe führt zu Zeitausrichtungswegen, die bei den Sprachmustersegment-Rahmen 47 bis 60 enden. Eine Teilaufstellung der kumulativen Abstandssignale d s und der Anfangsrahmensignale SFN für diese Endrahmen ist in Tabelle 2 angegeben. Für jeden dieser Sprachmusterrahmen betrug das vorher im Speicher 210-2 gespeicherte Abstandssignal =LPN. Das kumulative Abstandssignal vom Prozessor 207 läßt den Komparator 301 ansprechen, wodurch das kumulative Abstandssignal und die Anfangsrahmencodierungen vom Prozessor 207 unter Ansprechen auf Signale E und WLSC von der Steuerung 430 in den Stufenspeicher 210 gegeben werden. Die DTW-Verarbeitung für das Bezugswort "Zwei" wird am Ende der Operation des Prozessors 207 für den Sprachmustersegmentrahmen n=60 beendet, nachdem das Signal EP vom Komparator 520 erzeugt (Kästchen 1025) und die Signale d s (60) und SFN (60) vom Prozessor in den Stufenspeicher 210 gegeben worden sind (Kästchen 1035). Dann wird der Komparator 522 betätigt, und zwar unter Ansprechen darauf, daß der Bezugswortrahmen M L der unteren Grenze gleich dem Endrahmen M des Bezugswortes ist. Nach Durchführung der Änderungen im Stufenspeicher 210 für den Rahmen 60 wird das Signal DN erzeugt. Das Signal DN vom ODER-Gatter 528 veranlaßt die DTW-Steuerung 430, die dynamische Zeitverkettung für das Bezugswort "Drei" entsprechend den Index-Einstellkästchen 1050, 1055 und 1010 durchzuführen. Die Steuerung 430 erzeugt den Impuls IW 1, der den Wortzähler 220 auf den Zustand w=w₃ weiterschaltet, sowie den Impuls FSR. Der Impuls FSR überträgt das Signal n=31 im Zwischenspeicher 501 zum Zähler 503 und stellt den Zähler 505 in seinen ersten Zustand zurück. Der Impuls FSR stellt außerdem das Flipflop 370 ein, um das Signal DMTR einzuschalten. Der DTW- Prozessor 207 wählt nacheinander Zeitausrichtungswege unter Ansprechen auf die Merkmalssignale für das Bezugswort "Drei" aus dem Speicher 205 und die Sprachmustersegment-Merkmalssignale für diejenigen Rahmen, welche durch den Zähler 503 entsprechend dem Kästchen 1015 adressiert werden. Die Verarbeitung der nachfolgenden Rahmen, ausgehend vom Rahmen n=31, folgt der Schleife, die das Kästchen 1015, die Entscheidungskästchen 1020, 1025, 1040 und das Index-Einstellkästchen 1045 in Fig. 10 umfaßt, und zwar ohne Erzeugung des Signals EP, bis das Signal d′ vom Prozessor 207 das Schwellenwertsignal am Ausgang des Festwertspeichers 509 übersteigt. Wegen der Unähnlichkeit der Merkmalssignale des Bezugswertes "Drei" und derjenigen des Sprachmustersegments für die zweite Stufe wird kein Ausrichtungsendpunkt im Komparator 520 festgestellt, bevor das Abbruchsignal AB im Komparator 511 eingeschaltet wird. Unter Ansprechen auf das Signal AB vom Komparator 511 und das Signal DDN vom Prozessor 207 in demjenigen Rahmen, in welchem die Abbruchbedingungen auftreten, leitet die Steuerung 430 die DTW-Verabeitung für das Bezugswort "Vier" durch Erzeugung der Signale IW 1 und FSR entsprechend den Index-Einstellkästchen 1050, 1055 und 1010 ein. In Tabelle 3 sind die Endpunkte der Zeitausrichtungswege angegeben, die während der DTW-Verarbeitung für das Bezugswort "Vier" erzeugt werden. Am Ende der DTW-Verarbeitung für den Sprachmusterrahmen n=59 im Prozessor 207 wird das Signal =30,0 vom Stufenspeicherabschnitt 210-2 mit dem vom Prozessor 207 gewonnenen Signal d s im Komparator 301 verglichen. Da das Signal =30,0 (Tabelle 2) kleiner als das Signal d s =31,2 (Tabelle 3) ist, wird der Komparator 301 nicht erregt, und die DTW-Verarbeitung für den Rahmen 60 wird ohne Einschreiben der Signale d s und SFN für den Rahmen 59 vom Stufenprozessor 207 eingeleitet. Im Ergebnis hält der Stufenspeicher 210 die Codierungen w=2, =30,0 und SFN=32 fest, die vorher bei der Verarbeitung des Sprachmusterrahmens n=59 für das Bezugswort "Zwei" eingeschrieben worden sind. Das bei der Verarbeitung im Rahmen n=60 für das Bezugswort "Vier" erzeugte Signal EP bewirkt das Einschreiben der Codierungen d s =26,3 und SFN=34 vom Prozessor 207 in den Stufenspeicher 210. Dies geschieht deswegen, weil das Signal d s =26,3 (Tabelle 3) kleiner als das Signal =31,2 (Tabelle 2) ist, das vorher während der DTW-Verarbeitung für das Bezugswort "Zwei" in den Stufenspeicher 210 eingegeben worden ist. Auf entsprechende Weise werden die Rahmenwerte n=71 und n=73 für das Bezugswort "Vier" anstelle der für das Bezugswort "Eins" gewonnenen Werte in den Speicher 210 gegeben. Die Werte für den Rahmen n=72 beim Bezugswort "Eins" werden jedoch im Speicher 210 festgehalten. Entsprechend der Erfindung wird der beste Ausrichtweg für jeden Endrahmen der Stufe im Pegelspeicher abgelegt. Nach der DTW-Verarbeitung für den Rahmen n=99 wird kein Endrahmen entsprechend dem Entscheidungskästschen 1025 vor Beendigung der DTW-Verarbeitung über das Abbruchs- Entscheidungskästchen 1020 oder das Endrahmen-Entscheidungskästchen 1040 erhalten. Unter Ansprechen auf entweder die Signale DDN und AB oder DDN und D kann in das Wortindex-Einstellkästchen 1050 eingetreten werden, wodurch die Steuerung 430 Impulse W 1 und FSR erzeugt, um die DTW-Verarbeitung für das Bezugswort "Fünf" zu erzeugen. Die Verarbeitung für das Bezugswort "Fünf" führt zu Zeitausrichtungswegen, die bei Rahmen 98 bis 102 entsprechend der Auflistung in Tabelle 4 enden. Zeitausrichtungs-Wegeintragungen werden für die Rahmen 98 und 99 des Bezugswortes "Vier" in den Stufenspeicher 210 eingegeben. Bei der DTW-Verarbeitung für das Bezugswort "Fünf" festgestellte Wege enden ebenfalls bei den Rahmen 98 und 99. Mit Bezug auf den Rahmen 98 ist das kumulative Abstandssignal für das Bezugswort "Vier" kleiner als das für das Bezugswort "Fünf", und die in Tabelle 3 aufgeführten Signale für den Rahmen werden im Stufenspeicher 210 festgehalten. Für den Rahmen 99 ist das in Tabelle 4 aufgeführte Abstandssignal kleiner als das in Tabelle 3. Folglich ersetzen das Abstandssignal d s =55,9 und der Anfangsrahmencode SFN=32 am Ausgang des Prozessors 207 im Rahmen 99 das Abstandssignal und den Anfangsrahmencode, die für das Bezugswort "Vier" in den Stufenspeicher 210 eingegeben worden sind. Bei Beendigung der DTW-Verarbeitung für das Bezugswort "Fünf" über das Entscheidungskästchen 1020 oder das Kästchen 1040 wird die Erkennungsschaltung gemäß Fig. 2 und 3 in die Lage versetzt, nacheinander die Bezugswörter "Sechs", "Sieben", "Acht" und "Neun" zu verarbeiten. Die Merkmalssignale für diese Bezugswörter führen jedoch nicht zu Zeitausrichtungswegen, und die Signale d s und SFN für diese Bezugswörter werden nicht in dem Stufenspeicher 210 gegeben. Nach Verlassen der DTW-Verabeitgung für das Bezugswort "Neun" über das Abbruch-Entscheidungskästchen 1020 wird der Wortzähler 220 entsprechend dem Wortindex-Einstellkästchen 1050 weitergeschaltet, und es erfolgt ein Eintreten in das Abbruchmerkzeichen-Entscheidungskästchen 1060 über das Letztwort-Entscheidungskästchen 1055 unter Ansprechen auf das Signal W m im Wortzähler 220. Das Signal W m veranlaßt die Steuerung 400, den Ende-Impuls EC zu erzeugen, der die Abstandsverarbeitung für die Stufe 2 beendet. Während der DTW-Verarbeitung für jedes Bezugswort steuern die Signale R₁ und R₂ die Operationsbeschränkungen des Prozessors 207. Wie oben erwähnt, ändert sich die Auswahl der Bezugswortrahmen, um einer Koartikulation Rechnung zu tragen. Der Bereich der Anfangsrahmen für die Stufe 2 erstreckt sich vom Rahmen 31 bis zum Rahmen 39. Das Signal DMTR vom Flipflop 370, das nur während des Anfangsrahmenbereichs auftritt, wird dem UND-Gatter 530 in Fig. 5 zugeführt. Zwischen den Rahmen 31 und 39 ist das Signal DMTR eingeschaltet. Wenn das Bezugswort-Rahmensignal M L für die untere Grenze vom Prozessor 207 kleiner als SR 1 ist, so wird der zulässige Bezugswort-Rahmenbereich im Prozessor 207 unter Ansprechen auf das Signal R bis zum Bezugsrahmen m=1 ausgedehnt. Die Ausgangssignale und SN vom Speicher 210 werden dem DTW-Prozessor 207 über die Gatter 242 und 246 zugeführt, so daß der Anfangsrahmen und der Anfangsabstand für einen neuen Zeitausrichtweg bei der dynamischen Zeitverkettungsoperation des Prozessors benutzt werden können. Das Signal DMTR begrenzt den Anfangsrahmenbereich der Stufenverarbeitung auf die Zeitausrichtungsweg-Endpunkte der unmittelbar vorhergehenden Stufe. Dies stellt die Kontinuität der Zeitausrichtwege zwischen den Stufen sicher. Das Sprachmuster-Rahmensignal n w für die Grenze des oberen Bereichs im Zwischenspeicher 360 wird mit dem Verarbeitungsrahmensignal n vom Zähler 503 im Komparator 366 verglichen. Das Flipflop 370 wird durch das Signal FSR im Rahmen n s =31 eingestellt und bleibt zwischen den Rahmen n s =31 und n s =39 eingestellt. Wenn das Rahmensignal n=40 erreicht ist, so wird der Ausgang des Komparators 366 betätigt, und das Flipflop 370 wird zurückgestellt. Das Gatter 530 wird durch das Signal DMTR vorbereitet, so daß der Bereich des gewählten Bezugswort-Anfangsrahmens zwischen den Sprachmustersegmentrahmen n s =31 und n s =39 liegt. Danach wird das Gatter 530 in Fig. 5 gesperrt, so daß der Prozessor 207 unter Ansprechen auf das Signal R₂ vom Komparator 511 nur mit den Endbereichseinschränkungen oder den Zwischenbereichseinschränkungen gemäß Gleichung (7) arbeiten kann. Tabelle 5 zeigt die Ausrichtungswegsignale , und SN, die im Stufenabsschnitt L=2 des Speichers 210 am Ende der DTW-Verarbeitung der zweiten Stufe für die Sprachmusterrahmen 47 bis 102 gespeichert sind. In der ersten Spalte sind die Ausrichtweg-Endrahmen angegeben. In der Spalte 2 findet sich die Bezugswort- Identifizierung für den kleinsten kumulativen Abstandsweg, der beim Endrahmen der Spalte 1 endet. In Spalte 3 ist das kumulative Abstandssignal für den Ausrichtweg angegeben, der beim Endrahmen der Spalte 1 endet, und Spalte 4 führt den Anfangsrahmen SN des Ausrichtweges auf, der beim Endrahmen der Spalte 1 endet. In der ersten Zeile der Tabelle 5 ist beispielsweise der Ausrichtweg- Endrahmen gleich =47. Das Bezugswort für den kleinsten kumulativen Abstandsweg ist =2. Der kumulative Wegabstand ist =23,5 und der Anfangsrahmen dieses Wegs ist SN=32. Während der DTW-Verarbeitung der zweiten Stufe ist das Abbruch-Flipflop 291 zurückgstellt worden, als Ausrichtwegsignale zuerst in den Stufenspeicher 210 eingegeben worden sind. Da der Stufenzähler 250 sich nicht auf dem Maximalwert L max befindet, ist das Signal LMS abgeschaltet. Gemeinsam ansprechend auf die abgeschalteten Signale ABFF und LMS sowie den Impuls EC vom Steuergerät 430 wird die Steuerschaltung 400 veranlaßt, die Impulse IL 1 und SD zu erzeugen. Der Impuls IL 1 schaltet den Stufenzähler 250 auf den Zustand L=2, und der Impuls SD wird der Bereichssteuerung 440 zur Einleitung der Bereichseinstell-Betriebsweise zugeführt. Wie im Einzelnen mit Bezug auf die Stufe 1 beschrieben, werden die Endrahmen der gerade verarbeiteten Stufe L=2 entsprechend dem Flußdiagramm in Fig. 11 abgetastet, um das minimale, normierte Abstandssignal d p /n d zu bestimmen. Dieses Signal wird im Zwischenspeicher 309 abgelegt, und der Rahmen, in welchem das Signal n d aufgetreten ist, wird entsprechend der Darstellung in Fig. 11 im Zwischenspeicher 320 gespeichert. Das für die Stufe 2 bestimmte Signal d p /n d ist 0,435 und der entsprechende Rahmen ist 63. Da der Rahmen n d=63 nicht innerhalb der SEND=4-Rahmen des Sprachmuster-Endrahmens (128) auf der zweiten Stufe ist (Entscheidungskästchen 1170), wird die Einleitungsbetriebsweise für die dritte Stufe gestartet. Entsprechend dem Flußdiagramm für die Einleitungsbetriebsweise nach Fig. 8 wird jede der Rahmenspeicherstellen im Stufenspeicher 210 für die Stufe L+1=3 so eingestellt, daß das Signal (n s )=LPN und das Signal SN(n s )=0 ist. Nachdem die Speicherstelle des Sprachmuster-Endrahmens N m eingeleitet ist, wird das Signal EI von der Stufen- Betriebseinleitungssteuerung 410 erhalten (Entscheidungskästchen 840), und die Abtastbetriebsweise wird unter Ansprechen auf das Signal SB von der Folgesteuerschaltung 400 eingeleitet. Bei der Abtastbetriebsweise wird der Bereich von Anfangsrahmen für die dynamische Zeitverkettungsverarbeitung der dritten Stufe entsprechend dem Flußdiagramm in Fig. 9 unter Steuerung von Signalen des Abtaststeuergeräts 420 ausgewählt. Die obere Grenze des Bereichs wird zuerst entsprechend dem Entscheidungskästchen 912 bestimmt. Der Rahmen 88 wird als Rahmen n w gewählt, da das Signal (88)/88=0,519 kleiner als das Signal 1,2(d p /n p )=0,522 im Zwischenspeicher 309 ist. Nachdem der Rahmen n s =88 für die obere Grenze im Zwischenspeicher 360 abgelegt ist (Index-Einstellkästschen 920), wird der Rahmenzähler 230 auf den Zustand n s =1 zurückgestellt (Indexeinstellkästchen 922). DieAbstandssignale vom Stufenspeicher 210 für den Rahmen n s =1 werden dann mit dem Signal 1,2(dp/n p ) vom Multiplizierer 303 verglichen, und das entsprechende Signal SN wird entsprechend dem Entscheidungskästchen 924 mit Null verglichen, bis der Sprachmusterrahmen 53 erreicht ist. Das normierte Abstandssignal für den Rahmen 53 (0,519) ist kleiner als 1,2 dp/n p (0,522), wodurch das DMTR-Signal vom Flipflop 370 eingeschaltet wird. Die Steuerung 420 liefert dann das Ende-Signal EB (Entscheidungskästchen 924), und es wird in die DTW-Verarbeitungsbetriebsweise des Flußdiagramms gemäß Fig. 10 eingetreten. Die DTW-Verarbeitung der Stufe 3 entsprechend dem Flußdiagramm in Fig. 10 führt zur Erzeugung der Zeitausrichtungswege, für die die kumulativen Abstandssignale , die Anfangsrahmensignale SN und die gewählten Bezugswortsignale im Stufenspeicher 210 abgelegt werden. In der Tabelle 6 sind die in den Stufenspeicher 10 für die DTW-Verabeitung der dritten Stufe eingegebenen Signale , und SN aufgeführt. Die Endrahmen der Stufe 3 erstreckens ich gemäß Tabelle 6 vom Rahmen 75 zum Äußerungsendrahmen 128. Alle Anfangsrahmen SFN in Tabelle 6 liegen im Bereich SFN=53 bis SFN=89 entsprechend der Bereichseinschränkungsoperation, die der Verarbeitung der Stufe 3 vorausgeht. Nur die Merkmalssignale der Bezugswörter "Null", "Eins", "Drei", "Vier" und "Fünf" waren den Merkmalssignalen des Sprachmustersegments der Stufe 3 ausreichend ähnlich, um zu annehmbaren Ausrichtungswegen zu führen. Für das Bezugswort "Null" haben die Wege Endrahmen zwischen den Rahmen 103 und 105. Die Endrahmen für die Wege des Bezugswortes "Eins" erstrecken sich vom Rahmen 79 bis zum Rahmen 82. Für das Bezugswort "Vier" erstrecken sich Endrahmen zwischen den Rahmen 75 bis 79 und zwischen den Rahmen 106 bis 115. Für das Bezugswort "Fünf" liegen die Wegendrahmen zwischen den Rahmen 84 und 102. Am Ende der DTW-Verarbeitung für das Bezugswort "Neun" der Stufe 3 wird entsprechend dem Entscheidungskästchen 1060 das Abbruch-Merkzeichen als zurückgestellt festgestellt, der Stufenzähler 250 wird auf den Zustand L=3 weitergeschaltet, und die Bereichseinstellbetriebsweise gemäß Fig. 11 wird entsprechend dem Entscheidungskästchen 1070 eingeleitet. Wie mit Bezug auf die vorhergehende Stufe beschrieben worden ist, werden die Ergebnisse der im Stufenspeicher 210 abgelegten DTW-Verarbeitung der Stufe 3 zwischen dem Rahmen n s =1 bis zum Endrahmen N m =128 abgetastet. Das kumulative Abstandssignal für den Endrahmen 90 in Tabelle 6 ist 33,1 und der zugeordnete normierte Abstand (0,368) wird mittels des Teilers 355, des Zwischenspeichers 309 und des Komparators 311 als Minimum festgestellt. Das Signal 0,368 wird im Zwischenspeicher 309 abgelegt. Das dem minimalen normierten Abstand entsprechende Rahmensignal n s =90 wird während der Abtastoperation in den Zwischenspeicher 320 geliefert und dem Subtrahierer 330 als Signal n d zugerührt, um zu bestimmen, wie weit n d vom Endrahmen N m entfernt ist. Das Ausgangssignal des Subtrahierers 330 wird im Komparator 332 mit dem Signal SEND=4 verglichen. Da N m -n d =38 Rahmen ist, wird das Signal DE vom Komparator 332 nicht betätigt, und es ist die Verarbeitung für die vierte Stufe nötig. Unter Bezugnahme auf das allgemeine Flußdiagramm in Fig. 6 wird die Betriebseinleitung für die Rahmenstellen der vierten Stufe im Stufenspeicher 210 entsprechend dem Kästchen 605 so durchgeführt, daß jedes kumulative Äußerungsrahmen-Abstandssignal auf LPN und jedes Anfangsrahmensignal SN auf Null eingestellt wird. Es werden dann entsprechend dem Kästchen 607 die Rahmenstellen für die Stufe 3 abgetastet, um den Bereich zulässiger Anfangsrahmen zu bestimmen. Gemeinsam ansprechend auf das gespeicherte, minimale, normierte Abstandssignal im Zwischenspeicher 309 und die für die kumulativen Abstände bestimmten normierten Abstandssignale aus dem Stufenspeicherabschnitt 210-2 wird der Rahmen n s =2 der oberen Grenze zu n d gewählt und in den Zwischenspeicher 360 gegeben. Anschließend wird der Rahmen n s =84 der unteren Grenze gewählt und in Vorbereitung der DTW-Verarbeitung der Stufe 4 entsprechend dem Kästchen 609 im Zwischenspeicher 501 abgelegt. In Tabelle 7 sind die Ausrichtungsweg-Endpunkte, das gewählte Bezugswortsignal, die kumulativen Abstandssignale und die Anfangsrahmensignale für die Zeitausrichtungswege angegeben, die sich bei der Verarbeitung der vierten Stufe (Kästchen 609) ergeben. Die festgestellten Endrahmen erstrecken sich zwischen dem Rahmen 96 und dem Äußerungsendrahmen 128. Der Anfangsrahmenbereich liegt innerhalb der Einschränkung, die während der vorhergehenden Abtastbetriebsweise bestimmt worden ist, und es wurden Ausrichtungswege für die Bezugswörter "Zwei", "Drei" und "Vier" gefunden. Bei Beendigung der dynamischen Zeitverkettungsoperation für das Bezugswort "Neun" wird der Stufenzähler 250 auf den Zustand L=4 weitergeschaltet. Da die letzteStufe noch nicht erreicht ist (Entscheidungskästchen 611), werden die Speicherstellen für die fünfte Stufe (L=5) entsprechend dem Kästchen 605 vorbereitet. Bei der nachfolgenden Abtastung der Endrahmen der Stufe 4 (Kästchen 607) wird der minimale normierte Abstand im Rahmen 127 festgestellt. Dieses Rahmensignal wird in den Zwischenspeicher 320 gegeben und von dort zum Subtrahierer 330 übertragen. Das Ausgangssignal des Subtrahierers 330 entspricht N m -n d=1. Der Ort des minimalen normierten Rahmens liegt innerhalb von δ END=4 Rahmen vom Äußerungsendrahmen entfernt, und das Signal DE vom Komparator 332 wird eingeschaltet. Zu diesem Zeitpunkt hat der optimale Ausrichtungsweg den Bereich des Äußerungsendrahmens erreicht, und die Verarbeitung dieser Stufe wird beendet. Das Endrahmensignal NMS vom Rahmenzähler 230 veranlaßt die Bereichssteuerung 440, einen Ende-Impuls ED zu erzeugen. Abhängig vom Signal DE vom Komparator 332 und vom Signal ED der Bereichssteuerung 440 erzeugt die Folgesteuerschaltung 400 den Steuerimpuls SE. Dieser Impuls aktiviert die Rückverfolgungssteuerung 450, die die Schaltung gemäß Fig. 2 und 3 veranlaßt, die im Stufenspeicher 210 gespeicherten Zeitausrichtungswege zurückzuverfolgen und die gültigen Bezugswort-Kandidatenketten vom Speicher 210 zum Rückverfolgungsspeicher 260 zusammen mit den normierten Abstandssignalen für die Wege zu übertragen. Die Rückverfolgungsoperation wird entsprechend dem Flußdiagramm gemäß Fig. 12 ausgeführt. Am Beginn der Rückverfolgungsarbeitsweise veranlaßt der Impuls SE von der Steuerung 400 die Rückverfolgungssteuerung 450, die Impulse SIJE, SNM, SLPN, SLT 1 und das Signal D zu erzeugen. Der Impuls SLJE wird über das ODER-Gatter 467 dem Stufenzähler 250 zugeführt und bewirkt, daß das Signal LB=0 am Ausgang des Rückverfolgungszählers 240 zum Stufenzähler 250 übertragen wird (Indexkästchen 1205). Der Impuls SNM stellt den Rahmenzähler 230 auf den Zustand n s =128 ein (Indexkästchen 1210). Der Impuls SLPN gibt ein Signal LPN in den Zwischenspeicher 309, und der Impuls SLT 1 ein Rahmensignal 1 in den Zwischenspeicher 320. Das Signal D veranlaßt die Adressierlogik 290, das Signal L=0 und das Signal n s =128 zu den Adressiereingängen des Stufenspeichers 210 zu geben. Zu diesem Zeitpunkt werden die Rahmenstellen n s =128 der Stufe L=0 im Stufenspeicher 210 adressiert.Wie oben erwähnt, sind das Signal für jeden Rahmen jeder Stufe L=0 mit Ausnahme des Rahmens n s =1 und der Abstandssignale für jeden Rahmen mit Ausnahme des Rahmens n s =1 gleich LPN. Das Ausgangssignal des Stufenspeicherabschnitts 210-2 wird imTeiler 355 normiert, und das normierte Abstandsignal (128)/128 vom Teiler 355 wird mit dem Inhalt des Zwischenspeichers 309 im Komparator 311 verglichen. Der Inhalt des Zwischenspeichers 309 ist kleiner als das Ausgangssignal des Teilers 355, und das Signal DL vom Komparator 311 wird eingeschaltet. Folglichh wird der Inhalt der Zwischenspeicher 309 und 320 auf LPN/128 bzw. 128 geändert. Der Subtrahierer 330 erzeugt das Signal N m -n s =0 unter Ansprechen auf die Eingangssignale N m und das Eingangssignal n s vom Gatter 324. Das Signal N m -n s =0 ist kleiner als δ END=4 (Entscheidungskästchen 1215). Daher wird das Signal DE vom Komparator 332 eingeschaltet. Das eingeschaltete Signal DE veranlaßt die Rückverfolgungssteuerung 450, einen Impuls DN 1 zu erzeugen (Indexkästchen 1225), der den Rahmenzähler 230 auf den Zustand n s =127 zurückschaltet. Die Folge von Impulsen DN 1 der Rückverfolgungssteuerung 450 setzt sich fort, bis der Rahmen n s =124 erreicht ist. In diesem Zeitintervall wird das minimale Signal d(n s )/n s in den Zwischenspeicher 309 und das entsprechende Signal n s in den Zwischenspeicher 320 eingegeben. Es wird dann das Signal DE vom Komparator 332 abgeschaltet, wodurch die Rückverfolgungssteuerung 450 den Steuerimpuls LSF erzeugt. Unter Ansprechen auf den Steuerimpuls LSF wird der minimale, normierte Abstandsrahmen n d im Zwischenspeicher 320 über das UND-Gatter 336 und das ODER-Gatter 337 in den Zwischenspeicher 345 gegeben. Nach einer kurzen Verzögerung erzeugt die Steuerung 450 das Signal F, das die Adressierlogik 290 so ändert, daß =n d ist. Das Anfangsrahmensignal SN(n d) vom Stufenspeicherabschnitt 210-1 wird an einen Eingang des Komparators 338 über das UND-Gatter 335 und das ODER-Gatter 337 gegeben. SN(n d)=0 und der Komparator 338 schaltet das Signal SFNO ein. Das eingeschaltete Signal SFNO bedeutet, daß keine gültigen Zeitausrichtungswege vorhanden sind, die beim Rahmen n d auf der Stufe 0 enden. Der Rückverfolgungszähler 450 ändert demgemäß seinen Stand, so daß Zeitausrichtungswege, die auf der Stufe 1 enden, festgestellt werden können. Der Steuerimpuls IB 1 von der Rückverfolgungssteuerung 450 schaltet den Rückverfolgungszähler 240 auf LB=1 weiter. Der Impuls SLJE bewirkt, daß das Signal LB=1 vom Zähler 240 zum Stufenzähler 250 übertragen wird. Der Impuls SNM stellt den Rahmenzähler 230 auf den Zustand n s =N m ein, und die Impulse SLPN und SLTO stellen die Zwischenspeicher 309 und 320 auf LPN/128 bzw. 128 ein. Die Festsstellung des minimalen normierten Abstandssignals wird dann für die Stufe 1 entsprechend der Schleife durchgeführt, die im Flußdiagramm gemäß Fig. 12 das Entscheidungskästchen 1212, das Kästchen 1214, das Entscheidungskästchen 1215 und das Indexkästchen 1225 enthält. Wenn der Rahmen n s =124 erreicht ist, enthält der Zwischenspeicher 309 das Signal d p =LPN/128, und der Zwischenspeicher 320 das Signal n s =0. Das gilt deswegen, weil die DTW-Verarbeitung der Stufe 1 nicht zu Zeitausrichtungswegen innerhalb des Endrahmenbereichs geführt hat. Entsprechend dem Entscheidungskästchen 1230 ist das Signal SN(SF′)=0. Der Komparator 338 betätigt das Signal FNO. Der Zähler 240 wird durch das Signal IB 1 weitergeschaltet (Indexkästchen 1255), und man tritt über das Entscheidungskästchen 1260 in das Indexkästchen 1205 ein. Es wird dann die Rückverfolgungsoperation für die Stufe L=2 durch die Steuerimpulse SLJE, SNM, SLPN und SLT 1 sowie das Signal D von der Rückverfolgungssteuerung 450 unter Ansprechen auf das betätigte Signal SFNO vom Komparator 338 eingeleitet. Wie mit Bezug auf die Rükverfolgungsverarbeitung der Stufe 1 beschrieben worden ist, liefert die Adressierlogik 290 die Adressensignale n s vom Rahmenzähler 250 zu den Adressiereingängen des Stufenspeichers 210. Der Rahmenzähler 230 wird auf den Stand n s =N m eingestellt, und das minimale, normierte Abstandssignal d p /n d im Endrahmenbereich δ END wird festgestellt und im Zwischenspeicher 309 abgelegt. Der dem minimalen normierten Abstandssignal n d entsprechende Rahmen wird im Zwischenspeicher 310 gespeichert. Es sind keine Ausrichtungswege für die zweite Stufe innerhalb des Endrahmenbereichs δ END vorhanden. Demgemäß enthält der Zwischenspeicher 309 den Wert p /n d= und der Zwischenspeicher 320 enthält den Wert n d=125. Im Rahmen n s =124 wird das Signal DE vom Komparator 332 eingeschaltet, wodurch der Rahmencode n d unter Ansprechen auf das Signal LSF in den Zwischenspeicher 345 gegeben wird. Das Signal SN für den Rahmen n d ist Null, da keine Zeitausrichtungswege bei der DTW-Verarbeitung für die Stufe 2 im δ END-Rahmenbereich enden. Das Signal SN(n d)=0 veranlaßt den Komparator 338, das Signal SFNO einzuschalten. Die Rückverfolgungsverarbeitung der Stufe 3 wird durch das Signal IB 1 von der Rückverfolgungssteuerung 450 gestartet, das den Rückverfolgungszähler 240 auf LB=3 einstellt. Entsprehend der Angabe in Tabelle 6 hat die DTW-Verarbeitung der Stufe 3 zu Zeitausrichtungswegen mit Endpunkten bei den Rahmen 125, 126, 127 und 128 geführt. Entsprehend dem Entscheidungskästchen 1212, dem Index-Einstellkästchen 1214, dem Entscheidungskästchen 1215 und dem Indexkästchen 1225 in Fig. 12 werden die normierten Abstandssignale (n s )/n s für diese Endrahmen der Stufe 3 verarbeitet. Es wird das minimale, normierte Abstandssignal d p /n d=0,49 für den Rahmen 126 aufgefunden. Nachdem der Rahmenzähler 238 den Rahmen n s =124 erreicht hat, wird das Signal n d=126 vom Zwischenspeicher 320 durch das Signal LSF zum Zwischenspeicher 345 übertragen. Die Steuerung 450 erzeugt das Signal F, und das Signal SN=89 vom Stufenspeicher 210 wird über das UND-Gatter 335 und das ODER-Gatter 327 zu einem Eingang des Komparators 338 geführt. Das Signal SFNO von diesem Komparator bleibt abgeschaltet, und das Signal WBS wird zum Schreibbetätigungseingang des Rückverfolgungsspeichers 260 geliefert. Zu diesem Zeitpunkt werden das Signal =3 vom Stufenspeicherabschnitt 210-3 und das Signal d (126)/126 vom Teiler 355 in die Adresse L=3, LB=3 des Speichers 260 eingegeben. Das Signal SN (126)=89 vom Stufenspeicherabschnitt 210-1 wird dann über das UND-Gatter 335 und das ODER-Gatter 337 unter Ansprechen auf das Signal LSF von der Steuerung 450 in den Zwischenspeicher 345 gegeben. Der Steuerimpuls DL 1 von der Rückverfolgungssteuerung 450 schaltet den Stufenzähler 250 in den Zustand L=2 zurück. Die Speicherstellen n=89, =2 des Stufenspeichers 210 werden dann adressiert, so daß die Signale =4, (89)/89=0,521 in die Speicherstelle L=2, LB=3 des Rückverfolgungsspeichers 260 eingeschrieben werden. Das Signal SN (89)=32 vom Abschnitt 210-1 des Stufenspeichers wird unter Ansprechen auf das Signal LSF in den Zwischenspeicher 345 gegeben, und der Stufenzähler 250 wird durch das Signal DL 1 in den Zustand L=1 zurückgeschaltet. Dadurch wird die Adresse des Rückverfolgungsspeichers auf L=1, LB=3 geändert, und die Signale =4, (32)/32=0,384 aus der Rahmenstelle =32 der Stufe L=2 werden unter Ansprechen auf das Signal WBS von der Steuerung 450 in den Rückverfolgungsspeicher eingegeben. Das Signal SN (32)=1 vom Speicherabschnitt 210-1 wird in den Zwischenspeicher 345 eingeschrieben, und der Sufenzähler 250 wird auf den Zustand L=0 zurückgechaltet (Indexkästchen 1250). Das Signal LZS wird eingeschaltet, wenn der Stufenzähler 250 im Zustand L=0 ist. Unter Ansprechen auf das Signal LZS erzeugt die Steuerung 450 einen Impuls IB 1. Es wird dann der Rückverfolgungszähler 240 auf den Zustand LB=4 weitergeschaltet, und die Rückverfolgungsoperation der vierten Stufe wird durch Erzeugung der Impulse SLJE, SNM, SLPN und SLTO sowie des Steuersignals D angefangen. Bei der Rückverfolgung auf der vierten Stufe werden die Signale für die Folge von Rahmen 128 bis 125 verglichen. Das minimale, normierte Abstandssignal = 0,369 und der entsprechende Rahmen (n d=127) werden in die Zwischenspeicher 309 bzw. 320 eingegeben. Der Anfangsrahmen SN (127)=3 wird im Komparator 338 mit Null verglichen. Da er von Null verschieden ist, werden die Codierungen (127)=39 und in die Position L=4, LB=4 des Rückverfolgungsspeichers 260 eingeschrieben. Es wird dann der Code SN (127)=89 durch das Signal LSF in den Zwischenspeicher 345 gegeben. Der Stufenzähler 250 wird auf den Zustand L=3 zurückgestellt und dann erfolgt ein Zugriff zu den Stellen =3, =89 des Stufenspeichers 210. Die Signale (89)=5 und i (89)/89= 0,373 werden in die Position L=3, LB=4 des Rückverfolgungsspeichers 260 und das Signal SN (89)=60 in den Zwischenspeicher 345 gegeben. Der Zähler 250 wird auf den Zustand L=2 zurückgeschaltet. Das Signal SN (60)=32 ist von Null verschieden. Folglich werden die Stellen =2, =32 des Stufenspeichers 210 adressiert, so daß die Werte (60)=4, d (60)/60=0,438 in die Stelle L=2, LB=2 des Speichers 260 eingeschrieben werden. Das Signal SN (60)=32 gelangt in den Zwischenspeicher 345, und der Stufenzähler 350 wird in den Zustand L=1 zurückgeschaltet. Das Signal SFN (32)=1 in den Stellen =1, =32 des Stufenspeichers 210 ist von Null verschieden, wodurch die Signale (32)=4, (32)/32=0,384 in die Stelle L=1, LB=4 des Rückverfolgungsspeichers 260 eingeschrieben werden. Das Signal SN (32)=1 wird in den Zwischenspeicher 345 gegeben. Der Zähler 250 wird in den Zustand L=0 gebracht, in welchem das Signal LZS eingeschaltet wird. Unter Ansprechen auf das Signal LZS schaltet das Signal IB 1 von der Steuerung 450 den Rückverfolgungszähler 240 in den Zustand LB=5 weiter. Zu diesem Zeitpunkt ist LB=LMAX. Der Zähler 240 erzeugt ein Signal LBS, das die Steuerung 450 veranlaßt, einen Ende-Impuls EE zu erzeugen. Die Rückverfolgungsverarbeitung ist beendet, und der Speicher 260 enthält diejenige Bezugswortkette 443, die auf der Stufe 3 endet, und diejenige Bezugswortkette 4453, die auf der Stufe 4 endet, sowie die entsprechenden Abstandssignale. Das Signal EE wird der Folgesteuerung 400 zugeführt, die das Signal DONE erzeugt. Dieses Signal wird der Verbrauchereinrichtung 390 zugeführt, die die Codierungen des durch die Signale LB′ und L′ adressierten Rückverfolgungsspeichers zurückgewinnen kann. Die Verbrauchereinrichtung kann ein Datenprozessor, ein Nachrichtennetzwerk oder eine durch einen Code gesteuerte Maschine sein. Die Erkennungseinrichtung gemäß Fig. 2 und 3 kann beispielsweise Teil einer Fernsprecheinrichtung sein, die so ausgelegt ist, daß sie gesprochene Rechnungsnummern für Gebührenbelastungszwecke aufnehmen kann. Die Verbrauchereinrichtung 390 kann so ausgelegt sein, daß sie die Bezugswortkette für minimalen Abstand vom Rückverfolgungsspeicher 260 aufnimmt oder eine Bezugswortkette vorgeschriebener Länge aus dem Speicher 260 wählt. Bei gewissen Anordnungen können Einschränkungen hinsichtlich der jeweiligen Bezugswörter in jeder Wortposition vorhanden sein. Der Bezugswortwähler 207 kann in der Schaltung gemäß Fig. 2 aufgenommen sein, um nur vorbestimmte Bezugswort-Merkmalssignale für jede Stufe L unter Ansprechen auf das Ausgangssignal des Stufenzählers 250 und des Wortzählers 220 zu liefern. Beispielsweise kann das erste Wort jedes Sprachmusters auf die Ziffern 2 und 3 beschränkt sein. Unter Ansprechen auf das Stufensignal L=0 und L=1 wählt der Wähler 207 nur die Merkmalssignale der Ziffern 2 und 3 für die DTW-Verarbeitung. Das Signal W m vom Wähler 207 beendet dann die DTW-Verarbeitung der ersten Stufe am Ende der Zeitausrichtungs-Wegerzeugung für das Bezugswort "Drei".

Claims (11)

1. Verfahren zur Erkennung eines Sprachmusters als Kette vorbestimmter Bezugswörter mit den Verfahrensschritten:
  • a) Speichern von Signalsätzen (R V ), die die einen Anfangs- und einen Endrahmen enthaltende Zeitrahmenfolge akustischer Merkmale jedes Bezugswortes darstellen,
  • b) Erzeugen von Signalsätzen (T), die die Zeitrahmenfolge akustischer Merkmale des Sprachmusters darstellen,
  • c) Erzeugen von kumulativen Korrespondenzsignalen (D (T, R )) durch Vergleichen mittels dynamischer Zeitverkettung der Sprachmuster-Merkmalssignale (T) und der Bezugswort- Merkmalssignale (R V ),
  • d) Erzeugen wenigstens einer Bezugswortkette (R S ) unter Verwendung der kumulativen Korrespondenzsignale (D (T, R )),
  • e) Identifizieren des Sprachmusters als eine der erzeugten Bezugswortketten,
dadurch gekennzeichnet, daß der Verfahrensschritt d) folgende Schritte umfaßt:
  • f) Unterteilen der dynamischen Zeitverkettung in aufeinanderfolgende Stufen von Bezugswörtern (160, 170, 180, 190),
  • g) Zuordnen jeweils eines Segments des Sprachmusters zu jeder der aufeinander folgenden Stufen,
  • h) zeitliche Ausrichtung der Sprachmuster-Merkmalssignale (T) des der jeweiligen Stufe zugeordneten Segments mit den Bezugswort-Merkmalssignalen (R V ) der Stufe, um zeitausgerichtete Endrahmen- und Korrespondenzsignale für die Bezugswörter zu erzeugen,
  • i) Auswählen von Bezugsketten (R S ) unter Ansprechen auf die zeitausgerichteten Endrahmen- und Korrespondenzsignale für die Stufen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Verfahrensschritt h) die Schritte umfaßt:
  • k) Einschränkung des Bereichs der Anfangsrahmen für die augenblickliche Stufe (160, 170, 180, 190) unter Ansprechen auf die zeitausgerichteten Endrahmensignale der unmittelbar vorhergehenden Stufe,
  • l) Speichern des besten Korrespondenzsignals für jeden Endrahmen, ferner eines Signals, das das beste Bezugswort für diesen Endrahmen darstellt, und eines Signals, das den Anfangsrahmen entsprechend dem besten Bezugswort für diesen Endrahmen darstellt.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der Verfahrensschritt k) folgende Schritte umfaßt:
  • m) Feststellen des Minimums der besten Korrespondenzsignale der vorhergehenden Stufe unter Ansprechen auf die besten zeitausgerichteten Korrespondenzsignale der vorhergehenden Stufe,
  • n) Auswählen der Anfangsrahmen der augenblicklichen Stufe unter Ansprechen auf die besten zeitausgerichteten Korrespondenzsignale der vorhergehenden Stufe und des Minimums der besten Korrespondenzsignale der vorhergehenden Stufe.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß der Verfahrensschritt d) folgende Schritte aufweist:
  • o) Erzeugen eines den Endrahmen darstellenden Signals unter Ansprechen auf die Merkmalssignale,
  • p) Erzeugen eines Signals für jede Stufe, das den Endrahmen mit dem minimalen, besten Korrespondenzsignal darstellt,
  • q) Einleiten der Bezugswortkettenauswahl unter Ansprechen darauf, daß das minimale, beste Endrahmenkorrespondenzsignal innerhalb eines vorgeschriebenen Bereichs des Sprachmuster-Endrahmensignals liegt.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß der Verfahrensschritt i) den Verfahrensschritt umfaßt:
Erzeugen von Signalen, die jede Bezugswortkette darstellen, welche einen zeitausgerichteten Endrahmen innerhalb eines vorgeschriebenen Bereichs des Endrahmens besitzt, und zwar unter Ansprechen auf die gespeicherten, zeitausgerichteten Endrahmensignale, die Anfangsrahmensignale und die Bezugswort- Identifizierungssignale.
6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Verfahrensschritt h) folgende Schritte umfaßt:
  • r) Auswahl eines Bereichs von Bezugswortrahmen zur Zeitausrichtung mit jedem Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster-Merkmalssignale einschließlich Ausdehnen des unteren Grenzrahmens des Bezugswortbereichs bis zum Bezugswort-Anfangsrahmen, wenn der untere Grenzrahmen des gewählten Bezugswortbereichs kleiner als eine vorbestimmte Zahl ist, und Ausdehnen des oberen Grenzrahmens des gewählten Bezugswortbereichs bis zum Bezugswort-Endrahmen, wenn der obere Grenzrahmen des gewählten Bezugswortbereichs größer als eine zweite vorbestimmte Zahl ist.
7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Verfahrensschritt h) folgenden Schritt umfaßt:
  • s) Auswählen eines Bereichs von Bezugswortrahmen für die Zeitausrichtung mit jedem Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster-Merkmalssignale;
  • t) Erzeugen eines zeitausgerichteten Sprachmuster-Endrahmens unter Ansprechen darauf, daß der untere Grenzrahmen des gewählten Bezugswortbereichs gleich oder größer als der Bezugswort-Endrahmen ist.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Verfahrensschritt h) folgende Schritte umfaßt:
  • u) Auswahl eines Bereichs von Bezugswortrahmen für jeden Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster- Merkmalssignale;
  • v) Beendigen der Zeitausrichtung des Bezugswortes unter Ansprechen darauf, daß der untere Grenzrahmen des gewählten Bezugswortbereichs gleich oder größer als der Bezugswort-Endrahmen ist.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß der Verfahrensschritt h) folgende Schritte umfaßt:
  • w) Erzeugen eines zeitausgerichteten Korrespondenzsignals für jeden Sprachmusterrahmen unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster- Merkmalssignale;
  • x) Erzeugen eines maximal zulässigen Korrespondenzsignals für den Sprachmusterrahmen unter Ansprechen auf den Sprachmusterrahmen,
  • y) Beendigung der Zeitausrichtung des Bezugswortes unter Ansprechen darauf, daß das zeitausgerichtete Korrespondenzsignal eines Sprachmusterrahmens das maximal zulässige Korrespondenzsignal für den Rahmen übersteigt.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß der Verfahrensschritt d) den folgenden Schritt umfaßt:
  • z) Auswahl eines vorgeschriebenen Satzes von Bezugswörtern für die Zeitausrichtung auf jeder Bezugswortstufe unter Ansprechen auf die Stufenidentifiziersignale.
DE19823211313 1981-03-27 1982-03-26 Verfahren und vorrichtung zur kontinuierlichen sprachmustererkennung Granted DE3211313A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/248,570 US4400788A (en) 1981-03-27 1981-03-27 Continuous speech pattern recognizer

Publications (2)

Publication Number Publication Date
DE3211313A1 DE3211313A1 (de) 1982-11-11
DE3211313C2 true DE3211313C2 (de) 1988-06-16

Family

ID=22939686

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19823211313 Granted DE3211313A1 (de) 1981-03-27 1982-03-26 Verfahren und vorrichtung zur kontinuierlichen sprachmustererkennung

Country Status (6)

Country Link
US (1) US4400788A (de)
JP (1) JPS57169800A (de)
CA (1) CA1167967A (de)
DE (1) DE3211313A1 (de)
FR (1) FR2502822A1 (de)
GB (1) GB2095882B (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19540859A1 (de) * 1995-11-03 1997-05-28 Thomson Brandt Gmbh Verfahren zur Entfernung unerwünschter Sprachkomponenten aus einem Tonsignalgemisch
DE10015859A1 (de) * 2000-03-30 2001-10-11 Gunthard Born Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens
DE10015858A1 (de) * 2000-03-30 2001-10-11 Gunthard Born Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
JPS58111989A (ja) * 1981-12-25 1983-07-04 シャープ株式会社 音声認識装置
DE3215868A1 (de) * 1982-04-29 1983-11-03 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette
US4587670A (en) * 1982-10-15 1986-05-06 At&T Bell Laboratories Hidden Markov model speech recognition arrangement
USRE33597E (en) * 1982-10-15 1991-05-28 Hidden Markov model speech recognition arrangement
US4989248A (en) * 1983-01-28 1991-01-29 Texas Instruments Incorporated Speaker-dependent connected speech word recognition method
JPS60179797A (ja) * 1983-10-27 1985-09-13 日本電気株式会社 パタンマツチング装置
JPS60122475A (ja) * 1983-11-15 1985-06-29 Nec Corp パタン認識装置
JPS60211498A (ja) * 1984-04-05 1985-10-23 日本電気株式会社 連続音声認識装置
JP2607457B2 (ja) * 1984-09-17 1997-05-07 株式会社東芝 パターン認識装置
US4783809A (en) * 1984-11-07 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognizer for real time operation
US4718094A (en) * 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system
JPS61145599A (ja) * 1984-12-19 1986-07-03 日本電気株式会社 連続音声認識装置
US5241649A (en) * 1985-02-18 1993-08-31 Matsushita Electric Industrial Co., Ltd. Voice recognition method
US4980918A (en) * 1985-05-09 1990-12-25 International Business Machines Corporation Speech recognition system with efficient storage and rapid assembly of phonological graphs
US4748670A (en) * 1985-05-29 1988-05-31 International Business Machines Corporation Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor
US4783803A (en) * 1985-11-12 1988-11-08 Dragon Systems, Inc. Speech recognition apparatus and method
JPS62169199A (ja) * 1986-01-22 1987-07-25 株式会社デンソー 音声認識装置
JPS62232000A (ja) * 1986-03-25 1987-10-12 インタ−ナシヨナル・ビジネス・マシ−ンズ・コ−ポレ−シヨン 音声認識装置
US4827521A (en) * 1986-03-27 1989-05-02 International Business Machines Corporation Training of markov models used in a speech recognition system
US4831550A (en) * 1986-03-27 1989-05-16 International Business Machines Corporation Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events
US4941178A (en) * 1986-04-01 1990-07-10 Gte Laboratories Incorporated Speech recognition using preclassification and spectral normalization
US4918733A (en) * 1986-07-30 1990-04-17 At&T Bell Laboratories Dynamic time warping using a digital signal processor
US4910669A (en) * 1987-04-03 1990-03-20 At&T Bell Laboratories Binary tree multiprocessor
DE3711342A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen zusammenhaengend gesprochener woerter
DE3711348A1 (de) * 1987-04-03 1988-10-20 Philips Patentverwaltung Verfahren zum erkennen kontinuierlich gesprochener woerter
US5027408A (en) * 1987-04-09 1991-06-25 Kroeker John P Speech-recognition circuitry employing phoneme estimation
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
EP0316112A3 (de) * 1987-11-05 1989-05-31 AT&T Corp. Anwendung von statischen und dynamischen Spektralinformationen in Spracherkennungssystemen
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
US5119425A (en) * 1990-01-02 1992-06-02 Raytheon Company Sound synthesizer
WO1992006469A1 (en) * 1990-10-02 1992-04-16 The Dsp Group, Inc. Boundary relaxation for speech pattern recognition
GB9602691D0 (en) * 1996-02-09 1996-04-10 Canon Kk Word model generation
US5884259A (en) * 1997-02-12 1999-03-16 International Business Machines Corporation Method and apparatus for a time-synchronous tree-based search strategy
US6157731A (en) * 1998-07-01 2000-12-05 Lucent Technologies Inc. Signature verification method using hidden markov models
US7050973B2 (en) * 2002-04-22 2006-05-23 Intel Corporation Speaker recognition using dynamic time warp template spotting
US8521529B2 (en) * 2004-10-18 2013-08-27 Creative Technology Ltd Method for segmenting audio signals
US7567903B1 (en) * 2005-01-12 2009-07-28 At&T Intellectual Property Ii, L.P. Low latency real-time vocal tract length normalization
US20080189109A1 (en) * 2007-02-05 2008-08-07 Microsoft Corporation Segmentation posterior based boundary point determination
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
US9202520B1 (en) 2012-10-17 2015-12-01 Amazon Technologies, Inc. Systems and methods for determining content preferences based on vocal utterances and/or movement by a user

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
JPS5938599B2 (ja) * 1975-03-12 1984-09-18 日本電気株式会社 連続音声認識装置
JPS5938600B2 (ja) * 1975-10-31 1984-09-18 日本電気株式会社 レンゾクオンセイニンシキソウチ
GB1557286A (en) * 1975-10-31 1979-12-05 Nippon Electric Co Speech recognition
JPS592040B2 (ja) * 1976-08-24 1984-01-17 日本電信電話株式会社 音声認織装置
US4092493A (en) * 1976-11-30 1978-05-30 Bell Telephone Laboratories, Incorporated Speech recognition system
US4156868A (en) * 1977-05-05 1979-05-29 Bell Telephone Laboratories, Incorporated Syntactic word recognizer
JPS552205A (en) * 1978-06-20 1980-01-09 Kogyo Gijutsuin Real time continuous sound discriminator
US4349700A (en) * 1980-04-08 1982-09-14 Bell Telephone Laboratories, Incorporated Continuous speech recognition system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19540859A1 (de) * 1995-11-03 1997-05-28 Thomson Brandt Gmbh Verfahren zur Entfernung unerwünschter Sprachkomponenten aus einem Tonsignalgemisch
DE10015859A1 (de) * 2000-03-30 2001-10-11 Gunthard Born Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens
DE10015858A1 (de) * 2000-03-30 2001-10-11 Gunthard Born Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens
DE10015858C2 (de) * 2000-03-30 2002-03-28 Gunthard Born Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen
DE10015859C2 (de) * 2000-03-30 2002-04-04 Gunthard Born Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen

Also Published As

Publication number Publication date
FR2502822A1 (fr) 1982-10-01
FR2502822B1 (de) 1985-02-08
DE3211313A1 (de) 1982-11-11
GB2095882A (en) 1982-10-06
US4400788A (en) 1983-08-23
CA1167967A (en) 1984-05-22
JPS57169800A (en) 1982-10-19
JPH0416800B2 (de) 1992-03-25
GB2095882B (en) 1985-06-19

Similar Documents

Publication Publication Date Title
DE3211313C2 (de)
DE2953262C2 (de)
DE2753277C2 (de) Verfahren und Einrichtung zur Spracherkennung
DE3337353C2 (de) Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells
DE3317325C2 (de)
DE69420842T2 (de) Spracherkennung unter anwendung einer zweidurchgängigen suchmethode
DE4397100C2 (de) Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl
DE60004420T2 (de) Erkennung von Bereichen überlappender Elemente für ein konkatenatives Sprachsynthesesystem
EP1184839B1 (de) Graphem-Phonem-Konvertierung
EP1466317B1 (de) Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner
DE3244476C2 (de)
DE69712277T2 (de) Verfahren und vorrichtung zur automatischen sprachsegmentierung in phonemartigen einheiten
DE3216800C2 (de)
EP0533260B1 (de) Verfahren und Anordnung zum Erkennen der gesprochenen Wörter in einem Sprachsignal
DE69914131T2 (de) Positionshandhabung bei der Spracherkennung
DE3247229C2 (de)
DE3135483C2 (de) Verfahren und Schaltungsanordnung zur Erkennung einer alphanumerischen Eingangszeichenkette
DE3242866C2 (de)
DE19942178C1 (de) Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung
DE19847419A1 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung
EP0299572A2 (de) Verfahren zur Erkennung von zusammenhängend gesprochenen Wörtern
DE2212472A1 (de) Verfahren und Anordnung zur Sprachsynthese gedruckter Nachrichtentexte
DE69724485T2 (de) Lokalisierung eines Musters in einem Signal
DE69917960T2 (de) Phonembasierte Sprachsynthese
EP1058235B1 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G10L 1/00

8127 New person/name/address of the applicant

Owner name: AT & T TECHNOLOGIES, INC., NEW YORK, N.Y., US

D2 Grant after examination
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: BLUMBACH, KRAMER & PARTNER, 65193 WIESBADEN