DE3211313C2 - - Google Patents
Info
- Publication number
- DE3211313C2 DE3211313C2 DE3211313A DE3211313A DE3211313C2 DE 3211313 C2 DE3211313 C2 DE 3211313C2 DE 3211313 A DE3211313 A DE 3211313A DE 3211313 A DE3211313 A DE 3211313A DE 3211313 C2 DE3211313 C2 DE 3211313C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- frame
- reference word
- signals
- speech pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000004044 response Effects 0.000 claims description 65
- 230000001186 cumulative effect Effects 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 25
- 230000002123 temporal effect Effects 0.000 claims description 5
- 230000000977 initiatory effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 117
- 238000005070 sampling Methods 0.000 abstract description 2
- 238000012986 modification Methods 0.000 abstract 1
- 230000004048 modification Effects 0.000 abstract 1
- 230000015654 memory Effects 0.000 description 70
- 238000001514 detection method Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 3
- 101100001677 Emericella variicolor andL gene Proteins 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 101000835996 Caenorhabditis elegans Slit homolog 1 protein Proteins 0.000 description 1
- 101100001669 Emericella variicolor andD gene Proteins 0.000 description 1
- 101100001678 Emericella variicolor andM gene Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Time-Division Multiplex Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Image Analysis (AREA)
Description
Die Erfindung betrifft ein Verfahren zur
Erkennung eines Sprachmusters als Kette vorbestimmter
Bezugswörter nach dem Oberbegriff des Anspruchs 1.
Bei der Nachrichtenübertragung, Datenverarbeitung
und in Steuersystemen ist es häufig erwünscht,
Sprache als direkte Eingabe für Anfragen, Kommandos,
Daten oder andere Informationen zu benutzen. Spracherkennungsgeräte
vermeiden manuell betätigte Einrichtungen
und geben Personen die Möglichkeit, mit automatischen
Einrichtungen in Wechselwirkung zu treten, während sie
gleichzeitig andere Aktivitäten entfalten. Die Unterschiedlichkeit
von Sprachmustern von Sprecher zu Sprecher
und selbst für einen bestimmten Sprecher haben jedoch
die Genauigkeit der Spracherkennung eingeschränkt. Als
Folge davon sind Spracherkennungseinrichtungen nur unter
besonderen Umgebungsbedingungen erfolgreich gewesen.
Spracherkennungssysteme sind generell in der
Lage, Sprachsignale in Gruppe von vorgegebenen akustischen
Merkmalen zu transformieren. Die akustischen Merkmale
der Sprachsignale werden mit gespeicherten Sätzen
von vorher gewonnenen akustischen Merkmalen verglichen,
die Bezugswörter identifizieren. Das Sprachsignal ist
identifiziert, wenn mit den gespeicherten Merkmalen einer
besonderen Bezugswortfolge entsprechend vorgegebenen Erkennungskriterien
übereinstimmen. Die Genauigkeit einer
solchen Erkennung hängt in hohem Maße von den gewählten
Merkmalen und den vorgeschriebenen Erkennungskriterien
ab. Beste Ergebnisse werden erzielt, wenn die Bezugsmerkmale
und die Sprachmerkmale von der gleichen Person gewonnen
werden und das zu erkennende Sprachmuster mit bestimmten
Pausen zwischen den einzelnen Wörtern gesprochen
wird.
Die Erkennung kontinuierlicher Sprachmuster
kann durch Vergleichen der Folge von Sprachmustern mit
jeder möglichen Kombination von Bezugswort-Merkmalssignalmustern
erfolgen, die aus der kontinuierlichen Sprache
abgeleitet werden. Solche Anordnungen machen jedoch eine
zeitraubende Prüfung aller möglichen Bezugswort-Kombinationen
und eine umfangreiche Suche unter der großen Anzahl
von Bezugswortkombinationen erforderlich. Es ist
bekannt, daß die Anzahl möglicher Folgen exponentiell mit
der Anzahl von Wörtern in der Folge ansteigt. Demgemäß
ist es im allgemeinen unpraktisch, eine solche umfangreiche
Suche selbst für eine begrenzte Anzahl von Wörtern in
einem Sprachmuster durchzuführen.
Es lassen sich semantische und syntaktische
Regeln ableiten, um die Anzahl von möglichen Folgen bei
einer Suche einzuschränken, derart, daß bestimmte Klassen
von Informationen sich leicht analysieren lassen. In der
US-PS 41 56 868 ist beispielsweise eine auf einer syntaktischen
Analyse beruhende Erkennungsanordnung offenbart,
bei der ein Sprachmuster nur mit syntaktisch möglichen
Bezugsmustern verglichen wird. Die Erkennung von
Folgen gesprochener Wörter, die nicht zueinander in Beziehung
stehen, beispielsweise eine Folge von gesprochenen
Zahlen, läßt sich jedoch nicht verbessern, indem man
solche Einschränkungen hinsichtlich des Sinnzusammenhangs
einführt.
In den US-PS 40 49 913 und 40 59 725 sind
Erkennungssysteme für kontinuierliche Sprache beschrieben,
bei denen die Ähnlichkeit zwischen individuellen Bezugswort-
Merkmalsmustern und den Merkmalen aller möglichen
Intervalle der Sprachmuster berechnet werden. Aus den
Ähnlichkeitswerten werden Teilerkennungsergebnisse für
jedes Bezugswort-Merkmalsmuster abgeleitet. Sowohl die
Teilähnlichkeitswerte als auch die Teilerkennungsergebnisse
werden in einer Tabelle abgespeichert. Die Erkennungsergebnisse
aus der Tabelle werden zur Lieferung der
Bezugswortfolge entnommen, die dem Sprachmuster entspricht.
Alle möglichen Teilmusterkombinationen aus der Tabelle,
die kontinuierliche Muster bilden, werden gewählt. Die
gewählten Muster, für die die Ähnlichkeit ein Maximum
ist, werden dann ausgewählt. Obzwar diese Systeme sich
bei der Erkennung kontinuierlicher Sprache als wirksam
erwiesen haben, ist die Signalverarbeitung zur Gewinnung
der Bezugsmuster und der Teilmuster-Ähnlichkeitswerte
für viele Anwendungen zu kompliziert und unwirtschaftlich.
In der US-PS 43 49 700 ist eine Analysiereinrichtung
für kontinuierliche Sprache offenbart, die eine
Sprachäußerung als eine Folge von Bezugswörtern erkennen
kann, für die akustische Merkmalssignale gespeichert sind.
Abhängig von der Sprachäußerung und den akustischen Bezugswortmerkmalen
wird wenigstens eine Bezugswortfolge
als Kandidat für die Sprachäußerung erzeugt. Dazu werden
aufeinanderfolgende Wortpositionen der Sprachäußerung
definiert. In jeder Wortposition werden partielle Kandidatenfolgen
erzeugt, indem Bezugswörter bestimmt werden,
die Sprachäußerungsabschnitten entsprechen, und Bezugswörter,
die eine vorgeschriebene Ähnlichkeit mit ihren
Sprachäußerungsabschnitten haben, mit gewählten partiellen
Kandidatenfolgen der vorhergehenden Wortposition
kombiniert werden. Die bestimmten Sprachäußerungsabschnitte
können einen vorbestimmten Bereich des Sprachäußerungsabschnittes
für die Kandidatenserie der vorhergehenden
Wortposition überlappen, um der Koartikulation
und Unterschieden zwischen akustischen Merkmalen der
Sprachäußerung und denjenigen für isoliert gesprochene
Bezugswörter Rechnung zu tragen.
Die Analysiereinrichtung nach der vorgenannten
US-PS 43 49 700 verringert die Signalverarbeitungskomplizierheit
wesentlich, indem bestimmte Kandidaten-
Teilwortserien für jedes aufeinanderfolgende Intervall
der unbekannten Sprachäußerung gewählt wird. Außerdem
ist die Erkennung bei Vorhandensein einer Koartikulation
verbessert. Die Auswahl bestimmter Kandidaten für jede
Wortposition schließt jedoch andere mögliche Bezugswortfolgen-
Kandidaten aus der Überlegung aus, wenn die Erkennung
über die Wortpositionen fortschreitet. Demgemäß
ist die Genauigkeit der Erkennung bei längeren Sprachäußerungen
begrenzt.
Der Erfindung liegt die Aufgabe zugrunde, ein
verbessertes Verfahren zur Erkennung kontinuierlicher
Sprachmuster bereitzustellen, das bei hoher Genauigkeit
der Erkennung nur begrenzte Anforderungen an den Umfang
er erforderlichen Signalverarbeitung stellt.
Zur Lösung der Aufgabe geht die Erfindung aus
vom Verfahren nach dem auf der genannten US-PS 43 49 700
beruhenden Oberbegriff des Anspruchs 1.
Die Lösung ist im Kennzeichnungsteil des
Anspruchs 1 angegeben.
Weiterbildungen der Erfindung sind Gegenstand
der Unteransprüche.
Nachfolgend wird die Erfindung anhand der
Zeichnungen beschrieben. Es zeigen:
Fig. 1 graphisch ein Erkennungsverfahren für
kontinuierliche Sprache zur Erläuterung
der Erfindung;
Fig. 2 und 3 ein Blockschaltbild einer Spracherkennungsschaltung
zur Erläuterung der
Erfindung;
Fig. 4 ein genaueres Blockschaltbild sowie
eine Steuereinrichtung für die Schaltung
nach Fig. 2 und 3;
Fig. 5 ein genaueres Blockschaltbild einer
Rahmenfolge-Logikschaltung für die Schaltung
gemäß Fig. 2 und 3;
Fig. 6 ein allgemeines Flußdiagramm zur Erläuterung
des Spracherkennungsverfahrens
nach der Erfindung;
Fig. 7 bis 12 genauere Flußdiagramme zur Erläuterung
der Spracherkennungsanordnungen
nach der Erfindung.
Bei der Erkennung kontinuierlicher Sprache, beispielsweise
eines verbundenen Sprachmusters, wird eine
Zeitrahmenfolge akustischer Merkmalssignale
R V =R V (1), R V (2) . . . R V (M V ) (1)
für jedes Wort eines Satzes von Bezugswörtern gespeichert.
Die Merkmale lassen sich ableiten aus einer spektralen,
vorhersagenden oder anderen Analyseart von Aussprachen
jedes Bezugswortes R V , 1v V in bekannter Art. Eine
Zeitrahmenfolge akustischer Merkmalsignale
T = T(1), T(2), . . . T(N m ) (2)
wird aus einer ähnlichen Analyse eines Sprachmusters
abgeleitet. Generell werden alle möglichen Ketten
von Bezugswörtern synthetisiert, und die Folge von Merkmalssignalen
für jede Kette wird mit der Merkmalssignalfolge des Sprachmusters oder
der Sprachäußerung verglichen. Die am besten
korrespondierende Kette wird als die Sprachäußerung
identifiziert. Da die Rate der Sprache stark schwankt,
können bekannte Verfahren der dynamischen Programmierung
verwendet werden, um die Merkmale der Bezugswortkette
mit den Merkmalen der Sprachäußerung zeitlich
auszurichten. Auf diese Weise wird ein verhältnismäßig
genaues Maß für die Korrespondenz zwischen den Bezugswortketten
und der Sprachäußerung gewonnen.
Jede Bezugswortkette ist eine Verknüpfung von Bezugswörtern
R S = R v ⊕R v ² . . . ⊕R v Lmax (3)
Die akustischen Merkmalssignale der Kette R S werden durch eine sogenannte dynamische
Zeitverkettung (DTW)
mit den Merkmalssignalen der Sprachäußerung verknüpft, um das minimale
DTW-Abstandssignal zwischen den Bezugswortketten-
Merkmalssignalen
R S = R v ¹(1), R v ¹(2), . . ., R v ¹(M v ₁), R v ²(1),
R v ²(2), . . . R v ²(M v ₂), . . . R vLmax (1),
R vLmax (2) . . ., R vLmax (M vLmax ) (4)
sowie dem Sprachmuster-Merkmalssignal
T = T (1), . . . T (2), . . . T(n), . . . T(N m) (5)
zu erzeugen.
Das kumulative, durch die zeitliche Verkettung der Kette
R S mit den Sprachmuster-Merkmalssignalen T
gewonnene Abstandssignal beträgt
wobei w(n) der Verkettungsfaktor zwischen den Merkmalssignalen
T und R S ist und d(T(n), R S(w(n)))=d(n, w(n)) der
örtliche Abstand zwischen den Merkmalssignalen des Rahmens
n des Sprachmusters T und des Rahmens m=w(n) der Kette R S
ist. w(n) ist üblicherweise so begrenzt, daß die Endpunkte
des Sprachmusters mit den Endpunkten der Kette zusammenfallen,
und die Steigerung des Verkettungsfaktors w(n) ist
so gewählt, daß sie dem Bereich der erwarteten Sprachmusterrahmen
entspricht. Die direkte Anwendung der dynamischen
Sprachverkettung auf alle möglichen Ketten R S führt zu
einem unwirtschaftlichen und zeitaufwendigen Umfang der
Signalverarbeitung selbst für eine mäßige Anzahl von
Bezugswörtern.
Entsprechend der Erfindung wird die dynamische Zeitverkettung
in aufeinander folgende Stufen unterteilt, so
daß die Signalverarbeitung wesentlich verringert ist.
Die Anzahl von Ketten R S , die als Kandidaten für das
Sprachmuster betrachtet werden, ist jedoch
nicht beschränkt, wodurch die Erkennungsgenauigkeit nicht
beeinträchtigt ist. Fig. 1 erläutert die Stufenverarbeitung.
Die horizontale Achse in Fig. 1 entspricht
den aufeinander folgenden Rahmen 1, 2 . . .
n . . . N m des Sprachmusters. Jeder ist ein Sprachmustersegment
die durch Begrenzung der akustischen Zeitausrichtung definiert
sind. Die vertikale Achse ist in Stufen L=1, 2 . . . L max
unterteilt, wobei L max die größte erwartete Anzahl von
Wörtern in dem Sprachmuster ist. Jede Stufe auf der
vertikalen Achse ist in Rahmen von Bezugswörtern unterteilt.
Für jedes Bezugswort hat die Stufe L=M w Rahmen.
Die Anzahl der Rahmen ist im allgemeinen verschieden
für jedes Bezugswort, da die Bezugswortmuster unterschiedliche
Dauer haben. Die Merkmalssignale jedes Bezugsworts
R v werden zeitlich verkettet mit dem Sprachmustersegment,
das bei den Anfangsrahmen der Stufe beginnt.
Für jedes Bezugswort führen die möglichen Zeitausrichtungswege
zwischen dem Bezugswort und dem Mustersegment
für die Stufe über Punkte (n, m) entsprechend dem Ausdruck
wobei 1 n N m die Sprachmusterrahmen sind, 1 m M w
die Bezugswortrahmen für die Stufe sind und D A (n, m) das
akkumulierte Abstandssignal entlang dem Weg am Punkt
n, m ist. (n, m) ist der örtliche Abstand zwischen den
Sprachmuster-Merkmalssignalen beim Musterrahmen
n und dem Bezugswort-Merkmalssignal beim Bezugswortrahmen
m. Der am weitesten rechts stehende Ausdruck in Gleichung
(7) stellt den akkumulierten Abstand zum Musterrahmen
n-1 und zum Bezugswort-R S -Rahmen dar, nämlich
m-I₂j m-I₁. Der Rahmen I₁ ist so gewählt, daß er
dem zulässigen Unterschiedsbereich für die Sprachrate
entspricht. Er wird üblicherweise auf 1 gesetzt, wenn
w(n-1)=w(n-2) gilt und im anderen Fall auf 0. I₂ wird
in typischer Weise auf 2 gesetzt. Demgemäß erstreckt
sich j über den Bereich von m-2 bis m-1, wenn w(n-1)=
w(n-2) und im anderen Fall über den Bereich von m-2 bis
m. Dynamische Zeitverkettungsanordnungen sind genauer
beschrieben in dem Aufsatz "Minimum Prediction Residual
Applied to Speech Recognition" von F. Itakura, IEEE Transactions
on Acoustics, Speech and Signal Processing, Band
ASSP-23, S. 67-72, Februar 1975, und in einem Aufsatz
"Considerations in Dynamic Time Warping Algorithms for
Discrete Word Recognition" von L. R. Rabiner, A. E. Rosenberg
und S. E. Levinson, IEEE Transactions on Acoustics, Speech
and Signal Processing, Band ASSP-26, S. 575-582, Dezember
1978.
Der Weganfangsrahmen und der Wegendrahmen sowie der kumulative
Abstand zwischen dem Bezugswort und den Sprachmustermerkmalen
auf jedem Weg werden bestimmt durch das dynamische
Zeitverkettungsverfahren gemäß Gleichung (7). Die
Endrahmen der Stufe entsprechen den möglichen
Weganfangsrahmen der nächsten Stufe. Für jeden Stufenendrahmen
werden der minimale kumulative Abstand bis dahin,
das dem minimalen kumulativen Abstandssignal entsprechende
Bezugswort und der Stufenanfangsrahmen für den minimalen
kumulativen Abstandsweg gespeichert. Nach Beendigung
der Verarbeitung für die letzte Stufe wird die am dichtesten
korrespondierende Folge aus den gespeicherten Abstandssignalen,
den Bezugsworten, den Stufenendrahmen und den
Stufenanfangsrahmen rekonstruiert.
Gemäß Fig. 1 ist das dynamische Zeitverkettungsverfahren
auf den Bereich erwarteter Sprachrahmen beschränkt, um
eine unnötige Verarbeitung zu vermeiden. Beispielsweise
kann der Anfangsrahmen des Sprachmusters in Fig. 1
akustisch nicht dem Endrahmen eines der Bezugswörter
entsprechen. Auf ähnliche Weise sind andere Bereiche
in Fig. 1 akustisch nicht möglich. Folglich kann die
DTW-Verarbeitung auf den Bereich akustisch wahrscheinlicher
Sprachrahmen beschränkt werden, ohne an Erkennungsgenauigkeit
zu verlieren. In Fig. 1 ist die DTW-Verarbeitung
für eine Eingangsäußerung von 4 Wörtern beschränkt auf
den durch die Linien 101, 102, 103 und 104 begrenzten
Bereich. Die äußersten Punkte des zulässigen Bereichs
entsprechen den Endpunkten der möglichen Bezugswortketten
sowie des Sprachmusters. Das durch die Linien 101, 102,
103, 104 begrenzte Parallelogramm stellt eine 2 : 1-Beschleunigung
und eine 2 : 1-Reduzierung der Sprachrate zwischen
den Bezugswortketten und dem Sprachmuster dar. Diese
Begrenzungslinien sind durch die Bereichsbeschränkungen
gemäß Fig. 7 festgelegt. Der Bereich für die DTW-Verarbeitung
gemäß Fig. 1 ist zwar für die Zwecke der vorliegenden
Erfindung geeignet, es sei aber darauf hingewiesen, daß
andere, bekannte Beschränkungsanordnungen in Verbindung
mit der Erfindung gewählt werden können.
Fig. 1 zeigt graphisch den stufenförmigen Erkennungsprozeß
für ein Sprachmuster, das aus der gesprochenen 4-Wort-Binärzahlfolge
1001 besteht. Das Flußdiagramm in Fig. 6
zeigt die Operationsfolge für die Stufenaufbauanordnung.
Nach Speicherung der akustischen Merkmalssignale für
jedes Bezugswort, das heißt 0 und 1, wird die im Kästchen
601 angegebene Analyse des Sprachmusters durchgeführt.
Bei der Analyse wird die dem Sprachmuster entsprechende
Folge von akustischen Merkmalen erzeugt. Die
Wortstufe wird dann zu Anfang auf die Stufe L=0 (Kästchen
603) gesetzt, für die ein einzelner Musterbeginnrahmen
N=1 vorhanden ist.
Die Verarbeitung der ersten Stufe wird durch Einleitung
der Einspeicherung für das Abstandssignal und der Anfangsrahmensignale
der Stufe L+1=1 entsprechend dem Kästchen
605 begonnen. Die erste Stufe in Fig. 1 erstreckt sich
von der Abszisse 150 zur Linie 160. Die Linien entsprechen
dem Anfangs- und Endrahmen der Bezugswörter auf
der Stufe L=1. Das Ende der Stufe L=0 entsprechend der
Abszisse 150 wird abgetastet (Kästchen 607), um den ersten
Anfangsrahmen festzustellen. Nach Feststellung des Anfangsrahmens
n=1 bei der Abtastung wird entsprechend der Operation
im Kästchen 607 die dynamische Zeitverkettung der
Sprachmustermerkmale mit den Bezugswortmerkmalen für
die Stufe L+1=1 begonnen.
Bei dem zeitlichen Verkettungsverfahrensschritt werden
zuerst die Merkmalssignale des Bezugswortes "Null" vom
Bezugswortrahmen m=1 zum Rahmen M dynamisch zeitverkettet
mit den Sprachmuster-Merkmalssignalen, und zwar beginnend
beim Musterrahmen n=1. Auf diese Weise werden
die zulässigen Wege in dem durch die Linien 101, 104,
und 160 begrenzten Bereich, der das Sprachmustersegment
für die erste Stufe darstellt, erzeugt. Die Wege 110-1 und
110-2 mit den Endpunkten nk werden entsprechend
der Darstellung in Fig. 1 bestimmt. Die Endpunkte für
diese Wege sowie die Korrespondenzen für den kumulativen
Abstand entlang dieser Wege und das Bezugswort-Identifiziersignal
"Null" werden gespeichert. Wege, die am Endpunkt
n enden, können ebenfalls für das Bezugswort "Null"
festgestellt werden. Diese Wege haben jedoch kumulative
Abstände, die größer sind als diejenigen, welche später
für das Bezugswort "Eins" bestimmt werden.
Anschließend werden die Merkmalssignale des Bezugswortes
"Eins" von den Rahmen m=1 bis M=M dynamisch zeitverkettet
mit den Sprachmuster-Merkmalssignalen, beginnend beim
Musterrahmen n=1. Entsprechend der Darstellung in Fig. 1
werden Wege 110-3, 110-4, 110-5 und 110-6 für das Bezugswort
1 erzeugt. Die Endpunkte nkk und n dieser
Wege werden zusammen mit den kumulativen Wegabständen
und dem Bezugswort-Identifizierungssignal "Eins" gespeichert.
Für das Bezugswort "Eins" können auch Wege mit
den Endpunkten n und n gewonnen worden sein. Es ist
jedoch nur der Weg zu einem Endpunkt mit dem minimalen
kumulativen Abstand in Fig. 1 dargestellt. Wenn ein Weg
für das Bezugswort "Null" und ein Weg für das Bezugswort
"Eins" am gleichen Endpunkt zusammenlaufen, wird der
Weg mit dem kleineren kumulativen Abstand gewählt. Demgemäß
werden nur Wege des Bezugswortes "Null", die an den
Punkten n und n enden, zurückbehalten, während nur
Wege für das Bezugswort "Eins", die an den Punkten n
bis n enden, festgehalten bleiben. Auf diese Weise werden
alle möglichen Kombinationen von Bezugswort-Merkmalssignalen
für das Sprachmuster ausgewertet. Am Ende der
dynamischen Zeitverkettung für die Stufe L+1=1 wird die
Stufe L verglichen mit der maximalen Stufe L max =4, wie
in dem Entscheidungskästchen 611 gezeigt ist. Als Ergenis
des Vergleichs wird die Stufe von L=0 auf L=1 weitergeschaltet.
Dann tritt man erneut über das Entscheidungskästchen
611 in das Kästchen 605 ein, so daß die Abstands-
und Anfangsrahmenspeicherung für die Stufe L+1=2 eingeleitet
wird. Die Abtastung nach dem ersten Anfangsrahmen
der Stufe L=1 entsprechend dem Kästchen 607 führt zur
Feststellung des Rahmens n als Anfangsrahmen für die
dynamische Zeitverkettung der Stufe L+1=2.
Bei der DTW-Verarbeitung der zweiten Stufe (Kästchen
609) liegt die Folge von Bezugswort-Merkmalssignalrahmen
zwischen den Linien 160 und 170. Es sind nur DTW-Verarbeitungswege
in demjenigen Bereich zugelassen, der durch
die Segmentlinien 160, 101, 170, 103 und
104 begrenzt ist. Die Anfangsrahmen für die Verarbeitung
auf der zweiten Stufe entsprechen den Endrahmen der
Wege für die erste Stufe, um die Kontinuität aufrecht
zu erhalten. Die Merkmalssignale für das Bezugswort "Null",
beginnend auf der Linie 160, werden dynamisch verkettet
mit den Merkmalssignalen des Sprachmusters, beginnend
beim Rahmen n. Wie in Fig. 1 dargestellt,
werden unter anderem die DTW-Wege 120-5, 120-7, 120-8,
120-9 und 120-10 erzeugt. Die Endpunkte nk, nk
und n für diese Wege werden zusammen mit den kumulativen
Abständen vom Anfangspunkt des Sprachmusters zu diesen
Endpunkten sowie dem Null-Bezugswort-Identifizierungssignal
und den Anfangsrahmen der zweiten Stufe (L+1=2) für
die bestimmten Wege gespeichert.
Die Merkmalssignale für das Bezugswort "Eins" zwischen
den Linien 160 und 170 werden dann zeitlich verkettet
mit den Sprachmuster-Merkmalssignalen, beginnend beim Rahmen
n, um die Wege der zweiten Stufe für das Bezugswort
"Eins" zu bestimmen. Unter anderem werden die Wege 120-1,
120-2, 120-3, 120-4 und 120-6 gebildet. Für die Endpunkte
nkkk und n werden die kumulativen Abstände
vom Anfangsrahmen des Sprachmusters, das Identifiziersignal
für das Bezugswort "Eins" und die Rahmen entlang
der Linie 160, von der die Wege ausgehen, gespeichert.
Bei Beendigung des Zeitausrichtungsverfahrens (Kästchen
609) der zweiten Stufe (L+1=2) sind alle Zweiwort-Teilketten
innerhalb des zulässigen Bereichs ausgewertet
worden, und die Signale, die die möglichen Kandidatenketten
definieren gespeichert. Man tritt dann erneut in das
Entscheidungskästchen 611 ein. Da die letzte Stufe L max =4
noch nicht verarbeitet ist, wird die Stufe L weitergeschaltet
auf 2 (Kästchen 615).
Es wird jetzt in das Kästchen 605 eingetreten und mit
der Speicherung für die nächste Stufe L+1=3 begonnen.
Die Stufe L=2 wird abgetastet (Kästchen 607), um den
Endrahmen n als Anfangsrahmen für die Zeitausrichtungsverarbeitung
der dritten Stufe (L+1=3) festzustellen.
Während der Verarbeitung der dritten Stufe (Kästchen 609)
werden die Bezugswort-Merkmalssignale auf der dritten
Stufe zwischen den Linien 170 und 180 wiederholt. Die
dynamische Zeitverkettung der Bezugswort-Merkmalssignale
mit den Sprachmuster-Merkmalssignalen, beginnend
beim Rahmen n auf der Linie 170 führt zu besten
Abstandswegen 130-1, 130-3, 130-4, 130-5 und 130-6 für
das Bezugswort "Null" und besten Abstandswegen 130-2
für das Bezugswort "Eins". Die anderen möglichen Wege
von den Anfangsrahmen auf der Linie 170 sind ungültig,
da sie außerhalb des durch die Linien 170, 101, 102,
180 und 103 definierten Bereichs liegen oder kumulative
Abstände haben, die zu groß sind, um diese Wege in Betracht
zu ziehen. Mit der Speicherung der kumulativen Abstandssignale,
der Bezugswort-Identifizierungssignale und der
Anfangsrahmensignale für die zulässigen Endpunkte sind
alle möglichen Ketten der drei Bezugswörter am Ende der
dritten Stufe identifiziert.
Es wird dann erneut in das Endscheidungskästchen 611
eingetreten und als Ergebnis entsprechend dem Kästchen
615 der Pegelindex geändert auf L=3. Wie oben mit Bezug
auf die Verarbeitung der vorhergehenden Stufe erwähnt,
wird gemäß Kästchen 605 die Abstandsignal- und Rahmenspeicherung
für die Stufe L+1=4 begonnen. Die gespeicherten
Rahmensignale für die Stufe L=3 werden gemäß Kästchen
607 abgetastet, und der Anfangsrahmen n wird als erster
Rahmen für die dynamische Zeitverkettung der Stufe L+1=4
gewählt. Es wird dann gemäß Kästchen 609 die DTW-Verarbeitung
der vierten Stufe durchgeführt.
Wie in Fig. 1 gezeigt, führt die dynamische Zeitverkettung
der vierten Stufe zwischen den Bezugswort-Merkmalssignalen
und den Sprachmuster-Merkmalssignalen zu einem einzigen
Weg 140-1 zwischen dem Rahmen n auf der Linie
180 und dem Rahmen N₁ auf der Linie 190.
Nach der DTW-Verarbeitung der vierten Stufe wird der
Schnittpunkt des dynamischen Zeitverkettungswegs mit
dem Sprachmuster-Endrahmen N festgestellt und die Stufenverarbeitungskästchen
611 beendet. Man tritt dann in das
Kästchen 613 ein, und es wird die beste Bezugswortkette
aus den gespeicherten Stufendaten rekonstruiert. Demgemäß
ermöglichen nach Fig. 1 die gespeicherten Stufenendpunkte
nkk eine Rückverfolgung der Wege 140-1, 130-5,
120-8 und 110-5 durch die Stufen 4, 3, 2 und 1. Auf diese
Weise wird die Binärfolge 1001 als Sprachmuster
gewählt. Wenn auf irgendeiner Stufe mehr als ein Weg
beim Endrahmen N m endet, kann die am dichtesten
entsprechende Bezugswortkette durch einen Vergleich der
kumulativen Abstände für die möglichen Zeitausrichtungswege
in Fig. 1 gewählt werden. Alternativ wird die Bezugswortkette
mit einer bestimmten Anzahl von Ziffern ausgewählt.
Der Bereich zulässiger Ausrichtungswege im Beispiel nach
Fig. 1 ist so festgelegt, daß nur Sprachmuster mit
einer vorbestimmten Anzahl von verbundenen Wörtern durch
Angleichen des Endrahmens N m an die letzten
Bezugswort-Endrahmen auf der Linie 190 angenommen werden.
Diese Anordnung läßt sich leicht so abändern, daß Sprachmuster
mit weniger Wörtern angenommen werden, indem
der zulässige Bereich so ausgedehnt wird, daß er einen
Extrempunkt für jede Stufe enthält, der oberhalb der
Grenzlinie 104 für die minimale Sprachrate liegt. Gemäß
Fig. 1 können Sprachmuster mittels Bezugswortketten
von 2 oder 3 Wörtern verarbeitet werden, indem der dynamische
Zeitverkettungsbereich bis zu den gestrichelten
Verlängerungen der Linien 104, 170 und 180 sowie der
gestrichelten Linie 105 ausgedehnt wird. Der vergrößerte
Bereich ermöglicht eine Erkennung von verbundenen Wortmustern
unterschiedlicher Länge mit der Einschränkung,
daß die Maximalzahl von Wörtern in einem Sprachmuster
vorgeschrieben ist.
Bei dem in Fig. 1 gezeigten Beispiel schneidet der Endpunkt
des Wegs 140-1 der vierten Stufe der Linie, die den Endrahmen
N des Sprachmusters definiert. Eine solche Forderung
kann die Auswahl der Kandidaten-Bezugswortketten
unzulässig beschränkten. Eine Anordnung, bei der ein
Endbereich von mehreren Rahmen definiert ist, ermöglicht
eine gewisse Fehlergrenze bei der Bestimmung des Endrahmens
des Sprachmusters. Demgemäß kann in Fig. 1 ein
Endbereich zwischen den Linien 192 und 194 einen geeigneten
Sprachmuster-Endpunktbereich bilden. Die Linie 102
wird zur gestrichelten Linie 109 zwecks Anpassung an
den größeren Bereich von Sprachmuster-Endrahmen verschoben.
In bekannter Weise führt die zeitliche Ausrichtung von
verbundenen Sprachmustern mit Verknüpfungen von isolierten
Bezugswortmustern im allgemeinen aufgrund einer
Koartikulation bei den Sprachmustern mit verbundenen
Wörtern zu Fehlern. Diese Fehler können Fehlanpassungen
in den Anfangs- und Endbereichen von Wörtern zugeordnet
sein, da die Bezugswörter im allgemeinen verlängert sind,
wenn sie getrennt gesprochen werden. Die in Fig. 1 gezeigte
Anordnung kann so abgeändert werden, daß sie einer solchen
Koartikulation Rechnung trägt, indem die Auswahl der
am besten übereinstimmenden Anfangs- und Endrahmen an
den Grenzen jeder Stufe zugelassen wird. Demgemäß werden
die Zeitausrichtungsanordnungen dicht bei den Stufengrenzen
zur Anpassung an Koartikulationseinflüsse eingestellt.
Die Sprachmuster-Anfangsrahmen auf jeder Stufe gemäß Fig.
1 entsprechen den auf der vorhergehenden Stufe erzeugten
Endrahmen und sind unabhängig von der Größe der akkumulierten
Abstände, die den Endpunkten der vorhergehenden
Stufe zugeordnet sind. Die Erkennungsanordnung kann so
modifiziert werden, daß die Signalverarbeitungsanforderungen
weiter verringert sind, und zwar durch eine Begrenzung
der Anfangsrahmen entsprechend einem vorgeschriebenen
Bereich des besten mittleren kumulativen Abstands, der
bei der Verarbeitung der vorhergehenden Stufe bestimmt
worden ist. Die Genauigkeit der sich dann ergebenden
Erkennung bleibt durch eine solche Beschränkung im wesentlichen
unbeeinflußt, da nur die am wenigsten wahrscheinlichen
Kandidaten aus der Betrachtung ausgeschieden werden.
Die Fig. 2 und 3 zeigen ein genaueres Blockschaltbild
einer Erkennungseinrichtung für kontinuierliche Sprache
als Ausführungsbeispiel der Erfindung. In Fig. 2 kann
der Bezugswort-Merkmalssignalspeicher 205 ein integrierter,
programmierbarer Festwertspeicher (ROM) sein,
der eine Vielzahl von Schablonensignalen speichert.
Jedes Schablonensignal stellt eine Folge von akustischen
Merkmalen eines Bezugswortes dar. Diese akustischen Merkmale
werden aus isolierten Aussprachen des Wortes mit
Hilfe einer linearen Voraussageanalyse bekannter Art
abgeleitet. Obzwar lineare Voraussageparameter als Merkmalssignale
bei der Schaltungsanordnung nach Fig. 2 und 3
verwendet werden, sei darauf hingewiesen, daß andere
akustische Merkmale in Verbindung mit der Erfindung benutzt
werden können, beispielsweise Spektral- oder Formatparameter.
Die Aussprache jedes Bezugswortes ist in M Rahmen
unterteilt, und für jeden Rahmen wird ein Merkmalssignal
(p+1)-ter Ordnung erzeugt. Das Merkmalssignal
entspricht den autokorrelierten linearen Voraussagekoeffizienten
des Sprachsignals. Die Bezugswortschablone
wird dann durch das Signal gemäß Gleichung (1) dargestellt.
Die Schablonensignale für die Bezugswörter w₁, w₂, . . .
w m werden im Merkmalsspeicher 205 abgelegt und durch
ein Schablonen-Wortnummernsignal w vom Wortzähler 220
adressiert, der binäre Vor/Rückwärtszähler
enthalten kann. Zur Erläuterung wird
angenommen, daß die Erkennungseinrichtung gemäß Fig.
2 und 3 in der Lage ist, Folgen von gesprochenen Zahlen
zu erkennen. Demgemäß besteht der Bezugswortsatz aus
den Ziffern 0 bis 9.
Der Sprachmuster-Merkmalssignalgenerator 201 in Fig. 2
nimmt ein Sprachsignal von einem elektroakustischen Wandler
200 auf und wandelt es in eine Folge
von akustischen Merkmalssignalen des gleichen Typs um,
wie sie im Bezugsmerkmalssignalspeicher 105 abgelegt
sind. Für jeden Rahmen des Sprachsignals vom Wandler
200 wird eine lineare Voraussagecodier-Analyse durchgeführt,
um ein Merkmalssignal (p+1)-ter Ordnung für den
Rahmen zu bilden. Durch die Analyse erhält man die Folge
von Sprachmuster-Merkmalssignalen gemäß Gleichung (2).
Diese Merkmalssignale T(n) werden sequentiell zum
Merkmalssignalspeicher 203 übertragen,
wo sie Rahmen für Rahmen
gespeichert werden. Der Merkmalsgenerator
201 kann ein Generator mit linearen Voraussagekoeffizienten
sein, der in der US-PS 40 92 493 beschrieben ist,
oder irgendein anderer LPC-Generator bekannter Art.
Die Zeitausrichtungsverarbeitung wird im DTW-Prozessor
207 für jede Stufe entsprechend den Sprachmuster-Merkmalen
aus dem Speicher 203 und den Bezugswortmerkmalen
aus dem Speicher 205 durchgeführt. Die im Prozessor 207
erzeugten kumulativen Abstandssignale d s werden in den
Abschnitt 110-2 des Stufenspeichers 210 eingegeben, der
eine Vielzahl von RAM-Speichern umfassen
kann. Der Stufenspeicher wird gemeinsam durch die Sprachmuster-Rahmennummer
und die Stufe adressiert.
Der Abschnitt 210-1 speichert die vom DTW-Prozessor 207
bei der dynamischen Zeitverkettungsverarbeitung gewonnenen
Anfangsrahmennummern SFN. Der
Abschnitt 210-3 speichert die Bezugswort-Identifiziersignale
w, die der Verarbeitung zugeordnet sind. Die Verarbeitungsergebnisse,
die durch die Signale und adressiert
werden, werden als Anfangsrahmensignal SN, kumulatives
Abstandssignal und Bezugswort-Identifiziersignal
auf den Leitungen 211-1, 211-2 bzw. 211-3 zur Verfügung
gestellt.
Die Rahmenfolgelogik 307 in Fig. 3 liefert die Folge
von Sprachmusterrahmen n, die das Auslesen der Sprachmuster-
Merkmalssignale aus dem Speicher 203 steuert,
und erzeugt außerdem Steuersignale, die die Arbeitsweise
des DTW-Prozessors 207 bestimmen. Der Rückwärtsverfolgespeicher
260 in Fig. 2 tritt bei Beendigung der Verarbeitung
der letzten Stufe in Tätigkeit und speichert die
bei der Stufenverarbeitung bestimmten DTW-Wege derart,
daß die am genausten entsprechende Bezugswortkette gewählt
werden kann.
Zur Erläuterung wird angenommen, daß der Spracherkenner
gemäß Fig. 2 und 3 zur Identifizierung eines Sprachmusters
benutzt wird, das aus einer Folge von gesprochenen Zahlen
mit einer maximalen Länge von 5 Ziffern bestehen. Es
sei jedoch darauf hingewiesen, daß der Spracherkenner
zur Erkennung gesprochener Wörter oder Phrasen beliebiger
Zeichen und einer Länge von mehr als 5 Wörtern benutzt
werden kann. Das zur Erläuterung gewählte Sprachmuster
ist die Ziffernfolge "4453", die sich über 128 Rahmen
erstreckt. Vor Zuführung des Sprachmusters zum elektroakustischen
Wandler 200 wird das Signal "Start" durch
den Signalgenerator 204 unter Steuerung eines externen
Bauteils, beispielsweise des Schalters 206, erzeugt.
Das Signal "Start" wird dem Steuergerät 350 zugeführt, das
genauer in Fig. 4 dargestellt ist. Das Steuergerät gemäß
Fig. 4 weist eine Folge-Steuerschaltung 400 auf, die
generell die zeitliche Folge von Operationen der Erkennungsschaltung
gemäß Fig. 2 und 3 bestimmen kann, und Steuergeräte
410, 420, 430, 440 und 450, die eine individuelle,
durch die Folgesteuerschaltung 400 gewählte Betriebsweise
bestimmen. Jede Steuerschaltung in Fig. 4 ist ein Mikrocomputer
bekannter Art, beispielsweise der in dem Aufsatz
"Let a Bipolar Processor Do Your Control and Take Advantage
of Its High Speed" von Stephen Y. Lau beschriebenen
Art, der auf den S. 128-139 von "Electronic Design",
Nr. 4, 15. Februar 1979, erschienen ist. In bekannter
Weise erzeugt ein Steuergerät dieser Art ein oder mehrere
gewählte Ausgangssignale unter Ansprechen des Zustands
der zugeführten Signale. Jede Steuerschaltung beinhaltet
einen Festwertspeicher, in welchem ein Befehlssatz gespeichert
ist, der die Betriebsweise bestimmt.
Das Signal "Start" vom Generator 204 wird der Folgesteuerschaltung
400 zugeführt, die daraufhin einen Steuerimpuls
SA und ein Steuersignal A erzeugt. Der Steuerimpuls SA
wird dem Merkmalssignalgenerator 201
in Fig. 2 und dem Bedingungsgenerator 201 zugeführt,
um eine Folge von Sprachmuster-Merkmalssignalen
T(n) und Rahmenadressiersignale FSA unter Ansprechen
auf das Sprachmustersignal vom Wandler 200 zu erzeugen.
Die Rahmenadressiersignale werden zum Adresseneingang
des Merkmalssignalspeichers 203 über
ein UND-Gatter 222 und ein ODER-Gatter 226 zugeführt,
während das Steuersignal A betätigt ist.
Das Flußdiagramm gemäß Fig. 7 zeigt die Sprachmusteranalyseoperation.
Wenn das Signal "Start" gemäß Kästchen
700 vorliegt, wird der Steuerimpuls SA erzeugt, und die
Sprachmuster-Merkmalssignale werden entsprechend dem
Kästchen 710 erzeugt und gespeichert. Bei Beendigung
der Sprachmusteranalyse und Einspeicherung der Merkmalssignale
in den Speicher 203 wird der Steuerimpuls EA
vom Generator 201 erzeugt, und der Sprachmuster-Endrahmen
N m =128 wird vom Generator 201 zum Rahmenzähler 230
gegeben. Die Folgesteuerschaltung 400 in Fig. 4 erzeugt
Steuerimpulse SBO und SLJM unter Ansprechen auf den Impuls
EA. Diese Signale leiten die Stufenverarbeitung für die
erste Stufe entsprechend dem Kästchen 720 in Fig. 7 ein.
Der Steuerimpuls SBO wird dem Einstelleingang des Rückverfolgungszählers
240 in Fig. 2 zugeführt, der dadurch
auf 0 zurückgestellt wird. Der Impuls SLJM durchläuft
das ODER-Gatter 467, und das Signal SLJ von diesem Gatter
wird dem Stufenzähler 250 zugeführt. Dieser wird dadurch
auf 0 zurückgestellt, so daß sein Ausgangssignal L=0 und
sein Ausgangssignal L+1=1 ist. Der Zähler 250 weist
eine Zählschaltung, eine Addierschaltung
und eine Komparatorschaltung
bekannter Art auf.
Der Impuls EA am Ende der Sprachmusteranalyse veranlaßt
außerdem die Steuerschaltung 400, den Steuerimpuls SI
zu erzeugen, wie im Flußdiagramm gemäß Fig. 8 gezeigt.
Der Steuerimpuls SI versetzt die Erkennungsschaltung
gemäß Fig. 2 und 3 in die Lage, in die erste Einleitungsbetriebsweise
überzugehen, in der die Speicherstellen
der Stufe L+1=1 des Pegelspeichers 210 voreingestellt
werden. Auf diese Weise wird der Pegelspeicher 210 vor
der dynamischen Zeitverkettung der Sprachmuster-Merkmalssignale
des ersten Stufensegments mit den Bezugswort-
Merkmalssignalen der ersten Stufe in Betrieb genommen.
Gemäß Kästchen 810 in Fig. 8 wird die Sprachmuster-Rahmenadresse
für die Stufe L+1=1 des Speichers 210 zu Anfang
auf den ersten Rahmen n s =1 eingestellt. Die Abstandssignalspeicherstelle
für den ersten Rahmen wird auf den größtmöglichen
Zahlencode LPN eingestellt, der in der Schaltung
gemäß Fig. 2 und 3 verfügbar ist, und die Anfangsrahmenstelle,
die dem Sprachmusterrahmen n s =1 zugeordnet
ist, wird entsprechend dem Kästchen 820 auf 0 eingestellt.
Die Sprachmuster-Rahmennummer wird weitergeschaltet
(Kästchen 830), und dann wird wiederum über das Entscheidungskästchen
840 in das Kästchen 820 eingetreten, so
daß das nächste Sprachmuster-Rahmenabstandssignal
und die Anfangsrahmennummer-Speicherstelle voreingestellt
werden können. Die Speicherbetriebs-Einleitungsoperation
läuft weiter, bis die Sprachmuster-Rahmennummer größer
als der maximale Sprachmuster-Rahmen N m =128 ist.
Zu diesem Zeitpunkt wird der Steuerimpuls EI erzeugt.
Zu Beginn der Betriebseinleitung wird der Steuerimpuls
SI von der Steuerung 400 dem Stufeneinleitungs-Steuergerät
410 zugeführt. Das von der Steuerung 410 erzeugte Steuersignal
I gelangt zu ODER-Gattern 231 und 254 in der Stufenspeicher-
Adressierlogik 290. Unter Ansprechen auf das
Steuersignal I wird ein UND-Gatter 233 betätigt. Auf
entsprechende Weise wird das UND-Gatter 256 durch das
Ausgangssignal des ODER-Gatters 254 in Tätigkeit gesetzt.
Dann wird in der Steuerung 410 der Steuerimpuls SN1I
erzeugt, so daß das Signal SN1 vom ODER-Gatter 461 zum
Rückstelleingang des Rahmenzählers 230 übertragen wird.
Dieser wird dadurch in seinen ersten Zustand gebracht,
in welchem der Ausgang n s auf 1 eingestellt ist. Das
Signal n s =1 durchläuft das UND-Gatter 233 und das ODER-
Gatter 238, so daß die Sprachmuster-Rahmenstelle
ñ=1 des Stufenspeichers 210 adressiert wird. Der Stufenzähler
250 war vorher zurückgestellt worden, so daß sein
Ausgangssignal L+1=1 ist. Das Signal L+1=1 durchläuft
das UND-Gatter 256 und das ODER-Gatter 259, wodurch die
Stufe =1 des Speichers 210 adressiert wird. Auf diese
Weise werden die Speicherstellen des ersten Sprachmusterrahmens
für die Stufe 1 im Speicher 210 ausgewählt.
Der Speicher 210, der RAM-Speicher und
programmierbare integrierte ROM-Speicher
aufweisen kann, ist in drei Abschnitte unterteilt. Der
Zeitausrichtungsweg-Anfangsrahmen SN für die gewählte
Adresse wird im Abschnitt 210-1 gespeichert. Der kumulative
Abstand , der durch die dynamische Zeitverkettung für
den adressierten Rahmen gewonnen worden ist, wird im
Abschnitt 210-2 gespeichert, und das Bezugswort-Identifiziersignal
, das durch die dynamische Zeitverkettung
für den adressierten Rahmen erhalten worden ist, wird
im Abschnitt 210-3 gespeichert.
Wenn der Sprachmusterrahmen n s =1 der Stufe L+1=1 im
Speicher 210 adressiert wird, durchläuft ein Codesignal
0 das UND-Gatter 274 und das ODER-Gatter 286 unter Ansprechen
auf das Signal I. Am Informationseingang des Speicherabschnitts
210-1 erscheint ein Signal 0. Das durch das
Signal I vorbereitete UND-Gatter 284 läßt das LPN-Signal
zum Informationseingang des Speicherabschnitts 210-2
über das ODER-Gatter 282 durchlaufen. Die Steuerung 410
bleibt in Betrieb und erzeugt das Signal WLSI, und das
Schreibsignal WLS wird an den Schreibbetätigungseingang
des Speichers 210 über das ODER-Gatter 465 angelegt.
Dadurch werden ein Code 0 und ein Code LPN in die Speicherstellen
=1, =1 der Stufenspeicherabschnitte 210-1
bzw. 210-2 eingegeben.
Es wird dann in der Steuerung 410 der Steuerimpuls IN1I
erzeugt und über das ODER-Gatter 463 dem Rahmenzähler
230 zugeführt. Dieser wird weitergeschaltet. Er liefert
das Signal n s =2, das bewirkt, daß die Speicherstellen
des zweiten Sprachmusterrahmens im Stufenspeicher
210 (=1, =2) adressiert werden. Das nächste WLS-Signal
von der Steuerung 410 stellt die Speicherstellen SN (2)
und (2) auf 0 bzw. LPN ein. Die Folge von Impulsen IN1I
und WLSI der Steuerung 410 wiederholt sich mit einer
vorbestimmten Rate, um die Rahmenstellen
1 bis N(m) der Stufe L+1=1 voreinzustellen. Der Ausgang
NMS des Rahmenzählers 230 wird betätigt, wenn dessen
Zustand n s =N m erreicht ist. Unter Ansprechen auf das
Signal NMS vom Zähler 230 erzeugt die Steuerung 410 einen
Steuerimpuls EI, der die Betriebseinleitung der ersten
Stufe beendet, nachdem die Stellen =1, =N m der Speicherabschnitte
210-1 und 210-2 auf 0 bzw. LPN eingestellt
sind.
Die dynamische Zeitverkettung für jede Stufenverarbeitung
wird mit dem niedrigsten Endrahmen der vorhergehenden
Stufe begonnen, nachdem der höchste Endrahmen der vorhergehenden
Stufe festgestellt und gespeichert ist. Folglich
werden die =0 Stellen im Stufenspeicherabschnitt 210-1
beginnend beim Rahmen n s =1 abgetastet, um den ersten
Rahmen festzustellen, in welchem sich ein von 0 abweichend
bewerteter Anfangsrahmen befindet. Die Stufe =0 entspricht
dem Anfang des Sprachmusters und besitzt einen von 0
abweichend bewerteten Anfangsrahmen SN=1 für den Rahmen
n s =1. Im Stufenspeicher 210 sind die Eintragungen für
L=0 fest und befinden sich in einem Nurlese-Speicherabschnitt.
Die Stelle n s =1 des Abschnitts 210-1 ist dauernd
auf SN=1 eingestellt, und die entsprechende Stelle im
Abschnitt 10-2 ist dauernd auf =0 eingestellt. Alle
anderen Rahmenstellen für die Stufe L=0 im Abschnitt
210-1 sind dauernd auf SN=0 und alle anderen Stellen
im Abschnitt 210-2 auf =LPN eingestellt.
Die Abtastbetriebsweise wird unter Ansprechen auf einen
Impuls EI von der Steuerung 410 gestartet. Dieser Impuls
veranlaßt die Steuerschaltung 400, den Steuerimpuls SB
zu erzeugen. Unter Ansprechen auf den Impuls SB erzeugt
die Abtaststeuerung 420 ein Signal BB, das über ein ODER-
Gatter 469 als Signal B zu ODER-Gattern 231 und 252 in
der Stufenspeicher-Adressierlogik 290 für die Dauer der
Abtastung geführt wird. Das Ausgangssignal des ODER-
Gatters 231 bereitet das UND-Gatter 233 vor, so daß die
Folge von n s -Abtastadressensignalen vom Rahmenzähler
230 über das ODER-Gatter 238 an den -Adresseneingang
des Stufenspeichers 210 angelegt werden kann. Das Ausgangssignal
des ODER-Gatters 252 bereitet das UND-Gatter
258 vor, so daß das L=0-Signal das UND-Gatter 258 sowie
das ODER-Gatter 259 durchläuft und als -Adresseneingang
dem Stufenspeicher 210 zugeführt werden kann.
Die Abtaststeuerung 420 erzeugt außerdem Impulse BD und
SNM am Beginn der Abtastbetriebsweise. Der Impuls SNM
setzt entsprechend dem Indexeinstellkästchen 910 in Fig. 9
den Rahmenzähler auf den Sprachmuster-Endpunktzustand
(n s =n m ). Die Adressenlogik 209 wählt dann den Rahmen
n s =n m der Stufe L=0, und es werden die Signale SN=0
und =LPN für den Rahmen N m dem Gatter 335 bzw. dem
Teiler 355 zugeführt. Das Signal SN=0 gelangt an einen
Eingang eines Komparators 338. Unter Ansprechen auf dieses
Signal bleibt der Komparator 338 abgeschaltet. Demgemäß
bleibt auch das Signal DMTA am Ausgang des UND-Gatters
381 abgeschaltet (Kästchen 912). Die Abtaststeuerung
420 erzeugt dann den Impuls DN 1, der den Zähler 230
entsprechend dem Kästchen 914 rückwärts schaltet. Das
Signal NSO bleibt für n s =n m abgeschaltet (Kästchen 916).
Das Signal n s wird im Komparator 385 mit 0 verglichen,
wenn das Signal BD vorhanden ist. Auf diese Weise wird
der Rahmenzähler wiederholt rückwärts geschaltet, bis
n s =1 ist.
Das Signal SN=1 für n s =1 betätigt den Ausgang des Komparators
338. Das Signal für L=0, n s =1 vom Abschnitt
210-2 des Stufenspeichers 210 ist 0. Der Teiler 335 bildet
das Signal (1)/1=0, das im Komparator 305 mit dem vorher
im Zwischenspeicher 309 abgelegten Signal LPN verglichen
wird. Das Signal DMT wird betätigt, und das Gatter 381
liefert ein betätigtes Signal DMTA über das UND-Gatter
359 an den Zwischenspeicher 360. Dadurch wird das Signal
n s =1 in den Zwischenspeicher 350 gebracht (Kästchen 920).
Das Signal DMTA wird außerdem der Steuerung 420 zugeführt,
die das Signal BD ausschaltet und das Signal BU einschaltet.
Die Abtaststeuerung 420 liefert dann das Signal
SN 1B, das das ODER-Gatter 461 als Impuls SN 1 durchläuft
und den Rahmenzähler 230 auf seinen Anfangszustand n s =1
zurückstellt (Kästchen 922). Auf diese Weise werden die
Sprachmuster-Rahmenstellen n s =1 der Stufe L 0 im
Speicher 210 gewählt. Das Abstandssignal =0 für die
gewählte Rahmenstelle vom Stufenspeicherabschnitt 210-2
steht dann auf der Leitung 211-2 zur Verfügung und wird
von dort über den Teiler 335 und das Gatter 304 einem
Eingang des Komparators 305 in Fig. 3 zugeführt. Das andere
Eingangssignal des Komparators 305 vom Multiplizierer
303 ist zu diesem Zeitpunkt größer als 0, so daß das
Signal DMT vom Komparator 305 eingeschaltet wird. Dieses
Signal gelangt zum Gatter 381. Da das Signal SN=1 vom
Speicherabschnitt 210-1 am Komparator 338 vorhanden ist,
wird das Signal DMTA eingeschaltet, und der Zwischenspeicher
370 wird über das UND-Gatter 368 eingestellt.
Die Abtaststeuerung 420 erzeugt dann unter Ansprechen
auf das Signal DMTR vom Zwischenspeicher 370 den Steuerimpuls
EB. Dieser Impuls EB beendet die Abtastoperation
und veranlaßt das Folgesteuergerät 400, die Impulse FSL
und SC zu erzeugen.
Der Impuls FSL gelangt zur Rahmenfolgelogik 307, so daß
der augenblickliche SN-Code (n s =1) vom Stufenspeicherabschnitt
210-1 in die Rahmenfolgelogik 207 eingegeben
wird. Auf diese Weise wird die dynamische Zeitverkettung
für die erste Stufe beim Rahmen n =1 eingeleitet. Der
Impuls SC veranlaßt die DTW-Steuerung 430, die Steuersignalfolge
zu erzeugen, die die Schaltung gemäß Fig. 2
und 3 veranlaßt, die dynamische Zeitverkettung der Sprachmuster-
Segmentmerkmalssignale der ersten Stufe mit den
Bezugswort-Merkmalssignalen vom Rahmen SN=1
der ersten Stufe durchzuführen.
Das Flußdiagramm gemäß Fig. 10 erläutert die dynamischen
Zeitverkettungsvorgänge. Wie oben
erwähnt, bewirkt die dynamische Zeitverkettungsverarbeitung,
daß die Zeitausrichtungs-Wegendpunkte für die Stufe
L=1 bestimmt und die kumulativen Abstandssignale, die
Identifizierungssignale für das beste Bezugswort und die
Anfangsrahmensignale für diese Endpunkte im Pegelspeicher
210 gespeichert werden. Gemäß Fig. 10 wird entsprechend
dem Kästchen 1101 zu Anfang ein Merkzeichen (flag) gesetzt,
das dann bei Feststellung eines gültigen Stufenendrahmens
zurückgestellt wird. Entsprechend dem Kästchen
1005 wird das erste Bezugswort w₀ (Null) gewählt, und
der Anfangsrahmen für die dynamische Zeitverkettung wird
auf den Anfangsrahmen SN=1 eingestellt, der bei der
unmittelbar vorhergehenden Abtastbetriebsweise bestimmt
worden ist (Kästchen 1010). Der Anfangsrahmen des Bezugswortes
"Null" ist der Rahmen n=1. Dann wird die dynamische
Zeitverkettung der Sprachmuster-Merkmalssignals
mit den Bezugswort-Merkmalssignalen gemäß Kästchen
1015 gestartet.
Die DTW-Verarbeitung erfolgt entsprechend dem allgemeinen,
in Gleichung (7) dargestellten Verfahren. Entsprechend
der Erfindung werden die Bezugswortrahmen jeder Stufe
in drei Abschnitte unterteilt, nämlich einen Anfangsabschnitt
δ R 1, einen Endabschnitt δ R 2 und den Abschnitt
zwischen dem Anfangs- und dem Endabschnitt. Wie oben
mit Bezug auf Gleichung (7) erwähnt, werden die zulässigen
Bezugswortrahmen so gewählt, daß sie möglichen akustischen
Bedingungen genügen. Bei dem mittleren Segment
einer Stufe werden die Sprachraten-Einschränkungen gemäß
Gleichung (7) befolgt. Die akustischen Bezugswortmerkmale
im Speicher 205 werden von getrennt gesprochenen Mustern
des Wortes abgeleitet. Benachbarte Wörter in Sprachmustern
mit verbundenen Wörtern werden im allgemeinen
koartikuliert. Demgemäß wird der Bereich der Bezugswortrahmen
in den Anfangs- und Endsegmenten so eingestellt,
daß der Koartikulation Rechnung getragen ist. Im Anfangsabschnitt
wird die Wahl der Bezugsrahmen für den letzten
Ausdruck in Gleichung (7) über den Bereich der Rahmen
von δ R 1 ausgedehnt. Für das Segment w R 1 ist I₂=m und
I₁ ist 1 für w(n-1) = w(n-2) oder im anderen Fall 0. Entsprechend
wird im Endsegment die Wahl der Rahmen über
den Bereich δ R 2 hinaus ausgedehnt. Im Segment δ R 2 ist
I₁=1, wenn w(n-1) = w(n-2) und 0 im Bezugswort-Endrahmen
mk. Auf diese Weise wird die
zeitliche Ausrichtung der Sprachmustermerkmale zu
den Bezugsmerkmalen bei Vorhandensein einer Koartikulation
genauer gemacht. In typischer Weise ist δ R 1=4 und
δ R 2=6 für durch einen Sprecher erzeugte Bezugsmerkmalssignalschablonen.
Der Wert δ R 1 wird auf 0 und w R 2
auf 4 für sprecherunabhängige Bezugsmuster gesetzt.
Die dynamische Zeitverkettung gemäß Kästchen 1015 wird
über den Bereich 1 m M von Bezugswortrahmen für
jeden aufeinander folgenden Sprachmusterrahmen n durchgeführt.
Die Rahmenauswahl bei den im DTW-Prozessor 207
durchgeführten dynamischen Zeitverarbeitungsoperationen
wird durch die Rahmenfolgelogik 307 gesteuert, die genauer
in Fig. 5 dargestellt ist.
Bei dem Ausführungsbeispiel nach Fig. 2-5 liefert die
DTW-Prozessorsteuerung 430 Steuerimpulse SW 1 und FSR
sowie ein Steuersignal C unter Ansprechen auf einen Impuls
SC von der Folgesteuerung 400. Durch den Impuls SW 1 wird
der Wortzähler 220 in Fig. 2 auf seinen Zustand w=w₀ zurückgestellt.
Der Impuls FSR stellt den Zähler 505 auf seinen
Anfangszustand zurück. Der Zähler 505 speichert die Zahl
der Sprachmusterrahmen der bereits verarbeiteten Stufe.
Der Sprachmuster-Anfangsrahmen im Zwischenspeicher
501 wird durch den Impuls FSR zum Zähler 503 übertragen.
Der Ausgang n des Zählers 503 liefert das Eingangssprachmuster-
Rahmensignal
für die DTW-Verarbeitung. Das Signal
FSR stellt außerdem das Flipflop 370 über das ODER-Gatter
369 ein. Dadurch wird das Signal DMTR am Anfang jeder
DTW-Abtastung eingestellt.
Das Signal C von der Steuerung 430 wird ODER-Gattern 251
und 252 der Stufenspeicher-Adressierlogik 290 zugeführt.
Das Rahmensignal n vom Zähler 503 durchläuft dann das
UND-Gatter 236 zum -Adresseneingang des Speichers 210.
Abhängig vom Ausgangssignal des ODER-Gatters 252 überträgt
das UND-Gatter 258 das Stufensignal L vom Stufenzähler
250 zum -Adresseneingang des Speichers 210. Am Anfang
der DTW-Verarbeitung für die Stufe liefert der anfängliche
Sprachmustersegment-Rahmen vom Zähler 503 in Fig. 5 das
Sprachmustersegment-Rahmenadressensignal r für den
Sprachäußerungs-
Merkmalsignalspeicher 203 über das UND-Gatter
224 und das ODER-Gatter 226. Die dem Rahmensignal n
entsprechende Sprachmuster-Merkmalssignale werden dem
Eingang des DTW-Prozessors 207 zugeführt. Dieser wird
zu Anfang so voreingestellt, daß er das erste Bezugswort-Rahmensignal
an seinem Ausgang (M L ) für den unteren Grenzwert
des Bereichs liefert. Dieses Signal M L =1 gelangt
zum Komparator 524 in Fig. 5, der feststellt, ob die
Verarbeitung im Anfangssegment w R 1 der Stufe stattfindet.
In typischer Weise wird δ R 1 auf 4 Rahmen eingestellt.
Für 1 M L R 1 wird der Ausgang des Komparators 524
betätigt und ein Signal vom UND-Gatter 530 geliefert,
wenn der augenblickliche Sprachmusterrahmen ein Endrahmen
der vorhergegenden Stufe ist und das Signal DMTR
vom Flipflop 370 betätigt ist. Das Signal DMTR ist vorhanden,
wenn der Sprachsegmentrahmen innerhalb des Bereichs
von Endrahmen der vorhergehenden Stufe liegt. Dies ist
dann die Kontinuität der dynamischen Zeitverkettungswege
von Stufe zu Stufe.
Die DTW-Verarbeitung wird durch einen Steuerimpuls DST
von der DTW-Steuerung 430 eingeleitet. Das Bezugswort-
Rahmensignal
M H vom Prozessor 207 wird zur Adressierung
des Bezugswort-Merkmalsignalspeichers 205 benutzt, so
daß die Bezugsmerkmale der erforderlichen Rahmen für
das gewählte Wort w dem DTW-Prozessor gemäß Gleichung
(7) zugeführt werden. Wenn das Bezugswort-Rahmensignal
M L den Wert δ R 1 übersteigt, wird der Ausgang des Komparators
524 abgeschaltet, und das Signal R 1 wird vom DTW-Prozessor
getrennt. Demgemäß werden die Einschränkungen
der DTW-Verarbeitung gemäß Gleichung (7) so geändert,
daß sie den akustischen Bedingungen für das mittlere
Segment entsprechen.
Das Bezugswort-Endrahmensignal M vom Speicher 205 entspricht
dem Endrahmen des adressierten Bezugswortes und
wird dem Subtrahierer 515 sowie dem Komparator 520 in
der Rahmenfolge-Logikschaltung gemäß Fig. 5 zugeführt.
Das Signal M H für die obere Grenze des Bezugswort-Rahmenbereichs
bei der gerade ausgeführten dynamischen Zeitverkettung
wird vom Prozessor 207 zum Subtrahierer 515 und
zum Komparator 520 gegeben. Wenn das Differenzsignal
M - M H vom Subtrahierer 515 gleich oder kleiner als
das Signal δ R 2 entsprechend dem Endsegment der Stufe
ist, so wird der Ausgang R 2 des Komparators 518 betätigt.
Das Signal R 2 gelangt an einen der Steuereingänge des
Prozessors 207, so daß die dynamischen Zeitverkettungseinschränkungen
unter Anpassung an das Endsegment der
Stufenverarbeitung geändert werden.
Während der Operation des Prozessors 207 wird das Signal
d′, das den Abstand zwischen den augenblicklichen Bezugswortmerkmalen
und den Sprachmustersegment-Merkmalen bis
zum Rahmen (n) der Stufe darstellt, mit einem Schwellenwert
T(n) verglichen, wie im Entscheidungskästchen 1020
in Fig. 10 angegeben. Der Schwellenwert T(n) ist das
Ausgangssignal des Festwertspeichers 509 und wird auf
das größte Abstandssignal eingestellt, das für ein gültiges
Kandidatenbezugswort im augenblicklichen Rahmen erwartet
wird. Für den Fall, daß das Abstandssignal d′
vom Prozessor 207 den Schellenwert T übersteigt, wird
die Abstandsverarbeitung für das Bezugswort abgebrochen.
Es erfolgt dann ein Eintreten in das Indexkästchen 1050,
und das nächste Bezugswort wird gewählt. Entsprechend dem
Entscheidungskästchen 1055 wird dann bestimmt, ob alle
Bezugswörter für die Stufe verarbeitet worden sind. Wenn
nicht verarbeitete Bezugswörter vorhanden sind, wird
entsprechend dem Kästchen 1015 die dynamische Zeitverkettung
erneut gestartet, und zwar nachdem der Sprachäußerungsrahmen
für die Verarbeitung auf den Anfangsrahmen
zurückgestellt ist, der bei der vorhergehenden
Abtastoperation (Kästchen 1010) bestimmt worden ist.
Unter Bezugsnahme auf Fig. 2 und 5 wird das Signal d′
vom DTW-Prozessor 207 an einen Eingang des Komparators
511 geliefert, der die Schwellenwertentscheidung gemäß
Kästchen 1020 durchführt. Wie oben erwähnt, wird der
Zähler 505 am Anfang der Abstandsverarbeitung durch das
Signal FSR auf 1 zurückgestellt. Der Zähler 505 wird
durch das Signal FSI weitergeschaltet, nachdem ein Sprachsegmentrahmen
n entsprechend dem Kästchen 1015 verarbeitet
worden ist. Das Rahmenausgangssignal des Zählers
505 adressiert den Festwertspeicher (ROM) 509, und das
maximale Abstandsschwellenwertsignal T(n) vom Speicher
509 wird zum anderen Eingang des Komparators 511 geführt.
Wenn das Signal d′(n) das dem Rahmen im Festwertspeicher
509 zugeordnete Schwellenwertsignal übersteigt, so wird
das Abbruchsignal AB vom Komparator 511 eingeschaltet
und der Steuerung 430 zugeführt. Diese erzeugt dann einen
Impuls IW 1, der den Wortzähler 220 in Fig. 2 weiterschaltet,
sowie einen Impuls FSR, der den Zähler 505 zurückstellt
und das Rahmensignal im Zwischenspeicher 501 zum
Zähler 503 überträgt. Die Schaltung gemäß Fig. 2 und
3 wird dadurch so eingestellt, daß sie die Stufen-DTW-
Verarbeitung für das nachfolgende Bezugswort durchführt.
Bei der Verarbeitung der ersten Stufe für das
Sprachmuster 4453 wird das mit dem Rahmen n=1 beginnende
Sprachmustersegment zuerst dynamisch mit dem Bezugswort
"Null" im Prozessor 207 zeitverkettet. Bei der Verarbeitung
der ersten Stufe erfolgt jedoch für alle Bezugswörter
mit Ausnahme von "Vier" ein Abbruch ohne Erzeugung von
Zeitausrichtungswegen, und zwar wegen der Unähnlichkeit
des Bezugsmerkmalssignals mit den Sprachmustersegment-
Merkmalssignalen des ersten Wortes. Während der DTW-
Verarbeitung für das Bezugswort "Null" übersteigt ein
Abstandssignal d′(n) das Schwellenwertsignal T(n) vor
der Feststellung eines DTW-Ausrichteweg-Endpunktes. Das
Signal AB vom Komparator 511 wird betätigt, und unter
Ansprechen auf das Signal AB erzeugt die DTW-Steuerung
430 in Fig. 4 Steuerimpulse IW 1 und FSR. Der Impuls IW 1
schaltet den Wortzähler 220 in Fig. 2 weiter, und dessen
Ausgangssignal w adressiert die Merkmalssignale
für das Bezugswort "Eins" im Speicher 205. Der Impuls
FSR stellt den Zähler 505 auf seinen Anfangszustand zurück
und bewirkt, daß das Rahmensignal im Zwischenspeicher
501 zum Zähler 503 übertragen wird. Auf diese Weise wird
die dynamische Zeitverkettung des Anfangssegmentes des
Sprachmusters mit dem Bezugswort "Eins" gestartet. Während
der DTW-Zeitausrichtung für das Bezugswort "Eins" wird
der Komparator 511 wieder betätigt und die Verarbeitung
abgebrochen, ohne einen Zeitausrichtungs-Endpunkt zu
erreichen. Die dynamische Zeitverkettung der Bezugswörter
"Zwei" und "Drei" führt ebenfalls zu Abbruchsignalen
AB, da die Abstandssignale d′ vom Prozessor 207 das Schwellenwertsignal
T(n) vom Festwertspeicher 509 übersteigen,
bevor ein Zeitausrichtungsweg-Endpunkt erzeugt wird.
Nach Beendigung der DTW-Verarbeitung für das Bezugswort
"Drei" erzeugt das DTW-Steuergerät 430 die Impulse FSR
und IW 1. Der Impuls IW 1 schaltet den Wortzähler 220
weiter, so daß die Merkmalssignale für das Bezugswort
"Vier" im Speicher 205 adressiert werden. Der Impuls
FSR stellt den Zähler 503 auf den anfänglichen DTW-Verarbeitungsrahmen
n=1 im Zwischenspeicher 501 ein und stellt
den Zähler 505 auf 1 zurück. Es wird dann das Rahmensignal
n=1 vom Zähler 503 an den Sprachmuster-Merkmalsspeicher
203 und den Stufenspeicher 210 angelegt. Die Merkmalssignale
des Sprachmustersegments für die Stufe 1 werden
dann entsprechend der Adressierung durch den Zähler 503
dem DTW-Prozessor 207 zur Verfügung gestellt, und der
Stufenspeicher 210 wird in die Lage versetzt, die Zeitausrichtungsweg-
Ergebnisse für das Bezugswort "Vier"
aufzunehmen.
Der Prozessor 207 kann dann die Merkmalssignale des gewählten
Bezugswortes (Vier) für die Rahmen 1m M
mit den Merkmalssignalen des Sprachmusters für den im
Zähler 503 gespeicherten Rahmen n zeitlich verketten.
Die zeitliche Verkettung für den Rahmen n=1 wird unter
Ansprechen auf das Signal DST von der Steuerung 430 gestartet.
Der DTW-Prozessor 207 kann eine Anordnung enthalten,
wie sie in der Veröffentlichung "Microproducts Hardware
System Reference" der Data General Corporation, Westboro,
Massachusetts, 1979, beschrieben ist, oder andere Prozessorsysteme
bekannter Art.
Die Operationsfolge
des Prozessors 207 wird durch die permanent im Festwertspeicher
des Prozessors abgelegten Befehle bestimmt.
Der Prozessor 207 führt entsprechend
gespeicherten Befehlen
die dynamischen Zeitverkettungsoperationen nach Gleichung
(7) für jeden Sprachmusterrahmen n durch.
Jede Rahmen-Zeitausrichtoperation wird durch das Signal
DST gestartet. Die Auswahl der Bezugswortrahmen für die
zeitliche Ausrichtung erfolgt gemäß Gleichung (7) unter
Abänderung abhängig von den Signalen R 1 und R 2.
Der Prozessor 207 liefert das Signal d′ entsprechend
dem Wegabstand der augenblicklichen Stufe für den Rahmen
n 1, das Signal M I , das dem Bezugswortrahmen der unteren
Grenze entspricht, das Signal M H , das dem Bezugswortrahmen
der oberen Grenze entspricht, das Signal SFN, das dem
Anfangsrahmen des Ausrichtungswegs entspricht, und das
Signal d s , das dem kumulativen Abstand des Zeitausrichtungswegs
von dem Sprachmustersegment-Anfangsrahmen
entspricht.
Am Ende der DTW-Operation des Prozessors 207 für den
Rahmen n=1 legt der Prozessor das Signal DDN an die DTW-
Steuerung 430. Das Signal d′ vom Prozessor 207 wird mit
dem Signal T(n) für den Rahmen 1 vom Festwertspeicher
509 im Komparator 511 verglichen. Für d′ (1)<T (1) wird
der Ausgang AB des Komparators abgeschaltet. Zu diesem
Zeitpunkt wird der Bezugswortrahmen der oberen Grenze
für die Zeitverkettung M H vom Prozessor 207 ausgegeben
und im Komparator 520 mit dem Endrahmen M des Bezugsworts
w₄ aus dem Speicher 205 verglichen. Der Ausgang EP des
Komparators 520 bleibt abgeschaltet, da M H M ist. Unter
Ansprechen auf das Signal DDN und die abgeschalteten
Signale EP und AB erzeugt die Steuerung 430 das Signal
FSI, das die Zähler 503 und 505 auf den Zustand n=2 weiterschaltet,
und außerdem das Signal DST, um die DTW-
Operation für den Rahmen n=2 im Prozessor 207 zu starten.
Im Flußdiagramm gemäß Fig. 10 wird entsprechend dem Entscheidungskästchen
1020 d′ mit T n bei jeder Zeitverkettungsoperation
verglichen und in das Entscheidungskästchen
1025 eingetreten, um den oberen Bezugsrahmen M H mit dem
Bezugswort-Endrahmen M zu vergleichen. Wenn das Entscheidungskästchen
1025 mit der Angabe "Nein" verlassen
wird, tritt man in das Entscheidungskästchen 1040 ein.
Dort wird das Bezugswort-Rahmensignal M L der unteren
Grenze mit dem Bezugswort-Endrahmen M verglichen, und
der Sprachmusterrahmen n wird mit dem Sprachmuster-
Endrahmen N M verglichen. Wenn entweder M=M oder
n N M ist, so ist das Ende des Sprachmustersegments
für die Stufe erreicht. Die Zeitausrichtungsoperationen
für das Bezugswort werden dann entsprechend dem Index-
Abänderungskästchen 1050 beendet, wie oben beschrieben.
Im anderen Fall wird der Sprachmusterrahmen n entsprechend
dem Index-Kästchen 1045 weitergeschaltet.
Wenn der Stufen-Wegabstand d′(n) bis zu und einschließlich
des Rahmens n kleiner als der im Festwertspeicher 509
festgelegte Schwellenwert T(n) ist (Entscheidungskästchen
1020) und der Bezugsrahmen M H der oberen Grenze gleich
oder größer als der letzte Bezugswortrahmen M ist (Entscheidungskästchen 1025), so ist ein
gültiger Zeitausrichtungsweg festgestellt worden. Das
kumulative Wegabstandssignal d s (n) vom Prozessor 207
wird dann mit dem kumulativen Abstandssignal verglichen,
das vorher an der n-ten Rahmenstelle des Stufenspeichers
abgelegt worden ist. Wenn d s (n)<(n) ist, ersetzt das
kumulative Abstandssignal d s (n) vom Prozessor das Abstandssignal
(n) im Speicherabschnitt 210-2, beginnend mit
dem Rahmensignal SFN(n) vom Prozessor, das das Signal
SN(n) im Speicherabschnitt 210-1 ersetzt hat. Die Ersetzung
gemäß Kästchen 1035 findet statt, da der zuletzt
bestimmte Weg einem besseren Bezugswort-Kandidatenweg
entspricht, der beim Rahmen n endet. Wenn jedoch
d s (n) - (n) ist, so ist der vorher bestimmte Weg der
bessere Kandidat, und es wird aus dem Kästchen 1030 in
das Entscheidungskästchen 1040 eingetreten.
Bei dem Ausführungsbeispiel ist M H M beim Rahmen n=29
der ersten Stufe und d s (29=15,2 ist kleiner als
(29)=LPN. Demgemäß wird (29) zu 15,2 und SN (29)
wird 1. Nach der Ersetzung gemäß Kästchen 1035 wird der
Bezugsrahmen M L der unteren Grenze vom DTW-Prozessor
mit dem Bezugswort-Endrahmen M verglichen, und der
Sprachmusterrahmen n wird mit dem Sprachmuster-Endrahmen N m
gemäß Entscheidungskästchen 1040 verglichen,
um festzustellen, ob die Grenzen des Sprachmustersegments
der Stufe erreicht worden sind. Wenn die untere Grenze
M L M oder n N m ist, so ist die Stufen-DTW-Verarbeitung
für das Bezugswort "Vier" beendet, und man tritt
in das Indexkästchen 1050 ein. Im anderen Fall wird der
Sprachmusterrahmen weitergeschaltet (Kästchen 1045),
und die Zeitverkettung für den nächsten Rahmen wird begonnen.
Bei der Schaltung nach Fig. 2 und 3 wird die dynamische
Zeitverkettung der Merkmale des Bezugswortes "Vier" mit
den Sprachmustermerkmalen für aufeinander folgende
Rahmen nach n=1 im Prozessor 207 durchgeführt.
Am Ende der DTW-Operation für den Rahmen n=29
wird das Bezugsrahmensignal M H der oberen Grenze vom
Prozessor 207 gleich dem Signal M vom Bezugsmerkmalsspeicher
205, was bedeutet, daß ein Endpunkt erreicht ist.
Die Signale M H und M gelangen zum Komparator 520, der
jetzt betätigt wird. Das Signal EP vom Komparator 520
wird der DTW-Steuerung 430 zugeführt. Unter Ansprechen
auf das Signal EP schaltet die Steuerung 430 das Signal
C aus und das Signal E ein. Dann wird der Komparator
301 in Fig. 3 unter Ansprechen darauf betätigt, daß das
akkumulierte Abstandssignal d s (29)=15,2 vom Prozessor
207 kleiner als das akkumulierte Abstandssignal =LPN
ist, das für den Rahmen 29 im Speicherabschnitt 210-2
der Stufe L+1=1 abgelegt ist. Das Ausgangssignal SFN
des DTW-Prozessors 207 ist 1 entsprechend dem Anfangsrahmen
der ersten Stufe. Das Ausgangssignal d s des Prozessors
ist 15,2 entsprechend dem kumulativen Abstand,
und zwar bis zum Endpunkt n=29 der Stufe 1. Das Signal
SFN=1 wird dem Eingang des Speicherabschnitts 210-1 über
das UND-Gatter 272 und das ODER-Gatter 286 zugeführt,
und das Signal d s =15,2 gelangt über das UND-Gatter 280
und das ODER-Gatter 282 an den Eingang des Speicherabschnitts
210-2. Das Ausgangssignal w=4 des Wortzählers
220 wird an den Eingang des Stufenspeicherabschnitts
210-3 über das UND-Gatter 281 angelegt.
Unter Ansprechen darauf, daß das Signal D S eingeschaltet
ist, wird das Signal WLSC von der Steuerung 430 als Signal
WLS an den Schreibbetätigungseingang des Speichers
210 über das ODER-Gatter 465 angelegt. Auf diese Weise
werden das Bezugswort-Identifiziersignal w=4, das kumulative
Abstandsignal d s =15,2 und der Anfangsrahmencode
SFN=1 in die Stellen =29, =1 des Stufenspeichers 210
eingschrieben. Das Signal WLSC stellt außerdem das Abbruch-Flipflop
290 zurück. Nach dem Ende des Schreibimpulses
WLS liefert die Steuerung 430 den Impuls FSI
zur Weiterschaltung der Zähler 503 und 505 in Fig. 5.
Das Signal E ist ausgeschaltet, und das Signal C ist
eingschaltet. Das Signal DST von der Steuerung 430 wird
dem Prozessor 207 zugeführt, um die dynamische Zeitverkettung
für den Sprachmusterrahmen n=30 zu starten.
Die dynamische Zeitverkettung für jeden der Rahmen
29-40 führt zu einer Endrahmen-Erzeugung für die
Stufe L+1=1. Die Beendigung der Zeitverkettung für jeden
Rahmen wird durch das Signal DDN vom Prozessor
207 angezeigt. Die gleichzeitige Einschaltung des Ende-
Signals DDN vom Prozessor 207, des Endrahmensignals EP
vom Komparator 520 der Rahmenfolgelogik und des Signals
DS vom Komparator 301 leitet die Einspeicherung des
akkumulierten Abstandssignals des Endrahmensweges,
des Anfangsrahmen-Wegsignals SFN und des Bezugswort-
Identifizierungssignals w im Stufenspeicher 210 ein, wie
mit Bezug auf den Sprachmusterrahmen 29 beschrieben. Die
DTW-Verarbeitung des Bezugswortes "Vier" für die Rahmen
n=29 bis n=40 führt zu Zeitausrichtungswegen, die vom
Anfangsrahmen SFN=1 ausgehen.
In der Tabelle 1 sind das Wortidentifizierungssignal , das
kumulative Abstandssignal und das Anfangsrahmensignal
SN aufgeführt, die im Stufenspeicher 210 als Ergebnis
der Verarbeitung der Rahmen n=29 bis n=40 für die erste
Stufe abgelegt worden sind.
Während der dynamischen Zeitverkettung der Merkmale des
Bezugswortes "Vier" und des Segments der ersten
Stufe für den Rahmen n=41 übersteigt das Signal
d′ vom Prozessor 207 das maximale, im Festwertspeicher
509 erzeugte Schwellenwertsignal ohne Erzeugung eines
Endpunktsignals EP. Demgemäß wird ein Abbruchsignal AB
vom Komparator 511 erhalten. Dieses Signal veranlaßt
die Steuerung 430, den Wortzähler 220 mit Hilfe des Impulses
IW 1 weiterzuschalten, und stellt den Zähler 503 auf
den Anfangsrahmen im Zwischenspeicher 501 mit Hilfe des
Signals FSR zurück, so daß die dynamische Zeitverkettung
für das Bezugswort "Fünf" begonnen wird.
Die dynamische Zeitverkettung der akustischen Bezugswortmerkmale
mit den Sprachmustersegmentmerkmalen der ersten
Stufe entsprechend dem Flußdiagramm in Fig. 10 wird wiederholt
für die Bezugswörter "Fünf", "Sechs", "Sieben",
"Acht" und "Neun". Bei dem Ausführungsbeispiel hört jeweils
die DTW-Verarbeitung für diese Bezugswörter über
das Entscheidungskästchen 20 wegen der Unähnlichkeit
zwischen dem Bezugswort und den Sprachmustermerkmalssignalen
auf. Demgemäß gibt Tabelle 1 die Zeitausrichtungswege
an, die bei der DTW-Verarbeitung der ersten
Stufe bestimmt worden sind. Jedesmal dann, wenn der Bezugswortindex
gemäß Kästchen 1050 weitergeschaltet worden
ist, wird gemäß Kästchen 1055 bestimmt, ob das letzte
Bezugswort verarbeitet worden ist. Nach der Verarbeitung
der Merkmale des letzten Bezugswortes wird das Abbruchmerkzeichen
gemäß Entscheidungskästchen 1060 überprüft.
Wenn - wie beim Ausführugsbeispiel - das Abbruchmerkzeichen
zurückgestellt ist, wurde ein gültiger Zeitausrichtweg
bestimmt, und die Stufe L wird entsprechend
dem Indexkästchen 1065 weitergeschaltet. Wenn das Abbruchmerkzeichen
gesetzt bleibt, ist kein gültiger Weg für
diese Stufe bestimmt worden. Demgemäß ist kein möglicher
Zeitausrichtweg für die nachfolgende Stufe vorhanden.
Wenn die erste Stufe keinen gültigen Weg hat, tritt man
über das Entscheidungskästchen 1075 in das Wiederholungskästchen
1080 ein, und der Sprecher wird gebeten, seine
Sprachäußerung zu wiederholen. Das Signal RPT wird durch
die Folgesteuerschaltung 400 unter Ansprechen auf das
Signal ABFF vom Flipflop 291 erzeugt. Das Signal RPT
veranlaßt den Nachrichten-Synthetisierer 295, eine synthetisierte
Nachricht zu erzeugen, die den Sprecher veranlaßt,
sein Sprachmuster zu wiederholen. Wenn bei den
nachfolgenden Stufen kein gültiger Weg vorhanden ist,
werden die Sprachmuster-Kandidaten auf der Grundlage
der bereits gespeicherten Wegsignale ausgewertet. Für
das Sprachmuster 4453 wird die Stufe L auf L=1 weitergeschaltet,
und man tritt über das Entscheidungskästchen
1070 in die Bereichseinstell-Betriebsweise ein, die im
Flußdiagramm gemäß Fig. 11 dargestellt ist.
Wie oben beschrieben, kann das für die Zeitausrichtung
auf jeder Stufe gewählte Spachmustersegment über den
gesamten Bereich von Endrahmen erstreckt werden, die
für die vorhergehende Stufe bestimmt worden sind. Es
wurde jedoch gefunden, daß die Endrahmen an den äußersten
Enden eines Stufen-Sprachmustersegments im allgemeinen
sehr große kumulative Abstandssignale haben. Demgemäß
sind die über diese Endpunkte erzeugten Wege sehr unwahrscheinlich.
Der Bereich
der Anfangsrahmen SN wird für jede Stufe beschränkt auf
um diese sehr unwahrscheinlichen Wege
zu eleminieren. MT ist ein fester Bereichsfaktor und
d p /n d das normierte, minimale, kumulative Abstandssignal,
das bei der Verarbeitung der vorhergehenden Stufe
erhalten worden ist. Im einzelnen werden die Endpunkte
einer Stufe nach der DTW-Verarbeitung der Stufe abgetastet,
um den minimalen, normalisierten, kumulativen Abstand
und den entsprechenden Endpunkt n p zu bestimmen.
Es wird dann dieser Abstandswert d p /n d benutzt, um den
Bereich des Anfangsrahmens für die DTW-Verarbeitung der
nachfolgenden Stufe zu begrenzen.
Die Bestimmung des minimalen, normalisierten Abstandssignals
und des ihm entsprechenden Rahmens ist im Flußdiagramm
gemäß Fig. 11 dargestellt und wird mit der Schaltung
gemäß Fig. 2 und 3 unter Steuerung des Bereichssteuergeräts
440 durchgeführt. Die Bereichseinstelloperationen
werden abhängig vom Signal EC von der Steuerung
430 eingeleitet, das bei der Bestimmung der DTW-Stufenverarbeitungsbetriebsweise
auftritt. Unter Ansprechen
auf das Signal EC erzeugt die Folgesteuerschaltung 400
den Startimpuls SD. Dieser wird der Bereichssteuerung
440 zugeführt, die zu Anfang die Impulse SN 1D, SLPN und
das Steuersignal BF erzeugt. Der Impuls SN 1D stellt über
das ODER-Gatter 461 den Anfangsrahmenzähler 230 zurück,
so daß das Signal n s =1 entsprechend dem Index-Einstellkästschen
1110 in Fig. 11 ist. Der Impuls SLPN von der
Steuerung 440 führt ein Signal d p =LPN in den Zwischenspeicher
309 ein, während der Impuls SLT 1 ein Signal
1 in den Zwischenspeicher 320 gibt (Index-Einstellkästchen
1120). Das ODER-Gatter 469 liefert ein Signal B an
die Adressenlogik 290 in Fig. 2, und zwar unter Ansprechen
auf das Signal BF von der Steuerung 440. Das Signal
B bereitet das UND-Gatter 233 über das ODER-Gatter 231
und außerdem das UND-Gatter 258 über das ODER-Gatter
252 vor. Auf diese Weise werden das Abtast-Rahmenausgangssignal
des Anfangsrahmenzählers 230 als Signal
und das Stufensignal L=1 vom Stufenzähler 250 als Signal
an die Adresseneingänge des Stufenspeichers 210 geliefert.
Der Komparator 311 vergleicht das normalisierte, kumulative
Abstandsausgangssignal (n s )/n s vom Teiler 335,
Abschnitt 210-2, entsprechend dem Entscheidungskästchen
1130 mit dem Ausgangssignal (d p /n d) des Zwischenspeichers
309. Der Teiler 335 kann eine integrierte, arithmetische
Prozessoreinheit
enthalten. Falls das Signal (n s /n s kleiner als das
Ausgangssignal d p /n d des Zwischenspeichers 309 ist,
wird der Ausgang DL des Komparators 311 eingeschaltet.
Dadurch wird das Signal (n s /n s vom Speicherabschnitt
210-2 in den Zwischenspeicher 309 gegeben, während entsprechend
dem Kästchen 1140 der entsprechende Rahmen
n s in den Zwischenspeicher 320 gegeben wird. Bei Abwesenheit
eines Signals DL vom Komparator 311 bleibt der
Inhalt der Zwischenspeicher 309 und 320 unverändert.
Die Steuerung 440 erzeugt dann den Impuls IN 1D, der dem
Anfangsrahmenzähler 230 über das ODER-Gatter 463 zugeführt
wird, um entsprechend dem Index-Kästchen 1150 den
Abtastrahmen n s weiterzuschalten. Wenn der weitergeschaltete
Rahmen n s der Endrahmen des Sprachmusters ist
(Entscheidungskästchen 1160), so liefert der Anfangsrahmenzähler
230 das Signal NMS, um die Bereichseinstelloperation
zu beenden, indem die Bereichssteuerung 430
veranlaßt wird, das Endesignal ED zu erzeugen.
Während der Folge von Bereichsabtastoperationen wird
der Wert n s vom Rahmenzähler 230 über das UND-Gatter
324 und das ODER-Gatter 326 einem Eingang des Subtrahierers
330 zugeführt. Dieser erzeugt das Signal Nm-n d.
Der Komparator 332 liefert das Signal DE, wenn das
Signal n d entsprechend dem Entscheidungskästchen 1170
im Endrahmenbereich δ END liegt. Wenn das Signal DE eingeschaltet
ist, stellt der Minimalabstandsrahmen n d einen
gültigen Endrahmen für die Verarbeitung der Stufe
dar, und die Verarbeitung wird beendet. Für die Stufe
L=1 ist das minimale, normierte Abstandssignal im Zwischenspeicher
309 aus Tabelle 1
und der zugehörige n d-Rahmen ist 33. Folglich wird das
Signal DE am Ausgang des Komparators 332 nicht eingeschaltet,
und es wird die Einleitungsbetriebsweise entsprechend
dem Flußdiagramm in Fig. 8 gestartet.
Das Signal ED von der Bereichssteuerung 440 und das Signal
vom Komparator 332 werden am Ende der Bereichseinstellbetriebsweise
der Folgesteuerung 400 zugeführt. Diese
startet die Einleitungsbetriebsweise für die zweite Stufe
durch Erzeugung des Steuerimpulses SI, der die Stufen-
Betriebseinleitungssteuerung 410 aktiviert. In der Steuerung
410 werden unter Ansprechen auf den Impuls SI das
Steuersignal I und der Steuerimpuls SN 1I erzeugt. Wie
oben mit Bezug auf die Betriebseinleitung der ersten
Stufe beschrieben worden ist, veranlaßt das Signal I
die Stufenspeicher-Adressierlogik 290. Rahmenabtastsignale
vom Rahmenzähler 230 und das Stufensignal L+1=2 vom Stufenzähler
250 den Adresseneingängen des Stufenspeichers
210 zuzuführen. Das Signal bereitet außerdem die Gatter
274 und 284 vor, wodurch ein LPN-Code dem Eingang des
Stufenspeicherabschnitts 210-2 und ein Null-Code dem
Eingang des Stufenspeicherabschnitts 210-1 zugeführt
werden. Der Rahmenzähler 230 wird durch den Impuls SN 1
vom ODER-Gatter 461 entsprechend dem Index-Einstellkästchen
810 in Fig. 1 auf den Zustand n s =1 zurückgestellt.
Die Rahmenstellen n s der zweiten Stufe für die Stufe
L+1=2 werden dann entsprechend dem Kästchen 820, 830
und 840 nacheinander abgeändert.
Zu Anfang adressiert das Signal n s =1 vom Rahmenzähler
230 den ersten Sprachäußerungsrahmen n s =1 der Stufe L+1=2
im Speicher 210. Der Code LPN wird in den Abschnitt 210-2
und der Code "Null" in den Speicherabschnitt 210-1 eingegeben,
und zwar unter Ansprechen auf den Schreibbetätigungsimpuls
WLS, der aus dem Ausgangssteuerimpuls WLSI
der Steuerung 410 abgeleitet wird. Dann wird entsprechend
dem Index-Kästchen 830 in Fig. 8 durch einen Impuls IN 1I
von der Steuerung 410 der Rahmenzähler 230 weitergeschaltet.
Das Einschreiben wird für die nachfolgenden Signale
n s vom Rahmenzähler 230 wiederholt, solange das Signal
n s den Sprachmuster-Endrahmen N m nicht übersteigt
(Entscheidungskästchen 840). Wenn n s =n m ist, wird das
Signal NMS vom Rahmenzähler 230 eingeschaltet. Die Steuerung
410 liefert dann den Ende-Impuls EI, um die Einleitungsbetriebsweise
zu beenden.
Die im Flußdiagramm gemäß Fig. 9 dargestellte Abtastbetriebsweise
wird unter Steuerung der Abtaststeuerung
420 durchgeführt. Die Steuerung 420 wird durch einen
Steuerimpuls SB von der Folgesteuerschaltung 400 durch
den Ende-Impuls EI aktiviert. Am Anfang der Abtastbetriebsweise
wird die Adressierlogik 290 veranlaßt, das Signal
n s vom Rahmenzähler 230 und das Signal L vom Stufenzähler
250 mittels des Signals BB vom Steuergerät 420 an die
Adresseneingänge des Stufenspeichers 230 anzulegen. Der
Impuls SNM stellt den Rahmenzähler 230 auf den Zustand
n s =n m ein (Indexkästchen 910). Die Signale (N m ) und
SN (N m ) vom Stufenspeicher 210 werden dem Teiler 355
bzw. dem UND-Gatter 335 zugeführt. Das Signal MT ist
dauernd auf 1,2 eingestellt. Der Teiler 335 erzeugt das
Signal (Nm)/N m =LPN/128, das mit dem Ausgangssignal
des Multiplizierers 303 (1,2 d p /n d=0,458) verglichen
wird.
Das Signal
â(Nm)/N m übersteigt das Multipliziererausgangssignal.
Das Signal DMT vom Komparator 305 wird nicht eingeschaltet,
und das Signal DMTA vom UND-Gatter 381 bleibt abgeschaltet
(Entscheidungskästchen 912). Unter Ansprechen
auf das abgeschaltete DMTA-Signal vom UND-Gatter 381
liefert die Steuerung 420 einen Impuls DN 1, der den Rahmenzähler
230 zurückschaltet. Das Rückschalten des Zählers
findet unter Ansprechen auf ein abgeschaltetes DMTA-Signal
für die aufeinander folgenden Rahmen N m , N m-1 usw. statt,
bis ein Rahmen n s erreicht ist, für den gilt:
d(n s )/n s 0,458. Dies findet statt im Rahmen n s =39,
für den gilt: SN (39)≠0 und d(ns)/n s =0,426.
Es wird dann das Signal DMTA vom Gatter 381 eingeschaltet.
Das Signal n s =39 wird unter Ansprechen auf die Signale
DMTA und BD in den Zwischenspeicher 350 eingegeben (Kästchen
920). Das Signal n s wird über das Gatter 383 einem
Eingang des Komparators 385 zugeführt. Falls n<0 ist,
wird das Signal NS 0 betätigt. Unter Ansprechen auf das
Signal NSO erzeugt die Abtaststeuerung 420 ein Signal
RPT. Das Signal RPT schaltet den Nachrichten-Synthetisierer
295 ein, und der Sprecher wird aufgefordert, seine
Sprachäußerung zu wiederholen. In der Steuerung 420 wird
durch das Signal DMTA das Signal BD abgeschaltet und
das Signal BU eingeschaltet.
Der über das ODER-Gatter 461 von der Steuerung 420 zugeführte
Impuls SN 1B stellt entsprechend dem Index-Einstellkästchen
922 in Fig. 9 den Zähler 230 in den Zustand
n s =1 zurück, so daß die Signale (1) und SN (1) auf
den Leitungen 211-2 bzw. 211-1 zur Verfügung stehen.
Entsprechend dem Entscheidungskästchen 924 wird das Signal
(n s )/MD mit dem Bereichseinstellfaktor (MT) · (dp/n d)
verglichen, und der Anfangsrahmen SN(n s ) wird mit
Null verglichen, um festzustellen, ob der augenblickliche
Abtastrahmen n s innerhalb des vorgeschriebenen Bereichs
liegt. Das während der Verarbeitung der Stufe 1 gewonnene,
minimale, normierte Abstandssignal
wird im Zwischenspeicher 309 in Fig. 3 abgelegt.
Das Signal
wird im Multiplizierer 303 mit dem Bereichsfaktor
MT=1,2 multipliziert, und das Ausgangssignal des
Multiplizierers wird einem Eingang des Komparators 305
zugeführt. Das Signal (d) (1)/1=LPN vom Teiler 355 gelangt
an den anderen Eingang des Komparators 305. Der Ausgang
des Komparators 305 wird nicht betätigt. Das Signal
SN (1)=0 wird einem Eingang des Komparators 338 über
das UND-Gatter 335 und das ODER-Gatter 337 zugeführt.
Der Ausgang des Kompaators 338 wird nicht betätigt,
weil das Signal SN nicht größer als Null ist. Demgemäß
bleibt das Signal DMTA vom UND-Gatter 381 abgeschaltet.
Zu diesem Zeitpunkt erzeugt die Steuerung 420 das Signal
IN 1B, das den Rahmenzähler 230 über das ODER-Gatter 463
weiterschaltet. Auf diese Weise wird das Signal n s vom
Rahmenzähler 230 entsprechend dem Index-Änderungskästchen
930 in Fig. 9 auf Zwei eingestellt.
Die Signale vom Stufenspeicherabschnitt 210-2 haben
den Wert LPN, bis der Rahmen n s =29 erreicht ist. Das
Signal (n s )/n s für den Rahmen n s =29 ist 15,2/29=0,524,
und das entsprechende SN-Signal ist Eins. Wenn die Stellen
n s =29 des Stufenspeichers 210 adressiert werden,
bleibt der Komparator 305 abgeschaltet, und der Komparator
338 wird betätigt. Das Signal DMTA bleibt abgeschaltet,
und der Rahmenzähler 230 wird auf n s =30 weitergeschaltet.
Beim Rahmen n s =31 wird das Signal DMTA vom UND-Gatter
331 unter Ansprechen auf SN (31)=1 und = 0,423
der Steuerung 420 zugeführt, und die Abtastbetriebsweise
der zweiten Stufe wird durch Erzeugung des Signals EB
in der Steuerung 420 beendet. Der Impuls EB veranlaßt
die Folgesteuerschaltung 400, die Steuerimpulse FSL und
SC zu erzeugen. Der Impuls FSL stellt das Abbruch-
Flipflop 291 ein und überträgt den Code n s =31 in den
Zwischenspeicher 501 in Fig. 5. In diesem Rahmen wird
die dynamische Zeitverkettungsverarbeitung der zweiten
Stufe gestartet. Das Signal SC veranlaßt die DTW-Steuerung
440, die DTW-Verarbeitung für die zweite Stufe entsprechend
dem Flußdiagramm in Fig. 10 einzuleiten.
Bei der DTW-Verarbeitung der zweiten Stufe erstreckt
sich der Bereich der Sprachmustersegment-Anfangsrahmen
vom Rahmen n s =31 zum Rahmen n s =39. Zu Anfang werden die
Steuerimpulse SW 1 und FSR sowie das Steuersignal C von
der Steuerung 430 unter Ansprechen auf den Impuls SC
von der Folgesteuerschaltung 400 geliefert. Der Impuls
SW 1 stellt entsprechend dem Index-Kästchen 1005 in Fig. 10
den Wortzähler 220 auf w=w₀ zurück. Der Impuls FSR überträgt
den Code n s =31 vom Zwischenspeicher 501 zum Zähler
503 (Kästchen 1010) und stellt den Zähler 505 auf Eins
zurück. Das Signal C veranlaßt die Adressierlogik 290,
das Rahmensignal vom Zähler 503 und das Stufensignal
L=1 vom Stufenzähler 250 an die Adressensteuereingänge
und des Stufenspeichers 210 anzulegen.
Es wird dann das Signal DST von der Steuerung 430 an
den DTW-Prozessor 207 gegeben, um die dynamische Zeitverkettung
zwischen den Sprachmustersegment-Merkmalssignalen
des Rahmens 31 im Speicher 203 und den Merkmalssignalen
für das Bezugswort Null im Bezugswortspeicher
205 zu starten. Die Zeitausrichtungsverarbeitung des
Prozessors 207 schreitet entsprechend dem Kästchen 1015
in Fig. 10 weiter, wie mit Bezug auf die Verarbeitung
der ersten Stufe beschrieben worden ist. Wegen der Unähnlichkeit
der Merkmalssignale für das Bezugswort "Null"
mit dem Sprachmustersegment der zweiten Stufe wird
die dynamische Zeitverkettung entsprechend dem Entscheidungskästchen
1020 abgebrochen, bevor entsprechend dem
Entscheidungskästchen 1025 ein Endpunkt erreicht ist.
Demgemäß werden keine Abstandssignale oder Anfangsrahmensignale
für das Bezugswort "Null" im Stufenspeicher 210
abgelegt.
Unter Ansprechen auf das Signal AB vom Komparator 511
und das Signal DDN vom Prozessor 207 zum Zeitpunkt des
Abbruchs erzeugt der Prozessor 430 dem Impuls IW 1. Dieser
schaltet entsprechend dem Index-Kästchen 1050 den Wortzähler
220 weiter, so daß die DTW-Verarbeitung für das
Bezugswort "Eins" gestartet werden kann. Es wird das
Signal FSR erzeugt und der Zähler 503 auf den Anfangsrahmencode
n=31 sowie der Zähler 505 auf den ersten Zustand
zurückgestellt. Die DTW-Verarbeitung für das Bezugswort
"Eins" wird ausgehend vom Rahmen n=31 für jeden
Sprachmusterrahmen unter Ansprechen auf nachfolgende
Startimpulse DST von der Steuerung 430, Ende-Impulse
DDN vom Prozessor 207 und Weiterschaltimpulse FSI von
der Steuerung 430 durchgeführt. Die Operationen folgen
der Schleife mit dem Kästchen 1015, den Entscheidungskästchen
1020, 1025 und 1040 sowie dem Index-Änderungskästchen
1045 in Fig. 10, bis der Sprachmusterrahmen
71 verarbeitet wird.
Beim Rahmen 71 ist das Bezugswort-Rahmensignal
M H für die obere Grenze vom DTW-Prozessor 207 größer
als der Bezugswort-Endrahmen M²₁ für das Bezugswort "Eins".
Das Signal EP, nämlich die Endrahmenangabe, wird vom
Komparator 520 in Fig. 5 entsprechend dem Entscheidungskästchen
1025 erzeugt. Das Signal EP wird durch die
Steuerung 430 erzeugt und dann in das Entscheidungskästchen
1030 eingetreten. Das kumulative Abstandssignal
für den Rahmen 71 im Stufenspeicherabschnitt 210-2 wird
zum Komparator 301 gegeben und das kumulative DTW-Abstandssignal
d s vom Prozessor 207 wird dem anderen Eingang
des Komparators 301 zugeführt. Das Signal d s =41,2 ist
kleiner als =LPN.
Das Signal E verändert die Adressierlogik 290 so, daß
der Rahmen n=71 der Stellen für die Stufe L+1=2 im Stufenspeicher
210 adressiert werden. Das Signal DS vom Komparator
301 wird eingeschaltet, und die Steuerung 430 erzeugt
das Signal WLSC. Es werden dann das kumulative Abstandssignal
d s (71)=41,2 und der Anfangsrahmencode SN (71)=38
über die UND-Gatter 280 bzw. 274 in den Stufenspeicher
210 gegeben, und zwar unter Ansprechen auf das Schreibbetätigungssignal
WLS. Das Identifiziersignal für das
Bezugswort "Eins" wird über das UND-Gatter 281 in den
Stufenspeicher 210 gegeben. Wenn die Einspeicherung der
Signale d s und SFN entsprechend dem Kästschen 1035 beendet
ist, wird wiederum in das Kästchen 1015 für den Rahmen
n=72 eingetreten, und zwar über das Entscheidungskästchen
1040 und das Indexkästchen 1045. Auf entsprechende Weise
wird ein Impuls EP für jeden der Sprachmusterrahmen
72 und 73 erzeugt. Das kumulative Abstandssignal d s =35,2
für den Rahmen n=72 und der Anfangsrahmencode SFN=38
vom Prozessor 207 werden in die Stufe L+1=2 des Speichers
210 eingegeben. Für den Sprachmusterrahmen 73 werden
das kumulative Abstandssignal d s =39,1 und das Signal
SFN=38 vom Prozessor 207 in die Stufe L+1=2 des Speichers
entsprechend dem Kästchen 1035 eingechrieben.
Nach der Verarbeitung für den Rahmen n=73 führt die dynamische
Zeitverkettung entsprechend dem Kästchen 1015
zu einem Abbruchsignal AB vom Komparator 511 (Entscheidungskästchen
1020). Bei Erzeugung des Signals AB wird
der Wortzähler 220 entsprechend dem Indexkästchen 1050
durch das Signal IW 1 weitergeschaltet. Der Zähler 503
wird entsprechend dem Kästchen 1010 auf den Rahmen n=31
zurückgestellt, und die dynamische Zeitverkettung für
das Bezugswort "Zwei" wird unter Steuerung der Steuerschaltung
430 gestartet.
Die DTW-Verarbeitung des Bezugswortes "Zwei" für die
zweite Stufe führt zu Zeitausrichtungswegen, die bei
den Sprachmustersegment-Rahmen 47 bis 60 enden. Eine
Teilaufstellung der kumulativen Abstandssignale d s und
der Anfangsrahmensignale SFN für diese Endrahmen ist
in Tabelle 2 angegeben.
Für jeden dieser Sprachmusterrahmen betrug das vorher
im Speicher 210-2 gespeicherte Abstandssignal =LPN.
Das kumulative Abstandssignal vom Prozessor 207 läßt
den Komparator 301 ansprechen, wodurch das kumulative
Abstandssignal und die Anfangsrahmencodierungen vom Prozessor
207 unter Ansprechen auf Signale E und WLSC von
der Steuerung 430 in den Stufenspeicher 210 gegeben werden.
Die DTW-Verarbeitung für das Bezugswort "Zwei" wird am
Ende der Operation des Prozessors 207 für den Sprachmustersegmentrahmen
n=60 beendet, nachdem das Signal
EP vom Komparator 520 erzeugt (Kästchen 1025) und die
Signale d s (60) und SFN (60) vom Prozessor in den Stufenspeicher
210 gegeben worden sind (Kästchen 1035). Dann
wird der Komparator 522 betätigt, und zwar unter Ansprechen
darauf, daß der Bezugswortrahmen M L der unteren
Grenze gleich dem Endrahmen M des Bezugswortes ist.
Nach Durchführung der Änderungen im Stufenspeicher 210
für den Rahmen 60 wird das Signal DN erzeugt.
Das Signal DN vom ODER-Gatter 528 veranlaßt die DTW-Steuerung
430, die dynamische Zeitverkettung für das Bezugswort
"Drei" entsprechend den Index-Einstellkästchen 1050,
1055 und 1010 durchzuführen. Die Steuerung 430 erzeugt
den Impuls IW 1, der den Wortzähler 220 auf den Zustand
w=w₃ weiterschaltet, sowie den Impuls FSR. Der Impuls
FSR überträgt das Signal n=31 im Zwischenspeicher 501
zum Zähler 503 und stellt den Zähler 505 in seinen ersten
Zustand zurück. Der Impuls FSR stellt außerdem das Flipflop
370 ein, um das Signal DMTR einzuschalten. Der DTW-
Prozessor 207 wählt nacheinander Zeitausrichtungswege
unter Ansprechen auf die Merkmalssignale für das Bezugswort
"Drei" aus dem Speicher 205 und die Sprachmustersegment-Merkmalssignale
für diejenigen Rahmen, welche
durch den Zähler 503 entsprechend dem Kästchen 1015
adressiert werden.
Die Verarbeitung der nachfolgenden Rahmen, ausgehend
vom Rahmen n=31, folgt der Schleife, die das Kästchen
1015, die Entscheidungskästchen 1020, 1025, 1040 und
das Index-Einstellkästchen 1045 in Fig. 10 umfaßt, und
zwar ohne Erzeugung des Signals EP, bis das Signal d′
vom Prozessor 207 das Schwellenwertsignal am Ausgang
des Festwertspeichers 509 übersteigt. Wegen der Unähnlichkeit
der Merkmalssignale des Bezugswertes "Drei"
und derjenigen des Sprachmustersegments für die zweite
Stufe wird kein Ausrichtungsendpunkt im Komparator 520
festgestellt, bevor das Abbruchsignal AB im Komparator
511 eingeschaltet wird. Unter Ansprechen auf das Signal
AB vom Komparator 511 und das Signal DDN vom Prozessor
207 in demjenigen Rahmen, in welchem die Abbruchbedingungen
auftreten, leitet die Steuerung 430 die DTW-Verabeitung
für das Bezugswort "Vier" durch Erzeugung der Signale
IW 1 und FSR entsprechend den Index-Einstellkästchen 1050,
1055 und 1010 ein.
In Tabelle 3 sind die Endpunkte der Zeitausrichtungswege
angegeben, die während der DTW-Verarbeitung für das Bezugswort
"Vier" erzeugt werden.
Am Ende der DTW-Verarbeitung für den Sprachmusterrahmen
n=59 im Prozessor 207 wird das Signal =30,0 vom Stufenspeicherabschnitt
210-2 mit dem vom Prozessor 207 gewonnenen
Signal d s im Komparator 301 verglichen. Da das
Signal =30,0 (Tabelle 2) kleiner als das Signal d s =31,2
(Tabelle 3) ist, wird der Komparator 301 nicht erregt,
und die DTW-Verarbeitung für den Rahmen 60 wird ohne
Einschreiben der Signale d s und SFN für den Rahmen 59
vom Stufenprozessor 207 eingeleitet. Im Ergebnis hält
der Stufenspeicher 210 die Codierungen w=2, =30,0 und
SFN=32 fest, die vorher bei der Verarbeitung des Sprachmusterrahmens
n=59 für das Bezugswort "Zwei" eingeschrieben
worden sind.
Das bei der Verarbeitung im Rahmen n=60 für das Bezugswort
"Vier" erzeugte Signal EP bewirkt das Einschreiben
der Codierungen d s =26,3 und SFN=34 vom Prozessor 207
in den Stufenspeicher 210. Dies geschieht deswegen, weil
das Signal d s =26,3 (Tabelle 3) kleiner als das Signal
=31,2 (Tabelle 2) ist, das vorher während der DTW-Verarbeitung
für das Bezugswort "Zwei" in den Stufenspeicher
210 eingegeben worden ist. Auf entsprechende Weise werden
die Rahmenwerte n=71 und n=73 für das Bezugswort "Vier"
anstelle der für das Bezugswort "Eins" gewonnenen Werte
in den Speicher 210 gegeben. Die Werte für den Rahmen
n=72 beim Bezugswort "Eins" werden jedoch im Speicher
210 festgehalten. Entsprechend der Erfindung wird der
beste Ausrichtweg für jeden Endrahmen der Stufe im Pegelspeicher
abgelegt.
Nach der DTW-Verarbeitung für den Rahmen n=99
wird kein Endrahmen entsprechend dem Entscheidungskästschen
1025 vor Beendigung der DTW-Verarbeitung über das Abbruchs-
Entscheidungskästchen 1020 oder das Endrahmen-Entscheidungskästchen
1040 erhalten. Unter Ansprechen auf entweder
die Signale DDN und AB oder DDN und D kann in das Wortindex-Einstellkästchen
1050 eingetreten werden, wodurch
die Steuerung 430 Impulse W 1 und FSR erzeugt, um die
DTW-Verarbeitung für das Bezugswort "Fünf" zu erzeugen.
Die Verarbeitung für das Bezugswort "Fünf" führt zu Zeitausrichtungswegen,
die bei Rahmen 98 bis 102
entsprechend der Auflistung in Tabelle 4 enden.
Zeitausrichtungs-Wegeintragungen werden für die
Rahmen 98 und 99 des Bezugswortes "Vier" in den Stufenspeicher
210 eingegeben. Bei der DTW-Verarbeitung für
das Bezugswort "Fünf" festgestellte Wege enden ebenfalls
bei den Rahmen 98 und 99. Mit Bezug auf den Rahmen 98
ist das kumulative Abstandssignal für das Bezugswort
"Vier" kleiner als das für das Bezugswort "Fünf", und
die in Tabelle 3 aufgeführten Signale für den Rahmen
werden im Stufenspeicher 210 festgehalten.
Für den Rahmen 99 ist das in Tabelle 4 aufgeführte
Abstandssignal kleiner als das in Tabelle 3. Folglich
ersetzen das Abstandssignal d s =55,9 und der Anfangsrahmencode
SFN=32 am Ausgang des Prozessors 207 im Rahmen 99 das
Abstandssignal und den Anfangsrahmencode, die für das
Bezugswort "Vier" in den Stufenspeicher 210 eingegeben
worden sind.
Bei Beendigung der DTW-Verarbeitung für das Bezugswort
"Fünf" über das Entscheidungskästchen 1020 oder das Kästchen
1040 wird die Erkennungsschaltung gemäß Fig. 2 und
3 in die Lage versetzt, nacheinander die Bezugswörter
"Sechs", "Sieben", "Acht" und "Neun" zu verarbeiten.
Die Merkmalssignale für diese Bezugswörter führen jedoch
nicht zu Zeitausrichtungswegen, und die Signale d s und
SFN für diese Bezugswörter werden nicht in dem Stufenspeicher
210 gegeben. Nach Verlassen der DTW-Verabeitgung
für das Bezugswort "Neun" über das Abbruch-Entscheidungskästchen
1020 wird der Wortzähler 220 entsprechend dem
Wortindex-Einstellkästchen 1050 weitergeschaltet, und
es erfolgt ein Eintreten in das Abbruchmerkzeichen-Entscheidungskästchen
1060 über das Letztwort-Entscheidungskästchen
1055 unter Ansprechen auf das Signal W m im Wortzähler
220. Das Signal W m veranlaßt die Steuerung 400,
den Ende-Impuls EC zu erzeugen, der die Abstandsverarbeitung
für die Stufe 2 beendet.
Während der DTW-Verarbeitung für jedes Bezugswort steuern
die Signale R₁ und R₂ die Operationsbeschränkungen des
Prozessors 207. Wie oben erwähnt, ändert sich die Auswahl
der Bezugswortrahmen, um einer Koartikulation Rechnung
zu tragen. Der Bereich der Anfangsrahmen für die Stufe
2 erstreckt sich vom Rahmen 31 bis zum
Rahmen 39. Das Signal DMTR vom Flipflop 370, das nur
während des Anfangsrahmenbereichs auftritt, wird dem
UND-Gatter 530 in Fig. 5 zugeführt. Zwischen den Rahmen
31 und 39 ist das Signal DMTR eingeschaltet. Wenn das
Bezugswort-Rahmensignal M L für die untere Grenze vom
Prozessor 207 kleiner als SR 1 ist, so wird der zulässige
Bezugswort-Rahmenbereich im Prozessor 207 unter Ansprechen
auf das Signal R bis zum Bezugsrahmen m=1 ausgedehnt.
Die Ausgangssignale und SN vom Speicher 210 werden
dem DTW-Prozessor 207 über die Gatter 242 und 246 zugeführt,
so daß der Anfangsrahmen und der Anfangsabstand
für einen neuen Zeitausrichtweg bei der dynamischen Zeitverkettungsoperation
des Prozessors benutzt werden können.
Das Signal DMTR begrenzt den Anfangsrahmenbereich der
Stufenverarbeitung auf die Zeitausrichtungsweg-Endpunkte
der unmittelbar vorhergehenden Stufe. Dies stellt die
Kontinuität der Zeitausrichtwege zwischen den Stufen
sicher.
Das Sprachmuster-Rahmensignal n w für die Grenze des oberen
Bereichs im Zwischenspeicher 360 wird mit dem Verarbeitungsrahmensignal
n vom Zähler 503 im Komparator 366
verglichen. Das Flipflop 370 wird durch das Signal FSR
im Rahmen n s =31 eingestellt und bleibt zwischen den Rahmen
n s =31 und n s =39 eingestellt. Wenn das Rahmensignal n=40
erreicht ist, so wird der Ausgang des Komparators 366
betätigt, und das Flipflop 370 wird zurückgestellt. Das
Gatter 530 wird durch das Signal DMTR vorbereitet, so
daß der Bereich des gewählten Bezugswort-Anfangsrahmens
zwischen den Sprachmustersegmentrahmen n s =31 und n s =39
liegt. Danach wird das Gatter 530 in Fig. 5 gesperrt,
so daß der Prozessor 207 unter Ansprechen auf das Signal
R₂ vom Komparator 511 nur mit den Endbereichseinschränkungen
oder den Zwischenbereichseinschränkungen gemäß
Gleichung (7) arbeiten kann.
Tabelle 5 zeigt die Ausrichtungswegsignale , und SN,
die im Stufenabsschnitt L=2 des Speichers 210 am Ende der
DTW-Verarbeitung der zweiten Stufe für die Sprachmusterrahmen
47 bis 102 gespeichert sind.
In der ersten Spalte sind die Ausrichtweg-Endrahmen
angegeben. In der Spalte 2 findet sich die Bezugswort-
Identifizierung für den kleinsten kumulativen Abstandsweg,
der beim Endrahmen der Spalte 1 endet. In Spalte
3 ist das kumulative Abstandssignal für den Ausrichtweg
angegeben, der beim Endrahmen der Spalte 1 endet, und
Spalte 4 führt den Anfangsrahmen SN des Ausrichtweges
auf, der beim Endrahmen der Spalte 1 endet. In der ersten
Zeile der Tabelle 5 ist beispielsweise der Ausrichtweg-
Endrahmen gleich =47. Das Bezugswort für den kleinsten
kumulativen Abstandsweg ist =2. Der kumulative Wegabstand
ist =23,5 und der Anfangsrahmen dieses Wegs
ist SN=32.
Während der DTW-Verarbeitung der zweiten Stufe ist das
Abbruch-Flipflop 291 zurückgstellt worden, als Ausrichtwegsignale
zuerst in den Stufenspeicher 210 eingegeben
worden sind. Da der Stufenzähler 250 sich nicht auf dem
Maximalwert L max befindet, ist das Signal LMS abgeschaltet.
Gemeinsam ansprechend auf die abgeschalteten Signale
ABFF und LMS sowie den Impuls EC vom Steuergerät 430
wird die Steuerschaltung 400 veranlaßt, die Impulse IL 1
und SD zu erzeugen. Der Impuls IL 1 schaltet den Stufenzähler
250 auf den Zustand L=2, und der Impuls SD wird
der Bereichssteuerung 440 zur Einleitung der Bereichseinstell-Betriebsweise
zugeführt.
Wie im Einzelnen mit Bezug auf die Stufe 1 beschrieben,
werden die Endrahmen der gerade verarbeiteten Stufe
L=2 entsprechend dem Flußdiagramm in Fig. 11 abgetastet,
um das minimale, normierte Abstandssignal d p /n d zu
bestimmen. Dieses Signal wird im Zwischenspeicher 309
abgelegt, und der Rahmen, in welchem das Signal n d aufgetreten
ist, wird entsprechend der Darstellung in
Fig. 11 im Zwischenspeicher 320 gespeichert. Das für
die Stufe 2 bestimmte Signal d p /n d ist 0,435 und der
entsprechende Rahmen ist 63. Da der Rahmen n d=63 nicht
innerhalb der SEND=4-Rahmen des Sprachmuster-Endrahmens
(128) auf der zweiten Stufe ist (Entscheidungskästchen
1170), wird die Einleitungsbetriebsweise für die
dritte Stufe gestartet.
Entsprechend dem Flußdiagramm für die Einleitungsbetriebsweise
nach Fig. 8 wird jede der Rahmenspeicherstellen
im Stufenspeicher 210 für die Stufe L+1=3 so eingestellt,
daß das Signal (n s )=LPN und das Signal SN(n s )=0 ist.
Nachdem die Speicherstelle des Sprachmuster-Endrahmens
N m eingeleitet ist, wird das Signal EI von der Stufen-
Betriebseinleitungssteuerung 410 erhalten (Entscheidungskästchen
840), und die Abtastbetriebsweise wird unter
Ansprechen auf das Signal SB von der Folgesteuerschaltung
400 eingeleitet. Bei der Abtastbetriebsweise wird der
Bereich von Anfangsrahmen für die dynamische Zeitverkettungsverarbeitung
der dritten Stufe entsprechend dem
Flußdiagramm in Fig. 9 unter Steuerung von Signalen des
Abtaststeuergeräts 420 ausgewählt.
Die obere Grenze des Bereichs wird zuerst entsprechend
dem Entscheidungskästchen 912 bestimmt. Der Rahmen 88
wird als Rahmen n w gewählt, da das Signal (88)/88=0,519
kleiner als das Signal 1,2(d p /n p )=0,522 im Zwischenspeicher
309 ist. Nachdem der Rahmen n s =88 für die obere
Grenze im Zwischenspeicher 360 abgelegt ist (Index-Einstellkästschen
920), wird der Rahmenzähler 230 auf den
Zustand n s =1 zurückgestellt (Indexeinstellkästchen 922).
DieAbstandssignale vom Stufenspeicher 210 für den Rahmen
n s =1 werden dann mit dem Signal 1,2(dp/n p ) vom Multiplizierer
303 verglichen, und das entsprechende Signal SN
wird entsprechend dem Entscheidungskästchen 924 mit Null
verglichen, bis der Sprachmusterrahmen 53 erreicht ist.
Das normierte Abstandssignal für den Rahmen 53 (0,519)
ist kleiner als 1,2 dp/n p (0,522), wodurch das DMTR-Signal
vom Flipflop 370 eingeschaltet wird. Die Steuerung 420
liefert dann das Ende-Signal EB (Entscheidungskästchen
924), und es wird in die DTW-Verarbeitungsbetriebsweise
des Flußdiagramms gemäß Fig. 10 eingetreten.
Die DTW-Verarbeitung der Stufe 3 entsprechend dem Flußdiagramm
in Fig. 10 führt zur Erzeugung der Zeitausrichtungswege,
für die die kumulativen Abstandssignale ,
die Anfangsrahmensignale SN und die gewählten Bezugswortsignale
im Stufenspeicher 210 abgelegt werden.
In der Tabelle 6 sind die in den Stufenspeicher 10 für
die DTW-Verabeitung der dritten Stufe eingegebenen Signale
, und SN aufgeführt.
Die Endrahmen der Stufe 3 erstreckens ich gemäß Tabelle
6 vom Rahmen 75 zum Äußerungsendrahmen 128. Alle Anfangsrahmen
SFN in Tabelle 6 liegen im Bereich SFN=53 bis
SFN=89 entsprechend der Bereichseinschränkungsoperation,
die der Verarbeitung der Stufe 3 vorausgeht.
Nur die Merkmalssignale der Bezugswörter "Null", "Eins",
"Drei", "Vier" und "Fünf" waren den Merkmalssignalen
des Sprachmustersegments der Stufe 3 ausreichend ähnlich,
um zu annehmbaren Ausrichtungswegen zu führen. Für das
Bezugswort "Null" haben die Wege Endrahmen zwischen
den Rahmen 103 und 105. Die Endrahmen für die Wege
des Bezugswortes "Eins" erstrecken sich vom
Rahmen 79 bis zum Rahmen 82. Für das Bezugswort
"Vier" erstrecken sich Endrahmen zwischen den Rahmen 75
bis 79 und zwischen den Rahmen 106 bis 115. Für das Bezugswort
"Fünf" liegen die Wegendrahmen zwischen den Rahmen
84 und 102.
Am Ende der DTW-Verarbeitung für das Bezugswort "Neun"
der Stufe 3 wird entsprechend dem Entscheidungskästchen
1060 das Abbruch-Merkzeichen als zurückgestellt festgestellt,
der Stufenzähler 250 wird auf den Zustand L=3
weitergeschaltet, und die Bereichseinstellbetriebsweise
gemäß Fig. 11 wird entsprechend dem Entscheidungskästchen
1070 eingeleitet.
Wie mit Bezug auf die vorhergehende Stufe beschrieben
worden ist, werden die Ergebnisse der im Stufenspeicher
210 abgelegten DTW-Verarbeitung der Stufe 3 zwischen
dem Rahmen n s =1 bis zum Endrahmen N m =128 abgetastet.
Das kumulative Abstandssignal für den Endrahmen
90 in Tabelle 6 ist 33,1 und der zugeordnete normierte
Abstand (0,368) wird mittels des Teilers 355, des Zwischenspeichers
309 und des Komparators 311 als Minimum
festgestellt. Das Signal 0,368 wird im Zwischenspeicher
309 abgelegt. Das dem minimalen normierten Abstand entsprechende
Rahmensignal n s =90 wird während der Abtastoperation
in den Zwischenspeicher 320 geliefert und dem
Subtrahierer 330 als Signal n d zugerührt, um zu bestimmen,
wie weit n d vom Endrahmen N m entfernt ist. Das
Ausgangssignal des Subtrahierers 330 wird im Komparator
332 mit dem Signal SEND=4 verglichen. Da N m -n d =38 Rahmen
ist, wird das Signal DE vom Komparator 332 nicht betätigt,
und es ist die Verarbeitung für die vierte Stufe nötig.
Unter Bezugnahme auf das allgemeine Flußdiagramm in Fig. 6
wird die Betriebseinleitung für die Rahmenstellen der
vierten Stufe im Stufenspeicher 210 entsprechend dem
Kästchen 605 so durchgeführt, daß jedes kumulative Äußerungsrahmen-Abstandssignal
auf LPN und jedes Anfangsrahmensignal
SN auf Null eingestellt wird. Es werden dann
entsprechend dem Kästchen 607 die Rahmenstellen
für die Stufe 3 abgetastet, um den Bereich zulässiger
Anfangsrahmen zu bestimmen. Gemeinsam ansprechend auf das
gespeicherte, minimale, normierte Abstandssignal im Zwischenspeicher
309 und die für die kumulativen Abstände bestimmten
normierten Abstandssignale aus dem Stufenspeicherabschnitt
210-2 wird der Rahmen n s =2 der oberen Grenze zu
n d gewählt und in den Zwischenspeicher 360 gegeben. Anschließend
wird der Rahmen n s =84 der unteren Grenze gewählt
und in Vorbereitung der DTW-Verarbeitung der Stufe 4 entsprechend
dem Kästchen 609 im Zwischenspeicher 501 abgelegt.
In Tabelle 7 sind die Ausrichtungsweg-Endpunkte, das gewählte
Bezugswortsignal, die kumulativen Abstandssignale
und die Anfangsrahmensignale für die Zeitausrichtungswege
angegeben, die sich bei der Verarbeitung der vierten Stufe
(Kästchen 609) ergeben.
Die festgestellten Endrahmen erstrecken sich zwischen dem
Rahmen 96 und dem Äußerungsendrahmen 128. Der
Anfangsrahmenbereich liegt innerhalb der Einschränkung,
die während der vorhergehenden Abtastbetriebsweise bestimmt
worden ist, und es wurden Ausrichtungswege für
die Bezugswörter "Zwei", "Drei" und "Vier" gefunden.
Bei Beendigung der dynamischen Zeitverkettungsoperation
für das Bezugswort "Neun" wird der Stufenzähler 250 auf
den Zustand L=4 weitergeschaltet. Da die letzteStufe
noch nicht erreicht ist (Entscheidungskästchen 611),
werden die Speicherstellen für die fünfte Stufe (L=5)
entsprechend dem Kästchen 605 vorbereitet.
Bei der nachfolgenden Abtastung der Endrahmen der Stufe
4 (Kästchen 607) wird der minimale normierte Abstand
im Rahmen 127 festgestellt. Dieses Rahmensignal wird
in den Zwischenspeicher 320 gegeben und von dort zum
Subtrahierer 330 übertragen. Das Ausgangssignal des Subtrahierers
330 entspricht N m -n d=1. Der Ort des minimalen
normierten Rahmens liegt innerhalb von δ END=4
Rahmen vom Äußerungsendrahmen entfernt, und das Signal
DE vom Komparator 332 wird eingeschaltet. Zu diesem Zeitpunkt
hat der optimale Ausrichtungsweg den Bereich des
Äußerungsendrahmens erreicht, und die Verarbeitung dieser
Stufe wird beendet.
Das Endrahmensignal NMS vom Rahmenzähler 230 veranlaßt
die Bereichssteuerung 440, einen Ende-Impuls ED zu erzeugen.
Abhängig vom Signal DE vom Komparator 332 und
vom Signal ED der Bereichssteuerung 440 erzeugt die
Folgesteuerschaltung 400 den Steuerimpuls SE. Dieser
Impuls aktiviert die Rückverfolgungssteuerung 450, die
die Schaltung gemäß Fig. 2 und 3 veranlaßt, die im Stufenspeicher
210 gespeicherten Zeitausrichtungswege zurückzuverfolgen
und die gültigen Bezugswort-Kandidatenketten
vom Speicher 210 zum Rückverfolgungsspeicher 260 zusammen
mit den normierten Abstandssignalen für die Wege zu übertragen.
Die Rückverfolgungsoperation wird entsprechend
dem Flußdiagramm gemäß Fig. 12 ausgeführt.
Am Beginn der Rückverfolgungsarbeitsweise veranlaßt der
Impuls SE von der Steuerung 400 die Rückverfolgungssteuerung
450, die Impulse SIJE, SNM, SLPN, SLT 1 und
das Signal D zu erzeugen. Der Impuls SLJE wird über das
ODER-Gatter 467 dem Stufenzähler 250 zugeführt und bewirkt,
daß das Signal LB=0 am Ausgang des Rückverfolgungszählers
240 zum Stufenzähler 250 übertragen wird (Indexkästchen
1205). Der Impuls SNM stellt den Rahmenzähler 230 auf
den Zustand n s =128 ein (Indexkästchen 1210). Der Impuls
SLPN gibt ein Signal LPN in den Zwischenspeicher 309,
und der Impuls SLT 1 ein Rahmensignal 1 in den Zwischenspeicher
320. Das Signal D veranlaßt die Adressierlogik
290, das Signal L=0 und das Signal n s =128 zu den Adressiereingängen
des Stufenspeichers 210 zu geben.
Zu diesem Zeitpunkt werden die Rahmenstellen n s =128 der
Stufe L=0 im Stufenspeicher 210 adressiert.Wie oben
erwähnt, sind das Signal für jeden Rahmen jeder Stufe
L=0 mit Ausnahme des Rahmens n s =1 und der Abstandssignale
für jeden Rahmen mit Ausnahme des Rahmens n s =1 gleich
LPN. Das Ausgangssignal des Stufenspeicherabschnitts
210-2 wird imTeiler 355 normiert, und das normierte
Abstandsignal (128)/128 vom Teiler 355 wird mit dem
Inhalt des Zwischenspeichers 309 im Komparator 311 verglichen.
Der Inhalt des Zwischenspeichers 309 ist kleiner
als das Ausgangssignal des Teilers 355, und das Signal
DL vom Komparator 311 wird eingeschaltet. Folglichh wird
der Inhalt der Zwischenspeicher 309 und 320 auf LPN/128
bzw. 128 geändert.
Der Subtrahierer 330 erzeugt das Signal N m -n s =0 unter
Ansprechen auf die Eingangssignale N m und das Eingangssignal
n s vom Gatter 324. Das Signal N m -n s =0 ist kleiner
als δ END=4 (Entscheidungskästchen 1215). Daher wird das
Signal DE vom Komparator 332 eingeschaltet. Das eingeschaltete
Signal DE veranlaßt die Rückverfolgungssteuerung
450, einen Impuls DN 1 zu erzeugen (Indexkästchen
1225), der den Rahmenzähler 230 auf den Zustand n s =127
zurückschaltet. Die Folge von Impulsen DN 1 der Rückverfolgungssteuerung
450 setzt sich fort, bis der Rahmen
n s =124 erreicht ist. In diesem Zeitintervall wird das minimale Signal d(n s )/n s in den Zwischenspeicher 309
und das entsprechende Signal n s in den Zwischenspeicher
320 eingegeben. Es wird dann das Signal DE vom Komparator
332 abgeschaltet, wodurch die Rückverfolgungssteuerung
450 den Steuerimpuls LSF erzeugt.
Unter Ansprechen auf den Steuerimpuls LSF wird der minimale,
normierte Abstandsrahmen n d im Zwischenspeicher
320 über das UND-Gatter 336 und das ODER-Gatter 337
in den Zwischenspeicher 345 gegeben. Nach einer kurzen
Verzögerung erzeugt die Steuerung 450 das Signal F, das
die Adressierlogik 290 so ändert, daß =n d ist. Das
Anfangsrahmensignal SN(n d) vom Stufenspeicherabschnitt
210-1 wird an einen Eingang des Komparators 338 über
das UND-Gatter 335 und das ODER-Gatter 337 gegeben.
SN(n d)=0 und der Komparator 338 schaltet das Signal
SFNO ein. Das eingeschaltete Signal SFNO bedeutet, daß
keine gültigen Zeitausrichtungswege vorhanden sind, die
beim Rahmen n d auf der Stufe 0 enden. Der Rückverfolgungszähler
450 ändert demgemäß seinen Stand, so daß Zeitausrichtungswege,
die auf der Stufe 1 enden, festgestellt
werden können.
Der Steuerimpuls IB 1 von der Rückverfolgungssteuerung
450 schaltet den Rückverfolgungszähler 240 auf LB=1 weiter.
Der Impuls SLJE bewirkt, daß das Signal LB=1 vom Zähler
240 zum Stufenzähler 250 übertragen wird. Der Impuls
SNM stellt den Rahmenzähler 230 auf den Zustand n s =N m
ein, und die Impulse SLPN und SLTO stellen die Zwischenspeicher
309 und 320 auf LPN/128 bzw. 128 ein. Die Festsstellung
des minimalen normierten Abstandssignals wird
dann für die Stufe 1 entsprechend der Schleife durchgeführt,
die im Flußdiagramm gemäß Fig. 12 das Entscheidungskästchen
1212, das Kästchen 1214, das Entscheidungskästchen
1215 und das Indexkästchen 1225 enthält.
Wenn der Rahmen n s =124 erreicht ist, enthält der Zwischenspeicher
309 das Signal d p =LPN/128, und der Zwischenspeicher
320 das Signal n s =0. Das gilt deswegen, weil die
DTW-Verarbeitung der Stufe 1 nicht zu Zeitausrichtungswegen
innerhalb des Endrahmenbereichs geführt
hat. Entsprechend dem Entscheidungskästchen 1230 ist
das Signal SN(SF′)=0. Der Komparator 338 betätigt das
Signal FNO. Der Zähler 240 wird durch das Signal IB 1
weitergeschaltet (Indexkästchen 1255), und man tritt
über das Entscheidungskästchen 1260 in das Indexkästchen
1205 ein.
Es wird dann die Rückverfolgungsoperation für die Stufe
L=2 durch die Steuerimpulse SLJE, SNM, SLPN und SLT 1
sowie das Signal D von der Rückverfolgungssteuerung 450
unter Ansprechen auf das betätigte Signal SFNO vom Komparator
338 eingeleitet. Wie mit Bezug auf die Rükverfolgungsverarbeitung
der Stufe 1 beschrieben worden ist,
liefert die Adressierlogik 290 die Adressensignale n s
vom Rahmenzähler 250 zu den Adressiereingängen des Stufenspeichers
210. Der Rahmenzähler 230 wird auf den Stand
n s =N m eingestellt, und das minimale, normierte Abstandssignal
d p /n d im Endrahmenbereich δ END wird
festgestellt und im Zwischenspeicher 309 abgelegt. Der
dem minimalen normierten Abstandssignal n d entsprechende
Rahmen wird im Zwischenspeicher 310 gespeichert. Es sind
keine Ausrichtungswege für die zweite Stufe innerhalb
des Endrahmenbereichs δ END vorhanden. Demgemäß enthält
der Zwischenspeicher 309 den Wert p /n d= und der
Zwischenspeicher 320 enthält den Wert n d=125. Im
Rahmen n s =124 wird das Signal DE vom Komparator 332 eingeschaltet,
wodurch der Rahmencode n d unter Ansprechen
auf das Signal LSF in den Zwischenspeicher 345 gegeben
wird. Das Signal SN für den Rahmen n d ist Null, da keine
Zeitausrichtungswege bei der DTW-Verarbeitung für die
Stufe 2 im δ END-Rahmenbereich enden. Das Signal
SN(n d)=0 veranlaßt den Komparator 338, das Signal SFNO
einzuschalten. Die Rückverfolgungsverarbeitung der Stufe
3 wird durch das Signal IB 1 von der Rückverfolgungssteuerung
450 gestartet, das den Rückverfolgungszähler 240
auf LB=3 einstellt.
Entsprehend der Angabe in Tabelle 6 hat die DTW-Verarbeitung
der Stufe 3 zu Zeitausrichtungswegen mit Endpunkten
bei den Rahmen 125, 126, 127 und 128 geführt. Entsprehend
dem Entscheidungskästchen 1212, dem Index-Einstellkästchen
1214, dem Entscheidungskästchen 1215 und dem Indexkästchen
1225 in Fig. 12 werden die normierten Abstandssignale
(n s )/n s für diese Endrahmen der Stufe 3 verarbeitet.
Es wird das minimale, normierte Abstandssignal d p /n d=0,49
für den Rahmen 126 aufgefunden. Nachdem der
Rahmenzähler 238 den Rahmen n s =124 erreicht hat, wird
das Signal n d=126 vom Zwischenspeicher 320 durch das
Signal LSF zum Zwischenspeicher 345 übertragen. Die Steuerung
450 erzeugt das Signal F, und das Signal SN=89
vom Stufenspeicher 210 wird über das UND-Gatter 335 und
das ODER-Gatter 327 zu einem Eingang des Komparators
338 geführt. Das Signal SFNO von diesem Komparator bleibt
abgeschaltet, und das Signal WBS wird zum Schreibbetätigungseingang
des Rückverfolgungsspeichers 260 geliefert.
Zu diesem Zeitpunkt werden das Signal =3 vom Stufenspeicherabschnitt
210-3 und das Signal d (126)/126 vom
Teiler 355 in die Adresse L=3, LB=3 des Speichers 260
eingegeben.
Das Signal SN (126)=89 vom Stufenspeicherabschnitt 210-1
wird dann über das UND-Gatter 335 und das ODER-Gatter
337 unter Ansprechen auf das Signal LSF von der Steuerung
450 in den Zwischenspeicher 345 gegeben. Der Steuerimpuls
DL 1 von der Rückverfolgungssteuerung 450 schaltet den
Stufenzähler 250 in den Zustand L=2 zurück. Die Speicherstellen
n=89, =2 des Stufenspeichers 210 werden dann
adressiert, so daß die Signale =4, (89)/89=0,521 in
die Speicherstelle L=2, LB=3 des Rückverfolgungsspeichers
260 eingeschrieben werden. Das Signal SN (89)=32 vom
Abschnitt 210-1 des Stufenspeichers wird unter Ansprechen
auf das Signal LSF in den Zwischenspeicher 345 gegeben,
und der Stufenzähler 250 wird durch das Signal DL 1 in
den Zustand L=1 zurückgeschaltet. Dadurch wird die Adresse
des Rückverfolgungsspeichers auf L=1, LB=3 geändert,
und die Signale =4, (32)/32=0,384 aus der Rahmenstelle
=32 der Stufe L=2 werden unter Ansprechen auf das Signal
WBS von der Steuerung 450 in den Rückverfolgungsspeicher
eingegeben.
Das Signal SN (32)=1 vom Speicherabschnitt 210-1 wird
in den Zwischenspeicher 345 eingeschrieben, und der
Sufenzähler 250 wird auf den Zustand L=0 zurückgechaltet
(Indexkästchen 1250). Das Signal LZS wird eingeschaltet,
wenn der Stufenzähler 250 im Zustand L=0 ist. Unter Ansprechen
auf das Signal LZS erzeugt die Steuerung 450
einen Impuls IB 1. Es wird dann der Rückverfolgungszähler
240 auf den Zustand LB=4 weitergeschaltet, und die Rückverfolgungsoperation
der vierten Stufe wird durch Erzeugung
der Impulse SLJE, SNM, SLPN und SLTO sowie des
Steuersignals D angefangen.
Bei der Rückverfolgung auf der vierten Stufe werden die
Signale für die Folge von Rahmen 128 bis 125 verglichen.
Das minimale, normierte Abstandssignal = 0,369
und der entsprechende Rahmen (n d=127) werden in die
Zwischenspeicher 309 bzw. 320 eingegeben. Der Anfangsrahmen
SN (127)=3 wird im Komparator 338 mit Null verglichen.
Da er von Null verschieden ist, werden die Codierungen
(127)=39 und in die Position L=4, LB=4
des Rückverfolgungsspeichers 260 eingeschrieben. Es wird
dann der Code SN (127)=89 durch das Signal LSF in den
Zwischenspeicher 345 gegeben. Der Stufenzähler 250 wird
auf den Zustand L=3 zurückgestellt und dann
erfolgt ein Zugriff zu den Stellen =3, =89 des
Stufenspeichers 210. Die Signale (89)=5 und i (89)/89=
0,373 werden in die Position L=3, LB=4 des Rückverfolgungsspeichers
260 und das Signal SN (89)=60 in den Zwischenspeicher
345 gegeben. Der Zähler 250 wird auf den Zustand
L=2 zurückgeschaltet.
Das Signal SN (60)=32 ist von Null verschieden. Folglich
werden die Stellen =2, =32 des Stufenspeichers 210
adressiert, so daß die Werte (60)=4, d (60)/60=0,438
in die Stelle L=2, LB=2 des Speichers 260 eingeschrieben
werden. Das Signal SN (60)=32 gelangt in den Zwischenspeicher
345, und der Stufenzähler 350 wird in den Zustand
L=1 zurückgeschaltet. Das Signal SFN (32)=1 in den Stellen
=1, =32 des Stufenspeichers 210 ist von Null verschieden,
wodurch die Signale (32)=4, (32)/32=0,384 in die
Stelle L=1, LB=4 des Rückverfolgungsspeichers 260 eingeschrieben
werden. Das Signal SN (32)=1 wird in den Zwischenspeicher
345 gegeben. Der Zähler 250 wird in den
Zustand L=0 gebracht, in welchem das Signal LZS eingeschaltet
wird. Unter Ansprechen auf das Signal LZS schaltet
das Signal IB 1 von der Steuerung 450 den Rückverfolgungszähler
240 in den Zustand LB=5 weiter. Zu diesem
Zeitpunkt ist LB=LMAX. Der Zähler 240 erzeugt ein Signal
LBS, das die Steuerung 450 veranlaßt, einen Ende-Impuls
EE zu erzeugen.
Die Rückverfolgungsverarbeitung ist beendet, und der
Speicher 260 enthält diejenige Bezugswortkette 443, die
auf der Stufe 3 endet, und diejenige Bezugswortkette
4453, die auf der Stufe 4 endet, sowie die entsprechenden
Abstandssignale. Das Signal EE wird der Folgesteuerung
400 zugeführt, die das Signal DONE erzeugt. Dieses Signal
wird der Verbrauchereinrichtung 390 zugeführt, die die
Codierungen des durch die Signale LB′ und L′ adressierten
Rückverfolgungsspeichers zurückgewinnen kann. Die Verbrauchereinrichtung
kann ein Datenprozessor, ein Nachrichtennetzwerk
oder eine durch einen Code gesteuerte
Maschine sein. Die Erkennungseinrichtung gemäß Fig. 2
und 3 kann beispielsweise Teil einer Fernsprecheinrichtung
sein, die so ausgelegt ist, daß sie gesprochene Rechnungsnummern
für Gebührenbelastungszwecke aufnehmen kann.
Die Verbrauchereinrichtung 390 kann so ausgelegt sein,
daß sie die Bezugswortkette für minimalen Abstand vom
Rückverfolgungsspeicher 260 aufnimmt oder eine Bezugswortkette
vorgeschriebener Länge aus dem Speicher 260 wählt.
Bei gewissen Anordnungen können Einschränkungen hinsichtlich
der jeweiligen Bezugswörter in jeder Wortposition
vorhanden sein. Der Bezugswortwähler 207 kann in der
Schaltung gemäß Fig. 2 aufgenommen sein, um nur vorbestimmte
Bezugswort-Merkmalssignale für jede Stufe L unter
Ansprechen auf das Ausgangssignal des Stufenzählers 250
und des Wortzählers 220 zu liefern. Beispielsweise kann
das erste Wort jedes Sprachmusters auf die Ziffern 2
und 3 beschränkt sein. Unter Ansprechen auf das Stufensignal
L=0 und L=1 wählt der Wähler 207 nur die Merkmalssignale
der Ziffern 2 und 3 für die DTW-Verarbeitung.
Das Signal W m vom Wähler 207 beendet dann die DTW-Verarbeitung
der ersten Stufe am Ende der Zeitausrichtungs-Wegerzeugung
für das Bezugswort "Drei".
Claims (11)
1. Verfahren zur Erkennung eines Sprachmusters
als Kette vorbestimmter Bezugswörter mit den Verfahrensschritten:
- a) Speichern von Signalsätzen (R V ), die die einen Anfangs- und einen Endrahmen enthaltende Zeitrahmenfolge akustischer Merkmale jedes Bezugswortes darstellen,
- b) Erzeugen von Signalsätzen (T), die die Zeitrahmenfolge akustischer Merkmale des Sprachmusters darstellen,
- c) Erzeugen von kumulativen Korrespondenzsignalen (D (T, R )) durch Vergleichen mittels dynamischer Zeitverkettung der Sprachmuster-Merkmalssignale (T) und der Bezugswort- Merkmalssignale (R V ),
- d) Erzeugen wenigstens einer Bezugswortkette (R S ) unter Verwendung der kumulativen Korrespondenzsignale (D (T, R )),
- e) Identifizieren des Sprachmusters als eine der erzeugten Bezugswortketten,
dadurch gekennzeichnet, daß der Verfahrensschritt d)
folgende Schritte umfaßt:
- f) Unterteilen der dynamischen Zeitverkettung in aufeinanderfolgende Stufen von Bezugswörtern (160, 170, 180, 190),
- g) Zuordnen jeweils eines Segments des Sprachmusters zu jeder der aufeinander folgenden Stufen,
- h) zeitliche Ausrichtung der Sprachmuster-Merkmalssignale (T) des der jeweiligen Stufe zugeordneten Segments mit den Bezugswort-Merkmalssignalen (R V ) der Stufe, um zeitausgerichtete Endrahmen- und Korrespondenzsignale für die Bezugswörter zu erzeugen,
- i) Auswählen von Bezugsketten (R S ) unter Ansprechen auf die zeitausgerichteten Endrahmen- und Korrespondenzsignale für die Stufen.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß der Verfahrensschritt h) die
Schritte umfaßt:
- k) Einschränkung des Bereichs der Anfangsrahmen für die augenblickliche Stufe (160, 170, 180, 190) unter Ansprechen auf die zeitausgerichteten Endrahmensignale der unmittelbar vorhergehenden Stufe,
- l) Speichern des besten Korrespondenzsignals für jeden Endrahmen, ferner eines Signals, das das beste Bezugswort für diesen Endrahmen darstellt, und eines Signals, das den Anfangsrahmen entsprechend dem besten Bezugswort für diesen Endrahmen darstellt.
3. Verfahren nach Anspruch 2,
dadurch gekennzeichnet, daß der Verfahrensschritt k) folgende
Schritte umfaßt:
- m) Feststellen des Minimums der besten Korrespondenzsignale der vorhergehenden Stufe unter Ansprechen auf die besten zeitausgerichteten Korrespondenzsignale der vorhergehenden Stufe,
- n) Auswählen der Anfangsrahmen der augenblicklichen Stufe unter Ansprechen auf die besten zeitausgerichteten Korrespondenzsignale der vorhergehenden Stufe und des Minimums der besten Korrespondenzsignale der vorhergehenden Stufe.
4. Verfahren nach Anspruch 3,
dadurch gekennzeichnet, daß der Verfahrensschritt d) folgende
Schritte aufweist:
- o) Erzeugen eines den Endrahmen darstellenden Signals unter Ansprechen auf die Merkmalssignale,
- p) Erzeugen eines Signals für jede Stufe, das den Endrahmen mit dem minimalen, besten Korrespondenzsignal darstellt,
- q) Einleiten der Bezugswortkettenauswahl unter Ansprechen darauf, daß das minimale, beste Endrahmenkorrespondenzsignal innerhalb eines vorgeschriebenen Bereichs des Sprachmuster-Endrahmensignals liegt.
5. Verfahren nach Anspruch 4,
dadurch gekennzeichnet, daß der Verfahrensschritt i) den
Verfahrensschritt umfaßt:
Erzeugen von Signalen, die jede Bezugswortkette darstellen, welche einen zeitausgerichteten Endrahmen innerhalb eines vorgeschriebenen Bereichs des Endrahmens besitzt, und zwar unter Ansprechen auf die gespeicherten, zeitausgerichteten Endrahmensignale, die Anfangsrahmensignale und die Bezugswort- Identifizierungssignale.
Erzeugen von Signalen, die jede Bezugswortkette darstellen, welche einen zeitausgerichteten Endrahmen innerhalb eines vorgeschriebenen Bereichs des Endrahmens besitzt, und zwar unter Ansprechen auf die gespeicherten, zeitausgerichteten Endrahmensignale, die Anfangsrahmensignale und die Bezugswort- Identifizierungssignale.
6. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß der Verfahrensschritt h)
folgende Schritte umfaßt:
- r) Auswahl eines Bereichs von Bezugswortrahmen zur Zeitausrichtung mit jedem Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster-Merkmalssignale einschließlich Ausdehnen des unteren Grenzrahmens des Bezugswortbereichs bis zum Bezugswort-Anfangsrahmen, wenn der untere Grenzrahmen des gewählten Bezugswortbereichs kleiner als eine vorbestimmte Zahl ist, und Ausdehnen des oberen Grenzrahmens des gewählten Bezugswortbereichs bis zum Bezugswort-Endrahmen, wenn der obere Grenzrahmen des gewählten Bezugswortbereichs größer als eine zweite vorbestimmte Zahl ist.
7. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß der Verfahrensschritt h)
folgenden Schritt umfaßt:
- s) Auswählen eines Bereichs von Bezugswortrahmen für die Zeitausrichtung mit jedem Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster-Merkmalssignale;
- t) Erzeugen eines zeitausgerichteten Sprachmuster-Endrahmens unter Ansprechen darauf, daß der untere Grenzrahmen des gewählten Bezugswortbereichs gleich oder größer als der Bezugswort-Endrahmen ist.
8. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß der Verfahrensschritt h)
folgende Schritte umfaßt:
- u) Auswahl eines Bereichs von Bezugswortrahmen für jeden Sprachmusterrahmen jeder Stufe unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster- Merkmalssignale;
- v) Beendigen der Zeitausrichtung des Bezugswortes unter Ansprechen darauf, daß der untere Grenzrahmen des gewählten Bezugswortbereichs gleich oder größer als der Bezugswort-Endrahmen ist.
9. Verfahren nach Anspruch 8,
dadurch gekennzeichnet, daß der Verfahrensschritt h)
folgende Schritte umfaßt:
- w) Erzeugen eines zeitausgerichteten Korrespondenzsignals für jeden Sprachmusterrahmen unter Ansprechen auf die Bezugswort-Merkmalssignale und die Sprachmuster- Merkmalssignale;
- x) Erzeugen eines maximal zulässigen Korrespondenzsignals für den Sprachmusterrahmen unter Ansprechen auf den Sprachmusterrahmen,
- y) Beendigung der Zeitausrichtung des Bezugswortes unter Ansprechen darauf, daß das zeitausgerichtete Korrespondenzsignal eines Sprachmusterrahmens das maximal zulässige Korrespondenzsignal für den Rahmen übersteigt.
10. Verfahren nach einem der Ansprüche 1
bis 9, dadurch gekennzeichnet, daß der Verfahrensschritt
d) den folgenden Schritt umfaßt:
- z) Auswahl eines vorgeschriebenen Satzes von Bezugswörtern für die Zeitausrichtung auf jeder Bezugswortstufe unter Ansprechen auf die Stufenidentifiziersignale.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/248,570 US4400788A (en) | 1981-03-27 | 1981-03-27 | Continuous speech pattern recognizer |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3211313A1 DE3211313A1 (de) | 1982-11-11 |
DE3211313C2 true DE3211313C2 (de) | 1988-06-16 |
Family
ID=22939686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19823211313 Granted DE3211313A1 (de) | 1981-03-27 | 1982-03-26 | Verfahren und vorrichtung zur kontinuierlichen sprachmustererkennung |
Country Status (6)
Country | Link |
---|---|
US (1) | US4400788A (de) |
JP (1) | JPS57169800A (de) |
CA (1) | CA1167967A (de) |
DE (1) | DE3211313A1 (de) |
FR (1) | FR2502822A1 (de) |
GB (1) | GB2095882B (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19540859A1 (de) * | 1995-11-03 | 1997-05-28 | Thomson Brandt Gmbh | Verfahren zur Entfernung unerwünschter Sprachkomponenten aus einem Tonsignalgemisch |
DE10015859A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58100195A (ja) * | 1981-12-10 | 1983-06-14 | 日本電気株式会社 | 連続音声認識装置 |
JPS58111989A (ja) * | 1981-12-25 | 1983-07-04 | シャープ株式会社 | 音声認識装置 |
DE3215868A1 (de) * | 1982-04-29 | 1983-11-03 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette |
US4587670A (en) * | 1982-10-15 | 1986-05-06 | At&T Bell Laboratories | Hidden Markov model speech recognition arrangement |
USRE33597E (en) * | 1982-10-15 | 1991-05-28 | Hidden Markov model speech recognition arrangement | |
US4989248A (en) * | 1983-01-28 | 1991-01-29 | Texas Instruments Incorporated | Speaker-dependent connected speech word recognition method |
JPS60179797A (ja) * | 1983-10-27 | 1985-09-13 | 日本電気株式会社 | パタンマツチング装置 |
JPS60122475A (ja) * | 1983-11-15 | 1985-06-29 | Nec Corp | パタン認識装置 |
JPS60211498A (ja) * | 1984-04-05 | 1985-10-23 | 日本電気株式会社 | 連続音声認識装置 |
JP2607457B2 (ja) * | 1984-09-17 | 1997-05-07 | 株式会社東芝 | パターン認識装置 |
US4783809A (en) * | 1984-11-07 | 1988-11-08 | American Telephone And Telegraph Company, At&T Bell Laboratories | Automatic speech recognizer for real time operation |
US4718094A (en) * | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
JPS61145599A (ja) * | 1984-12-19 | 1986-07-03 | 日本電気株式会社 | 連続音声認識装置 |
US5241649A (en) * | 1985-02-18 | 1993-08-31 | Matsushita Electric Industrial Co., Ltd. | Voice recognition method |
US4980918A (en) * | 1985-05-09 | 1990-12-25 | International Business Machines Corporation | Speech recognition system with efficient storage and rapid assembly of phonological graphs |
US4748670A (en) * | 1985-05-29 | 1988-05-31 | International Business Machines Corporation | Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor |
US4783803A (en) * | 1985-11-12 | 1988-11-08 | Dragon Systems, Inc. | Speech recognition apparatus and method |
JPS62169199A (ja) * | 1986-01-22 | 1987-07-25 | 株式会社デンソー | 音声認識装置 |
JPS62232000A (ja) * | 1986-03-25 | 1987-10-12 | インタ−ナシヨナル・ビジネス・マシ−ンズ・コ−ポレ−シヨン | 音声認識装置 |
US4827521A (en) * | 1986-03-27 | 1989-05-02 | International Business Machines Corporation | Training of markov models used in a speech recognition system |
US4831550A (en) * | 1986-03-27 | 1989-05-16 | International Business Machines Corporation | Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events |
US4941178A (en) * | 1986-04-01 | 1990-07-10 | Gte Laboratories Incorporated | Speech recognition using preclassification and spectral normalization |
US4918733A (en) * | 1986-07-30 | 1990-04-17 | At&T Bell Laboratories | Dynamic time warping using a digital signal processor |
US4910669A (en) * | 1987-04-03 | 1990-03-20 | At&T Bell Laboratories | Binary tree multiprocessor |
DE3711342A1 (de) * | 1987-04-03 | 1988-10-20 | Philips Patentverwaltung | Verfahren zum erkennen zusammenhaengend gesprochener woerter |
DE3711348A1 (de) * | 1987-04-03 | 1988-10-20 | Philips Patentverwaltung | Verfahren zum erkennen kontinuierlich gesprochener woerter |
US5027408A (en) * | 1987-04-09 | 1991-06-25 | Kroeker John P | Speech-recognition circuitry employing phoneme estimation |
US4843562A (en) * | 1987-06-24 | 1989-06-27 | Broadcast Data Systems Limited Partnership | Broadcast information classification system and method |
EP0316112A3 (de) * | 1987-11-05 | 1989-05-31 | AT&T Corp. | Anwendung von statischen und dynamischen Spektralinformationen in Spracherkennungssystemen |
US5168524A (en) * | 1989-08-17 | 1992-12-01 | Eliza Corporation | Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation |
US5119425A (en) * | 1990-01-02 | 1992-06-02 | Raytheon Company | Sound synthesizer |
WO1992006469A1 (en) * | 1990-10-02 | 1992-04-16 | The Dsp Group, Inc. | Boundary relaxation for speech pattern recognition |
GB9602691D0 (en) * | 1996-02-09 | 1996-04-10 | Canon Kk | Word model generation |
US5884259A (en) * | 1997-02-12 | 1999-03-16 | International Business Machines Corporation | Method and apparatus for a time-synchronous tree-based search strategy |
US6157731A (en) * | 1998-07-01 | 2000-12-05 | Lucent Technologies Inc. | Signature verification method using hidden markov models |
US7050973B2 (en) * | 2002-04-22 | 2006-05-23 | Intel Corporation | Speaker recognition using dynamic time warp template spotting |
US8521529B2 (en) * | 2004-10-18 | 2013-08-27 | Creative Technology Ltd | Method for segmenting audio signals |
US7567903B1 (en) * | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
US20080189109A1 (en) * | 2007-02-05 | 2008-08-07 | Microsoft Corporation | Segmentation posterior based boundary point determination |
JP5024154B2 (ja) * | 2008-03-27 | 2012-09-12 | 富士通株式会社 | 関連付け装置、関連付け方法及びコンピュータプログラム |
US9202520B1 (en) | 2012-10-17 | 2015-12-01 | Amazon Technologies, Inc. | Systems and methods for determining content preferences based on vocal utterances and/or movement by a user |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4059725A (en) * | 1975-03-12 | 1977-11-22 | Nippon Electric Company, Ltd. | Automatic continuous speech recognition system employing dynamic programming |
JPS5938599B2 (ja) * | 1975-03-12 | 1984-09-18 | 日本電気株式会社 | 連続音声認識装置 |
JPS5938600B2 (ja) * | 1975-10-31 | 1984-09-18 | 日本電気株式会社 | レンゾクオンセイニンシキソウチ |
GB1557286A (en) * | 1975-10-31 | 1979-12-05 | Nippon Electric Co | Speech recognition |
JPS592040B2 (ja) * | 1976-08-24 | 1984-01-17 | 日本電信電話株式会社 | 音声認織装置 |
US4092493A (en) * | 1976-11-30 | 1978-05-30 | Bell Telephone Laboratories, Incorporated | Speech recognition system |
US4156868A (en) * | 1977-05-05 | 1979-05-29 | Bell Telephone Laboratories, Incorporated | Syntactic word recognizer |
JPS552205A (en) * | 1978-06-20 | 1980-01-09 | Kogyo Gijutsuin | Real time continuous sound discriminator |
US4349700A (en) * | 1980-04-08 | 1982-09-14 | Bell Telephone Laboratories, Incorporated | Continuous speech recognition system |
-
1981
- 1981-03-27 US US06/248,570 patent/US4400788A/en not_active Expired - Lifetime
-
1982
- 1982-03-18 CA CA000398689A patent/CA1167967A/en not_active Expired
- 1982-03-24 GB GB8208673A patent/GB2095882B/en not_active Expired
- 1982-03-25 FR FR8205106A patent/FR2502822A1/fr active Granted
- 1982-03-26 DE DE19823211313 patent/DE3211313A1/de active Granted
- 1982-03-27 JP JP57048184A patent/JPS57169800A/ja active Granted
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19540859A1 (de) * | 1995-11-03 | 1997-05-28 | Thomson Brandt Gmbh | Verfahren zur Entfernung unerwünschter Sprachkomponenten aus einem Tonsignalgemisch |
DE10015859A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer grammatische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858A1 (de) * | 2000-03-30 | 2001-10-11 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen Kommunikation in natürlichen Sprachen und Einrichtung zur rechnergestützten Durchführung dieses Verfahrens |
DE10015858C2 (de) * | 2000-03-30 | 2002-03-28 | Gunthard Born | Verfahren zu einer auf semantische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
DE10015859C2 (de) * | 2000-03-30 | 2002-04-04 | Gunthard Born | Verfahren zu einer auf grammatische Inhalte bezogenen rechnergestützten Kommunikation in natürlichen Sprachen |
Also Published As
Publication number | Publication date |
---|---|
FR2502822A1 (fr) | 1982-10-01 |
FR2502822B1 (de) | 1985-02-08 |
DE3211313A1 (de) | 1982-11-11 |
GB2095882A (en) | 1982-10-06 |
US4400788A (en) | 1983-08-23 |
CA1167967A (en) | 1984-05-22 |
JPS57169800A (en) | 1982-10-19 |
JPH0416800B2 (de) | 1992-03-25 |
GB2095882B (en) | 1985-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3211313C2 (de) | ||
DE2953262C2 (de) | ||
DE2753277C2 (de) | Verfahren und Einrichtung zur Spracherkennung | |
DE3337353C2 (de) | Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells | |
DE3317325C2 (de) | ||
DE69420842T2 (de) | Spracherkennung unter anwendung einer zweidurchgängigen suchmethode | |
DE4397100C2 (de) | Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl | |
DE60004420T2 (de) | Erkennung von Bereichen überlappender Elemente für ein konkatenatives Sprachsynthesesystem | |
EP1184839B1 (de) | Graphem-Phonem-Konvertierung | |
EP1466317B1 (de) | Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner | |
DE3244476C2 (de) | ||
DE69712277T2 (de) | Verfahren und vorrichtung zur automatischen sprachsegmentierung in phonemartigen einheiten | |
DE3216800C2 (de) | ||
EP0533260B1 (de) | Verfahren und Anordnung zum Erkennen der gesprochenen Wörter in einem Sprachsignal | |
DE69914131T2 (de) | Positionshandhabung bei der Spracherkennung | |
DE3247229C2 (de) | ||
DE3135483C2 (de) | Verfahren und Schaltungsanordnung zur Erkennung einer alphanumerischen Eingangszeichenkette | |
DE3242866C2 (de) | ||
DE19942178C1 (de) | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung | |
DE19847419A1 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung | |
EP0299572A2 (de) | Verfahren zur Erkennung von zusammenhängend gesprochenen Wörtern | |
DE2212472A1 (de) | Verfahren und Anordnung zur Sprachsynthese gedruckter Nachrichtentexte | |
DE69724485T2 (de) | Lokalisierung eines Musters in einem Signal | |
DE69917960T2 (de) | Phonembasierte Sprachsynthese | |
EP1058235B1 (de) | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10L 1/00 |
|
8127 | New person/name/address of the applicant |
Owner name: AT & T TECHNOLOGIES, INC., NEW YORK, N.Y., US |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8328 | Change in the person/name/address of the agent |
Free format text: BLUMBACH, KRAMER & PARTNER, 65193 WIESBADEN |