DE69317229T2 - Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems - Google Patents
Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines SpracherkennungssystemsInfo
- Publication number
- DE69317229T2 DE69317229T2 DE69317229T DE69317229T DE69317229T2 DE 69317229 T2 DE69317229 T2 DE 69317229T2 DE 69317229 T DE69317229 T DE 69317229T DE 69317229 T DE69317229 T DE 69317229T DE 69317229 T2 DE69317229 T2 DE 69317229T2
- Authority
- DE
- Germany
- Prior art keywords
- phrase
- probability
- phrases
- received
- received phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 48
- 230000001419 dependent effect Effects 0.000 claims description 23
- 238000007792 addition Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000007257 malfunction Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
- Die vorliegende Erfindung bezieht sich allgemein auf Spracherkennungssysteme und insbesondere auf ein Verfahren und ein System zum Verhindern der Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems.
- Sprecherabhängige Spracherkennungssysteme sind in den letzten Jahren zunehmend anspruchsvoll geworden. In der Tat stellt Texas Instruments ein TI-System 1500 bereit, das die Spracherkennung von Befehlen mit dem Ziel des Ausführens zahlreicher Funktionen gestattet. Ein wichtiges Merkmal eines Spracherkennungssystems wie des TI-Systems 1500 ist die Fähigkeit, allein durch einen Sprachbefehl einen Teilnehmer schnell anzuwählen oder einen schnellen Zugang zu diesem zu bekommen. Zum Beispiel kann eine Person dem Spracherkennungssystem einen Befehl erteilen und sagen "Rufe Bob Johnson an". Das Spracherkennungssystem wird dann mit einer Telephonnummer oder einer anderen Zugangsnummer, die einem gewissem Bob Johnson zugeordnet ist, auf eine zugeordnete vorprogrammierte Datenbank zugreifen. Das System wird dann sofort diese Nummer verwenden oder wählen.
- Oft vergessen jedoch Personen, die solche sprecherabhängigen Spracherkennungssysteme zum Ausführen dieses Typs von Sprachwahl oder "Namenverzeichniswahl" verwenden, wen sie in ihrer Vokabularliste haben. Beim Vergessen wird ein Anwender eine Phrase einzutragen versuchen, die mit einer bereits auf der Vokabularliste existierenden Phrase übereinstimmt oder zu einer solchen verwirrend ähnlich ist. Versucht z. B. eine Person, ihrer Vokabularliste die Phrase "Bob Johnson" hinzuzufügen, kann dies zu einer offensichtlichen Fehlfunktion des Systems führen, wenn jene Phrase bereits existiert. Bei der späteren Suche nach Bob Johnson, um diesen anzurufen, wird der Anwender oder Teilnehmer den Befehl "Rufe Bob Johnson an" erteilen, jedoch kann das System, um den Anruf abzugeben, nur eine von zwei Telephonnummern verwenden. Damit kann der Anwender nicht richtig steuern, welche Nummer das System anrufen wird. Darüber hinaus kann es zu einem ähnlichen Systemfehler kommen, wenn die Person zu der Liste die Phrase "Bob Johnston" hinzufügt, wenn ein verwirrend ähnlicher "Bob Johnson" bereits existiert. In beiden Fällen wird es offensichtlich zu einer Systemfehlfunktion kommen. Es ist jedoch wichtig zu wissen, daß die Fehler, die aus dem Zuordnen mehr als einer Telephonnummer zu einer einzelnen Phrase oder einer verwirrend ähnlichen Phrase in einer Vokabularliste resultieren, nicht von einer schlechten Systemleistung herrühren. Statt dessen rühren die Fehler von einem falschen Gebrauch des Spracherkennungssystems her.
- Ähnliche Probleme existieren bei der Eintragung allgemeiner sprecherabhängiger Befehle in sprecherabhängigen Spracherkennungssystemen.
- Es besteht deshalb ein Bedarf an einem Verfahren und einem System, die das Hinzufügen bereits existierender und verwirrend ähnlicher Phrasen zu einer Vokabularliste für ein sprecherabhängiges Spracherkennungssystem verhindern.
- Es besteht ein Bedarf an einem System, das Vokabularlistenfunktionen für ein sprecherabhängiges Spracherkennungssystem optimiert, indem es Hinzufügungen zu der Vokabularliste, die ein fehlerhaftes Erkennen des Systems bewirken, verhindert.
- Überdies ist ein Bedarf an einem verbesserten Spracherkennungssystem entstanden, das die Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste verhindert.
- Die europäische Patentanmeldung EP 241 163 offenbart ein sprecherabhängiges Spracherkennungssystem, das das Einsetzen eines neuen Wortes in das Systemvokabular verhindert, wenn der Abstand zwischen den Merkmalen des neuen Wortes und den Merkmalen irgendeines bereits in dem Vokabular befindlichen Wortes kleiner als ein vorbestimmter Schwellenwert ist.
- Die vorliegende Erfindung schafft dementsprechend ein Verfahren und ein System, die die Eintragung bereits vorhandener oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindern und die die mit den vorhandenen Verfahren des Aufbaus von Einträgen für Spracherkennungssystene verbundenen Nachteile und Beschränkungen überwinden oder vermindern.
- Ein Aspekt der vorliegenden Erfindung ist ein Verfahren, das die Eintragung bereits existierender oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindert, mit den Schritten zunächst des Empfangens einer Phrase, die zu der Vokabularliste hinzuzufügen oder in diese einzutragen ist. Der nächste Schritt besteht in dem Zuweisen einer ersten Wahrscheinlichkeit an alle anderen auf der Vokabularliste existierenden Phrasen und einer zweiten, jedoch geringeren Wahrscheinlichkeit an die erstempfangene Phrase. Im nächsten Schritt hat der Anwender die einzutragende Phrase zu wiederholen. Das Spracherkennungssystem vergleicht dann die wiederholte Phrase mit der gesamten Vokabularliste, die nun die Phrase, wie sie zuerst empfangen wurde, enthält. Der nächste Schritt besteht darin, dem Anwender anzuzeigen, ob die wiederholte Phrase mit einer anderen als der erstempfangenen Phrase auf der Vokabularliste übereinstimmt. Überdies enthält das Verfahren den Schritt, das Hinzufügen der Phrase in dem Fall zu verhindern, daß die wiederholte Phrase auf der gesamten Vokabularliste mit einer anderen als der erstempfangenen Phrase übereinstimmt.
- Ein technischer Vorteil der vorliegenden Erfindung besteht darin, daß sie zum Herausfinden der Unterschiede zwischen den verwirrend ähnlichen Phrasen, die ein Anwender zu der Vokabularliste hinzuzufügen versuchen könnte, die gleichen Spracherkennungsalgorithmen verwendet, die in einem sprecherabhängigen Spracherkennungssystem existieren. Dies gewährleistet, daß minimale zusätzliche Kosten nötig sind, um die vorliegende Erfindung auszuführen. Gleichzeitig und in kritischen Fällen vermag die vorliegende Erfindung den Betrieb sprecherabhängiger Spracherkennungssysteme wesentlich zu verbessern.
- Ein weiterer technischer Vorteil der vorliegenden Erfindung besteht darin, daß die vorliegende Erfindung dem Anwender das sofortige Modifizieren seiner Eingabe ermöglicht, indem sie ihn auf die verwirrend ähnliche Phrase aufmerksam macht, um so ein Hinzufügen der verwirrend ähnlichen Phrase zu der Vokabularliste zu verhindern.
- Die Erfindung und ihre Anwendungsweisen und Vorteile werden am besten mit Bezug auf die folgende Beschreibung erläuternder Ausführungsformen verständlich, die im Zusammenhang mit der sie begleitenden Zeichnung zu lesen sind, worin:
- Fig. 1 konzeptuell eine beispielhafte Vokabularliste eines sprecherabhängigen Spracherkennungssystems zeigt;
- Fig. 2 einen Ablaufplan der Schritte und des Datenflusses des Eintragungsprozesses gemäß der bevorzugten Ausführungsform bereitstellt;
- Fig. 3 einen Ablaufplan des Vokabularlisten-Aktualisierungsprozesses gemäß der bevorzugten Ausführungsform zeigt;
- Fig. 4 anhand eines Ablaufplans den Prozeß der Erzeugung der Aktualisierungsgrammatik gemäß der bevorzugten Ausführungsform zeigt, und
- Fig. 5 eine konzeptuelle Erläuterung einer für die Zwecke der vorliegenden Erfindung modifizierten Vokabularliste ist.
- Die bevorzugte Ausführungsform der vorliegenden Erfindung läßt sich am besten unter Bezug auf die Zeichnung verstehen, worin für gleiche und einander entsprechende Teile der verschiedenen Zeichnungen gleiche Bezugszeichen verwendet werden.
- Fig. 1 zeigt konzeptuell eine beispielhafte Liste 10 von Phrasen, die eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems zur Verwendung mit der bevorzugten Ausführungsform bilden. Die Vokabularliste 10 aus Fig. 1 kann z. B. eine Namenliste für eine Namenverzeichniswahl für ein sprachaktiviertes Schnellwahlsystem sein. Ein Spracherkennungssystem, das die bevorzugte Ausführungsform der vorliegenden Erfindung verwenden kann, ist ein Texas Instruments- System 1500, das mit einem Spracherkennungs-Anwendungssystem mit der Phrase HG arbeitet. Obgleich dieses System zur Ausführung der erfinderischen Konzepte der vorliegenden Erfindung weitgehend von Software und Algorithmen abhängt, kann die Funktion der vorliegenden Erfindung ähnlich durch eine Schaltungsanordnung und Bauelemente ausgeführt werden. Die vorliegende Erfindung beabsichtigt deshalb zum Ausführen dieser Funktionen klar die Verwendung einer Schaltungsanordnung.
- Die Vokabularliste 10 aus Fig. 1 enthält Phrasen wie "Phrase 1" an der durch das Bezugszeichen 12 bezeichneten Stelle, "Phrase 2" an der mit 14 bezeichneten Stelle usw. bis hinab zu "Phrase N" an der Stelle des Bezugszeichens 16. Ein Ziel eines sprecherabhängigen Spracherkennungssystems besteht darin, einem Anwender das Hinzufügen von Phrasen zu der Vokabularliste 10 zu gestatten und dann jene Phrasen für Befehle und zur Steuerung aufzurufen. Zum Beispiel kann ein Anwender, der das Spracherkennungssystem verwendet, sagen "rufe Phrase 1 an", worauf das System den Sprachbefehl erkennt und die Person oder den Ort, die mit "Phrase 1" verknüpft sind, anruft.
- Häufig könnten Anwender der sprecherabhängigen Spracherkennungssysteme vergessen, welche Wörter auf ihrer Vokabularliste stehen. Wenn ein Anwender eine Phrase vergessen hat, könnte er manchmal versuchen, eine Phrase erneut einzutragen, oder er könnte ohne Rücksicht auf zuvor eingetragene Phrasen versuchen, eine Phrase einzutragen, die einer existierenden Phrase ähnelt. Tritt z. B. einer dieser Fälle auf, kann die Vokabularliste 10 Phrasen enthalten, welche nicht auf der Vokabularliste sein sollten. Dies führt zu Verwirrung und kann den Wert oder den Nutzen der Vokabularliste 10 schmälern. Um diese Probleme zu vermeiden, schafft die bevorzugte Ausführungsform der vorliegenden Erfindung ein Verfahren und ein System, die verhindern, daß auf der Vokabularliste 10 verwirrend ähnliche Phrasen existieren.
- Fig. 2 zeigt den Prozeßablauf des Eintragungsprozesses 20 der bevorzugten Ausführungsform. Der Anwender oder Teilnehmer wird den Eintragungsprozeß wie durch den Block 22 gezeigt beginnen. Dies kann dadurch geschehen, daß an die sprecherabhängige Spracherkennungseintragung ein Befehl wie "überprüfe die Liste" gerichtet wird. Das System wird dann z. B. den Anwender in Schritt 24 durch den Befehl "sagen Sie die Schnellwahlphrase" auffordern. Die Ernpfangsschaltungsanordnung der Spracherkennung wird dann die hinzuzufügende Phrase empfangen. Als nächstes führt das Spracherkennungssystem z. B. einen als "Hidden Markov Modeling"-Eintragung (HMN- Eintragung) bekannten Prozeß aus, der zum Identifizieren der Endpunkte der Rede einen energiebasierten Endezeigeprozeß oder eine andere geeignete Technik verwendet. Dies geschieht im Schritt 26. Ein Beispiel des HMM-Prozesses, den die bevorzugte Ausführungsform ausführt, findet sich bei J. Picone, Continuous Speech Recognition Using Hidden Markov Models, Speech and Image Understanding Laboratory, Texas Instruments, Inc., 7. Mai 1990 (Nachdruck aus dem IEEE ASSP-Magazin). Wie der Block 28 zeigt, bestehen die nächsten Schritte darin, unter Verwendung der HMM-Technik ein HMM-Modell zu erzeugen und zu der Teilnehmerschablone Akustikvektoren hinzuzufügen. Sobald der Eintragungsprozeß 20 abgeschlossen ist, besteht der nächste Schritt in der Aktualisierung der Vokabularliste 10.
- Fig. 3 zeigt den Aktualisierungsprozeß 30 der bevorzugten Ausführungsform Beginnend bei Block 32 besteht der erste Schritt darin, daß das Spracherkennungssystem dem Teilnehmer anzeigt, daß es die Vokabularliste 10 aktualisiert. Dann fordert das Spracherkennungssystem den Teilnehmer auf, die Phrase zu wiederholen. Das Spracherkennungssystem kann z. B. wie in Block 34 gezeigt den Befehl "sagen Sie den Schnellwahlnamen noch einmal" verwenden. Als nächstes führt das Spracherkennungssystem den HMM-Algorithmus aus, um auf der Grundlage der in einer mit dem Spracherkennungssystem in Block 36 verknüpften Datenbank geladenen Modelle nach der besten Phrase zu suchen. Dies ist ein Vergleichsschritt, der identifiziert, ob sich auf der Vokabularliste 10 die gleiche oder eine verwirrend ähnliche Phrase befindet. Das Spracherkennungssystem gibt dann das beste Modell (d. h. die beste Phrase) und eine mit dem Modell verknüpfte Punktzahl zurück. Bei Block 38 fragt das Verfahren der bevorzugten Ausführungsform ab, ob die zurückgegebene Phrase die gleiche ist wie die, die der Teilnehmer einzutragen versucht. Ist dies der Fall, teilt das Spracherkennungssystem dem Teilnehmer diese Informationen, wie Block 40 zeigt, als einen "Erfolg" mit.
- Das Spracherkennungssystem wird dann die Phrase in der Vokabularliste 10 halten. Ist dies nicht der Fall, unterrichtet das System den Teilnehmer, wie Block 42 zeigt, darüber, daß die Phrase, die er einzugeben versucht, einer anderen Phrase auf der Vokabularliste 10 zu ähnlich ist. Zu diesem Zeitpunkt besteht das Verfahren darin, dem Teilnehmer die auf der Vokabularliste 10 befindliche verwirrend ähnliche Phrase abzuspielen und dann Anweisungen anzufordern. Die bevorzugte Ausführungsform scheidet die Phrase deshalb von dem Eintragungsprozeß aus.
- Ein Schlüsselprozeß der bevorzugten Ausführungsform ist die Erzeugung von Modellen, die akustische Modelle aller Phrasen auf der Schablone sind. Fig. 4 zeigt den Prozeß 50, durch den akustische Modelle für alle Phrasen auf der Vokabularliste 10 erstellt werden. Beginnend bei Block 52 aktualisiert das Spracherkennungssystem die Grammatikerzeugung. Dann erzeugt das System für jede Phrase auf der Vokabularliste 10 ein akustisches HMM-Modell für die Phrase zur Eintragung in Block 54. Der nächste Schritt besteht darin, in Block 56 dem Modell für die Phrase, die momentan in die Vokabularliste 10 eingetragen wird, eine durch die Variable "PROB" bezeichnete Wahrscheinlichkeit zuzuordnen. In Block 56 wird auch allen Phrasen, die verbleiben, eine Wahrscheinlichkeit 1 zugeordnet. Der Wert des Wahrscheinlichkeitsparameters PROB ist so gewählt, daß er die Unterdrückung ähnlicher Phrasen maximiert und gleichzeitig die Wahrscheinlichkeit, daß die Phrasenausgabe tatsächlich verschieden von der ist, die eingetragen wird, minimiert.
- Das Ergebnis des obigen Eintragungsprozesses 20, des Aktualisierungsprozesses 30 und des Prozesses 50 der Erzeugung einer aktualisierten Grammatik ist eine modifizierte Vokabularliste, die die Ziele der bevorzugten Ausführungsform schafft. Fig. 5 zeigt konzeptuell eine Vokabularliste, die durch den Prozeß der bevorzugten Ausführungsform modifiziert wurde.
- Insbesondere wurde in die modifizierte Vokabularliste zusammen mit der "PHRASE 1" an der Stelle 12, der "PHRASE 2" an der Stelle 14 bis hin zu "PHRASE N" an der Stelle 16 die "PHRASE i" eingetragen. Die Spalte 62 zeigt die für jedes der Modelle auf der Vokabularliste 10 zugeordnete Wahrscheinlichkeit. Zum Beispiel haben "PHRASE 1", "PHRASE 2" und "PHRASE N" alle einen Wahrscheinlichkeitswert 1,0. Bei der "PHRASE i" wird der Stelle 60 die Wahrscheinlichkeitsvariable PROB mit einem Wert kleiner als 1,0 zugeordnet. Dies gibt der "PHRASE i" die zur Unterstützung der von der bevorzugten Ausführungsform ausgeführten Unterdrückung notwendige Wahrscheinlichkeit.
- Obgleich das obenbeschriebene Verfahren und das obenbeschriebene System den Betrieb der vorliegenden Erfindung klar machen, hilft die folgende Diskussion, den Betrieb noch deutlicher zu machen. Das folgende Beispiel zeigt deshalb den Betrieb der bevorzugten Ausführungsform. Es wird z. B. angenommen, daß ein Anwender beschließt, zu der Vokabularliste 10 die Phrase "Bob Johnston" hinzuzufügen. Um die Eintragung zu beginnen, kann der Anwender dann an das Spracherkennungssystem den Befehl "überprüfe die Liste" übergeben. Bei Schritt 24 aus Fig. 2 wird das System den Anwender mit den Wörtern "sagen Sie die Schnellwahlphrase" auffordern. Als nächstes wird der Anwender "Bob Johnston" sagen. Die bevorzugte Ausführungsform wird dann die Phrase "Bob Johnston" eintragen und gemäß der Schritte 26 und 28 aus Fig. 2 ein HMM-Modell "Bob Johnston" erzeugen.
- Unmittelbar danach wird das System die Vokabularliste 10 aktualisieren und den Anwender auffordern: "sagen Sie die Schnellwahlphrase noch einmal" (siehe Fig. 3). Sobald der Anwender die Phrase "Bob Johnston" noch einmal sagt, wird der HMM-Algorithmus versuchen nachzusehen, ob es auf der Vokabularliste 10 eine Übereinstimmung mit der Phrase "Bob Johnston" gibt. Bevor dies jedoch durch das Verfahren der bevorzugten Ausführungsform geschieht, wird allen Phrasen auf der Vokabularliste 10 außer der Phrase "Bob Johnston" die Wahrscheinlichkeit 1,0 zugeordnet (siehe Fig. 4). Der Phrase "Bob Johnston" wird z. B. eine Wahrscheinlichkeit von 0,8 (d. h. eine geringere Wahrscheinlichkeit als allen anderen Phrasen auf der Vokabularliste 10) zugeordnet.
- Nun wird z. B. angenommen, daß es auf der Vokabularliste 10 die Phrase "Bob Johnsom" gibt. Da die Wahrscheinlichkeit einer Übereinstimmung zwischen nochmals gesagtem "Bob Johnston" und "Bob Johnson" 1,0 beträgt, während die Wahrscheinlichkeit für "Bob Johnston" 0,8 ist, wird das System dem Anwender in diesem Fall mit einer höheren Wahrscheinlichkeit eine Übereinstimmung mit der Phrase "Bob Johnson" zurückgeben. An dieser Stelle wird die bevorzugte Ausführungsform eine Überprüfung durchführen, ob es eine Übereinstimmung zwischen der ein zweites Mal gesagten Phrase und der erstempfangenen Phrase (d. h. der Phrase mit der niedrigeren zugeordneten Wahrscheinlichkeit) gibt. In diesem Beispiel ist dies nicht der Fall. Der Anwender wird deshalb davon in Kenntnis gesetzt, daß die einzutragende Phrase einer anderen Phrase auf der Liste zu ähnlich ist. Das System wird dann dem Anwender einen Befehl der Art "sie versuchen, die Phrase Bob Johnston einzugeben, während die Phrase Bob Johnson bereits in der Datenbank existiert. Bitte wählen Sie eine andere Phrase." abspielen. Statt dieser können dem Anwender andere, ähnliche Anweisungen bereitgestellt werden. Im wesentlichen wird der Betrieb der bevorzugten Ausführungsform jedoch einen fehlerfreieren Gebrauch der Vokabularliste 10 in einen sprecherabhängigen Sprachverarbeitungssystem gestatten.
- Wenn ein Anwender in anderen Phasen versucht, zu der Vokabularliste eine verwirrend ähnliche Phrase hinzuzufügen, besteht der erste auszuführende Schritt darin, im Lernprozeß eine Aktualisierung vorzunehmen. Diese Aktualisierung beginnt mit einer Eintragung, durch die ein Modell der hinzugefügten Phrase erzeugt wird. Der nächste Schritt besteht darin, den Anwender die Phrase wiederholen zu lassen und zu versuchen, die erste Phrase mit der zweiten zu überlagern oder sie zu aktualisieren, um ein besseres Modell zu erzeugen. In einem Versuch, ein besseres Modell zu erstellen, wird traditionell allen Phrasen eine gleiche Wahrscheinlichkeit zugeordnet oder, was ähnlich ist, das einzelne Modell unabhängig davon, welche anderen Phrasen sich auf der Liste befinden, aktualisiert. Statt dessen wertet die bevorzugte Ausführungsform die wiederholte Phrase aus und ordnet bei der Aktualisierung allen Phrasen Wahrscheinlichkeiten zu, so daß das System alle anderen Phrasen gegenüber der Phrase, die der Anwender zu der Vokabularliste hinzuzufügen versucht, bevorzugt. Dadurch, daß allen anderen Phrasen eine höhere Wahrscheinlichkeit als der erstgesprochenen Phrase zugeordnet wurde, werden ähnlich klingende Phrasen gegenüber der erstgesprochenen Phrase oder der Phrase, die der Anwender einzugeben wünscht, ausgewählt. Die bevorzugte Ausführungsform testet daher die einzugebende Phrase gegenüber allen anderen derzeit auf der Vokabularliste vorhandenen Phrasen. Dies geschieht durch ein künstliches Verringern der Wahrscheinlichkeit dafür, daß das System die zweitgesprochene Phrase als die erstgesprochene erkennt. Dieser gesamte Vergleichsprozeß wird durch die Spracherkennungs-Systemsoftware wie die in dem Spracherkennungssystem Texas Instruments-System 1500 verwendete HG-Systemsoftware ausgeführt.
- Ein alternatives Verfahren enthält die Schritte des Ausführens des Erkennungsalgorithmus mit den Eintragungsdaten unter Verwendung der Sprachmodelle aller Phrasen bis auf die eine, die dem System neu hinzugefügt werden soll. In dieser Situation wird der Erkenner typischerweise die beste Übereinstimmung unter den verbleibenden Modellen suchen. Das alternative Verfahren nutzt dann eine Entscheidungsregel, die auf der Punktzahl bei der falschen Übereinstimmung und der in dem richtigen Modell erhaltenen Punktzahl beruht, um zu entscheiden, ob es die neue Phrase in die Vokabularliste 10 aufnehmen soll. Das alternative Verfahren fügt die neue Phrase dann hinzu, wenn die Differenz zwischen der Punktzahl für die falsche Übereinstimmung und der Punktzahl für die richtige Übereinstimmung unterhalb einer vorbestimmten Schwelle liegt. Das Spracherkennungssystem wird dann den Anwender darüber informieren, daß die Phrase zum Hinzufügen übernommen wurde oder auch nicht.
- Obgleich die vorliegende Erfindung ausführlich beschrieben wurde, können selbstverständlich verschiedene Veränderungen, Ersetzungen und Abwandlungen hierzu vorgenommen werden, ohne vom Umfang der durch die beigefügten Ansprüche definierten Erfindung abzuweichen.
Claims (15)
1. Verfahren zum Verhindern der Eintragung von bereits
vorhandenen oder verwirrend ähnlichen Phrasen in eine
Vokabularliste (10) eines sprecherabhängigen
Spracherkennungssystems, mit den folgenden Schritten:
zunächst Empfangen einer erstempfangenen Phrase (60),
die von einem Anwender ausgesprochen wird, um sie zu
mehreren anderen Phrasen (12, 14, 16) in einer
Vokabularliste hinzuzufügen;
Eintragen der Phrase in die Vokabularliste;
Zuweisen einer ersten Wahrscheinlichkeit an die
Phrase (60) und einer zweiten Wahrscheinlichkeit an jede
der mehreren anderen Phrasen (12, 14, 16), wobei die
zweite Wahrscheinlichkeit einen höheren Wert als die
erste Wahrscheinlichkeit besitzt;
Empfangen einer zweitempfangenen Phrase, wobei die
zweitempfangene Phrase die gleiche Phrase ist, die vom
Anwender zu einem zweiten Zeitpunkt ausgesprochen wird,
wobei die erste Wahrscheinlichkeit und die zweite
Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das
sprecherabhängige Spracherkennungssystem die
zweitempfangene Phrase mit der erstempfangenen Phrase (60) oder
mit einer der mehreren anderen Phrasen (12, 14, 16) in
der Vokabularliste zur Übereinstimmung bringt;
Vergleichen der zweitempfangenen Phrase mit der
Vokabularliste, die die erstempfangene Phrase (60) und die
mehreren anderen Phrasen (12, 14, 16) enthält;
Ausgeben eines Hinweises an den Benutzer, ob die
zweitempfangene Phrase mit einer der mehreren anderen
Phrasen (12, 14, 16) übereinstimmt; und
Zurückweisen der Eintragung der erstempfangenen
Phrase (60) in die Vokabularliste, falls die
zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12,
14, 16) übereinstimmt.
2. Verfahren nach Anspruch 1, bei dem der Vergleichsschritt
unter Verwendung eines "Hidden Markov Modeling"-Prozesses
ausgeführt wird.
3. Verfahren nach Anspruch 1, ferner mit dem Schritt des
Beibehaltens der erstempfangenen Phrase in der
Vokabularliste, falls der Vergleichsschritt eine Übereinstimmung
zwischen der zweitempfangenen Phrase und der
erstempfangenen Phrase ergibt.
4. Verfahren nach Anspruch 1, bei dem die erste
Wahrscheinlichkeit die Unterscheidung von Ähnlichkeiten zwischen
der zweitempfangenen Phrase und jeder der mehreren
anderen Phrasen maximal macht und die Wahrscheinlichkeit, daß
das Spracherkennungssystem die zweitempfangene Phrase mit
einer von der erstempfangenen Phrase verschiedenen Phrase
zur Übereinstimmung bringt, minimal macht.
5. Verfahren nach Anspruch 1, bei dem der Hinweisschritt den
Schritt des Abspielens einer Nachricht enthält, die
angibt, daß die erstempfangene Phrase wenigstens einer der
mehreren anderen Phrasen zu ähnlich ist.
6. Verfahren nach Anspruch 1, bei dem die zweite
Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.
7. Verfahren nach Anspruch 1, bei dem der Eintragungsschritt
den Schritt des Eintragens der Phrase unter Verwendung
eines energiebasierten Endezeigeprozesses enthält.
8. System zum Verhindern der Eintragung von bereits
vorhandenen oder verwirrend ähnlichen Phrasen in eine
Vokabularliste (10) eines sprecherabhängigen
Spracherkennungssystems, mit:
einer Empfangsschaltungsanordnung, die dem
sprecherabhängigen Spracherkennungssystem zugeordnet ist, um
zunächst eine erstempfangene Phrase (60), die von einem
Anwender ausgesprochen wird, zu empfangen, um sie zu
mehreren anderen Phrasen (12, 14, 16) in einer Vokabularliste
hinzuzufügen;
einem Eintragungsmechanismus zum Eintragen der Phrase
in die Vokabularliste;
einem Zuweisungsalgorithmus zum Zuweisen einer ersten
Wahrscheinlichkeit an die Phrase (60) und einer zweiten
Wahrscheinlichkeit an jede der mehreren anderen Phrasen
(12, 14, 16), wobei die zweite Wahrscheinlichkeit einen
größeren Wert als die erste Wahrscheinlichkeit besitzt;
wobei die Empfangsschaltungsanordnung ferner eine
zweitempfangene Phrase empfängt, wobei die
zweitempfangene Phrase gleich der ersten Phrase ist und von Anwender
zu einem zweiten Zeitpunkt ausgesprochen wird, wobei die
erste Wahrscheinlichkeit und die zweite
Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das
Spracherkennungssystem die zweitempfangene Phrase mit der
erstempfangenen Phrase (60) oder mit einer der mehreren anderen
Phrasen (12, 14, 16) in der Vokabularliste zur
Übereinstimmung bringt;
einer Vergleichsschaltungsanordnung zum Vergleichen
der zweitempfangenen Phrase mit der Vokabularliste, die
die erstempfangene Phrase (60) und die mehreren weiteren
Phrasen (12, 14, 16) enthält;
einer Kommunikationsschaltungsanordnung, die dem
Anwender mitteilt, ob die zweitempfangene Phrase mit einer
der mehreren weiteren Phrasen (12, 14, 16) übereinstimmt;
und
einer Zurückweisungsschaltungsanordnung zum
Zurückweisen der Eintragung der erstempfangenen Phrase (60) in
die Vokabularliste, falls die zweitempfangene Phrase mit
einer der mehreren anderen Phrasen (12, 14, 16)
übereinstimmt.
9. System nach Anspruch 8, bei dem die
Vergleichsschaltungsanordnung ferner eine Schaltungsanordnung zum Ausführen
des Vergleichs unter Verwendung eines "Hidden Markov
Modeling"-Prozesses enthält.
10. System nach Anspruch 8, ferner mit einer
Halteschaltungsanordnung zum Halten der erstempfangenen Phrase in der
Vokabularliste, falls die Vergleichsschaltungsanordnung
eine Übereinstimmung zwischen der zweitempfangenen Phrase
und der erstempfangenen Phrase feststellt.
11. System nach Anspruch 8, bei dem die erste
Wahrscheinlichkeit die Unterscheidung von Ahnlichkeiten zwischen der
zweitempfangenen Phrase und jeder der mehreren anderen
Phrasen maximal macht und die Wahrscheinlichkeit, daß das
Spracherkennungssystem die Phrase mit einer von der
erstempfangenen Phrase verschiedenen Phrase zur
Übereinstimmung bringt, minimal macht.
12. System nach Anspruch 8, bei dem die
Kommunikationsschaltungsanordnung ferner eine Abspielschaltungsanordnung
enthält, die eine Nachricht abspielt, die angibt, daß die
erstempfangene Phrase wenigstens einer der mehreren
weiteren Phrasen zu ähnlich ist.
13. System nach Anspruch 8, bei dem die zweite
Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.
14. System nach Anspruch 8, bei dem der
Eintragungsmechanismus einen Mechanismus zum Eintragen der Phrase unter
Verwendung eines energiebasierten Endezeigeprozesses
einträgt.
15. Verbessertes sprecherabhängiges Spracherkennungssystem,
das ein System nach irgendeinem der Ansprüche 8 bis 14
enthält.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/989,285 US5452397A (en) | 1992-12-11 | 1992-12-11 | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69317229D1 DE69317229D1 (de) | 1998-04-09 |
DE69317229T2 true DE69317229T2 (de) | 1998-06-25 |
Family
ID=25534958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69317229T Expired - Lifetime DE69317229T2 (de) | 1992-12-11 | 1993-12-10 | Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems |
Country Status (6)
Country | Link |
---|---|
US (1) | US5452397A (de) |
EP (1) | EP0601876B1 (de) |
JP (1) | JP3388845B2 (de) |
KR (1) | KR100283736B1 (de) |
DE (1) | DE69317229T2 (de) |
MY (1) | MY115138A (de) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2015410C (en) * | 1989-05-17 | 1996-04-02 | Chin H. Lee | Speech recognition employing key word modeling and non-key word modeling |
US5509104A (en) * | 1989-05-17 | 1996-04-16 | At&T Corp. | Speech recognition employing key word modeling and non-key word modeling |
US5717738A (en) * | 1993-01-11 | 1998-02-10 | Texas Instruments Incorporated | Method and device for generating user defined spoken speed dial directories |
TW323364B (de) * | 1993-11-24 | 1997-12-21 | At & T Corp | |
US5737723A (en) * | 1994-08-29 | 1998-04-07 | Lucent Technologies Inc. | Confusable word detection in speech recognition |
US5758322A (en) * | 1994-12-09 | 1998-05-26 | International Voice Register, Inc. | Method and apparatus for conducting point-of-sale transactions using voice recognition |
US5754977A (en) * | 1996-03-06 | 1998-05-19 | Intervoice Limited Partnership | System and method for preventing enrollment of confusable patterns in a reference database |
US5915238A (en) * | 1996-07-16 | 1999-06-22 | Tjaden; Gary S. | Personalized audio information delivery system |
US5752230A (en) * | 1996-08-20 | 1998-05-12 | Ncr Corporation | Method and apparatus for identifying names with a speech recognition program |
US5905789A (en) * | 1996-10-07 | 1999-05-18 | Northern Telecom Limited | Call-forwarding system using adaptive model of user behavior |
US6167117A (en) * | 1996-10-07 | 2000-12-26 | Nortel Networks Limited | Voice-dialing system using model of calling behavior |
US5917891A (en) * | 1996-10-07 | 1999-06-29 | Northern Telecom, Limited | Voice-dialing system using adaptive model of calling behavior |
US5912949A (en) * | 1996-11-05 | 1999-06-15 | Northern Telecom Limited | Voice-dialing system using both spoken names and initials in recognition |
US5915001A (en) * | 1996-11-14 | 1999-06-22 | Vois Corporation | System and method for providing and using universally accessible voice and speech data files |
US6208713B1 (en) | 1996-12-05 | 2001-03-27 | Nortel Networks Limited | Method and apparatus for locating a desired record in a plurality of records in an input recognizing telephone directory |
US6137863A (en) * | 1996-12-13 | 2000-10-24 | At&T Corp. | Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition |
US6005927A (en) * | 1996-12-16 | 1999-12-21 | Northern Telecom Limited | Telephone directory apparatus and method |
US6061654A (en) * | 1996-12-16 | 2000-05-09 | At&T Corp. | System and method of recognizing letters and numbers by either speech or touch tone recognition utilizing constrained confusion matrices |
EP0885513A1 (de) * | 1996-12-17 | 1998-12-23 | Koninklijke Philips Electronics N.V. | Schnurloses telefongerät |
CN1216137A (zh) * | 1996-12-24 | 1999-05-05 | 皇家菲利浦电子有限公司 | 一种训练语音识别系统的方法和实践该方法的装置特别是手提电话设备 |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6219453B1 (en) | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6141661A (en) * | 1997-10-17 | 2000-10-31 | At&T Corp | Method and apparatus for performing a grammar-pruning operation |
US6243677B1 (en) * | 1997-11-19 | 2001-06-05 | Texas Instruments Incorporated | Method of out of vocabulary word rejection |
US6122612A (en) * | 1997-11-20 | 2000-09-19 | At&T Corp | Check-sum based method and apparatus for performing speech recognition |
US6205428B1 (en) | 1997-11-20 | 2001-03-20 | At&T Corp. | Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers |
US6208965B1 (en) | 1997-11-20 | 2001-03-27 | At&T Corp. | Method and apparatus for performing a name acquisition based on speech recognition |
US5987411A (en) * | 1997-12-17 | 1999-11-16 | Northern Telecom Limited | Recognition system for determining whether speech is confusing or inconsistent |
US6223158B1 (en) | 1998-02-04 | 2001-04-24 | At&T Corporation | Statistical option generator for alpha-numeric pre-database speech recognition correction |
US6205261B1 (en) | 1998-02-05 | 2001-03-20 | At&T Corp. | Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US7937260B1 (en) | 1998-06-15 | 2011-05-03 | At&T Intellectual Property Ii, L.P. | Concise dynamic grammars using N-best selection |
US6400805B1 (en) | 1998-06-15 | 2002-06-04 | At&T Corp. | Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition |
US6233560B1 (en) | 1998-12-16 | 2001-05-15 | International Business Machines Corporation | Method and apparatus for presenting proximal feedback in voice command systems |
US8275617B1 (en) | 1998-12-17 | 2012-09-25 | Nuance Communications, Inc. | Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands |
US7266498B1 (en) * | 1998-12-18 | 2007-09-04 | Intel Corporation | Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu |
US20020032564A1 (en) * | 2000-04-19 | 2002-03-14 | Farzad Ehsani | Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface |
AU5451800A (en) | 1999-05-28 | 2000-12-18 | Sehda, Inc. | Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces |
CA2376277C (en) | 1999-06-11 | 2011-03-15 | Telstra New Wave Pty Ltd | A method of developing an interactive system |
KR20010054622A (ko) * | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US6535850B1 (en) | 2000-03-09 | 2003-03-18 | Conexant Systems, Inc. | Smart training and smart scoring in SD speech recognition system with user defined vocabulary |
US8200485B1 (en) | 2000-08-29 | 2012-06-12 | A9.Com, Inc. | Voice interface and methods for improving recognition accuracy of voice search queries |
US6973429B2 (en) * | 2000-12-04 | 2005-12-06 | A9.Com, Inc. | Grammar generation for voice-based searches |
US7013276B2 (en) * | 2001-10-05 | 2006-03-14 | Comverse, Inc. | Method of assessing degree of acoustic confusability, and system therefor |
JP2003241790A (ja) * | 2002-02-13 | 2003-08-29 | Internatl Business Mach Corp <Ibm> | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム |
GB2385698B (en) * | 2002-02-26 | 2005-06-15 | Canon Kk | Speech processing apparatus and method |
AU2002950336A0 (en) * | 2002-07-24 | 2002-09-12 | Telstra New Wave Pty Ltd | System and process for developing a voice application |
AU2002951244A0 (en) * | 2002-09-06 | 2002-09-19 | Telstra New Wave Pty Ltd | A development system for a dialog system |
AU2003900584A0 (en) * | 2003-02-11 | 2003-02-27 | Telstra New Wave Pty Ltd | System for predicting speech recognition accuracy and development for a dialog system |
AU2004211007B2 (en) * | 2003-02-11 | 2010-08-19 | Telstra Corporation Limited | System for predicting speech recognition accuracy and development for a dialog system |
US7729913B1 (en) | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
AU2003902020A0 (en) * | 2003-04-29 | 2003-05-15 | Telstra New Wave Pty Ltd | A process for grammatical inference |
US7899671B2 (en) * | 2004-02-05 | 2011-03-01 | Avaya, Inc. | Recognition results postprocessor for use in voice recognition systems |
WO2006033044A2 (en) * | 2004-09-23 | 2006-03-30 | Koninklijke Philips Electronics N.V. | Method of training a robust speaker-dependent speech recognition system with speaker-dependent expressions and robust speaker-dependent speech recognition system |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
US8195456B2 (en) * | 2009-12-04 | 2012-06-05 | GM Global Technology Operations LLC | Robust speech recognition based on spelling with phonetic letter families |
JP6744025B2 (ja) * | 2016-06-21 | 2020-08-19 | 日本電気株式会社 | 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム |
US10832658B2 (en) * | 2017-11-15 | 2020-11-10 | International Business Machines Corporation | Quantized dialog language model for dialog systems |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE33597E (en) * | 1982-10-15 | 1991-05-28 | Hidden Markov model speech recognition arrangement | |
US5218668A (en) * | 1984-09-28 | 1993-06-08 | Itt Corporation | Keyword recognition system and method using template concantenation model |
US4783804A (en) * | 1985-03-21 | 1988-11-08 | American Telephone And Telegraph Company, At&T Bell Laboratories | Hidden Markov model speech recognition arrangement |
ES2019628B3 (es) * | 1986-02-15 | 1991-07-01 | Smiths Ind Public Ltd Company | Procesador de textos hablados y metodo.. |
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
US5129002A (en) * | 1987-12-16 | 1992-07-07 | Matsushita Electric Industrial Co., Ltd. | Pattern recognition apparatus |
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5054074A (en) * | 1989-03-02 | 1991-10-01 | International Business Machines Corporation | Optimized speech recognition system and method |
US5033087A (en) * | 1989-03-14 | 1991-07-16 | International Business Machines Corp. | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system |
US4977598A (en) * | 1989-04-13 | 1990-12-11 | Texas Instruments Incorporated | Efficient pruning algorithm for hidden markov model speech recognition |
US5220639A (en) * | 1989-12-01 | 1993-06-15 | National Science Council | Mandarin speech input method for Chinese computers and a mandarin speech recognition machine |
US5271088A (en) * | 1991-05-13 | 1993-12-14 | Itt Corporation | Automated sorting of voice messages through speaker spotting |
US5212730A (en) * | 1991-07-01 | 1993-05-18 | Texas Instruments Incorporated | Voice recognition of proper names using text-derived recognition models |
-
1992
- 1992-12-11 US US07/989,285 patent/US5452397A/en not_active Expired - Lifetime
-
1993
- 1993-11-30 MY MYPI93002522A patent/MY115138A/en unknown
- 1993-12-10 JP JP31064093A patent/JP3388845B2/ja not_active Expired - Lifetime
- 1993-12-10 DE DE69317229T patent/DE69317229T2/de not_active Expired - Lifetime
- 1993-12-10 KR KR1019930027148A patent/KR100283736B1/ko not_active IP Right Cessation
- 1993-12-10 EP EP93309975A patent/EP0601876B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0601876B1 (de) | 1998-03-04 |
MY115138A (en) | 2003-04-30 |
EP0601876A1 (de) | 1994-06-15 |
KR940015969A (ko) | 1994-07-22 |
DE69317229D1 (de) | 1998-04-09 |
JPH06282291A (ja) | 1994-10-07 |
KR100283736B1 (ko) | 2001-03-02 |
JP3388845B2 (ja) | 2003-03-24 |
US5452397A (en) | 1995-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69317229T2 (de) | Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems | |
DE69919842T2 (de) | Sprachmodell basierend auf der spracherkennungshistorie | |
DE69525178T2 (de) | Ansagedienste mit spracheingabe | |
DE4397100C2 (de) | Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl | |
DE69514382T2 (de) | Spracherkennung | |
DE69226796T2 (de) | Zeitliche Dekorrelationsverfahren zur störsicheren Sprechererkennung | |
DE69324428T2 (de) | Verfahren zur Sprachformung und Gerät zur Spracherkennung | |
DE69032777T2 (de) | Spracherkennung unter Anwendung von Stichwörtern und Nichtstichwörter-Modellierung | |
DE3876207T2 (de) | Spracherkennungssystem unter verwendung von markov-modellen. | |
DE69622565T2 (de) | Verfahren und vorrichtung zur dynamischen anpassung eines spracherkennungssystems mit grossem wortschatz und zur verwendung von einschränkungen aus einer datenbank in einem spracherkennungssystem mit grossem wortschatz | |
DE3337353C2 (de) | Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells | |
DE68928097T2 (de) | Spracherkennungssystem | |
DE69420842T2 (de) | Spracherkennung unter anwendung einer zweidurchgängigen suchmethode | |
DE69923379T2 (de) | Nicht-interaktive Registrierung zur Spracherkennung | |
DE69324629T2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE69229816T2 (de) | Einrichtung und Verfahren für Sprachmusteridentifizierung | |
DE69827988T2 (de) | Sprachmodelle für die Spracherkennung | |
DE19847419A1 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung | |
DE60215272T2 (de) | Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen | |
DE69607913T2 (de) | Verfahren und vorrichtung zur spracherkennung auf der basis neuer wortmodelle | |
EP0836175B1 (de) | Verfahren und Anordnung zum Ableiten wenigstens einer Folge von Wörtern aus einem Sprachsignal | |
DE19944608A1 (de) | Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe | |
DE69719702T2 (de) | Ein automatisches Auskunftssystem welches ein heuristisches Modell zur Vorhersage der am wahrscheinlichsten erfragten Nummer verwendet | |
WO2006111230A1 (de) | Verfahren zur gezielten ermittlung eines vollständigen eingabedatensatzes in einem sprachdialogsystem | |
DE3786822T2 (de) | Spracherkennungssystem. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |