DE69317229T2

DE69317229T2 - Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems

Info

Publication number: DE69317229T2
Application number: DE69317229T
Authority: DE
Inventors: Abraham P Ittycheriah; Barbara J Wheatley
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1992-12-11
Filing date: 1993-12-10
Publication date: 1998-06-25
Anticipated expiration: 2013-12-11
Also published as: EP0601876B1; MY115138A; EP0601876A1; KR940015969A; DE69317229D1; JPH06282291A; KR100283736B1; JP3388845B2; US5452397A

Description

[Technisches Gebiet der Erfindung]

Die vorliegende Erfindung bezieht sich allgemein auf Spracherkennungssysteme und insbesondere auf ein Verfahren und ein System zum Verhindern der Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems.

[Hintergrund der Erfindung]

Sprecherabhängige Spracherkennungssysteme sind in den letzten Jahren zunehmend anspruchsvoll geworden. In der Tat stellt Texas Instruments ein TI-System 1500 bereit, das die Spracherkennung von Befehlen mit dem Ziel des Ausführens zahlreicher Funktionen gestattet. Ein wichtiges Merkmal eines Spracherkennungssystems wie des TI-Systems 1500 ist die Fähigkeit, allein durch einen Sprachbefehl einen Teilnehmer schnell anzuwählen oder einen schnellen Zugang zu diesem zu bekommen. Zum Beispiel kann eine Person dem Spracherkennungssystem einen Befehl erteilen und sagen "Rufe Bob Johnson an". Das Spracherkennungssystem wird dann mit einer Telephonnummer oder einer anderen Zugangsnummer, die einem gewissem Bob Johnson zugeordnet ist, auf eine zugeordnete vorprogrammierte Datenbank zugreifen. Das System wird dann sofort diese Nummer verwenden oder wählen.
Oft vergessen jedoch Personen, die solche sprecherabhängigen Spracherkennungssysteme zum Ausführen dieses Typs von Sprachwahl oder "Namenverzeichniswahl" verwenden, wen sie in ihrer Vokabularliste haben. Beim Vergessen wird ein Anwender eine Phrase einzutragen versuchen, die mit einer bereits auf der Vokabularliste existierenden Phrase übereinstimmt oder zu einer solchen verwirrend ähnlich ist. Versucht z. B. eine Person, ihrer Vokabularliste die Phrase "Bob Johnson" hinzuzufügen, kann dies zu einer offensichtlichen Fehlfunktion des Systems führen, wenn jene Phrase bereits existiert. Bei der späteren Suche nach Bob Johnson, um diesen anzurufen, wird der Anwender oder Teilnehmer den Befehl "Rufe Bob Johnson an" erteilen, jedoch kann das System, um den Anruf abzugeben, nur eine von zwei Telephonnummern verwenden. Damit kann der Anwender nicht richtig steuern, welche Nummer das System anrufen wird. Darüber hinaus kann es zu einem ähnlichen Systemfehler kommen, wenn die Person zu der Liste die Phrase "Bob Johnston" hinzufügt, wenn ein verwirrend ähnlicher "Bob Johnson" bereits existiert. In beiden Fällen wird es offensichtlich zu einer Systemfehlfunktion kommen. Es ist jedoch wichtig zu wissen, daß die Fehler, die aus dem Zuordnen mehr als einer Telephonnummer zu einer einzelnen Phrase oder einer verwirrend ähnlichen Phrase in einer Vokabularliste resultieren, nicht von einer schlechten Systemleistung herrühren. Statt dessen rühren die Fehler von einem falschen Gebrauch des Spracherkennungssystems her.
Ähnliche Probleme existieren bei der Eintragung allgemeiner sprecherabhängiger Befehle in sprecherabhängigen Spracherkennungssystemen.
Es besteht deshalb ein Bedarf an einem Verfahren und einem System, die das Hinzufügen bereits existierender und verwirrend ähnlicher Phrasen zu einer Vokabularliste für ein sprecherabhängiges Spracherkennungssystem verhindern.
Es besteht ein Bedarf an einem System, das Vokabularlistenfunktionen für ein sprecherabhängiges Spracherkennungssystem optimiert, indem es Hinzufügungen zu der Vokabularliste, die ein fehlerhaftes Erkennen des Systems bewirken, verhindert.
Überdies ist ein Bedarf an einem verbesserten Spracherkennungssystem entstanden, das die Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste verhindert.
Die europäische Patentanmeldung EP 241 163 offenbart ein sprecherabhängiges Spracherkennungssystem, das das Einsetzen eines neuen Wortes in das Systemvokabular verhindert, wenn der Abstand zwischen den Merkmalen des neuen Wortes und den Merkmalen irgendeines bereits in dem Vokabular befindlichen Wortes kleiner als ein vorbestimmter Schwellenwert ist.

[ZUSAMMENFASSUNG DER ERFINDUNG]

Die vorliegende Erfindung schafft dementsprechend ein Verfahren und ein System, die die Eintragung bereits vorhandener oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindern und die die mit den vorhandenen Verfahren des Aufbaus von Einträgen für Spracherkennungssystene verbundenen Nachteile und Beschränkungen überwinden oder vermindern.
Ein Aspekt der vorliegenden Erfindung ist ein Verfahren, das die Eintragung bereits existierender oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindert, mit den Schritten zunächst des Empfangens einer Phrase, die zu der Vokabularliste hinzuzufügen oder in diese einzutragen ist. Der nächste Schritt besteht in dem Zuweisen einer ersten Wahrscheinlichkeit an alle anderen auf der Vokabularliste existierenden Phrasen und einer zweiten, jedoch geringeren Wahrscheinlichkeit an die erstempfangene Phrase. Im nächsten Schritt hat der Anwender die einzutragende Phrase zu wiederholen. Das Spracherkennungssystem vergleicht dann die wiederholte Phrase mit der gesamten Vokabularliste, die nun die Phrase, wie sie zuerst empfangen wurde, enthält. Der nächste Schritt besteht darin, dem Anwender anzuzeigen, ob die wiederholte Phrase mit einer anderen als der erstempfangenen Phrase auf der Vokabularliste übereinstimmt. Überdies enthält das Verfahren den Schritt, das Hinzufügen der Phrase in dem Fall zu verhindern, daß die wiederholte Phrase auf der gesamten Vokabularliste mit einer anderen als der erstempfangenen Phrase übereinstimmt.
Ein technischer Vorteil der vorliegenden Erfindung besteht darin, daß sie zum Herausfinden der Unterschiede zwischen den verwirrend ähnlichen Phrasen, die ein Anwender zu der Vokabularliste hinzuzufügen versuchen könnte, die gleichen Spracherkennungsalgorithmen verwendet, die in einem sprecherabhängigen Spracherkennungssystem existieren. Dies gewährleistet, daß minimale zusätzliche Kosten nötig sind, um die vorliegende Erfindung auszuführen. Gleichzeitig und in kritischen Fällen vermag die vorliegende Erfindung den Betrieb sprecherabhängiger Spracherkennungssysteme wesentlich zu verbessern.
Ein weiterer technischer Vorteil der vorliegenden Erfindung besteht darin, daß die vorliegende Erfindung dem Anwender das sofortige Modifizieren seiner Eingabe ermöglicht, indem sie ihn auf die verwirrend ähnliche Phrase aufmerksam macht, um so ein Hinzufügen der verwirrend ähnlichen Phrase zu der Vokabularliste zu verhindern.

[Kurzbeschreibung der Zeichnung]

Die Erfindung und ihre Anwendungsweisen und Vorteile werden am besten mit Bezug auf die folgende Beschreibung erläuternder Ausführungsformen verständlich, die im Zusammenhang mit der sie begleitenden Zeichnung zu lesen sind, worin:
Fig. 1 konzeptuell eine beispielhafte Vokabularliste eines sprecherabhängigen Spracherkennungssystems zeigt;
Fig. 2 einen Ablaufplan der Schritte und des Datenflusses des Eintragungsprozesses gemäß der bevorzugten Ausführungsform bereitstellt;
Fig. 3 einen Ablaufplan des Vokabularlisten-Aktualisierungsprozesses gemäß der bevorzugten Ausführungsform zeigt;
Fig. 4 anhand eines Ablaufplans den Prozeß der Erzeugung der Aktualisierungsgrammatik gemäß der bevorzugten Ausführungsform zeigt, und
Fig. 5 eine konzeptuelle Erläuterung einer für die Zwecke der vorliegenden Erfindung modifizierten Vokabularliste ist.

[Ausführliche Beschreibung der Erfindung]

Die bevorzugte Ausführungsform der vorliegenden Erfindung läßt sich am besten unter Bezug auf die Zeichnung verstehen, worin für gleiche und einander entsprechende Teile der verschiedenen Zeichnungen gleiche Bezugszeichen verwendet werden.
Fig. 1 zeigt konzeptuell eine beispielhafte Liste 10 von Phrasen, die eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems zur Verwendung mit der bevorzugten Ausführungsform bilden. Die Vokabularliste 10 aus Fig. 1 kann z. B. eine Namenliste für eine Namenverzeichniswahl für ein sprachaktiviertes Schnellwahlsystem sein. Ein Spracherkennungssystem, das die bevorzugte Ausführungsform der vorliegenden Erfindung verwenden kann, ist ein Texas Instruments- System 1500, das mit einem Spracherkennungs-Anwendungssystem mit der Phrase HG arbeitet. Obgleich dieses System zur Ausführung der erfinderischen Konzepte der vorliegenden Erfindung weitgehend von Software und Algorithmen abhängt, kann die Funktion der vorliegenden Erfindung ähnlich durch eine Schaltungsanordnung und Bauelemente ausgeführt werden. Die vorliegende Erfindung beabsichtigt deshalb zum Ausführen dieser Funktionen klar die Verwendung einer Schaltungsanordnung.
Die Vokabularliste 10 aus Fig. 1 enthält Phrasen wie "Phrase 1" an der durch das Bezugszeichen 12 bezeichneten Stelle, "Phrase 2" an der mit 14 bezeichneten Stelle usw. bis hinab zu "Phrase N" an der Stelle des Bezugszeichens 16. Ein Ziel eines sprecherabhängigen Spracherkennungssystems besteht darin, einem Anwender das Hinzufügen von Phrasen zu der Vokabularliste 10 zu gestatten und dann jene Phrasen für Befehle und zur Steuerung aufzurufen. Zum Beispiel kann ein Anwender, der das Spracherkennungssystem verwendet, sagen "rufe Phrase 1 an", worauf das System den Sprachbefehl erkennt und die Person oder den Ort, die mit "Phrase 1" verknüpft sind, anruft.
Häufig könnten Anwender der sprecherabhängigen Spracherkennungssysteme vergessen, welche Wörter auf ihrer Vokabularliste stehen. Wenn ein Anwender eine Phrase vergessen hat, könnte er manchmal versuchen, eine Phrase erneut einzutragen, oder er könnte ohne Rücksicht auf zuvor eingetragene Phrasen versuchen, eine Phrase einzutragen, die einer existierenden Phrase ähnelt. Tritt z. B. einer dieser Fälle auf, kann die Vokabularliste 10 Phrasen enthalten, welche nicht auf der Vokabularliste sein sollten. Dies führt zu Verwirrung und kann den Wert oder den Nutzen der Vokabularliste 10 schmälern. Um diese Probleme zu vermeiden, schafft die bevorzugte Ausführungsform der vorliegenden Erfindung ein Verfahren und ein System, die verhindern, daß auf der Vokabularliste 10 verwirrend ähnliche Phrasen existieren.
Fig. 2 zeigt den Prozeßablauf des Eintragungsprozesses 20 der bevorzugten Ausführungsform. Der Anwender oder Teilnehmer wird den Eintragungsprozeß wie durch den Block 22 gezeigt beginnen. Dies kann dadurch geschehen, daß an die sprecherabhängige Spracherkennungseintragung ein Befehl wie "überprüfe die Liste" gerichtet wird. Das System wird dann z. B. den Anwender in Schritt 24 durch den Befehl "sagen Sie die Schnellwahlphrase" auffordern. Die Ernpfangsschaltungsanordnung der Spracherkennung wird dann die hinzuzufügende Phrase empfangen. Als nächstes führt das Spracherkennungssystem z. B. einen als "Hidden Markov Modeling"-Eintragung (HMN- Eintragung) bekannten Prozeß aus, der zum Identifizieren der Endpunkte der Rede einen energiebasierten Endezeigeprozeß oder eine andere geeignete Technik verwendet. Dies geschieht im Schritt 26. Ein Beispiel des HMM-Prozesses, den die bevorzugte Ausführungsform ausführt, findet sich bei J. Picone, Continuous Speech Recognition Using Hidden Markov Models, Speech and Image Understanding Laboratory, Texas Instruments, Inc., 7. Mai 1990 (Nachdruck aus dem IEEE ASSP-Magazin). Wie der Block 28 zeigt, bestehen die nächsten Schritte darin, unter Verwendung der HMM-Technik ein HMM-Modell zu erzeugen und zu der Teilnehmerschablone Akustikvektoren hinzuzufügen. Sobald der Eintragungsprozeß 20 abgeschlossen ist, besteht der nächste Schritt in der Aktualisierung der Vokabularliste 10.
Fig. 3 zeigt den Aktualisierungsprozeß 30 der bevorzugten Ausführungsform Beginnend bei Block 32 besteht der erste Schritt darin, daß das Spracherkennungssystem dem Teilnehmer anzeigt, daß es die Vokabularliste 10 aktualisiert. Dann fordert das Spracherkennungssystem den Teilnehmer auf, die Phrase zu wiederholen. Das Spracherkennungssystem kann z. B. wie in Block 34 gezeigt den Befehl "sagen Sie den Schnellwahlnamen noch einmal" verwenden. Als nächstes führt das Spracherkennungssystem den HMM-Algorithmus aus, um auf der Grundlage der in einer mit dem Spracherkennungssystem in Block 36 verknüpften Datenbank geladenen Modelle nach der besten Phrase zu suchen. Dies ist ein Vergleichsschritt, der identifiziert, ob sich auf der Vokabularliste 10 die gleiche oder eine verwirrend ähnliche Phrase befindet. Das Spracherkennungssystem gibt dann das beste Modell (d. h. die beste Phrase) und eine mit dem Modell verknüpfte Punktzahl zurück. Bei Block 38 fragt das Verfahren der bevorzugten Ausführungsform ab, ob die zurückgegebene Phrase die gleiche ist wie die, die der Teilnehmer einzutragen versucht. Ist dies der Fall, teilt das Spracherkennungssystem dem Teilnehmer diese Informationen, wie Block 40 zeigt, als einen "Erfolg" mit.
Das Spracherkennungssystem wird dann die Phrase in der Vokabularliste 10 halten. Ist dies nicht der Fall, unterrichtet das System den Teilnehmer, wie Block 42 zeigt, darüber, daß die Phrase, die er einzugeben versucht, einer anderen Phrase auf der Vokabularliste 10 zu ähnlich ist. Zu diesem Zeitpunkt besteht das Verfahren darin, dem Teilnehmer die auf der Vokabularliste 10 befindliche verwirrend ähnliche Phrase abzuspielen und dann Anweisungen anzufordern. Die bevorzugte Ausführungsform scheidet die Phrase deshalb von dem Eintragungsprozeß aus.
Ein Schlüsselprozeß der bevorzugten Ausführungsform ist die Erzeugung von Modellen, die akustische Modelle aller Phrasen auf der Schablone sind. Fig. 4 zeigt den Prozeß 50, durch den akustische Modelle für alle Phrasen auf der Vokabularliste 10 erstellt werden. Beginnend bei Block 52 aktualisiert das Spracherkennungssystem die Grammatikerzeugung. Dann erzeugt das System für jede Phrase auf der Vokabularliste 10 ein akustisches HMM-Modell für die Phrase zur Eintragung in Block 54. Der nächste Schritt besteht darin, in Block 56 dem Modell für die Phrase, die momentan in die Vokabularliste 10 eingetragen wird, eine durch die Variable "PROB" bezeichnete Wahrscheinlichkeit zuzuordnen. In Block 56 wird auch allen Phrasen, die verbleiben, eine Wahrscheinlichkeit 1 zugeordnet. Der Wert des Wahrscheinlichkeitsparameters PROB ist so gewählt, daß er die Unterdrückung ähnlicher Phrasen maximiert und gleichzeitig die Wahrscheinlichkeit, daß die Phrasenausgabe tatsächlich verschieden von der ist, die eingetragen wird, minimiert.
Das Ergebnis des obigen Eintragungsprozesses 20, des Aktualisierungsprozesses 30 und des Prozesses 50 der Erzeugung einer aktualisierten Grammatik ist eine modifizierte Vokabularliste, die die Ziele der bevorzugten Ausführungsform schafft. Fig. 5 zeigt konzeptuell eine Vokabularliste, die durch den Prozeß der bevorzugten Ausführungsform modifiziert wurde.
Insbesondere wurde in die modifizierte Vokabularliste zusammen mit der "PHRASE 1" an der Stelle 12, der "PHRASE 2" an der Stelle 14 bis hin zu "PHRASE N" an der Stelle 16 die "PHRASE i" eingetragen. Die Spalte 62 zeigt die für jedes der Modelle auf der Vokabularliste 10 zugeordnete Wahrscheinlichkeit. Zum Beispiel haben "PHRASE 1", "PHRASE 2" und "PHRASE N" alle einen Wahrscheinlichkeitswert 1,0. Bei der "PHRASE i" wird der Stelle 60 die Wahrscheinlichkeitsvariable PROB mit einem Wert kleiner als 1,0 zugeordnet. Dies gibt der "PHRASE i" die zur Unterstützung der von der bevorzugten Ausführungsform ausgeführten Unterdrückung notwendige Wahrscheinlichkeit.

BETRIEB

Obgleich das obenbeschriebene Verfahren und das obenbeschriebene System den Betrieb der vorliegenden Erfindung klar machen, hilft die folgende Diskussion, den Betrieb noch deutlicher zu machen. Das folgende Beispiel zeigt deshalb den Betrieb der bevorzugten Ausführungsform. Es wird z. B. angenommen, daß ein Anwender beschließt, zu der Vokabularliste 10 die Phrase "Bob Johnston" hinzuzufügen. Um die Eintragung zu beginnen, kann der Anwender dann an das Spracherkennungssystem den Befehl "überprüfe die Liste" übergeben. Bei Schritt 24 aus Fig. 2 wird das System den Anwender mit den Wörtern "sagen Sie die Schnellwahlphrase" auffordern. Als nächstes wird der Anwender "Bob Johnston" sagen. Die bevorzugte Ausführungsform wird dann die Phrase "Bob Johnston" eintragen und gemäß der Schritte 26 und 28 aus Fig. 2 ein HMM-Modell "Bob Johnston" erzeugen.
Unmittelbar danach wird das System die Vokabularliste 10 aktualisieren und den Anwender auffordern: "sagen Sie die Schnellwahlphrase noch einmal" (siehe Fig. 3). Sobald der Anwender die Phrase "Bob Johnston" noch einmal sagt, wird der HMM-Algorithmus versuchen nachzusehen, ob es auf der Vokabularliste 10 eine Übereinstimmung mit der Phrase "Bob Johnston" gibt. Bevor dies jedoch durch das Verfahren der bevorzugten Ausführungsform geschieht, wird allen Phrasen auf der Vokabularliste 10 außer der Phrase "Bob Johnston" die Wahrscheinlichkeit 1,0 zugeordnet (siehe Fig. 4). Der Phrase "Bob Johnston" wird z. B. eine Wahrscheinlichkeit von 0,8 (d. h. eine geringere Wahrscheinlichkeit als allen anderen Phrasen auf der Vokabularliste 10) zugeordnet.
Nun wird z. B. angenommen, daß es auf der Vokabularliste 10 die Phrase "Bob Johnsom" gibt. Da die Wahrscheinlichkeit einer Übereinstimmung zwischen nochmals gesagtem "Bob Johnston" und "Bob Johnson" 1,0 beträgt, während die Wahrscheinlichkeit für "Bob Johnston" 0,8 ist, wird das System dem Anwender in diesem Fall mit einer höheren Wahrscheinlichkeit eine Übereinstimmung mit der Phrase "Bob Johnson" zurückgeben. An dieser Stelle wird die bevorzugte Ausführungsform eine Überprüfung durchführen, ob es eine Übereinstimmung zwischen der ein zweites Mal gesagten Phrase und der erstempfangenen Phrase (d. h. der Phrase mit der niedrigeren zugeordneten Wahrscheinlichkeit) gibt. In diesem Beispiel ist dies nicht der Fall. Der Anwender wird deshalb davon in Kenntnis gesetzt, daß die einzutragende Phrase einer anderen Phrase auf der Liste zu ähnlich ist. Das System wird dann dem Anwender einen Befehl der Art "sie versuchen, die Phrase Bob Johnston einzugeben, während die Phrase Bob Johnson bereits in der Datenbank existiert. Bitte wählen Sie eine andere Phrase." abspielen. Statt dieser können dem Anwender andere, ähnliche Anweisungen bereitgestellt werden. Im wesentlichen wird der Betrieb der bevorzugten Ausführungsform jedoch einen fehlerfreieren Gebrauch der Vokabularliste 10 in einen sprecherabhängigen Sprachverarbeitungssystem gestatten.
Wenn ein Anwender in anderen Phasen versucht, zu der Vokabularliste eine verwirrend ähnliche Phrase hinzuzufügen, besteht der erste auszuführende Schritt darin, im Lernprozeß eine Aktualisierung vorzunehmen. Diese Aktualisierung beginnt mit einer Eintragung, durch die ein Modell der hinzugefügten Phrase erzeugt wird. Der nächste Schritt besteht darin, den Anwender die Phrase wiederholen zu lassen und zu versuchen, die erste Phrase mit der zweiten zu überlagern oder sie zu aktualisieren, um ein besseres Modell zu erzeugen. In einem Versuch, ein besseres Modell zu erstellen, wird traditionell allen Phrasen eine gleiche Wahrscheinlichkeit zugeordnet oder, was ähnlich ist, das einzelne Modell unabhängig davon, welche anderen Phrasen sich auf der Liste befinden, aktualisiert. Statt dessen wertet die bevorzugte Ausführungsform die wiederholte Phrase aus und ordnet bei der Aktualisierung allen Phrasen Wahrscheinlichkeiten zu, so daß das System alle anderen Phrasen gegenüber der Phrase, die der Anwender zu der Vokabularliste hinzuzufügen versucht, bevorzugt. Dadurch, daß allen anderen Phrasen eine höhere Wahrscheinlichkeit als der erstgesprochenen Phrase zugeordnet wurde, werden ähnlich klingende Phrasen gegenüber der erstgesprochenen Phrase oder der Phrase, die der Anwender einzugeben wünscht, ausgewählt. Die bevorzugte Ausführungsform testet daher die einzugebende Phrase gegenüber allen anderen derzeit auf der Vokabularliste vorhandenen Phrasen. Dies geschieht durch ein künstliches Verringern der Wahrscheinlichkeit dafür, daß das System die zweitgesprochene Phrase als die erstgesprochene erkennt. Dieser gesamte Vergleichsprozeß wird durch die Spracherkennungs-Systemsoftware wie die in dem Spracherkennungssystem Texas Instruments-System 1500 verwendete HG-Systemsoftware ausgeführt.
Ein alternatives Verfahren enthält die Schritte des Ausführens des Erkennungsalgorithmus mit den Eintragungsdaten unter Verwendung der Sprachmodelle aller Phrasen bis auf die eine, die dem System neu hinzugefügt werden soll. In dieser Situation wird der Erkenner typischerweise die beste Übereinstimmung unter den verbleibenden Modellen suchen. Das alternative Verfahren nutzt dann eine Entscheidungsregel, die auf der Punktzahl bei der falschen Übereinstimmung und der in dem richtigen Modell erhaltenen Punktzahl beruht, um zu entscheiden, ob es die neue Phrase in die Vokabularliste 10 aufnehmen soll. Das alternative Verfahren fügt die neue Phrase dann hinzu, wenn die Differenz zwischen der Punktzahl für die falsche Übereinstimmung und der Punktzahl für die richtige Übereinstimmung unterhalb einer vorbestimmten Schwelle liegt. Das Spracherkennungssystem wird dann den Anwender darüber informieren, daß die Phrase zum Hinzufügen übernommen wurde oder auch nicht.
Obgleich die vorliegende Erfindung ausführlich beschrieben wurde, können selbstverständlich verschiedene Veränderungen, Ersetzungen und Abwandlungen hierzu vorgenommen werden, ohne vom Umfang der durch die beigefügten Ansprüche definierten Erfindung abzuweichen.

Claims

1. Verfahren zum Verhindern der Eintragung von bereits vorhandenen oder verwirrend ähnlichen Phrasen in eine Vokabularliste (10) eines sprecherabhängigen Spracherkennungssystems, mit den folgenden Schritten:

zunächst Empfangen einer erstempfangenen Phrase (60), die von einem Anwender ausgesprochen wird, um sie zu mehreren anderen Phrasen (12, 14, 16) in einer Vokabularliste hinzuzufügen;

Eintragen der Phrase in die Vokabularliste;

Zuweisen einer ersten Wahrscheinlichkeit an die Phrase (60) und einer zweiten Wahrscheinlichkeit an jede der mehreren anderen Phrasen (12, 14, 16), wobei die zweite Wahrscheinlichkeit einen höheren Wert als die erste Wahrscheinlichkeit besitzt;

Empfangen einer zweitempfangenen Phrase, wobei die zweitempfangene Phrase die gleiche Phrase ist, die vom Anwender zu einem zweiten Zeitpunkt ausgesprochen wird, wobei die erste Wahrscheinlichkeit und die zweite Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das sprecherabhängige Spracherkennungssystem die zweitempfangene Phrase mit der erstempfangenen Phrase (60) oder mit einer der mehreren anderen Phrasen (12, 14, 16) in der Vokabularliste zur Übereinstimmung bringt;

Vergleichen der zweitempfangenen Phrase mit der Vokabularliste, die die erstempfangene Phrase (60) und die mehreren anderen Phrasen (12, 14, 16) enthält;

Ausgeben eines Hinweises an den Benutzer, ob die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt; und

Zurückweisen der Eintragung der erstempfangenen Phrase (60) in die Vokabularliste, falls die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt.

2. Verfahren nach Anspruch 1, bei dem der Vergleichsschritt unter Verwendung eines "Hidden Markov Modeling"-Prozesses ausgeführt wird.

3. Verfahren nach Anspruch 1, ferner mit dem Schritt des Beibehaltens der erstempfangenen Phrase in der Vokabularliste, falls der Vergleichsschritt eine Übereinstimmung zwischen der zweitempfangenen Phrase und der erstempfangenen Phrase ergibt.

4. Verfahren nach Anspruch 1, bei dem die erste Wahrscheinlichkeit die Unterscheidung von Ähnlichkeiten zwischen der zweitempfangenen Phrase und jeder der mehreren anderen Phrasen maximal macht und die Wahrscheinlichkeit, daß das Spracherkennungssystem die zweitempfangene Phrase mit einer von der erstempfangenen Phrase verschiedenen Phrase zur Übereinstimmung bringt, minimal macht.

5. Verfahren nach Anspruch 1, bei dem der Hinweisschritt den Schritt des Abspielens einer Nachricht enthält, die angibt, daß die erstempfangene Phrase wenigstens einer der mehreren anderen Phrasen zu ähnlich ist.

6. Verfahren nach Anspruch 1, bei dem die zweite Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.

7. Verfahren nach Anspruch 1, bei dem der Eintragungsschritt den Schritt des Eintragens der Phrase unter Verwendung eines energiebasierten Endezeigeprozesses enthält.

8. System zum Verhindern der Eintragung von bereits vorhandenen oder verwirrend ähnlichen Phrasen in eine Vokabularliste (10) eines sprecherabhängigen Spracherkennungssystems, mit:

einer Empfangsschaltungsanordnung, die dem sprecherabhängigen Spracherkennungssystem zugeordnet ist, um zunächst eine erstempfangene Phrase (60), die von einem Anwender ausgesprochen wird, zu empfangen, um sie zu mehreren anderen Phrasen (12, 14, 16) in einer Vokabularliste hinzuzufügen;

einem Eintragungsmechanismus zum Eintragen der Phrase in die Vokabularliste;

einem Zuweisungsalgorithmus zum Zuweisen einer ersten Wahrscheinlichkeit an die Phrase (60) und einer zweiten Wahrscheinlichkeit an jede der mehreren anderen Phrasen (12, 14, 16), wobei die zweite Wahrscheinlichkeit einen größeren Wert als die erste Wahrscheinlichkeit besitzt;

wobei die Empfangsschaltungsanordnung ferner eine zweitempfangene Phrase empfängt, wobei die zweitempfangene Phrase gleich der ersten Phrase ist und von Anwender zu einem zweiten Zeitpunkt ausgesprochen wird, wobei die erste Wahrscheinlichkeit und die zweite Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das Spracherkennungssystem die zweitempfangene Phrase mit der erstempfangenen Phrase (60) oder mit einer der mehreren anderen Phrasen (12, 14, 16) in der Vokabularliste zur Übereinstimmung bringt;

einer Vergleichsschaltungsanordnung zum Vergleichen der zweitempfangenen Phrase mit der Vokabularliste, die die erstempfangene Phrase (60) und die mehreren weiteren Phrasen (12, 14, 16) enthält;

einer Kommunikationsschaltungsanordnung, die dem Anwender mitteilt, ob die zweitempfangene Phrase mit einer der mehreren weiteren Phrasen (12, 14, 16) übereinstimmt; und

einer Zurückweisungsschaltungsanordnung zum Zurückweisen der Eintragung der erstempfangenen Phrase (60) in die Vokabularliste, falls die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt.

9. System nach Anspruch 8, bei dem die Vergleichsschaltungsanordnung ferner eine Schaltungsanordnung zum Ausführen des Vergleichs unter Verwendung eines "Hidden Markov Modeling"-Prozesses enthält.

10. System nach Anspruch 8, ferner mit einer Halteschaltungsanordnung zum Halten der erstempfangenen Phrase in der Vokabularliste, falls die Vergleichsschaltungsanordnung eine Übereinstimmung zwischen der zweitempfangenen Phrase und der erstempfangenen Phrase feststellt.

11. System nach Anspruch 8, bei dem die erste Wahrscheinlichkeit die Unterscheidung von Ahnlichkeiten zwischen der zweitempfangenen Phrase und jeder der mehreren anderen Phrasen maximal macht und die Wahrscheinlichkeit, daß das Spracherkennungssystem die Phrase mit einer von der erstempfangenen Phrase verschiedenen Phrase zur Übereinstimmung bringt, minimal macht.

12. System nach Anspruch 8, bei dem die Kommunikationsschaltungsanordnung ferner eine Abspielschaltungsanordnung enthält, die eine Nachricht abspielt, die angibt, daß die erstempfangene Phrase wenigstens einer der mehreren weiteren Phrasen zu ähnlich ist.

13. System nach Anspruch 8, bei dem die zweite Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.

14. System nach Anspruch 8, bei dem der Eintragungsmechanismus einen Mechanismus zum Eintragen der Phrase unter Verwendung eines energiebasierten Endezeigeprozesses einträgt.

15. Verbessertes sprecherabhängiges Spracherkennungssystem, das ein System nach irgendeinem der Ansprüche 8 bis 14 enthält.