[go: up one dir, main page]

DE69317229T2 - Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems - Google Patents

Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems

Info

Publication number
DE69317229T2
DE69317229T2 DE69317229T DE69317229T DE69317229T2 DE 69317229 T2 DE69317229 T2 DE 69317229T2 DE 69317229 T DE69317229 T DE 69317229T DE 69317229 T DE69317229 T DE 69317229T DE 69317229 T2 DE69317229 T2 DE 69317229T2
Authority
DE
Germany
Prior art keywords
phrase
probability
phrases
received
received phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69317229T
Other languages
English (en)
Other versions
DE69317229D1 (de
Inventor
Abraham P Ittycheriah
Barbara J Wheatley
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Application granted granted Critical
Publication of DE69317229D1 publication Critical patent/DE69317229D1/de
Publication of DE69317229T2 publication Critical patent/DE69317229T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

    [Technisches Gebiet der Erfindung]
  • Die vorliegende Erfindung bezieht sich allgemein auf Spracherkennungssysteme und insbesondere auf ein Verfahren und ein System zum Verhindern der Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems.
  • [Hintergrund der Erfindung]
  • Sprecherabhängige Spracherkennungssysteme sind in den letzten Jahren zunehmend anspruchsvoll geworden. In der Tat stellt Texas Instruments ein TI-System 1500 bereit, das die Spracherkennung von Befehlen mit dem Ziel des Ausführens zahlreicher Funktionen gestattet. Ein wichtiges Merkmal eines Spracherkennungssystems wie des TI-Systems 1500 ist die Fähigkeit, allein durch einen Sprachbefehl einen Teilnehmer schnell anzuwählen oder einen schnellen Zugang zu diesem zu bekommen. Zum Beispiel kann eine Person dem Spracherkennungssystem einen Befehl erteilen und sagen "Rufe Bob Johnson an". Das Spracherkennungssystem wird dann mit einer Telephonnummer oder einer anderen Zugangsnummer, die einem gewissem Bob Johnson zugeordnet ist, auf eine zugeordnete vorprogrammierte Datenbank zugreifen. Das System wird dann sofort diese Nummer verwenden oder wählen.
  • Oft vergessen jedoch Personen, die solche sprecherabhängigen Spracherkennungssysteme zum Ausführen dieses Typs von Sprachwahl oder "Namenverzeichniswahl" verwenden, wen sie in ihrer Vokabularliste haben. Beim Vergessen wird ein Anwender eine Phrase einzutragen versuchen, die mit einer bereits auf der Vokabularliste existierenden Phrase übereinstimmt oder zu einer solchen verwirrend ähnlich ist. Versucht z. B. eine Person, ihrer Vokabularliste die Phrase "Bob Johnson" hinzuzufügen, kann dies zu einer offensichtlichen Fehlfunktion des Systems führen, wenn jene Phrase bereits existiert. Bei der späteren Suche nach Bob Johnson, um diesen anzurufen, wird der Anwender oder Teilnehmer den Befehl "Rufe Bob Johnson an" erteilen, jedoch kann das System, um den Anruf abzugeben, nur eine von zwei Telephonnummern verwenden. Damit kann der Anwender nicht richtig steuern, welche Nummer das System anrufen wird. Darüber hinaus kann es zu einem ähnlichen Systemfehler kommen, wenn die Person zu der Liste die Phrase "Bob Johnston" hinzufügt, wenn ein verwirrend ähnlicher "Bob Johnson" bereits existiert. In beiden Fällen wird es offensichtlich zu einer Systemfehlfunktion kommen. Es ist jedoch wichtig zu wissen, daß die Fehler, die aus dem Zuordnen mehr als einer Telephonnummer zu einer einzelnen Phrase oder einer verwirrend ähnlichen Phrase in einer Vokabularliste resultieren, nicht von einer schlechten Systemleistung herrühren. Statt dessen rühren die Fehler von einem falschen Gebrauch des Spracherkennungssystems her.
  • Ähnliche Probleme existieren bei der Eintragung allgemeiner sprecherabhängiger Befehle in sprecherabhängigen Spracherkennungssystemen.
  • Es besteht deshalb ein Bedarf an einem Verfahren und einem System, die das Hinzufügen bereits existierender und verwirrend ähnlicher Phrasen zu einer Vokabularliste für ein sprecherabhängiges Spracherkennungssystem verhindern.
  • Es besteht ein Bedarf an einem System, das Vokabularlistenfunktionen für ein sprecherabhängiges Spracherkennungssystem optimiert, indem es Hinzufügungen zu der Vokabularliste, die ein fehlerhaftes Erkennen des Systems bewirken, verhindert.
  • Überdies ist ein Bedarf an einem verbesserten Spracherkennungssystem entstanden, das die Eintragung verwirrend ähnlicher Phrasen in eine Vokabularliste verhindert.
  • Die europäische Patentanmeldung EP 241 163 offenbart ein sprecherabhängiges Spracherkennungssystem, das das Einsetzen eines neuen Wortes in das Systemvokabular verhindert, wenn der Abstand zwischen den Merkmalen des neuen Wortes und den Merkmalen irgendeines bereits in dem Vokabular befindlichen Wortes kleiner als ein vorbestimmter Schwellenwert ist.
  • [ZUSAMMENFASSUNG DER ERFINDUNG]
  • Die vorliegende Erfindung schafft dementsprechend ein Verfahren und ein System, die die Eintragung bereits vorhandener oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindern und die die mit den vorhandenen Verfahren des Aufbaus von Einträgen für Spracherkennungssystene verbundenen Nachteile und Beschränkungen überwinden oder vermindern.
  • Ein Aspekt der vorliegenden Erfindung ist ein Verfahren, das die Eintragung bereits existierender oder verwirrend ähnlicher Phrasen in eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems verhindert, mit den Schritten zunächst des Empfangens einer Phrase, die zu der Vokabularliste hinzuzufügen oder in diese einzutragen ist. Der nächste Schritt besteht in dem Zuweisen einer ersten Wahrscheinlichkeit an alle anderen auf der Vokabularliste existierenden Phrasen und einer zweiten, jedoch geringeren Wahrscheinlichkeit an die erstempfangene Phrase. Im nächsten Schritt hat der Anwender die einzutragende Phrase zu wiederholen. Das Spracherkennungssystem vergleicht dann die wiederholte Phrase mit der gesamten Vokabularliste, die nun die Phrase, wie sie zuerst empfangen wurde, enthält. Der nächste Schritt besteht darin, dem Anwender anzuzeigen, ob die wiederholte Phrase mit einer anderen als der erstempfangenen Phrase auf der Vokabularliste übereinstimmt. Überdies enthält das Verfahren den Schritt, das Hinzufügen der Phrase in dem Fall zu verhindern, daß die wiederholte Phrase auf der gesamten Vokabularliste mit einer anderen als der erstempfangenen Phrase übereinstimmt.
  • Ein technischer Vorteil der vorliegenden Erfindung besteht darin, daß sie zum Herausfinden der Unterschiede zwischen den verwirrend ähnlichen Phrasen, die ein Anwender zu der Vokabularliste hinzuzufügen versuchen könnte, die gleichen Spracherkennungsalgorithmen verwendet, die in einem sprecherabhängigen Spracherkennungssystem existieren. Dies gewährleistet, daß minimale zusätzliche Kosten nötig sind, um die vorliegende Erfindung auszuführen. Gleichzeitig und in kritischen Fällen vermag die vorliegende Erfindung den Betrieb sprecherabhängiger Spracherkennungssysteme wesentlich zu verbessern.
  • Ein weiterer technischer Vorteil der vorliegenden Erfindung besteht darin, daß die vorliegende Erfindung dem Anwender das sofortige Modifizieren seiner Eingabe ermöglicht, indem sie ihn auf die verwirrend ähnliche Phrase aufmerksam macht, um so ein Hinzufügen der verwirrend ähnlichen Phrase zu der Vokabularliste zu verhindern.
  • [Kurzbeschreibung der Zeichnung]
  • Die Erfindung und ihre Anwendungsweisen und Vorteile werden am besten mit Bezug auf die folgende Beschreibung erläuternder Ausführungsformen verständlich, die im Zusammenhang mit der sie begleitenden Zeichnung zu lesen sind, worin:
  • Fig. 1 konzeptuell eine beispielhafte Vokabularliste eines sprecherabhängigen Spracherkennungssystems zeigt;
  • Fig. 2 einen Ablaufplan der Schritte und des Datenflusses des Eintragungsprozesses gemäß der bevorzugten Ausführungsform bereitstellt;
  • Fig. 3 einen Ablaufplan des Vokabularlisten-Aktualisierungsprozesses gemäß der bevorzugten Ausführungsform zeigt;
  • Fig. 4 anhand eines Ablaufplans den Prozeß der Erzeugung der Aktualisierungsgrammatik gemäß der bevorzugten Ausführungsform zeigt, und
  • Fig. 5 eine konzeptuelle Erläuterung einer für die Zwecke der vorliegenden Erfindung modifizierten Vokabularliste ist.
  • [Ausführliche Beschreibung der Erfindung]
  • Die bevorzugte Ausführungsform der vorliegenden Erfindung läßt sich am besten unter Bezug auf die Zeichnung verstehen, worin für gleiche und einander entsprechende Teile der verschiedenen Zeichnungen gleiche Bezugszeichen verwendet werden.
  • Fig. 1 zeigt konzeptuell eine beispielhafte Liste 10 von Phrasen, die eine Vokabularliste eines sprecherabhängigen Spracherkennungssystems zur Verwendung mit der bevorzugten Ausführungsform bilden. Die Vokabularliste 10 aus Fig. 1 kann z. B. eine Namenliste für eine Namenverzeichniswahl für ein sprachaktiviertes Schnellwahlsystem sein. Ein Spracherkennungssystem, das die bevorzugte Ausführungsform der vorliegenden Erfindung verwenden kann, ist ein Texas Instruments- System 1500, das mit einem Spracherkennungs-Anwendungssystem mit der Phrase HG arbeitet. Obgleich dieses System zur Ausführung der erfinderischen Konzepte der vorliegenden Erfindung weitgehend von Software und Algorithmen abhängt, kann die Funktion der vorliegenden Erfindung ähnlich durch eine Schaltungsanordnung und Bauelemente ausgeführt werden. Die vorliegende Erfindung beabsichtigt deshalb zum Ausführen dieser Funktionen klar die Verwendung einer Schaltungsanordnung.
  • Die Vokabularliste 10 aus Fig. 1 enthält Phrasen wie "Phrase 1" an der durch das Bezugszeichen 12 bezeichneten Stelle, "Phrase 2" an der mit 14 bezeichneten Stelle usw. bis hinab zu "Phrase N" an der Stelle des Bezugszeichens 16. Ein Ziel eines sprecherabhängigen Spracherkennungssystems besteht darin, einem Anwender das Hinzufügen von Phrasen zu der Vokabularliste 10 zu gestatten und dann jene Phrasen für Befehle und zur Steuerung aufzurufen. Zum Beispiel kann ein Anwender, der das Spracherkennungssystem verwendet, sagen "rufe Phrase 1 an", worauf das System den Sprachbefehl erkennt und die Person oder den Ort, die mit "Phrase 1" verknüpft sind, anruft.
  • Häufig könnten Anwender der sprecherabhängigen Spracherkennungssysteme vergessen, welche Wörter auf ihrer Vokabularliste stehen. Wenn ein Anwender eine Phrase vergessen hat, könnte er manchmal versuchen, eine Phrase erneut einzutragen, oder er könnte ohne Rücksicht auf zuvor eingetragene Phrasen versuchen, eine Phrase einzutragen, die einer existierenden Phrase ähnelt. Tritt z. B. einer dieser Fälle auf, kann die Vokabularliste 10 Phrasen enthalten, welche nicht auf der Vokabularliste sein sollten. Dies führt zu Verwirrung und kann den Wert oder den Nutzen der Vokabularliste 10 schmälern. Um diese Probleme zu vermeiden, schafft die bevorzugte Ausführungsform der vorliegenden Erfindung ein Verfahren und ein System, die verhindern, daß auf der Vokabularliste 10 verwirrend ähnliche Phrasen existieren.
  • Fig. 2 zeigt den Prozeßablauf des Eintragungsprozesses 20 der bevorzugten Ausführungsform. Der Anwender oder Teilnehmer wird den Eintragungsprozeß wie durch den Block 22 gezeigt beginnen. Dies kann dadurch geschehen, daß an die sprecherabhängige Spracherkennungseintragung ein Befehl wie "überprüfe die Liste" gerichtet wird. Das System wird dann z. B. den Anwender in Schritt 24 durch den Befehl "sagen Sie die Schnellwahlphrase" auffordern. Die Ernpfangsschaltungsanordnung der Spracherkennung wird dann die hinzuzufügende Phrase empfangen. Als nächstes führt das Spracherkennungssystem z. B. einen als "Hidden Markov Modeling"-Eintragung (HMN- Eintragung) bekannten Prozeß aus, der zum Identifizieren der Endpunkte der Rede einen energiebasierten Endezeigeprozeß oder eine andere geeignete Technik verwendet. Dies geschieht im Schritt 26. Ein Beispiel des HMM-Prozesses, den die bevorzugte Ausführungsform ausführt, findet sich bei J. Picone, Continuous Speech Recognition Using Hidden Markov Models, Speech and Image Understanding Laboratory, Texas Instruments, Inc., 7. Mai 1990 (Nachdruck aus dem IEEE ASSP-Magazin). Wie der Block 28 zeigt, bestehen die nächsten Schritte darin, unter Verwendung der HMM-Technik ein HMM-Modell zu erzeugen und zu der Teilnehmerschablone Akustikvektoren hinzuzufügen. Sobald der Eintragungsprozeß 20 abgeschlossen ist, besteht der nächste Schritt in der Aktualisierung der Vokabularliste 10.
  • Fig. 3 zeigt den Aktualisierungsprozeß 30 der bevorzugten Ausführungsform Beginnend bei Block 32 besteht der erste Schritt darin, daß das Spracherkennungssystem dem Teilnehmer anzeigt, daß es die Vokabularliste 10 aktualisiert. Dann fordert das Spracherkennungssystem den Teilnehmer auf, die Phrase zu wiederholen. Das Spracherkennungssystem kann z. B. wie in Block 34 gezeigt den Befehl "sagen Sie den Schnellwahlnamen noch einmal" verwenden. Als nächstes führt das Spracherkennungssystem den HMM-Algorithmus aus, um auf der Grundlage der in einer mit dem Spracherkennungssystem in Block 36 verknüpften Datenbank geladenen Modelle nach der besten Phrase zu suchen. Dies ist ein Vergleichsschritt, der identifiziert, ob sich auf der Vokabularliste 10 die gleiche oder eine verwirrend ähnliche Phrase befindet. Das Spracherkennungssystem gibt dann das beste Modell (d. h. die beste Phrase) und eine mit dem Modell verknüpfte Punktzahl zurück. Bei Block 38 fragt das Verfahren der bevorzugten Ausführungsform ab, ob die zurückgegebene Phrase die gleiche ist wie die, die der Teilnehmer einzutragen versucht. Ist dies der Fall, teilt das Spracherkennungssystem dem Teilnehmer diese Informationen, wie Block 40 zeigt, als einen "Erfolg" mit.
  • Das Spracherkennungssystem wird dann die Phrase in der Vokabularliste 10 halten. Ist dies nicht der Fall, unterrichtet das System den Teilnehmer, wie Block 42 zeigt, darüber, daß die Phrase, die er einzugeben versucht, einer anderen Phrase auf der Vokabularliste 10 zu ähnlich ist. Zu diesem Zeitpunkt besteht das Verfahren darin, dem Teilnehmer die auf der Vokabularliste 10 befindliche verwirrend ähnliche Phrase abzuspielen und dann Anweisungen anzufordern. Die bevorzugte Ausführungsform scheidet die Phrase deshalb von dem Eintragungsprozeß aus.
  • Ein Schlüsselprozeß der bevorzugten Ausführungsform ist die Erzeugung von Modellen, die akustische Modelle aller Phrasen auf der Schablone sind. Fig. 4 zeigt den Prozeß 50, durch den akustische Modelle für alle Phrasen auf der Vokabularliste 10 erstellt werden. Beginnend bei Block 52 aktualisiert das Spracherkennungssystem die Grammatikerzeugung. Dann erzeugt das System für jede Phrase auf der Vokabularliste 10 ein akustisches HMM-Modell für die Phrase zur Eintragung in Block 54. Der nächste Schritt besteht darin, in Block 56 dem Modell für die Phrase, die momentan in die Vokabularliste 10 eingetragen wird, eine durch die Variable "PROB" bezeichnete Wahrscheinlichkeit zuzuordnen. In Block 56 wird auch allen Phrasen, die verbleiben, eine Wahrscheinlichkeit 1 zugeordnet. Der Wert des Wahrscheinlichkeitsparameters PROB ist so gewählt, daß er die Unterdrückung ähnlicher Phrasen maximiert und gleichzeitig die Wahrscheinlichkeit, daß die Phrasenausgabe tatsächlich verschieden von der ist, die eingetragen wird, minimiert.
  • Das Ergebnis des obigen Eintragungsprozesses 20, des Aktualisierungsprozesses 30 und des Prozesses 50 der Erzeugung einer aktualisierten Grammatik ist eine modifizierte Vokabularliste, die die Ziele der bevorzugten Ausführungsform schafft. Fig. 5 zeigt konzeptuell eine Vokabularliste, die durch den Prozeß der bevorzugten Ausführungsform modifiziert wurde.
  • Insbesondere wurde in die modifizierte Vokabularliste zusammen mit der "PHRASE 1" an der Stelle 12, der "PHRASE 2" an der Stelle 14 bis hin zu "PHRASE N" an der Stelle 16 die "PHRASE i" eingetragen. Die Spalte 62 zeigt die für jedes der Modelle auf der Vokabularliste 10 zugeordnete Wahrscheinlichkeit. Zum Beispiel haben "PHRASE 1", "PHRASE 2" und "PHRASE N" alle einen Wahrscheinlichkeitswert 1,0. Bei der "PHRASE i" wird der Stelle 60 die Wahrscheinlichkeitsvariable PROB mit einem Wert kleiner als 1,0 zugeordnet. Dies gibt der "PHRASE i" die zur Unterstützung der von der bevorzugten Ausführungsform ausgeführten Unterdrückung notwendige Wahrscheinlichkeit.
  • BETRIEB
  • Obgleich das obenbeschriebene Verfahren und das obenbeschriebene System den Betrieb der vorliegenden Erfindung klar machen, hilft die folgende Diskussion, den Betrieb noch deutlicher zu machen. Das folgende Beispiel zeigt deshalb den Betrieb der bevorzugten Ausführungsform. Es wird z. B. angenommen, daß ein Anwender beschließt, zu der Vokabularliste 10 die Phrase "Bob Johnston" hinzuzufügen. Um die Eintragung zu beginnen, kann der Anwender dann an das Spracherkennungssystem den Befehl "überprüfe die Liste" übergeben. Bei Schritt 24 aus Fig. 2 wird das System den Anwender mit den Wörtern "sagen Sie die Schnellwahlphrase" auffordern. Als nächstes wird der Anwender "Bob Johnston" sagen. Die bevorzugte Ausführungsform wird dann die Phrase "Bob Johnston" eintragen und gemäß der Schritte 26 und 28 aus Fig. 2 ein HMM-Modell "Bob Johnston" erzeugen.
  • Unmittelbar danach wird das System die Vokabularliste 10 aktualisieren und den Anwender auffordern: "sagen Sie die Schnellwahlphrase noch einmal" (siehe Fig. 3). Sobald der Anwender die Phrase "Bob Johnston" noch einmal sagt, wird der HMM-Algorithmus versuchen nachzusehen, ob es auf der Vokabularliste 10 eine Übereinstimmung mit der Phrase "Bob Johnston" gibt. Bevor dies jedoch durch das Verfahren der bevorzugten Ausführungsform geschieht, wird allen Phrasen auf der Vokabularliste 10 außer der Phrase "Bob Johnston" die Wahrscheinlichkeit 1,0 zugeordnet (siehe Fig. 4). Der Phrase "Bob Johnston" wird z. B. eine Wahrscheinlichkeit von 0,8 (d. h. eine geringere Wahrscheinlichkeit als allen anderen Phrasen auf der Vokabularliste 10) zugeordnet.
  • Nun wird z. B. angenommen, daß es auf der Vokabularliste 10 die Phrase "Bob Johnsom" gibt. Da die Wahrscheinlichkeit einer Übereinstimmung zwischen nochmals gesagtem "Bob Johnston" und "Bob Johnson" 1,0 beträgt, während die Wahrscheinlichkeit für "Bob Johnston" 0,8 ist, wird das System dem Anwender in diesem Fall mit einer höheren Wahrscheinlichkeit eine Übereinstimmung mit der Phrase "Bob Johnson" zurückgeben. An dieser Stelle wird die bevorzugte Ausführungsform eine Überprüfung durchführen, ob es eine Übereinstimmung zwischen der ein zweites Mal gesagten Phrase und der erstempfangenen Phrase (d. h. der Phrase mit der niedrigeren zugeordneten Wahrscheinlichkeit) gibt. In diesem Beispiel ist dies nicht der Fall. Der Anwender wird deshalb davon in Kenntnis gesetzt, daß die einzutragende Phrase einer anderen Phrase auf der Liste zu ähnlich ist. Das System wird dann dem Anwender einen Befehl der Art "sie versuchen, die Phrase Bob Johnston einzugeben, während die Phrase Bob Johnson bereits in der Datenbank existiert. Bitte wählen Sie eine andere Phrase." abspielen. Statt dieser können dem Anwender andere, ähnliche Anweisungen bereitgestellt werden. Im wesentlichen wird der Betrieb der bevorzugten Ausführungsform jedoch einen fehlerfreieren Gebrauch der Vokabularliste 10 in einen sprecherabhängigen Sprachverarbeitungssystem gestatten.
  • Wenn ein Anwender in anderen Phasen versucht, zu der Vokabularliste eine verwirrend ähnliche Phrase hinzuzufügen, besteht der erste auszuführende Schritt darin, im Lernprozeß eine Aktualisierung vorzunehmen. Diese Aktualisierung beginnt mit einer Eintragung, durch die ein Modell der hinzugefügten Phrase erzeugt wird. Der nächste Schritt besteht darin, den Anwender die Phrase wiederholen zu lassen und zu versuchen, die erste Phrase mit der zweiten zu überlagern oder sie zu aktualisieren, um ein besseres Modell zu erzeugen. In einem Versuch, ein besseres Modell zu erstellen, wird traditionell allen Phrasen eine gleiche Wahrscheinlichkeit zugeordnet oder, was ähnlich ist, das einzelne Modell unabhängig davon, welche anderen Phrasen sich auf der Liste befinden, aktualisiert. Statt dessen wertet die bevorzugte Ausführungsform die wiederholte Phrase aus und ordnet bei der Aktualisierung allen Phrasen Wahrscheinlichkeiten zu, so daß das System alle anderen Phrasen gegenüber der Phrase, die der Anwender zu der Vokabularliste hinzuzufügen versucht, bevorzugt. Dadurch, daß allen anderen Phrasen eine höhere Wahrscheinlichkeit als der erstgesprochenen Phrase zugeordnet wurde, werden ähnlich klingende Phrasen gegenüber der erstgesprochenen Phrase oder der Phrase, die der Anwender einzugeben wünscht, ausgewählt. Die bevorzugte Ausführungsform testet daher die einzugebende Phrase gegenüber allen anderen derzeit auf der Vokabularliste vorhandenen Phrasen. Dies geschieht durch ein künstliches Verringern der Wahrscheinlichkeit dafür, daß das System die zweitgesprochene Phrase als die erstgesprochene erkennt. Dieser gesamte Vergleichsprozeß wird durch die Spracherkennungs-Systemsoftware wie die in dem Spracherkennungssystem Texas Instruments-System 1500 verwendete HG-Systemsoftware ausgeführt.
  • Ein alternatives Verfahren enthält die Schritte des Ausführens des Erkennungsalgorithmus mit den Eintragungsdaten unter Verwendung der Sprachmodelle aller Phrasen bis auf die eine, die dem System neu hinzugefügt werden soll. In dieser Situation wird der Erkenner typischerweise die beste Übereinstimmung unter den verbleibenden Modellen suchen. Das alternative Verfahren nutzt dann eine Entscheidungsregel, die auf der Punktzahl bei der falschen Übereinstimmung und der in dem richtigen Modell erhaltenen Punktzahl beruht, um zu entscheiden, ob es die neue Phrase in die Vokabularliste 10 aufnehmen soll. Das alternative Verfahren fügt die neue Phrase dann hinzu, wenn die Differenz zwischen der Punktzahl für die falsche Übereinstimmung und der Punktzahl für die richtige Übereinstimmung unterhalb einer vorbestimmten Schwelle liegt. Das Spracherkennungssystem wird dann den Anwender darüber informieren, daß die Phrase zum Hinzufügen übernommen wurde oder auch nicht.
  • Obgleich die vorliegende Erfindung ausführlich beschrieben wurde, können selbstverständlich verschiedene Veränderungen, Ersetzungen und Abwandlungen hierzu vorgenommen werden, ohne vom Umfang der durch die beigefügten Ansprüche definierten Erfindung abzuweichen.

Claims (15)

1. Verfahren zum Verhindern der Eintragung von bereits vorhandenen oder verwirrend ähnlichen Phrasen in eine Vokabularliste (10) eines sprecherabhängigen Spracherkennungssystems, mit den folgenden Schritten:
zunächst Empfangen einer erstempfangenen Phrase (60), die von einem Anwender ausgesprochen wird, um sie zu mehreren anderen Phrasen (12, 14, 16) in einer Vokabularliste hinzuzufügen;
Eintragen der Phrase in die Vokabularliste;
Zuweisen einer ersten Wahrscheinlichkeit an die Phrase (60) und einer zweiten Wahrscheinlichkeit an jede der mehreren anderen Phrasen (12, 14, 16), wobei die zweite Wahrscheinlichkeit einen höheren Wert als die erste Wahrscheinlichkeit besitzt;
Empfangen einer zweitempfangenen Phrase, wobei die zweitempfangene Phrase die gleiche Phrase ist, die vom Anwender zu einem zweiten Zeitpunkt ausgesprochen wird, wobei die erste Wahrscheinlichkeit und die zweite Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das sprecherabhängige Spracherkennungssystem die zweitempfangene Phrase mit der erstempfangenen Phrase (60) oder mit einer der mehreren anderen Phrasen (12, 14, 16) in der Vokabularliste zur Übereinstimmung bringt;
Vergleichen der zweitempfangenen Phrase mit der Vokabularliste, die die erstempfangene Phrase (60) und die mehreren anderen Phrasen (12, 14, 16) enthält;
Ausgeben eines Hinweises an den Benutzer, ob die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt; und
Zurückweisen der Eintragung der erstempfangenen Phrase (60) in die Vokabularliste, falls die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt.
2. Verfahren nach Anspruch 1, bei dem der Vergleichsschritt unter Verwendung eines "Hidden Markov Modeling"-Prozesses ausgeführt wird.
3. Verfahren nach Anspruch 1, ferner mit dem Schritt des Beibehaltens der erstempfangenen Phrase in der Vokabularliste, falls der Vergleichsschritt eine Übereinstimmung zwischen der zweitempfangenen Phrase und der erstempfangenen Phrase ergibt.
4. Verfahren nach Anspruch 1, bei dem die erste Wahrscheinlichkeit die Unterscheidung von Ähnlichkeiten zwischen der zweitempfangenen Phrase und jeder der mehreren anderen Phrasen maximal macht und die Wahrscheinlichkeit, daß das Spracherkennungssystem die zweitempfangene Phrase mit einer von der erstempfangenen Phrase verschiedenen Phrase zur Übereinstimmung bringt, minimal macht.
5. Verfahren nach Anspruch 1, bei dem der Hinweisschritt den Schritt des Abspielens einer Nachricht enthält, die angibt, daß die erstempfangene Phrase wenigstens einer der mehreren anderen Phrasen zu ähnlich ist.
6. Verfahren nach Anspruch 1, bei dem die zweite Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.
7. Verfahren nach Anspruch 1, bei dem der Eintragungsschritt den Schritt des Eintragens der Phrase unter Verwendung eines energiebasierten Endezeigeprozesses enthält.
8. System zum Verhindern der Eintragung von bereits vorhandenen oder verwirrend ähnlichen Phrasen in eine Vokabularliste (10) eines sprecherabhängigen Spracherkennungssystems, mit:
einer Empfangsschaltungsanordnung, die dem sprecherabhängigen Spracherkennungssystem zugeordnet ist, um zunächst eine erstempfangene Phrase (60), die von einem Anwender ausgesprochen wird, zu empfangen, um sie zu mehreren anderen Phrasen (12, 14, 16) in einer Vokabularliste hinzuzufügen;
einem Eintragungsmechanismus zum Eintragen der Phrase in die Vokabularliste;
einem Zuweisungsalgorithmus zum Zuweisen einer ersten Wahrscheinlichkeit an die Phrase (60) und einer zweiten Wahrscheinlichkeit an jede der mehreren anderen Phrasen (12, 14, 16), wobei die zweite Wahrscheinlichkeit einen größeren Wert als die erste Wahrscheinlichkeit besitzt;
wobei die Empfangsschaltungsanordnung ferner eine zweitempfangene Phrase empfängt, wobei die zweitempfangene Phrase gleich der ersten Phrase ist und von Anwender zu einem zweiten Zeitpunkt ausgesprochen wird, wobei die erste Wahrscheinlichkeit und die zweite Wahrscheinlichkeit die Wahrscheinlichkeit steuern, daß das Spracherkennungssystem die zweitempfangene Phrase mit der erstempfangenen Phrase (60) oder mit einer der mehreren anderen Phrasen (12, 14, 16) in der Vokabularliste zur Übereinstimmung bringt;
einer Vergleichsschaltungsanordnung zum Vergleichen der zweitempfangenen Phrase mit der Vokabularliste, die die erstempfangene Phrase (60) und die mehreren weiteren Phrasen (12, 14, 16) enthält;
einer Kommunikationsschaltungsanordnung, die dem Anwender mitteilt, ob die zweitempfangene Phrase mit einer der mehreren weiteren Phrasen (12, 14, 16) übereinstimmt; und
einer Zurückweisungsschaltungsanordnung zum Zurückweisen der Eintragung der erstempfangenen Phrase (60) in die Vokabularliste, falls die zweitempfangene Phrase mit einer der mehreren anderen Phrasen (12, 14, 16) übereinstimmt.
9. System nach Anspruch 8, bei dem die Vergleichsschaltungsanordnung ferner eine Schaltungsanordnung zum Ausführen des Vergleichs unter Verwendung eines "Hidden Markov Modeling"-Prozesses enthält.
10. System nach Anspruch 8, ferner mit einer Halteschaltungsanordnung zum Halten der erstempfangenen Phrase in der Vokabularliste, falls die Vergleichsschaltungsanordnung eine Übereinstimmung zwischen der zweitempfangenen Phrase und der erstempfangenen Phrase feststellt.
11. System nach Anspruch 8, bei dem die erste Wahrscheinlichkeit die Unterscheidung von Ahnlichkeiten zwischen der zweitempfangenen Phrase und jeder der mehreren anderen Phrasen maximal macht und die Wahrscheinlichkeit, daß das Spracherkennungssystem die Phrase mit einer von der erstempfangenen Phrase verschiedenen Phrase zur Übereinstimmung bringt, minimal macht.
12. System nach Anspruch 8, bei dem die Kommunikationsschaltungsanordnung ferner eine Abspielschaltungsanordnung enthält, die eine Nachricht abspielt, die angibt, daß die erstempfangene Phrase wenigstens einer der mehreren weiteren Phrasen zu ähnlich ist.
13. System nach Anspruch 8, bei dem die zweite Wahrscheinlichkeit eine Eins-Wahrscheinlichkeit enthält.
14. System nach Anspruch 8, bei dem der Eintragungsmechanismus einen Mechanismus zum Eintragen der Phrase unter Verwendung eines energiebasierten Endezeigeprozesses einträgt.
15. Verbessertes sprecherabhängiges Spracherkennungssystem, das ein System nach irgendeinem der Ansprüche 8 bis 14 enthält.
DE69317229T 1992-12-11 1993-12-10 Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems Expired - Lifetime DE69317229T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/989,285 US5452397A (en) 1992-12-11 1992-12-11 Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list

Publications (2)

Publication Number Publication Date
DE69317229D1 DE69317229D1 (de) 1998-04-09
DE69317229T2 true DE69317229T2 (de) 1998-06-25

Family

ID=25534958

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69317229T Expired - Lifetime DE69317229T2 (de) 1992-12-11 1993-12-10 Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems

Country Status (6)

Country Link
US (1) US5452397A (de)
EP (1) EP0601876B1 (de)
JP (1) JP3388845B2 (de)
KR (1) KR100283736B1 (de)
DE (1) DE69317229T2 (de)
MY (1) MY115138A (de)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2015410C (en) * 1989-05-17 1996-04-02 Chin H. Lee Speech recognition employing key word modeling and non-key word modeling
US5509104A (en) * 1989-05-17 1996-04-16 At&T Corp. Speech recognition employing key word modeling and non-key word modeling
US5717738A (en) * 1993-01-11 1998-02-10 Texas Instruments Incorporated Method and device for generating user defined spoken speed dial directories
TW323364B (de) * 1993-11-24 1997-12-21 At & T Corp
US5737723A (en) * 1994-08-29 1998-04-07 Lucent Technologies Inc. Confusable word detection in speech recognition
US5758322A (en) * 1994-12-09 1998-05-26 International Voice Register, Inc. Method and apparatus for conducting point-of-sale transactions using voice recognition
US5754977A (en) * 1996-03-06 1998-05-19 Intervoice Limited Partnership System and method for preventing enrollment of confusable patterns in a reference database
US5915238A (en) * 1996-07-16 1999-06-22 Tjaden; Gary S. Personalized audio information delivery system
US5752230A (en) * 1996-08-20 1998-05-12 Ncr Corporation Method and apparatus for identifying names with a speech recognition program
US5905789A (en) * 1996-10-07 1999-05-18 Northern Telecom Limited Call-forwarding system using adaptive model of user behavior
US6167117A (en) * 1996-10-07 2000-12-26 Nortel Networks Limited Voice-dialing system using model of calling behavior
US5917891A (en) * 1996-10-07 1999-06-29 Northern Telecom, Limited Voice-dialing system using adaptive model of calling behavior
US5912949A (en) * 1996-11-05 1999-06-15 Northern Telecom Limited Voice-dialing system using both spoken names and initials in recognition
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US6208713B1 (en) 1996-12-05 2001-03-27 Nortel Networks Limited Method and apparatus for locating a desired record in a plurality of records in an input recognizing telephone directory
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6005927A (en) * 1996-12-16 1999-12-21 Northern Telecom Limited Telephone directory apparatus and method
US6061654A (en) * 1996-12-16 2000-05-09 At&T Corp. System and method of recognizing letters and numbers by either speech or touch tone recognition utilizing constrained confusion matrices
EP0885513A1 (de) * 1996-12-17 1998-12-23 Koninklijke Philips Electronics N.V. Schnurloses telefongerät
CN1216137A (zh) * 1996-12-24 1999-05-05 皇家菲利浦电子有限公司 一种训练语音识别系统的方法和实践该方法的装置特别是手提电话设备
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6219453B1 (en) 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6141661A (en) * 1997-10-17 2000-10-31 At&T Corp Method and apparatus for performing a grammar-pruning operation
US6243677B1 (en) * 1997-11-19 2001-06-05 Texas Instruments Incorporated Method of out of vocabulary word rejection
US6122612A (en) * 1997-11-20 2000-09-19 At&T Corp Check-sum based method and apparatus for performing speech recognition
US6205428B1 (en) 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6208965B1 (en) 1997-11-20 2001-03-27 At&T Corp. Method and apparatus for performing a name acquisition based on speech recognition
US5987411A (en) * 1997-12-17 1999-11-16 Northern Telecom Limited Recognition system for determining whether speech is confusing or inconsistent
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US7937260B1 (en) 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
US6233560B1 (en) 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
US8275617B1 (en) 1998-12-17 2012-09-25 Nuance Communications, Inc. Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
US7266498B1 (en) * 1998-12-18 2007-09-04 Intel Corporation Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu
US20020032564A1 (en) * 2000-04-19 2002-03-14 Farzad Ehsani Phrase-based dialogue modeling with particular application to creating a recognition grammar for a voice-controlled user interface
AU5451800A (en) 1999-05-28 2000-12-18 Sehda, Inc. Phrase-based dialogue modeling with particular application to creating recognition grammars for voice-controlled user interfaces
CA2376277C (en) 1999-06-11 2011-03-15 Telstra New Wave Pty Ltd A method of developing an interactive system
KR20010054622A (ko) * 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US6535850B1 (en) 2000-03-09 2003-03-18 Conexant Systems, Inc. Smart training and smart scoring in SD speech recognition system with user defined vocabulary
US8200485B1 (en) 2000-08-29 2012-06-12 A9.Com, Inc. Voice interface and methods for improving recognition accuracy of voice search queries
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
US7013276B2 (en) * 2001-10-05 2006-03-14 Comverse, Inc. Method of assessing degree of acoustic confusability, and system therefor
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム
GB2385698B (en) * 2002-02-26 2005-06-15 Canon Kk Speech processing apparatus and method
AU2002950336A0 (en) * 2002-07-24 2002-09-12 Telstra New Wave Pty Ltd System and process for developing a voice application
AU2002951244A0 (en) * 2002-09-06 2002-09-19 Telstra New Wave Pty Ltd A development system for a dialog system
AU2003900584A0 (en) * 2003-02-11 2003-02-27 Telstra New Wave Pty Ltd System for predicting speech recognition accuracy and development for a dialog system
AU2004211007B2 (en) * 2003-02-11 2010-08-19 Telstra Corporation Limited System for predicting speech recognition accuracy and development for a dialog system
US7729913B1 (en) 2003-03-18 2010-06-01 A9.Com, Inc. Generation and selection of voice recognition grammars for conducting database searches
AU2003902020A0 (en) * 2003-04-29 2003-05-15 Telstra New Wave Pty Ltd A process for grammatical inference
US7899671B2 (en) * 2004-02-05 2011-03-01 Avaya, Inc. Recognition results postprocessor for use in voice recognition systems
WO2006033044A2 (en) * 2004-09-23 2006-03-30 Koninklijke Philips Electronics N.V. Method of training a robust speaker-dependent speech recognition system with speaker-dependent expressions and robust speaker-dependent speech recognition system
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8195456B2 (en) * 2009-12-04 2012-06-05 GM Global Technology Operations LLC Robust speech recognition based on spelling with phonetic letter families
JP6744025B2 (ja) * 2016-06-21 2020-08-19 日本電気株式会社 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム
US10832658B2 (en) * 2017-11-15 2020-11-10 International Business Machines Corporation Quantized dialog language model for dialog systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE33597E (en) * 1982-10-15 1991-05-28 Hidden Markov model speech recognition arrangement
US5218668A (en) * 1984-09-28 1993-06-08 Itt Corporation Keyword recognition system and method using template concantenation model
US4783804A (en) * 1985-03-21 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Hidden Markov model speech recognition arrangement
ES2019628B3 (es) * 1986-02-15 1991-07-01 Smiths Ind Public Ltd Company Procesador de textos hablados y metodo..
CA1311059C (en) * 1986-03-25 1992-12-01 Bruce Allen Dautrich Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words
US5129002A (en) * 1987-12-16 1992-07-07 Matsushita Electric Industrial Co., Ltd. Pattern recognition apparatus
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5054074A (en) * 1989-03-02 1991-10-01 International Business Machines Corporation Optimized speech recognition system and method
US5033087A (en) * 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US4977598A (en) * 1989-04-13 1990-12-11 Texas Instruments Incorporated Efficient pruning algorithm for hidden markov model speech recognition
US5220639A (en) * 1989-12-01 1993-06-15 National Science Council Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
US5271088A (en) * 1991-05-13 1993-12-14 Itt Corporation Automated sorting of voice messages through speaker spotting
US5212730A (en) * 1991-07-01 1993-05-18 Texas Instruments Incorporated Voice recognition of proper names using text-derived recognition models

Also Published As

Publication number Publication date
EP0601876B1 (de) 1998-03-04
MY115138A (en) 2003-04-30
EP0601876A1 (de) 1994-06-15
KR940015969A (ko) 1994-07-22
DE69317229D1 (de) 1998-04-09
JPH06282291A (ja) 1994-10-07
KR100283736B1 (ko) 2001-03-02
JP3388845B2 (ja) 2003-03-24
US5452397A (en) 1995-09-19

Similar Documents

Publication Publication Date Title
DE69317229T2 (de) Verfahren und System zur Verhinderung der Eingabe von verwirrend ähnlichen Sätzen in eine Wörterliste eines Spracherkennungssystems
DE69919842T2 (de) Sprachmodell basierend auf der spracherkennungshistorie
DE69525178T2 (de) Ansagedienste mit spracheingabe
DE4397100C2 (de) Verfahren zum Erkennen von Sprachsignalen und Spracherkennungssystem mit rekursiver Grammatik mit endlicher Zustandsanzahl
DE69514382T2 (de) Spracherkennung
DE69226796T2 (de) Zeitliche Dekorrelationsverfahren zur störsicheren Sprechererkennung
DE69324428T2 (de) Verfahren zur Sprachformung und Gerät zur Spracherkennung
DE69032777T2 (de) Spracherkennung unter Anwendung von Stichwörtern und Nichtstichwörter-Modellierung
DE3876207T2 (de) Spracherkennungssystem unter verwendung von markov-modellen.
DE69622565T2 (de) Verfahren und vorrichtung zur dynamischen anpassung eines spracherkennungssystems mit grossem wortschatz und zur verwendung von einschränkungen aus einer datenbank in einem spracherkennungssystem mit grossem wortschatz
DE3337353C2 (de) Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells
DE68928097T2 (de) Spracherkennungssystem
DE69420842T2 (de) Spracherkennung unter anwendung einer zweidurchgängigen suchmethode
DE69923379T2 (de) Nicht-interaktive Registrierung zur Spracherkennung
DE69324629T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69229816T2 (de) Einrichtung und Verfahren für Sprachmusteridentifizierung
DE69827988T2 (de) Sprachmodelle für die Spracherkennung
DE19847419A1 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äußerung
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE69607913T2 (de) Verfahren und vorrichtung zur spracherkennung auf der basis neuer wortmodelle
EP0836175B1 (de) Verfahren und Anordnung zum Ableiten wenigstens einer Folge von Wörtern aus einem Sprachsignal
DE19944608A1 (de) Erkennung einer in buchstabierter Form vorliegenden Sprachäußerungseingabe
DE69719702T2 (de) Ein automatisches Auskunftssystem welches ein heuristisches Modell zur Vorhersage der am wahrscheinlichsten erfragten Nummer verwendet
WO2006111230A1 (de) Verfahren zur gezielten ermittlung eines vollständigen eingabedatensatzes in einem sprachdialogsystem
DE3786822T2 (de) Spracherkennungssystem.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition