DE10127559A1 - Benutzergruppenspezifisches Musterverarbeitungssystem - Google Patents
Benutzergruppenspezifisches MusterverarbeitungssystemInfo
- Publication number
- DE10127559A1 DE10127559A1 DE2001127559 DE10127559A DE10127559A1 DE 10127559 A1 DE10127559 A1 DE 10127559A1 DE 2001127559 DE2001127559 DE 2001127559 DE 10127559 A DE10127559 A DE 10127559A DE 10127559 A1 DE10127559 A1 DE 10127559A1
- Authority
- DE
- Germany
- Prior art keywords
- user
- user group
- specific
- group
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Collating Specific Patterns (AREA)
- Silicon Polymers (AREA)
- Developing Agents For Electrophotography (AREA)
- Macromonomer-Based Addition Polymer (AREA)
Abstract
Die Erfindung bezieht sich auf ein Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den Verfahrensschritten: DOLLAR A - Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und DOLLAR A - Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80...81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.
Description
Die Erfindung bezieht sich auf ein Musterverarbeitungssystem und insbesondere auf ein
Sprachverarbeitungssystem. Musterverarbeitungssysteme und insbesondere solche mit
Spracherkennung werden an vielen Stellen und für viele Anwendungen eingesetzt.
Beispiele sind die über Telefon erreichbaren automatischen Auskunfts- und Transaktions
systeme, z. B. die automatische Fahrplanauskunft der niederländischen Openbaar Vervoer
Reisinformatie (OVR) oder die Telefonbankingsysteme vieler Banken, sowie die in der
Stadt Wien aufgestellten Informationskioske der Firma Philips, an denen ein Benutzer mit
Hilfe von Tastatur- und Spracheingaben z. B. Informationen über die Wiener Sehens
würdigkeiten und Hotels erhalten kann.
Sollen Musterverarbeitungssysteme von vielen Benutzern verwendet werden, werden in der
Regel für die Musterverarbeitung so genannte benutzerunabhängige Musterverarbeitungs
datensätze verwendet. D. h., bei der Verarbeitung von Mustern unterschiedlicher Benutzer
wird kein Unterschied zwischen den Benutzern gemacht, im Falle der Spracherkennung
werden so z. B. für alle Sprecher dieselben akustischen Referenzmodelle verwendet. Dem
Fachmann ist jedoch bekannt, dass die Qualität der Musterverarbeitung durch die Ver
wendung benutzerspezifischer Musterverarbeitungsdatensätze verbessert wird. Z. B. steigt
die Genauigkeit von Spracherkennungssystemen, wenn man für einen Sprecher eine
speziell auf ihn abgestimmte Vokaltraktlängennormierung seiner sprachlichen Äußerungen
durchführt.
Solche sprecherabhängigen Spracherkennungssysteme werden auch bereits weitgehend in
Anwendungen mit kleinen Benutzerzahlen eingesetzt. Beispiele sind persönliche Diktiersysteme,
z. B. FreeSpeech von Philips, oder die professionellen Diktiersysteme für
geschlossene Benutzergruppen,, z. B. SpeechMagic von Philips für den Bereich der Rönt
genologie. Einer Übertragung dieser Techniken auf Musterverarbeitungssysteme mit vielen
Benutzern stehen jedoch verschiedene Hemmnisse im Wege.
Zum einen würde die große Zahl der Benutzer eines solchen Systems zu einem hohen
Speicherbedarf für die benutzerspezifischen Musterverarbeitungsdatensätze führen. Zum
anderen muss davon ausgegangen werden, dass eine größere Zahl der Benutzer nicht bereit
wäre, den Trainingsaufwand für die Erstellung ihrer benutzerspezifischen Musterverarbei
tungsdatensätze auf sich zu nehmen. Da sich nämlich die Musterverarbeitungssysteme der
einzelnen Hersteller und teilweise auch die einzelnen Produkte eines Herstellers von
einander unterscheiden, und daher die benutzerspezifischen Musterverarbeitungsdaten
sätze nicht zwischen den Systemen austauschbar sind, wäre dieser Trainingsaufwand für
nahezu jedes System nötig, das ein Benutzer verwenden will.
In den Patent Abstracts of Japan, JP 08-123461 A wird daher vorgeschlagen, dass ein
Benutzer eine persönliche Informationskarte (individual information card) bei sich trägt,
welche die für ihn charakteristischen Daten (individual information data) aufnimmt. Um
dann die Sprachverarbeitung (speech processing) eines entsprechenden Systems (speech
interface system) auf sich zu spezialisieren (specializing the system for the individual),
schiebt er z. B. seine Informationskarte in einen Schlitz des Systems. Dieses liest seine
Daten von der Karte und führt mit ihnen eine benutzerabhängige Verarbeitung seiner
sprachlichen Äußerungen durch.
Die Verwendung einer persönlichen Informationskarte löst also die Problematik des hohen
Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten, vorausgesetzt
die Hersteller der Sprachverarbeitungssysteme unterstützen die Verwendung der Karte an
ihren Systemen. Sie schafft jedoch die Notwendigkeit, dass ein Benutzer seine Karte zur
Systemnutzung stets bei sich führen und jedes System eine Eingabevorrichtung für die
Karte vorsehen muss. Beispielsweise ist sie für die Nutzung eines telefonischen Auskunfts
systems nicht einsetzbar.
Aufgabe der Erfindung ist es daher, ein Musterverarbeitungssystem, insbesondere ein
Sprachverarbeitungssystem, der eingangs genannten Art mit einer den benutzerspezifischen
Musterverarbeitungssystemen vergleichbaren Qualität zu schaffen, das die Problematik des
hohen Speicherbedarfs und des mehrfachen Erstellens benutzerspezifischer Daten löst,
ohne dass der Benutzer zur Systembenutzung zusätzlicher Ausrüstung wie z. B. einer
Informationskarte bedarf, und das auch mit bisherigen Benutzerterminals wie z. B. dem
Telefon benutzt werden kann.
Diese Aufgabe wird gelöst einerseits durch ein Verfahren zur Musterverarbeitung,
insbesondere zur Sprachverarbeitung mit den Verfahrensschritten:
- - Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- - Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes für die Verarbeitung einer Mustereingabe des Benutzers,
und andererseits durch ein Musterverarbeitungssystem, insbesondere ein Sprachver
arbeitungssystem, das
- - zur Entgegennahme einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- - zur Verwendung eines für die Benutzergruppe spezifischen Musterverarbeitungs datensatzes für die Verarbeitung einer Mustereingabe des Benutzers
vorgesehen ist.
Durch die Einteilung der Benutzer in Benutzergruppen wird die Problematik des hohen
Speicherbedarfes vermieden. Darüber hinaus können die benutzergruppenspezifischen
Musterverarbeitungsdatensätze auch auf zentralen Datenspeichern untergebracht und über
ein Netzwerk den Musterverarbeitungsvorrichtungen zur Verfügung gestellt werden.
Damit ergeben sich durch die Vermeidung mehrfacher Datenhaltung weitere Möglich
keiten der Speicherersparnis. Die Mehrfachverwendung der benutzergruppenspezifischen
Musterverarbeitungsdatensätze in mehreren Systemen vermeidet die Problematik einer
mehrfachen Festlegung der Benutzergruppe für den Benutzer.
Zur Benutzung des benutzergruppenspezifischen Musterverarbeitungssystems muss ein
Benutzer dem System nur seine Benutzergruppe z. B. durch eine Nummer oder einen
symbolischen Namen mitteilen. Während die Benutzergruppeninformation auch auf einer
Chipkarte untergebracht werden kann, genügt es zur Benutzung z. B. eines telefonischen
Auskunftssystems auch, dem System die Benutzergruppe verbal mitzuteilen oder z. B. bei
einer numerischen Kodierung die Nummer über die Tastatur eines DTMF-fähigen
Telefons einzugeben. Damit lässt sich ein solches benutzergruppenspezifisches Musterver
arbeitungssystem auch ohne zusätzliche Ausrüstung wie z. B. einer Informationskarte und
auch mit bisherigen Benutzerterminals wie z. B. einem Telefon benutzen.
Die Festlegung der Benutzergruppe für einen Benutzer kann, wie in Anspruch 2 bean
sprucht, in einer Trainingsphase erfolgen, in welcher der Benutzer z. B. einen vorge
gebenen Text sprechen muss, den ein Trainingssystem aufnimmt und zur Bestimmung der
Benutzergruppe verwendet. Diese Trainingsphase kann unabhängig von einer Benutzung
eines benutzergruppenspezifischen Musterverarbeitungssystems erfolgen. Sie kann jedoch
einem "neuen" Benutzer, d. h. einem Benutzer, dem noch keine Benutzergruppe zuge
wiesen wurde, auch bei Benutzung des Systems angeboten werden. Weiter ist es denkbar,
die während der Systembenutzung anfallenden Mustereingaben des Benutzers, die
vielleicht zunächst mit einer benutzerunabhängigen Musterverarbeitung behandelt wurden,
für die erstmalige oder auch die Neufestlegung der Benutzergruppe zu verwenden.
Letzteres könnte sich ergeben, wenn sich die Mustercharakteristik des Benutzers oder die
Benutzergruppen des Systems verändert haben.
Dem Fachmann sind z. B. aus der Literatur zahlreiche Verfahren aus dem Bereich der
Benutzeradaption bekannt, um eine solche Festlegung der Benutzergruppe vorzunehmen.
Manche dieser Verfahren wie z. B. das "speaker clustering" aus der Spracherkennung
führen dabei unmittelbar auf eine Benutzergruppe. Andere wie z. B. "adaptive speaker
clustering", MLLR oder MAP aus der Spracherkennung oder auch die "eigenfaces" aus der
Bilderkennung werden üblicherweise eingesetzt, um benutzerspezifische Musterver
arbeitungsdatensätze zu erhalten. Durch eine Quantelung, d. h. durch eine Beschränkung
der benutzerspezifischen Adaptionsparameter auf bestimmte Stufen, lässt sich jedoch die
Auflösung der Adaptionsverfahren so weit vergröbern, dass sich die gewünschte Anzahl an
Benutzergruppen einstellt.
Im Anspruch 3 wird beansprucht, dass die Festlegung der Benutzergruppe für den
Benutzer durch den Benutzer beeinflussbar ist. Es ist dabei z. B. denkbar, dass ein System
Benutzergruppen unterschiedlicher Güte anbietet. So kann ein System beispielsweise
Benutzergruppen hoher Güte anbieten, indem es für diese Gruppen z. B. sehr fein
aufgelöste akustische Referenzmodelle anbietet und sich in einer solchen Benutzergruppe
nur Benutzer sehr ähnlicher Sprech- und Verhaltensweisen befinden. Dadurch könnten
einer solchen Benutzergruppe z. B. bei einer Spracherkennung annähernd gute Erken
nungsgenauigkeiten geboten werden, wie dies bei benutzerabhängigen Systemen der Fall
wäre. Der dazu im System notwendige höhere Aufwand könnte über eine entsprechende
Preistarifstruktur an die Benutzer weitergegeben werden.
Die Unteransprüche 4 und 5 beziehen sich auf zwei vorteilhafte Möglichkeiten der
Benutzereingabe. Zum einen können Benutzereingaben an einem öffentlichen Benutzer
terminal wie z. B. einem eingangs erwähnten Informationskiosk oder aber einem Bank
automaten gemacht werden. Zum anderen kann ein Benutzer ein Telefon oder auch einen
PC oder Laptop benutzen, wobei seine Eingaben über ein Netzwerk, z. B. das Telefonnetz
oder das Internet, übermittelt werden.
Der Unteranspruch 6 spezifiziert einige mögliche Bestandteile eines benutzergruppen
spezifischen Musterverarbeitungsdatensatzes:
- - eine benutzergruppenspezifische Sprache und/oder Dialekt,
- - eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
- - ein benutzergruppenspezifisches akustisches Referenzmodell,
- - ein benutzergruppenspezifisches Vokabular,
- - ein benutzergruppenspezifsches Sprachmodell und/oder
- - ein benutzergruppenspezifisches Dialogmodell.
Dies sind typische Bestandteile eines solchen Datensatzes, der beispielsweise für eine
benutzergruppenspezifische Spracherkennung verwendet werden kann. Dabei können die
akustischen Referenzmodelle z. B. in der Form so genannter Hidden-Markov-Modelle für
die Laute einer Sprache vorliegen. Benutzergruppenspezifische Vokabularien enthalten
z. B. die typischerweise von einer Benutzergruppe für eine Anwendung verwendeten
Wörter. Sprachmodelle können alle Beziehungen zur Bildung einer Wortfolge also
beispielsweise auch grammatische Regeln oder semantische Präferenzen der Benutzer
gruppe umfassen, während Dialogmodelle die kennzeichnenden Muster der Interaktion
zwischen dem System und Benutzern einer Benutzergruppe angeben.
Neben der Spracherkennung umfasst die Erfindung auch andere Arten der benutzer
gruppenspezifischen Musterverarbeitung wie beispielsweise die benutzergruppenspezifische
Sprachkodierung, z. B. durch Verwendung benutzergruppenspezifischer Kodebücher. Aber
auch die benutzergruppenspezifische Handschrifterkennung und Mimikverarbeitung, z. B.
in Systemen zum "Online-Chatten" mit animierten Charakteren, so genannten Avataren,
fällt in den Bereich der Erfindung.
Im Anspruch 7 wird beansprucht, das System zur Beschaffung von Informationen wie z. B.
Fahrplan- oder touristischen Auskünften zu benutzen. Weiter wird beansprucht, das
System zu verwenden für die Vergabe von Aufträgen wie z. B. für das Tätigen von Ein
käufen an einem Automaten oder das Erledigen von Bankgeschäften über das Internet.
Diese und weitere Aspekte und Vorteile der Erfindung werden im Folgenden an Hand der
Ausführungsbeispiele und insbesondere an Hand der beigefügten Zeichnungen näher
erläutert. Es zeigen:
Fig. 1 und 2 Ausführungsformen des erfindungsgemäßen benutzergruppenspezifischen
Musterverarbeitungssystems,
Fig. 3 eine schematische Darstellung des Inhalts eines Datenspeichers für die
benutzergruppenspezifischen Musterverarbeitungsdatensätze,
Fig. 4 den Ablauf einer Benutzung eines erfindungsgemäßen
benutzergruppenspezifischen Musterverarbeitungssystems in Form eines
Flussdiagramms.
Die Fig. 1 zeigt eine Ausführungsform des erfindungsgemäßen benutzergruppen
spezifischen Musterverarbeitungssystems, das für die Benutzereingaben ein öffentliches
Benutzerterminal 10 vorsieht. Typische Anwendungen einer solcher Ausführungsform der
Erfindung sind die Erledigung von Bankgeschäften an Bankautomaten 10, der Abruf von
Informationen an den eingangs erwähnten Informationskiosken 10 oder auch der Kauf von
Fahrkarten an Fahrkartenautomaten 10.
Das öffentliche Benutzerterminal 10 verfügt über eine graphische Ausgabeeinheit (Dis
play) 11, eine Eingabetastatur 12, ein Mikrofon 13 zur Eingabe sprachlicher Äußerungen
eines Benutzers und einen Eingabeschlitz 14 für eine benutzereigene Chipkarte 70, z. B.
eine EC- oder Kundenkarte. Weiterhin enthält es eine lokale Spracherkennungsvor
richtung 42, die über einen lokalen Datenspeicher 32 zur Speicherung von benutzer
gruppenspezifischen Musterverarbeitungsdatensätzen zur benutzergruppenspezifischen
Sprachverarbeitung verfügt. Auf der benutzereigenen Chipkarte 70, die zur Benutzung des
Systems in den Eingabeschlitz 14 eingeschoben wird, befindet sich z. B. ein Chip 71 zur
Speicherung für die Anwendung typischer Daten, beispielsweise für eine Bankkarte die
Kontonummer des Girokontos, sowie ein weiterer Chip 72 zur Speicherung einer ein
deutigen Kennzeichnung der für die benutzergruppenspezifische Sprachverarbeitung
festgelegten Benutzergruppe des Benutzers.
Eine solche eindeutige Kennzeichnung kann z. B. aus einer Nummer bestehen, denkbar ist
aber auch ein symbolischer Name, beispielsweise der Name einer öffentlich bekannten
Person, die ebenfalls zu dieser Benutzergruppe gehört, so dass ihre Sprachverarbeitungs
charakteristik typisch für die Benutzergruppe ist. Insbesondere ein solcher symbolischer
Name aber auch eine Nummer lassen sich von einem Benutzer gut erinnern, so dass eine
solche eindeutige Kennzeichnung dem Musterverarbeitungssystem auch ohne Hilfe einer
Chipkarte z. B. über das Mikrofon 13 oder die Eingabetastatur 12 übermittelt werden
kann. In diesem Fall entfiele dann der Chip 72 auf der Chipkarte 70. Weiter können alle
Informationen auf der Chipkarte 70 inklusive einer eventuellen Benutzergruppenkenn
zeichnung auch auf einem einzigen Chip 71 untergebracht werden.
Speichert man alle benutzergruppenspezifischen Musterverarbeitungsdatensätze auf dem
lokalen Datenspeicher 32, so kann die lokale Spracherkennungsvorrichtung 42 vollständig
lokal arbeiten. Ein solcher "stand alone" Automat eignet sich z. B. besonders gut für den
Verkauf von Zigaretten oder anderen direkt im Automaten verfügbaren Waren. Das
öffentliche Benutzerterminal 10 kann aber auch über ein Netzwerk 20 mit weiteren
Datenspeichern 30 . . . 31 zur Speicherung von benutzergruppenspezifischen Musterver
arbeitungsdatensätzen zur benutzergruppenspezifischen Spracherkennung verbunden
werden. Bei dem Netzwerk 20 kann es sich dabei z. B. um ein privates MAN (Metro
politan Area Network), beispielsweise das Netzwerk einer Bank, handeln. Das Netzwerk 20
kann aber auch durch ein öffentliches Netzwerk und insbesondere durch das Internet reali
siert werden. Als Mischform sind auch beispielsweise auf Basis des Internets verwirklichte
VPNs (Virtual Private Networks) möglich.
Fig. 2 zeigt eine weitere Ausführungsform des erfindungsgemäßen benutzergruppen
spezifischen Musterverarbeitungssystems. Wie in Fig. 1 sind wieder das Netzwerk 20 und
die daran angeschlossenen Datenspeicher 30 . . . 31 dargestellt. Im Gegensatz zu Fig. 1 sind
jedoch auch die Spracherkennungsvorrichtungen 40 . . . 41 an das Netzwerk 20 ange
schlossen. Die Benutzereingaben erfolgen hier an einem öffentlichen Benutzerterminal 10,
das jedoch im Gegensatz zu Fig. 1 über keine lokale Spracherkennungsvorrichtung 42 mit
lokalem Datenspeicher 32 verfügt, oder über ein Telefon 60 oder auch über einen PC,
Laptop oder dergleichen 50, die alle dafür am Netzwerk 20 angeschlossen sind bzw. dazu
damit verbunden werden können. Diese und andere Eingabemöglichkeiten wie z. B. das in
Fig. 1 gezeigte öffentliche Benutzerterminal 10 mit lokaler Spracherkennungsvorrich
tung 42 können in einem benutzergruppenspezifischen Musterverarbeitungssystem alle
oder auch nur teilweise verwirklicht werden.
Die in den Fig. 1 und 2 dargestellten Szenarien unterscheiden sich also vor allem in der
Anordnung der Spracherkennungsvorrichtung 42 bzw. 40 . . . 41, in der die Erkennung der
sprachlichen Äußerungen eines Benutzers erfolgt. Die in Fig. 1 lokal im öffentlichen
Benutzerterminal 10 untergebrachte Spracherkennungsvorrichtung 42 eignet sich
besonders für den Fall, dass nur einfache Kommandos erkannt werden müssen und das
öffentliche Benutzerterminal 10 hauptsächlich von immer denselben Kunden benutzt wird.
In diesem Fall genügt eine relativ einfache und kostengünstige Spracherkennungsvor
richtung 42 und zur benutzergruppenspezifischen Spracherkennung können die benutzer
gruppenspezifischen Musterverarbeitungsdatensätze der Hauptnutzer auf dem lokalen
Datenspeicher 32 der Spracherkennungsvorrichtung 42 gehalten werden. Weitere
benutzergruppenspezifischen Musterverarbeitungsdatensätze, die z. B. von durchreisenden
Benutzern benötigt werden und die nicht lokal im Datenspeicher 32 vorhanden sind,
werden von den über das Netzwerk 20 angeschlossenen Datenspeichern 30 . . . 31 geladen.
Dadurch ergibt sich insgesamt nur eine geringe Belastung des Netzwerkes 20.
In Fig. 2 erfolgt die Spracherkennung der sprachlichen Äußerungen eines Benutzers in den
über das Netzwerk angeschlossenen Spracherkennungsvorrichtungen 40 . . . 41. Dies ist
sinnvoll bei komplexeren Sprachäußerungen, die eine hohe Erkennungsleistung erfordern
und/oder bei ständig wechselnden Benutzern. Durch die Bündelung der Spracherken
nungsaufgaben und der Datenhaltung ergeben sich Vorteile in der Maschinenauslastung,
dem benötigten Speicherplatz und dem nötigen Datenverkehr über das Netzwerk 20. So
kann es z. B. sinnvoll sein, innerhalb des Netzwerkes 20 die Spracherkennungsvorrich
tungen 40 . . . 41 untereinander und mit den Datenspeichern 30 . . . 31 mit einem breit
bandigen Subnetz zu verbinden. Auch kann es gegebenenfalls von Vorteil sein, die
Erkennung der sprachlichen Äußerungen einzelner Benutzer möglichst immer derselben
Spracherkennungsvorrichtung 40 . . . 41 zuzuweisen, die dann die benutzergruppen
spezifischen Musterverarbeitungsdatensätze dieser Benutzer wieder in lokalen Daten
speichern halten kann.
Neben den gerade erwähnten Systemausgestaltungen sind für den Fachmann je nach Ein
satzgebiet auch viele weitere Varianten ohne weiteres ausführbar. Hier soll daher nur noch
die Technik der gespiegelten Datenhaltung erwähnt werden, die hinreichend aus der Lehre
der verteilten Datenbanken bekannt ist. Dabei werden die Daten eines Benutzers, d. h.
hier einer Benutzergruppe, in mehreren, i. d. R räumlich weit getrennten Datenspeichern,
z. B. in Fig. 1 in den Speichern 32 und 30 . . . 31, gehalten, um dem Benutzer auch bei
hoher Belastung des Netzwerkes 20 schnellen Zugriff auf seine Daten zu gestatten. Die
Konsistenz der Datenhaltung in den einzelnen Speichern wird dann durch geeignete
Synchronisationsprozeduren sichergestellt, die weniger zeitkritisch sind und ggf. zu Zeiten
geringerer Netzwerkbelastung abgearbeitet werden können.
Eine nächste Ausführungsform der Erfindung ergibt sich dadurch, wenn die benutzer
gruppenspezifischen Musterverarbeitungsdatensätze zur benutzergruppenspezifischen
Musterverarbeitung nicht in systemeigenen Datenspeichern gehalten werden, sondern
beispielsweise von einem dritten Provider oder auch von einem Benutzer selbst (für seine
eigene Benutzergruppe) zur Verfügung gestellt werden. Im ersten Fall können sich dritte
Unternehmen auf das Erstellen, Verwalten und/oder Aktualisieren der benutzergruppen
spezifischen Musterverarbeitungsdatensätze spezialisieren, um diese dann z. B. gegen
Lizenzgebühren den Betreibern der benutzergruppenspezifischen Musterverarbeitungs
systeme zur Verfügung zu stellen. Dritte Unternehmen können sich aber auch um die
Festlegung der Benutzergruppenzugehörigkeit für die Benutzer kümmern.
Im zweiten Fall würde ein Benutzer selbst die benutzergruppenspezifischen Musterver
arbeitungsdatensätze seiner Benutzergruppe z. B. aus einem der Datenspeicher 32,
30 . . . 31 eines benutzergruppenspezifischen Musterverarbeitungssystems herunterladen.
Bei Benutzung eines anderen benutzergruppenspezifischen Musterverarbeitungssystems,
das nicht selbst über die benutzergruppenspezifischen Musterverarbeitungsdatensätze seiner
Benutzergruppe verfügt, kann er diese Daten dann auf dem Laptop 50 dem System zur
Verfügung stellen. Allgemein kann er sie jedoch auch über einen an das Netzwerk 20, also
insbesondere an das Internet angeschlossenen PC zur Verfügung stellen, wobei er dann
dem System die Adresse dieses PC's mitteilen würde. In diesem Szenario übernimmt damit
die Mitteilung der Adresse des PC's oder Laptops 50 die Rolle der Mitteilung der ein
deutigen Kennzeichnung der Benutzergruppe.
Während in den obigen Ausführungsbeispielen als Benutzerendgeräte zum Systemzugang
öffentliche Benutzerterminals 10 mittlerer Komplexität, Telefone 60 und PC's oder Lap
tops 50 benutzt wurden, sind auch andere Lösungen möglich. Beispiele sind Mobiltelefone
und Informationskioske mit komplexen multimedialen Interaktionsmöglichkeiten wie
Touchscreens, Kameras, Lautsprechern, etc.
Fig. 3 zeigt eine schematische Darstellung des Inhalts eines Datenspeichers 30 für die
benutzergruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81. Bei dem Daten
speicher 30, der hier stellvertretend steht sowohl für die lokalen Datenspeicher 32 wie auch
für die am Netzwerk 20 angeschlossenen weiteren Datenspeicher 30 . . . 31, handelt es sich
dabei um einen bekannten Computerdatenspeicher, z. B. eine Festplatte. Die benutzer
gruppenspezifischen Musterverarbeitungsdatensätze 80 . . . 81 können in Form einzelner
Dateien vorliegen, die in für das benutzergruppenspezifische Musterverarbeitungssystem
geeigneter Weise z. B. binär kodiert sind. Möglich ist aber auch eine Organisation in Form
einer Datenbank oder dergleichen.
Fig. 4 zeigt einen möglichen Ablauf einer Benutzung eines erfindungsgemäßen benutzer
gruppenspezifischen Musterverarbeitungssystems in Form eines Flussdiagramms. Dabei
wird nur auf die Vorgänge eingegangen, die für die benutzergruppenspezifische Musterver
arbeitung von Bedeutung sind, während anwendungsspezifische Aktionen wie z. B. das
Mitteilen einer Kontonummer und einer PIN für eine Bankanwendung hier nicht darge
stellt sind.
Nach dem Startblock 101 fordert das benutzergruppenspezifische Musterverarbeitungs
system einen Benutzer im Prozessblock 102 auf, ihm seine Benutzergruppe bekannt zu
geben, d. h. dem System eine eindeutige Kennzeichnung der für den Benutzer festgelegten
Benutzergruppe für die benutzergruppenspezifische Musterverarbeitung zu übergeben.
Nach dem Entscheidungsblock 103 verzweigt die weitere Bearbeitung, je nachdem, ob
dem Benutzer seine Benutzergruppe bekannt ist oder nicht.
Kennt der Benutzer seine Benutzergruppe, so teilt er diese im Block 104 dem System mit,
indem er z. B. in den Szenarien der Fig. 1 und 2 die Chipkarte 70 in den Eingabeschlitz 14
eines öffentlichen Benutzerterminals 10 schiebt, die Eingabetastatur 12 oder das Mikro
fon 13 des öffentlichen Benutzerterminals 10 benutzt oder die Benutzergruppe über ein
Telefon 60 oder einen Laptop 50 dem System bekannt gibt. Das System sucht dann im
Block 105 den zur Benutzergruppe des Benutzers gehörigen benutzergruppenspezifischen
Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 auf und stellt ihn einer
Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung.
Kennt dagegen der Benutzer seine Benutzergruppe nicht, so fragt ihn das System im
Block 106, ob er möchte, dass das System jetzt eine Benutzergruppe für ihn festlegen soll.
Möchte er dies, so sammelt das System im Block 107 Trainingsmustereingaben des
Benutzers und verarbeitet diese zur Festlegung einer Benutzergruppe für den Benutzer. Im
Block 108 wird dem Benutzer die so festgelegte Benutzergruppe mitgeteilt und die Kon
trolle geht über in den schon beschriebenen Block 105, in dem der zur Benutzergruppe des
Benutzers gehörige benutzergruppenspezifische Musterverarbeitungsdatensatz in einem
Datenspeicher 32, 30 . . . 31 aufgesucht und einer Musterverarbeitungsvorrichtung 42, 40 . . . 41
zur Verfügung gestellt wird.
Möchte der Benutzer jetzt aber keine Benutzergruppe für sich festlegen lassen, z. B. weil er
dazu jetzt keine Zeit hat oder weil ihm bereits eine Benutzergruppe zugewiesen wurde,
deren eindeutige Kennzeichnung er jedoch im Moment nicht zur Verfügung hat, so ver
zweigt die Kontrolle nach Block 106 zu Block 109. Dort wird ein benutzerunabhängiger
Musterverarbeitungsdatensatz in einem Datenspeicher 32, 30 . . . 31 aufgesucht und einer
Musterverarbeitungsvorrichtung 42, 40 . . . 41 zur Verfügung gestellt, so dass die nach
folgenden Musterverarbeitungsschritte dann unabhängig von den speziellen Charakteristika
des Benutzers durchgeführt werden.
Der der Musterverarbeitungsvorrichtung 42, 40 . . . 41 in einem der Blöcke 105 bzw. 109
zur Verfügung gestellte benutzergruppenspezifische bzw. benutzerunabhängige Musterver
arbeitungsdatensatz kann dabei noch von weiteren Bedingungen abhängen. So kann
beispielsweise für unterschiedliche Anwendungen, unterschiedliche Umgebungsbedingun
gen, also z. B. unterschiedliche Hintergrundgeräusche bei Spracherkennung, oder unter
schiedliche Terminals für die Benutzereingaben, wie Mikrofontyp bei Spracheingabe oder
Kameratyp bei Gestikerkennung, ein jeweils daran angepasster Musterverarbeitungsdaten
satz verwendet werden.
Nach den jeweiligen Blöcken 105 bzw. 109 erfolgt im Block 110 die Verarbeitung einer
Mustereingabe des Benutzers, d. h. der Benutzer wird zu einer Mustereingabe aufgefordert
und die Mustereingabe wird aufgenommen und verarbeitet. Bei solchen Mustereingaben
kann es sich dabei um über ein Mikrofon 13 oder ein Telefon 60 eingegebene sprachliche
Äußerungen handeln. Möglich sind aber auch Eingaben von handschriftlichem Text
und/oder Zeigeereignissen zur Auswahl eines auf dem Display 11 angebotenen Menü
punktes. Dazu ließe sich beispielsweise das Display 11 des öffentlichen Benutzer
terminals 10 als Touchscreen ausführen und/oder man könnte das öffentliche Benutzer
terminal 10 mit einer Kamera ausrüsten.
Optional können die im Block 110 gemachten Mustereingaben des Benutzers auch
zwischengespeichert und z. B. zur Überprüfung der Benutzergruppenfestlegung für den
Benutzer herangezogen werden. Sind ausreichend Benutzereingaben für eine solche Über
prüfung gesammelt worden und wird festgestellt, dass die momentane Benutzergruppen
festlegung für den Benutzer unter Musterverarbeitungsgesichtspunkten nicht optimal ist,
so kann das System in Absprache mit dem Benutzer einen besser geeigneten benutzer
gruppenspezifischen Musterverarbeitungsdatensatz in eine Musterverarbeitungsvorrichtung
42, 40 . . . 41 laden, um damit die weiteren Musterverarbeitungsschritte durchzuführen.
Ein solches Vorgehen ist z. B. auch dann durchführbar, wenn die bisherige Musterver
arbeitung mit einem benutzerunabhängigen Musterverarbeitungsdatensatz durchgeführt
wurde.
Im Block 111 werden die der Mustereingabe des Benutzers entsprechenden Aktionen
durchgeführt, so z. B. bei einer Bankanwendung Kontostände auf dem Display 11 des
öffentlichen Benutzerterminals 10 dargestellt. Gegebenenfalls können aber auch Rück
fragen an den Benutzer gestellt werden. Auch kann der Benutzer zu weiteren Eingaben wie
z. B. einer fehlenden Bankleitzahl aufgefordert werden.
Im Block 112 wird entschieden, ob die Interaktion mit dem Benutzer beendet ist. Ist dies
nicht der Fall, so tritt die Kontrolle wieder in Block 110 ein, um die nächste Musterein
gabe des Benutzers zu verarbeiten. Ist die Interaktion mit dem Benutzer dagegen beendet,
so wird ggf. (entsprechend den obigen Ausführungen zu Block 110) im Block 113 die neue
bzw. veränderte Benutzergruppe für den Benutzer auf die Datenspeicher 32, 30 . . . 31
gespeichert, sofern diese Daten bisher beispielsweise nur lokal in einer der Spracherken
nungsvorrichtungen 42, 40 . . . 41 gehalten wurden. Danach beendet das System im
Block 114 die Bearbeitung der Benutzereingaben.
Die Beendigung der Interaktion mit dem Benutzer im Block 112 kann z. B. durch die
Erkennung einer bejahenden Antwort des Benutzers im Block 110 auf eine entsprechende
vorherige Systemfrage erfolgen. Alternativ oder zusätzlich kann man jedoch auch eine
Abbruchtaste innerhalb der Eingabetastatur 12 des öffentlichen Benutzerterminals 10
vorsehen, die zu jedem Zeitpunkt der Mensch-Maschine-Kommunikation ausgelöst
werden kann. Weitere, für den Fachmann naheliegende Variationen sind denkbar.
In den Blöcken 107 und 113 wurde die Möglichkeit vorgesehen, eine Benutzergruppen
festlegung für den Benutzer während einer solchen Mensch-Maschine-Kommunikation
neu zu erstellen, sowie in den Blöcken 110 und 113 eine solche Benutzergruppenfest
legung zu modifizieren. Die Erstellung oder Modifikation der Benutzergruppenfestlegung
muss aber nicht im Rahmen einer Benutzung des Systems z. B. zur Erledigung von Bank
geschäften erfolgen, sondern kann auch separat für sich vorgenommen werden.
Diese Möglichkeit erscheint z. B. besonders interessant für eines der in Fig. 2 dargestellten
Szenarien, in dem ein Benutzer in Ruhe von zu Hause aus seine Benutzergruppe festlegen
lassen kann. Dabei kann er dann beispielsweise von einem Systembetreiber zur Verfügung
gestellte Software lokal auf seinem Laptop 50 einsetzen und/oder die z. B. über das Inter
net erreichbare Infrastruktur des Betreibers wie Prozessoren, Programme und/oder Daten
speicher benutzen. Aber auch das in Fig. 4 beschriebene Szenario der Benutzergruppenfest
legung direkt am öffentlichen Benutzerterminal 10 hat seine Berechtigung, da diese Fest
legung besser an die Benutzungsverhältnisse dieser Maschine wie z. B. Mikrofon- oder
Kameraeigenschaften oder Umgebungsgeräusche angepasst ist.
Während in Fig. 4 wesentliche Aspekte eines erfindungsgemäßen Verfahrens zur benutzer
gruppenspezifischen Musterverarbeitung erläutert wurden, ist es für den Fachmann offen
sichtlich, dass ein solches Verfahren in der Praxis noch weitere Mechanismen beispielsweise
zur Behandlung von Fehlersituationen enthalten muss. So kann es z. B. vorkommen, dass
einem System die von einem anderen System festgelegte Benutzergruppe eines Benutzers
nicht bekannt ist. Dann kann das System sich zur Fehlerbehandlung beispielsweise genauso
verhalten wie in dem ab Block 106 beschriebenen Fall, dass dem Benutzer seine Benutzer
gruppe z. Z. nicht bekannt ist.
Claims (8)
1. Verfahren zur Musterverarbeitung, insbesondere zur Sprachverarbeitung, mit den
Verfahrensschritten:
- - Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
- - Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet
dass die Festlegung der Benutzergruppe für den Benutzer in einer Trainingsphase erfolgt.
3. Verfahren nach Anspruch 1 oder 2,
dadurch gekennzeichnet,
dass die Festlegung der Benutzergruppe für den Benutzer durch den Benutzer beeinflussbar
ist.
4. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet,
dass Benutzereingaben an einem öffentlichen Benutzerterminal (10), insbesondere einem
Bankterminal, einem Fahrkartenautomaten oder einem Informationskiosk, gemacht
werden.
5. Verfahren nach einem der Ansprüche 1 bis 4,
dadurch gekennzeichnet,
dass Benutzereingaben über ein Netzwerk (20), insbesondere das Internet, übermittelt
werden.
6. Verfahren nach einem der Ansprüche 1 bis 5,
dadurch gekennzeichnet,
dass zu einem benutzergruppenspezifischen Musterverarbeitungsdatensatz (80 . . . 81) zur benutzergruppenspezifischen Spracherkennung
eine benutzergruppenspezifische Sprache und/oder Dialekt,
eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
ein benutzergruppenspezifsches akustisches Referenzmodell,
ein benutzergruppenspezifisches Vokabular,
ein benutzergruppenspezifisches Sprachmodell und/oder
ein benutzergruppenspezifisches Dialogmodell
gehören.
dass zu einem benutzergruppenspezifischen Musterverarbeitungsdatensatz (80 . . . 81) zur benutzergruppenspezifischen Spracherkennung
eine benutzergruppenspezifische Sprache und/oder Dialekt,
eine benutzergruppenspezifische Merkmalsextraktion, insbesondere eine benutzergruppenspezifische Vokaltraktlängennormierung,
ein benutzergruppenspezifsches akustisches Referenzmodell,
ein benutzergruppenspezifisches Vokabular,
ein benutzergruppenspezifisches Sprachmodell und/oder
ein benutzergruppenspezifisches Dialogmodell
gehören.
7. Verwendung eines Verfahrens nach einem der Ansprüche 1 bis 6 zur Beschaffung von
Informationen und/oder zur Vergabe von Aufträgen, insbesondere zur Erledigung von
Bankgeschäften.
8. Musterverarbeitungssystem, insbesondere Sprachverarbeitungssystem, das
zur Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
zur Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers vorgesehen ist.
zur Entgegennahme (104) einer eindeutigen Kennzeichnung einer für den Benutzer festgelegten Benutzergruppe und
zur Verwendung (105) eines für die Benutzergruppe spezifischen Musterverarbeitungsdatensatzes (80 . . . 81) für die Verarbeitung (110) einer Mustereingabe des Benutzers vorgesehen ist.
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2001127559 DE10127559A1 (de) | 2001-06-06 | 2001-06-06 | Benutzergruppenspezifisches Musterverarbeitungssystem |
EP02735724A EP1402518B1 (de) | 2001-06-06 | 2002-06-05 | Für eine benutzergruppe spezifisches musterverarbeitungssystem |
JP2003502817A JP4837887B2 (ja) | 2001-06-06 | 2002-06-05 | ユーザ・グループに固有のパターン処理システム |
AT02735724T ATE340399T1 (de) | 2001-06-06 | 2002-06-05 | Für eine benutzergruppe spezifisches musterverarbeitungssystem |
US10/479,554 US20040148165A1 (en) | 2001-06-06 | 2002-06-05 | Pattern processing system specific to a user group |
DE2002614850 DE60214850T2 (de) | 2001-06-06 | 2002-06-05 | Für eine benutzergruppe spezifisches musterverarbeitungssystem |
PCT/IB2002/002055 WO2002099785A1 (en) | 2001-06-06 | 2002-06-05 | Pattern processing system specific to a user group |
US13/589,394 US9009043B2 (en) | 2001-06-06 | 2012-08-20 | Pattern processing system specific to a user group |
US14/637,049 US9424838B2 (en) | 2001-06-06 | 2015-03-03 | Pattern processing system specific to a user group |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2001127559 DE10127559A1 (de) | 2001-06-06 | 2001-06-06 | Benutzergruppenspezifisches Musterverarbeitungssystem |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10127559A1 true DE10127559A1 (de) | 2002-12-12 |
Family
ID=7687445
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2001127559 Withdrawn DE10127559A1 (de) | 2001-06-06 | 2001-06-06 | Benutzergruppenspezifisches Musterverarbeitungssystem |
DE2002614850 Expired - Lifetime DE60214850T2 (de) | 2001-06-06 | 2002-06-05 | Für eine benutzergruppe spezifisches musterverarbeitungssystem |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2002614850 Expired - Lifetime DE60214850T2 (de) | 2001-06-06 | 2002-06-05 | Für eine benutzergruppe spezifisches musterverarbeitungssystem |
Country Status (6)
Country | Link |
---|---|
US (3) | US20040148165A1 (de) |
EP (1) | EP1402518B1 (de) |
JP (1) | JP4837887B2 (de) |
AT (1) | ATE340399T1 (de) |
DE (2) | DE10127559A1 (de) |
WO (1) | WO2002099785A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007132404A3 (en) * | 2006-05-12 | 2008-05-08 | Koninkl Philips Electronics Nv | Method for changing over from a first adaptive data processing version to a second adaptive data processing version |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030220788A1 (en) * | 2001-12-17 | 2003-11-27 | Xl8 Systems, Inc. | System and method for speech recognition and transcription |
US7881822B2 (en) * | 2004-05-05 | 2011-02-01 | Provision Interactive Technologies, Inc. | System and method for dispensing consumer products |
KR100897553B1 (ko) * | 2007-01-04 | 2009-05-15 | 삼성전자주식회사 | 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치 |
US20130325483A1 (en) * | 2012-05-29 | 2013-12-05 | GM Global Technology Operations LLC | Dialogue models for vehicle occupants |
US20130325449A1 (en) | 2012-05-31 | 2013-12-05 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US10431235B2 (en) | 2012-05-31 | 2019-10-01 | Elwha Llc | Methods and systems for speech adaptation data |
US9620128B2 (en) | 2012-05-31 | 2017-04-11 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US10395672B2 (en) | 2012-05-31 | 2019-08-27 | Elwha Llc | Methods and systems for managing adaptation data |
CN104412322B (zh) * | 2012-06-29 | 2019-01-18 | 埃尔瓦有限公司 | 用于管理适应数据的方法和系统 |
KR101619262B1 (ko) * | 2014-11-14 | 2016-05-18 | 현대자동차 주식회사 | 음성인식 장치 및 방법 |
KR20170034227A (ko) * | 2015-09-18 | 2017-03-28 | 삼성전자주식회사 | 음성 인식 장치 및 방법과, 음성 인식을 위한 변환 파라미터 학습 장치 및 방법 |
US10268683B2 (en) * | 2016-05-17 | 2019-04-23 | Google Llc | Generating output for presentation in response to user interface input, where the input and/or the output include chatspeak |
TWI682386B (zh) * | 2018-05-09 | 2020-01-11 | 廣達電腦股份有限公司 | 整合式語音辨識系統及方法 |
US11961522B2 (en) * | 2018-11-28 | 2024-04-16 | Samsung Electronics Co., Ltd. | Voice recognition device and method |
JP7261096B2 (ja) * | 2019-06-13 | 2023-04-19 | 株式会社日立製作所 | 計算機システム、モデル生成方法及びモデル管理プログラム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101468A (en) * | 1992-11-13 | 2000-08-08 | Dragon Systems, Inc. | Apparatuses and methods for training and operating speech recognition systems |
JPH08123461A (ja) * | 1994-10-20 | 1996-05-17 | Hitachi Ltd | 個人情報カードを用いた音声インタフェースシステム |
US5895447A (en) * | 1996-02-02 | 1999-04-20 | International Business Machines Corporation | Speech recognition using thresholded speaker class model selection or model adaptation |
US6665639B2 (en) * | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US6167377A (en) * | 1997-03-28 | 2000-12-26 | Dragon Systems, Inc. | Speech recognition language models |
US6182037B1 (en) * | 1997-05-06 | 2001-01-30 | International Business Machines Corporation | Speaker recognition over large population with fast and detailed matches |
JP2000089780A (ja) * | 1998-09-08 | 2000-03-31 | Seiko Epson Corp | 音声認識方法および音声認識装置 |
US6253181B1 (en) * | 1999-01-22 | 2001-06-26 | Matsushita Electric Industrial Co., Ltd. | Speech recognition and teaching apparatus able to rapidly adapt to difficult speech of children and foreign speakers |
US6487530B1 (en) * | 1999-03-30 | 2002-11-26 | Nortel Networks Limited | Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models |
US7505905B1 (en) * | 1999-05-13 | 2009-03-17 | Nuance Communications, Inc. | In-the-field adaptation of a large vocabulary automatic speech recognizer (ASR) |
JP2000347684A (ja) * | 1999-06-02 | 2000-12-15 | Internatl Business Mach Corp <Ibm> | 音声認識システム |
US6442519B1 (en) * | 1999-11-10 | 2002-08-27 | International Business Machines Corp. | Speaker model adaptation via network of similar users |
EP1134725A1 (de) * | 2000-03-15 | 2001-09-19 | Siemens Aktiengesellschaft | Anpassung automatischer Spracherkennungssysteme an spezifische Charakteristika von einzelnen Sprechergruppen zur Verbesserung der Erkennungsleistung |
US6493669B1 (en) * | 2000-05-16 | 2002-12-10 | Delphi Technologies, Inc. | Speech recognition driven system with selectable speech models |
US20020046030A1 (en) * | 2000-05-18 | 2002-04-18 | Haritsa Jayant Ramaswamy | Method and apparatus for improved call handling and service based on caller's demographic information |
AU2001269521A1 (en) * | 2000-07-13 | 2002-01-30 | Asahi Kasei Kabushiki Kaisha | Speech recognition device and speech recognition method |
US6735563B1 (en) * | 2000-07-13 | 2004-05-11 | Qualcomm, Inc. | Method and apparatus for constructing voice templates for a speaker-independent voice recognition system |
DE10047724A1 (de) * | 2000-09-27 | 2002-04-11 | Philips Corp Intellectual Pty | Verfahren zur Ermittlung eines Eigenraumes zur Darstellung einer Mehrzahl von Trainingssprechern |
DE10047718A1 (de) * | 2000-09-27 | 2002-04-18 | Philips Corp Intellectual Pty | Verfahren zur Spracherkennung |
US6823306B2 (en) * | 2000-11-30 | 2004-11-23 | Telesector Resources Group, Inc. | Methods and apparatus for generating, updating and distributing speech recognition models |
US7103549B2 (en) * | 2001-03-22 | 2006-09-05 | Intel Corporation | Method for improving speech recognition performance using speaker and channel information |
US6785647B2 (en) * | 2001-04-20 | 2004-08-31 | William R. Hutchison | Speech recognition system with network accessible speech processing resources |
-
2001
- 2001-06-06 DE DE2001127559 patent/DE10127559A1/de not_active Withdrawn
-
2002
- 2002-06-05 EP EP02735724A patent/EP1402518B1/de not_active Expired - Lifetime
- 2002-06-05 AT AT02735724T patent/ATE340399T1/de not_active IP Right Cessation
- 2002-06-05 DE DE2002614850 patent/DE60214850T2/de not_active Expired - Lifetime
- 2002-06-05 US US10/479,554 patent/US20040148165A1/en not_active Abandoned
- 2002-06-05 JP JP2003502817A patent/JP4837887B2/ja not_active Expired - Lifetime
- 2002-06-05 WO PCT/IB2002/002055 patent/WO2002099785A1/en active IP Right Grant
-
2012
- 2012-08-20 US US13/589,394 patent/US9009043B2/en not_active Expired - Fee Related
-
2015
- 2015-03-03 US US14/637,049 patent/US9424838B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007132404A3 (en) * | 2006-05-12 | 2008-05-08 | Koninkl Philips Electronics Nv | Method for changing over from a first adaptive data processing version to a second adaptive data processing version |
US9009695B2 (en) | 2006-05-12 | 2015-04-14 | Nuance Communications Austria Gmbh | Method for changing over from a first adaptive data processing version to a second adaptive data processing version |
Also Published As
Publication number | Publication date |
---|---|
EP1402518B1 (de) | 2006-09-20 |
US20150179164A1 (en) | 2015-06-25 |
ATE340399T1 (de) | 2006-10-15 |
DE60214850D1 (de) | 2006-11-02 |
US20120310647A1 (en) | 2012-12-06 |
US9009043B2 (en) | 2015-04-14 |
DE60214850T2 (de) | 2007-05-10 |
WO2002099785A1 (en) | 2002-12-12 |
JP2004529390A (ja) | 2004-09-24 |
JP4837887B2 (ja) | 2011-12-14 |
US9424838B2 (en) | 2016-08-23 |
US20040148165A1 (en) | 2004-07-29 |
EP1402518A1 (de) | 2004-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69327188T2 (de) | Einrichtung für automatische Spracherkennung | |
DE10127559A1 (de) | Benutzergruppenspezifisches Musterverarbeitungssystem | |
DE60017000T2 (de) | Verfahren zur zielorientierten Sprachübersetzung mittels Extraktion der Bedeutung und Dialog | |
DE102012212185B4 (de) | Pflegen und Bereitstellen von Sprachmodellen | |
DE60313706T2 (de) | Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium | |
DE69622565T2 (de) | Verfahren und vorrichtung zur dynamischen anpassung eines spracherkennungssystems mit grossem wortschatz und zur verwendung von einschränkungen aus einer datenbank in einem spracherkennungssystem mit grossem wortschatz | |
EP1926081A1 (de) | Verfahren zur Dialoganpassung und Dialogsystem zur Durchführung | |
DE60123153T2 (de) | Sprachgesteuertes Browsersystem | |
EP1071075A2 (de) | Verfahren zur Eingabe von Daten in ein System | |
DE60133537T2 (de) | Automatisches umtrainieren eines spracherkennungssystems | |
DE10110977C1 (de) | Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem | |
DE112018007578T5 (de) | Dialogsystem, das zu Semantik-Verständnis-Mapping zwischen Benutzerabsichten und Maschinenservices fähig ist | |
DE102020215954A1 (de) | Dialogsystem und verfahren zum steuern desselben | |
EP1361737A1 (de) | Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen | |
EP1159733B1 (de) | Verfahren und anordnung zur bestimmung eines repräsentativen lautes | |
DE69333762T2 (de) | Spracherkennungssystem | |
DE69837428T2 (de) | Speichermedium mit elektronischer Schaltung und mit diesem Speichermedium augestatteter Sprachsynthesizer | |
DE112020004925T5 (de) | Aktualisieren und umsetzen eines dokuments aus einem audiovorgang | |
DE10220522B4 (de) | Verfahren und System zur Verarbeitung von Sprachdaten mittels Spracherkennung und Frequenzanalyse | |
EP1321851B1 (de) | Verfahren und System zum Nutzen von vom Nutzer frei zu wählenden Markierungsnamen als Einsprungposition in die Menustruktur eines Sprach-Dialogsystems | |
EP2012218B1 (de) | Verfahren zur Beeinflussung der Interpretation multimodaler Eingaben | |
DE60222413T2 (de) | Spracherkennung | |
EP1363271A1 (de) | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs | |
DE102019217751A1 (de) | Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem | |
DE102004011426B3 (de) | Vorrichtung zum Erkennen einer in einem Sprachsignal enthaltenen Emotion und Verfahren zum Erkennen einer in einem Sprachsignal enthaltenen Emotion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: PHILIPS INTELLECTUAL PROPERTY & STANDARDS GMBH, 20 |
|
8139 | Disposal/non-payment of the annual fee |