SpeechRecognition
Limited availability
This feature is not Baseline because it does not work in some of the most widely-used browsers.
Das SpeechRecognition
-Interface der Web Speech API ist das Kontrollinterface für den Erkennungsdienst; es behandelt auch das SpeechRecognitionEvent
, das vom Erkennungsdienst gesendet wird.
Hinweis: In einigen Browsern, wie Chrome, erfordert die Nutzung der Spracherkennung auf einer Webseite eine serverbasierte Erkennungs-Engine. Ihr Audio wird an einen Webdienst zur Erkennungsverarbeitung gesendet, sodass es offline nicht funktioniert.
Konstruktor
SpeechRecognition()
-
Erstellt ein neues
SpeechRecognition
-Objekt.
Instanz-Eigenschaften
SpeechRecognition
erbt auch Eigenschaften von seinem Elterninterface, EventTarget
.
SpeechRecognition.lang
-
Gibt die Sprache der aktuellen
SpeechRecognition
zurück und setzt sie. Wenn nicht angegeben, wird standardmäßig der HTML-Attributwertlang
oder die Spracheinstellung des User-Agents verwendet, sofern dieser nicht festgelegt ist. SpeechRecognition.continuous
-
Steuert, ob kontinuierliche Ergebnisse für jede Erkennung zurückgegeben werden oder nur ein einzelnes Ergebnis. Standardmäßig ist es auf ein einzelnes Ergebnis (
false
) festgelegt. SpeechRecognition.interimResults
-
Steuert, ob vorläufige Ergebnisse zurückgegeben werden sollen (
true
) oder nicht (false
). Vorläufige Ergebnisse sind Ergebnisse, die noch nicht endgültig sind (z.B. ist die EigenschaftSpeechRecognitionResult.isFinal
false
). SpeechRecognition.maxAlternatives
-
Legt die maximale Anzahl von
SpeechRecognitionAlternative
s pro Ergebnis fest. Der Standardwert ist 1. SpeechRecognition.phrases
Experimentell-
Legt ein Array von
SpeechRecognitionPhrase
-Objekten fest, die für kontextuelles Biasing verwendet werden. SpeechRecognition.processLocally
Experimentell-
Gibt an, ob die Spracherkennung lokal auf dem Gerät des Benutzers durchgeführt werden muss.
Veraltete Eigenschaften
Das Konzept der Grammatik wurde aus der Web Speech API entfernt. Verwandte Funktionen bleiben in der Spezifikation und werden von unterstützenden Browsern weiterhin für die Abwärtskompatibilität erkannt, haben jedoch keinen Einfluss auf die Spracherkennungsdienste.
SpeechRecognition.grammars
-
Gibt eine Sammlung von
SpeechGrammar
-Objekten zurück und setzt sie, die die von der aktuellenSpeechRecognition
verstandenen Grammatiken darstellen.
Statische Methoden
SpeechRecognition.available()
Experimentell-
Überprüft, ob die angegebenen Sprachen für die Spracherkennung verfügbar sind.
SpeechRecognition.install()
Experimentell-
Installiert die erforderlichen Sprachpakete für die geräteinterne Spracherkennung in den angegebenen Sprachen.
Instanz-Methoden
SpeechRecognition
erbt auch Methoden von seinem Elterninterface, EventTarget
.
SpeechRecognition.abort()
-
Stoppt den Spracherkennungsdienst, sodass er eingehende Audiodaten nicht mehr hört und keinen
SpeechRecognitionResult
zurückzugeben versucht. SpeechRecognition.start()
-
Startet den Spracherkennungsdienst, um eingehende Audiodaten (von einem Mikrofon oder einer Audiospur) zu hören, und gibt die Ergebnisse dieser Erkennung zurück.
SpeechRecognition.stop()
-
Stoppt den Spracherkennungsdienst vom Hören eingehender Audiodaten und versucht, basierend auf den bisher erfassten Ergebnissen eine
SpeechRecognitionResult
zurückzugeben.
Ereignisse
Hören Sie auf diese Ereignisse mit addEventListener()
oder indem Sie einen Ereignislistener der oneventname
-Eigenschaft dieses Interfaces zuweisen.
audiostart
-
Wird ausgelöst, wenn der User-Agent mit der Audioerfassung begonnen hat.
audioend
-
Wird ausgelöst, wenn der User-Agent die Audioerfassung abgeschlossen hat.
end
-
Wird ausgelöst, wenn der Spracherkennungsdienst getrennt wurde.
error
-
Wird ausgelöst, wenn ein Fehler bei der Spracherkennung auftritt.
nomatch
-
Wird ausgelöst, wenn der Spracherkennungsdienst ein endgültiges Ergebnis ohne signifikante Erkennung zurückgibt. Dies kann ein gewisses Maß an Erkennung beinhalten, das die
confidence
-Schwelle nicht erreicht oder überschreitet. result
-
Wird ausgelöst, wenn der Spracherkennungsdienst ein Ergebnis zurückgibt – ein Wort oder Satz wurde positiv erkannt und dies wurde an die App zurückgemeldet.
soundstart
-
Wird ausgelöst, wenn ein beliebiges Geräusch – erkennbarer Sprachklang oder nicht – erkannt wurde.
soundend
-
Wird ausgelöst, wenn ein beliebiges Geräusch – erkennbarer Sprachklang oder nicht – nicht mehr erkannt wird.
speechstart
-
Wird ausgelöst, wenn ein Geräusch, das von dem Spracherkennungsdienst als Sprache erkannt wird, erkannt wurde.
speechend
-
Wird ausgelöst, wenn Sprache, die vom Spracherkennungsdienst erkannt wurde, nicht mehr erkannt wird.
start
-
Wird ausgelöst, wenn der Spracherkennungsdienst beginnt, Audio zur Erkennung zu hören.
Beispiele
In unserem Speech color changer-Beispiel erstellen wir eine neue SpeechRecognition
-Objektinstanz mithilfe des SpeechRecognition()
-Konstruktors.
Nachdem einige andere Werte festgelegt wurden, stellen wir es so ein, dass der Erkennungsdienst startet, wenn ein Button geklickt wird (siehe SpeechRecognition.start()
). Wenn ein Ergebnis erfolgreich erkannt wurde, wird das result
-Ereignis ausgelöst, wir extrahieren die gesprochene Farbe aus dem Ereignisobjekt und setzen dann die Hintergrundfarbe des <html>
-Elements auf diese Farbe.
const recognition = new SpeechRecognition();
recognition.continuous = false;
recognition.lang = "en-US";
recognition.interimResults = false;
recognition.maxAlternatives = 1;
const diagnostic = document.querySelector(".output");
const bg = document.querySelector("html");
const startBtn = document.querySelector("button");
startBtn.onclick = () => {
recognition.start();
console.log("Ready to receive a color command.");
};
recognition.onresult = (event) => {
const color = event.results[0][0].transcript;
diagnostic.textContent = `Result received: ${color}`;
bg.style.backgroundColor = color;
};
Spezifikationen
Specification |
---|
Web Speech API> # speechreco-section> |
Browser-Kompatibilität
Loading…