DE1202517B - Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern - Google Patents
Einrichtung zur automatischen Erkennung von gesprochenen Silben oder WoerternInfo
- Publication number
- DE1202517B DE1202517B DET26689A DET0026689A DE1202517B DE 1202517 B DE1202517 B DE 1202517B DE T26689 A DET26689 A DE T26689A DE T0026689 A DET0026689 A DE T0026689A DE 1202517 B DE1202517 B DE 1202517B
- Authority
- DE
- Germany
- Prior art keywords
- signal
- occurrence
- sound
- flip
- flops
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010355 oscillation Effects 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims 1
- 230000001960 triggered effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electric Clocks (AREA)
Description
- Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Wörtern Die Erfindung betrifft eine Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Wörtern, z. B. Ziffernwörtern, bei der die den Schallschwingungen entsprechenden elektrischen Schwingungen in Zeitabständen auf in ihnen enthaltene Merkmale geprüft werden.
- Es sind bereits Vorschläge bekanntgeworden, die auf eine automatische Erkennung gesprochener Laute und Wörter abzielen. Geräte, die dies leisten, könnten mit Vorteil unter anderem für die Dateneingabe in Rechenmaschinen, die Nummernwahl beim Telefon, das Schreiben von Texten und die Steuerung von Maschinen eingesetzt werden.
- Ein bekannter Ansatz zur Lösung des Problems besteht darin, daß die den Schallschwingungen eines Lautes oder einer Lautverbindung entsprechenden elektrischen Schwingungen in Zeitabständen auf das jeweils in ihnen enthaltene Kurzzeitspektrum durch einen Raster von Bandfiltern geprüft und Signale entsprechend den Frequenzverteilungen in mehreren aufeinanderfolgenden Spektren in einer Durchschiebematrix gespeichert werden, wobei ein laufender Vergleich mit vorgegebenen Signalmustern stattfinden soll, die durch die Laute eines »Mustersprechers« gebildet wurden.
- Die Einrichtung nach der vorliegenden Erfindung benutzt ebenfalls das Prinzip, die Sprachwellenformen in Zeitabständen auf in ihnen enthaltene Merkmale zu prüfen und eine Merkmalsverteilung als Signalmuster zu speichern. Sie ermöglicht es aber einerseits, gleich ganze Silben oder Wörter, z. B. Ziffernwörter, zu erkennen. Andererseits kommt sie mit wenigen zu prüfenden Grundmerkmalen aus und kann daher einfach und mit geringem Raumbedarf ausgebildet werden. Ihr Arbeitsprinzip beruht auf dem Ergebnis von Untersuchungen der Lautwellenformen auf Struktur-Grundmerkmale, die sowohl lautcharakteristisch als auch von den Artikulationseigenheiten unterschiedlicher Sprecher unabhängig sind. Mit einem Versuchsgerät nach der Erfindung konnte eine gute Erkennungssicherheit mit sehr verschiedenen Sprechern und wenig Sprechdisziplin erreicht werden.
- Erfindungsgemäß wird dies Ergebnis in der Weise erzielt, daß jeweils eine einen Schwellenwert überschreitende Meßgröße das Auftreten oder Nichtauftreten einer langsamen (Grund-) Schwingung sowie das Auft reten oder Nichtauftreten einer wesentlich schnelleren (Ober-) Schwingung feststellt und diese Feststellungen mit ja/nein bewertet als Code zur Einstufung des untersuchten Lautes in eine Lautgruppe mittels einer Verknüpfungsschaltung dienen, und daß durch diese erzeugte Lautgruppen-Markiersignale in der Reihenfolge ihres Auftretens in einem Signalspeicher geordnet werden und nach Beendigung der gesprochenen Silbe (bzw. des Wortes) abgefragt zu deren Identifizierung herangezogen werden. Gegebenenfalls können verfeinerte Prüfungen zugesetzt werden, insbesondere Prüfungen der Zeitdauer oder auch der Häufigkeit des Auftretens der Schwingungsformen.
- Nachfolgend wird ein Ausführungsbeispiel einer Einrichtung nach der Erfindung näher erläutert.
- F i g. 1 zeigt eine Sprachwellenform eines bestimmten gesprochenen Wortes, F i g. 2 eine binäre Merkmalstabelle (Kodetabelle) für Laute, F i g. 3 eine Kodetabelle (Entschlüsselungstabelle) für Ziffernwörter, F i g. 4 ein Schaltbild einer Erkennungseinrichtung für Ziffernwörter.
- In F i g. 1, Zeile w, ist ein Oszillogramm des gesprochenen Wortes »sieben« wiedergegeben. Im Verlauf der Wellenform lassen sich zwei Merkmale verfolgen, nämlich das deutliche Auftreten einer langsamen Schwingung oder »Grundschwingung«, die in Zeile a wiedergegeben ist, sowie das deutliche Auftreten wesentlich schnellerer Schwingungen, die dort, wo eine Grundschwingung vorhanden ist, auf dieser »Oberwellen« bilden. Man könnte diese wesentlich schnelleren Schwingungen auch als »Rauhigkeit« bezeichnen. Sie sind in Zeile b für sich herausgezogen. Diese beiden Teilschwingungen a und b lassen sich in hinreichender Weise aus der Gesamtschwingung ableiten. Jede hat zu verschiedenen Zeiten größere oder kleinere Amplituden, und zur Merkmalsgewinnung soll durch Setzen einer Schwelle unterschieden werden zwischen genügend großen Amplituden (Schwingung deutlich vorhanden: SignalL) und nicht genügend großen Amplituden (Schwingung nicht deutlich oder nicht vorhanden: Signal 0). Es kann nun festgestellt werden, daß die Kombination a =L, b = 0 bei dem Laut n auftritt, aber z. B. auch bei w, o, n; diese Lautgruppe sei als Lautgruppe N bezeichnet. Die Kombination a = 0, b = L gilt für den Lauts, aber z. B. auch ks, f (v), d, t; diese Lautgruppe wird als Lautgruppe S bezeichnet. Eine die Kombination a = L, b = L ergebende Lautgruppe I schließlich enthält außer dem Laut i z. B. die Laute a, b, e, 1, r, dr. Es ergibt sich so eine Merkmalstabelle gemäß F i g. 2. Diese einfache Kodierung ergibt einen Grundschritt zur Erkennung von Wörtern; von ihm ausgehend kann nun weiterhin die zeitliche Reihenfolge des Auftretens solcher Lautverbindungen selbsttätig ermittelt werden, um die Wortkodierung auszubauen. Mit wiederum wenigen Reihenfolgekriterien ist es dann möglich, z. B. die gesprochenen Ziffernwörter »null« bis »neun« automatisch zu erkennen. Hierfür kommt man damit aus, daß zusätzlich zu der Erkennung der drei Lautgruppen N, S, I noch das Vorkommen von Lautgruppen N, S vor und/oder nach der Lautgruppe I registriert wird. Wenn man vor der Lautgruppe I liegende Lautgruppen N, S mit N 1, S 1 und dahinterliegende mit N2, S2 bezeichnet, lassen sich die Ziffernwörter kodieren, wie in F i g. 3 angegeben.
- Es sei nun die Schaltung einer mit dieser Kodierung arbeitenden Ziffernwort-Erkennungseinrichtung beschrieben. In F i g. 4 ist M ein Mikrofon, in das die Ziffernwörter gesprochen werden, MV i#t ein Mikrofonverstärker. Die verstärkten elektrischen Sprachschwingungen gelangen in eine Schaltung Ea zur Erkennung der Teilschwingung a (»Grundwelle«) und gleichzeitig in eine Schaltung Eb zur Erkennung der Schwingung b (»Oberwelle«, »Rauhigkeit«). Am Ausgang von Ea liegt ein Schmitt-Trigger STa und am Ausgang von Eb ein Schmitt-Trigger STb. Wenn die Schwingung a bzw. b mit genügender Amplitude auftritt, kippt der Schmitt-Trigger STa bzw. STb und gibt einen Kippimpuls auf ein bistabiles Flip-Flop FFa bzw. FFb. Die Ausgänge »0« und »L« der Flip-Flops FFa und FFb, deren Grundstellungs-Ausgangswerte eingetragen sind, sind über eine Verknüpfungsschaltung V 1 an UND-Tore N 1, S 1, 1, N 2, S 2 angeschlossen nach Maßgabe der Tabelle F i g. 2. Am Ausgang jedes UND-Tores liegt ein bistabiles Flip-Flop, so daß als Signalspeicher fünf Kodier-Flip-Flops FFN1, FFS1, FFI, FFN2 und FFS2 vorhanden sind. Während das UND-Tor I keine weitere Eingangsbedingung als die durch die Tabelle F i g. 2 gegebene hat, haben die UND-Tore N 1, S 1, N 2, S 2, noch jedes einen dritten Eingang. Die dritten Eingänge von Nl und Sl liegen an dem Ausgang von FFI, der bei dessen Grundstellung den Wert »L« führt, die dritten Eingänge von N2 und S2 liegen an dem anderen Ausgang von FFI. Infolgedessen betätigen LautgruppenN, S, die vor der Lautgruppe I liegen, die Kodier-Flip-Flops FFN1 bzw. FFS2, treten sie nach der Lautgruppe I auf, so werden FFN2 bzw. FFS2 umgeworfen.
- Die »0«- und »L«-Ausgänge der genannten fünf Flip-Flops sind an eine DekodierungsmatrixD angeschlossen, aus der die Steuerspannungen für zehn UND-Tore UO, Ul ... U9 entnommen werden, und zwar nach Maßgabe der Verknüpfungstabelle F i g. 3. Am Ausgang jedes UND-Tores Ux (x = 0, 1 ... 9) liegt ein bistabiles Flip-Flop FFx (x= 0, 1 ... 9), und der Wirkausgang jedes dieser Flip-Flops gibt sein Signal über einen Verstärker Vx (x = 0, 1 ... 9) in einen Ziffernwert-Ausgabekanal Zx (x= 0, 1 ... 9), über den z. B. ein optischer ZiffernindikatorLx (x= 0, 1 ... 9), wie in F i g. 4 dargestellt, oder ein sonstiges Wirkglied vie e-ma ein,- Rechenmaschinentaste betätigt werden kann.
- Um die Merkmalsk(,-lieruilg auf den fünf Kopier-Flip-Flops zu erhalten, muß die Wellenform jedes Ziffernwortes in Zeitabständen auf das Vorhandensein oder Nichtvorhandensein der Schwingungsform a und b abgefragt werden. Zu diesem Zweck ist ein Taktgenerator TG vorgesehen, der Abfrageimpulse z. B. in einem gleichmäßigen Rhythmus von etwa 10 Hz lielert. Diese stellen die Eingangs-Flip-FlopsFFa, FFb zurück, falls sie auf »L« gestellt waren, und dienen zugleich zur getakteten Einstellung der fünf Kodier-Flip-Flops und der End-Flip-Flops entsprechend den an den vorgeschalteten Toren liegenden Signalspannungen. Ferner ist ein monostabiles Flip-Flop fF vorhanden, das durch die Wellenanstiegsflanke jedes neu gesprochenen Ziffernwortes in seine instabile Stellung geworfen wird und nach einer fest vorgegebenen Zeit von etwa 1 bis 2 Sekunden wieder zurückkippt. Ein beim Rückkippen erzeugter Impuls bewirkt die Rückstellung und damit zugleich Abfrage der fünf Kodier-Flip-Flops, wobei die End-Flip-Flops FFx eingestellt werden. Diese können z. B. durch den Hinkipp-Impuls von fF beim Sprechen eines neuen Wortes gelöscht werden.
- Eine andere Methode zur zeitlich aufeinanderfolgenden Abfrage der Merkmale besteht darin, daß der Taktgenerator TG Abfrage-Taktimpulse erzeugt, die aus der Sprachwelle selbst abgeleitet werden. Es ist denn zweckmäßig den Taktgeber so auszubilden, daß aus dem Schwingungsverlauf der Einhüllenden der Sprachwellenform die Maxima differenzierend erfaßt werden und an den Stellen dieser Maxima jeweils ein Abfrageimpuls z. B. durch ein monostabiles Flip-Flop erzeugt wird.
- Die Schaltung Ea zur Erkennung der Teilschwingung a (»Grundwelle«) kann als ein Tiefpaß und die Schaltung Eb zur Erkennung der Teilschwingung b (»Oberwelle«) als ein Hochpaß ausgebildet werden. Jedoch sind auch andere Schaltungen, die eine Integration der Wellenform einerseits und eine Differentiation andererseits leisten, zur Diskriminierung der Teilschwingungen verwendbar. Eine andere Möglichkeit ist die, daß die »Oberwelle« oder »Rauhigkeit« gemittelt wird und Auslenkungen der gemittelten Welle sowie gegenüber der gemittelten Welle festgestellt werden. Schließlich ist eine Erkennung auch auf die Weise möglich, daß nur die Nulldurchgänge der gemittelten Welle und außerdem die auf die gemittelte Welle bezogenen Nulldurchgänge der Schwingungen herangezogen werden.
- Bei dem vorstehend beschriebenen Ausführungsbeispiel der Schaltung ist für das Festhalten der in der Kodiertabelle F i g. 2 enthaltenen Kombination »00« (= Pause) kein Speicher vorgesehen. Es sei daher besonders angemerkt, daß auch diese Kombination (Nichtauftreten der langsamen und Nichtauftreten der schnellen Schwingung, wie es sich z. B. in der Mitte des Oszillogramms der F i g. 1 zeigt) zu den Merkmalen gehört, die für die Kodierung oftmals nützlich sein können.
- Die angegebene Worterkennungsmethode kann dadurch weiter ausgebaut bzw. verfeinert werden, daß außer der Erkennung der Lautgruppen selbst und der Berücksichtigung ihrer zeitlichen Reihenfolge auch die Dauer erfaßt wird, während der sie jeweils vorhanden sind. Diese Dauer manifestiert sich durch die Länge des Rechteckimpulses, der von einem der Schmitt-Trigger STa und STb nach dem Ansprechen jeweils ausgegeben wird. Man kann dann, etwa mit Hilfe monostabiler Flip-Flops oder während der Impulsdauer ansteigender Sägezähne, z. B. wieder eine Dualisierung vornehmen, die angibt, ob die Dauer einer Lautgruppe, also einer 0-L-Kombination nach F i g. 2, lang (= L) oder kurz (= 0) ist. Eine solche Erweiterung der Kodierung kann unter anderem dazu herangezogen werden, gewisse Konsonanten, wie etwa s, die unter Umständen sehr stimmhaft ausgesprochen werden, von Vokalen sicherer zu unterscheiden. Ferner kann auch die Häufigkeit, mit der die einzelnen Lautgruppen auftreten, zur Erkennung mit herangezogen werden. Hierfür wären z. B. Zähler einzusetzen, die den einzelnen Lautgruppen zugeordnet sind und bei jedesmaligem Auftreten der Lautgruppe innerhalb eines Wortes um eine Einheit weiterzählen. Ihr Zählergebnis wird dann ein Bestandteil der Wortkodierung. Die bei derartigen Erweiterungen der Wortkodierung vorzunehmende Erweiterung des Entschlüsselungsschemas und der Dekodierinatrix D läßt sich unter Betrachtung des im obigen Ausführungsbeispiel angegebenen Prinzips ohne Schwierigkeiten durchführen.
Claims (2)
- Patentansprüche: 1. Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Wörtern, z. B. Ziffernwörtern, bei der die den Schallschwingungen entsprechenden elektrischen Schwingungen in Zeitabständen auf in ihnen enthaltene Merkmale geprüft werden, dadurch gekennzeichn e t, daß jeweils eine einen Schwellenwert überschreitende Meßgröße das Auftreten oder Nichtauftreten einer langsamen (Grund-) Schwingung (a in F i g. 1) sowie das Auftreten oder Nichtauftreten einer wesentlich schnelleren (Ober-) Schwingung (b in F i g. 1) feststellt und diese Feststellungen mit ja/nein bewertet als Code zur Einstufung des untersuchten Lautes in eine Lautgruppe mittels einer Verknüpfungsschaltung (V1) dienen und daß durch diese erzeugte Lautgruppen-Markiersignale in der Reihenfolge ihres Auftretens in einem Signalspeicher (FFN1 ... FFS2) geordnet werden und nach Beendigung der gesprochenen Silbe (bzw. des Wortes) abgefragt zu deren Identifizierung herangezogen werden.
- 2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß auch die Dauer und/oder Häufigkeit des Auftretens der Schwingungsformen (a, b) geprüft wird. 3. Einrichtung nach Anspruch 1 und 2, dadurch gekennzeichnet, daß die die langsame und die die schnelle Schwingung erkennenden Schaltungen (Ea, STa, Eb, STb) jeweils einen Signalgeber (FFa, FFb) betätigen und die beiden Signalgeber in Kombination die Merkmals-Signalspeicher (FFN1 ... FFS2) betätigen. 4. Einrichtung nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß den Signalspeichern (FFN1 ... FFS2) Koinzidenztore (N1 ... S2) vorgeschaltet sind, an deren Eingängen die Signalgeber (FFa, FFb) und außerdem Signale (mindestens) eines der Signalspeicher (FFI) liegen, so, daß vor und nach dem Ansprechen dieses Signalspeichers jeweils eine andere Gruppe weiterer Signalspeicher an die Signalgeber angeschlossen wird. 5. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Abfrage der Merkmale durch einen frei laufenden Taktgenerator (TG) bewirkt wird. 6. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß Merkmals-Abfrageimpulse aus den Lautschwingungen selbst hergeleitet werden. 7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet, daß die Abfrageimpulse durch Maxima der Lautschwingungs-Hüllkurve ausgelöst werden. 8. Einrichtung nach Anspruch 1 bzw. den folgenden, dadurch gekennzeichnet, daß die Signalgeber (FFa, FFb) und die Signalspeicher (FFN1 ... FFS2) bistabile Kippschaltungen sind und die Ausgänge der die Signalspeicher bildenden Kippschaltungen in entsprechend den zu erkenneden Lautgruppen verknüpfter Weise (Dekodiermatrix D) an Koinzidenztore (Ux) angeschlossen sind, an deren jeweils eine Lautgruppe signalisierenden Ausgängen weitere Signalgeber (FFx) angeschlossen sind. 9. Einrichtung nach Anspruch 1 bis 8, dadurch gekennzeichnet, daß zur Prüfung auf das deutliche Auftreten bzw. Nichtauftreten der langsamen bzw. schnellen Schwingungen mindestens eine der folgenden Einrichtungen vorgesehen ist: a) ein Tiefpaß und ein Hochpaß, b) eine integrierende und eine differenzierende Schaltung, c) eine Schaltung, welche die getragene Welle mittelt und Auslenkungen der gemittelten Welle sowie gegenüber der gemittelten Welle feststellt, d) eine Schaltung zur Feststellung von Nulldurchgängen einer gemittelten Welle und von Nulldurchgängen der Schwingungen, bezogen auf die gemittelte Welle.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DET26689A DE1202517B (de) | 1964-07-29 | 1964-07-29 | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern |
GB31454/65A GB1109496A (en) | 1964-07-29 | 1965-07-23 | Device for the automatic recognition of speech |
US475708A US3445594A (en) | 1964-07-29 | 1965-07-29 | Circuit arrangement for recognizing spoken numbers |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DET26689A DE1202517B (de) | 1964-07-29 | 1964-07-29 | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern |
Publications (1)
Publication Number | Publication Date |
---|---|
DE1202517B true DE1202517B (de) | 1965-10-07 |
Family
ID=7552979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DET26689A Pending DE1202517B (de) | 1964-07-29 | 1964-07-29 | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern |
Country Status (3)
Country | Link |
---|---|
US (1) | US3445594A (de) |
DE (1) | DE1202517B (de) |
GB (1) | GB1109496A (de) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3647978A (en) * | 1969-04-30 | 1972-03-07 | Int Standard Electric Corp | Speech recognition apparatus |
US3688126A (en) * | 1971-01-29 | 1972-08-29 | Paul R Klein | Sound-operated, yes-no responsive switch |
US3742143A (en) * | 1971-03-01 | 1973-06-26 | Bell Telephone Labor Inc | Limited vocabulary speech recognition circuit for machine and telephone control |
US3755627A (en) * | 1971-12-22 | 1973-08-28 | Us Navy | Programmable feature extractor and speech recognizer |
US3928724A (en) * | 1974-10-10 | 1975-12-23 | Andersen Byram Kouma Murphy Lo | Voice-actuated telephone directory-assistance system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3198884A (en) * | 1960-08-29 | 1965-08-03 | Ibm | Sound analyzing system |
US3225141A (en) * | 1962-07-02 | 1965-12-21 | Ibm | Sound analyzing system |
US3238303A (en) * | 1962-09-11 | 1966-03-01 | Ibm | Wave analyzing system |
-
1964
- 1964-07-29 DE DET26689A patent/DE1202517B/de active Pending
-
1965
- 1965-07-23 GB GB31454/65A patent/GB1109496A/en not_active Expired
- 1965-07-29 US US475708A patent/US3445594A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US3445594A (en) | 1969-05-20 |
GB1109496A (en) | 1968-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2918533C2 (de) | ||
EP0366192B1 (de) | Textverarbeitungsvorrichtung | |
DE3884880T2 (de) | Billige Spracherkennungseinrichtung und Verfahren. | |
DE1248225B (de) | Verfahren und Vorrichtung zum genauen Ermitteln der Herzschlagfrequenz | |
DE2326517A1 (de) | Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern | |
DE2518320A1 (de) | Verfahren und detektorschaltung zum feststellen einer signalaktivitaet im tonfrequenzbereich bei einer fernsprechverbindungsleitung | |
DE2034623A1 (de) | Verfahren und Vorrichtung fur die Zah lung von Sprachsignalen in Anwesenheit von Rauschen | |
DE2357067C3 (de) | Elektrische Schaltungsanordnung in Verbindung mit einer Spracherkennungseinrichtung | |
DE2703200A1 (de) | Verfahren und vorrichtung zur kontrolle des schwingungszustandes eines schwingungssystems in einem signalgeber | |
DE3149134C2 (de) | Verfahren und Vorrichtung zur Bstimmung von Endpunkten eines Sprachausdrucks | |
DE3878895T2 (de) | Verfahren und einrichtung zur spracherkennung. | |
DE1937464B2 (de) | Sprachanalysiergeraet | |
DE2805478C2 (de) | Schaltungsanordnung zur Diskriminierung von Sprachsignalen | |
DE3102385C2 (de) | ||
EP1125278B1 (de) | Datenverarbeitungssystem oder kommunikationsendgerät mit einer einrichtung zur erkennung gesprochener sprache und verfahren zur erkennung bestimmter akustischer objekte | |
DE1202517B (de) | Einrichtung zur automatischen Erkennung von gesprochenen Silben oder Woertern | |
DE2737467C2 (de) | Fernsteueranordnung | |
DE1422040A1 (de) | Verfahren zum automatischen Erkennen gesprochener Worte | |
DE2806920A1 (de) | Stimmenidentifikationssystem | |
DE1422056A1 (de) | Phonetische Schreibmaschine | |
DE2431458A1 (de) | Verfahren zur automatischen sprechererkennung | |
DE1547027C3 (de) | Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen | |
DE1816736A1 (de) | Verfahren zum selbsttaetigen Anhalten und Wiederfreigeben des Tontraeger-Transports bei einem Schallaufzeichnungs- insbesondere Diktier-Geraet sowie Vorrichtung zur Ausuebung dieses Verfahrens | |
DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales | |
DE1940082A1 (de) | Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine |