DE2034623C2 - Verfahren für das Erkennen von Sprachsignalen in Rauschen - Google Patents
Verfahren für das Erkennen von Sprachsignalen in RauschenInfo
- Publication number
- DE2034623C2 DE2034623C2 DE2034623A DE2034623A DE2034623C2 DE 2034623 C2 DE2034623 C2 DE 2034623C2 DE 2034623 A DE2034623 A DE 2034623A DE 2034623 A DE2034623 A DE 2034623A DE 2034623 C2 DE2034623 C2 DE 2034623C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech
- duration
- counter
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/204—Multiple access
- H04B7/212—Time-division multiple access [TDMA]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J3/00—Time-division multiplex systems
- H04J3/17—Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
- H04J3/175—Speech activity or inactivity detectors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Time-Division Multiplex Systems (AREA)
- Transmitters (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
2. Vorrichtung zur Durchführung des Verfahrens für das Erkennen von Sprachsignalen in Rauschen
gemäß Anspruch 1 mit:
— einer Einrichtung (10) zum Vergleich der Momentanwerte sowohl der Nutzsignale als auch
der Rauschsignale mit einem Schwellenwert, dessen Pegel so festgelegt wird, daß er vom
Momentanwert des Nutzsignals mit höherer Wahrscheinlichkeit überschritten wird als vom
Momentanwert der Rauschsignale, wobei sowohl der Schwellenwert als auch die Signalpegel
digital durch positive und negative PCM-Codeworte dargestellt sind;
— einer Einrichtung (12) zum Erzeugen eines Erkennungssignals,
sobald ein Amplituden-Abtastwert den Schwellenwert überschreitet;
gekennzeichnet durch eine Einrichtung (14, 26), um aus dem Erkennungssignal ein Übertragungssteuersignal
zu erzeugen, dessen Dauer gleich der Dauer eines erkannten Sprachsignals ist oder zur Dauer
dieses Signals in einer festlegbaren Beziehung steht, eine vorbestimmte maximale Dauer aber nicht überschreitet
3. Vorrichtung nach Anspruch 2, gekennzeichnet durch
— eine Einrichtung (16, 32), um die Dauer eines Sprachsignals zu messen, indem die während
dieser Zeit aufgelaufenen Zeittakte summiert werden;
— eine Einrichtung (18, 34), um die Einrichtung
(16, 32) zurückzustellen, sobald die Dauer des Sprachsignals ein vorbestimmtes Maximum erreicht
hat;
— eine Einrichtung (20, 22), um die Dauer einer
Vergleichsperiode, die mit dem Ende des Sprachsignals beginnt, zu messen, in dem die
während dieser Zeitdauer auflaufenden Zeittakte summiert werden;
eine Einrichtung (36), um dann ein Ausgangssignal zu erzeugen, wenn die Dauer der Vergleichsperiode gleich der Dauer der vorangegangenen Signalperiode ist
eine Einrichtung (36), um dann ein Ausgangssignal zu erzeugen, wenn die Dauer der Vergleichsperiode gleich der Dauer der vorangegangenen Signalperiode ist
Die vorliegende Erfindung bezieht sich auf ein Verfahren für das Erkennen eines Sprachsignals in Rauschen
nach dem Oberbegriff des Anspruchs 1.
Weiterhin bezieht sich die Erfindung auf eine Vorrichtung zur Durchführung des Verfahrens.
Es ist bereits seit langem bekannt, daß nur während etwa 30%—40% der Dauer eines Gesprächs Sprachsignale
vorhanden sind. Die übrige Zeit ist durch Gesprächspausen oder durch Sprachtöne, die zu schwach
für eine Unterscheidung bzw. eine Auflösung in Einzeltöne sind, ausgefüllt Um den Wirkungsgrad eines
Kommunikationssystems zu steigern, kann man einen Sender in Abhängigkeit von einem Sprachdetektorausgang
lediglich bei Anwesenheit von Sprachsignalen mit Sinngehalt einschalten und erreicht damit eine vorteilhafte,
erhebliche Energieeinsparung. Dies ist besonders bei der Satelliten-Nachrichtenübertragung von Bedeutung,
weil man dadurch die vorhandenen Kanäle besser ausnützen kann. Die meisten bekannten Sprachdetektoren
arbeiten vorwiegend analog und nicht digital und messen im allgemeinen den Effektivwert und nicht den
Augenblickswert eines Eingangssignals. Beim Überschreiten eines eingestellten Schwellenwertes durch den
Effektivwert eines Eingangssignals wird ein Ausgangssignal erzeugt, um die Anwesenheit von Sprache anzuzeigen.
Derartige Sprachdetektoren haben zwei erhebliche Nachteile. Erstens vergeht eine verhältnismäßig
lange Zeit nach dem Beginn eines Sprachsignais, bis ein Ausgangssignal erzeugt wird. Dies ist eine Folge davon,
daß derartige Detektoren ein Integral bilden bzw. eine Speicherfunktion aufweisen, so daß eine bestimmte
Zeitdauer erforderlich ist, bis der Effektivwert des Signals den Schwellenwert übersteigt Dadurch wird der
Anfangsabschnitt des brauchbaren Signals abgeschnitten und erzeugt einen schroffen Sprachanfang, was in
Übertragungssystemen, welche durch den Ausgang des Sprachdetektors getriggert sind, eine unerwünschte
Verzerrung verursacht Zweitens muß der Schwellenwert bekannter Sprachdetektoren sehr niedrig eingestellt
werden, um auf jedes Sprachsignal mit Sinngehalt anzusprechen und um eine gute Sprachqualität zu erhalten.
Auf Grund des niedrigen eingestellten Schwellenwertes triggern häufig herausragende Rauschsignale
die Detektoren, wodurch eine weitere Verzerrung in das System eingebracht und die gewünschte Energieeinsparung
zum Teil wieder zunichte gemacht wird.
In den US-Patentschriften 34 24 869 und 33 69 080 sind bekannte Verfahren und Vorrichtungen beschrieben,
die insbesondere auch dem Inhalt des Oberbegriffes des Anspruches 1 sowie dem soeben abgehandelten
Stand der Technik entsprechen. Die dort beschriebenen Verfahren haben die genannten Nachteile.
Der Erfindung liegt demgegenüber die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung so verfügbar
zu machen, daß mit deren Hilfe noch dichter an die Sprachsignale herangegangen werden kann, ohne
merkbare Qualitätseinbußen hinnehmen zu müssen.
Die Lösung ist in den Merkmalen der vorangestellten
Die Lösung ist in den Merkmalen der vorangestellten
Ansprüche enthalten und die Vorteile lassen sich dadurch
erzielen, daß digital die Momentanwerte der Eingangssignale mit einem zweckmäßig gewählten Schwellenwert
verglichen werden.
Es wird ein Erkennungssignal gebildet, des die Anwesenheit
eines Sprachsignals anzeigt Aus diesem Erkennungssignal wird ein Sende-Steuersignal erzeugt, dessen
Dauer der Dauer des Sprachsignals, gegebenenfalls zuzüglich einer zweckmäßig gewählten Überhangzeit,
entspricht
Der Sprachdetektor ist gemäß der Erfindung digital aufgebaut Es wurde festgestellt daß Spitzenwerte viel
früher nach Beginn eines Sprachsignals auftreten als ein Effektivwert benötigt um einen zweckmäßig eingestellten
Schwellenwert zu überschreiten. Es wurde weiter festgestellt daß oberhalb eines bestimmten Pegels die
Wahrscheinlichkeit, daß ein Augenblickswert eines Sprachsignals den Mittelwert übersteigt, immer mehr
wächst als die Wahrscheinlichkeit, daß ein Augenblickswert für ein Zufallssignal oder ein »weißes", & h. einer
Gauß-Verteilung entsprechendes Signal den Mittelwert übersteigt Anders ausgedrückt, treten für gleiche
Effektivwerte der Leistung der Sprachsignale und des weißen Rauschens augenblickliche Spitzenspannungen
oberhalb eines bestimmten Pegels häufiger für Sprache als für Rauschen auf. Wenn man den Schwellenwert in
diesen Bereich legt, verbessert sich die Wirkungsweise bedeutend sowohl in Hinblik auf die Verzögerung der
Anzeige als auch in Hinblick auf die Unterdrückung des Rauschens.
Vokale, Umlaute und als Reibelaut gesprochene Konsonanten sind Impulse nahezu periodischr Wellenform,
deren Spitzenwerte gruppenweise auftretea Innerhalb dieser Gruppen weisen die Spitzenwerte ungefähr
gleichen Zeitabstand auf. Jede Gruppe enthält eine gewisse Anzahl von Spitzen, deren Amplituden entweder
kontinuierlich bis zum Ende jeder Tonhöhen-Periode absinken oder im wesentlichen konstant bleiben,
je nach der Stimmleistung und der Sprechweise. Des weiteren sind die Spitzen innerhalb jeder Gruppe entsprechend
der Spektralverteilung der Sprache voneinander getrennt Deshalb und weil die fCAf-Abtastrate
an oder oberhalb der Nyquist-Grenze liegt, wird der digitale Sprachdetektor jedesmal von mehr als einem Abtastwert
getriggert
Endkonsonanten sind nicht wie die voranstehend beschriebenen Laute gruppiert, sondern ihre Spitzenwerte
weisen im Zeitintervall eine annähernd exponentiell Verteilung auf. Jeder Spitzenwert hat jedoch eine Dauer
von einigen ms, und das Abtastsystem tastet jeden Spitzenwert mehr als einmal ab.
Das Rauschen als völliges Zufallsereignis weist nicht die Charakteristika von Sprachlauten auf. Auf sehr hohe
Spitzen folgen im allgemeinen solche mit niedriger Amplitude.
Weitere Einzelheiten, Merkmale und Vorteile der vorliegenden Erfindung werden anhand der in den Figuren
dargestellten Ausführungsbeispielen näher beschrieben. Es zeigen
F i g. 1 kumulative Verteilungsfunktionen der Sprach- und statischen Rauschsignale,
F i g. 2 ein Blockschaltbild eines digitalen Sprachdetektors gemäß der vorliegenden Erfindung,
F i g. 3 eine schematische Darstellung des Zeitablaufs für die Schaltung gemäß F i g. 2 und
F i g. 4 ein Blockschaltbild einer weiteren Ausführungsform gemäß der Erfindung.
F i g. 1 zeigt eine kumulative Verteilungsfunktion sowohl der Sprachsignale als auch des weißen Rauschens,
bei der als Abszissenwerte die Verhältnisse der Momentan- zu den Effektivwerten der Signalpegel in dB und
als Ordinatenwerte die Wahrscheinlichkeiten des Auftretens in logaritbmischem Maßstab aufgetragen sind.
Aus diesen Kurven ist leicht ersichtlich, daß oberhalb des Werts von ungefähr 4,5 dB die Wahrscheinlichkeit
für ein Sprachsignal immer größer als die für das weiße Rauschen wird. Durch die Einstellung eines genügend
ίο hohen Detektorschwellenwertes in dem günstigen
Wahrscheinlichkeitsbereich kann daher die Möglichkeit, daß durch ein Rauschsignal getriggert wird, sehr
klein gehalten oder unter Umständen sogar vermieden werden. Durch einen Schwellenwert von —25 dBmobeispielsweise
kann, verglichen mit einem üblichen Schwellenwert von —40 dBmo herkömmlicher analoger oder
Effektivwert-Speicher-Detektoren, in dem erfindungsgemäßen
Sprach-Detektor erreicht werden, daß er bei Rauschsignalen mit Effektivwerten von —35 dB nicht
triggert, sehr wohl jedoch bei Sprachsignalen mit -45 dB.
Im Blockschaltbild nach F i g. 2 wird der gewählte Schwellenwert einem digitalen Vergleichsschaltkreis 10
eingegeben. Beispielsweise kann der Code für den Schwellenwert aus den letzten 6 bits eines 7-bit-Codewortes
in einem PCM-Code mit 128 Abtaststufen bestehen.
Dabei liegt der neutrale Punkt oder Null-Spannungspegel zwischen der 63. und 64. Stufe und gleiche
Pegel oberhalb oder unterhalb des Nullspannungspegels unterscheiden sich nur durch das erste (Vorzeichen-)bit
Dies bedeutet, daß der Schwellenwertcode 011000 der 24. und 103. Stufe entspricht, deren vollständige
zugehörige Codeworte lauten: 0011000 und 1011000. Der Schwellenwertcode kann wiederholt in
den Vergleichsschaltkreis 10 seriell oder parallel eingegeben oder auch dauernd im Vergleichsschaltkreis 10
gespeichert werden.
Die zweite Eingangsgröße für die Vergleichsschaltung 10 ist das fOf-Codewort jedes Amplitudenabtastwertes
und wird dem Ausgang eines fCM-Codierers
entnommen.
Die Vergleichsschaltung 10 erzeugt immer dann ein Ausgangssignal, wenn die letzten 6 bits eines codierten
Abtastwertes gleich dem gewählten Schwellenwertcode sind oder diesen überschreiten. Dieses Ausgangssignal
startet einen Impulsgenerator 12, der seinerseits einen Ausgangsimpuls mit vorbestimmter Minimaldauer erzeugt,
die ausreicht, um den Ein-Zustand des endgültigen Detektorausgangssignals während des Auftretens
kontinuierlicher Sprachsignale aufrecht zu erhalten. Dadurch wird eine getrennte Triggerung durch jede momentane,
den Schwellenwert überschreitende Sprachsignalspitze vermieden. Die Minimaldauer des Ausgangsimpulses
des Impulsgenerators 12 wird in Übereinstimmung mit der Frequenz der Sprachsignalspitzen
gewählt und ist immer größer als die PCM-Abtastperiode. Der Impulsgenerator 12 wird durch jeden Ausgangsimpuls
der Schaltung 10 getriggert und startet die Verzögerung durch jeden Triggerimpuls, so daß bei einer
Serie von Impulsen der Vergleichsschaltung 10, die geringeren Abstand als die minimale Ausgangsimpulsdauer
des Impulsgenerators 12 aufweisen, der Ausgangsimpuls des letzteren angehoben bleibt
Der Impulsgenerator 12 kann aus einer Anordnung bekannter Schaltungen bestehen wie seriell geschaltete
Flipflops mit übersteuertem Setz-Eingang, die von einer vom Zeittakt abgeleiteten Impulsfolge rückstellbar sind.
Das Ausgangssignal des Impulsgenerators 12 ist durch
die Rechteckschwingung A des Steuerungsdiagramms gemäß F i g. 3 gekennzeichnet.
Der Ausgangsimpuls des Impulsgenerators 12 wird einem Überhangzeit-Zähler 14 zugeleitet. Darin startet
er über ein UND-Gatter 18 einen Zähler 16, stellt einen Zähler 20 und einen Sprach-Dauer-Detektor 22 zurück
und sperrt ein NAND-Gatter 24. Nachdem der Rücksetz-Eingang des Binär-Zählers 16 von tief nach hoch
gebracht wurde, beginnt dieser den 8-kHz Zeitrastertakt zu zählen, der an seinem Eingang anliegt Der erste
Ausgangsimpuls der zweiten Stufe des Zählers 16 setzt das Träger-Steuerungs-Flipflop 26 über die Leitung 28
und der hochgesetzte ^-Ausgang des Flipflops, wie es
Rechteckschwingung F von F i g. 33 zeigt, versetzt das Trägersignal des Übertragungssystems in Sendebereitschaft
Man nimmt das Triggersignal für das Träger-Steuerungs-Flipflop 26 von Ausgang der zweiten Stufe des
Zählers 16, um ein Durchgehen des Systems zu vermeiden, und erkauft sich damit eine Ansprechverzögerung
von 250 μ5, die jedoch im Hinblick auf die Sprachverständlichkeit
vernachlässigbar ist Der Zähler 16 erzeugt die in F i g. 3B gezeigten Ausgangsimpulse im Abstand
von 10 ms, die über die Leitung 30 einem Sprachdauer-Zähler
32 zugeführt werden. Dieser ist ein aus 4 Flipflops bestehender Binärzähler, dessen in F i g. 3
unterhalb der Schwingung B gezeigten Parallelausgänge die Anzahl der von Zähler 16 empfangenen Impulse
wiedergeben. Sobald der Sprachdauer-Zähler 32 von Zähler 16 fünfzehn Impulse empfange hat und sich
sein Parallelausgang im Zustand (1111) befindet, dem
ein hochgsetzter Signalpegel an allen vier Ausgängen entspricht, wie im ersten Beispiel von F i g. 3 dargestellt
ist, wird das Ausgangssignal des Detektors 34 für maximale Überhangzeit, der den Inhalt des Zählers 32 kodiert,
heruntergesetzt, wie in F i g. 3C gezeigt Dies stellt am Ausgang des Gatters 18 den tiefen Rücksetzspiegel
wieder her, entsprechend den Impulsdiagrammen A, C von F i g. 3, der das Rückstellen des Zählers 16 bewirkt,
den Zustand (1111) des Zählers 32 jedoch beläßt
Nach dem Ende des Sprachimpulses und nach Ablauf der Verzögerung des Impulsgenerators 12 (zusammen
200 ms im ersten Beispiel von F i g. 3) geht das Ausgangssigna! von Impulsgenerator 12 auf den tiefen Pegel.
Damit verschwindet an einem binärkodierten Dezimalzähler 20 das hochgesetzte Rückstellsignal, worauf
dieser die 8-kHz Takte zu zählen beginnt, wie es das Impulsdiagramm D in F i g. 3 zeigt Gleichzeitig verschwindet
das Rückstellsignal an einem Sprachdauer-Detektor 22, der nun damit bginnt, die Ausgangsimpulse des
Zählers 20 zu zählen, wie es das Impulsdiagramm gerade unterhalb der Wellenform D in F i g. 3 zeigt Der
Sprachdauer-Detektor 22 besteht aus einem 4-stufigen Binärzähler genau wie der Sprachdauer-Zähler 32 mit
dem Unterschied, daß er sich, während Sprache anliegt, im Rücksetzzustand befindet und während der sonstigen
Zeit in Betrieb ist Sowohl die parallelen Ausgänge des Sprachdauer-Zählers 32 als auch des Sprachdauerdetektors
22 werden dem Detektor 36 für die verzögerte Übergangszeit zugeführt Letzterer arbeitet wie
ein digitaler Vergleicher, der die beiden Zählerzustände vergleicht und bei Koinzidenz ein Ausgangssignal abgibt,
wie es das Impulsdiagramm Fin Fi g. 3 zeigt Dieses Ausgangssignal setzt das Träger-Steuerungs-Flipflop
26 zurück, dessen tiefgesetztes (>Ausgangssignal das Trägersignal abschaltet, um die Übertragung zu
beenden.
Der hochgesetzte (^-Ausgang des rückgesetzten
Träger-Steuerungs-Flipflops 26 wird dem NAND-Gatter 24 zugeführt, das einen hochgesetzten Rücksetzimpuls
erzeugt, sobald der nächste Impuls des Zählers 20 beendet ist, wie in Fig.3G gezeigt. Dieser Rückstellimpuls
wird dem Sprachdauerzähler 32 zugeführt, um diesen in den Zustand (0000) zurückzusetzen, was wiederum
den Ausgang des Detektors 34 für maximale Überhangzeit hoch und den Ausgang des Detektors 36
für verzögerte Überhangzeit tief setzt.
to Zu diesem Zeitpunkt hat der Schaltkreis einen vollständigen Spracherkennungszyklus durchlaufen und ist
bereit, den nächsten Sprachimpuls zu empfangen.
Im ersten Beispiel von F i g. 3 dauert das Sprachsignal, wie es durch den Ausgangsimpuls des Impulsgenerators
12 dargestellt wird, 200 ms und überschreitet damit die maximale Überhangzeit von 150 ms, wie sie vom
Schaltkreis 14 erzeugt wird. Unter diesen Bedingungen erreicht der Sprachdauer-Zähler 32 seinen maximalen
Zählerstand 15 oder (1111). Nach dem Ende des Sprachsignals
erreicht deshalb der Sprachdauer-Detektor 22 den Zustand (1111) bis sein Ausgang mit demjenigen
des Sprachdauer-Zählers 32 übereinstimmt, den Detektor 36 für die verzögrte Überhangszeit triggert und den
Zyklus beendet Dieserart wird die maximale Überhangzeit von 150 ms gebildet
Im zweiten Beispiel von F i g. 3 ist das Sprachsignal nach 100 ms beendet Während dieser Zeit liefert der
Zähler 16 10 Impulse und der Sprachdauer-Zähler 32 erreicht den binären Zustand (1010). Nach dem Ende des
Sprachimpulses liefert der Zähler 20 10 Impulse an den
Sprachdauer-Detektor 22, dessen binärer Zustand dann ebenfalls (1010) ist Diese Übereinstimmung wird im
Detektor 36 für die verzögerte Überhangzeit erkannt, das Träger-Steuerungs-Flipflop 26 zurückgesetzt und
somit die Übertragung beendet Bei diesem Beispiel bewirkt der Schaltkreis 14 eine Überhangzeit, die gleich
der Dauer des Sprachsignals ist, da letzteres die maximal zulässigen 150 ms nicht überschreitet
Einzelheiten der verschiedenen Schaltungskomponenten, wie Zähler 16 und 20, Sprachdauerzähler 32 und Detektor 22 werden nicht detailliert beschrieben, da sie allgemein bekannt sind. Das gleiche gilt für die logische NAND-Schaltung 24, die nicht aus einer einzelnen Gatterschaltung bestehen muß, sondern auch aus mehreren bekannten logischen Schaltkreisen zusammengesetzt sein kann.
Einzelheiten der verschiedenen Schaltungskomponenten, wie Zähler 16 und 20, Sprachdauerzähler 32 und Detektor 22 werden nicht detailliert beschrieben, da sie allgemein bekannt sind. Das gleiche gilt für die logische NAND-Schaltung 24, die nicht aus einer einzelnen Gatterschaltung bestehen muß, sondern auch aus mehreren bekannten logischen Schaltkreisen zusammengesetzt sein kann.
Eine weitere Ausführungsform zeigt Bild 4. Das Ausgangssignal einer Vergleichsschaltung 10 wird einem
Entscheidungsimpulszähler 11 zugeführt Dieser Zähler
so 11 erzeugt nur dann ein Ausgangssignal, wenn er eine festgelegte Anzahl von ungestörten, aufeinanderfolgenden
Impulsen von der Schaltung 10 empfangen hat Auf Grund der spezifischen Charakteristik von Sprachsignalen,
wie sie vorangehend beschrieben wurde und wegen des zufälligen Auftretens von Rauschsignalen
bedeutet dies eine weitere Steigerung der Zuverlässigkeit der Schaltung, indem die Wahrscheinlichkeit, daß
zufällige Rauschspitzen ein Sprachsignal vortäuschen, verringert wird Wird beispielsweise der Zähler 11 erst
nach 4 empfangenen Impulsen getriggert — diese Anzahl wurde experimentiell als Optimum ermittelt — so
wird die Sprachverständlichkeit nur so unwesentlich durch das Abschneiden der ersten vier Impulse verschlechtert,
daß der Unterschied nicht wahrgenommen wird.
Der Ausgang des Zählers 11 wird dem Impulsgenerator
12 zugeleitet, dessen Ausgang direkt mit dem Einstelleingang des Träger-Steuerungs-Flip-Flops 26 ge-
koppelt ist. Wahlweise kann auch das Impulsgenerator-Ausgangssignal
selbst als das Trägersteuersignal verwendet werden. Eine fest vorgegebene Überhangzeit,
vorzugsweise im Bereich von 160 bis 200 ms, kann vom
Impulsgenerator 12 abgeleitet werden, wodurch wiederholtes Triggern des Trägers vermieden und der Schaltungsaufwand
stark verringert wird.
In dieser Weise kann aus der Beschreibung der beiden
erfindungsgemäßen Ausführungsformen ersehen werden, daß verschiedene Änderungen in der Form und in
den Einzelheiten möglich sind, ohne daß dadurch von dem vorliegenden Gegenstand der Erfindung abgewichen
wird.
Hierzu 4 Blatt Zeichnungen
Claims (1)
1. Verfahren für das Erkennen von Sprachsignalen in Rauschen in der Abfolge der Funktionen:
— Vergleich der Momentanwerte sowohl der
Sprachsignale als auch der Rauschsignale mit einem Schwellenwert, dessen Pegel so festgelegt
wird, daß er vom Momentanwert des Nutzsignals mit höherer Wahrscheinlichkeit Oberschritten
wird als vom Momentanwert der Rauschsignale, wobei sowohl der Schwellenwert
als auch die Signalpegel digital durch positive und negative /CM-Codeworte dargestellt
werden,
- Erzeugen eines Erkennungssignals, sobald ein Amplituden-Abtastwert den Schwellenwert
überschreitet,
gekennzeichnet durch
— ein aus dem Erkennungssignal erzeugtes Übertragungssteuersignal,
dessen Dauer gleich der Dauer eines erkannten Sprachsignals ist oder zur Dauer dieses Signals in einer festlegbaren
Beziehung steht, jedoch eine vorbestimmte Maximal-Dauer nicht überschreitet
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US84152869A | 1969-07-14 | 1969-07-14 | |
US1918470A | 1970-03-13 | 1970-03-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2034623A1 DE2034623A1 (de) | 1971-04-08 |
DE2034623C2 true DE2034623C2 (de) | 1982-12-09 |
Family
ID=26691957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2034623A Expired DE2034623C2 (de) | 1969-07-14 | 1970-07-13 | Verfahren für das Erkennen von Sprachsignalen in Rauschen |
Country Status (7)
Country | Link |
---|---|
US (1) | US3712959A (de) |
JP (1) | JPS5250483B1 (de) |
DE (1) | DE2034623C2 (de) |
FR (1) | FR2060544A5 (de) |
GB (1) | GB1305819A (de) |
NL (1) | NL173340C (de) |
SE (1) | SE365922B (de) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE786256A (fr) * | 1971-07-15 | 1973-01-15 | Philips Nv | Dispositif de commutation commande par des signaux |
FR2157143A5 (de) * | 1971-10-19 | 1973-06-01 | Queffeulou Jean Yves | |
US3864520A (en) * | 1972-07-25 | 1975-02-04 | Ford Ind Inc | Signal monitoring control apparatus |
US3825694A (en) * | 1972-10-30 | 1974-07-23 | Cit Alcatel | Conversation detector for a telephonic channel concentrator |
US3832491A (en) * | 1973-02-13 | 1974-08-27 | Communications Satellite Corp | Digital voice switch with an adaptive digitally-controlled threshold |
US3832493A (en) * | 1973-06-18 | 1974-08-27 | Itt | Digital speech detector |
US3890467A (en) * | 1973-11-01 | 1975-06-17 | Communications Satellite Corp | Digital voice switch for use with delta modulation |
US3882458A (en) * | 1974-03-27 | 1975-05-06 | Gen Electric | Voice operated switch including apparatus for establishing a variable threshold noise level |
IT1014614B (it) * | 1974-04-24 | 1977-04-30 | Sits Soc It Telecom Siemens | Circuito per rivelare la presenza di attivita in banda fonica in una giunzione telefonica |
JPS5154703A (de) * | 1974-11-08 | 1976-05-14 | Oki Electric Ind Co Ltd | |
IT1044353B (it) * | 1975-07-03 | 1980-03-20 | Telettra Lab Telefon | Metodo e dispositivo per il rico noscimento della presenza e.o assenza di segnale utile parola parlato su linee foniche canali fonici |
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
US4028496A (en) * | 1976-08-17 | 1977-06-07 | Bell Telephone Laboratories, Incorporated | Digital speech detector |
DE2649259C2 (de) * | 1976-10-29 | 1983-06-09 | Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg | Verfahren zum automatischen Erkennen von gestörter Telefonsprache |
US4130739A (en) * | 1977-06-09 | 1978-12-19 | International Business Machines Corporation | Circuitry for compression of silence in dictation speech recording |
US4323730A (en) * | 1979-06-13 | 1982-04-06 | Northern Telecom Limited | Idle channel noise suppressor for speech encoders |
FR2466825A1 (fr) * | 1979-09-28 | 1981-04-10 | Thomson Csf | Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif |
CA1147071A (en) * | 1980-09-09 | 1983-05-24 | Northern Telecom Limited | Method of and apparatus for detecting speech in a voice channel signal |
US4357491A (en) * | 1980-09-16 | 1982-11-02 | Northern Telecom Limited | Method of and apparatus for detecting speech in a voice channel signal |
US4573188A (en) * | 1982-06-10 | 1986-02-25 | The Aerospace Corporation | Digital to analog converter |
US4499594A (en) * | 1982-06-10 | 1985-02-12 | The Aerospace Corporation | Digital to analog converter |
JPH07113840B2 (ja) * | 1989-06-29 | 1995-12-06 | 三菱電機株式会社 | 音声検出器 |
JP2908168B2 (ja) * | 1993-03-15 | 1999-06-21 | シャープ株式会社 | 信号識別回路 |
JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3369080A (en) * | 1964-12-16 | 1968-02-13 | Bell Telephone Labor Inc | Conference circuit for coded signals permitting conference calls between vocoder and analogue stations |
US3424869A (en) * | 1965-06-15 | 1969-01-28 | Bell Telephone Labor Inc | Digital speech interpolation communication system |
-
1970
- 1970-03-13 US US00019184A patent/US3712959A/en not_active Expired - Lifetime
- 1970-07-10 FR FR7025858A patent/FR2060544A5/fr not_active Expired
- 1970-07-10 SE SE09583/70A patent/SE365922B/xx unknown
- 1970-07-13 DE DE2034623A patent/DE2034623C2/de not_active Expired
- 1970-07-13 GB GB3388270A patent/GB1305819A/en not_active Expired
- 1970-07-14 JP JP45061098A patent/JPS5250483B1/ja active Pending
- 1970-07-14 NL NLAANVRAGE7010412,A patent/NL173340C/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
NL7010412A (de) | 1971-01-18 |
NL173340C (nl) | 1984-01-02 |
US3712959A (en) | 1973-01-23 |
SE365922B (de) | 1974-04-01 |
GB1305819A (de) | 1973-02-07 |
JPS5250483B1 (de) | 1977-12-24 |
DE2034623A1 (de) | 1971-04-08 |
FR2060544A5 (de) | 1971-06-18 |
NL173340B (nl) | 1983-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2034623C2 (de) | Verfahren für das Erkennen von Sprachsignalen in Rauschen | |
DE2159575C3 (de) | Deltamodulator | |
EP0025086A2 (de) | Verfahren und Anordnung zur Impulsabstandsmessung bei periodischen Impulspaaren | |
DE2323959C3 (de) | Anordnung zur Fernablesung mehrerer Zähler | |
DE2730662A1 (de) | Verfahren und schaltung zum erzeugen eines autokorrelations-funktions-faktors | |
DE2131635A1 (de) | Digitale Komprimierschaltung | |
DE68911081T2 (de) | Logarithmischer Hüllkurvendetektor für ein analoges Signal. | |
DE3002960A1 (de) | Adaptiver deltamodulator | |
DE1912981A1 (de) | Codierer fuer Pulscodemodulation und differentielle Pulscodemodulation | |
DE2455584A1 (de) | Anti-larsen-einrichtung | |
DE2410748C3 (de) | Sprachgeschätzter Signalempfänger für Mehrfrequenzsignale | |
DE2143438A1 (de) | Digitaler Schwellwert-Detektor | |
DE2139918A1 (de) | Analog Digital Codierer | |
DE2857329C1 (de) | Verfahren und Einrichtung zur Verringerung des Bedarfs der Zahl von uebertragenen Bits bei der UEbertragung von PCM-Information | |
DE2110033B2 (de) | Sender zum Übertragen von Analogsignalen durch Impulskodemodulation | |
DE2950160A1 (de) | Logarithmischer analog-digital- wandler | |
DE3621513C2 (de) | Verfahren zur Übertragung eines Audiosignales | |
DE2610834A1 (de) | Detektor zur feststellung des spitzenwerts einer veraenderlichen elektrischen groesse | |
DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales | |
DE3040241A1 (de) | Schaltungsanordnung zur messung der daempfung einer uebertragungsstrecke | |
DE2325364A1 (de) | Anordnung zum entdecken eines schwachen nutzsignals in rausch- oder stoersignalen | |
DE3043727A1 (de) | Verfahren zum periodischen wandeln eines digitalwertes in einen analogwert | |
WO2006092424A1 (de) | Datenübertragungsverfahren mit pulsbreitemodulation , sender und empfänger dafür | |
DE1940082A1 (de) | Verfahren zum Erkennen von Sprachmerkmalen und deren Aufzeichung mittels einer elektrisch gesteuerten Schreibmaschine | |
DE3342739A1 (de) | A/d- und d/a-wandlung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8181 | Inventor (new situation) |
Free format text: FARIELLO, ETTORE, WASHINGTON, D.C., US |
|
D2 | Grant after examination |