-
Bezeichnung: Verfahren zur Übertragung breitbandiger
-
Tonsignale über einen Übertragungskanal mit verminderter Übertragungsbandbreite
Die Erfindung bezieht sich auf ein Verfahren zur Übertragung breitbandiger Tonsignale
über einen Übertragungskanal mit verminderter Übertragungsbandbreite bei dem n,3Ch
Art eines Vocoders sendeseitig das zu übertragende Tonsignal in ein den unteren
Signalbereich umfassendes Basisband und einen oberen Signalbereich unterteilt wird,
der obere Signalbereich mit Hilfe von Filtern in eine Anzahl von m Teilbereichen
aufgeteilt wird und in jedem Teilbereich die Augenblickswerte der Energieverteilung
bestimmt werden, worauf diese Informationen als trägerfrequentes Pilotsignal unter
Hinzufügung des unveränderten Basisbandes über den Übertragungskanal übermittelt
werden, und bei dem empfangsseitig aus dem Pilotsignal die Information über die
Augenblickswerte der Energieverteilung in den einzelnen Teilbereichen wiedergewonnen
und damit Er satz generatoren gesteuert werden und aus den hierdurch gewonnenen
Ersatzsignalen und dem direkt übertragenen Basisband durch Addition ein Tonsignal
geformt wird, das mit dem ursprünglichen breitbandigen Tonsignal weitgehend gleichklingt.
-
Bekannte Verfahren dieser Art arbeiten in Analogtechnik.
-
Eine digitale Verarbeitung war bisher nicht möglich, weil die Informationsmenge,
die mit dem Pilotsignal übertragen werden muß, sehr hoch ist. So ist zum Beispiel
die Zahl der Augenblickswerte der Energieverteilung pro Sekunde sehr
hoch,
zum Beispiel mindestens 30 bis 50 Werte pro Sekunde, um sicher zu stellen, daß die
Zischlaute der Sprache mit den zugehörigen niederfrequenten Lauten zeitlich zusammenfallen.
Das menschliche Ohr stellt in dieser Hinsicht hohe Anforderungen. Es ist daher bekannt,
daß zur Übertragung digitalisierter Signale eine wesentlich größere Bandbreite nötig
ist als bei analogen Signalen. Da bei der Übertragung in den vorgesehenen Bereichen
sowieso ein Mangel an Bandbreite besteht, war es bisher nur möglich, analoge Verfahren
zur Übertragung breitbandiger Tonsignale über einen Übertragungskanal mit verminderter
Übertragungsbandbreite zu verwenden.
-
Die Aufgabe der Erfindung besteht daher darin, ein Verfahren der eingangs
genannten Art vorzuschlagen, das sich der digitalen Technik bedient.
-
Diese Aufgabe wird dadurch gelöst, daß sendeseitig die Augenblickswerte
der Energieverteilung in den m Teilbereichen in digitale Amplitudenwerte mit jeweils
n Digitalstellen umgewandelt werden, daß die digitalen Amplitudenwerte mit einem
Multiplikationsfaktor derart erweitert werden, daß der größte digitale Amplitudenwert
dem größtmöglichen Digitalwert mit n Digitalstellen gleich ist, daß die Anzahl der
Digitalstellen der Amplitudenwerte in den m Teilbereichen durch Unterdrückung der
niederwertigen Stellen reduziert wird, daß den reduzierten Amplitudenwerten jeweils
Datenwörter erheblich reduzierter Stellenzahl zugeordnet werden, wobei die zugeordneten
Datenwörter dem ohrphysiologisch zulässig grob angenäherten Gruppenspektrum entsprechen,
daß die Datenwörter dem Pilotsignal in Phasen- oder Frequenzmodulation aufmoduliert
werden, daß das Pilotsignal mit einem der Gesamtamplitude des oberen Signalbereiches
proportionalen Amplitudensignal amplitudenmoduliert wird, das in an sich bekannter
Weise
nur so groß ist, daß das Pilotsignal die Mithörschwelle nicht
wesentlich überschreitet, und daß empfangsseitig nach der Demodulation den Datenwörtern
jeweils die Amplitudeninformationen für die zugehörigen m Teilbereiche zugeordnet
und diese Amplitudeninformationen mit dem wiedergewonnenen Amplitudensignal des
Pilotträgers moduliert werden.
-
Die vorgeschlagene Lösung hat den Vorteil, daß alternativ auch andere
Digitaldaten, zum Beispiel schriftliche Informationen, mit dem Pilotträger übertragen
werden können Darüber hinaus sind nach der Einführung des Systems auch zu einem
späteren Zeitpunkt noch nachträgliche Änderungen möglich, ohne die Kompatibilität
mit bereits vorhandenen Geräten in Frage zu stellen. Schließlich ist es besonders
leicht, mit dem erfindungsgemäßen System die Zischlaute der menschlichen Sprache
zu übertragen.
-
Ein vorteilhaftes Sendeverfahren zur Übertragung breitbandiger Tonsignale
über einen Übertragungskanal mit verminderter Übertragungsbandbreite, bei dem nach
Art eines Vocoders sendeseitig das zu übertragende Tonsignal in ein den unteren
Signalbereich umfassendes Basisband und einen oberen Signalbereich unterteilt wird,
der obere Signalbereich mit Hilfe von Filtern in eine Anzahl von m Teilbereichen
aufgeteilt wird und in jedem Teilbereich die Augenblickswerte der Energieverteilung
bestimmt werden, worauf diese Informationen als trägerfrequentes Pilotsignal unter
Hinzufügung des unveränderten Basisbandes über den Übertragungskanal übermittelt
werden, ist dadurch gekennzeichnet, daß die Augenblickswerte der Energieverteilung
in den m Teilbereichen in digitale Amplitudenwerte mit jeweils n
Digitalstellen
umgewandelt werden, daß die digitalen Amplitudenwerte mit einem Multiplikationsfaktor
derart erweitert werden, daß der größte digitale Amplitudenwert dem größtmöglichen
Digitalwert mit n Digitalstellen gleich ist, daß die Anzahl der Digitalstellen der
Amplitudenwerte in den m Teilbereichen durch Unterdrückung der niederwertigen Stellen
reduziert wird, daß den reduzierten Amplitudenwerten jeweils Datenwörter erheblich
reduzierter Stellenzahl zugeordnet werden, wobei die zugeordneten Datenwörter dem
ohrphysiologisch zulässig grob angenäherten Gruppenspektrum entsprechen, daß die
Datenwörter dem Pilotsignal in Phasen- oder Frequenzmodulation aufmoduliert werden
und daß das Pilotsignal mit einem der Gesamtamplitude des oberen Signalbereiches
proportionalen Amplitudensignal amplitudenmoduliert wird, das in an sich bekannter
Weise nur so groß ist, daß das Pilotsignal die Mithörschwelle nicht wesentlich überschreitet.
-
Vorteilhaft werden sendeseitig die reduzierten, digitalen Amplitudenwerte
der m Teilbereiche zu v Unter gruppen zusammengefaßt, denen Datenwörter erheblich
reduzierter Stellenzahl zugeordnet werden, wobei die zugeordneten Datenwörter dem
ohrphysiologisch zulässig grob angenäherten Gruppenspektrum entsprechen.
-
Vorzugsweise wird das analoge Amplitudensignal zur Amplitudenmodulation
des Pilotsignals durch Gleichrichtung des Analogsignals des gesamten oberen Signalbereichs
erhalten und ist die Bandbreite der Amplitudenmodulation wesentlich größer als die
Folgefrequenz der digitalen Datenwörter.
-
Der Multiplikationsfaktor wird vorteilhaft in ein analoyes Amplitudensignal
zur Amplitudenmodulation des Pilotträgers umgewandelt.
-
Vorzugsweise sind die m Teilbereiche logarithmisch gestaffelt.
-
Vorteilhaft erden sendeseitig die reduzierten Amplitudenwerte als
Kurzadressen einem Speicher zugeführt, der die Datenwörter für das ohrphysiologisch
angenäherte Gruppenspektrum enthält.
-
Ein vorteilhaftes Verfahren zum Empfang von breitbandigen Tonsignalen
über einen Übertragungskanal mit verminderter Übertragungsbandbreite, bei dem nach
Art eines Vocoders ein den unteren Signalbereich umfassendes Basisband zusammen
mit einem Pilotsignal übertragen wird, bei dem empfangsseitig aus dem Pilotsignal
die Informationen über die Augenblickswerte über die Energieverteilung in den einzelnen
m Teilbereichen des oberen Signalbereiches des Tonsignals wiedergewonnen und damit
Ersatzgeneratoren gesteuert werden und bei dem aus den hierdurch gewonnenen Ersatzsignalen
und dem direkt übertragenen Basisband durch Addition ein Tonsignal geformt wird,
das mit dem ursprünglichen breitbandigen Tonsignal weitgehend gleichklingt, ist
dadurch gekennzeichnet, daß empfangsseitig nach der Demodulation des Pilotsignals
Datenwörter erhalten werden, denen jeweils die Amplitudeninformationen für die zugehörigen
m Teilbereiche zugeordnet werden, und daß diese Amplitudeninformationen mit dem
wiedergewonnenen Amplitudensignal des Pilotträgers multipliziert werden.
-
Vorteilhaft werden empfangsseitig die wiedergewonnenen Datenwörter
als Kurzadressen einem Speicher zugeführt, der für jedes Datenwort die Amplitudeninformation
der zugeordneten m Teilbereiche enthält.
-
Mit den Amplitudeninformationen werden vorteilhaft im oberen Signalbereich
liegende, logorithmisch gestaffelte Tongeneratoren in ihrer Amplitude moduliert.
-
Empfangsseitig sind im Speicher die Amplitudeninformationen vorzugsweise
als digitale Zeitfunktionen mit schmalbandigem Rauschen enthalten, die durch Digital-Analog-Wandlung
in m frequenzgestaffelte Schmalband-Rauschspannungen gewandelt werden.
-
Vorzugsweise ist sendeseitig zur Verbesserung der Sprachübertragung
eine Spracherkennung vorgesehen, wird den Datenwörtern eine Kennung für Sprache
und eine Katalognummer für Zischlaute zugeordnet und wird empfangsseitig aus der
Sprachkennung und der Katalognummer der Zischlaut wiedergewonnen.
-
Vorteilhaft sind empfangsseitig die Zischlaute in digitaler Form als
Zeitfunktion im Speicher enthalten.
-
Die Erfindung ist in den Zeichnungen beispielhaft dargestellt. Es
zeigen: Fig. 1 ein Blockschaltbild der erfindungsgemäßen senderseitigen Einrichtung,
Fig. 2 ein Blockschaltbild einer anderen Ausführungsform einer erfindungsgemäßen
senderseitigen Einrichtung, Fig. 3 ein Blockschaltbild einer erfindungsgemäßen Empfangsschaltung,
Fig.
4 ein Blockschaltbild einer senderseitigen Einrichtung mit Spracherkennung, Fig.
5 ein Blockschaltbild einer empfängerseitigen Einrichtung mit Spracherkennung.
-
Nach Fig. 1 erhält eine senderseitige Einrichtung von einem Studio
1 ein breitbandiges Tonsignal 2 von beispielsweise 16 KHz Bandbreite, das in ein
unteres Basisband 3 von beispielsweise 3,5 bis 4 KHz Bandbreite und einem oberen
Signalbereich 4 aufgeteilt wird.
-
Mit bekannten Filtereinrichtungen 5 wird der obere Signalbereich 4
in 8 bis 12 logorithmisch gestaffelte m Teilbereiche zerlegt, wobei die Signale
dieser Teilbereiche mit gleichvielen hochwertigen, bis in den Millivoltbereich arbeitenden
Gleichrichtern 6 gleichgerichtet werden.
-
Die Zeitkonstante der Gleichrichter 6 ist der Bandbreite des jeweilig
zugeordneten Filters der Filtereinrichtung 5 angepaßt.
-
Die von den Gleichrichtern 6 gelieferten Gleichrichterspannungen 7,
die ein Maß für die spektrale Energieverteilung in den m Teilbereichen sind, werden
Analog-Digital-Wandlern 8 mit 8 bit Auflösung zugeführt und in m digitale Amplitudenwerte
9 mit jeweils 8 bit umgewandelt. Die hohe Auflösung von 8 bit ist notwendig, weil
nicht nur die Signale im Basisband 3, sondern auch im oberen Signalbereich 4 eine
hohe Dynamik, also einen großen Lautstärkebereich aufweisen sollen. Eine geringere
Auflösung bewirkte, daß nur bei großer Lautstärke die Übertragung der Höhen ermöglicht
ist.
-
Somit ergeben sich bei 12 Teilbereichen mit jeweils 8 bit insgesamt
96 bit. Bei einer Wiederholfrequenz von beispielsweise 50 Hz ergibt dies eine so
große Datenmenge, daß die erforderliche Bandbreite um viele Größenordnungen größer
ist als die Bandbreite des Übertragungskanals. Die digitalen Amplitudenwerte 9 werden
daher einem Normierer 10 zugeführt, in dem sie mit einem Multiplikationsfaktor derart
erweitert werden, daß der größte digitale Amplitudenwert dem größtmöglichen Digitalwert
mit 8 Digitalstellen gleich ist. Dadurch wird das Gesamtspektrum von seiner Information
über die Gesamtlautstärke befreit, so daß nur der relative Amplitudenverlauf des
Spektrums, bezogen auf die jeweils lauteste Spektrallinie übrigbleibt. Dieser relative
Amplitudenverlauf kann eine wesentlich geringere Auflösung haben, weil das menschliche
Ohr in dieser Hinsicht recht unkritisch ist.
-
Im Normierer 10 werden weiterhin die niederwertigen Stellen der normierten
digitalen Amplitudenwerte unterdrückt und zu drei v Untergruppen 11 mit jeweils
vier Kanälen zu 3 bit zusammengefaßt, so daß die v. Untergruppen 11 jeweils Signale
mit 12 bit, also insgesamt 36 bit aufweisen. Somit liegen drei stark in ihrer Auflösung
reduzierte Gruppenspektren 12 mit jeweils 12 bit vor.
-
Diese Gruppenspektren 12 werden nun einer Irrelevanzreduktion unterworfen
und dazu jeweils einem 4K enthaltenden Speicher 13 zugeführt, in dem durch ohrphysiologische
Reihenuntersuchungen gewonnene Spektralformen sehr geringer Auflösung abgespeichert
sind. Diese Speicher 13 liefern bei angelegtem Gruppenspektrum 12 (12-bit-Adresse)
Datenwörter 14 erheblich reduzierter Stellenzahl, mit zum Beispiel 4 bit. Die Datenwörter
14
sind als Katalognummern aufzufassen, die die als Adresse anzusehenden
Gruppenspektren 12 ohrphysiologisch zulässig in 16 vereinfachte Gruppenspektren
katalogisieren, deren Nummerierung durch das 4 bit Datenwort gegeben ist.
-
Insgesamt ergeben sich somit immer noch 3 mal 4 = 12 bit, d.h. es
können immer noch sehr viele, nämlich 4096 verschiedene normierte Gesamtspektren
dargestellt werden.-Dies reicht aus, denn noch weiter gehende Unterscheidungen kann
das menschliche Ohr bei den hohen Frequenzen nicht wahrnehmen. Diese Datenwörter
14 mit insgesamt 12 bit werden nun in Phasen- oder Frequenzmodulation in einem Pilotmodulator
1-5 auf das Pilotsignal 16 aufmoduliert.
-
Dem Pilotmodulator 15 wird außerdem ein der Gesamtamplitude des oberen
Signalbereiches 4 proportionales Amplitudensignal 17 zugeführt, mit dem das Pilotsignal
16 amplitudenmoduliert wird. Das Amplitudensignal 17 wird von einem Gleichrichter
18 erhalten, der den oberen Signalbereich 4 gleichrichtet.
-
Diese Doppelmodulationsart des Pilotsignals 16 ist ohrphysiologisch
besonders günstig, weil dadurch die Amplitudeninformation mit der Gesamtbandbreite
des Pilotsignals, und damit sehr schnellen Schwankungen folgend übertragen wird.
Bei zeitsequentieller analoger Übertragung, wie sie bei einem bekannten Verfahren
zur Anwendung kommt, ist - infolge der vollständigen zeitsequentiellen Übertragung
der absoluten Energieinhalte aller Teilbereiche - nur ein Bruchteil der Amplitudenfolgegeschwindigkeit
möglich, was als sehr störend empfunden wird. Die spektralen Änderungen können im
Gegensatz dazu mit dem Ohr nur sehr viel langsamer wahrgenommen werden als Amplitudenschwankungen.
-
Bei einem Knall oder einem Schlag des Schlagzeugs dürfen die hohen
Frequenzanteile zeitlich nicht nachhinken. Noch unnatürlicher ist es, wenn sie zum
Beispiel durch Verzögerung der Tiefen zuerst kommen. Dagegen braucht die genaue
spektrale Darstellung erst nach ca. 40 bis 60 Millisekunden erreicht zu sein.
-
Wie weiter Fig. 1 zeigt, wird das Pilotsignal 16 einem Summierer 19
zugeführt, und zusammen mit dem Basisband 3 übertragen. Weil somit das Pilotsignal
16 zusammen mit dem Basisband 3 übertragen wird und mit älteren Geräten kompatibel
bleibt, ist bei dieser Modulationsart sichergestellt, daß zusätzlich die Bedingung
des Verdeckungsefektes berücksichtigt wird, daß nämlich das Pilotsignal die Mithörschwelle
nicht wesentlich überschreitet. Bei leiser Musik ist somit auch die Amplitude des
Pilotsignals 16 entsprechend kleiner, so daß immer durch die lautere Wiedergabe
des Basisbandes 3 das Pilotsignal 16 in den nach dem vorgeschlagenen Verfahren arbeitenden
Geräten verdeckt wird.
-
Die Verdeckung des Pilotsignals ist auch schon bei den bekannten analogen
Verfahren erreicht worden, nicht jedoch wurde erreicht, die ohrphysiologisch sehr
wichtige Bevorzugung der Amplitudeninformationen bezüglich der Schnelligkeit der
Änderungsgeschwindigkeit.
-
Die Ausführung der senderseitigen Einrichtung nach Fig. 2 unterscheidet
sich dadurch von der Einrichtung nach Fig. 1, daß das Amplitudensignal 17 vom Normierer
abgeleitet wird.
-
Beim Normieren des Spektrums im Normierer 10 entstehen als Amplitudenwert
für das Gesamtsignal des Spektrums ein Multiplikationsfaktor 20 in digitaler Form,
mit beispielsweise 5 bit, der einem Digital-Analog-Wandler 21 zur Gewinnung des
Amplitudensignals 17 zugeführt wird.
-
Nach Fig. 3 weist eine erfindungsgemäße Empfangsschaltung einen Empfänger
22 für das Basisband 3 und das Pilotsignal 16 auf. Das Pilotsignal 16 wird einem
Pilotdecoder 23 zugeführt, der das Pilotsignal 16 sowohl amplitudendemoduliert,
und somit das Amplitudensignal 17 zurückgewinnt, als auch phasen- bzw. frequenzdemoduliert,
und somit die seriell übertragenden Digitalwörter 14 zurückgewinnt. Diese Datenwörter
14 werden in drei Datenworte zu je 4 bit aufgeteilt und drei empfängerseitigen Speichern
24 zugeführt, die beim Anlegen dieser 4 bit-Datenwörter jeweils 12 Digitaldaten
abgeben, die Gruppenspektren mit vier Kanälen zu je 3 bit darstellen. Damit ergeben
sich durch diese Datenexpansion zwölf Gruppenspektren 12 mit je 3 bit in normierter
Amplitudendarstellung. Diese Gruppenspektren 12 werden in zwölf multiplizierenden
Digital-Analog-Wandlern 25 in zwölf Analogspannungen zurückverwandelt. Dabei wird
das durch Amplitudendemulation gewonnene Amplitudensignal 17 als Multiplikationssignal
allen zwölf Digital-Analog-Wandlern 25 zugeführt. An den Ausgängen der multiplizierenden
Digital-Analog-Wandler 25 liegen nunmehr der Amplitude des Originalsignals entsprechende
Analogsignale 26 vor, die als Lautstärkesteuersignale nachfolgend zwölf Tongeneratoren
27 zugeführt werden und die deren Amplitude steuern. Diese Tongeneratoren 27 liegen
etwa in der Mitte der logarithmisch gestaffelten Filterfrequenzen des oberen Signalbereiches
4. Die Ausgangssignale 28 der Tongeneratoren 27 werden mit dem demodulierten Signal
des Basisbandes 3 zu einem Summensignal 29 zusammengefügt.
-
Es ist auch möglich, die Tonfrequenzen mit einer oder mehreren Rauschspannungen
in der Frequenz zu modulieren.
-
Es ist weiterhin auch möglich, schmalbandige Rauschspannungen anstelle
der Tonfrequenzen zu verwenden.
-
Diese schmalbandigen Rauschspannungen können digital als Zeitfunktion
in einem Speicher abgespeichert sein.
-
Durch Ansteuerung dieses Speichers durch einen Zähler können die zwölf
Rauschspektren auf Maximalamplitude normiert entnommen und Digital-Analog-Wandlern
zugeführt werden, an deren Ausgang die Rauschspannungen dann in analoger Form vorliegen.
Diese analogen Rauschspannungen werden dann mit den Amplitudensteuersignalen moduliert.
Dies kann zum Beispiel dadurch erreicht werden, daß multiplizierende Digital-Analog-Wandler
zur Anwendung kommen.
-
Zur besonders guten Wiedergabe der menschlichen Sprache kann die senderseitige
Einrichtung durch eine Spracherkennung ergänzt werden. Mit dieser an sich bekannten,
in den Figuren nicht dargestellten Spracherkennungsschaltung wird bei Sprache die
Signalverarbeitung der senderseitigen Einrichtung gemäß Fig. 1 in eine senderseitige
Einrichtung mit einer Signalverarbeitung nach Fig. 4 umgeschaltet. Die nicht dargestellte
Spracherkennung ist vor dem Pilotmodulator 15 angeordnet. Das 12 bit Datenwort 14
wird in einem weiteren Speicher 30 auf seine Struktur untersucht und durch eine
weitere 1 rrelevanzredukt ion eine Katalognummer des identifizierten Zischlautes
gebildet. Unter der Annahme, daß es 64 Zischlaute gibt, genügt eine 6-bit Katalognummer
31, so daß dieser 6-bit Katalognummer 31 noch von der nicht dargestellten Spracherkennungsschaltung
gelieferte Erkennungsbit 32 der Sprache angehängt werden können, beispielsweise
sechs Einsen.
-
Wie die Fig. 5 zeigt, erkennt der Empfänger 22 mit Hilfe des Pilotdecoders
23 an den Erkennungsbit 32, daß es sich um
Sprache handelt. Der
Empfänger führt dann die wiedergewonnene 6-bit Katalognummer 31 als Adresse einem
Speicher 33 zu, in dem die verfügbaren Zischlaute als Zeitfunktionen abgespeichert
sind und die bei Anlegen dri 6-bit Katalognummer 31 mit normierter maximaler Amplitude
J tude abqegeben werden. Auch hier wird dann durch einen multiplizierenden Analog-Digital-Wandler
25 der Zischlaut mit richtiger Lautstärke analog zurückgewonnen.