DE2659674C3 - Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders - Google Patents
Verfahren und Anordnung zum Synchronisieren eines Semi-FormantvocodersInfo
- Publication number
- DE2659674C3 DE2659674C3 DE19762659674 DE2659674A DE2659674C3 DE 2659674 C3 DE2659674 C3 DE 2659674C3 DE 19762659674 DE19762659674 DE 19762659674 DE 2659674 A DE2659674 A DE 2659674A DE 2659674 C3 DE2659674 C3 DE 2659674C3
- Authority
- DE
- Germany
- Prior art keywords
- input
- output
- synchronization
- formant
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 title claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 230000008447 perception Effects 0.000 description 6
- 230000005284 excitation Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Time-Division Multiplex Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Die Erfindung betrifft ein Verfahren und eine Anordnung zum Synchronisieren eines Semi-Formantvocoders,
bei dem das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen über das
Sprachsignal mit seinen Formanten enthält
Insbesondere aus Gründen der einfachen Verschlüsselungsmöglichkeit
besteht großes Interesse an der Übertragung von Sprachsignalen in digitalisierter,
insbesondere pulscodemodulierter Form. Zur Übertragung von Sprachsignalen in digitalisierter Form mit
niedriger Bitrate über bandbegrenzte Kanäle werden Vocoder verwendet Die Prinzipien der wichtigsten
Vocoder sind beispielsweise in den »Proceedings of the IEEE«. Band 54, Nr. 5, Mai 1966, Seiten 702 bis 734
beschrieben.
Die älteste Methode zum Analysieren und Synthetisieren von Sprache zum Zweck der Reduktion der
erforderlichen Bandbreite der zu übertragenden Sprache bzw. zum Zweck der Digitalisierung des Sprachsignals
mit niedriger Bitrate ist im sogenannten Kanalvocoder verwirklicht Während die direkte
Digitalisierung des Sprachsignals auf sehr hohe Bitraten, bei kompandierter Pulscodemodulation (PCM) beispielsweise
auf 64 kbit/s, führt, ermöglicht ein Kanalvocoder die Übertragung des Sprachsignals mit wenigen
kbit/s. Der Kanalvocoder nutzt die Eigenschaften des menschlichen Gehörs aus, welches eine Kurzzeit-Spektralanalyse
des empfangenen Sprachsignals durchführt, aber sehr unempfindlich gegen Phasenverzerrungen ist.
Für die Spracherzeugung läßt sich ü^her ein Ersatzbild
angeben, in welchem der Sprechtakt durch ein zeitvariables Filter dargestellt wird, welches bei
stimmhaften Lauten durch einen Impulsgenerator mit einer Impulsfolge der Sprachgrundfrequenz (»pitch«)
und bei stimmlosen Lauten durch einen Rauschgenerator angeregt wird.
Das den Sprechtakt darstellende Filter kann durch eine Anzahl von parallel geschalteten Bandpässen
dargestellt werdenderen Durchlaßbereiche aneinander anstoßen und deren Ausgangssignale addiert werden.
Mit Hilfe variabler Dämpfungsglieder am Eingang oder Ausgang jedes Bandpasses kann ein bestimmtes
Übertragungsverhalten, eine bestimmte spektrale Hüllkurve, eingestellt und durch Änderung der Dämpfungsglieder auch zeitvariabel gestaltet werden. Durch
Anregung dieses Systems mit einer Impulsfolge oder Rauschen läßt sich, wenn die Einstellung der Dämpfungsglieder
laufend, beispielsweise alle 20 ms, entsprechend geändert wird, auf der Empfangsseite synthetische
Sprache erzeugen.
Mit einer gleichartigen Filteranordnung auf der Sendeseite läßt sich die Sprache analysieren, indem die
Signalleitungen an den Ausgängen der Filter gemessen werden. Diese sich nur langsam ändernden Meßwerte
können laufend übertragen und zur Einstellung der Dämpfungsglieder im Syntheseteil verwendet werden.
Zusätzlich muß im sendeseitigen Analyseteil fortlaufend
ermittelt werden, ob die Sprachleute stimmhaft oder stimmlos sind und bei stimmhaften Lauten muß die
Sprachgrundfreqiienz gemessen werden. Diese Informationen
werden ebenfalls zum empfangsseitigen Analyseteil übertragen.
Auf die Verfahren zur Ermittlung der Information über die Anregung soll hier nicht näher eingegangen
werden, da dies nicht Gegenstand der Erfindung ist. Hierzu sei auf die bereits genannte Literaturstelle sowie
auf das Buch »Speech Analysis, Synthesis and Perception«, j Flanagan, Springer-Verlag, Berlin,
Heidelber, New York, 1972, Seiten 184 bis 186 und Seite
324 verwiesen.
Eine Reduktion des Aufwandes ergibt sich beim sogenannten »Formantvocoder«. Dieser ist ebenfalls in
den bereits genannten »Proceedings of the IEEE«, Seiten 725 und 726, insbesondere Fig.7, sowie im
genannten Buch »Speech Analysis, Synthesis and Perception« auf 'den Seiten 339 bis 348, insbesondere
Figur 8.9, beschrieben. Die spektrale Einhüllende eines Sprachsignals ist durch mehrere Maxima gekennzeichnet
Diese entstehen aufgrund von Resonanzen des Sprechtaktes, welche als Forrnanten bezeichnet werden.
In der Sprache Erwachsener finden sich unterhalb von 3 kHz in der Regel drei Formanten. 'p. einem
Formantvocoder hat der Analyseteil die Aufgabe, die Frequenzlagen der einzelnen Formanten sowie die
Amplituden der spektralen Einhüllenden bei diesen Frequenzen zu ermitteln. Diese Informationen werden,
zusammen mit der Information über die Anregung (Sprachgrundfrequenz, Entscheidung stimmhaft/stimmlos)
digitalisiert und zum empfangsseitigen Syntheseteil übertragen.
Im Syntheseteil werden die Durchlaßbereiche durchstimmbarer Bandpässe auf die Formantfrequenzen
eingestellt. Diese Bandpässe werden beispielsweise gleichartig angeregt wie beim Kanalvocoder (mit
Impulsen bei stimmhaften Lauten, mit Rauschen bei stimmlosen Lauten). Die Ausgangssignale der Bandpässe
werden durch Dämpfungsglieder entsprechend der ebenfalls übertragenen Information über die Spektralamplituden
bei den jeweiligen Formantfrequenzen gewichtet und ergeben addiert das synthetische
Sprachsignal.
Der Formantvocoder hat gegenüber dem Kanalvocoder den Vorteil, daß weniger Information übertragen
werden muß, da nur die Information über die Lage und Amplitude der Formanten zu ermitteln ist und somit nur
eine geringere Bitrate für die Übertragung notwendig wird, daß aber andererseits eine bessere und natürliche
Sprachwiedergabe erwartet werden kann, da der Formantvocoder sich besser an die Struktur des
Sprechtrakts angleicht als der Kanalvocoder. Die Messung der Formanten ist allerdings problematisch, da
sich die Frequenzbereiche der einzelnen Frequenzen nicht gegenseitig ausschließen, so daß beispielsweise
zwei Formanten zusammenfallen können oder daß einzelne Formanten ganz verschwinden. Daher ergeben
sich für einen reinen Formantvocoder beträchtliche Realisierungsschwierigkeiten.
Dazu kommt, daß bei allen Vocodern mit Sprachgrundfrequenziindung
und synthetischer Anregung auf der Empfangsseite die erreichbare Sprachqualität begrenzt ist. Diese Schwierigkeit ist in den bereits
genannten Literaturstellen eingehend diskutiert. Insbesondere ergeben sich Probleme bei der Sprachgrundfrequenzfindung
aus bandbegrenzter Telefonsprache mit einer unteren Grenzfrequenz von ca. 300 Hz, in welcher
die Sprachgrundfrequenj selbst gar nicht mehr enthalten
ist. sondern nur noch deren Harmonische, und bei Hintergrundgeräuschen.
Zur Umgehung dieser Schwierigkeit wurde verschiedentlich der Einsatz von Vocodern mit Sprachanregung
(»voice excited vocoder«) vorgeschlagen, so beispielsweise im bereits genannten Buch, »Speech Analysis,
Synthesis and Perception«, auf den Seiten 333 bis 337 und den Seiten 347 bis 348. Hierbei wird, auf Kosten
einer höheren Bitrate bei der Übertragung, ein Teil des Sprachbandes, zum Beispiel von 300 bis 800 Hz, direkt
ίο übertragen und hieraus wird im Syntheseteil durch
geeignete Maßnahmen das Anregungssignal für die höherfrequenten Kanäle gewonnen. Ein derartiger
Vocoder, bei welchem ein Teil des Sprachbandes direkt übertragen wird und nur der restliche Teil des
Sprachbandes dem vocodergemäßen Analyse-Synthese-Verfahren unterzogen wird, wird auch ais »Semi-Vocoder«
bezeichnet Hierzu sei beispielsweise auf die bereits genannten »Proceedings of the IEEE«, Seite 730,
verwiesen sowie auf die DE-OS 24 33 741.
Auch Formantvocoder mit unir::telbarer Übertragung
eines Teils des Sprachbandes nnö, beispielsweise
aus dem bereits genannten Buch, »Speech Analysis, Synthesis and Perception«, Seiten 347 bis 348, bekannt.
Diese Vocoder sollen im folgenden als »Semi-Fü.-mantvocoder« bezeichnet werden. Der direkt übertragene
Teil des Sprachbandes wird im folgenden als »Grundband« bezeichnet
Derartige Vocoder ermöglichen eine sehr gute Qualität der übertragenen und synthetisierten Sprache
so auch bei unvollkommener Nachbildung der Struktur der höheren Formanten (der erste Formant ist in der Regel
bereits im übertragenen Grundband enthalten), da das direkt übertragene Grundband eine sehr wirkungsvolle
Maskierung dieser Unvollkommenheiten bewirkt. Das Grundband allein würde bereits eine, wegen der
geringen Bandbreite allerdings nur bedingt verständliche, Sprachwiedergabe ermöglichen. Die zugesetzten
höheren Formanten erhöhen die Verständlichi-.eit und
Natürlichkeit der Sprache und erleichtern die Sprecheridentifikation
(die bei Vocodern mit synthetischer A'ordnung im Syntheseteil nur sehr bedingt möglicht
ist).
Die Ausgangssignale des Analyseteils des Vocoders werden zunächst digitalisiert und anschließend in einem
■i) Multiplexer in einem seriellen Strom binärer Daten
umgeformt. Der Einsatz des Multiplexers ist beispielsweise aus den erwähnten »Proceedings of the IEEE«,
Bild 6 und 7 auf den Seiten 724 und 725, ersichtlich. Der resultierende digitale Bitstrom (PCM) wird zum
Empfänger übertragen. Hierzu ist bei der Übertragung über einen Telefonkanal sende- und empfangsseitig ein
»Modem« (Abkürzung für »Modulator-Demodulator«) erforderlich, um das zu übertragende PCM-Signal
anzupassen. Die eigentliche Übertragung erfolgt beispielsweise in Form eines frequenz- oder phasenuinge·
tasteten Signals. Einzelheiten hierzu können beispielsweise dem Buch »Principles of Data Communication«.
R. W. Lucky, J.Salz und E. J. Weldon, Mc Graw-Hill Book Company, New York, San Francisco,
M) Toronto, London, Sidney, 1968, entnommen werden. Auf
der Empfangsseite erfolgt im Modem die Rück'imwandlung
in das binäre Datensignal und die Serien-Parallel-Wandlung mittels eines Demultiplexers, bevor die
einzelnen Teilsignale den entsprechenden Stellen im
bi Syntheseteil zugeführt werden.
Der Erfindung liegt die Aufgabe zugrunde, bei einem Semi-Formantvocoder das Problem der Synchronisierung
zu lösen.
Diese Aufgabe wird bei einem Verfahren zum Synchronisieren eines Semi-Formantvocodeni, bei dem
das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen über das Sprachsignal mit seinen
Formanten enthält, erfindungsgemäß dadurch gelöst, daß aus mehreren Rahmen ein Überrahmen gebildet
wird, bei dem in einem Rahmen sendeseitig die Information über den Formanten mit der höchsten
Frequenz durch ein Synchronisiersignal ersetzt wird und bei dem empfangsseitig dieses Synchronisiersignal
ausgewertet und durch die gespeicherte Information über den Formanten mit der höchsten Frequenz aus
dem vorhergehenden Rahmen ersetzt wird.
Das digitale binäre Signal muß eine Rahmenstruktur aufweisen, um die Teilinformationen über die einzelnen
Formanten und über das Grundband auf der Empfangsseile wieder trennen zu können. Beginn und Elnde eines
Pulsrahmens müssen eindeutig erkennbar sein. Hierzu ist eine Rahmensynchronisation notwendig. Werden
dem Pulsstrom zusätzliche Synchronisierbits zugesetzt, so steigt die Bitratc an. was aus Gründen der
verfügbaren begrenzten Übertragungsbandbreite unerwünscht ist. Wird andererseits die Bitrate nicht erhöht,
so muß ein Teil der verfügbaren bit/s für Synchronisierzwecke verwendet werden; dieser Anteil steht für die
Übertragung der Analysesignale dann nicht mehr zur Verfügung, was ebenfalls nachieilig ist. Wird dagegen
.i'ä dritte Möglichkeit laufend in bestimmten Abständen
ein Teil der dem zu übertragenen <■ pracnsignal
zugeordneten Bits einfach durch Synchronisierbits ersetzt, so sind diese Bits und damit die betroffenen zu
übertragenden Abtastwerte der Sprachinformation verfälscht, was sich im allgemeinen als Qualitätsverminderung
im Sprachsignal am Ausgang des empfangsseitigen Syntheseteils des Semi-Formantvocoders auswirkt.
Bei der Erfindung wird von der Erkenntnis ausgegangen,
daß zum einen die Wegnahme von Informationsbits beim Formanten mit der höchsten Frequenz die Qualität
des Sprachsignals am wenigsten beeinträchtigt und daß zum anderen der Ersatz der zeitweise ausbleibenden
Information über den Formanten mit der höchsten Frequenz durch die Information über den Formanten
mit der höchsten Frequenz aus dem vorhergehenden Rahmen den Qualitätsverlust der Sprache weitgehendst
ausgleicht.
Wie bereits erläutert wurde und auch aus dem schon genannten Buch »Speech Analysis. Syathesis and
Perception«. Seite 348, ersichtlich ist, genügt es bei einem Semi-Formantvocoder bereits eine unvollkommene
Nachbildung der Sprache im Bereich der höheren Formanten im Syntheseteil, um ein natürlich klingendes
Sprachsignal guter Verständlichkeit erzeugen zu können. Dabei wird, wie Versuche zeigen, die Qualität der
Nachbildung mit wachsender Ordnung des Formanten unkritischer. Dies hängt teilweise auch damit zusammen,
daß bei den höherfrequenten Formanten eine nennenswerte Energie im Spektrum vorwiegend nur noch bei
stimmlosen Lauten (mit rauschartiger Anregung) auftritt. Diese Eigenschaft der Sprache ist beispielsweise
auch dem bereits genannten Buch »Speech Analysis, Synthesis and Perception«, Seite 175, Figur 5.27, zu
entnehmen.
Wird daher die Nachbildung nur des höchsten übertragenen Formanten, und auch diese nur gelegentlich,
nämlich so oft wie zu Synchronisationszwecken not!17, verfälsch* so wird die ^usthtät des svnthet!S!erten
Sprachsignals nicht unerträglich beeinflußt. Da sich die Formantfrequenzen und -amplituden ferner zeitlich nur
langsam ändern (das .Sprachsignal ist ein 'quasistationärer'
Vorgang) ist eine weitere Verbesserung dadurch erzielbar, daß zur Synthese des Sprachsignals die durch
die Synchronisierinformation verfä|<:rhtpn Rits Hurrh
die entsprechenden, dem höchsten übertragenen Formanten zugeordneten, Bits der vorhergehenden Rahmens
ersetzt werden, welche zu diesem Zweck über die Dauer eines Rahmens zwischcngespcichert wurden. Da
sich über die Dauer eines Rahmens das Sprachsignal nur wenig ändert, wird sich auch die Frequenz und
Amplitude des höchsten Formanten nur wenig peil "der!
haben, so daß auch die Synthese des nöchstcn
Formanten noch nahezu richtig ist. Diese Ersatz wirkt sich näherungsweise so aus, als ob bezüglich des
höchsten Formanten die Dauer des Analyst intervals
(beispielsweise 20 ms) gelegentlich verdoppelt wird (aul beispielsweise 40 ms), aber nur bei Auftreten der
Synchronisierbits.
Eine Anordnung zur Durchfuhr'.mg des erfindung.>6c
mäßen Verfahrens, die sendeseitig aus einem Analyseteil, einem Multiplexer und einem Modulator und
empfarv^eitig aus einem Demodulator, einem Demultiplexer
und einem Syntheseteil besteht, ist vorteilhafterweise dadurch gekennzeichnet, daß sendeseitig eir
Sychronisierwortgenerator mit einem an einen Steuer
ausgang des Multiplexers angeschlossenen Steuerein gang vorgesehen ist, daß sendeseitig ein erstei
I Ί ischalter vorgesehen ist. dessen einer Fir,gang mil
dem Ausgang des Multiplexers, dessen anderer Eingang mit dem Ausgang des Synchronisierwortgenerators unc
dessen Ausgang mit dem Eingang des Modulator; verbunden sind, da3 sendeseitig ei'".· <
ischaltersteue rung vorgesehen ist, deren Eingang mit einerr
Steuerausgang des Multiplexers und deren Ausgang mil dem Steuereingang des ersten Umschalters verbunder
sind, daß empfangsseitig eine Synchronisierwort-Erken nungsschaltung vorgesehen ist, deren Eingang mit derr
Ausgang des Demodulators und deren Ausgang mil einem Synchronisiereingang des Demultiplexers ver
bunden sind, daß empfangsseitig ein zweiter Umschalter vorgesehen ist. dessen einer Eingang über eir
Verzögerungsglied mit dem Ausgang des Demodula tors, dessen Ausgang mit dem Eingang des Demultiplexers
und dessen Steuereingang mit einem Umschalter Steuerausgang der Synchronisierwort-Erkennungs
schaltung verbunden sind, und daß empfangsseitig eir Speicher vorgesehen ist, dessen Eingang einerr
Ausgang des Syntheseteils für die digitale Informatior über den Formanten mit der höchsten Frequenz unc
dessen Ausgang mit dem anderen Eingang des zweiter Umschalters verbunden sind.
Vorteilhaft ist es dabei, wenn als Umschalter eine Gatterschaltung vorgesehen ist
Eine Verschlüsselung des Multiplexsignals ist möglich wenn zwischen dem Ausgang des ersten Umschalten
und dem Eingang des Modulators eine Verschlüsse iungseinrichtung und wenn zwischen dem Ausgang de;
Demodulators und dem Eingang der Synchronisierwort Erkennungsschakung sowie dem Eingang des Verzöge
rungsgliedes eine Entschlüsselungseinrichtung vorgese hen sind.
Vorteilhaft ist es dabei, wenn eine Verschlüsselungs
einrichtung mit einem Synchronisiereingang vorgese hen ist, der zur Vorwärtssynchronisation mit den
Ausgang des Synchronisierwortgenerators verbunder ist und wenn eine Entschlüsselungseinrichtung mi
einem Synchronisiereingang vorgesehen ist, der mi einem Ausgang der Synchronisier-Erkennungsschaltunj
verbunden ist.
Anhand von Ausführungsbeispielen wird die Erfindung näher erläutert.
Fig.! zeigt ein Ausführur.gsbeispäe! eines Scrrsi-Formantvocoders,
F i g. 2 zeigt die Rahmenstruktur des Multiplexsignals und
Fi?, 3 zeigt einen mit Gattern realisierten Umschalter.
Der Semi-Formantvocoder nach Fig. 1 enthält ein Mikrofon 1, einen Analyseteil 2, einen Multiplexer 3 mit
Steuerausgang 4, Takteingänge 5 und 5', einen Synchronisierwortgenerator 6, einen Umschalter 7, eine
Umschaltersteuerung 8, einen Modulator 9, einen Hbertragungskanal 10, einen Demodulator 11, ein i">
Verzögerungsglied 12, einen Umschalter 13, einen Speicher 14, eine Synchronisierwort-Erkennungsschaltung
15, einen Demultiplexer 16 mit Synchronisiereingang 17, einen Syntheseteil 18 mit einem Ausgang 19 für
die digitale Information über den Formanten mit der röchsten Frequenz und einen Hörer 20. Wahlweise
kann nnc'i one Verschlüsselungseinrichtung 21 und eine
Entschiüsselungseinrichtung 22 vorgesehen sein.
F i g. 2 zeigt ein Beispiel für zwei Multiplexsignale im
selben Zeitabschnitt, wie sie an den Punkten a'und c'in Fig. 1 auftreten. Die Multiplexsignale sind in Rahmen R
und Überrahmen OR gegliedert. Arabische Indices beziehen sich auf die Rahmen und römische Indices auf
die Überrahmen. Jeder Rahmen R ist in diesem Beispiel in Bits für das Grundband G, einen zweiten Formanten
F2 und einen dritten Formanten F3 untergliedert.
Der Semi-Formantvocoder nach Fig. 1 wirkt wie folgt:
Das zu analysierende Sprachsignal gelangt vom Mikrofon 1 zum sendeseitigen Analys°teil 2, welcher
nach einem der verschiedenartigen in der bereits genannten Literatur angegebenen Prinzipien aufgebaut
sein kann. Der Analyseteil 2 führt bereits die Analog-Digital-Umsetzung der ermittelten Teilsignale
(Frequenzen und Amplituden der Formanten, Grundband) durch und gibt im vorliegenden Ausführungsbeispiel
diese Informationen auf mehreren Leitungen parallel an den Multiplexer 3 ab. Die Informationen über
die Formanten brauchen nur in größeren Abständen, ca. alle 20 ms, übertragen zu werden. Im vorliegenden
Beispiel ist angenommen, daß außer dem Grundband nur Frequenz und Amplitude des zweiten und dritten
Formanten übertragen werden. Dies ermöglicht die Übertragung eines auf ca. 3 kHz bandbegrenzten
Sprachsignals. Bei einem breitbandigeren Signal muß- so ten mehr Formanten übertragen werden. Der Multiplexer
liefert ein binäres serielles PCM-Signal an den einen Eingang a des ersten Umschalters 7. Es wäre auch ein
Vertauschen der Reihenfolge von Multiplexer und Analog-Digitalumsetzung möglich.
Die Taktrate des abgegebenen PCM-Signals wird durch den Takt Γ bestimmt, der dem Mulitplexer 3 am
Eingang 5 zugeführt wird. Das abgegebene PCM-Signal gelangt über den ersten Umschalter 7 an den Eingang
des Modulators 9. Der Synchronisierwortgenerator 6, dem ebenfalls der Takt Γ vom Eingang 5 her zugeführt
wird, gibt das Synchronisiersignal ab. Dieses Signal wird mit dem Umschalter 7 lediglich in ganz bestimmten,
durch die Umschaltersteuerung 8 festgelegten, Zeiträumen in das PCM-Signal vom Multiplexer 7 eingefügt
und ersetzt dort einen Teil derjenigen Bits, die die Information über die Frequenz und/oder Amplitude des
höchsten Formanten tragen. Die richtige zeitliche Zuordnung wird dadurch erzwungen, daß der Synchronisierwortgenerator
6 mit einem Steuerausgang 4 des Multiplexers 3 verbunden ist, über welchen dem Synchronisierwortgenerator 6 mitgeteilt wird, wann am
Multiplexerausgang die Information über den höchsten Formanten auftritt. Diese Triggerinformation vom
Ausgang 4 wird gleichzeitig der Umschaltersteuerung 8 zugeführt, welche in vorbestimmten synchronen Zeiträumen
veranlaßt, daß der erste Umschalter 7 von a nach b umschaltet, so daß am Punkt cdas PCM-Signal
mit der gewünschten Rahmenstruktur zur Verfügung steht. Die Struktur dieses Signals ist in Fig. 2 in der
oberen Zeile dargestellt.
In den mit G], G2, G\... bezeichneten Zeiträumen
werden die Bits überti agen, die die Information über das Grundband enthalten. In den Zeiträumen F2 wird die
Information über den zweiten Formanten, in den Zeiträumen F3 die Information über den dritten
Formanten übertragen. Die hier gewählte Signalstruktur stellt lediglich eines von vielen möglichen Beispielen
dar. Es könnten auch mehr Formanten übertragen werden. Auch könnte die Reihenfolge sowie die Art der
Ineinanderschachtelung beim Multiplexen anders gewählt sein. Es ist beispielsweise auch eine bitweise
Verschachtelung anstatt der gewählten blockweisen Verschachtelung möglich. Gi, F2i und F3) bilden den
Rahmen R\, entsprechend werden die folgenden Rahmen gebildet.
Zum Zeitpunkt des Auftretens von F3? wird der erste
Umschalter 7 von Position a nach Position b umgeschaltet und F3i durch das vom Synchronisierwortgenerator
6 abgegebene Synchronisiersignal S\ ersetzt. Entsprechend wird F3s durch Sw ersetzt. Damit
ergeben sich die im gewählten Beispiel jeweils drei Rahmen umfassenden Überrahmen ÜR\, OR», ÜR\\\.
Das PCM-Signal gelangt vom ersten Umschalter 7 zum Eingang des Modulators 9, welcher das modulierte
Signal auf den Übertragungskanal 10 gibt.
Auf der Empfangsseite gelangt das übertragene Signal auf den Eingang des Demodulators 11, der an
seinem Ausgang wiederum das PCM-Signal mit der ir. Fig.2, obere Zeile, dargestellten Struktur an den
Eingang des Verzögerungsgliedes 12, sowie an den Eingang der Synchronisierwort-Erkennungsschaltung
15 abgibt. Beim Eintreffen des Synchronisierwortes (S], Sw, ... in Fig. 2) veranlaßt die Schaltung 15, welcher
vom Anschluß 5' der Bittakt T zugeführt wird, das Umschalten des zweiten Umschalters 13 von Position a'
nach Position b'. In diesem Zeitraum erhält der Umschalter 13 vom Speicher 14 die zwischengespeicherte
digitale Information über den höchsten Formanten aus dem vorhergehenden Rahmen. Diese Information
wurde dem Speicher 14 vorher vom Ausgang 19 des Syntheseteils 18 zugeführt. Am Punkt c'des Umschalters
13 erscheint daher das in der unteren Zeile von F i g. 2 dargestellte Signal, in welchem letztlich F3i
durch F3| und F3s durch F34 ersetzt ist Dieses Signal
wird dem Demultiplexer 16 zugeführt Die Synchronisierwort-Erkennungsschaltung 15 synchronisiert den
Demultiplexer 16 über den Eingang 17. Der Demultiplexer 16 erhält ebenfalls den Bittakt T vom Anschluß 5'.
Das Verzögerungsglied 12 hat die Aufgabe, der Synchronisierwort-Erkennungsschaltung 15 rechtzeitig
die Erkennung der Synchronisierinformation zu ermöglichen, aufgrund welcher der Umschalter 13 betätigt
wird.
An den Ausgängen des Demultiplexers erscheinen wiederum die das Grundband und die Formaten, im
gewählten Beispiel den zweiten und dritten Formanten,
beschreibenden digitalen Teilsignale. Diese werden zum Syntheseteil 18 geleitet, der das synthetisierte Sprachsignal
dem Hörer 20 zuführt.
Bei Einsatz einer sendeseitigen Verschlüsselungseinrichtung, in Fig. i mit 21 bezeichnet, zwischen dem
Ausgang cdes ersten Umschalters 7 und dem Eingang des Modulators 9, sowie einer empfangsseitigen
Entschlüsselungseinrichtung, in F i g. 1 mit 22 bezeichnet, zwischen dem Ausgang des Demodulators Il und
dem Eingang des Verzögerungsgliedes 12, besteht die Möglichkeit, das im PCM-Signal enthaltene Synchronisiersignal
gleichzeitig sendeseitig zur Vorwärtssynchronistaion der Verschlüsselungseinrichtung 21 und emp-
10
fangsseitig zur Synchronisation der zugehörigen Entschlüsselungseinrichtung
22 mit zu benutzen. Hierzu wird der Verschlüsselungseinrichtung 21 das Synchronisiersignal
vom Synchronisierwortgenerator 6 zugeführt, der Entschlüsselungseinrichtung 22 wird dieses Signal
von der Synchronisierwort-Erkennungsschaltung 15 zugeführt. Dieser Fall ist in Fig. 1 gestrichelt eingezeichnet.
Fig.3 zeigt eine als Umschalter wirkende Gatterschaltung.
Sie enthält zwei UND-Gatter 23 und 24, einen Inverter 25 und ein ODER-Gatter 26. Diese
Anordnung wirkt wie einer der Umschalter 7 und 13 und kann diese ersetzen.
Hierzu 2 Blatt Zeichnungen
Claims (5)
1. Verfahren zum Synchronisieren eines Semi-Formantvocoders,
bei dem das Multiplexsignal in Rahmen zusammengefaßte digitale Informationen
über das Sprachsignal mit seinen Formanten enthält, dadurch gekennzeichnet, daß aus mehreren
Rahmen ein Überrahmen gebildet wird, bei dem in einem Rahmen sendeseitig die Information über
den Formanten mit der höchsten Frequenz durch ein Synchronisiersignal ersetzt wird und bei dem
empfangsseitig dieses Synchronisiersignal ausgewertet und durch die gespeicherte Information über
den Formanten mit der höchsten Frequenz aus dem vorhergehenden Rahmen ersetzt wird.
2. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, die sendeseitig aus einem
Analyseteil, einem Multiplexer und einem Modulator und empfangsseitig aus einem Demodulator, einem
Demultiplexer und einem Syntheseteil besteht, dadurch gekennzeichnet, daß sendeseitig ein Synchronisierwortgenerator
(6) mit einem an einen Steuerausgang (4) des Multiplexers (3) angeschlossenen Steuereingang vorgesehen ist, daß sendeseitig
ein erster Umschalter (7) vorgesehen ist, dessen einer Eingang (a)mh dem Ausgang des Multiplexers
(3), dessen anderer Eingang (b) mit dem Ausgang des Synchronisierwortgenerators (6) und dessen Ausgang
(c) mit dem Eingang des Modulators (9) verbunden sind, daß sendeseitig eine Umschaltersteuerung
{%,) vorgesehen ist, deren Eingang mit
einem Steuerausgang /4) des Multiplexers (3) und deren Ausgang mit dem Steuereingang (u)des ersten
Umschalters (7) verbunden sind, 'iaß empfangsseitig eine Synchronisierwort-Erkennungsschaltung (15)
vorgesehen ist, deren Eingang mit dem Ausgang des Demodulators (11) und deren Ausgang mit einem
Synchronisiereingang (17) des Demultiplexers (16) verbunden sind, daß empfangsseitig ein zweiter
Umschalter (13) vorgesehen ist, dessen einer Eingang (a') über ein Verzögerungsglied (12) mit
dem Ausgang des Demodulators (11), dessen Ausgang (c') mit dem Eingang des Demultiplexers
(16) und dessen Steuereingang (u') mit einem Umschaltersteuerausgang der Synchronisierwort-Erkennungsschaltung
(15) verbunden sind, und dsiß empfangsseitig ein Speicher (14) vorgesehen tut,
dessen Eingang mit einem Ausgang (19) des Syntheseteils (18) für die digitale information über
den Formanten mit der höchsten Frequenz und dessen Ausgang mit dem anderen Eingang (b') des
zweiten Umschalters (13) verbunden sind (Fi g. I).
3. Anordnung nach Anspruch 2, dadurch gekennzeichnet, daß als Umschalter eine Gatterschaltung
vorgesehen ist (F i g. 3). «
4. Anordnung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß zwischen dem Ausgang (c)des
ersten Umschalters (7) und dem Eingang des Modulators (9) eine Verschlüsselungseinrichtung
(21) und zwischen dem Ausgang des Demodulators (11) und dem Eingang der Synchronisierwort-Erkennungsschaltung
(15) sowie dem Eingang di:s Verzögerungsgliedes (12) eine Entschlüsselungseinrichtung
(22) vorgesehen sind (F i g. 1).
5. Anordnung nach Anspruch 4, dadurch gekennzeichnet, daß die Verschlüsselungseinrichtung (21)
einen Synchronisiereingang aufweist, der zur Vorwärtssynchronisation mit dem Ausgang des Synchronisierwortgenerators
(6) verbunden ist, und daß die Entschlüsselungseinrichtung (22) einen Synchronisiereingang
besitzt, der mit einem Ausgang der Synchronisierwort-Erkennungsschaltung (15) verbunden
ist (F ig. 1).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19762659674 DE2659674C3 (de) | 1976-12-30 | 1976-12-30 | Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19762659674 DE2659674C3 (de) | 1976-12-30 | 1976-12-30 | Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2659674A1 DE2659674A1 (de) | 1978-07-20 |
DE2659674B2 DE2659674B2 (de) | 1978-10-26 |
DE2659674C3 true DE2659674C3 (de) | 1979-07-12 |
Family
ID=5997101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19762659674 Expired DE2659674C3 (de) | 1976-12-30 | 1976-12-30 | Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE2659674C3 (de) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6208959B1 (en) | 1997-12-15 | 2001-03-27 | Telefonaktibolaget Lm Ericsson (Publ) | Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel |
-
1976
- 1976-12-30 DE DE19762659674 patent/DE2659674C3/de not_active Expired
Also Published As
Publication number | Publication date |
---|---|
DE2659674A1 (de) | 1978-07-20 |
DE2659674B2 (de) | 1978-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE69023604T2 (de) | Digitalsignalkodiergerät. | |
DE3023375C1 (de) | ||
DE69509555T2 (de) | Verfahren zur veränderung eines sprachsignales mittels grundfrequenzmanipulation | |
DE3041423C1 (de) | Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals | |
EP0193143B1 (de) | Verfahren zur Übertragung eines Audiosignals | |
DE69014422T2 (de) | Digitales Übertragungssystem, Sender und Empfänger zur Verwendung im Übertragungssystem und Aufzeichnungsträger, der aus dem Sender in Form einer Aufzeichnungseinrichtung erhalten wird. | |
DE69916756T2 (de) | Tonverarbeitungverfahren und Vorrichtung zur Anpassung eines Hörgerätes für Hörbehinderte | |
EP1386307B2 (de) | Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals | |
EP2245621B1 (de) | Verfahren und mittel zur enkodierung von hintergrundrauschinformationen | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
EP0464534B1 (de) | Transformationskodierer mit adaptiver Fensterfunktion | |
DE2609297C3 (de) | Übertragungssystem für Gesprächssignale | |
DE4343366C2 (de) | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen | |
DE102021205251B4 (de) | Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz | |
EP0370277A2 (de) | Subband-Übertragungssystem | |
DE2659674C3 (de) | Verfahren und Anordnung zum Synchronisieren eines Semi-Formantvocoders | |
DE3138523A1 (de) | Verfahren zur abhoersicheren frequenzbandkomprimierten uebertragung von sprachsignalen | |
DE1151285B (de) | Nachrichtenuebertragungssystem fuer Sprache mit Herabsetzung der Bandbreite | |
DE2826818C2 (de) | Verfahren und Vorrichtung zum Erzeugen eines künstlichen Durchschnitts-Sprechsignals | |
DE2855395C2 (de) | Nachrichtenübertragungssystem | |
DE60210766T2 (de) | Adpcm sprachkodiersystem mit phasenfaltungs und -entfaltungsfiltern | |
DE102013005844B3 (de) | Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals | |
DE2152280C3 (de) | Sprach-Multiplex-Vorrichtung zur Mehrfachnutzung von Fernsprechkanälen | |
DE1926362C (de) | Einrichtung zur Sprachanalyse und synthe se nach dem Vocoderpnnzip |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OAP | Request for examination filed | ||
OD | Request for examination | ||
C3 | Grant after two publication steps (3rd publication) | ||
8339 | Ceased/non-payment of the annual fee |