[go: up one dir, main page]

DE2608244C2 - Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern - Google Patents

Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern

Info

Publication number
DE2608244C2
DE2608244C2 DE19762608244 DE2608244A DE2608244C2 DE 2608244 C2 DE2608244 C2 DE 2608244C2 DE 19762608244 DE19762608244 DE 19762608244 DE 2608244 A DE2608244 A DE 2608244A DE 2608244 C2 DE2608244 C2 DE 2608244C2
Authority
DE
Germany
Prior art keywords
difference signal
signal
eigenvectors
vector
synchronous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19762608244
Other languages
English (en)
Other versions
DE2608244A1 (de
Inventor
Helmut Dipl.-Ing. 7913 Aufheim Mangold
Jürgen Dr.-Ing. 7900 Ulm Schürmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Licentia Patent Verwaltungs GmbH
Original Assignee
Licentia Patent Verwaltungs GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Licentia Patent Verwaltungs GmbH filed Critical Licentia Patent Verwaltungs GmbH
Priority to DE19762608244 priority Critical patent/DE2608244C2/de
Priority to DE19762621692 priority patent/DE2621692C2/de
Publication of DE2608244A1 publication Critical patent/DE2608244A1/de
Application granted granted Critical
Publication of DE2608244C2 publication Critical patent/DE2608244C2/de
Expired legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Analyse und Synthese des bei der Sprachübertragung mit vef minder· ter Bandbreite mit Hilfe von Prädiktoren gebildeten Differenzsjgnals.
Bei der Übertragung von Sprschsignalen mit Hilfe von Prädiktoren entsteht ein Differenzsignal, dessen ϊ Leistung gegenüber der ursprünglichen Leistung zwar vermindert, jedoch noch immer so groß ist, daß eine mehrstufige Übertragung notwendig ist. Um eine weitere Verminderung der Übertragungsrate zu erreichen, muß das Differenzsignal durch weniger schnell in veränderliche Parameter beschrieben werden. In der DE-OS 23 03 497 ist ein Verfahren beschrieben, das die Aufteilung der zu übertragenden Informationsmenge in Schätzkoeffizienten und Differenzsignal und die Quantisierung der Schätzkoeffizienten und des Differenzsi-ϊ gnals mit einem Rechenwerk entsprechend der Statistik des zu übertragenden Sprachsignals steuert. Durch dieses Verfahren läßt sich zwar die zu übertragende Bitrate reduzieren, dies jedoch zum Teil auf Kosten der Natürlichkeit des wiedergewonnenen Sprachsignals.
2(i Die der Erfindung zugrundeliegenden Aufgabe ist ein Verfahren anzugeben, das bei geringer Bitrate eine wesentlich bessere Natürlichkeit des Sprachsignals erreicht als es nach dem beschriebenen Verfahren möglich war.
Diese Aufgabe wird erfindungsgemäß durch die kennzeichnenden Merkmale des Anspruchs 1 gelöst. Zweckmäßige Ausführungen sind in den Unteransprüchen genannt.
An einem Ausführungsbeispiel und anhand der F i g. 1 jo bis 8 sei im folgenden das Verfahren näher erläutert.
F i g. 1 zeigt den C'bersichtsschaltplan eines Prädiktionsvocoders, bei dem das Differenzsignal ^übertragen wird,
F i g. 2 zeigt zwei typische Differenzsignale über der r> Zeit t aufgetragen, wobei der zu rekonstruierende Abschnitt a kleiner gewählt ist, als die kleinste auftretende Pitchperiode,
Fig. 3 zeigt die zweidimensionale Darstellung des (beispielsweise 40-dimensionaIen) Differenzsignalvek-4(i tors im ursprünglichen Koordinatensystem d\, d2 ... und das dazu gehörige gedrehte Eigenvektorsystem b 1, 62 ... Die Punktwolke zeigt die Endpunkte des Differenzsignalvektors bei vielen Messungen mit verschiedenen Wörtern und Sprechern.
4i F i g. 4 zeigt die Zusammensetzung des Differenzsignalvektors d aus Impulsanteilvektor y und Rauschanteilsvektor d:
Fig. 5 zeigt die Normierung des rekonstruierten Differenzsignal-Vektors c?auf die Länge von d,
v> Fig. 6 zeigt die Normierung nur des Rauschanteilvektors ei"
Fig. 7 zeigt ein Ausführungsbeispiel, wie das im Anspruch I beschriebene Verfahren auf der Sendeseite verwirklicht werden kann. (F = Rechenwerk zur ή Berechnung der Faltung, D— Schwellenwertdetektor. R = Rechenwerk zur Bestimmung des Rauschanteils, C — Rechenwerk zur Berechnung des cos φ,).
F i g. 8 zeigt ein Ausführungsbeispiel wie das im Anspruch 1 genannte Verfahren auf der Empfangsseite M) verv/irklicht werden kann. (RG = Rauchgenerator, N - Rechenwerk zur Normierung).
Betrachtet man das Differenzsignal, so lassen sich im Wesentlichen zwei Verschiedene Typen Unterscheiden! Fig.2a einen Mischtyp aus impülsrormiger Erregung und Rauschen und Fig.2b einen überwiegend rauschähnlichen Typ,
Das Differenzsignal wird deshalb auf Impuls^ und Rauschanteil hin analysiert und nur eine Beschreibung
OR 94.4
über zeitliche Lage und Höbe der Impulse und der Leistung des Rauschanteils übertragen und schließlich am Empfangsort ein Ersatzsignal \3\ erzeugt, das anstelle von \d\ im Empfänger zur Rekonstruktion des Sprachsignale verwendet wird. Aus der Folge {dl der Abtastwerte dk-2, dt-u dt, dt + i ... werden dazu Ausschnitte mit je π Abtastwerten herausgegriffen und als π Komponenten eines Vektors aufgefaßt.
di = (dk, du-\, dic-2 ·-. dit-n+\)T
Diese Ausschnitte werden so groß gewählt, daß sie auch die kleinste auftetende Pitchperiode nicht überschreiten. Daraus ergibt sich, daß gewisse Anteile im Bereich der Impulse recht genau rekonstruiert werden, andere Anteile im Bereich rein rauschförmiger Erregung weniger genau.
Aus einer Vielzahl von Messungen verschiedener Wörter und Sprecher wurden die Stichproben der Abtastweite des Differenzsignals, d. h die Vektoren dk in einem η dimensicnalen Koordinatensystem dargestellt, was eine Punktwolke chrakteristischen Abmaßes ergab(Fig. 3).
Durch eine Koordinatentransformation, d. h. Drehung und Verschiebung des Ursprungs in den Schwerpunkt der Punktwolke, wird erreicht, daß die Vektoren dk im neuen Koordinatensystem durch kleinere Komponenten beschrieben werden können. Dies bedeutet, daß weniger Leistung übertragen werden muß, um die Vektoren dj, zu übermitteln. Es hat sich sogar gezeigt, daß bei einer Beschränkung auf wenige wesentliche Komponenten nur ein kleiner Rekonstruktionsfehler gemacht wird. Oft genügt es auch, nur eine Drehung des Koordinatensystems vorzunehmen.
Die neuen Koordinaten, welche die verlangten Eigenschaften haben, werden mit Hilfe der Karhunen-Loeve-Transformation ausgerechnet und ergeben sich als die orthogonalen Eigenvektoren baer Matrix von dk im ursprünglichen Koordinatensystem. Die aus vielen Messungen im Mittel als günstigste ermittelten orthogonalen Eigenvektoren b können als Konstante in Festwertspeicher eingegeben und diese Speicher für das Durchführen des beschriebenen Verfahrens benutzt werden. Die Projektion eines Differenzsignalvektors dk auf einen der Eigenvektoren b, stellt eine Faltung des Differenzsigralvektors dk mit dem Eijrenvektor b, dar. bzw. eine Filterung des Differenzisgnalvektors dk mit einem Filter, dessen Impulsantwort durch den Eigenvektor b, repräsentiert wird (Fig. 4). Der Differenzsignalvektor dk wird also in Hen Komponenten des neuen Koordinatensystems aus orthogonalen Eigenvektoren B dargestellt, nach der Gleichung
y = B 'dk
Die gefilterten Difrerenzsignalvektoren y kennzeichnen den Impulsanteil und werden übertragen. Die Beschränkung auf den größten gefilterten Differenzsignalvektor ^hebt die lmpul'<sstruktui besonders hervor Ein solches Signal läßt sich deshalb besonders gut zur Feststellung der Synchron/eitpunkte verwenden, d. h. der Zeitpunkte, zu denen düVj Rekonstruktion mit Hilfe eines Eigenvektors im Empfänger besonders kleiner Fehler liefert,
Leider ist die Amplitude dieser Impulsspitzen, über viele Differenzsignale betrachtet, sehr unterschiedlich, so daß es nicht möglich ist, mit einem Schwellendetektor eindeutig die SyiichfönzeilpUnkte zu bestimmen. Es ist deshalb eine Normierung notwendig, Für diese Normie-
rung bietet sich der Cosinus des Winkels φ zwischen dem DifferenzsignalveKtor d* und dem gefilterten Differenzsignalvektor y an, da für gute Obereinstimmung der beiden Vektoren dk und y der Winkel φ besonders klein ist, bzw. der Wert cos φ gegen 1 strebt. Es gilt:
IU
cos, - ——
Kl
Die Ermittlung von cos2 φ, ergibt nur positive Schwellenwerte. Damit ist also für die Analyse ein einfaches Verfahren zur Gewinnung der Synchronzeitpunkte gegeben.
Die Feststellung der Synchronzeitpunkte besitzt eine gewisse Ähnlichkeit mit aer früher bei Vocodern üblichen Pitschanalyse, bei der die Grundfrequenz des Sprachsignals ermittelt wurde. Im Regelfall v/erden mit der hier dargestellten Methode auch Synchronzeitpunkte im Absnnd der Grundperiode gefunden, dies muß aber nicht unbedingt sein und ist für dit Wirkungsweise des Verfahrens nicht erforderlich. Wesentlich ist, daß die Synchronzeitp:inkte festlegen, wann die Eigenvektoren zur Rekonstruktion des Differenzsignals /um Einsatz kommen sollen, um ein möglichst orginalgetreues Differe.izsignal zu erzeugen.
Zur vollständigen Rekonstruktion des Differenzsignals muß nun noch ein Rauschvektor d' mit dem ursprünglichen Signal angepaßter Amplitude am Empfangsort hinzugefügt werden.Die AmplitudeI'''!ergibt sich in einfacher Weise als
lc/1I v'l'/l Ui'
Diese Rekonstruktion betrifft nur den jeweils als Impulsanteil vereinbarten Ausschnitt des Differenzsignals. Aus Gründen der Einfachheit empfiehlt es sich jedoch, den Rest des Differenzsignals bis zum Einsatz des nächsten Eigenvektors mit Rauschen gleicher Leistung aufzufüllen.
Da der am Fmpfangsort erzeugte Rauschvektor κ 3' nicht orthogonal zum Eigenvektor b, ist. wird bei der Rekonstruktion eine Korrektur notwendig sein. Die möglichen rekonstruierten Rauschvektoren 3' haben ihren Endpunkt auf dem Kreis, der durch df»n Radius mit der Länge \d' | um den Endpunkt des Vektors/gebildet wird (Fig. 4). Die Länge des Vektors 3'kann also maximal |>1 + 3' |, minimal \y\ - |<?" | betragen. Diese stark schwankenden Differenzsignale führen zu Blubbern im rekonstruierten Sprachsignal. Mit Hilfe einer Normierung können diese Schwankungen des Differenzsignals verringert werden.
Diese kann auf eine ers.e Art so geschehen, daß der Ge am.vektor σ nachträglich auf die Länge \d\ normiert wird (Fig. 5). Es entsteht so der Vektor 3„„rm. der die Richtung von dhat. ai/er die Länge von c/besitzi.
Diese Art der Normierung geht gleichermaßen auf Kosten von Impuls- und Rauschanteil. Das Verhältnis von Impuls- und Rauschanteil bleibt konstant.
Bei einer anderen Art der Normierung wird dagegen nur die Größe des Rauschanteils variiert (F ι g. 6), so daß der Impülsänteil erhalten bleibt. Hier wird der Raüschvektör 3^ so normiert,daß
C?„„tm
J*
Bei bisher bekannten Methoden der Analyse und
Synthese des Differenzsignals wurde ein sogenanntes Melodiesignal gewonnen, aus dem am Empfangsort mit Hilfe von Einheitsimpulsen das Sprachsignal rekonstruiert wurde. Eine Mischung von Impuls- und Rauschanteil war nicht vorgesehen. Das beschriebene Verfahren dagegen erlaubt einen stetigen Übergang von stimmhafter Erregung, d. h. Impulserregung über Mischerregung bis zur stimmlosen Erregung, d. h. reinem Rauschen, wobei die reine Impulserregung praktisch kaum vorkommt.
Dadurch eine wesentlich verbesserte Natürlichkeit des so erzeugten Sprachsignals erreicht. Die Genauigkeit der Rekonstruktion ist dabei beliebig steigerbar, sie hängt lediglich ab vom Aufwand und der Übertragungsrate.
Ein weiterer Vorteil des erfindungsgemäßen Verfahrens liegt in einer sehr zuverlässigen* phasenstarren Ermittlung der Synchronzeitpuiikle.
I lier/.ü 4 liliiit Zeichnungen

Claims (8)

Patentansprüche:
1. Verfahren zur Analyse und Synthese des bei der Sprachübertragung mit verminderter Bandbreite mit Hilfe von Prädiktoren gebildeten Differenzsignals, dadurch gekennzeichnet, daß das Differenzsignal mit Eigenvektoren gefaltet wird, wobei die Eigenvektoren nach bekannten Methoden aus einer passend gewählten Sprachsignal-Stichprobe berechnet werden, daß die maximale Periodenlänge der Eigenvektoren die kürzeste vorkommende Grundperiode des Differenzsignals nicht überschreitet, daß bei der Faltung der Synchronzeitpunkt durch die Stelle maximaler Korrelation zwischen Differenzsignal und Eigenvektor festgelegt wird, daß zu diesem Synchronzeitpunkt der zugehörige Eigenwert bestimmt wird, daß der Abstand aufeinanderfolgender Synchronzeitpunkte und ein Maß für den Eigenwert übertragen wird und daß der Empfänger ans diesen übertragenen Werten ein synthetisches Differenzsignal mit Hilfe der dort ebenfalls vorhandenen Eigenvektoren erzeugt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß durch eine Faltung des Differenzsignals mit den Eigenvektoren sich die Impulsanleile des Differenzsignals ergeben und daß die Impulsanteile als kennzeichnende Größe.i übertragen werden.
3. Verfahren nach den Ansprüchen 1 oder 2. dadurch gekennzeichnet, daß durch ein Rechenwerk aus der 2. Potenz des Differenzsignals abzüglich der
2. Potenz de Impulsanteils der Rauschanteil berechnet und der Rauschanteil Js kennzeichnende Größe übertragen wird.
4. Verfahren nach einem der A. ,prüche 1. 2 oder
3, dadurch gekennzeichnet, daß aus den Impulsanteilen und dem Differenzsignal mit Hilfe eines Rechenwerkes die 2. Potenz der cos-Funktion des Winkels zwischen dem Vektor des Impulsanteils und dem Vektor des Differenzsignals gebildet wird, daß mit Hilfe eines Schwellendetektors das Synchronsignal ermittelt wird und daß das Synchronsignal als kennzeichnende Größe übertragen wird.
5. Verfahren nach einem der Ansprüche I bis 4. dadurch gekennzeichnet, daß im Empfänger aus den gespeicherten Eigenvektoren ein dem Impulsanteil entsprechender passender Teil zum Synchronzeitpunkt ausgewählt wird, und zu dem von einem Rauschgenerator gebildeten, dem Rauschanteil entsprechendem Signal addiert wird.
6. Verfahren nach einem der Ansprüche I bis 5. dadurch gekennzeichnet, daß eins im Empfänger zusammengesetzte Differenzsignal W auf die Gesamtleistung des Differenzsignals (d) am Sender normiert wird(Fig. 5).
7. Verfahren nach einem der Ansprüche 1 bis 5. dadurch gekennzeichnet, daß nur der Rauschanteil (i^des im Empfänger zusammengesetzten Differenzsignals auf die Gesamtleistung des Differenzsignals (d)am Sender normiert wird (F ι g. 6).
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß Von den Eigenvekto^ feii huf wenige höhefwerdge Verwendet wefden,
DE19762608244 1976-02-28 1976-02-28 Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern Expired DE2608244C2 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE19762608244 DE2608244C2 (de) 1976-02-28 1976-02-28 Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern
DE19762621692 DE2621692C2 (de) 1976-02-28 1976-05-15 Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern und Anordnung zur Durchführung des Verfahrens

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19762608244 DE2608244C2 (de) 1976-02-28 1976-02-28 Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern

Publications (2)

Publication Number Publication Date
DE2608244A1 DE2608244A1 (de) 1977-09-15
DE2608244C2 true DE2608244C2 (de) 1981-09-24

Family

ID=5971159

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762608244 Expired DE2608244C2 (de) 1976-02-28 1976-02-28 Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern

Country Status (1)

Country Link
DE (1) DE2608244C2 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2811454A1 (de) * 1978-03-14 1979-09-20 Hertz Inst Heinrich Verfahren zur verbesserung der wiedergabequalitaet bandbegrenzt verfuegbarer sprache
FR2631146B1 (fr) * 1988-05-04 1991-05-10 Thomson Csf Procede et dispositif de codage de l'energie du signal vocal dans des vocodeurs a tres faibles debits

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2303497C2 (de) * 1973-01-25 1981-12-03 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Verfahren zur Übertragung von Sprachsignalen

Also Published As

Publication number Publication date
DE2608244A1 (de) 1977-09-15

Similar Documents

Publication Publication Date Title
DE69329511T2 (de) Verfahren und Einrichtung zum Unterscheiden zwischen stimmhaften und stimmlosen Lauten
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE69526007T2 (de) Postfilter und Verfahren zur Postfilterung
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
EP0624866B1 (de) Frequenzanalyseverfahren
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE69032551T2 (de) Einrichtung zur Sprachkodierung
DE69518452T2 (de) Verfahren für die Transformationskodierung akustischer Signale
DE3101851C2 (de) Vorrichtung zum Erkennen von Sprache
DE69107841T2 (de) Transformationskodierer und -dekodierer mit adaptiver blocklänge, adaptiver transformation und adaptivem fenster für hochwertige tonsignale.
DE69534285T3 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69700087T2 (de) Gerät und Verfahren zur Signalanalyse
DE69618422T2 (de) Verfahren zur Sprachdekodierung und tragbares Endgerät
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
WO2010037713A1 (de) Verfahren zur fehlerverdeckung bei fehlerhafter übertragung von sprachdaten
DE69618408T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
DE60015934T2 (de) Verfahren und vorrichtung zur vorverarbeitung von sprachsignalen zur kodierung mittels transformationssprachkodierer
DE3884839T2 (de) Codierung von akustischen Wellenformen.
DE69834093T2 (de) Sprachübertragungssystem mit veränderlicher bitrate
DE2608244C2 (de) Verfahren zur Analyse und Synthese des Differenzsignals bei Prädiktionsvocodern
DE69401959T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und einrichtung mit toleranz für dekoderspektralverzerrungen
DE69420200T2 (de) CELP Koder-Dekoder
DE3037276C2 (de) Tonsynthesizer

Legal Events

Date Code Title Description
OD Request for examination
OF Willingness to grant licences before publication of examined application
D2 Grant after examination
Q176 The application caused the suspense of an application

Ref document number: 2621692

Country of ref document: DE

AG Has addition no.

Ref country code: DE

Ref document number: 2621692

Format of ref document f/p: P

8339 Ceased/non-payment of the annual fee