DE69827545T2 - Vorrichtung zur Erzeugung von Hintergrundrauschen - Google Patents
Vorrichtung zur Erzeugung von Hintergrundrauschen Download PDFInfo
- Publication number
- DE69827545T2 DE69827545T2 DE69827545T DE69827545T DE69827545T2 DE 69827545 T2 DE69827545 T2 DE 69827545T2 DE 69827545 T DE69827545 T DE 69827545T DE 69827545 T DE69827545 T DE 69827545T DE 69827545 T2 DE69827545 T2 DE 69827545T2
- Authority
- DE
- Germany
- Prior art keywords
- circuit
- noise
- power
- raster
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000005253 cladding Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
- Diese Erfindung betrifft eine Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere eine Schaltung zur Bestimmung der Energie des laufenden Rasters und eine Schaltung zur Bestimmung der Umhüllung dieses Rasters per so genannter LPC-Analyse beinhaltet.
- Wenn man Sprachsignale in Netzwerktypen überträgt, die auch andere Daten als solche Signale befördern, ist es oft nützlich, sich zu versichern, dass Sie nicht die gesamte Bandbreite einnehmen und den gleichzeitigen Durchgang dieser anderen Daten zulassen, was der Optimierung ihres Datenflusses gleichkommt. Dann ist vor der Übertragung ein Detektor der Sprachaktivität vorgesehen, der in den Eingangssignalen dort, wo Sprachsignale mit Rauschen und stillen Momenten vermischt sind, das Auffinden derjenigen Zeiträume ermöglicht, in denen die Sprachsignale anwesend sind.
- Wenn die Anwesenheit von Sprachsignalen erkannt wird, überträgt der nachfolgende Sprachkodierer regelmäßig (alle Raster) einen digitalen Datenstrom, der es einem entfernten Gesprächspartner ermöglicht, diese Sprachsignale später wiederherzustellen. Wenn man dagegen keine Sprachsignale mehr erkennt, schickt man keine kodierten Raster mehr ins Netz, um hierin den Datenfluss einzusparen. Für den entfernten Gesprächspartner kann man dann während dieser sprachlosen Zeiträume die Signalmuster auf Null erzwingen. Diese Lösung ist für die Verringerung des Datenflusses effizient, kann jedoch für den Gesprächspartner zu unangenehmen Effekten führen. Denn in der Mehrheit der Fälle gibt es keine vollkommene Stille an den Orten, an denen das Gespräch stattfindet, sondern eher eine Umgebungsrauschen. Wenn folglich im Zeitpunkt der Sprache/Stille-Übertragungen die Eingangssignalmuster auf Null gezwungen werden, hat der Gesprächspartner den Eindruck einer Diskontinuität des Gesprächs oder selbst einer Unterbrechung der Leitung.
- Das Ziel dieser Erfindung ist die Bereitstellung einer Vorrichtung zur Erzeugung von Komfortrauschen, die diese Nachteile behebt.
- Die Erfindung betrifft zu diesem Zweck eine Vorrichtung zur Erzeugung von Komfortrauschen entsprechend der Definition im einleitenden Absatz der Beschreibung, die außerdem dadurch gekennzeichnet ist, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen Rauschens, ein Untersystem aus zwei Stimmen zur parallelen Leistungsdefinition und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird, wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung, deren Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter und einen Multiplizierer mit einem Wägungskoeffizienten α enthält, und der zweite Leistungsdefinitionsweg einen Multiplizierer mit dem zusätzlichen Wägungskoeffizienten (L – α) enthält.
- Diese Vorrichtung ermöglicht es, dem entfernten Gesprächspartner eine Meldung besserer Qualität wiederzugeben. Denn mit der Übertragung während den Ruhezeiten von einigen Rastern, welche die grundsätzlichen Merkmale des Umgebungsrauschens enthalten, beseitigt man diesen unangenehmen Eindruck der Leitungsunterbrechung im Falle völliger Ruhe. Die Kodierung dieser paar Rauschraster ist sehr wenig kostspielig im Datenfluss, da man nur die Frequenz- und Energiemerkmale des Rauschsignals senden muss, die ausreichen, um dem Gesprächspartner ein weitgehend äquivalentes Rauschen wiederzugeben. Vorrichtungen für die Erzeugung von Komfortrauschen sind bereits in Sprachkodierern enthalten, beschrieben z. B. in US-A-55 37509 von C. B. Southcottetal: "voice control of the pan-european digital mobile radio system", Communications technology for the 1990's and beyond, Dallas, 27.–30. Nov. 1989, Band 2 von 3, 27.11.1989, Institute of electrical and electronics engineers, Seiten 1070–1074, oder aus dem Empfehlungsprojekt, das kürzlich von der Internationalen Telekommunikations-Union (ITU) veröffentlicht wurde, "Draft Recommendation G.723Dual rate speech coder for multimedia telecommunication transmitting at 5.3 and 6.3 kbits/s", ITU, Study Group 15, 1995, 10. "LBC Meeting", Newton, Ma., USA, mit dem Ziel, eine Norm für einen Sprachkodierer zu definieren. Dazu muss man allerdings bemerken, das im Falle dieser bestehenden Ausführungen der Vorgang für die Erzeugung von Komfortrauschen sehr stark in den Sprachkodierer impliziert ist. Im vorliegenden Falle dagegen ist die Erzeugung nicht vom Kodierer abhängig. Denn man bedient sich nicht mehr der Wellenformdiktionäre, die traditionsgemäß in den Sprachkodierern enthalten waren, sondern der Addition des gefilterten Rauschens mit einem gaußschen Rauschen, das besonders interessant ist, wenn das Umgebungsrauschen sehr schwach ist.
- Die Besonderheiten der Erfindung treten jetzt anhand der folgenden Beschreibung und der beigefügten Zeichnung (
1 ) detaillierter in Erscheinung, die als nicht erschöpfendes Beispiel gegeben werden und ein Ausführungsbeispiel einer Vorrichtung zur Erzeugung von Rauschen nach der Erfindung veranschaulichen. - Auf
1 sind die Eingangssignale im Kodierteil in der Form von aufeinanderfolgenden Rastern TRn–1, TRn, ... vorbestimmter Dauer verfügbar. Dieser Kodierteil enthält zuerst wie auf der Figur vermerkt eine Schaltung11 zur Bestimmung der Energie des laufenden Rasters, auch als Leistungsanalyse bezeichnet, sowie eine Schaltung12 zur Bestimmung der Umhüllung dieser Raster (vom Standpunkt der Frequenz) mit einer unter dem Namen LPC (in Englisch: linear predictive coding) bekannten Analyse, welche eine Bewertung der linearen Voraussagekoeffizienten ermöglicht. Diese Merkmale der Eingangssignale werden quantifiziert, kodiert und übertragen. - Bei der Dekodierung, wo man ein so genanntes Komfortrauschen für den entfernten Gesprächspartner wiederherstellen möchte, enthält die Vorrichtung zur Erzeugung von Rauschen nach der Erfindung zuerst eine Schaltung
21 zur Erzeugung eines gaußschen Rauschens. Diese Schaltung ist kein Wellenformdiktionär und erfordert demnach keinen Speicher. Die Berechnung zur Ermöglichung dieser Erzeugung ist eine in Echtzeit gebildete Summe von Pseudozufallszahlen (man erhält ein gaußsches Signal, wenn die Anzahl an Iterationen ausreichend groß ist, weniger als zehn reichen generell aus). Dieses Rauschen wird parallel über zwei Leistungsdefinitionswege30 und40 gesendet, von denen der erste in Serie eine Leistungsschaltung31 (diese Leistung wird von der Energie des betreffenden laufenden Rasters bestimmt, die übertragen wurde), einen Filter32 (dessen ebenfalls übertragenen LPC-Koeffizienten wie hiervor aufgezeigt bewertet wurden) und einen Multiplizierer33 aufweist. Der Ausgang dieses Multiplizierers33 und und der eines ähnlichen Multiplizierers43 , welche den anderen Weg40 (diese Multiplizierer ermöglichen Wägungen mit den jeweiligen Koeffizienten a und 1 – a) bilden, bilden die Eingänge eines Addierers25 , an dessen Ausgang das wiederhergestellte Komfortrauschraster TBC beim Ausbleiben von Sprachsignalen kommt. - Man hat folglich im Kodierteil die Energie des betreffenden Rasters bestimmt und quantifiziert, um die Leistung einer der Leistungsdefinitionswege festzulegen, und auch die Koeffizienten des Filters dieses selben Leistungsdefinitionswegs bewertet und quantifiziert, anhand eines gaußschen Rauschens (das man einer Filterung unterzieht) ein Rauschen mit praktisch den selben spektralen Merkmalen wie das Originalrauschen zu regenerieren. Beim Anhören ist dieses wiederhergestellte Rauschen nicht genau dasselbe wie das Originalrauschen, doch die Qualität wird deutlich verbessert, da die brutalen Übergänge zwischen Sprache und völliger Ruhe nunmehr vermieden werden.
- Selbstverständlich ist in diese Erfindung nicht auf dieses Ausführungsbeispiel beschränkt, anhand dessen Varianten vorgesehen werden können. Für die Dekodierung kann man z. B. die Tatsache berücksichtigen, dass man den Datenflusses reduziert hat, indem man nicht jedes Mal ein kodiertes Raster überträgt: Um die abrupten Übergänge zu verringern ist es dann möglich, eine Interpolation mit den vorhergehenden Rastern zu machen, was die Energie und die Filterkoeffizienten betrifft. Auch kann man die Qualität verbessern, indem man zur Kodierung auch eine Interpretation der vorhergehenden Raster vorsieht.
encoding = Kodierung
decoding = Dekodierung
Claims (1)
- Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere eine Schaltung zur Bestimmung der Energie (
11 ) des laufenden Rasters und eine Schaltung zur Bestimmung der Umhüllung (12 ) dieses Rasters per so genannter LPC-Analyse beinhaltet, dadurch gekennzeichnet, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen Rauschens (21 ), ein Untersystem aus zwei Stimmen (30 ,40 ) zur parallelen Leistungsdefinition und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird, wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung (31 ), deren Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter (32 ) und einen Multiplizierer (33 ) mit einem Wägungskoeffizienten enthält, und der zweite Leistungsdefinitionsweg einen Multiplizierer (43 ) mit dem zusätzlichen Wägungskoeffizienten (L – α) enthält.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9703617A FR2761512A1 (fr) | 1997-03-25 | 1997-03-25 | Dispositif de generation de bruit de confort et codeur de parole incluant un tel dispositif |
FR9703617 | 1997-03-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69827545D1 DE69827545D1 (de) | 2004-12-23 |
DE69827545T2 true DE69827545T2 (de) | 2005-12-15 |
Family
ID=9505153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69827545T Expired - Fee Related DE69827545T2 (de) | 1997-03-25 | 1998-03-10 | Vorrichtung zur Erzeugung von Hintergrundrauschen |
Country Status (6)
Country | Link |
---|---|
US (1) | US6108623A (de) |
EP (1) | EP0869476B1 (de) |
JP (1) | JPH10340097A (de) |
CN (1) | CN1132327C (de) |
DE (1) | DE69827545T2 (de) |
FR (1) | FR2761512A1 (de) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240383B1 (en) * | 1997-07-25 | 2001-05-29 | Nec Corporation | Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal |
US6621834B1 (en) * | 1999-11-05 | 2003-09-16 | Raindance Communications, Inc. | System and method for voice transmission over network protocols |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
US7243065B2 (en) * | 2003-04-08 | 2007-07-10 | Freescale Semiconductor, Inc | Low-complexity comfort noise generator |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US8589153B2 (en) | 2011-06-28 | 2013-11-19 | Microsoft Corporation | Adaptive conference comfort noise |
US9640190B2 (en) * | 2012-08-29 | 2017-05-02 | Nippon Telegraph And Telephone Corporation | Decoding method, decoding apparatus, program, and recording medium therefor |
CN104978970B (zh) * | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
GB2532041B (en) | 2014-11-06 | 2019-05-29 | Imagination Tech Ltd | Comfort noise generation |
CN109841222B (zh) * | 2017-11-29 | 2022-07-01 | 腾讯科技(深圳)有限公司 | 音频通信方法、通信设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63124636A (ja) * | 1986-11-14 | 1988-05-28 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声伝送システムの疑似信号挿入方式 |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5327457A (en) * | 1991-09-13 | 1994-07-05 | Motorola, Inc. | Operation indicative background noise in a digital receiver |
US5828997A (en) * | 1995-06-07 | 1998-10-27 | Sensimetrics Corporation | Content analyzer mixing inverse-direction-probability-weighted noise to input signal |
US5689615A (en) * | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
US5864799A (en) * | 1996-08-08 | 1999-01-26 | Motorola Inc. | Apparatus and method for generating noise in a digital receiver |
-
1997
- 1997-03-25 FR FR9703617A patent/FR2761512A1/fr not_active Withdrawn
-
1998
- 1998-03-10 EP EP98200761A patent/EP0869476B1/de not_active Expired - Lifetime
- 1998-03-10 DE DE69827545T patent/DE69827545T2/de not_active Expired - Fee Related
- 1998-03-11 US US09/038,565 patent/US6108623A/en not_active Expired - Fee Related
- 1998-03-23 JP JP10073942A patent/JPH10340097A/ja not_active Ceased
- 1998-03-25 CN CN98105854A patent/CN1132327C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE69827545D1 (de) | 2004-12-23 |
US6108623A (en) | 2000-08-22 |
EP0869476B1 (de) | 2004-11-17 |
CN1194507A (zh) | 1998-09-30 |
FR2761512A1 (fr) | 1998-10-02 |
EP0869476A1 (de) | 1998-10-07 |
JPH10340097A (ja) | 1998-12-22 |
CN1132327C (zh) | 2003-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69631318T2 (de) | Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem | |
DE69226500T2 (de) | Verfahren und Gerät zur Sprachsignalübertragung | |
DE19609170B4 (de) | Verfahren zur Durchführung einer "Tiefe-Zuerst"-Suche in einem Codebuch zur Codierung eines Geräusch- bzw. Klangsignales, Vorrichtung zur Durchführung dieses Verfahrens sowie zellulares Kommunikationssystem mit einer derartigen Vorrichtung | |
DE69116476T2 (de) | Digitaler Signalverschlüssler | |
DE19604273C2 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
DE69624383T2 (de) | Verfahren zum kodieren und dekodieren von audiosignalen | |
DE2945414C2 (de) | Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals | |
DE69927578T2 (de) | Verfahren und vorrichtung zur durchführung einer mehrparteienkommunikation für ein kommunikationssystem | |
DE69827545T2 (de) | Vorrichtung zur Erzeugung von Hintergrundrauschen | |
DE69018989T2 (de) | Polyphonische kodierung. | |
DE19742655C2 (de) | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals | |
DE3736193C2 (de) | ||
DE2740945A1 (de) | Verfahren zum uebertragen von bildsignalen mit hilfe der differenz-puls- code-modulation (dpcm) und gesteuertem quantisierer | |
DE69738476T2 (de) | Verfahren und Gerät für Anrufregistrierung in einem Speicher | |
DE2522491A1 (de) | Echoloeschvorrichtung fuer eine fernsprechleitung | |
DE19715126A1 (de) | Sprachsignal-Codiervorrichtung | |
DE69527470T2 (de) | Mobilfunkübertragungssystem mit einem Ton- oder Sprachaktivitätsdetektor und Faltungskodierung | |
DE2826662A1 (de) | Schaltungsanordnung fuer schnelle sprachwiedergabe ueber digitale delta -modulation | |
DE4494736C2 (de) | Verfahren zur Spektralanalyse eines Eingangssignals sowie Spektral-Analysator zum Ausführen einer Spektralanalyse | |
DE69830816T2 (de) | Mehrstufige Audiodekodierung | |
EP0135229B1 (de) | Verfahren und Schaltungsanordnung zur Herstellung von Konferenzverbindungen in einem Vermittlungssystem | |
EP2047632A1 (de) | Verfahren zum durchführen einer sprachkonferenz und sprachkonferenzsystem | |
DE69928682T2 (de) | Audiocodierer, der Paketabschnitte wiederholt sendet | |
DE3650163T2 (de) | Integrierte digitale Schaltung zur Verarbeitung von Sprachsignalen. | |
DE2455584B2 (de) | Freisprecheinrichtung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |