DE2233872C2 - Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals - Google Patents
Verfahren zur Bestimmung der Grundwellenperiode eines SprachsignalsInfo
- Publication number
- DE2233872C2 DE2233872C2 DE2233872A DE2233872A DE2233872C2 DE 2233872 C2 DE2233872 C2 DE 2233872C2 DE 2233872 A DE2233872 A DE 2233872A DE 2233872 A DE2233872 A DE 2233872A DE 2233872 C2 DE2233872 C2 DE 2233872C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech
- speech signal
- value
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 title claims description 10
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 2
- 208000019300 CLIPPERS Diseases 0.000 description 1
- 241000009298 Trigla lyra Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals, bei dem
zur Vorhersage des augenblicklichen Wertes jedes Abtastwertes des Sprachsignals jeweils eine bewertete
Summierung einer Anzahl früherer .Sprachsignalabtastwerte verwendet wird und der vorhergesagte Signalnbtastwert
von dem tatsächlichen Signalabtastwert zur Erzeugung eines Differenzsignals subtrahiert wird.
Es sind Einrichtungen zur Verringerung der Kanalkapazität,
die für die Übertragung von Sprachsignalen erforderlich ist. bekannt. Die bekannteste Einrichtung
dieser Art ist der Vocoder. Ferner ist es auch bekannt, die Redundanz von Sprachsignale durch eine lineare
Vorhersage-Technik /u beseitigen. Bei diesen Einrichtungen wird ein .Sprachsignal analysiert, um seine
kennzeichnenden Eigenschaften /u bestimmen, woraufhin dann codierte Informationen bezüglich dieser
Eigenschaften anstelle des Sprachsignals selbst übertragen werden. Auf der Empfangsseite wird dann aus der
codierten Information ein künstliches Sprachsignal erzeugt. Ein Merkmal des .Sprachsignals ist seine
Grund- oder Tonhöhenfrequenz. Diese Eigenschaft bezeichnet die Grundfrequen/. mit der die Stimmbänder
während der Erzeugung verschiedener stimmhafter Sprachsignale vibrieren.
Das eingangs definierte Verfahren zur Bestimmung der Grundfrequenz eines Sprachsignals ist aus der
CAPS 8 44 193 bekannt. Damit das Signal für die b5
Übertragung hinsichtlich des gewünschten Informationsgehaltes die niedrigste mögliche Entropie beinhaltet,
werden bei diesem bekannten Verfahren sämtliche redundanten Merkmale aus dem zu ubertiagenden
Sprachsignal entfernt. Dabei wird die Redundanz zur Bandbreitenverringerung dadurch beseitigt, daß derjenige
Teil des Eingangssignals, welcher aus dem früher übertragenen Signal vorhersagbar ist. entfernt wird. Zur
Übertragung gelangt dann lediglich der nicht voraussagbare Teil des Signals. Um die Akkumulierung von
Codierfehlern zu vermeiden, wird sendeseitig nicht das Eingangssprachsignal zur Bestimmung des Differenzsignals
herangezogen, sondern das Sprachsignal aus den vorher übertragenen, codierten Signalen rekonstruiert.
Zur Lösung der Aufgabe ist es auch erforderlich, sowohl die Grundfrequenzmerkmale als auch die Formantmerkmale
aus dem Differenzsignal zu entfernen.
Der Erfindung liegt die Aufgabe zugrunde, die
Grundfrequenz eines Sprachsignals weitgehend fehlerfrei aus den Vorhersagedaten zu bestimmen, wobei auch
eine Unabhängigkeit vom Formantcharakter des Sprachsignals angestrebt wird.
Diese Aufgabe wird gemäß der Erfindung dadurch gelöst, daß als Zeitraum, welcher die Anzahl der
Λ kt^ctiuorlo -»■■»- /~Za%*,lnmtn** Aar *>r>wl%tiwtmetnt*»r*
(IL-IUjinbltb <-UI UknillllUllg U^J TÜI llklgVjUglVII
Abtastwertes umfaßt. 1 Millisekunde gewählt wird, daß man die Frequenz feststellt, mit der Differenzsignalspitzenwerte
oberhalb eines vorgegebenen Schwellenwertes auftreten, und daß die so ermittelte Frequenz als
Grundfrequenz des Sprachsignals mit der zugehörigen Grundwellenperkyde klassifiziert wird.
Weiterbildungen der Erfindung sind den Unteransprüchen zu entnehmen.
Die gemäß der Erfindung erhaltene Grundfrequenz eines Sprachsignals bzw. der Stimmbänder kann dann
weiter verwendet werden, beispielsweise zur Bestimmung des Stimmhaft-Stimmloscharakters des Sprachsignals.
Die Vorteile der Erfindung, nämlich die weitgehend fehlerfreie Bestimmung der Sprachgrundfrequenz, basieren
auf der Analyse eines komplexen Sprachsignals zur Bestimmung seiner Grundfrequenz. Diese Analyse
beruht auf der Analyse rles Ft'ilVrs zwischen einem
vorhergesagten Wert des Sprachsignals. basierend auf seinen früheren Abiastwerten, jnd seinem im Augenblick
gerade vorliegenden Wert. Das Zeitintervall, das durch eine Anzahl von Abtastwerten repräsentiert und
für die Gewinnung des Vorhersagewertes verwendet wird, ist in typischer Weise eine Millisekunde lang.
Aufgrund eines bei der Vorhersage verwendeten Kurzzeitspeichers stellen die vorhergesagten Signalwerte
weitgehend die Formantstruktur des Sprachsignals dar. Die Grundfrequenzanalyseeinrichiung nach
der Erfindung ist besonders effektiv, da bei der Erzeugung eines Differen/signals. d. h. des Vorhersagefehlersignals,
die Formantstruktur des Signals aus dem Eingangssignal entfernt worden ist. Da jedoch die
Grundfrequenzpenodc der Sprachsignale in typischer Weise in einem Bereich von j ms bis 20 ms liegt, ist die
Vorhersage der Grundfrequen/siruktur. basierend juf
einem Zeitintervall von einer Millisekunde eines vergangenen Sprachabschnittes völlig vernachlässigbar
Daher bleibt die Cjrundfrequenzinformation in dem
Vorhcrsagefehlersignal enthalten, so daB nur eine
geringe oder gar keine Rückwirkung durch die Formantstruktur auftritt, und die Spitzenabtrennoperation
für die Erzeugung eines Meßwertes der Sprachgrundfrequenz des Eingangssignals wirksam ist.
Ein weiterer Vorteil basiert auf der zusätzlichen Verwendung von Vorhersagefehlerabtastungen zur
Erzeugung eines Stimmhaft-Stimmlos-Unterschei-
dungssignals. Die Siimmhafientschcidiing wird abgeleitet
aus dem Verhältnis des Effektivwertes, also des
quadratischen Mittelwertes der Eingangssignalabtastwerte zum Effektivwert der entsprechenden Vorhersagefehlcrabtastwcrte.
Im folgenden wird die Erfindung anhand der Figuren beispielsweise näher erläutert. Es zeigt
F i g. 1 das Blockschaltbild eines Sprachsignalanalysators.
das das Prinzip der Erfindung verdeutlicht und
Fig.2 eine Larstellung der Wellenform eines
stimmhaften Sprachsignals.der Positionen festgestellter Grundfrequenzimpulse in dem stimmhaften Sprachsignal
(vertikale Linien) und eines stimmlosen Sprachsegments.
Ein Signalanalysator, der das Prinzip der Erfindung beinhaltet, ist in F i g. 1 dargestellt. Die Sprachsignale,
die von einer beliebigen Quelle geliefert werden, werden zu dem Analysator übertragen und durch ein
Tiefpaßfilter 10 geschleust. Das Filter 10 hat eine typische Grundfrequenz in der Gegend von 5 kHz. Das
sich ergebende Signal wird dann mit einer Frequenz von etwa 1OkHz im Abtaster Ii abgetastet, wobei dieser
Abtastvorgang von den Signalen des Taktgeoers 12 gesteuert wird. Die Sprachabtastwerte. s,„ die au' diese
Weise abgeleitet werden, werden zu einer Speichereinheit 13 übertragen, die diese Signale geordnet speichert
und zwar in typischen Blöcken von 200 Abtastungen,
d. h. Si, S). .., sjoo. Die Blöcke oder Rahmen von
Abtastwerten werden periodisch aus der Speichereinheit 13 entnommen, beispielsweise ebenfalls von ;inem
Signal des Taktgebers 12 gesteuert und zu einer adaptiven Vorhersageschaltung 14. einem Vorhersage-Parameterrechner
und zu einem Subtrahiernetz 16 übertragen.
Die adaptive Vorhersageschaltung 14 bearbeitet die π
angelieferten Signale btastwerte. um den augenblicklichen Wert jedes Abtastwertes auf der Basis einer
gewichteten Summation einer Anzahl von früheren Abtastwerten vorherzusagen. Die Vorhersageoperation
erfolgt auf der Basis Abtastwert zu Abtastwert, und die ίο
Vorhersageschaltung 14 wird periodisch mit einem neuen Rahmen von Abtastungen von der Speichereinheit
13 beschickt. Eine für die Verwendung in dem System gemäß der vorliegenden Erfindung geeignete
adaptive Vorhersageschaltung ist beispielsweise in der -n
US-PS 36 31 520ausführlich beschrieben.
Zur Anpassung des sich konstant ändernden Charakters des Eingangssprachsignals, wird die adaptive
Vorhersageschaltung 14 so gesteuert, daß sie sich an den laufenden Signalzustand anpaßt. Es hat sich als ίο
genügend erwiesen, die Werte der verwendeten Parameter nachzustellen, um die Vorhersageschaltung
in Intervallen zu steuern, die mit der Grundwellenperiode des Signals vergleichbar sind. Da das exakte
CirundwellenintervaU nicht zur Verfügung steht (obwohl das Grundfrequen/ausgungssignal des Systems in
einer Rückkoppelanordnung /ur Annäherung des Iniervalls einer späteren Grundwellcnperiode verwendet
werden kann), ist eine Nachstellung der Parameterwerte in Intervallen von etwa der Zeit von 200
Abtastungen vollständig ausreichend. Dieses entspricht einem Zeitintervall von etwa 20 msek.
Der Vorhersage-Parameterrechner 15 bearbeitet so
Sprachablastwerte der Speichereinheit 13. um eine Folge von Parametersignalen ;) = ;/i. ./>. ... a„ zu
erzeugen, die periodisch zur Nachstellung der Vorhcrsageschaltung
14 verwendet werden. Die Paramcnterwer-Ic .7 werden so gewühlt, daß sie den quadratischen
Mittelwcrt-Vorhersagefehler des Systems minimal halten. Eine ausführliche Erläuterung der Beziehung der
Parametersignale <; zu dem Eingangssignal, ihrer Erzeugung und die Art in der sie zur Steuerung der
Vorhersageschaltung verwendet werden, werden ausführlich in der obengenannten US-Patentschrift erläutert.
Die Parametersignale des Vorhersage-Parameterrechners 15 werden noch vordem Zeitpunkt erzeugt, zu
dem ein Signalblock in der Vorhersageschaltung 14 verarbeitet wird, und zwar wegen der der Vorhersageoperation
inhärenten Verzögerung. In typischer Weise v/erden die Parametersteuersignale innerhalb
eines Intervalls erzeugt, daß der Zeit von annähet nd 60 Abtastungen entspricht.
Die Abtastwerte, die von der adaptiven Vorhersageschaltung 14 erzeugt werden, werden in dem Subtrahiernetz
16 von dem tatsächlichen Wert der entsprechenden Signalabtastungen, die von der Speichereinheit
13 zu dem Subtrahiernetz 16 übertragen werden, subtrahiert. Das sich ergebende Differenzsignal repräsentiert
den Fehler bei der Vorhersage des Signaiwertes. Dieses Signa! wird daher »Vorhersagefehler«
genannt. Offensichtlich wird eine geeignete Verzögerung vorgesehen, beispielsweise für das Auslesen der
Abtastwerte aus der Speichereinheit 13 oder bei uVer
Abgabe an das Subtrahiernetzwerk 16, damit für die Vervollständigung der Vorhersageoperation genügend
Zeit zur Verfügung steht. Natürlich werden alle hier beschriebenen Operationen auf konventionelle Weise
synchron ausgeführt.
Es ist für die genannten Operationen von Bedeutung, daß die Signalabtastwerte weitgehend auf der Basis
ihrer formanten Zugehörigkeit vorhergesagt werden. Vorhergesagte Signale stellen daher im wesentlichen
die Formantstruktur des Eingangssignais dar. Da die vorhergesagten Signalwerte von den tatsächlichen
Signalwerten subtrahiert werden, ist das Vorhersagefehlersignal am Ausgang des Subtrahiernetzwerkes 18
im wesentlichen frei von jeglicher Formanter Info-mation.
Dennoch hat sich das Vorhersagefehlersignal zur Bewahrung und Bezeichnung des Grundfrequenzcharakter
. des übertragenen Signals als notwendig erwiesen.
Die Vorhersagefehlersignale der Subtrahierschaltung 16 werden über das Tiefpassfilter 17 geleitet. Dieses
Filter 17 besitzt eine relativ niedrige Gruniifrequewz. da
die Sprachgrundfrequenz des anliegenden Signals im allgemeinen im unteren Bereich des Bandes liegt. Die
Beseitigung höherer Frequenzanteile hilft bei der Isolation des Grundfrequenzsignals.
Die Positionen der individuellen Grundfrequen/impulse
in dem übertragenen Signal werden dadurch bestimmt, daß die Abtastwerte lokalisiert werden, für
die der Vorhersagefehlerwert groß ist. Die von dem Filter 17 übertragenen Abtastwerte besitzen daher
Amplituden, die der Pifferen/ /wischen dem rbertrage·
nen Signalabtastwert und dem vorhergesigten Signal
proportional sind. Es isl daher notwendig, nur die Grundfrequenz des Vorhersage(Fehler-)Signals zu
suchen. Dieses kam mit jedem beliebigen Grundfrequen/detekto' 18 durch gführt werden. Ein geeigneter
Detektor besteht aus einem Halbwellengleichrichter 19,
der zur Aufrechterhaltung nur der positive" Spitze des
Signals verwendet wird, um spätere Operationen zu vereinfachen. Das gleichgerichtete Signal wird dann zu
dem Spitzciiiibtrcnnci 20 übertragen, der den größten
Abtastwert in jedem Signalrahnien sucht. Derartige Spitzcnabtrenner sind an sich bekannt und werden
häufig in (iniiKlfrequciizdeleklorcii verwende!, insbcsoiidere
in solchen des Cepsiruintvps. Auf diese Weise
ermittelte Spitzensignale werden /ii einem Schwellenweitdetektor
21 übertragen, iler auf einen Pegel
eingestellt ist. bei eiern kleinere Spitzen am Ausgang des Analysalors unterdrückt werden. Der Schwellenwert ist
so eingestellt, dall er an die festgestellten wahren Grundfrequenzspitzen angep.ißt ist. beispielsweise an
F.rl'ahrungswerte. Die sich ergebende l'oljre von Grundfreqiien/impiilsen is', für die Grundfreqiienz oiler
Periode des anliegenden Sprachsignals iiidikativ und sie kann auf jede gewünschte Weise weiter verwendet
werden.
Alternativ hierzu kann, wie von früher schon bekannt.
der Grundfrequenzdetektor einen Autokorrelator enthalten, dem ein Spitzenabtrenner und ein Schwellenwertdetektor
nachfolgen.
F i g. 2 zeigt ein typisches Intervall des Sprachsignals. In der Zeile A ist ein stimmhaftes Spraehsegment
gezeigt. Die Zeile Π illustriert die Impulsfolge, die von
dem Grundfrequenzdetekto;· 18 als Ausgangssignal des
Analysators erzeugt wurde. In der Zeile C ist dagegen
ein typisches stimmloses Sprachsegment dargestellt.
Um sicherzustellen, daß eine klare Unterscheidung
zwischen stimmhaften und stimmlosen Signalsegrncnten
möglich ist. wird gemäß der Erfindung ein Stimmhaft-/ Stimmlos-Unterscheidungssignal erzeugt. Hiernach basiert
die Stimmhaft7Stimmlos-Entscheidung auf dem Verhältnis des quadratischen Mittelwertes der Sprachabtastwerte
zu dem quadratischen Mittelwert der Vorhersagefehlerabtastwerte. Es hat sich gezeigt, daß
dieses Verhältnis für stimmlose Sprachabschnitte beträchtlich kleiner ist als für stimmhafte Sprachabschnitte
und zwar in typischer Weise um einen Faktor von etwa 10.
Daher werden die Sprachabtastwerte von dem Abiastwert zu dem quadratischen Mittelwertnetzwerk
22 und die Vorhersagefehierabtastwcrte von dem Subtrahiernetzwerk 16 zu dem quadratischen Mittelwertnetzwerk
23 übertragen. Die Netzwerke für die Erzeugung eines Signals . das den Mittelwert der Folge
von Abtastwerten proportional ist. sind an sich bekannt und sie werden häufig in Einrichtungen für die
akustische Signalverarbeitung verwendet. Ein typisches Netzwerk enthält eine Einrichtung zur Erzeugung eines
Signals, das dem (Quadrat jedes Nignalablaslwenes
proportional ist. ein Addiernetzwcrk ftir die Aufsuniniierung
einer Folge um quadratischen Signalw eilen
und ein Teilernetzwerk für die Erzeugung eines Signals,
ilas viiien Durchschnittswert "der Mittelwert des
aufsiiminierten quadratischen Signals proportional ist.
/wei Signale, jeweils dem quadratischen Mittelwert
von Sprachabtasiwerten und dem quadratischen Mittelwert
der Vorhersagefehlerabtastwerie proportional,
werden zu dem Teiler 24 übertragen, der an seinem Ausgang ein Signal erzeugt, das dem Quotienten der
beiden .Signalwerte entspricht. Dieses (Juoticnicnsignal
wird dann /u dem Schwellen^ eisdetektor 25 übenragen.
der ein erstes Signal fur (Juoiicnicnwertc groller
als K). als Angabe für ein stimmhaftes Signalinter\all und ein zweites Signal fur (.hioiicntcii kleiner .ils M)
erzeugt, das als Angabe fur ein stimmloses Signalintervall dient. Die Ausgangssignalc des Detektors 25
können in jeder gewünschten Weise verwendet werden,
um den .Stimmcharakter des Eingangssigrals anzugeben
Die Einrichtung zur (irundfrcqucnzbcsiimiiuing gemäß
der Erfindung verbessert zusammen mit der Siininiari-Eiitscheidimgseinriclitung weilgehend die Zuverlässigkeit,
mit der zwei wichtige Sprachcharakteristiken
bestimmt werden können. Diese verbesserte Zuverlässigkeit stammt in erster Linie von dem
tatsächlichen Fehlen der Formantenstruktur in dem Signa) zu dem Zeitpunkt, zu dem die Grundfrequen/-messung
durchgeführt wird. Darüberhinaus ist der beschriebene Grundfrequenzdeiektor insbesondere für
eine Anwendung in einem Sprachübertragung- oder Sprachanalysesystem geeignet, indem eine lineare
Vorhersageeinrichtung verwendet wird. Für diesen Fall
wird das Vorhersagefehlersignal, das zu dem Subtrahiernetzwerk 16 übertragen wird, von der bei der
Kodierung der Sprachsignale verwendeten Vorhersageschaitung erzeugt.
Ferner kann das Stimmentscheidungssignal im Zusammenhang mit anderen Kriterien verwendet
werden, wie beispielsweise der spektralen Balance der niedrigen Frequenzen zu den höheren Frequenzen, '<im
die Siimmhaft-/Stimmlos-Entscheidung noch zuverlässiger zu machen.
Hierzu 1 Blatt Zeichnungen
Claims (2)
1. Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals, bei dem zur Vorhersage
des augenblicklichen Wertes jedes Abtastwertes des Sprachsignals jeweils eine bewertete Summierung
einer Anzahl früherer Sprachsignalabtastwerte verwendet wird und der vorhergesagte Signalabtasiwert
von dem tatsächlichen Signalabtastwert zur Erzeugung eines Differenzsignals subtrahiert wird.
dadurch gekennzeichnet.
daß als Zeitraum, welcher die Anzahl der Abtastwerte zur Gewinnung des vorhergesagten Abtastwertes
umfaßt, I Millisekunde gewählt wird,
daß man die Frequenz feststellt, mit der Differenz- i\ Signalspitzenwerte oberhalb eines vorgegebenen Schwellenwertes auftreten,
daß man die Frequenz feststellt, mit der Differenz- i\ Signalspitzenwerte oberhalb eines vorgegebenen Schwellenwertes auftreten,
und daß die so ermittelte Frequenz als Grundfrequenz des Sprachsignals mit der zugehörigen
Grundwellenperiode klassifiziert wird.
2. Anwendung des Verfahrens nach Anspruch I
zur Bestimmung des S;irnmhaf'.-Siirr.rn!oscharak;crs
eines Sprachsignals, dadurch gekennzeichnet, daß ein erstes, zum Effektivwert des Sprachsignals
proportionales Signal, ein zweites, zum Effektivwert des Differenzsignal proportionales und ein drittes
Signal erzeugt werden, das zu dem Verhältnis des ersten zum zweiten Effektivwertsignal proportional
ist. wobei Werte des dritten Signals größer als ein vorgegebener Schwellenwert zur Angabe eines jo
stimmhaften Sprachsignals und Werte des dritten Signals kleber als der vorgegebene Schwellenwert
zur Angabe eines stimmlosen Sprachsignals dienen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16117371A | 1971-07-09 | 1971-07-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2233872A1 DE2233872A1 (de) | 1973-01-18 |
DE2233872C2 true DE2233872C2 (de) | 1983-11-03 |
Family
ID=22580131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2233872A Expired DE2233872C2 (de) | 1971-07-09 | 1972-07-10 | Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals |
Country Status (6)
Country | Link |
---|---|
US (1) | US3740476A (de) |
JP (2) | JPS5524118B1 (de) |
CA (1) | CA967285A (de) |
DE (1) | DE2233872C2 (de) |
FR (1) | FR2145501B1 (de) |
NL (1) | NL7209311A (de) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3979557A (en) * | 1974-07-03 | 1976-09-07 | International Telephone And Telegraph Corporation | Speech processor system for pitch period extraction using prediction filters |
US4074069A (en) * | 1975-06-18 | 1978-02-14 | Nippon Telegraph & Telephone Public Corporation | Method and apparatus for judging voiced and unvoiced conditions of speech signal |
JPS6051720B2 (ja) * | 1975-08-22 | 1985-11-15 | 日本電信電話株式会社 | 音声の基本周期抽出装置 |
US4038495A (en) * | 1975-11-14 | 1977-07-26 | Rockwell International Corporation | Speech analyzer/synthesizer using recursive filters |
US4070709A (en) * | 1976-10-13 | 1978-01-24 | The United States Of America As Represented By The Secretary Of The Air Force | Piecewise linear predictive coding system |
DE2649259C2 (de) * | 1976-10-29 | 1983-06-09 | Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg | Verfahren zum automatischen Erkennen von gestörter Telefonsprache |
US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
US4164626A (en) * | 1978-05-05 | 1979-08-14 | Motorola, Inc. | Pitch detector and method thereof |
US4280387A (en) * | 1979-02-26 | 1981-07-28 | Norlin Music, Inc. | Frequency following circuit |
JPS5918717B2 (ja) * | 1979-02-28 | 1984-04-28 | ケイディディ株式会社 | 適応形ピツチ抽出方式 |
US4383135A (en) * | 1980-01-23 | 1983-05-10 | Scott Instruments Corporation | Method and apparatus for speech recognition |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS58140798A (ja) * | 1982-02-15 | 1983-08-20 | 株式会社日立製作所 | 音声ピツチ抽出方法 |
JPS5922602U (ja) * | 1982-08-04 | 1984-02-13 | 長山 勉 | 浴室における幼児等の洗髪台 |
US4561102A (en) * | 1982-09-20 | 1985-12-24 | At&T Bell Laboratories | Pitch detector for speech analysis |
JPS6050901U (ja) * | 1983-09-16 | 1985-04-10 | ▲いざさ▼ 秀之 | 乳幼児用エヤ−マツト |
US4675863A (en) * | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
US4879748A (en) * | 1985-08-28 | 1989-11-07 | American Telephone And Telegraph Company | Parallel processing pitch detector |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US5010574A (en) * | 1989-06-13 | 1991-04-23 | At&T Bell Laboratories | Vector quantizer search arrangement |
FR2670313A1 (fr) * | 1990-12-11 | 1992-06-12 | Thomson Csf | Procede et dispositif pour l'evaluation de la periodicite et du voisement du signal de parole dans les vocodeurs a tres bas debit. |
SE467806B (sv) * | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
US5353372A (en) * | 1992-01-27 | 1994-10-04 | The Board Of Trustees Of The Leland Stanford Junior University | Accurate pitch measurement and tracking system and method |
US5546383A (en) | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
US5471527A (en) * | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
US5586126A (en) * | 1993-12-30 | 1996-12-17 | Yoder; John | Sample amplitude error detection and correction apparatus and method for use with a low information content signal |
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
US5717819A (en) * | 1995-04-28 | 1998-02-10 | Motorola, Inc. | Methods and apparatus for encoding/decoding speech signals at low bit rates |
US6140568A (en) * | 1997-11-06 | 2000-10-31 | Innovative Music Systems, Inc. | System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal |
US7124075B2 (en) * | 2001-10-26 | 2006-10-17 | Dmitry Edward Terez | Methods and apparatus for pitch determination |
JP2004297273A (ja) * | 2003-03-26 | 2004-10-21 | Kenwood Corp | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム |
JP3827317B2 (ja) * | 2004-06-03 | 2006-09-27 | 任天堂株式会社 | コマンド処理装置 |
JP2012503212A (ja) * | 2008-09-19 | 2012-02-02 | ニューサウス イノベーションズ ピーティーワイ リミテッド | オーディオ信号分析方法 |
WO2020044362A2 (en) | 2018-09-01 | 2020-03-05 | Indian Institute Of Technology Bombay | Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2732424A (en) * | 1956-01-24 | oliver | ||
DD49355A (de) * | ||||
CA844193A (en) * | 1970-06-09 | Western Electric Company, Incorporated | Predictive coding of speech signals | |
US2221523A (en) * | 1938-03-17 | 1940-11-12 | Ora L Railsback | Pitch determining apparatus |
US2927969A (en) * | 1954-10-20 | 1960-03-08 | Bell Telephone Labor Inc | Determination of pitch frequency of complex wave |
US2908761A (en) * | 1954-10-20 | 1959-10-13 | Bell Telephone Labor Inc | Voice pitch determination |
US3026375A (en) * | 1958-05-09 | 1962-03-20 | Bell Telephone Labor Inc | Transmission of quantized signals |
US3405237A (en) * | 1965-06-01 | 1968-10-08 | Bell Telephone Labor Inc | Apparatus for determining the periodicity and aperiodicity of a complex wave |
US3420955A (en) * | 1965-11-19 | 1969-01-07 | Bell Telephone Labor Inc | Automatic peak selector |
US3437757A (en) * | 1966-06-15 | 1969-04-08 | Bell Telephone Labor Inc | Speech analysis system |
DE1572520A1 (de) * | 1967-06-08 | 1970-02-19 | Telefunken Patent | Verfahren zur Erkennung von Sprachlauten |
GB1180288A (en) * | 1967-06-23 | 1970-02-04 | Standard Telephones Cables Ltd | Analysing Complex Signal Waveforms |
US3631520A (en) * | 1968-08-19 | 1971-12-28 | Bell Telephone Labor Inc | Predictive coding of speech signals |
DE2062589C3 (de) * | 1970-12-18 | 1981-03-12 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales |
-
1971
- 1971-07-09 US US00161173A patent/US3740476A/en not_active Expired - Lifetime
-
1972
- 1972-01-27 CA CA133,301A patent/CA967285A/en not_active Expired
- 1972-07-03 NL NL7209311A patent/NL7209311A/xx not_active Application Discontinuation
- 1972-07-06 FR FR7224483A patent/FR2145501B1/fr not_active Expired
- 1972-07-08 JP JP6793072A patent/JPS5524118B1/ja active Pending
- 1972-07-10 DE DE2233872A patent/DE2233872C2/de not_active Expired
-
1981
- 1981-06-17 JP JP56093676A patent/JPS5774800A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JPS5524118B1 (de) | 1980-06-26 |
US3740476A (en) | 1973-06-19 |
NL7209311A (de) | 1973-01-11 |
DE2233872A1 (de) | 1973-01-18 |
FR2145501A1 (de) | 1973-02-23 |
JPS5774800A (en) | 1982-05-11 |
CA967285A (en) | 1975-05-06 |
FR2145501B1 (de) | 1976-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2233872C2 (de) | Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals | |
DE69614989T2 (de) | Verfahren und Vorrichtung zur Feststellung der Sprachaktivität in einem Sprachsignal und eine Kommunikationsvorrichtung | |
DE69615119T2 (de) | Relaxation CELP (RCELP) Koder | |
DE2945414C2 (de) | Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals | |
DE69529356T2 (de) | Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile | |
DE68912692T2 (de) | Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale. | |
DE69520067T2 (de) | Verfahren und Einrichtung zur Kennzeichnung eines Eingangssignales | |
DE69121312T2 (de) | Geräuschsignalvorhersagevorrichtung | |
DE69837822T2 (de) | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen | |
DE3782025T2 (de) | Verfahren zur verbesserung der qualitaet kodierter sprache. | |
EP1386307B2 (de) | Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals | |
DE2229149A1 (de) | Verfahren zur Übertragung von Sprache | |
DE2626793B2 (de) | Elektrische Schaltungsanordnung zum Bestimmen des stimmhaften oder stimmlosen Zustandes eines Sprachsignals | |
DE69223335T2 (de) | Sprachkodiersystem | |
DE19715126C2 (de) | Sprachsignal-Codiervorrichtung | |
DE2636032C3 (de) | Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal | |
DE69033510T2 (de) | Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung | |
DE19722705A1 (de) | Verfahren zur Abschätzung der Verstärkung zur Sprachkodierung | |
DE69706650T2 (de) | System und verfahren zur fehlerkorrektur in einer auf korrelation basierenden grundfrequenzschätzvorrichtung | |
DE2622423A1 (de) | Vocodersystem | |
DE69324732T2 (de) | Selektive Anwendung von Sprachkodierungstechniken | |
DE60110541T2 (de) | Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz | |
DE10120168A1 (de) | Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen | |
DE2303497C2 (de) | Verfahren zur Übertragung von Sprachsignalen | |
DE2357949A1 (de) | Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E77 | Valid patent as to the heymanns-index 1977 | ||
OD | Request for examination | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |