[go: up one dir, main page]

DE2233872C2 - Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals - Google Patents

Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals

Info

Publication number
DE2233872C2
DE2233872C2 DE2233872A DE2233872A DE2233872C2 DE 2233872 C2 DE2233872 C2 DE 2233872C2 DE 2233872 A DE2233872 A DE 2233872A DE 2233872 A DE2233872 A DE 2233872A DE 2233872 C2 DE2233872 C2 DE 2233872C2
Authority
DE
Germany
Prior art keywords
signal
speech
speech signal
value
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE2233872A
Other languages
English (en)
Other versions
DE2233872A1 (de
Inventor
Bishnu Saroop Murray Hill N.J. Atal
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of DE2233872A1 publication Critical patent/DE2233872A1/de
Application granted granted Critical
Publication of DE2233872C2 publication Critical patent/DE2233872C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals, bei dem zur Vorhersage des augenblicklichen Wertes jedes Abtastwertes des Sprachsignals jeweils eine bewertete Summierung einer Anzahl früherer .Sprachsignalabtastwerte verwendet wird und der vorhergesagte Signalnbtastwert von dem tatsächlichen Signalabtastwert zur Erzeugung eines Differenzsignals subtrahiert wird.
Es sind Einrichtungen zur Verringerung der Kanalkapazität, die für die Übertragung von Sprachsignalen erforderlich ist. bekannt. Die bekannteste Einrichtung dieser Art ist der Vocoder. Ferner ist es auch bekannt, die Redundanz von Sprachsignale durch eine lineare Vorhersage-Technik /u beseitigen. Bei diesen Einrichtungen wird ein .Sprachsignal analysiert, um seine kennzeichnenden Eigenschaften /u bestimmen, woraufhin dann codierte Informationen bezüglich dieser Eigenschaften anstelle des Sprachsignals selbst übertragen werden. Auf der Empfangsseite wird dann aus der codierten Information ein künstliches Sprachsignal erzeugt. Ein Merkmal des .Sprachsignals ist seine Grund- oder Tonhöhenfrequenz. Diese Eigenschaft bezeichnet die Grundfrequen/. mit der die Stimmbänder während der Erzeugung verschiedener stimmhafter Sprachsignale vibrieren.
Das eingangs definierte Verfahren zur Bestimmung der Grundfrequenz eines Sprachsignals ist aus der CAPS 8 44 193 bekannt. Damit das Signal für die b5 Übertragung hinsichtlich des gewünschten Informationsgehaltes die niedrigste mögliche Entropie beinhaltet, werden bei diesem bekannten Verfahren sämtliche redundanten Merkmale aus dem zu ubertiagenden Sprachsignal entfernt. Dabei wird die Redundanz zur Bandbreitenverringerung dadurch beseitigt, daß derjenige Teil des Eingangssignals, welcher aus dem früher übertragenen Signal vorhersagbar ist. entfernt wird. Zur Übertragung gelangt dann lediglich der nicht voraussagbare Teil des Signals. Um die Akkumulierung von Codierfehlern zu vermeiden, wird sendeseitig nicht das Eingangssprachsignal zur Bestimmung des Differenzsignals herangezogen, sondern das Sprachsignal aus den vorher übertragenen, codierten Signalen rekonstruiert. Zur Lösung der Aufgabe ist es auch erforderlich, sowohl die Grundfrequenzmerkmale als auch die Formantmerkmale aus dem Differenzsignal zu entfernen.
Der Erfindung liegt die Aufgabe zugrunde, die Grundfrequenz eines Sprachsignals weitgehend fehlerfrei aus den Vorhersagedaten zu bestimmen, wobei auch eine Unabhängigkeit vom Formantcharakter des Sprachsignals angestrebt wird.
Diese Aufgabe wird gemäß der Erfindung dadurch gelöst, daß als Zeitraum, welcher die Anzahl der Λ kt^ctiuorlo -»■■»- /~Za%*,lnmtn** Aar *>r>wl%tiwtmetnt*»r*
(IL-IUjinbltb <-UI UknillllUllg U^J TÜI llklgVjUglVII
Abtastwertes umfaßt. 1 Millisekunde gewählt wird, daß man die Frequenz feststellt, mit der Differenzsignalspitzenwerte oberhalb eines vorgegebenen Schwellenwertes auftreten, und daß die so ermittelte Frequenz als Grundfrequenz des Sprachsignals mit der zugehörigen Grundwellenperkyde klassifiziert wird.
Weiterbildungen der Erfindung sind den Unteransprüchen zu entnehmen.
Die gemäß der Erfindung erhaltene Grundfrequenz eines Sprachsignals bzw. der Stimmbänder kann dann weiter verwendet werden, beispielsweise zur Bestimmung des Stimmhaft-Stimmloscharakters des Sprachsignals.
Die Vorteile der Erfindung, nämlich die weitgehend fehlerfreie Bestimmung der Sprachgrundfrequenz, basieren auf der Analyse eines komplexen Sprachsignals zur Bestimmung seiner Grundfrequenz. Diese Analyse beruht auf der Analyse rles Ft'ilVrs zwischen einem vorhergesagten Wert des Sprachsignals. basierend auf seinen früheren Abiastwerten, jnd seinem im Augenblick gerade vorliegenden Wert. Das Zeitintervall, das durch eine Anzahl von Abtastwerten repräsentiert und für die Gewinnung des Vorhersagewertes verwendet wird, ist in typischer Weise eine Millisekunde lang. Aufgrund eines bei der Vorhersage verwendeten Kurzzeitspeichers stellen die vorhergesagten Signalwerte weitgehend die Formantstruktur des Sprachsignals dar. Die Grundfrequenzanalyseeinrichiung nach der Erfindung ist besonders effektiv, da bei der Erzeugung eines Differen/signals. d. h. des Vorhersagefehlersignals, die Formantstruktur des Signals aus dem Eingangssignal entfernt worden ist. Da jedoch die Grundfrequenzpenodc der Sprachsignale in typischer Weise in einem Bereich von j ms bis 20 ms liegt, ist die Vorhersage der Grundfrequen/siruktur. basierend juf einem Zeitintervall von einer Millisekunde eines vergangenen Sprachabschnittes völlig vernachlässigbar Daher bleibt die Cjrundfrequenzinformation in dem Vorhcrsagefehlersignal enthalten, so daB nur eine geringe oder gar keine Rückwirkung durch die Formantstruktur auftritt, und die Spitzenabtrennoperation für die Erzeugung eines Meßwertes der Sprachgrundfrequenz des Eingangssignals wirksam ist.
Ein weiterer Vorteil basiert auf der zusätzlichen Verwendung von Vorhersagefehlerabtastungen zur Erzeugung eines Stimmhaft-Stimmlos-Unterschei-
dungssignals. Die Siimmhafientschcidiing wird abgeleitet aus dem Verhältnis des Effektivwertes, also des quadratischen Mittelwertes der Eingangssignalabtastwerte zum Effektivwert der entsprechenden Vorhersagefehlcrabtastwcrte.
Im folgenden wird die Erfindung anhand der Figuren beispielsweise näher erläutert. Es zeigt
F i g. 1 das Blockschaltbild eines Sprachsignalanalysators. das das Prinzip der Erfindung verdeutlicht und
Fig.2 eine Larstellung der Wellenform eines stimmhaften Sprachsignals.der Positionen festgestellter Grundfrequenzimpulse in dem stimmhaften Sprachsignal (vertikale Linien) und eines stimmlosen Sprachsegments.
Ein Signalanalysator, der das Prinzip der Erfindung beinhaltet, ist in F i g. 1 dargestellt. Die Sprachsignale, die von einer beliebigen Quelle geliefert werden, werden zu dem Analysator übertragen und durch ein Tiefpaßfilter 10 geschleust. Das Filter 10 hat eine typische Grundfrequenz in der Gegend von 5 kHz. Das sich ergebende Signal wird dann mit einer Frequenz von etwa 1OkHz im Abtaster Ii abgetastet, wobei dieser Abtastvorgang von den Signalen des Taktgeoers 12 gesteuert wird. Die Sprachabtastwerte. s,„ die au' diese Weise abgeleitet werden, werden zu einer Speichereinheit 13 übertragen, die diese Signale geordnet speichert und zwar in typischen Blöcken von 200 Abtastungen, d. h. Si, S). .., sjoo. Die Blöcke oder Rahmen von Abtastwerten werden periodisch aus der Speichereinheit 13 entnommen, beispielsweise ebenfalls von ;inem Signal des Taktgebers 12 gesteuert und zu einer adaptiven Vorhersageschaltung 14. einem Vorhersage-Parameterrechner und zu einem Subtrahiernetz 16 übertragen.
Die adaptive Vorhersageschaltung 14 bearbeitet die π angelieferten Signale btastwerte. um den augenblicklichen Wert jedes Abtastwertes auf der Basis einer gewichteten Summation einer Anzahl von früheren Abtastwerten vorherzusagen. Die Vorhersageoperation erfolgt auf der Basis Abtastwert zu Abtastwert, und die ίο Vorhersageschaltung 14 wird periodisch mit einem neuen Rahmen von Abtastungen von der Speichereinheit 13 beschickt. Eine für die Verwendung in dem System gemäß der vorliegenden Erfindung geeignete adaptive Vorhersageschaltung ist beispielsweise in der -n US-PS 36 31 520ausführlich beschrieben.
Zur Anpassung des sich konstant ändernden Charakters des Eingangssprachsignals, wird die adaptive Vorhersageschaltung 14 so gesteuert, daß sie sich an den laufenden Signalzustand anpaßt. Es hat sich als ίο genügend erwiesen, die Werte der verwendeten Parameter nachzustellen, um die Vorhersageschaltung in Intervallen zu steuern, die mit der Grundwellenperiode des Signals vergleichbar sind. Da das exakte CirundwellenintervaU nicht zur Verfügung steht (obwohl das Grundfrequen/ausgungssignal des Systems in einer Rückkoppelanordnung /ur Annäherung des Iniervalls einer späteren Grundwellcnperiode verwendet werden kann), ist eine Nachstellung der Parameterwerte in Intervallen von etwa der Zeit von 200 Abtastungen vollständig ausreichend. Dieses entspricht einem Zeitintervall von etwa 20 msek.
Der Vorhersage-Parameterrechner 15 bearbeitet so Sprachablastwerte der Speichereinheit 13. um eine Folge von Parametersignalen ;) = ;/i. ./>. ... a„ zu erzeugen, die periodisch zur Nachstellung der Vorhcrsageschaltung 14 verwendet werden. Die Paramcnterwer-Ic .7 werden so gewühlt, daß sie den quadratischen Mittelwcrt-Vorhersagefehler des Systems minimal halten. Eine ausführliche Erläuterung der Beziehung der Parametersignale <; zu dem Eingangssignal, ihrer Erzeugung und die Art in der sie zur Steuerung der Vorhersageschaltung verwendet werden, werden ausführlich in der obengenannten US-Patentschrift erläutert. Die Parametersignale des Vorhersage-Parameterrechners 15 werden noch vordem Zeitpunkt erzeugt, zu dem ein Signalblock in der Vorhersageschaltung 14 verarbeitet wird, und zwar wegen der der Vorhersageoperation inhärenten Verzögerung. In typischer Weise v/erden die Parametersteuersignale innerhalb eines Intervalls erzeugt, daß der Zeit von annähet nd 60 Abtastungen entspricht.
Die Abtastwerte, die von der adaptiven Vorhersageschaltung 14 erzeugt werden, werden in dem Subtrahiernetz 16 von dem tatsächlichen Wert der entsprechenden Signalabtastungen, die von der Speichereinheit 13 zu dem Subtrahiernetz 16 übertragen werden, subtrahiert. Das sich ergebende Differenzsignal repräsentiert den Fehler bei der Vorhersage des Signaiwertes. Dieses Signa! wird daher »Vorhersagefehler« genannt. Offensichtlich wird eine geeignete Verzögerung vorgesehen, beispielsweise für das Auslesen der Abtastwerte aus der Speichereinheit 13 oder bei uVer Abgabe an das Subtrahiernetzwerk 16, damit für die Vervollständigung der Vorhersageoperation genügend Zeit zur Verfügung steht. Natürlich werden alle hier beschriebenen Operationen auf konventionelle Weise synchron ausgeführt.
Es ist für die genannten Operationen von Bedeutung, daß die Signalabtastwerte weitgehend auf der Basis ihrer formanten Zugehörigkeit vorhergesagt werden. Vorhergesagte Signale stellen daher im wesentlichen die Formantstruktur des Eingangssignais dar. Da die vorhergesagten Signalwerte von den tatsächlichen Signalwerten subtrahiert werden, ist das Vorhersagefehlersignal am Ausgang des Subtrahiernetzwerkes 18 im wesentlichen frei von jeglicher Formanter Info-mation. Dennoch hat sich das Vorhersagefehlersignal zur Bewahrung und Bezeichnung des Grundfrequenzcharakter . des übertragenen Signals als notwendig erwiesen.
Die Vorhersagefehlersignale der Subtrahierschaltung 16 werden über das Tiefpassfilter 17 geleitet. Dieses Filter 17 besitzt eine relativ niedrige Gruniifrequewz. da die Sprachgrundfrequenz des anliegenden Signals im allgemeinen im unteren Bereich des Bandes liegt. Die Beseitigung höherer Frequenzanteile hilft bei der Isolation des Grundfrequenzsignals.
Die Positionen der individuellen Grundfrequen/impulse in dem übertragenen Signal werden dadurch bestimmt, daß die Abtastwerte lokalisiert werden, für die der Vorhersagefehlerwert groß ist. Die von dem Filter 17 übertragenen Abtastwerte besitzen daher Amplituden, die der Pifferen/ /wischen dem rbertrage· nen Signalabtastwert und dem vorhergesigten Signal proportional sind. Es isl daher notwendig, nur die Grundfrequenz des Vorhersage(Fehler-)Signals zu suchen. Dieses kam mit jedem beliebigen Grundfrequen/detekto' 18 durch gführt werden. Ein geeigneter Detektor besteht aus einem Halbwellengleichrichter 19, der zur Aufrechterhaltung nur der positive" Spitze des Signals verwendet wird, um spätere Operationen zu vereinfachen. Das gleichgerichtete Signal wird dann zu dem Spitzciiiibtrcnnci 20 übertragen, der den größten Abtastwert in jedem Signalrahnien sucht. Derartige Spitzcnabtrenner sind an sich bekannt und werden
häufig in (iniiKlfrequciizdeleklorcii verwende!, insbcsoiidere in solchen des Cepsiruintvps. Auf diese Weise ermittelte Spitzensignale werden /ii einem Schwellenweitdetektor 21 übertragen, iler auf einen Pegel eingestellt ist. bei eiern kleinere Spitzen am Ausgang des Analysalors unterdrückt werden. Der Schwellenwert ist so eingestellt, dall er an die festgestellten wahren Grundfrequenzspitzen angep.ißt ist. beispielsweise an F.rl'ahrungswerte. Die sich ergebende l'oljre von Grundfreqiien/impiilsen is', für die Grundfreqiienz oiler Periode des anliegenden Sprachsignals iiidikativ und sie kann auf jede gewünschte Weise weiter verwendet werden.
Alternativ hierzu kann, wie von früher schon bekannt. der Grundfrequenzdetektor einen Autokorrelator enthalten, dem ein Spitzenabtrenner und ein Schwellenwertdetektor nachfolgen.
F i g. 2 zeigt ein typisches Intervall des Sprachsignals. In der Zeile A ist ein stimmhaftes Spraehsegment gezeigt. Die Zeile Π illustriert die Impulsfolge, die von dem Grundfrequenzdetekto;· 18 als Ausgangssignal des Analysators erzeugt wurde. In der Zeile C ist dagegen ein typisches stimmloses Sprachsegment dargestellt.
Um sicherzustellen, daß eine klare Unterscheidung zwischen stimmhaften und stimmlosen Signalsegrncnten möglich ist. wird gemäß der Erfindung ein Stimmhaft-/ Stimmlos-Unterscheidungssignal erzeugt. Hiernach basiert die Stimmhaft7Stimmlos-Entscheidung auf dem Verhältnis des quadratischen Mittelwertes der Sprachabtastwerte zu dem quadratischen Mittelwert der Vorhersagefehlerabtastwerte. Es hat sich gezeigt, daß dieses Verhältnis für stimmlose Sprachabschnitte beträchtlich kleiner ist als für stimmhafte Sprachabschnitte und zwar in typischer Weise um einen Faktor von etwa 10.
Daher werden die Sprachabtastwerte von dem Abiastwert zu dem quadratischen Mittelwertnetzwerk 22 und die Vorhersagefehierabtastwcrte von dem Subtrahiernetzwerk 16 zu dem quadratischen Mittelwertnetzwerk 23 übertragen. Die Netzwerke für die Erzeugung eines Signals . das den Mittelwert der Folge von Abtastwerten proportional ist. sind an sich bekannt und sie werden häufig in Einrichtungen für die akustische Signalverarbeitung verwendet. Ein typisches Netzwerk enthält eine Einrichtung zur Erzeugung eines
Signals, das dem (Quadrat jedes Nignalablaslwenes proportional ist. ein Addiernetzwcrk ftir die Aufsuniniierung einer Folge um quadratischen Signalw eilen und ein Teilernetzwerk für die Erzeugung eines Signals, ilas viiien Durchschnittswert "der Mittelwert des aufsiiminierten quadratischen Signals proportional ist.
/wei Signale, jeweils dem quadratischen Mittelwert von Sprachabtasiwerten und dem quadratischen Mittelwert der Vorhersagefehlerabtastwerie proportional, werden zu dem Teiler 24 übertragen, der an seinem Ausgang ein Signal erzeugt, das dem Quotienten der beiden .Signalwerte entspricht. Dieses (Juoticnicnsignal wird dann /u dem Schwellen^ eisdetektor 25 übenragen. der ein erstes Signal fur (Juoiicnicnwertc groller als K). als Angabe für ein stimmhaftes Signalinter\all und ein zweites Signal fur (.hioiicntcii kleiner .ils M) erzeugt, das als Angabe fur ein stimmloses Signalintervall dient. Die Ausgangssignalc des Detektors 25 können in jeder gewünschten Weise verwendet werden, um den .Stimmcharakter des Eingangssigrals anzugeben
Die Einrichtung zur (irundfrcqucnzbcsiimiiuing gemäß der Erfindung verbessert zusammen mit der Siininiari-Eiitscheidimgseinriclitung weilgehend die Zuverlässigkeit, mit der zwei wichtige Sprachcharakteristiken bestimmt werden können. Diese verbesserte Zuverlässigkeit stammt in erster Linie von dem tatsächlichen Fehlen der Formantenstruktur in dem Signa) zu dem Zeitpunkt, zu dem die Grundfrequen/-messung durchgeführt wird. Darüberhinaus ist der beschriebene Grundfrequenzdeiektor insbesondere für eine Anwendung in einem Sprachübertragung- oder Sprachanalysesystem geeignet, indem eine lineare Vorhersageeinrichtung verwendet wird. Für diesen Fall wird das Vorhersagefehlersignal, das zu dem Subtrahiernetzwerk 16 übertragen wird, von der bei der Kodierung der Sprachsignale verwendeten Vorhersageschaitung erzeugt.
Ferner kann das Stimmentscheidungssignal im Zusammenhang mit anderen Kriterien verwendet werden, wie beispielsweise der spektralen Balance der niedrigen Frequenzen zu den höheren Frequenzen, '<im die Siimmhaft-/Stimmlos-Entscheidung noch zuverlässiger zu machen.
Hierzu 1 Blatt Zeichnungen

Claims (2)

Patentansprüche:
1. Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals, bei dem zur Vorhersage des augenblicklichen Wertes jedes Abtastwertes des Sprachsignals jeweils eine bewertete Summierung einer Anzahl früherer Sprachsignalabtastwerte verwendet wird und der vorhergesagte Signalabtasiwert von dem tatsächlichen Signalabtastwert zur Erzeugung eines Differenzsignals subtrahiert wird. dadurch gekennzeichnet.
daß als Zeitraum, welcher die Anzahl der Abtastwerte zur Gewinnung des vorhergesagten Abtastwertes umfaßt, I Millisekunde gewählt wird,
daß man die Frequenz feststellt, mit der Differenz- i\ Signalspitzenwerte oberhalb eines vorgegebenen Schwellenwertes auftreten,
und daß die so ermittelte Frequenz als Grundfrequenz des Sprachsignals mit der zugehörigen Grundwellenperiode klassifiziert wird.
2. Anwendung des Verfahrens nach Anspruch I zur Bestimmung des S;irnmhaf'.-Siirr.rn!oscharak;crs eines Sprachsignals, dadurch gekennzeichnet, daß ein erstes, zum Effektivwert des Sprachsignals proportionales Signal, ein zweites, zum Effektivwert des Differenzsignal proportionales und ein drittes Signal erzeugt werden, das zu dem Verhältnis des ersten zum zweiten Effektivwertsignal proportional ist. wobei Werte des dritten Signals größer als ein vorgegebener Schwellenwert zur Angabe eines jo stimmhaften Sprachsignals und Werte des dritten Signals kleber als der vorgegebene Schwellenwert zur Angabe eines stimmlosen Sprachsignals dienen.
DE2233872A 1971-07-09 1972-07-10 Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals Expired DE2233872C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US16117371A 1971-07-09 1971-07-09

Publications (2)

Publication Number Publication Date
DE2233872A1 DE2233872A1 (de) 1973-01-18
DE2233872C2 true DE2233872C2 (de) 1983-11-03

Family

ID=22580131

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2233872A Expired DE2233872C2 (de) 1971-07-09 1972-07-10 Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals

Country Status (6)

Country Link
US (1) US3740476A (de)
JP (2) JPS5524118B1 (de)
CA (1) CA967285A (de)
DE (1) DE2233872C2 (de)
FR (1) FR2145501B1 (de)
NL (1) NL7209311A (de)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3979557A (en) * 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
US4074069A (en) * 1975-06-18 1978-02-14 Nippon Telegraph & Telephone Public Corporation Method and apparatus for judging voiced and unvoiced conditions of speech signal
JPS6051720B2 (ja) * 1975-08-22 1985-11-15 日本電信電話株式会社 音声の基本周期抽出装置
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
US4070709A (en) * 1976-10-13 1978-01-24 The United States Of America As Represented By The Secretary Of The Air Force Piecewise linear predictive coding system
DE2649259C2 (de) * 1976-10-29 1983-06-09 Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zum automatischen Erkennen von gestörter Telefonsprache
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4164626A (en) * 1978-05-05 1979-08-14 Motorola, Inc. Pitch detector and method thereof
US4280387A (en) * 1979-02-26 1981-07-28 Norlin Music, Inc. Frequency following circuit
JPS5918717B2 (ja) * 1979-02-28 1984-04-28 ケイディディ株式会社 適応形ピツチ抽出方式
US4383135A (en) * 1980-01-23 1983-05-10 Scott Instruments Corporation Method and apparatus for speech recognition
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法
JPS5922602U (ja) * 1982-08-04 1984-02-13 長山 勉 浴室における幼児等の洗髪台
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
JPS6050901U (ja) * 1983-09-16 1985-04-10 ▲いざさ▼ 秀之 乳幼児用エヤ−マツト
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
US4879748A (en) * 1985-08-28 1989-11-07 American Telephone And Telegraph Company Parallel processing pitch detector
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
USRE34247E (en) * 1985-12-26 1993-05-11 At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US5010574A (en) * 1989-06-13 1991-04-23 At&T Bell Laboratories Vector quantizer search arrangement
FR2670313A1 (fr) * 1990-12-11 1992-06-12 Thomson Csf Procede et dispositif pour l'evaluation de la periodicite et du voisement du signal de parole dans les vocodeurs a tres bas debit.
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5353372A (en) * 1992-01-27 1994-10-04 The Board Of Trustees Of The Leland Stanford Junior University Accurate pitch measurement and tracking system and method
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5586126A (en) * 1993-12-30 1996-12-17 Yoder; John Sample amplitude error detection and correction apparatus and method for use with a low information content signal
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5717819A (en) * 1995-04-28 1998-02-10 Motorola, Inc. Methods and apparatus for encoding/decoding speech signals at low bit rates
US6140568A (en) * 1997-11-06 2000-10-31 Innovative Music Systems, Inc. System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
JP2004297273A (ja) * 2003-03-26 2004-10-21 Kenwood Corp 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
JP2012503212A (ja) * 2008-09-19 2012-02-02 ニューサウス イノベーションズ ピーティーワイ リミテッド オーディオ信号分析方法
WO2020044362A2 (en) 2018-09-01 2020-03-05 Indian Institute Of Technology Bombay Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2732424A (en) * 1956-01-24 oliver
DD49355A (de) *
CA844193A (en) * 1970-06-09 Western Electric Company, Incorporated Predictive coding of speech signals
US2221523A (en) * 1938-03-17 1940-11-12 Ora L Railsback Pitch determining apparatus
US2927969A (en) * 1954-10-20 1960-03-08 Bell Telephone Labor Inc Determination of pitch frequency of complex wave
US2908761A (en) * 1954-10-20 1959-10-13 Bell Telephone Labor Inc Voice pitch determination
US3026375A (en) * 1958-05-09 1962-03-20 Bell Telephone Labor Inc Transmission of quantized signals
US3405237A (en) * 1965-06-01 1968-10-08 Bell Telephone Labor Inc Apparatus for determining the periodicity and aperiodicity of a complex wave
US3420955A (en) * 1965-11-19 1969-01-07 Bell Telephone Labor Inc Automatic peak selector
US3437757A (en) * 1966-06-15 1969-04-08 Bell Telephone Labor Inc Speech analysis system
DE1572520A1 (de) * 1967-06-08 1970-02-19 Telefunken Patent Verfahren zur Erkennung von Sprachlauten
GB1180288A (en) * 1967-06-23 1970-02-04 Standard Telephones Cables Ltd Analysing Complex Signal Waveforms
US3631520A (en) * 1968-08-19 1971-12-28 Bell Telephone Labor Inc Predictive coding of speech signals
DE2062589C3 (de) * 1970-12-18 1981-03-12 Siemens AG, 1000 Berlin und 8000 München Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales

Also Published As

Publication number Publication date
JPS5524118B1 (de) 1980-06-26
US3740476A (en) 1973-06-19
NL7209311A (de) 1973-01-11
DE2233872A1 (de) 1973-01-18
FR2145501A1 (de) 1973-02-23
JPS5774800A (en) 1982-05-11
CA967285A (en) 1975-05-06
FR2145501B1 (de) 1976-08-13

Similar Documents

Publication Publication Date Title
DE2233872C2 (de) Verfahren zur Bestimmung der Grundwellenperiode eines Sprachsignals
DE69614989T2 (de) Verfahren und Vorrichtung zur Feststellung der Sprachaktivität in einem Sprachsignal und eine Kommunikationsvorrichtung
DE69615119T2 (de) Relaxation CELP (RCELP) Koder
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE69529356T2 (de) Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile
DE68912692T2 (de) Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
DE69520067T2 (de) Verfahren und Einrichtung zur Kennzeichnung eines Eingangssignales
DE69121312T2 (de) Geräuschsignalvorhersagevorrichtung
DE69837822T2 (de) Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
DE3782025T2 (de) Verfahren zur verbesserung der qualitaet kodierter sprache.
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE2626793B2 (de) Elektrische Schaltungsanordnung zum Bestimmen des stimmhaften oder stimmlosen Zustandes eines Sprachsignals
DE69223335T2 (de) Sprachkodiersystem
DE19715126C2 (de) Sprachsignal-Codiervorrichtung
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE69033510T2 (de) Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE19722705A1 (de) Verfahren zur Abschätzung der Verstärkung zur Sprachkodierung
DE69706650T2 (de) System und verfahren zur fehlerkorrektur in einer auf korrelation basierenden grundfrequenzschätzvorrichtung
DE2622423A1 (de) Vocodersystem
DE69324732T2 (de) Selektive Anwendung von Sprachkodierungstechniken
DE60110541T2 (de) Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz
DE10120168A1 (de) Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen
DE2303497C2 (de) Verfahren zur Übertragung von Sprachsignalen
DE2357949A1 (de) Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls

Legal Events

Date Code Title Description
E77 Valid patent as to the heymanns-index 1977
OD Request for examination
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee