EP0195441A1 - Method for low bite rate speech coding using a multipulse excitation signal - Google Patents
Method for low bite rate speech coding using a multipulse excitation signal Download PDFInfo
- Publication number
- EP0195441A1 EP0195441A1 EP86103770A EP86103770A EP0195441A1 EP 0195441 A1 EP0195441 A1 EP 0195441A1 EP 86103770 A EP86103770 A EP 86103770A EP 86103770 A EP86103770 A EP 86103770A EP 0195441 A1 EP0195441 A1 EP 0195441A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- filter
- pulse
- signal
- pulses
- speech signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 title claims description 28
- 230000001755 vocal effect Effects 0.000 claims abstract description 17
- 230000004044 response Effects 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005311 autocorrelation function Methods 0.000 claims description 3
- 230000003111 delayed effect Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 18
- 238000012545 processing Methods 0.000 abstract description 8
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Definitions
- the invention relates to low bit rate digital codings which are used for speech in vocoders and which do not restore the original form of the speech signal but parameters allowing the excitation signal and the signals to be defined over successive time windows. characteristics of a filter generating a synthetic speech signal resembling listening to the original speech signal. It relates more particularly to a form of elaboration of the excitation signal of the filter known under the name multi-pulse.
- the filter models the vocal tract considered to be invariant over short periods of time on the order of 20 ms. It restores the spectrum of short-term frequencies of the speech signal, especially its maxima or formants which are more perceived by the ear than its minima. It can be performed in different analog or digital ways: channel synthesis, formant synthesis or linear prediction synthesis.
- This mode of elaboration poses the problem of an effective distinction between voiced and unvoiced sounds. It results in an excitation signal having only a distant relationship with the vocal excitation signal and producing via the vocal tract modeling filter a synthetic speech signal which is not very faithful and which is sometimes difficult to understand.
- This minimization is done according to the criterion of minimization of the quadratic error on the window considered with a so-called perceptual weighting of the error taking into account the property of the human ear to be less sensitive to distortions in the regions forming speech frequency spectrum where energy is relatively concentrated.
- the successive approximation is stopped after a certain number of iterations determined according to the available computing capacities and the coding bit rate.
- the object of the present invention is to combat the degradation of the signal-to-noise ratio of a synthesized speech signal due to the method by successive approximations used for determining the pulses of the excitation signal of the filter producing the speech signal. synthesized, without significantly increasing the number of calculations to be undertaken.
- It relates to a low bit rate coding method of speech consisting in replacing the speech signal to be coded with parameters defining over successive time windows the characteristics of a filter modeling the vocal tract and of the positions and amplitudes of pulses which form the excitation signal of the filter and which are determined by successive approximations according to the criterion of minimization of the quadratic error existing between the speech signal to be coded and the synthesized speech signal restored by the filter.
- This method consists, after determining by successive approximations of the positions and amplitudes of the excitation signal, in adding to the amplitude of each pulse a corrective term depending on the value of the partial derivative of the quadratic error with respect to the amplitude of the impulse considered taken for independent variable.
- FIG. 1 there is a transmitter equipment 1 connected by a digital link 2 at low speed to a receiver equipment 3.
- the receiving equipment 3 comprises a demultiplexer 31 and two decoders 32, 33 placed at the input, which are adapted to the multiplexers 16 and to the coders 14, 15 of the transmitting equipment 1 and which extract from the signal received from the digital transmission link 2 the sets of prediction coefficients a (k) and the multi - pulse excitation signal v (k), and a filter 34 for modeling the vocal tract whose characteristics are adjusted from the sets of prediction coefficients a (k) and which generates from the multi-pulse signal d excitation v (k) of the samples S (k) of a synthesized speech signal reproducing the original speech signal.
- the analysis circuit 11 of the transmitting equipment 1 is a digital processing circuit which is not detailed because it is well known to those skilled in the art and is not within the scope of the invention.
- a (k) For the way in which it proceeds to extract the sets of prediction coefficients a (k) from the samples of the speech signal to be coded, reference may be made to the book by Markel J., Gray A. entitled "Linear prediction of speech” edited by Springer. Verlag, New York, 1976.
- the predicted signal S (n) is defined from the elapsed values of the speech signal to be coded S (n) by means of the prediction coefficients a (k) by the relation:
- Prediction is considered optimal when the quadratic error between the predicted values and the actual values defined by: is minimal.
- the voice path modeling filter 34 of the reception equipment has the transfer function H (z) which is expressed from the prediction coefficients a (k) by: Its synthesis is outside the scope of the present invention. It can be done from the prediction coefficients a (k) by application of the previous relation but is carried out preferentially by the method d t Itakura-Saito in the form of a lattice defined from so-called transmitted reflection coefficients in place of prediction coefficients a (k) to which they correspond by well-known equivalence relations.
- the circuit 12 for generating the excitation multi-pulse signal generates, for each time window of analysis of the signal, to code a sequence of pulses in minimum number with positions and amplitudes chosen so as to obtain from the filter modeling the conduit. vocal a synthesized speech signal reproducing as faithfully as possible for a listener the original speech signal.
- the criterion adopted to estimate the fidelity of reproduction of a speech signal by a synthetic signal is that of minimization of the quadratic error, over a time window of analysis, between the original speech signal and the speech signal synthesized with error weighting taking into account the perceptual properties of a listener that make it less sensitive to distortions occurring in the forming regions of the frequency spectrum of the speech signal where energy is relatively concentrated.
- One known way of achieving this weighting in particular by US Pat. No. 4,133,976, consists in subjecting the error signal formed by the difference between the original speech signal and the synthesized speech signal to filtering, the function of which is transfer W (z) is expressed as a function of that H (z) of the vocal tract modeling filter by the relation:
- This filtering can be obtained by passing the error signal or its components through a predictive filter whose transfer function is H -1 (z) then through a so-called perceptual filter with transfer function H (rz) which can be determined as a function of the prediction coefficients by the definition relation:
- predictive filtering is done on the components of the error signal, explicitly on the speech signal to be coded and implicitly on the synthesized speech signal, while perceptual filtering is done on the error signal itself, the components of which have been combined after predictive filtering.
- the processing circuit 12 comprises a delay circuit 120 which receives the packets of N successive samples S (k) of the speech signal to be coded corresponding to the successive time windows on which the analysis circuit 11 and which store them the time necessary for the latter to establish each set of prediction coefficients a (k), and a predictive filter 121 which receives its set of coefficients a (k) from the analysis circuit 11 and the successive sample packets S (k) of the delay circuit 120 and which delivers a prediction residue signal r (k).
- the predictive filtering of the synthesized speech signal is obtained implicitly by replacing this signal by the multi-pulse excitation signal v (k) from which it follows by a filtering in H (z) carried out by the modeling filter of the vocal tract.
- a subtractor 122 forms the error signal by subtracting the multi-pulse signal v (k) from the prediction residue signal r (k) and applies it to a perceptual filter 123 receiving its coefficients from a processing circuit 124 the developing from the set of prediction coefficients a (k) by implementing the last relation mentioned.
- the pulse sequences forming the excitation multi-pulse signal for each of the time windows on which the analysis circuit 11 operates are generated in the processing circuit 12 by a pulse synthesizer circuit 125 which receives the signal d weighted error from the perceptual filter 123.
- This pulse synthesizer circuit 125 generates for each sequence of the excitation multi-pulse signal a number of pulses compatible with the transmission capacity of the digital link 2 which connects the equipment d transmission 1 to the reception equipment 3 while giving them positions in the time window considered and amplitudes minimizing the energy of the weighted error.
- a (i) be the amplitudes of these pulses assumed at most in number Q and m (i) their respective positions in the time window chosen from the discrete positions 1, .., N of samples staggered along the window.
- the pulse sequence V (k) is expressed by: where d (k, m (i)) is a function taking the value one for k equal m (i) and zero everywhere else.
- h '(k) the samples of the impulse response of the perceptual filter 123 having the transfer function H ( ⁇ z)
- the weighted error e (k) is expressed by: where B (j) and b (j) define the pulses relating to the preceding windows.
- the weighted error e (k) in step (1 + 1) is expressed according to the rela tion (1) by: or : which makes it possible to define the energy E (1 + 1) of the weighted error in step (1 + 1) relative to the energy of the weighted error E (1) in step (1) by : (1) or by noting by t (k) the function and by C (i, j) the samples of the autocorrelation function of the impulse response of the perceptual filter 123
- the amplitude A (i) of each of them is corrected to using the corrective term A '(i) deduced from relation (4): corrective term which can still be expressed taking into account relations (2) and (6) in the form: and which is defined as a ratio of two terms with the numerator the partial derivative, compared to the amplitude A (i), of the weighted quadratic error between the speech signal to be coded and the synthesized speech signal and the denominator the zero value of the autocorrelation function of the impulse response of the perceptual filter delayed by a delay corresponding to the position of the pulse considered relative to the start of the window.
- T (j) can be expressed by:
- This system of equations (10) can be rewritten or again, in terms of correction A "(i)
- a comparison of this system of equations with relations (2) and (9) shows that the definition of the corrective term A '(i) is deduced from that of the corrective term A n (i) given by the optimal solution by admitting that the values C (i, j) of the correlation between two impulse responses from the perceptual filter are zero when they are not simultaneous.
- the corrective term A (i) has the advantage of having a definition relation of the same nature as that (4) of the amplitude A (1 + 1) of the pulse placed during each step of the method by approximations and therefore to be able to be elaborated with a very limited number of additional operations, without common measure with the number of operations necessary for the resolution of the system of equations ( 12 ).
- the stage of elaboration of the set of Q corrective terms A '(i) takes place after the Q th stage of the approximation method during which (QT) th pulse has been determined by means of the study of the function t (k). It resembles, as we will see below, an additional step of the approximation method in which the calculation of the function t (k) is not performed but replaced by the systematic calculation of the pulse amplitude for all the pulse positions already determined.
- FIG. 2 illustrates an embodiment of the analysis circuits 11 and of preparation 12 of the transmitting equipment.
- This consists of a microprocessor 40 connected by address buses 41, of. data 42 and control 43 to a random access memory 44 making it possible to temporarily store the samples of the speech signal to be coded S (k) as well as calculation variables, to a read-only memory 45 containing programs for packetizing the samples S (k) of the speech signal to be coded, of calculation of the set of prediction coefficients a (k) corresponding to each packet and of samples h '(k) of the impulse response of the perceptual filter as well as of determination of the positions and amplitudes pulses of the sequence of the excitation multi-pulse signal, and to an input-output interface 46 allowing the introduction of the digital samples S (k) of speech to be coded and the delivery to the coders of the sets of coefficients of prediction a (k) and positions and amplitudes of pulses of the excitation multi-pulse signal sequences.
- the microprocessor 40 performs several simultaneous operations under the control of the programs recorded in the read-only memory 45.
- a packet of samples calculates the set of prediction coefficients a (k) which corresponds to it by solving according to one of the known methods described in the above-mentioned work the system of equations (o) and stores them in RAM 44.
- the microprocessor then stores in memory the values of this function t (k) then calculates the function z (1) by the formula: determines the value of k for which this function is maximum and takes it as the value of the index m (1 + 1) locating the position of the (1+ 1 ) th pulse of which it determines the amplitude A (1 + 1) by calculating the relation: (o)
- the function t (k) is calculated from its definition by means of the samples r (k) of the prediction residue signal taking into account the fact that the sequence of the multi-pulse signal on the window current is then a null signal:
- stage of drawing up corrective terms which does not require operations which are very different from those carried out during a stage of the method by successive approximations is easily integrated into the framework of the latter without appreciably increasing the duration of implementation which is fundamental in the context of vocoders where the development of each sequence of the excitation multi-pulse signal must be done over the limited duration of a time window of analysis.
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
L'invention concerne un système de codage numérique de la parole avec un équipement émetteur (1) substituant au signal de parole à coder d'une part des paramètres élaborés par un circuit d'analyse (11) définissant sur des fenêtres temporelles successives les caractéristiques d'un filtre (34) qui est placé dans un équipement de réception (3) relié par une ligne de transmission à faible débit (2) et qui modélise le conduit vocal et d'autre part un signal multi-impulsionnel d'excitation qui est destiné au filtre (34) et qui est délivré par un circuit d'élaboration (12) déterminant les positions et amplitudes des impulsions par approximations successives selon le critère de minimisation de l'erreur quadratique existant entre le signal de parole à coder et le signal de parole synthétisé par ledit filtre. Elle consiste à faire ajouter par le circuit d'élaboration (12). en fin d'approximation, un terme correctif à l'amplitude de chacune des impulsions qui est fonction de la valeur de la dérivée partielle de l'erreur quadratique effectuée relativement à l'amplitude de l'impulsion considérée prise pour variable indépendante.The invention relates to a digital speech coding system with transmitting equipment (1) substituting for the speech signal to be coded, on the one hand, parameters developed by an analysis circuit (11) defining the characteristics of successive time windows. a filter (34) which is placed in a reception equipment (3) connected by a low speed transmission line (2) and which models the vocal tract and on the other hand a multi-pulse excitation signal which is intended for the filter (34) and which is delivered by a processing circuit (12) determining the positions and amplitudes of the pulses by successive approximations according to the criterion of minimization of the quadratic error existing between the speech signal to be coded and the speech signal synthesized by said filter. It consists in having added by the production circuit (12). at the end of the approximation, a corrective term for the amplitude of each of the pulses which is a function of the value of the partial derivative of the quadratic error carried out relative to the amplitude of the pulse considered taken for independent variable.
Description
L'invention est relative aux codages numériques à faible débit qui sont utilisés pour la parole dans les vocodeurs et qui ne restituent pas la forme originelle du signal de parole mais des paramètres permettant de définir sur des fenêtres temporelles successives le signal d'excitation et lés caractéristiques d'un filtre engendrant un signal de parole synthétique ressemblant à l'écoute au signal de parole d'origine. Elle concerne plus particulièrement une forme d'élaboration du signal d'excitation du filtre connue sous le nom multi-impulsionnelle.The invention relates to low bit rate digital codings which are used for speech in vocoders and which do not restore the original form of the speech signal but parameters allowing the excitation signal and the signals to be defined over successive time windows. characteristics of a filter generating a synthetic speech signal resembling listening to the original speech signal. It relates more particularly to a form of elaboration of the excitation signal of the filter known under the name multi-pulse.
Le filtre modélise le conduit vocal considéré comme invariant sur de courtes périodes de temps de l'ordre de 20 ms. Il restitue le spectre des fréquences à court terme du signal de parole, surtout ses maxima ou formants qui sont davantage perçus par l'oreille que ses minima. Il peut être réalisé de différentes manières analogiques ou numériques : synthèse à canaux, synthèse à formants ou synthèse à prédiction linéaire.The filter models the vocal tract considered to be invariant over short periods of time on the order of 20 ms. It restores the spectrum of short-term frequencies of the speech signal, especially its maxima or formants which are more perceived by the ear than its minima. It can be performed in different analog or digital ways: channel synthesis, formant synthesis or linear prediction synthesis.
Le signal d'excitation nécessaire au filtre de modélisation du conduit vocal pour synthétiser un signal de parole doit modéliser le signal d'excitation vocale. La manière la plus ancienne de l'élaborer consiste à utiliser deux sources commutées :
- - une source d'impulsions périodiques à la fréquence du fondamental du signal de parole d'origine (pitch) utilisée pour les sons voisés (voyelles),
- - une source de bruit utilisée pour les sons non voisés (fricatives).
- - a source of periodic pulses at the frequency of the fundamental of the original speech signal (pitch) used for voiced sounds (vowels),
- - a noise source used for unvoiced sounds (fricatives).
Ce mode d'élaboration pose le problème d'une distinction efficace entre les sons voisés et non voisés. Il aboutit à un signal.d'excitation n'ayant qu'un lointain rapport avec le signal d'excitation vocale et produisant par l'intermédiaire du filtre de modélisation du conduit vocal un signal synthétique de parole peu fidèle et parfois difficile à comprendre.This mode of elaboration poses the problem of an effective distinction between voiced and unvoiced sounds. It results in an excitation signal having only a distant relationship with the vocal excitation signal and producing via the vocal tract modeling filter a synthetic speech signal which is not very faithful and which is sometimes difficult to understand.
On connait, notamment par le brevet français n° 2 517 452, un autre mode d'élaboration du signal d'excitation du filtre de modélisation du conduit vocal qui permet de lui donner une forme plus ressemblante à celle du signal d'excitation vocale afin d'obtenir un signal synthétique de parole plus fidèle et qui est connu sous le nom de multi-impulsionnel. Ce mode d'élaboration consiste à engendrer pour l'excitation du filtre de modélisation du conduit vocal, un signal formé d'impulsions dont les positions et amplitudes sur chaque fenêtre temporelle sont ajustées de manière à minimiser sur chaque fenêtre temporelle les différences entre le signal de parole synthétisée et le signal de parole à coder. Cette minimisation se fait selon le critère de minimisation de l'erreur quadratique sur la fenêtre considérée avec une pondération dite perceptuelle de l'erreur tenant compte de la propriété de l'oreille humaine d'être moins sensible aux distorsions dans les régions de formant du spectre de fréquence de parole où l'énergie est relativement concentrée.We know, in particular from French Patent No. 2,517,452, another method of developing the excitation signal of the vocal tract modeling filter which makes it possible to give it a shape more resembling that of the vocal excitation signal in order to get a more faithful synthetic speech signal and which is known as multi-pulse. This method of production consists in generating, for the excitation of the vocal tract modeling filter, a signal formed of pulses whose positions and amplitudes on each time window are adjusted so as to minimize the differences between the signal on each time window. of synthesized speech and the speech signal to be encoded. This minimization is done according to the criterion of minimization of the quadratic error on the window considered with a so-called perceptual weighting of the error taking into account the property of the human ear to be less sensitive to distortions in the regions forming speech frequency spectrum where energy is relatively concentrated.
La minimisation selon le critère de l'erreur quadratique moyenne doit être obtenue avec un nombre minimum d'impulsions pour limiter le plus possible le débit binaire nécessaire à la transmission de la parole codée. Faute de solution directe à ce problème on choisit des emplacements discrets où il est possible de placer des impulsions et l'on procéde par approximations successives en définissant à chaque étape l'erreur quadratique pondérée résultant du signal impulsionnel adopté à l'étape précédente auquel on adjoint une nouvelle impulsion dont l'amplitude et la position sont inconnues, en déterminant alors en fonction de la position possible de cette nouvelle impulsion, la valeur de l'amplitude qui annule la dérivée partielle de cette erreur quadratique pondérée par rapport à cette amplitude considérée comme variable indépendante, puis en choisissant la position de l'impulsion pour laquelle cette erreur quadratique pondérée est minimale et en adoptant comme signal impulsionnel pour cette étape celui adopté à l'étape précédente auquel on adjoint l'impulsion ainsi définie.The minimization according to the criterion of the mean square error must be obtained with a minimum number of pulses to limit as much as possible the bit rate necessary for the transmission of coded speech. In the absence of a direct solution to this problem, we choose discrete locations where it is possible to place pulses and we proceed by successive approximations by defining at each step the weighted quadratic error resulting from the pulse signal adopted in the previous step to which we adds a new pulse whose amplitude and position are unknown, then determining as a function of the possible position of this new pulse, the value of the amplitude which cancels the partial derivative of this quadratic error weighted with respect to this amplitude considered as independent variable, then by choosing the position of the pulse for which this weighted quadratic error is minimal and by adopting as impulse signal for this stage that adopted in the preceding stage to which one adds the pulse thus defined.
L'approximation successive est arrêtée au bout d'un certain nombre d'itérations déterminé en fonction des capacités de calcul disponibles et du débit de codage.The successive approximation is stopped after a certain number of iterations determined according to the available computing capacities and the coding bit rate.
Elle a pour inconvénient d'accumuler les erreurs ce qui provoque une dégradation du rapport signal sur bruit du signal de parole synthétisé qui se manifeste surtout pour les voix aiguës.It has the disadvantage of accumulating errors which causes a degradation of the signal to noise ratio of the synthesized speech signal which manifests itself especially for high voices.
Pour éviter cet inconvénient, on a proposé de recalculer les amplitudes optimales de toutes les impulsions une fois leurs positions déterminées. Mais cela suppose la résolution d'un système d'équations linéaires augmentant de façon notable la quantité des calculs à effectuer pour la détermination du signal d'excitation ce qui, dans la pratique, enlève beaucoup d'intérêt à cette solution.To avoid this drawback, it has been proposed to recalculate the optimal amplitudes of all the pulses once their positions determined. But that supposes the resolution of a system of linear equations notably increasing the quantity of computations to be carried out for the determination of the excitation signal which which, in practice, removes much interest from this solution.
La présente invention a pour but de lutter contre la dégradation du rapport 'signal sur bruit d'un signal de parole -synthétisée due à la méthode par approximations successives utilisée pour la détermination des impulsions du signal d'excitation du filtre élaborant le signal de parole synthétisée, sans pour autant augmenter de façon significative le nombre de calculs à entreprendre.The object of the present invention is to combat the degradation of the signal-to-noise ratio of a synthesized speech signal due to the method by successive approximations used for determining the pulses of the excitation signal of the filter producing the speech signal. synthesized, without significantly increasing the number of calculations to be undertaken.
Elle a pour objet un procédé de codage à faible débit de la parole consistant à substituer au signal de parole à coder des paramètres définissant sur des fenêtres temporelles successives les caractérisitiques d'un filtre modélisant le conduit vocal et des positions et amplitudes d'impulsions qui forment le signal d'excitation du filtre et qui sont déterminées par approximations successives selon le critère de minimisation de l'erreur quadratique existant entre le signal de parole à coder et le signal de parole synthétisée restitué par le filtre. Ce procédé consiste, après détermination par approximations successives des positions et amplitudes du signal d'excitation, à ajouter à l'amplitude de chaque impulsion un terme correctif fonction de la valeur de la dérivée partielle de l'erreur quadratique par rapport à l'amplitude de l'impulsion considérée prise pour variable indépendante.It relates to a low bit rate coding method of speech consisting in replacing the speech signal to be coded with parameters defining over successive time windows the characteristics of a filter modeling the vocal tract and of the positions and amplitudes of pulses which form the excitation signal of the filter and which are determined by successive approximations according to the criterion of minimization of the quadratic error existing between the speech signal to be coded and the synthesized speech signal restored by the filter. This method consists, after determining by successive approximations of the positions and amplitudes of the excitation signal, in adding to the amplitude of each pulse a corrective term depending on the value of the partial derivative of the quadratic error with respect to the amplitude of the impulse considered taken for independent variable.
Cette correction bien que non optimale ne nécessite que très peu de calculs supplémentaires.This correction, although not optimal, requires very few additional calculations.
D'autres caractéristiques et avantages de l'invention ressortiront de la description ci-après en regard du dessin dans lequel :
- - la figure 1 représente le schéma synoptique général d'un vocodeur utilisant un codage numérique à prédiction linéaire
- - et la figure 2 un mode de réalisation d'un circuit d'analyse de prédiction linéaire et d'un circuit d'élaboration d'un signal multi-impulsionnel utilisés dans le vocodeur représenté à la figure précédente.
- - Figure 1 shows the general block diagram of a vocoder using digital coding with linear prediction
- - And Figure 2 an embodiment of a linear prediction analysis circuit and a circuit for developing a multi-pulse signal used in the vocoder shown in the previous figure.
On distingue dans la figure 1 un équipement émetteur 1 relié par une liaison numérique 2 à faible débit à un équipement récepteur 3.In FIG. 1 there is a
L'équipement émetteur 1 reçoit sur une entrée 10, à une cadence d'échantillonnage donnée, par exemple de 8 kHz, des échantillons numériques S (k) d'un signal de parole à coder dont la bande de fréquence a été au préalable limitée supérieurement à la moitié de la fréquence d'échantillonnage. Il groupe ces échantillons numériques S (k) par paquets de N successifs correspondant à des fenêtres temporelles sur lesquelles les caractéristiques du conduit vocal sont supposées invariantes, déduit de chaque paquet un jeu de p coefficients a (k) dits de prédiction linéaire permettant de définir en réception les caractéristiques d'un filtre modélisant le conduit vocal et un signal multi-impulsionnel v (k) destiné à l'excitation en réception du filtre modélisant le conduit vocal, et met les jeux de coefficients de prédiction linéaire a (k) et le signal multi-impulsionnel d'excitation v (k) sous une forme adaptée à leur acheminement par la liaison numérique 2 à faible débit vers l'équipement de réception 3. Pour ce faire, il comporte :
- - un circuit d'analyse 11 par prédiction linéaire qui engendre à partir des échantillons numériques S (k) du signal de parole à coder les jeux de coefficients de prédiction linéaire a (k) correspondant aux fenêtres temporelles successives,
- - un circuit d'élaboration 12 du signal multi-impulsionnel d'excitation v (k) qui opère à partir des échantillons numériques S (k) du signal de parole à coder et des jeux de coefficients de prédiction linéaire a (k) délivrés par le circuit d'analyse pour chaque paquet de N échantillons,
- - un circuit à
retard 13 retardant chaque jeu de coefficients de prédiction linéaire a(k) délivrés par le circuit d'analyse 11 le temps nécessaire au circuit d'élaboration 12 pour engendrer le signal d'excitation correspondant à la même fenêtre temporelle et - - des
14, 15 et uncodeurs multiplexeur 16 mettant les jeux de coefficients de prédiction linéaire a (k) et le signal multi-impulsionnel d'excitation v (k) défini par les positions et les amplitudes de ses impulsions sous une forme adaptée à leur acheminement par la liaison numérique à faible débit 2.
- a linear prediction analysis circuit 11 which generates from the digital samples S (k) of the speech signal to code the sets of linear prediction coefficients a (k) corresponding to the successive time windows,
- a
circuit 12 for developing the multi-pulse excitation signal v (k) which operates from digital samples S (k) of the speech signal to be coded and sets of linear prediction coefficients a (k) delivered by the analysis circuit for each packet of N samples, - a
delay circuit 13 delaying each set of linear prediction coefficients a (k) delivered by the analysis circuit 11 the time necessary for theprocessing circuit 12 to generate the excitation signal corresponding to the same time window and - -
14, 15 and acoders multiplexer 16 putting the sets of linear prediction coefficients a (k) and the multi-pulse excitation signal v (k) defined by the positions and amplitudes of its pulses in a form adapted to their routing by the digital low-speed link 2.
L'équipemement récepteur 3 comporte un démultiplexeur 31 et deux décodeurs 32, 33 placés en entrée, qui sont adaptés aux multiplexeurs 16 et au codeurs 14, 15 de l'équipement émetteur 1 et qui extraient du signal reçu de la liaison de transmission numérique 2 les jeux de coefficients de prédiction a (k) et le signal multi-impulsionnel d'excitation v (k), et un filtre 34 de modélisation du conduit vocal dont les caractéristiques sont ajustées à partir des jeux de coefficients de prédiction a (k) et qui engendre à partir du signal multi-impulsionnel d'excitation v (k) des échantillons S(k) d'un signal de parole synthétisée reproduisant le signal de parole d'origine.The receiving equipment 3 comprises a
Le circuit d'analyse 11 de l'équipement émetteur 1 est un circuit de traitement numérique qui n'est pas détaillé car il est bien connu de l'homme de métier et n'est pas du domaine de l'invention. Pour la façon dont il procède pour extraire les jeux de coefficients de prédiction a (k) des échantillons du signal de parole à coder on pourra se reporter au livre de Markel J., Gray A. intitulé "Linear prédiction of speech" édité par Springer Verlag, New York, 1976. Brièvement, le signal prédit S (n) se définit à partir des valeurs écoulées du signal de parole à coder S(n) au moyen des coefficients de prédiction a (k) par la relation :
Cela s'obtient par la méthode des moindres carrés qui donne les coefficients de prédiction linéaire a(k) comme solution du système d'équations :
Le filtre de modélisation du conduit vocal 34 de l'équipement de réception a pour fonction de transfert H(z) qui s'exprime à partir des coefficients de prédiction a (k) par :
Le circuit d'élaboration 12 du signal multi-impulsionnel d'excitation engendre pour chaque fenêtre temporelle d'analyse du signal à coder une séquence d'impulsions en nombre minimal avec des positions et des amplitudes choisies de manière à obtenir du filtre modélisant le conduit vocal un signal de parole synthétisée reproduisant le plus fidèlement possible pour un auditeur le signal de parole d'origine.The
Le critère adopté pour estimer la fidélité de reproduction d'un signal de parole par un signal synthétique est celui de minimisation de l'erreur quadratique, sur une fenêtre temporelle d'analyse, entre le signal de parole d'origine et le signal de parole synthétisée avec une pondération de l'erreur tenant compte des propriétés perceptuelles d'un auditeur qui font qu'il est moins sensible aux distorsions se produisant dans les régions de formant du spectre de fréquence du signal de parole où l'énergie est relativement concentrée. Une manière connue de réaliser cette pondération notamment par le brevet américain n° 4 133 976 consiste à soumettre le signal d'erreur formé de la différence entre le signal de parole d'origine et le signal de parole synthétisée à un filtrage dont la fonction de transfert W (z) s'exprime en fonction de celle H (z) du filtre de modélisation du conduit vocal par la relation :
Ce filtrage peut être obtenu par passage du signal d'erreur ou de ses composants dans un filtre prédictif dont la fonction de transfert est H-1 (z) puis dans un filtre dit perceptuel de fonction de transfert H ( r z) qui peut se déterminer en fonction des coefficients de prédiction par la relation de définition :
D'une manière générale, le filtrage prédictif se fait sur les composants du signal d'erreur, de façon explicite sur le signal de parole à coder et de façon imPlicite sur le signal de parole synthétisée, tandis que le filtrage perceptuel se fait sur le signal d'erreur lui-même dont les composants ont été réunis après filtrage prédictif.In general, predictive filtering is done on the components of the error signal, explicitly on the speech signal to be coded and implicitly on the synthesized speech signal, while perceptual filtering is done on the error signal itself, the components of which have been combined after predictive filtering.
Pour le filtrage prédictif du signal de parole à coder, le circuit d'élaboration 12 comporte un circuit à retard 120 qui reçoit les paquets de N échantillons successifs S(k) du signal de parole à coder correspondant aux fenêtres temporelles sucessives sur lesquelles opère le circuit d'analyse 11 et qui les stockent le temps nécessaire à ce dernier pour établir chaque jeu de coefficients de prédiction a(k), et un filtre prédictif 121 qui reçoit son jeu de coefficients a(k) du circuit d'analyse 11 et les paquets d'échantillons successifs S (k) du circuit à retard 120 et qui délivre un signal de résidu de prédiction r(k).For the predictive filtering of the speech signal to be coded, the
Le filtrage prédictif du signal de parole synthétisée s'obtient implicitement en remplaçant ce signal par le signal multi-impulsionnel d'excitation v(k) dont il découle par un filtrage en H (z) effectué par le filtre de modélisation du conduit vocal.The predictive filtering of the synthesized speech signal is obtained implicitly by replacing this signal by the multi-pulse excitation signal v (k) from which it follows by a filtering in H (z) carried out by the modeling filter of the vocal tract.
Un soustracteur 122 forme le signal d'erreur en retranchant le signal multi-impulsionnel v (k) du signal de résidu de prédiction r (k) et l'applique à un filtre perceptuel 123 recevant ses coefficients d'un circuit de traitement 124 les élaborant à partir du jeu de coefficients de prédiction a(k) par mise en oeuvre de la dernière relation citée.A
Les séquences d'impulsions formant le signal multi-impulsionnel d'excitation pour chacune des fenêtres temporelles sur lesquelles opèrent le circuit d'analyse 11 sont engendrées dans le circuit d'élaboration 12 par un circuit synthétiseur d'impulsions 125 qui reçoit le signal d'erreur pondérée issu du filtre perceptuel 123. Ce circuit synthétiseur d'impulsions 125 engendre pour chaque séquence du signal multi-impulsionnel d'excitation un nombre d'impulsions compatible avec la capacité de transmission de la liaison numérique 2 qui relie l'équipement d'émission 1 à l'équipement de réception 3 tout en leur donnant des positions dans la fenêtre temporelle considérée et des amplitudes minimisant l'énergie de l'erreur pondérée.The pulse sequences forming the excitation multi-pulse signal for each of the time windows on which the analysis circuit 11 operates are generated in the
Soient A (i) les amplitudes de ces impulsions supposées au plus en nombre Q et m (i) leurs positions respectives dans la fenêtre temporelle choisies parmi les positions discrètes 1,.., N d'échantillons échelonnées le long de la fenêtre. La séquence d'impulsions V (k) s'exprime par :
Cette expression atteint son minimum lorsque sa dérivée par rapport à l'amplitude A (1+1) de la (1+1) ième impulsion s'annule c'est-à-dire pour la valeur :
La mise en oeuvre de cette méthode d'élaboration par approximations successives des séquences d'impulsions du signal multi-impulsionnel d'excitation se fait, d'une manière bien connue de l'homme de l'art, notamment par le brevet français n° 2 517 452 à l'aide de circuits de traitement de corrélation placés dans le circuit de synthèse d'impulsions 125 qui calculent les fonctions d'intercorrélation du numérateur et d'autocorrélation du dénominateur du membre droit de l'égalité (4) à partir des échantillons de l'erreur pondérée fournis par le filtre perceptuel 123 et des échantillons de la réponse impulsionnelle du filtre perceptuel fournis par le circuit de traitement 124.The implementation of this method of elaboration by successive approximations of the pulse sequences of the excitation multi-pulse signal is done, in a manner well known to those skilled in the art, in particular by French patent n ° 2 517 452 using correlation processing circuits placed in the
Cette méthode d'élaboration assez complexe présente l'inconvénient d'accumuler les erreurs au cours de ses étapes.This rather complex method of preparation has the disadvantage of accumulating errors during its stages.
Pour corriger ce défaut,il a été proposé de recalculer les amplitudes de toutes les impulsions d'une séquence du signal multi-impulsionnel d'excitation une fois les positions de toutes les impulsions choisies par la méthode précédente.To correct this defect, it has been proposed to recalculate the amplitudes of all the pulses of a sequence of the excitation multi-pulse signal once the positions of all the pulses chosen by the previous method.
En effet, en dérivant l'erreur pondérée e (k) exprimée par la relation (1) par rapport aux amplitudes d'impulsions A (i) placées en des instants choisis m(1),.., m(Q) de la fenêtre temporelle considérée on obtient :
Pour lutter contre l'imprécision sur les amplitudes des impulsions d'une séquence du signal multi-impulsionnel d'excitation due à la méthode par approximation successive utilisée pour leur détermination, on propose, selon l'invention, de terminer la détermination des impulsions d'une séquence par une actualisation de leurs amplitudes à l'aide d'un terme correctif qui est égal pour chacune des impulsions à l'amplitude que l'on donnerait à une impulsion supplémentaire si l'on prolongeait d'une étape la méthode d'obtention par approximations successives en fixant arbitrairement la position de la nouvelle impulsion au même emplacement.To combat the imprecision on the amplitudes of the pulses of a sequence of the excitation multi-pulse signal due to the successive approximation method used for their determination, it is proposed, according to the invention, to complete the determination of the pulses d '' a sequence by updating their amplitudes using a corrective term which is equal for each of the pulses to the amplitude which would be given to an additional pulse if the method d is extended by one step 'obtaining by successive approximations by arbitrarily fixing the position of the new pulse at the same location.
Ainsi, ayant déterminé le nombre maximum Q d'impulsions prévues au cours de Q étapes successives disposées en des positions m(1), ..,m(Q), on corrige l'amplitude A(i) de chacune d'elle à l'aide du terme correctif A'(i) déduit de la relation (4) :
L'intérêt de cette correction apparaît par comparaison avec la méthode de recalcul global des amplitudes optimales de toutes les impulsions exposées précédemment qui donne les valeurs optimales A opt (i) comme solution du système d'équations :
En remarquant que le terme T (j) peut s'exprimer par :
Le terme correctif A (i) présente l'intérêt d'avoir une relation de définition de même nature que celle (4) de l'amplitude A (1+1) de l'impulsion placée au cours de chaque étape de la méthode par approximations et par conséquent de pouvoir être élaboré avec un nombre d'opérations supplémentaires très restreint, sans commune mesure avec le nombre d'opérations nécessaires à la résolution du système d'équations (12).The corrective term A (i) has the advantage of having a definition relation of the same nature as that (4) of the amplitude A (1 + 1) of the pulse placed during each step of the method by approximations and therefore to be able to be elaborated with a very limited number of additional operations, without common measure with the number of operations necessary for the resolution of the system of equations ( 12 ).
L'étape d'élaboration du jeu des Q termes correctifs A'(i) a lieu après la Q ième étape de la méthode par approximations au cours de laquelle (Q-T) ième impulsion a été déterminée au moyen de l'étude de la fonction t (k). Elle ressemble, comme on va le voir ci-après, à une étape supplémentaire de la méthode par approximations dans laquelle le calcul de la fonction t (k) n'est pas effectué mais remplacé par le calcul systématique de l'amplitude d'impulsion pour toutes les positions d'impulsions déjà déterminées.The stage of elaboration of the set of Q corrective terms A '(i) takes place after the Q th stage of the approximation method during which (QT) th pulse has been determined by means of the study of the function t (k). It resembles, as we will see below, an additional step of the approximation method in which the calculation of the function t (k) is not performed but replaced by the systematic calculation of the pulse amplitude for all the pulse positions already determined.
La figure 2 illustre un mode de réalisation des circuits d'analyse 11 et d'élaboration 12 de l'équipement émetteur.FIG. 2 illustrates an embodiment of the analysis circuits 11 and of
Celui-ci se compose d'un microprocesseur 40 relié par des bus d'adresses 41, de. données 42 et de contrôle 43 à une mémoire vive 44 permettant de stocker de manière provisoire les échantillons du signal de parole à coder S (k) ainsi que des variables de calcul, à une mémoire morte 45 contenant des programmes de mise en paquets des échantillons S(k) du signal de parole à coder, de calcul du jeu de coefficients de prédiction a(k) correspondant à chaque paquet et des échantillons h' (k) de la réponse impulsionnelle du filtre perceptuel ainsi que de détermination des positions et amplitudes des impulsions de la séquence du signal multi-impulsionnel d'excitation, et à un interface d'entrée sortie 46 permettant l'introduction des échantillons numérique S (k) de parole à coder et la délivrance en direction des codeurs des jeux de coefficients de prédiction a(k) et des positions et amplitudes des impulsions des séquences du signal multi-impulsionnel d'excitation.This consists of a
Le microprocesseur 40 prooède à plusieurs opérations simultanées sous le oontrôle des programmes enregistrés dans la mémoire morte 45.The
Il procède tout d'abord à l'arrangement par paquets de N des échantillons du signal de parole à coder S(k) qui lui parviennent régulièrement sous forme série, interrompant ses autres tâches toutes les 125 s pour une cadence d'échaatilloanage de 8 kHz pour les recueillir sur son entrée et les stocker dans la mémoire vive 44.It first of all arranges in packets of N the samples of the speech signal to be coded S (k) which regularly reach it in serial form, interrupting its other tasks every 125 s for a cadence of 8 kHz to collect them on its input and store them in RAM 44.
Une fois un paquet d'échantillons complet, il calcule le jeu des coefficients de prédiction a(k) qui lui correspond en résolvant selon l'une des méthodes connues décrites dans l'ouvrage précité le système d'équations (o) et les stocke en mémoire vive 44.Once a packet of samples is complete, it calculates the set of prediction coefficients a (k) which corresponds to it by solving according to one of the known methods described in the above-mentioned work the system of equations (o) and stores them in RAM 44.
A partir de ce jeu de coefficients de prédiction a(k), il élabore les échantillons h' (k) de la réponse impulsionnelle du filtre perceptuel ainsi que les échantillons du aigaal de résidu de prédiction r(k) et les signaux d'autocorrélation C (i,i) de la réponse impulsionnelle du filtre perceptuel qu'il stocke en mémoire vive puis il élabore la séquence du signal multi-impulsionnel d'excitation.From this set of prediction coefficients a (k), it develops the samples h '(k) of the impulse response of the perceptual filter as well as the samples of the aigaal of prediction residue r (k) and the autocorrelation signals. C (i, i) of the impulse response of the perceptual filter which it stores in random access memory then it elaborates the sequence of the multi-impulse excitation signal.
Pour élaborer la séquence du signal multi-impulsionnel d'excitation il procède, comme indiqué précédemment, par une méthode d'approximations successives à Q étapes à chaque étape de laquelle il calcule une fonction :
Le microprocesseur stocke ensuite en mémoire vive les valeurs de cette fonction t(k) puis calcule la fonction z (1) par la formule :
Au cours de la première étape, la fonction t(k) est calculée à partir de sa définition au moyen des échantillons r(k) du signal de résidu de prédiction en tenant compte du fait que la séquence du signal multi-impulsionnel sur la fenêtre courante est alors un signal nul :
Après la dernière étape de la méthode par approximations successives ayant permis de déterminer la position m(Q) et l'amplitude A (Q) de la Q ième impulsion au moyen de la dernière mise à jour :
Il effectue enfin les corrections en adoptant pour amplitudes définitives des impulsions sur la fenêtre temporelle considérée les valeurs : A (i) + A' (i) i =1,..,Q dont on notera qu'elles correspondront dans la relation (1) pour la détermination des impulsions sur la s ième fenêtre temporelle suivante aux amplitudes B(-s.Q+i)Finally, it performs the corrections by adopting for final amplitudes pulses over the time window considered the values: A (i) + A '(i) i = 1, .., Q which we note will correspond in relation (1 ) for the determination of the pulses on the following s th time window at amplitudes B (-s.Q + i)
L'étape d'élaboration des termes correctifs n'exigeant pas d'opérations très différentes de celles effectuées au cours d'une étape de la méthode par approximations successives s'intègre facilement dans le cadre de cette dernière sans en augmenter de façon appréciable la durée de mise en oeuvre ce qui est fondamental dans le cadre des vocodeurs où l'élaboration de chaque séquence du signal multi-impulsionnel d'excitation doit se faire sur la durée limitée d'une fenêtre temporelle d'analyse.The stage of drawing up corrective terms which does not require operations which are very different from those carried out during a stage of the method by successive approximations is easily integrated into the framework of the latter without appreciably increasing the duration of implementation which is fundamental in the context of vocoders where the development of each sequence of the excitation multi-pulse signal must be done over the limited duration of a time window of analysis.
Claims (2)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR8504304A FR2579356B1 (en) | 1985-03-22 | 1985-03-22 | LOW-THROUGHPUT CODING METHOD OF MULTI-PULSE EXCITATION SIGNAL SPEECH |
FR8504304 | 1985-03-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
EP0195441A1 true EP0195441A1 (en) | 1986-09-24 |
EP0195441B1 EP0195441B1 (en) | 1990-04-25 |
Family
ID=9317484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP86103770A Expired - Lifetime EP0195441B1 (en) | 1985-03-22 | 1986-03-20 | Method for low bite rate speech coding using a multipulse excitation signal |
Country Status (6)
Country | Link |
---|---|
US (1) | US4847905A (en) |
EP (1) | EP0195441B1 (en) |
CA (1) | CA1241117A (en) |
DE (1) | DE3670712D1 (en) |
DK (1) | DK126986A (en) |
FR (1) | FR2579356B1 (en) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE35057E (en) * | 1987-08-28 | 1995-10-10 | British Telecommunications Public Limited Company | Speech coding using sparse vector codebook and cyclic shift techniques |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
AU629637B2 (en) * | 1989-05-11 | 1992-10-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Excitation pulse positioning method in a linear predictive speech coder |
JP2940005B2 (en) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | Audio coding device |
US5673364A (en) * | 1993-12-01 | 1997-09-30 | The Dsp Group Ltd. | System and method for compression and decompression of audio signals |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US6012025A (en) * | 1998-01-28 | 2000-01-04 | Nokia Mobile Phones Limited | Audio coding method and apparatus using backward adaptive prediction |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
JP4460165B2 (en) * | 1998-09-11 | 2010-05-12 | モトローラ・インコーポレイテッド | Method and apparatus for encoding an information signal |
EP2009623A1 (en) * | 2007-06-27 | 2008-12-31 | Nokia Siemens Networks Oy | Speech coding |
US8036886B2 (en) * | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
GB2596821A (en) | 2020-07-07 | 2022-01-12 | Validsoft Ltd | Computer-generated speech detection |
US12254895B2 (en) | 2021-07-02 | 2025-03-18 | Digital Voice Systems, Inc. | Detecting and compensating for the presence of a speaker mask in a speech signal |
US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
-
1985
- 1985-03-22 FR FR8504304A patent/FR2579356B1/en not_active Expired
-
1986
- 1986-03-18 CA CA000504346A patent/CA1241117A/en not_active Expired
- 1986-03-19 DK DK126986A patent/DK126986A/en not_active Application Discontinuation
- 1986-03-20 EP EP86103770A patent/EP0195441B1/en not_active Expired - Lifetime
- 1986-03-20 DE DE8686103770T patent/DE3670712D1/en not_active Expired - Lifetime
- 1986-03-24 US US06/843,487 patent/US4847905A/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
IEEE INTERNATIONAL CONFERENCE ON ACOUSTIC, SPEECH AND SIGNAL PROCESSING, 19-25 mars 1984, San Diego, US, vol. 1, pages 10.1.1-10.1.4, IEEE, New York, US; M. BEROUTI et al.: "Efficient computation and encoding of the multipulse excitation for LPC" * |
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 74, suppl. 1, 1983, page S51, Acoustical Society of America, New York, US; S. SINGHAL: "Optimizing pulse amplitudes in multipulse excitation" * |
Also Published As
Publication number | Publication date |
---|---|
DK126986D0 (en) | 1986-03-19 |
EP0195441B1 (en) | 1990-04-25 |
CA1241117A (en) | 1988-08-23 |
FR2579356A1 (en) | 1986-09-26 |
DK126986A (en) | 1986-09-23 |
FR2579356B1 (en) | 1987-05-07 |
DE3670712D1 (en) | 1990-05-31 |
US4847905A (en) | 1989-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0195441B1 (en) | Method for low bite rate speech coding using a multipulse excitation signal | |
EP1316087B1 (en) | Transmission error concealment in an audio signal | |
FR2517452A1 (en) | CIRCUIT FOR DIGITAL SPEECH PROCESSING | |
EP1944755B1 (en) | Modification of a voice signal | |
WO2007096550A2 (en) | Improved coding/decoding of a digital audio signal, in celp technique | |
EP0428445B1 (en) | Method and apparatus for coding of predictive filters in very low bitrate vocoders | |
EP3175444B1 (en) | Frame loss management in an fd/lpd transition context | |
EP0801790A1 (en) | Speech coding method using synthesis analysis | |
EP2080194B1 (en) | Attenuation of overvoicing, in particular for generating an excitation at a decoder, in the absence of information | |
EP0685833B1 (en) | Method for speech coding using linear prediction | |
EP0490740A1 (en) | Method and apparatus for pitch period determination of the speech signal in very low bitrate vocoders | |
EP1875465A1 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
Srivastava | Fundamentals of linear prediction | |
FR2510288A1 (en) | Underwater noise generator for sonar simulation - uses auto-correlator, to generate filter coefficients in series with white noise generator and predictive analysers | |
EP2589045B1 (en) | Adaptive linear predictive coding/decoding | |
NO862602L (en) | VOCODES BUILT INTO DIGITAL SIGNAL PROCESSING DEVICES. | |
EP1192619B1 (en) | Audio coding and decoding by interpolation | |
EP1192618B1 (en) | Audio coding with adaptive liftering | |
EP1192621B1 (en) | Audio encoding with harmonic components | |
WO2002029786A1 (en) | Method and device for segmental coding of an audio signal | |
EP0454552A2 (en) | Method and apparatus for low bitrate speech coding | |
Moreau | Predictive speech coding at low bit rates: a unified approach | |
Zhang | Code excited linear prediction with multi-pulse codebooks | |
Rao et al. | DEVELOPMENT OF SPEECH BANDWIDTH EXTENSION TECHNIQUE USING DISCRETE COSINE TRANSFORM | |
WO2008081141A2 (en) | Acoustic unit coding by interpolation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): BE DE FR GB IT NL SE |
|
17P | Request for examination filed |
Effective date: 19870324 |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: ALCATEL CIT |
|
17Q | First examination report despatched |
Effective date: 19881124 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: ALCATEL CIT |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): BE DE FR GB IT NL SE |
|
REF | Corresponds to: |
Ref document number: 3670712 Country of ref document: DE Date of ref document: 19900531 |
|
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) | ||
ITF | It: translation for a ep patent filed | ||
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed | ||
ITTA | It: last paid annual fee | ||
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 19931230 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: SE Payment date: 19940127 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: BE Payment date: 19940210 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 19940221 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: NL Payment date: 19940331 Year of fee payment: 9 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 19940416 Year of fee payment: 9 |
|
EAL | Se: european patent in force in sweden |
Ref document number: 86103770.3 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Effective date: 19950320 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SE Effective date: 19950321 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BE Effective date: 19950331 |
|
BERE | Be: lapsed |
Owner name: ALCATEL CIT Effective date: 19950331 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: NL Effective date: 19951001 |
|
GBPC | Gb: european patent ceased through non-payment of renewal fee |
Effective date: 19950320 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: FR Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 19951130 |
|
NLV4 | Nl: lapsed or anulled due to non-payment of the annual fee |
Effective date: 19951001 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Effective date: 19951201 |
|
EUG | Se: european patent has lapsed |
Ref document number: 86103770.3 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: ST |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20050320 |