[go: up one dir, main page]

PT93999B - Processo posicionamento de impulsos de excitacao num codificador preditivo linear de fala - Google Patents

Processo posicionamento de impulsos de excitacao num codificador preditivo linear de fala Download PDF

Info

Publication number
PT93999B
PT93999B PT93999A PT9399990A PT93999B PT 93999 B PT93999 B PT 93999B PT 93999 A PT93999 A PT 93999A PT 9399990 A PT9399990 A PT 9399990A PT 93999 B PT93999 B PT 93999B
Authority
PT
Portugal
Prior art keywords
phase
positions
pulse
signal
excitation
Prior art date
Application number
PT93999A
Other languages
English (en)
Other versions
PT93999A (pt
Inventor
Torbjorn Minde
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Publication of PT93999A publication Critical patent/PT93999A/pt
Publication of PT93999B publication Critical patent/PT93999B/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Paper (AREA)
  • Control Of Stepping Motors (AREA)
  • Numerical Control (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Traffic Control Systems (AREA)
  • Road Signs Or Road Markings (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)
  • Output Control And Ontrol Of Special Type Engine (AREA)
  • Turbine Rotor Nozzle Sealing (AREA)
  • Saccharide Compounds (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Character Spaces And Line Spaces In Printers (AREA)
  • Control Of Position Or Direction (AREA)

Description

MEMÓRJA DESCRTTJVA
CAMPO TfcCNTCO
O presente invento relaciona-se com um processo de posicionamento de impulsos de excitação num codificador preditivo linear de fala, o qual funciona de acordo com um principio multi-iropulso. Tal codificador de fala pode ser incorporado, por exemplo, numa rede de telefone móvel, com a finalidade de comprimir sinais de linguagem antes da transmissão a partir de um nóvel .
ARTE ANTERIOR
Os codificadores preditivos lineares de fala que funcionam de acordo com o dito princípio multi-irapulso, são conhecidos na arte, por exemplo, de US-PS 3 624 302 que descreve a codificação preditiva linear de sinais de fala, e também de US-PS 3 740 476 o qual ensina como os sinais de parâmetros preditivos e resíduos preditivos podem ser formados num tal codificador de fala.
Quando se forma um sinal de fala artificia] por meio de codificação preditiva linear, é gerado do sinal original um número de parâmetros preditivos (a^ ) os quais caracterizam o sinal sintetizado de fala. Assim, pode ser formado, com a ajuda destes parâmetros, um sinal de fala que não incluirá a redundância que normalmente se verifica na fala natural, e cuja conversão não é necessária, quando se transmite fala entre, por exemplo, uma estação móvel e uma base incluidas numa rede rádio móvel. Do aspecto da largura de banda, é mais apropriado transferir unicamente os parâmetros preditivos, em vez do sinal de linguagem original, que requer uma largura de banda muito mais larga. O sinal de linguagem regenerado, num receptor, e constituindo um sinal de fala sintético pode, contudo, ser difícil de apreender, devido a uma falta de concordância entre o modelo de fala do sinal original e o sinal sintético recriado com a ajuda dos parâmetros de predição. Estas deficiências, foram descritas em detalhe na US-PS 4 472 832 {SE-A--456618) , e podem ser algo obviadas, pela introdução dos chamados impulsos de excitação (mui t. i - impul sos ) , quando st* forma a reprodução
851
LM 48]7/01489
-3sintética de fala. Neste caso, o modelo de entrada da fala origina] é dividido em intervalos de quadro. Dentro de tal cada intervalo é formado um dado número de impulsos de amplitude variável e de posição de fase (posição de tempo), por um lado na dependência dos parâmetros de predição ajç, e por outro lado na dependência do resíduo de predição dj^ entre o modelo de entrada da fala e a reprodução da fala. Cada um dos impulsos permite influenciar a reprodução de modelo de fala, de modo que o resíduo preditivo seja tão pequeno quanto possível. Os impulsos de excitação gerados têm uma relação de bit relativamente baixa e podem portanto ser codificados e transmitidos numa banda, estreita, como podem também os parâmetros de predição. Isto resulta numa melhoria na qualidade do sinal de fala regenerado.
DESCRIÇÃO DO INVENTO
No caso dos processos já mencionados e conhecidos, os impulsos de excitação são gerados dentro de cada intervalo de quadro do modelo de entrada de fala, ponderando o sinal residual djç e realimentando e ponderando os valores gerados a partir dos impulsos de excitação, cada num filtro preditivo separado. Os sinais de saída dos dois filtros são então correlacionados. Isto é seguido pela maximização da correlação de um certo número de elementos de sinal do sinal correlacionado, formando com eles os parâmetros (amplitude e posição de fase) dos impulsos de excitação. A vantagem deste algoritmo muiti-iropulso, para geração de impulsos de excitação, é que vários tipos de som podem ser gerados com um pequeno número de impulsos (por ex. 8 impulsos por intervalo de quadro). O algoritmo de procura de impulso é geral em relação ao posicionamento dos impulsos no quadro. É possível recriar sons não acentuados (consoantes), que normalmente requerem impulsos posicionados aleatoriamente, e sons acentuados (vogais), os quais requerem posicionamento mais reunido dos impulsos.
Uma desvantagem, do processo de posicionamento de impulso conhecido, é que a codificação efectuada subsequentemente à definição das posições de impulso, é complexa em relação quer ao cálculo quer à armazenagem. Além disso, o processo requer um
851
LM 4817/01489
-4grande número de bits para cada posição de impulso no intervalo de quadro. Os bits, nas palavras código, obtidos dos algoritmos de codificação de impulso combinatórios óptimos, são também propensos a erros de bit. Um erro de bit, na palavra código a ser transmitida do transmissor para o receptor, pode ter uma consequência desastrosa em relação ao posicionamento de impulso, quando se descodifica a palavra código no receptor.
O presente invento é baseado no facto de que o número de posições de impulso, para os impulsos de excitação, dentro de um intervalo de quadro, é tão grande que torna possível preceder ao posicionamento exacto de um ou mais impulsos de excitação dentro do quadro e ainda obter um sinal de fala regenerado de qualidade aceitável subsequentemente à codificação e transmissão.
De acordo com processos conhecidos, as posições de fase correctas são calculadas a partir dos impulsos de excitação dentro de um quadro e quadros seguintes do sinal de fala, e o posicionamento dos impulsos é efectuado, unicamente, na dependência de processamento complexo dos parâmetros de sinal de fala (resíduo preditivo, sinal residual e os parâmetros dos impulsos de excitação em quadros precedentes).
De acordo com o processo do presente invento, são introduzidas certas limitações de posição de fase quando se posicionam os impulsos, negando um dado número de posições de fase, determinadas previamente, para os impulsos, que seguem a posição de fase de um impulso de excitação que já foi calculado. Subsequentemente ao cálculo da posição de um primeiro impulso, dentro do quadro, e subsequentemente à colocação deste impulso na posição de fase calculada, é negada a dita posição de fase para os impulsos seguintes, dentro do quadro. Esta regra é aplicada, de preferência, a todas as posições de impulso no quadro.
Por consequência, o objectivo do presente invento é fornecer um processo para determinar as posições dos impulsos de excitação, dentro de um intervalo de quadro e dos intervalos de quadro seguintes, de um modelo de entrada de fala, para um
851
LM 4817/01489
-5codificador preditivo linear, que requer um codificador menos complexo, e uma largura de banda mais pequena e que reduzirá o risco de erro de bit na recodif icação subsequente, antes da transmissão.
O processo do invento é caracterizado pelos aspectos indicados na parte de caracterização da reivindicação 1.
O processo proposto pode ser aplicado com um codificador de fala, que funciona de acordo com o princípio muiti-impulso era correlação com um sinal de fala original e a resposta impulso de um sinal sintetizado-LPC. O processo pode também ser aplicado, contudo, com um chamado codificador de fala-RPE, no qual vários impulsos de excitação são posicionados simultaneamente no intervalo de quadro.
BREVE DESCRIÇÃO DOS DESENHOS
O processo proposto será agora descrito, em mais detalhe, com referência aos desenhos anexos, nos quais:
a Figura 1 é um esquema de blocos simplificado de um codificador de fala-LPC conhecido;
a Figura 2 é um diagrama de tempo que cobre certos sinais ocorrendo no codificador de fala, de acordo com a Figura 1;
a Figura 3 é um diagrama explicando o princípio do inventoí as Figuras 4a, 4b são diagramas mais detalhados ilustrando o princípio do invento;
a Figura 5 é um esquema de blocos ilustrando uma parte de um codificador de fala que funciona de acordo com o princípio do invento;
a Figura 6 é fluxograma para o codificador de fala mostrado na Figura 5; e a Figura 7 é um arranjo de blocos incluído no fluxograma da Figura 6.
MALHOR MANEIRA DE EXECUTAR O INVENTO
A Figura 1 é um esquema de blocos simplificado de um r
851
LM 4817/01489
-6codificador de fala-LPC conhecido, o qual funciona de acordo com o princípio muiti-impulso. Um tal codificador é descrito em detalhe na US-PS 4 472 832 (SE-A-456618) . Um sinal de fala analógico de, por exemplo, um microfone ocorre na entrada de um analisador de predição 110. Adicionalmente a um conversor analógico-digital, o analisador de predição 110 também inclui um computador-LPC e um gerador de sinal residual, o qual forma parâmetros de predição aj^ e um sinal residual d^, respectivamente. Os parâmetros de predição caracterizam o sinal sintetizado, visto que o sinal residual mostra o erro entre o sinal sintetizado e o sinal de fala original, através da entrada do analisador.
Um processador de excitação 120 recebe os dois sinais ajç e djç, e funciona sob um de um número de intervalos de quadro, mutuamente sequenciais, determinados pelo sinal de quadro FC, de modo a emitir um dado número de impulsos de excitação, durante cada dos ditos intervalos. Cada, dos ditos impulsos é determinado pela sua amplitude Amp e pela sua posição de tempo, mp dentro do quadro. Os parâmetros de impulso de excitação Amp, mp são conduzidos para um codificador 131, e são depois roultiplexados com os parâmetros de predição ajç, antes da transmissão, por exemplo, por um transmissor rádio.
O processador de excitação 120, inclui dois filtros preditivos, tendo a mesma resposta de impulso, para ponderarem os sinais d^ e Aj, roj na dependência dos parâmetros de predição a μ , durante uma dada fase de computação ou cálculo p. Também está incluído um gerador de sinal de correlação, que é eficaz para efectuar a correlação entre o sinal origina] ponderado (y) e o sinal sintetizado ponderado (y) de cada vez que um impulso de excitação tenha de ser gerado. Para cada correlação é obtido um número q de candidatos de elementos de impulso Aj, mj (0$i<I) dos quais um dá o erro quadrático mais pequeno ou o valor absoluto mais pequeno. A amplitude AInp e a posição de tempo mp, para o candidato seleccionado, são calculadas no gerador de sinal de excitação. A contribuição do impulso seleccionado Amp, mp é então subtraída do sinal desejado, no gerador de sinal de
851
LM 4817/01489
-7correlacção, de modo a obter uma nova sequência de candidatos, e o processo é repetido um certo número de vezes que iguala o número desejado de impulsos de excitação dentro de um quadro. Isto é descrito em detalhe na atrás referida especificação de patente dos Estados Unidos.
A Figura 2 é um diagrama de tempo sobre sinais de entrada de fala residuais preditivos d^ e impulsos de excitação. 0 número de impulsos de excitação, neste caso é também oito (8), dos quais o impulso Am|, mj, foi seleccionado primeiro (dá o erro mais pequeno) e depois disso o impulso Amg, mg, etc., dentro do quatro.
No processo anterior conhecido, para calcular a amplitude Aj e posição de fase mj , para cada impulso de excitação, mj=mp, é calculado para o impulso, que dá valor máximo de ai/0ij, e foi calculada a amplitude associada Amp, onde am é o vector de correlação cruzada entre os sinais yn e yn, de acordo com o atrás mencionado, e Ç5mm é a matriz de auto-correlação para a resposta de impulso dos filtros de predição. Qualquer posição nip apenas é aceite, quando unicamente as condições atrás são comprimidas. 0 índice p significa a fase sob a qual é realizado o cálculo de um impulso de excitação, de acordo com o atrás mencionado.
De acordo com o invento, um quadro de acordo(com a Figura 2 é dividido da maneira ilustrada na Figura 3. É assumido, através de um exemplo, que o quadro contém N=12 posições. Neste caso, as N-posições formam um vector de exploração (n ) . A totalidade do quadro é dividida nos chamados sub-blocos. Cada sub-bloco conterá então um dado número de fases. Por exemplo, se a totalidade do quadro contém N=12 posições, de acordo com a Figura 3, quatro sub-blocos são obtidos e cada sub-bloco conterá três fases diferentes. O sub-bloco tem uma dada posição dentro do quadro completo, sendo esta posição referida como a posição de fase. Cada posição n(O<n<N) pertencerá então a um dado sub-bloco nf (0<nf<Nf) e uma dada fase f (0<f<F) no dito sub-bloco.
Em geral, as posições n(0<n<N) no vector de exploração total, o qual contém N posições, será /
851
LM 4817/01489
-8n=nf'F + f nf=O, (Nf-1), f = O, ... (F-l> e η - Ο, ..., (N-l). Adicionalmente, a seguinte relação aplicar-se-á também f = n MOD F e nf = n DIV F ... (1).
O diagrama da Figura 3 ilustra a distribuição das fases f e sub-blocos nf, para um dado vector de exploração, contendo N posições. Neste caso, N = 12, F = 3 e Np = 4.
processo do invento implica a limitação de impulso a posições que não pertencem a uma fase ocupada fp, para os impulsos de excitação, cujas posições n foram calculadas em fases precedentes.
Em seguida, a ordem ou número de sequências de um dado ciclo de cálculo, de um impulso, de excitação, é designado por p, de acordo com o atrás referido. O processo proposto resultará então nas seguintes fases de cálculo, para ura intervalo de quadro:
1 . calcular o sinal desejado Yn;
2. calcular o vector de correlação cruzada aj;
3. calcular a matriz de auto-correlação Ç9i j;
4 . quando p = 1; exploração para mp, isto é a posição de
impulso, a qual dá o máximo af/0i j = am/0mm nas fases não
ocupadas f;
5. calcular a amplitude Amp para a posição de impulso descoberta
mp ’
6. actualizar o vector de correlação cruzada í
7. calcular fp e nfp, de acordo com a relação (1) acima; e
8. realizar os passos 4-7 acima, quando p=p+l.
As Figuras 4a e 4b são diagramas que ilustram o processo proposto.
A Figura 4a ilustra um exemplo, no qual o número de posições num quadro é N = 24, o número de fases é F=4 e o número de posições de fase é Np= 6.
É assumido que não são ocupadas fases no arranque p-1, e é /
851
LM 4817/01489
-9também assumido que as fases de calculo 1-4 atrás dão a posição mj-5. Esta posição de impulso é marcada com um circulo na Figura 4a. Isto dá a fase 1, nas respectivas posições de fase np = = 0,1,2,3,4 e 5 e as posições de impulso correspondentes são n - 1,5,9,13,17 e 21, de acordo coro a relação (1) atrás. A fase 1, e as posições de impulso correspondentes, são então ocupadas quando se calcula a posição do impulso de excitação seguinte (p=2). É assumido que a fase de cálculo 4 para p = 2 resulta em m2~7. Possivelmente m2~9 pode ter dado o valor máximo de a£/0ij, embora isto dê uma fase ocupada. A posição de impulso m2 = 7 dá fase 3 em cada das posições de fase nf-0, ... 5, e significa que as posições de impulso n=3,7,ll,15 e 22 serão ocupadas. As posições 1,3,5,7,9,11,13,15,17,19,21 e 23 são assim ocupadas antes do início da fase de cálculo seguinte (p=3).
É assumido que as fases de cálculo 1-4 atrás referidas, para p=3, darão mg=12, e que para p=4 as fases de cálculo resultam na última posição 1114 = 22. Todas as posições no quadro são aqui ocupadas. A Figura 4a ilustra os impulsos de excitação (Ami,mi), (Am, m2) etc., obtidos.
A Figura 4b ilustra um exemplo adicional, no qual N=25, F=5 e Np=5, isto é, o número de fases, dentro de cada posição de fase, foi aumentado de um. O posicionamento de impulso é efectuado da mesma maneira que o de acordo com a Figura 4a, e finalmente são obtidos cinco impulsos de excitação. O número máximo de impulsos de excitação obtido é assim igual ao número de fases dentro de uma posição de fase.
As fases obtidas fj, ···, fp (p = 4 na Figura 4a e p = 5 na Figura 4b) são codificadas juntas e as posições de fase resultantes npj , . .., nfp» são, cada uma, codificadas per se antes da transmissão. Pode ser empregue a codificação combinatória para codificar as fases. Cada uma das posições de fase é codificada com uma palavra código per se .
De acordo com uma realização, o circuito processador de fala conhecido, pode ser modificado da maneira ilustrada na Figura 5, a qual ilustra a parte do processador de fala que inclui os
851
LM 4817/01489
-10c.ircuitos geradores de sinal de excitação 120.
Cada dos sinais residuais preditivo d^ e o gerador de excitação 127, são aplicados a um respectivo filtro 121 e 123 no tempo com um sinal de quadro FC, através das portas 122, 124. Os filtros 121, 123 produzem os sinais yn e yn que são correlacionados no gerador de correlação 125. 0 sinal yn representa o
A verdadeiro sinal de fala, visto que yn representa o sinal de fala sintetizado. É obtido, do gerador de correlação 125, um sinal Cfq o qual inclui os componentes a4 e de acordo com o atrás referido. É feito um cálculo, no gerador de excitação, da posição de impulso uip, que dão o máximo af/^ij, em que a amplitude Amp, de acordo com o referido atrás, é obtida adicionalmente com a posição de impulso n>p.
Os parâmetros de impulso de excitação mp, Amp, produzidos pelo gerador de excitação 127, são enviados a um gerador de fase 129. Este gerador calcula as fases de corrente fp e as posições de fase nfp dos valores mp, Amp, chegando do gerador de excitação 127, de acordo com a relação f = (m - 1) MOD F + 1 nf = (m - 1) DIV F + 1 onde F = ao número de fases possíveis.
O gerador de fase 129 pode consistir num processador o qual inclui uma memória de leitura eficaz para armazenar instruções para calcular as fases e as posições de fase de acordo com a relação atrás referida.
A fase e a posição de fase são então fornecidas ao codificador 131. Este codificador tem do mesmo princípio de construção que o codificador conhecido, mas é eficaz para codificar fase e posição de fase, em vez das posições de impulso mr
No lado do receptor, as fases e posições de fase sao descodificadas e o descodificador calcula depois a posição de impulso mp, de acordo com a relação mp=(nfp - 1) ’ F+ fp a qual dá uma determinação clara da posição do impulso de /”
851
LM 4817/01489
-11excitação.
A fase fp é também fornecida ao gerador de correlação 125 e ao gerador de excitação 127. 0 gerador de correlação armazena esta fase e toma em conta que esta fase fp está ocupada. Nenhuns valores do sinal C-[q são calculados, onde q está incluído, nas posições que pertencem a todos os fp precedentes, calculados para uma sequência analisada. As posições ocupadas são q = n’F + fp onde n = 0, . .., (Nf - 1) e fp significa todas as fases precedentes ocupadas dentro de um quadro. De modo semelhante, o gerador de excitação 127 toma em conta as fases ocupadas quando * faz uma comparação entre os sinais C^q e Cjq
Quando todas as posições de impulso, em relação a um quadro, forem calculadas e processadas, e quando o quadro seguinte se iniciar, todas as fases, é claro, estarão novamente vagas para o primeiro impulso do novo quadro.
A figura 6 ilustra um fluxograma que constitui o fluxograma ilustrado na Figura 3 da atrás referida especificação de patente dos Estados Unidos, o qual foi modificado para incluir a limitação de fase. Os blocos, que não são acompanhados por textos explicativos, são descritos em maior detalhe com referência à Figura 7. Introduzido entre os blocos 328 e 329, que respeitam ao cálculo do sinal de saída nip, Amp do gerador de fase 129 e recitação do índice de posição p, encontra-se um bloco 328a, o qual se refere aos cálculos a serem realizados no gerador de fase, e depois disso um bloco 328b, o qual se refere à aplicação de um sinal de saída no codificador 131 e nos geradores 125 e 127. fp e nfp são calculados de acordo com a relação acima (1). É então, realizada nos geradores 125 e 127 uma fixação do vector ufi = 1 *
a qual é usada quando se testa o valor q = q , o qual dá o valor máximo am/0mro coro a intenção de confirmar se uma posição de impulso correspondente dá uma fase, a qual está ocupada ou vaga. Este teste é realizado nos blocos 308a, 308b, 308c (entre os /
851
LM 4817/01489
-12blocos 307 e 309) e nos blocos 318a, 318b (entre os blocos 317,
319). As instruções dadas pelos blocos 308a, b e c são realizadas no gerador de correlação 125, visto que as instruções dadas pelos blocos 318a, b são realizadas no gerador de excitação 127.
Primeiramente, o sinal f, isto é, a fase é calculado do índice q, de acordo com o atrás referido, após o que é realizado um teste para confirmar se a posição do vector, para a fase f no vector nf, é igual a 1. Se Uf =1, o que implica que a fase está *
ocupada para precisamente este índice q , não são realizados cálculos de correlação de acordo com a instrução do bloco 309 e de modo semelhante as comparações no bloco 319. Por outro lado, quando Uf = 0, isto indica uma fase vaga e os cálculos subsequentes são realizados como anteriormente.
As fases ocupadas permanecerão durante todas as sequências calculadas em relação a um intervalo de quadro completo, mas estarão vagas no início de um novo intervalo de quadro. Por consequência, a seguir ao bloco 307, o vector Uj é ajustado para zero antes de cada nova análise de quadro.
Quando se codifica as posições nip, para os vários impulsos de excitação, dentro de um quadro, ambas a posição de fase nfp e a fase fp deveriam ser codificadas. A codificação das posições é assim dividida em duas palavras código separadas, tendo significado mutuamente diferente. Neste caso, os bits nas palavras código obtêm o significado mutuamente diferente, e por consequência a sensibilidade a erros de bit também será diferente. Esta dissimi1itude é vantajosa com vista à codificação de canal de correcção de erro ou detecção de erro.
A limitação, anteriormente descrita, no posicionamento dos impulsos de excitação, significa que a codificação das posições de impulso tem lugar numa relação de bit mais baixa do que, quando se codificam as posições em mui ti-impulsos, sem a dita limitação. Isto também significa que o algoritmo de exploração será menos complexo do que sem esta limitação. Por consenso, o processo do invento envolve certas limitações quando se posicionam os impulsos. Uma posição de impulso precisa não é
851
LM 4817/01489
-1 3sempre possível, contudo, por exemplo de acordo com a Figura 4b. Esta limitação, contudo, será ponderada em relação às vantagens atrás referidas.
O processo do invento foi descrito no atrás mencionado, com referência a um codificador de fala, no qual o posicionamento dos impulsos de excitação é realizado num impulso de cada vez, até estar preenchido um intervalo de quadro. Outro tipo de codificador de fala, descrito na EP-A-195487 funciona com o posicionamento de um modelo de impulso, no qual o intervalo de tempo ta entre os impulsos é constante, em vez de um impulso único. 0 processo do invento pode também ser aplicado a um codificador de fala deste tipo. As posições proibidas num quadro (comparar por exemplo as Figuras 4a, 4b referidas atrás) coincidem logo com as posições dos impulsos num modelo de impulso.

Claims (4)

  1. REIVINDICAÇÕES
    1 - Processo para posicionar impulsos de excitação para um codificador preditivo linear (LPC) o qual funciona de acordo com o princípio multi-impulso, em que um sinal sintetizado é formado a partir de um dado sinal de fala, por intermédio
    a) da formação de um certo número de parâmetros preditivos (a^ ) dentro de um dado intervalo de quadro, o qual constitui uma secção de temporização do sinal de fala dado;
    b) da formação de um sinal residual () o qual dá o erro entre o dado sinal de fala e o sinal sintetizado dentro do intervalo de quadro, e com a finalidade de determinar uma rede (p) de impulsos de excitação dentro do intervalo de quadro;
    c) da ponderação do dito sinal residual (djç) com os ditos parâmetros preditivos (ak) modo a formar um sinal representativo de fala ponderado (y) , e
    d) da ponderação de um sinal, o qual representa a amplitude {Aj ) e a posição de tempo (mj) dos impulsos de excitação no quadro, com os ditos parâmetros preditivos (a^), de modo a formarem um sinal de fala sintetizado ponderado (y); e através
    e) da correlação do sinal de fala representativo (y) com o sinal de fala sintetizado (y) de modo a obter uma expressão (Cjq) para o erro entre os ditos sinais, e depois
    f) determinar um valor extremado da dita expressão (Cjq) de modo a obter uma dada amplitude (Amp) e uma dada posição de temporização (mfp) de um dos ditos impulsos de excitação, durante um dado número de fases (p), sendo o dito sinal de linguagem sintetizado e ponderado, de acordo com o passo d), formado através da subtracção da contribuição dos passos precedentes (ρ-1 ) , caracterizado por se dividir o número de posições de temporização possiveis n (0<n<N) para os impulsos de excitação dentro de um quadro, num número np de posições de fase (0<np<Np) das quais cada posição de fase inclui um número de fases f (0<f<F), de modo que n = np.F + f, onde F = ao número
    70 851
    LM 4817/01489
    -15total de fase numa posição de fase; e por, no início do dito processo de posicionamento e quando se determinam a amplitude (Ami) e posição (mj) do primeiro impulso de excitação dentro do quadro, todas as n posições, dentro do quadro, estarem vagas para posicionamento, de acordo com os ditos passos d)-f), enquanto que em relação ao posicionamento subsequente dos ditos impulsos de excitação, a fase f determinada para o primeiro impulso de excitação é negada para o impulso de excitação (Am2, mg) calculado subsequentemente, e em todas as restantes posições de fase np, e quando se determinam a amplitude e posição dos impulsos de excitação subsequentes, de acordo com os ditos passos d)-f), as fases para impulsos de excitação anteriores, em todas as posições de fase, serem ocupadas e não coincidirem com as fases dos impulsos de excitação subsequentes; e por as posições de fase np assim obtidas serem cada uma delas codificadas separadamente para formarem palavras de código separadas, enquanto que as fases obtidas f são codificadas junto para formarem uma única palavra código antes da transmissão através de um meio de transmissão.
  2. 2 - Processo de acordo com a reivindicação 1, caracterizado por se calcularem a amplitude (Amp) e posição (nip) de um dado impulso de excitação e subsequentemente para este fim se calcularem as fases associadas fp e posição de fase npp, de acordo com as relações nfp ~ (mp “ 1)) Mod F + 1 fp = (mP ~ 1) Div F + 1 em que apenas o valor da fase fp determina qual a posição (mp+^) do impulso seguindo o dito impulso de excitação, que será proibida, e em que este procedimento é repetido para todas as fases fp+i, fp42 ··· de impulsos de excitação calculados subsequentemente, até que o número desejado de impulsos de excitação tenha sido obtido dentro do quadro.
  3. 3 - Processo, acordo com as reivindicações 1-2, caracterizado por quando se calcula a fase da posição de impulso (q), calculada no passo de correlação e) de um número total (Q)
    70 851
    LM 4817/01489
    -16de posições possíveis ser atribuído uni vector teste (uf), o qual representa o estado, ocupado ou vago, das diferentes fases dentro do quadro; e por ser investigada uma fase calculada fj com a ajuda do vector teste para confirmar se esta fase está ocupada ou vaga, em que se a fase f está ocupada o passo de correlação está em contagem e continua a subir para a posição possível seguinte (q+1), enquanto que, se a fase estiver vaga, o passo e) é realizado e repetido para todas essas posições, e por quando se determina um valor extremado, de acordo com o passo f), ser realizado um novo cálculo da fase fj, para uma dada posição de impulso (q), após o que é efectuada uma investigação, com a ajuda do dito vector teste (uf) em que se a fase está vaga, o passo f) é omitido e é efectuada a contagem a subir, para a posição de impulso seguinte (q+1), e se a fase está ocupada, o dito passo f) é realizado para se calcular um novo valor (q) da posição de impulso, o qual dá o valor máximo da correlação (am/ /0mm ) > que a nova posição (q + 1) assim calculada obtém uma fase a qual constitui uma fase vaga no vector fase (uf).
  4. 4 - Processo de acordo com a reivindicação 1, caracterizado por a posição de impulso de excitação, durante os ditos passos, ser incluída num modelo regular de impulsos de excitação, cada um dos quais tem a mesma amplitude (Afflp ) e uma mutuamente semelhante distância de temporização (ta) dentro do quadro.
PT93999A 1989-05-11 1990-05-10 Processo posicionamento de impulsos de excitacao num codificador preditivo linear de fala PT93999B (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE8901697A SE463691B (sv) 1989-05-11 1990-03-09 Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
SG163394A SG163394G (en) 1989-05-11 1994-11-14 Excitation pulse prositioning method in a linear predictive speech coder

Publications (2)

Publication Number Publication Date
PT93999A PT93999A (pt) 1991-01-08
PT93999B true PT93999B (pt) 1996-08-30

Family

ID=26660505

Family Applications (1)

Application Number Title Priority Date Filing Date
PT93999A PT93999B (pt) 1989-05-11 1990-05-10 Processo posicionamento de impulsos de excitacao num codificador preditivo linear de fala

Country Status (22)

Country Link
US (1) US5193140A (pt)
EP (1) EP0397628B1 (pt)
JP (1) JP3054438B2 (pt)
CN (1) CN1020975C (pt)
AT (1) ATE111625T1 (pt)
AU (1) AU629637B2 (pt)
BR (1) BR9006761A (pt)
CA (1) CA2032520C (pt)
DE (1) DE69012419T2 (pt)
DK (1) DK0397628T3 (pt)
ES (1) ES2060132T3 (pt)
FI (1) FI101753B1 (pt)
HK (1) HK147594A (pt)
IE (1) IE66681B1 (pt)
NO (1) NO302205B1 (pt)
NZ (1) NZ233100A (pt)
PH (1) PH27161A (pt)
PT (1) PT93999B (pt)
SE (1) SE463691B (pt)
SG (1) SG163394G (pt)
TR (1) TR24559A (pt)
WO (1) WO1990013891A1 (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
DE69434514T2 (de) * 1993-12-24 2006-06-22 Seiko Epson Corp. Tintenstrahlaufzeichnungskopf
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
DE4446558A1 (de) * 1994-12-24 1996-06-27 Philips Patentverwaltung Digitales Übertragungssystem mit verbessertem Decoder im Empfänger
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
DE19641619C1 (de) * 1996-10-09 1997-06-26 Nokia Mobile Phones Ltd Verfahren zur Synthese eines Rahmens eines Sprachsignals
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
JPH10303252A (ja) * 1997-04-28 1998-11-13 Nec Kansai Ltd 半導体装置
CA2254620A1 (en) * 1998-01-13 1999-07-13 Lucent Technologies Inc. Vocoder with efficient, fault tolerant excitation vector encoding
JP3199020B2 (ja) 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
JP4460165B2 (ja) * 1998-09-11 2010-05-12 モトローラ・インコーポレイテッド 情報信号を符号化する方法および装置
US6539349B1 (en) * 2000-02-15 2003-03-25 Lucent Technologies Inc. Constraining pulse positions in CELP vocoding
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US12254895B2 (en) 2021-07-02 2025-03-18 Digital Voice Systems, Inc. Detecting and compensating for the presence of a speaker mask in a speech signal
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
CA1255802A (en) * 1984-07-05 1989-06-13 Kazunori Ozawa Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
GB8621932D0 (en) * 1986-09-11 1986-10-15 British Telecomm Speech coding

Also Published As

Publication number Publication date
SE8901697D0 (sv) 1989-05-11
CA2032520A1 (en) 1990-11-12
IE66681B1 (en) 1996-01-24
NZ233100A (en) 1992-04-28
TR24559A (tr) 1992-01-01
US5193140A (en) 1993-03-09
NO905471D0 (no) 1990-12-19
SE8901697L (sv) 1990-11-12
NO905471L (no) 1990-12-19
CN1047157A (zh) 1990-11-21
ES2060132T3 (es) 1994-11-16
IE901467L (en) 1990-11-11
EP0397628A1 (en) 1990-11-14
AU5549090A (en) 1990-11-29
SG163394G (en) 1995-04-28
FI101753B (sv) 1998-08-14
SE463691B (sv) 1991-01-07
JPH03506079A (ja) 1991-12-26
BR9006761A (pt) 1991-08-13
NO302205B1 (no) 1998-02-02
DK0397628T3 (da) 1995-01-16
WO1990013891A1 (en) 1990-11-15
JP3054438B2 (ja) 2000-06-19
CA2032520C (en) 1996-09-17
HK147594A (en) 1995-01-06
DE69012419D1 (de) 1994-10-20
EP0397628B1 (en) 1994-09-14
DE69012419T2 (de) 1995-02-16
ATE111625T1 (de) 1994-09-15
FI910021A0 (fi) 1991-01-02
FI101753B1 (fi) 1998-08-14
PH27161A (en) 1993-04-02
AU629637B2 (en) 1992-10-08
CN1020975C (zh) 1993-05-26
PT93999A (pt) 1991-01-08

Similar Documents

Publication Publication Date Title
PT93999B (pt) Processo posicionamento de impulsos de excitacao num codificador preditivo linear de fala
EP1281174B1 (en) Forward error correction in speech coding
US4561102A (en) Pitch detector for speech analysis
CA1181854A (en) Digital speech coder
JP2954588B2 (ja) 音声の符号化装置、復号装置及び符号化・復号システム
US4912764A (en) Digital speech coder with different excitation types
Sun et al. Impact of packet loss location on perceived speech quality
BRPI9913756B1 (pt) processos de codificação e decodificação, codificador, decodificador, processos de seleção de arquivo de código para codificação e decodificação e aparelhos de seleção de arquivo de código para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário
JPH0833753B2 (ja) 人の音声の符号化処理システム
BR112016030149B1 (pt) Processador de áudio e método para processamento de um sinal de áudio utilizando correção de fase horizontal
BRPI0311523B1 (pt) “Método e dispositivo de ocultação de apagamento de quadro causado por quadros de um sinal de som codificado apagados durante transmissão”
US4791670A (en) Method of and device for speech signal coding and decoding by vector quantization techniques
KR100713566B1 (ko) 씨이엘피 스피치 부호화를 위한 성형 고정 코드북 탐색 방법
US8200483B2 (en) Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof
US6064956A (en) Method to determine the excitation pulse positions within a speech frame
JP2002505450A (ja) ハイブリッド被刺激線形予測スピーチ符号化装置及び方法
Kroon et al. Experimental evaluation of different approaches to the multi-pulse coder
SA90110060B1 (ar) طريقة تنظيم نبضات الاستثارة excitation pulses في جهاز ترميز(كود)كلام تنبؤي خطي linear predictive (LPC) coder
KR19980035868A (ko) 음성데이터 부호화/복호화장치 및 그 방법

Legal Events

Date Code Title Description
FG3A Patent granted, date of granting

Effective date: 19960510

MM3A Annulment or lapse

Free format text: LAPSE DUE TO NON-PAYMENT OF FEES

Effective date: 20021130