RU2013142079A

RU2013142079A - Генерирование шума в аудиокодеках

Info

Publication number: RU2013142079A
Application number: RU2013142079/08A
Authority: RU
Inventors: Панджи СЕТИАВАН; Штефан ВИЛЬДЕ; Антони ЛОМБАР; Мартин ДИТЦ
Original assignee: Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date: 2011-02-14
Filing date: 2012-02-14
Publication date: 2015-03-27
Also published as: JP2014510307A; JP6643285B2; AU2012217162A1; MX2013009305A; TWI480856B; KR20130126711A; CN103477386A; CA2968699C; US8825496B2; JP2016026319A; EP3373296B1; RU2585999C2; MY167776A; JP2017223968A; WO2012110482A2; ZA201306874B; EP2676262B1; KR101624019B1; JP5934259B2; CA2827305C

Abstract

1. Аудиокодер, содержащий:- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,- при этом:- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оц�

Claims

1. Аудиокодер, содержащий:

- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;

- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и

- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,

- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,

- при этом:

- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или

- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.

2. Аудиокодер по п. 1, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.

3. Аудиокодер по п. 1 или 2, в котором модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в спектральном представлении сигнала возбуждения и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.

4. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала.

5. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и выбирать между использованием параметрического кодирования для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала, или оставлением части верхних частот входного аудиосигнала некодированной.

6. Аудиокодер по п. 4, в котором кодер выполнен с возможностью прерывать прогнозирующее кодирование и/или кодирование с преобразованием и параметрическое кодирование в неактивных фазах или прерывать прогнозирующее кодирование и/или кодирование с преобразованием и выполнять параметрическое кодирование спектральной огибающей части верхних частот представления в форме спектрального разложения входного аудиосигнала при более низком частотно-временном разрешении по сравнению с использованием параметрического кодирования в активной фазе.

7. Аудиокодер по п. 4, в котором кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот.

8. Аудиокодер, содержащий:

- при этом кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,

- при этом кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и

- при этом модуль оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.

9. Аудиокодер по п. 8, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в частях нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала и выполнять статистический анализ частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала в локальных минимумах для того, чтобы извлекать параметрическую оценку фонового шума.

10. Аудиокодер по п. 1, в котором модуль оценки шума выполнен с возможностью продолжать непрерывное обновление оценки фонового шума в течение неактивной фазы, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума, непрерывно обновляемой в течение неактивной фазы.

11. Аудиокодер по п. 10, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума в фиксированном или переменном интервале времени.

12. Аудиодекодер для декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, причем аудиодекодер содержит:

- модуль (90) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;

- декодер (92), выполненный с возможностью восстанавливать аудиосигнал из потока данных в течение активной фазы;

- параметрический генератор (94) случайных чисел; и

- генератор (96) фонового шума, выполненный с возможностью восстанавливать аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,

- при этом модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.

13. Аудиодекодер по п. 12, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе и с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.

14. Аудиодекодер по п. 12, в котором декодер выполнен с возможностью, при восстановлении аудиосигнала из потока данных, применять формирование спектрального разложения сигнала возбуждения, кодированного с преобразованием в поток данных согласно коэффициентам линейного прогнозирования, также кодированным в данные, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума, посредством идентификации локальных минимумов в спектральном представлении сигнала возбуждения и оценки спектральной огибающей фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в спектральном представлении сигнала возбуждения в качестве опорных точек.

15. Способ кодирования аудио, содержащий этапы, на которых:

- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;

- кодируют входной аудиосигнал в поток данных в течение активной фазы; и

- обнаруживают вход в неактивную фазу после активной фазы на основе входного сигнала, и

- кодируют в поток данных параметрическую оценку фонового шума в неактивной фазе,

- при этом:

- определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или

- кодирование входного аудиосигнала содержит этап, на котором прогнозирующим образом кодируют входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодируют с преобразованием спектральное разложение сигнала возбуждения и кодируют коэффициенты линейного прогнозирования в поток данных, при этом определение параметрической оценки фонового шума содержит этап, на котором используют спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.

16. Способ кодирования аудио, содержащий этапы, на которых:

- при этом кодирование входного аудиосигнала содержит этап, на котором используют прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и используют параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,

- при этом используют гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и

- при этом определение параметрической оценки фонового шума содержит этап, на котором обновляют параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.

17. Способ декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, при этом способ содержит этапы, на которых:

- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;

- восстанавливают аудиосигнал из потока данных в течение активной фазы;

- восстанавливают аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,

- при этом определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.

18. Компьютерная программа, содержащая программный код для осуществления, при выполнении на компьютере, способа по п. 15.