RU2023124046A

RU2023124046A - Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов

Info

Publication number: RU2023124046A
Application number: RU2023124046A
Authority: RU
Inventors: Хейко ПУРНХАГЕН; Понтус КАРЛЬССОН; Кристофер КЬЁРЛИНГ
Original assignee: Долби Интернешнл Аб
Filing date: 2023-09-18
Publication date: 2025-03-18

Claims

1. Способ кодирования стереофонического входного сигнала, содержащего левый канал и правый канал и имеющего перцепционную стереофоническую картину, причем способ включает:

выбор или режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT), или режима кодирования с линейным предсказанием в качестве выбранного режима кодирования;

кодирование стереофонического входного сигнала с использованием только выбранного режима кодирования для получения кодированного выходного сигнала; и

генерирование сигнала битового потока, содержащего кодированный выходной сигнал,

при этом, если выбирают режим кодирования с линейным предсказанием, кодирование включает:

понижающее микширование стереофонического входного сигнала в монофонический сигнал, причем монофонический сигнал представляет собой сумму левого канала и правого канала,

оценивание параметров стереофонической картины для реконструкции стереофонического сигнала, который аппроксимирует перцепционную стереофоническую картину стереофонического входного сигнала, из монофонического сигнала,

генерирование остаточного сигнала, который указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и оцененными параметрами стереофонической картины,

кодирование монофонического сигнала с использованием кодирования с линейным предсказанием для получения кодированного монофонического сигнала и

вывод кодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины в качестве кодированного выходного сигнала,

при этом, если выбирают режим кодирования с преобразованием на основе MDCT, кодирование включает:

анализ стереофонического входного сигнала посредством применения как кодирования среднего/побочного стереофонического сигнала, так и кодирования левого/правого стереофонического сигнала и выбора или режима кодирования среднего/побочного стереофонического сигнала, или режима кодирования левого/правого стереофонического сигнала на основе оцененной энтропии для каждого режима кодирования стереофонического сигнала,

кодирование стереофонического входного сигнала с использованием выбранного режима кодирования стереофонического сигнала в первом частотном диапазоне для получения кодированного стереофонического сигнала в первом частотном диапазоне,

понижающее микширование стереофонического входного сигнала в монофонический сигнал во втором частотном диапазоне,

кодирование монофонического сигнала во втором частотном диапазоне с использованием кодирования с преобразованием на основе MDCT для получения кодированного монофонического сигнала во втором частотном диапазоне и

вывод кодированного стереофонического сигнала в первом частотном диапазоне и кодированного монофонического сигнала во втором частотном диапазоне в качестве кодированного выходного сигнала.

2. Способ по п. 1, отличающийся тем, что анализ включает выбор того, какой режим кодирования стереофонического сигнала будет более эффективно кодировать стереофонический входной сигнал.

3. Способ по п. 1, отличающийся тем, что выбор или режима кодирования с преобразованием на основе MDCT, или режима с линейным предсказанием зависит от характеристик стереофонического входного сигнала.

4. Способ по п. 1, отличающийся тем, что оценивание включает оценивание параметров стереофонической картины во множестве частотных диапазонов.

5. Способ по п. 1, отличающийся тем, что ширину полосы первого частотного диапазона и ширину полосы второго частотного диапазона определяют на основе по меньшей мере частично требуемой целевой битовой скорости передачи данных.

6. Способ по п. 1, отличающийся тем, что режим кодирования с линейным предсказанием выбирают, когда стереофонический входной сигнал представляет собой речь.

7. Энергонезависимый машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по п. 1.

8. Устройство для кодирования стереофонического входного сигнала, содержащего левый канал и правый канал и имеющего перцепционную стереофоническую картину, для получения кодированного выходного сигнала, причем устройство содержит:

селектор режима для выбора или режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT), или режима кодирования с линейным предсказанием;

кодер с преобразованием на основе MDCT для кодирования стереофонического входного сигнала, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, но не если выбранный режим кодирования является режимом кодирования с линейным предсказанием;

кодер с линейным предсказанием для кодирования стереофонического входного сигнала, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, но не если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT; и

генератор битового потока для генерирования сигнала битового потока, содержащего кодированный выходной сигнал, при этом кодер с линейным предсказанием выполнен с возможностью:

понижающего микширования стереофонического входного сигнала в монофонический сигнал, причем монофонический сигнал представляет собой сумму левого канала и правого канала,

оценивания параметров стереофонической картины для реконструкции стереофонического сигнала, который аппроксимирует перцепционную стереофоническую картину стереофонического входного сигнала, из монофонического сигнала,

генерирования остаточного сигнала, который указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и оцененными параметрами стереофонической картины,

кодирования монофонического сигнала с использованием кодирования с линейным предсказанием для получения кодированного первого монофонического сигнала и

вывода кодированного монофонического сигнала, остаточного сигнала и оцененных параметров стереофонической картины в качестве кодированного выходного сигнала,

при этом кодер с преобразованием на основе MDCT выполнен с возможностью:

анализа стереофонического входного сигнала посредством применения как кодирования среднего/побочного стереофонического сигнала, так и кодирования левого/правого стереофонического сигнала и выбора или режима кодирования среднего/побочного стереофонического сигнала, или режима кодирования левого/правого стереофонического сигнала на основе оцененной энтропии для каждого режима кодирования стереофонического сигнала,

кодирования стереофонического входного сигнала с использованием выбранного режима кодирования стереофонического сигнала в первом частотном диапазоне для получения кодированного стереофонического сигнала в первом частотном диапазоне,

понижающего микширования стереофонического входного сигнала в монофонический сигнал во втором частотном диапазоне,

кодирования монофонического сигнала во втором частотном диапазоне с использованием кодирования с преобразованием на основе MDCT для получения кодированного монофонического сигнала во втором частотном диапазоне и

вывода кодированного стереофонического сигнала в первом частотном диапазоне и кодированного монофонического сигнала во втором частотном диапазоне в качестве кодированного выходного сигнала.

9. Способ декодирования сигнала битового потока для получения декодированного выходного сигнала, имеющего левый канал и правый канал, причем способ включает:

извлечение кодированного звукового сигнала из сигнала битового потока, причем кодированный звуковой сигнал сгенерирован посредством кодирования входного стереофонического звукового сигнала, имеющего левый входной канал и правый входной канал, с использованием выбранного режима кодирования, при этом выбранный режим кодирования является одним из режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT) или режима кодирования с линейным предсказанием;

декодирование кодированного звукового сигнала с использованием только выбранного режима кодирования для получения декодированного сигнала; и

вывод декодированного сигнала в качестве декодированного выходного сигнала,

при этом, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, декодирование включает:

прием кодированного монофонического сигнала, причем кодированный монофонический сигнал представляет собой сумму левого входного канала и правого входного канала входного стереофонического звукового сигнала,

декодирование кодированного монофонического сигнала с использованием декодирования с линейным предсказанием для получения декодированного монофонического сигнала,

извлечение параметров стереофонической картины и остаточного сигнала из сигнала битового потока для реконструкции стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, при этом остаточный сигнал указывает погрешность, связанную с отображением стереофонического звукового сигнала монофоническим сигналом и параметрами стереофонической картины,

реконструкцию стереофонического звукового сигнала с использованием декодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины для получения реконструированного стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, и

вывод реконструированного стереофонического звукового сигнала в качестве декодированного сигнала,

при этом, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, декодирование включает:

прием стереофонического сигнала в первом частотном диапазоне, причем стереофонический сигнал сгенерирован с использованием выбранного режима кодирования стереофонического сигнала, причем выбранный режим кодирования стереофонического сигнала включает или кодирование среднего/побочного стереофонического сигнала, или кодирование левого/правого стереофонического сигнала,

прием кодированного монофонического сигнала во втором частотном диапазоне,

декодирование стереофонического сигнала в первом частотном диапазоне с использованием выбранного режима кодирования стереофонического сигнала для получения декодированного стереофонического сигнала в первом частотном диапазоне,

декодирование кодированного монофонического сигнала во втором частотном диапазоне с использованием декодирования с преобразованием на основе MDCT для получения декодированного монофонического сигнала во втором частотном диапазоне и

генерирование декодированного сигнала из декодированного стереофонического сигнала в первом частотном диапазоне и декодированного монофонического сигнала во втором частотном диапазоне.

10. Способ по п. 9, отличающийся тем, что декодирование с преобразованием на основе MDCT также включает извлечение дополнительной информации из сигнала битового потока для реконструкции одного или более поддиапазонов, не подвергаемых кодированию.

11. Способ по п. 10, отличающийся тем, что дополнительная информация включает параметр, используемый для определения огибающей спектра одного или более поддиапазонов, не подвергаемых кодированию.

12. Способ по п. 9, отличающийся тем, что декодирование с преобразованием на основе MDCT включает перцепционное декодирование.

13. Способ по п. 9, отличающийся тем, что параметры стереофонической картины содержат параметры стереофонической картины для множества частотных диапазонов.

14. Способ по п. 9, отличающийся тем, что ширину полосы первого частотного диапазона и ширину полосы второго частотного диапазона определяют на основе по меньшей мере частично требуемой целевой битовой скорости передачи данных.

15. Энергонезависимый машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по п. 9.

16. Устройство для декодирования сигнала битового потока для получения декодированного выходного сигнала, имеющего левый канал и правый канал, причем устройство содержит:

демультиплексор для извлечения кодированного звукового сигнала из сигнала битового потока, причем кодированный звуковой сигнал сгенерирован посредством кодирования входного стереофонического звукового сигнала, имеющего левый входной канал и правый входной канал, с использованием выбранного режима кодирования, при этом выбранный режим кодирования является одним из режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT) или режима кодирования с линейным предсказанием;

декодер с преобразованием на основе MDCT для декодирования кодированного звукового сигнала, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, но не если выбранный режим кодирования является режимом кодирования с линейным предсказанием; и

декодер с линейным предсказанием для декодирования кодированного звукового сигнала, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, но не если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT,

при этом декодер с линейным предсказанием выполнен с возможностью:

приема кодированного монофонического сигнала, причем кодированный монофонический сигнал представляет собой сумму левого входного канала и правого входного канала входного стереофонического звукового сигнала,

декодирования кодированного монофонического сигнала с использованием декодирования с линейным предсказанием для получения декодированного монофонического сигнала,

извлечения параметров стереофонической картины и остаточного сигнала из сигнала битового потока для реконструкции стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, при этом остаточный сигнал указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и параметрами стереофонической картины,

реконструкции стереофонического звукового сигнала с использованием декодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины для получения реконструированного стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, и

вывода реконструированного стереофонического звукового сигнала в качестве декодированного выходного сигнала,

при этом декодер с преобразованием на основе MDCT выполнен с возможностью:

приема стереофонического сигнала в первом частотном диапазоне, причем стереофонический сигнал сгенерирован с использованием выбранного режима кодирования стереофонического сигнала, причем выбранный режим кодирования стереофонического сигнала включает или режим кодирования среднего/побочного стереофонического сигнала, или режим кодирования левого/правого стереофонического сигнала,

приема кодированного монофонического сигнала во втором частотном диапазоне,

декодирования стереофонического сигнала в первом частотном диапазоне с использованием выбранного режима кодирования стереофонического сигнала для получения декодированного стереофонического сигнала в первом частотном диапазоне,

декодирования кодированного монофонического сигнала во втором частотном диапазоне с использованием декодирования с преобразованием на основе MDCT для получения декодированного монофонического сигнала во втором частотном диапазоне и

генерирования декодированного выходного сигнала из декодированного стереофонического сигнала в первом частотном диапазоне и декодированного монофонического сигнала во втором частотном диапазоне.

17. Устройство по п. 16, отличающееся тем, что декодирование с преобразованием на основе MDCT также включает извлечение дополнительной информации из сигнала битового потока для реконструкции одного или более поддиапазонов, не подвергаемых кодированию.

18. Устройство по п. 17, отличающееся тем, что дополнительная информация включает параметр, используемый для определения огибающей спектра одного или более поддиапазонов, не подвергаемых кодированию.

19. Устройство по п. 16, отличающееся тем, что декодирование с преобразованием на основе MDCT включает перцепционное декодирование.

20. Устройство по п. 19, отличающееся тем, что параметры стереофонической картины содержат параметры для множества частотных диапазонов.