RU2023124046A - Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов - Google Patents
Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов Download PDFInfo
- Publication number
- RU2023124046A RU2023124046A RU2023124046A RU2023124046A RU2023124046A RU 2023124046 A RU2023124046 A RU 2023124046A RU 2023124046 A RU2023124046 A RU 2023124046A RU 2023124046 A RU2023124046 A RU 2023124046A RU 2023124046 A RU2023124046 A RU 2023124046A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- stereophonic
- stereo
- encoding
- frequency range
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims 26
- 238000000034 method Methods 0.000 title claims 17
- 230000009466 transformation Effects 0.000 claims 5
- 238000013507 mapping Methods 0.000 claims 4
- 230000003595 spectral effect Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
Claims (80)
1. Способ кодирования стереофонического входного сигнала, содержащего левый канал и правый канал и имеющего перцепционную стереофоническую картину, причем способ включает:
выбор или режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT), или режима кодирования с линейным предсказанием в качестве выбранного режима кодирования;
кодирование стереофонического входного сигнала с использованием только выбранного режима кодирования для получения кодированного выходного сигнала; и
генерирование сигнала битового потока, содержащего кодированный выходной сигнал,
при этом, если выбирают режим кодирования с линейным предсказанием, кодирование включает:
понижающее микширование стереофонического входного сигнала в монофонический сигнал, причем монофонический сигнал представляет собой сумму левого канала и правого канала,
оценивание параметров стереофонической картины для реконструкции стереофонического сигнала, который аппроксимирует перцепционную стереофоническую картину стереофонического входного сигнала, из монофонического сигнала,
генерирование остаточного сигнала, который указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и оцененными параметрами стереофонической картины,
кодирование монофонического сигнала с использованием кодирования с линейным предсказанием для получения кодированного монофонического сигнала и
вывод кодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины в качестве кодированного выходного сигнала,
при этом, если выбирают режим кодирования с преобразованием на основе MDCT, кодирование включает:
анализ стереофонического входного сигнала посредством применения как кодирования среднего/побочного стереофонического сигнала, так и кодирования левого/правого стереофонического сигнала и выбора или режима кодирования среднего/побочного стереофонического сигнала, или режима кодирования левого/правого стереофонического сигнала на основе оцененной энтропии для каждого режима кодирования стереофонического сигнала,
кодирование стереофонического входного сигнала с использованием выбранного режима кодирования стереофонического сигнала в первом частотном диапазоне для получения кодированного стереофонического сигнала в первом частотном диапазоне,
понижающее микширование стереофонического входного сигнала в монофонический сигнал во втором частотном диапазоне,
кодирование монофонического сигнала во втором частотном диапазоне с использованием кодирования с преобразованием на основе MDCT для получения кодированного монофонического сигнала во втором частотном диапазоне и
вывод кодированного стереофонического сигнала в первом частотном диапазоне и кодированного монофонического сигнала во втором частотном диапазоне в качестве кодированного выходного сигнала.
2. Способ по п. 1, отличающийся тем, что анализ включает выбор того, какой режим кодирования стереофонического сигнала будет более эффективно кодировать стереофонический входной сигнал.
3. Способ по п. 1, отличающийся тем, что выбор или режима кодирования с преобразованием на основе MDCT, или режима с линейным предсказанием зависит от характеристик стереофонического входного сигнала.
4. Способ по п. 1, отличающийся тем, что оценивание включает оценивание параметров стереофонической картины во множестве частотных диапазонов.
5. Способ по п. 1, отличающийся тем, что ширину полосы первого частотного диапазона и ширину полосы второго частотного диапазона определяют на основе по меньшей мере частично требуемой целевой битовой скорости передачи данных.
6. Способ по п. 1, отличающийся тем, что режим кодирования с линейным предсказанием выбирают, когда стереофонический входной сигнал представляет собой речь.
7. Энергонезависимый машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по п. 1.
8. Устройство для кодирования стереофонического входного сигнала, содержащего левый канал и правый канал и имеющего перцепционную стереофоническую картину, для получения кодированного выходного сигнала, причем устройство содержит:
селектор режима для выбора или режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT), или режима кодирования с линейным предсказанием;
кодер с преобразованием на основе MDCT для кодирования стереофонического входного сигнала, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, но не если выбранный режим кодирования является режимом кодирования с линейным предсказанием;
кодер с линейным предсказанием для кодирования стереофонического входного сигнала, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, но не если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT; и
генератор битового потока для генерирования сигнала битового потока, содержащего кодированный выходной сигнал, при этом кодер с линейным предсказанием выполнен с возможностью:
понижающего микширования стереофонического входного сигнала в монофонический сигнал, причем монофонический сигнал представляет собой сумму левого канала и правого канала,
оценивания параметров стереофонической картины для реконструкции стереофонического сигнала, который аппроксимирует перцепционную стереофоническую картину стереофонического входного сигнала, из монофонического сигнала,
генерирования остаточного сигнала, который указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и оцененными параметрами стереофонической картины,
кодирования монофонического сигнала с использованием кодирования с линейным предсказанием для получения кодированного первого монофонического сигнала и
вывода кодированного монофонического сигнала, остаточного сигнала и оцененных параметров стереофонической картины в качестве кодированного выходного сигнала,
при этом кодер с преобразованием на основе MDCT выполнен с возможностью:
анализа стереофонического входного сигнала посредством применения как кодирования среднего/побочного стереофонического сигнала, так и кодирования левого/правого стереофонического сигнала и выбора или режима кодирования среднего/побочного стереофонического сигнала, или режима кодирования левого/правого стереофонического сигнала на основе оцененной энтропии для каждого режима кодирования стереофонического сигнала,
кодирования стереофонического входного сигнала с использованием выбранного режима кодирования стереофонического сигнала в первом частотном диапазоне для получения кодированного стереофонического сигнала в первом частотном диапазоне,
понижающего микширования стереофонического входного сигнала в монофонический сигнал во втором частотном диапазоне,
кодирования монофонического сигнала во втором частотном диапазоне с использованием кодирования с преобразованием на основе MDCT для получения кодированного монофонического сигнала во втором частотном диапазоне и
вывода кодированного стереофонического сигнала в первом частотном диапазоне и кодированного монофонического сигнала во втором частотном диапазоне в качестве кодированного выходного сигнала.
9. Способ декодирования сигнала битового потока для получения декодированного выходного сигнала, имеющего левый канал и правый канал, причем способ включает:
извлечение кодированного звукового сигнала из сигнала битового потока, причем кодированный звуковой сигнал сгенерирован посредством кодирования входного стереофонического звукового сигнала, имеющего левый входной канал и правый входной канал, с использованием выбранного режима кодирования, при этом выбранный режим кодирования является одним из режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT) или режима кодирования с линейным предсказанием;
декодирование кодированного звукового сигнала с использованием только выбранного режима кодирования для получения декодированного сигнала; и
вывод декодированного сигнала в качестве декодированного выходного сигнала,
при этом, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, декодирование включает:
прием кодированного монофонического сигнала, причем кодированный монофонический сигнал представляет собой сумму левого входного канала и правого входного канала входного стереофонического звукового сигнала,
декодирование кодированного монофонического сигнала с использованием декодирования с линейным предсказанием для получения декодированного монофонического сигнала,
извлечение параметров стереофонической картины и остаточного сигнала из сигнала битового потока для реконструкции стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, при этом остаточный сигнал указывает погрешность, связанную с отображением стереофонического звукового сигнала монофоническим сигналом и параметрами стереофонической картины,
реконструкцию стереофонического звукового сигнала с использованием декодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины для получения реконструированного стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, и
вывод реконструированного стереофонического звукового сигнала в качестве декодированного сигнала,
при этом, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, декодирование включает:
прием стереофонического сигнала в первом частотном диапазоне, причем стереофонический сигнал сгенерирован с использованием выбранного режима кодирования стереофонического сигнала, причем выбранный режим кодирования стереофонического сигнала включает или кодирование среднего/побочного стереофонического сигнала, или кодирование левого/правого стереофонического сигнала,
прием кодированного монофонического сигнала во втором частотном диапазоне,
декодирование стереофонического сигнала в первом частотном диапазоне с использованием выбранного режима кодирования стереофонического сигнала для получения декодированного стереофонического сигнала в первом частотном диапазоне,
декодирование кодированного монофонического сигнала во втором частотном диапазоне с использованием декодирования с преобразованием на основе MDCT для получения декодированного монофонического сигнала во втором частотном диапазоне и
генерирование декодированного сигнала из декодированного стереофонического сигнала в первом частотном диапазоне и декодированного монофонического сигнала во втором частотном диапазоне.
10. Способ по п. 9, отличающийся тем, что декодирование с преобразованием на основе MDCT также включает извлечение дополнительной информации из сигнала битового потока для реконструкции одного или более поддиапазонов, не подвергаемых кодированию.
11. Способ по п. 10, отличающийся тем, что дополнительная информация включает параметр, используемый для определения огибающей спектра одного или более поддиапазонов, не подвергаемых кодированию.
12. Способ по п. 9, отличающийся тем, что декодирование с преобразованием на основе MDCT включает перцепционное декодирование.
13. Способ по п. 9, отличающийся тем, что параметры стереофонической картины содержат параметры стереофонической картины для множества частотных диапазонов.
14. Способ по п. 9, отличающийся тем, что ширину полосы первого частотного диапазона и ширину полосы второго частотного диапазона определяют на основе по меньшей мере частично требуемой целевой битовой скорости передачи данных.
15. Энергонезависимый машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по п. 9.
16. Устройство для декодирования сигнала битового потока для получения декодированного выходного сигнала, имеющего левый канал и правый канал, причем устройство содержит:
демультиплексор для извлечения кодированного звукового сигнала из сигнала битового потока, причем кодированный звуковой сигнал сгенерирован посредством кодирования входного стереофонического звукового сигнала, имеющего левый входной канал и правый входной канал, с использованием выбранного режима кодирования, при этом выбранный режим кодирования является одним из режима кодирования с преобразованием на основе модифицированного дискретного косинусного преобразования (MDCT) или режима кодирования с линейным предсказанием;
декодер с преобразованием на основе MDCT для декодирования кодированного звукового сигнала, если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT, но не если выбранный режим кодирования является режимом кодирования с линейным предсказанием; и
декодер с линейным предсказанием для декодирования кодированного звукового сигнала, если выбранный режим кодирования является режимом кодирования с линейным предсказанием, но не если выбранный режим кодирования является режимом кодирования с преобразованием на основе MDCT,
при этом декодер с линейным предсказанием выполнен с возможностью:
приема кодированного монофонического сигнала, причем кодированный монофонический сигнал представляет собой сумму левого входного канала и правого входного канала входного стереофонического звукового сигнала,
декодирования кодированного монофонического сигнала с использованием декодирования с линейным предсказанием для получения декодированного монофонического сигнала,
извлечения параметров стереофонической картины и остаточного сигнала из сигнала битового потока для реконструкции стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, при этом остаточный сигнал указывает погрешность, связанную с отображением стереофонического сигнала монофоническим сигналом и параметрами стереофонической картины,
реконструкции стереофонического звукового сигнала с использованием декодированного монофонического сигнала, остаточного сигнала и параметров стереофонической картины для получения реконструированного стереофонического звукового сигнала, который аппроксимирует перцепционную стереофоническую картину входного стереофонического звукового сигнала, и
вывода реконструированного стереофонического звукового сигнала в качестве декодированного выходного сигнала,
при этом декодер с преобразованием на основе MDCT выполнен с возможностью:
приема стереофонического сигнала в первом частотном диапазоне, причем стереофонический сигнал сгенерирован с использованием выбранного режима кодирования стереофонического сигнала, причем выбранный режим кодирования стереофонического сигнала включает или режим кодирования среднего/побочного стереофонического сигнала, или режим кодирования левого/правого стереофонического сигнала,
приема кодированного монофонического сигнала во втором частотном диапазоне,
декодирования стереофонического сигнала в первом частотном диапазоне с использованием выбранного режима кодирования стереофонического сигнала для получения декодированного стереофонического сигнала в первом частотном диапазоне,
декодирования кодированного монофонического сигнала во втором частотном диапазоне с использованием декодирования с преобразованием на основе MDCT для получения декодированного монофонического сигнала во втором частотном диапазоне и
генерирования декодированного выходного сигнала из декодированного стереофонического сигнала в первом частотном диапазоне и декодированного монофонического сигнала во втором частотном диапазоне.
17. Устройство по п. 16, отличающееся тем, что декодирование с преобразованием на основе MDCT также включает извлечение дополнительной информации из сигнала битового потока для реконструкции одного или более поддиапазонов, не подвергаемых кодированию.
18. Устройство по п. 17, отличающееся тем, что дополнительная информация включает параметр, используемый для определения огибающей спектра одного или более поддиапазонов, не подвергаемых кодированию.
19. Устройство по п. 16, отличающееся тем, что декодирование с преобразованием на основе MDCT включает перцепционное декодирование.
20. Устройство по п. 19, отличающееся тем, что параметры стереофонической картины содержат параметры для множества частотных диапазонов.
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2023117249A Division RU2804032C1 (ru) | 2009-03-17 | 2023-06-29 | Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2023124046A true RU2023124046A (ru) | 2025-03-18 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9741354B2 (en) | Bitstream syntax for multi-process audio decoding | |
US8046214B2 (en) | Low complexity decoder for complex transform coding of multi-channel sound | |
JP4950210B2 (ja) | オーディオ圧縮 | |
CN103052983B (zh) | 音频或视频编码器、音频或视频解码器及编码和解码方法 | |
KR101135726B1 (ko) | 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 | |
CN105702258B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
KR101372476B1 (ko) | 주 성분 분석을 바탕으로 다중채널 오디오 신호의 등급별 디코딩 장치 및 방법 | |
KR101271069B1 (ko) | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 | |
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
US7774205B2 (en) | Coding of sparse digital media spectral data | |
CN1822508B (zh) | 对数字信号进行编码和解码的方法和设备 | |
US20100014679A1 (en) | Multi-channel encoding and decoding method and apparatus | |
CN103329197A (zh) | 用于反相声道的改进的立体声参数编码/解码 | |
US10783892B2 (en) | Audio encoding apparatus and method, and audio decoding apparatus and method | |
WO2009048239A2 (en) | Encoding and decoding method using variable subband analysis and apparatus thereof | |
US20110137661A1 (en) | Quantizing device, encoding device, quantizing method, and encoding method | |
JP2019506633A (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
EP2690622B1 (en) | Audio decoding device and audio decoding method | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
RU2023124046A (ru) | Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов | |
HK1239938A1 (en) | Method and apparatus for coding or decoding subband configuration data for subband groups |