RU2389155C2 - Elimination of time delays on signal processing channels - Google Patents
Elimination of time delays on signal processing channels Download PDFInfo
- Publication number
- RU2389155C2 RU2389155C2 RU2008120661/09A RU2008120661A RU2389155C2 RU 2389155 C2 RU2389155 C2 RU 2389155C2 RU 2008120661/09 A RU2008120661/09 A RU 2008120661/09A RU 2008120661 A RU2008120661 A RU 2008120661A RU 2389155 C2 RU2389155 C2 RU 2389155C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- downmix signal
- downmix
- spatial information
- time
- Prior art date
Links
- 238000012545 processing Methods 0.000 title abstract description 55
- 230000001934 delay Effects 0.000 title abstract description 3
- 230000008030 elimination Effects 0.000 title 1
- 238000003379 elimination reaction Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 101
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000006243 chemical reaction Methods 0.000 claims description 48
- 230000003111 delayed effect Effects 0.000 claims description 24
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 238000005259 measurement Methods 0.000 description 116
- 238000010586 diagram Methods 0.000 description 9
- 238000003672 processing method Methods 0.000 description 7
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Description
Область техники, к которой относится изобретениеFIELD OF THE INVENTION
Раскрытые варианты осуществления относятся, в целом, к обработке сигнала.The disclosed embodiments relate generally to signal processing.
Уровень техникиState of the art
Многоканальное аудиокодирование (обычно именуемое пространственным аудиокодированием) заключает пространственное изображение многоканального аудиосигнала в компактный набор пространственных параметров, которые можно использовать для синтеза высококачественного многоканального представления из переданного низведенного сигнала (сигнала, полученного путем понижающего микширования).Multi-channel audio coding (commonly referred to as spatial audio coding) encapsulates the spatial image of a multi-channel audio signal in a compact set of spatial parameters that can be used to synthesize high-quality multi-channel representations from the transmitted downmix signal (signal obtained by downmixing).
В многоканальной аудиосистеме, поддерживающей несколько схем кодирования, низведенный сигнал может испытывать задержку по времени относительно других низведенных сигналов и/или соответствующих пространственных параметров вследствие обработки сигнала (например, преобразований из временного измерения в частотное).In a multi-channel audio system supporting several coding schemes, the downmix signal may experience a time delay with respect to other downmix signals and / or corresponding spatial parameters due to signal processing (for example, transformations from a time dimension to a frequency one).
Сущность изобретенияSUMMARY OF THE INVENTION
Цели настоящего изобретения можно добиться, обеспечив способ обработки аудиосигнала, содержащий этапы, на которых: принимают аудиосигнал, включающий в себя низведенный сигнал и пространственную информацию; преобразуют низведенный сигнал из первого измерения во второе измерение для обеспечения первого преобразованного низведенного сигнала; преобразуют первый преобразованный низведенный сигнал из второго измерения в третье измерение для обеспечения второго преобразованного низведенного сигнала; и объединяют второй преобразованный низведенный сигнал и пространственную информацию, в котором объединенная пространственная информация задержана на промежуток времени, который включает в себя истекшее время преобразования.The objectives of the present invention can be achieved by providing a method for processing an audio signal, comprising the steps of: receiving an audio signal including a downmix signal and spatial information; converting a downmix signal from a first measurement to a second dimension to provide a first converted downmix signal; converting the first converted downmix signal from the second dimension to the third dimension to provide a second converted downmix signal; and combining the second converted downmix signal and spatial information in which the combined spatial information is delayed by a period of time that includes the elapsed conversion time.
Краткое описание чертежейBrief Description of the Drawings
В прилагаемых чертежах, которые призваны обеспечивать лучшее понимание изобретения и составляют часть данной заявки, представлен(ы) вариант(ы) осуществления изобретения и, совместно с описанием, служат для пояснения принципов изобретения. На чертежах:In the accompanying drawings, which are intended to provide a better understanding of the invention and form part of this application, embodiment (s) of the invention are presented and, together with the description, serve to explain the principles of the invention. In the drawings:
фиг.1-3 - блок-схемы устройств декодирования аудиосигнала согласно вариантам осуществления настоящего изобретения, соответственно;1-3 are block diagrams of audio decoding devices according to embodiments of the present invention, respectively;
фиг.4 - блок-схема блока многоканального декодирования, показанного на фиг. 1, для пояснения способа обработки сигнала;FIG. 4 is a block diagram of a multi-channel decoding unit shown in FIG. 1, to explain a signal processing method;
фиг.5 - блок-схема блока многоканального декодирования, показанного на фиг.2, для пояснения способа обработки сигнала; и5 is a block diagram of a multi-channel decoding unit shown in FIG. 2, for explaining a signal processing method; and
фиг.6-10 - блок-схемы для пояснения способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.6-10 are flowcharts for explaining a method for decoding an audio signal according to another embodiment of the present invention.
Предпочтительные варианты осуществления изобретенияPreferred Embodiments
Обратимся к подробному описанию предпочтительных вариантов осуществления настоящего изобретения, примеры которых проиллюстрированы на прилагаемых чертежах. По возможности, одинаковые или сходные детали обозначены на чертежах одинаковыми позициями.Turning to the detailed description of preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings. If possible, the same or similar parts are indicated in the drawings by the same reference numbers.
Поскольку обработка сигнала для аудиосигнала возможна в нескольких измерениях и, в частности, во временном измерении, аудиосигнал подлежит соответствующей обработке с учетом выравнивания по времени.Since signal processing for an audio signal is possible in several dimensions, and in particular in a time dimension, the audio signal must be appropriately processed taking into account time alignment.
Таким образом, при обработке аудиосигнала можно преобразовывать измерение аудиосигнала. Преобразование измерения аудиосигнала может включать в себя преобразование T/F (временного/частотного) измерения и комплексное преобразование измерения. Преобразование T/F измерения включает в себя, по меньшей мере, одно из преобразования сигнала во временном измерении в сигнал в частотном измерении и преобразования сигнала в частотном измерении в сигнал во временном измерении. Комплексное преобразование измерения означает преобразование измерения согласно сложности операции обработки аудиосигнала. Кроме того, комплексное преобразование измерения включает в себя преобразование сигнала в действительном частотном измерении в сигнал в комплексном частотном измерении, сигнала в комплексном частотном измерении в сигнал в действительном частотном измерении и т.д. Если аудиосигнал обрабатывается без учета выравнивания по времени, качество звучания может ухудшаться. Для выравнивания может осуществляться обработка задержки. Обработка задержки может включать в себя, по меньшей мере, одну из задержки кодирования и задержки декодирования. Задержка кодирования означает, что сигнал задерживается на величину задержки, учитываемую при кодировании сигнала. Задержка декодирования означает задержку в реальном времени, вносимую при декодировании сигнала.Thus, when processing the audio signal, it is possible to convert the measurement of the audio signal. The measurement conversion of the audio signal may include a T / F (time / frequency) measurement conversion and a complex measurement conversion. The T / F conversion of the measurement includes at least one of converting the signal in the time dimension to a signal in the frequency dimension and converting the signal in the frequency dimension to a signal in the time dimension. Comprehensive measurement conversion means measuring conversion according to the complexity of the audio signal processing operation. In addition, the complex conversion of the measurement includes the conversion of the signal in the actual frequency measurement into a signal in the complex frequency measurement, the signal in the complex frequency measurement into a signal in the actual frequency measurement, etc. If the audio signal is processed without timing equalization, the sound quality may deteriorate. For alignment, delay processing may be performed. The delay processing may include at least one of a coding delay and a decoding delay. Encoding delay means that the signal is delayed by the amount of delay taken into account when encoding the signal. Decoding delay means the real-time delay introduced by decoding the signal.
'Входное измерение низведенного сигнала' означает измерение низведенного сигнала, поступающего на блок многоканального декодирования, который генерирует многоканальный аудиосигнал.“Input downmix measurement” means measuring a downmix signal to a multi-channel decoding unit that generates a multi-channel audio signal.
'Входное измерение остаточного сигнала' означает измерение остаточного сигнала, поступающего на блок многоканального декодирования.'Input measurement of the residual signal' means the measurement of the residual signal supplied to the multi-channel decoding unit.
'Данные временного ряда' означают данные, нуждающиеся в синхронизации по времени с многоканальным аудиосигналом или в выравнивании по времени. Некоторые примеры 'данных временного ряда' включает в себя данные движущихся изображений, неподвижных изображений, текста и т.д.'Time series data' means data that needs to be time synchronized with a multi-channel audio signal or time aligned. Some examples of 'time series data' includes data from moving images, still images, text, etc.
'Опережение' означает процесс продвижения сигнала на указанное время.'Lead' means the process of advancing a signal by a specified time.
'Отставание' означает процесс задерживания сигнала на указанное время.'Lag' means the process of delaying a signal for a specified time.
'Пространственная информация' означает информацию для синтеза многоканальных аудиосигналов. Пространственная информация может представлять собой пространственные параметры, включающие в себя, но без ограничения: CLD (разность уровней каналов), указывающую различие в энергии между двумя каналами, ICC (межканальную когерентность), указывающую корреляцию между двумя каналами), CPC (коэффициент прогнозирования канала), который представляет собой коэффициент прогнозирования, используемый при генерации трех каналов из двух каналов, и т.д.'Spatial information' means information for the synthesis of multi-channel audio signals. Spatial information can be spatial parameters, including, but not limited to: CLD (channel level difference), which indicates the difference in energy between the two channels, ICC (inter-channel coherence), which indicates the correlation between the two channels), CPC (channel prediction coefficient) , which is the prediction coefficient used when generating three channels from two channels, etc.
Описанное здесь декодирование аудиосигнала является одним примером обработки сигнала, которую можно осуществлять согласно настоящему изобретению. Настоящее изобретение применимо также к другим типам обработки сигнала (например, обработке видеосигнала). Описанные здесь варианты осуществления можно видоизменить так, чтобы они включали в себя любое количество сигналов, которые можно представить в измерении любого вида, в том числе, но без ограничения: времени, квадратурного зеркального фильтра (QMF), модифицированного дискретного косинусного преобразования (MDCT), сложности и т.д.The audio decoding described herein is one example of signal processing that can be performed according to the present invention. The present invention is also applicable to other types of signal processing (e.g., video signal processing). The embodiments described herein can be modified to include any number of signals that can be represented in any kind of measurement, including, but not limited to: time, quadrature mirror filter (QMF), modified discrete cosine transform (MDCT), difficulties etc.
Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения включает в себя генерацию многоканального аудиосигнала путем объединения низведенного сигнала и пространственной информации. Может существовать совокупность измерений для представления низведенного сигнала (например, временное измерение, QMF, MDCT). Поскольку преобразования между измерениями может вносить задержку по времени на тракте обработки низведенного сигнала, необходим этап компенсации разницы в синхронизации по времени между низведенным сигналом и пространственной информацией, соответствующей низведенному сигналу. Компенсация разницы в синхронизации по времени может включать в себя задерживание, по меньшей мере, одного из низведенного сигнала и пространственной информации. Несколько вариантов осуществления компенсации разницы в синхронизации по времени между двумя сигналами и/или между сигналами и параметрами описано ниже со ссылкой на прилагаемые чертежи.An audio signal processing method according to one embodiment of the present invention includes generating a multi-channel audio signal by combining a downmix signal and spatial information. A set of measurements may exist to represent the downmix signal (e.g., time measurement, QMF, MDCT). Since the conversion between measurements can introduce a time delay on the processing path of the downmix signal, a step is necessary to compensate for the difference in time synchronization between the downmix signal and spatial information corresponding to the downmix signal. Compensation for the difference in time synchronization may include delaying at least one of the downmix signal and spatial information. Several embodiments of compensating for differences in time synchronization between two signals and / or between signals and parameters are described below with reference to the accompanying drawings.
Любое упоминание здесь термина "устройство" не предусматривает ограничения описанного варианта осуществления аппаратной реализацией. Описанные здесь варианты осуществления можно реализовать посредством оборудования, программного обеспечения, программно-аппаратного обеспечения или любой их комбинации.Any reference to the term “device” here does not limit the described embodiment to a hardware implementation. The embodiments described herein may be implemented by hardware, software, firmware or any combination thereof.
Описанные здесь варианты осуществления можно реализовать в виде команд на компьютерно-считываемом носителе, которые при выполнении на процессоре (например, компьютерном процессоре) предписывают процессору осуществлять операции, которые обеспечивают различные аспекты настоящего описанного здесь изобретения. Термин "компьютерно-считываемый носитель" означает любой носитель, который участвует в обеспечении команд для выполнения процессором, в том числе, но без ограничения, энергонезависимые носители (например, оптические или магнитные диски), энергозависимые носители (например, память) и среды связи. Среды связи включает в себя, без ограничения, коаксиальные кабели, медные провода и оптические волокна. Среды связи также могут иметь вид акустических, световых или радиоволн.The embodiments described herein may be implemented as instructions on a computer-readable medium that, when executed on a processor (eg, a computer processor), instructs the processor to perform operations that provide various aspects of the present invention described herein. The term “computer-readable medium” means any medium that is involved in providing instructions for execution by a processor, including but not limited to non-volatile media (eg, optical or magnetic disks), volatile media (eg, memory), and communication media. Communication media includes, without limitation, coaxial cables, copper wires, and optical fibers. Communication media can also be in the form of acoustic, light or radio waves.
На фиг.1 показана схема устройства декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения.1 is a diagram of an audio decoding apparatus according to one embodiment of the present invention.
Согласно фиг.1, устройство декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения включает в себя блок 100 низводящего декодирования и блок 200 многоканального декодирования.1, an audio signal decoding apparatus according to one embodiment of the present invention includes a
Блок 100 низводящего декодирования включает в себя блок преобразования в другое измерение 110. В показанном примере, блок 100 низводящего декодирования передает низведенный сигнал XQ1, обработанный в измерении QMF, на блок 200 многоканального декодирования без дополнительной обработки. Блок 100 низводящего декодирования также передает низведенный сигнал во временном измерении XT1 на блок 200 многоканального декодирования, который генерируется путем преобразования низведенного сигнала XQ1 из измерения QMF во временное измерение с использованием блока 110 преобразования. Методы преобразования аудиосигнала из измерения QMF во временное измерение общеизвестны и включены в общедоступные стандарты обработки аудиосигнала (например, MPEG).The
Блок 200 многоканального декодирования генерирует многоканальный аудиосигнал XM1 с использованием низведенного сигнала XT1 или XQ1 и пространственной информации SI1 или SI2.The
На фиг.2 показана схема устройства декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.2 is a diagram of an audio decoding apparatus according to another embodiment of the present invention.
Согласно фиг.2, устройство декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения включает в себя блок 100a низводящего декодирования, блок 200a многоканального декодирования и блок 300a преобразования в другое измерение.2, an audio decoding apparatus according to another embodiment of the present invention includes a
Блок 100a низводящего декодирования включает в себя блок 110a преобразования в другое измерение. В показанном примере блок низводящего декодирования 100a выводит низведенный сигнал Xm, обработанный в измерении MDCT. Блок 100a низводящего декодирования также выводит низведенный сигнал XT2 во временном измерении, который генерируется путем преобразования Xm из измерения MDCT во временное измерение с использованием блока 110a преобразования.The
Низведенный сигнал XT2 во временном измерении передается на блок 200a многоканального декодирования. Низведенный сигнал Xm в измерении MDCT проходит через блок 300a преобразования в другое измерение, где он преобразуется в низведенный сигнал XQ2 в измерении QMF. Преобразованный низведенный сигнал XQ2 затем передается на блок 200a многоканального декодирования.The downmix signal XT2 in the time dimension is transmitted to the
Блок 200a многоканального декодирования генерирует многоканальный аудиосигнал XM2 с использованием переданного низведенного сигнала XT2 или XQ2 и пространственной информации SI3 или SI4.The
На фиг.3 показана схема устройства декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.3 is a diagram of an audio decoding apparatus according to another embodiment of the present invention.
Согласно фиг.3, устройство декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения включает в себя блок 100b низводящего декодирования, блок 200b многоканального декодирования, блок 400b остаточного декодирования и блок 500b преобразования в другое измерение.3, an audio decoding apparatus according to another embodiment of the present invention includes a
Блок 100b низводящего декодирования включает в себя блок 110b преобразования в другое измерение. Блок низводящего декодирования 100b передает низведенный сигнал XQ3, обработанный в измерении QMF, на блок 200b многоканального декодирования без дополнительной обработки. Блок 100b низводящего декодирования также передает низведенный сигнал XT3 на блок 200b многоканального декодирования, который генерируется путем преобразования низведенного сигнала XQ3 из измерения QMF во временное измерение с использованием блока 110b преобразования.The
В некоторых вариантах осуществления кодированный остаточный сигнал RB поступает в блок 400b остаточного декодирования и затем обрабатывается. В этом случае, обработанный остаточный сигнал RM является сигналом в измерении MDCT. Остаточный сигнал может представлять собой, например, сигнал ошибки прогнозирования, широко используемый в приложениях аудиокодирования (например, MPEG).In some embodiments, the encoded residual signal RB is supplied to the
Затем остаточный сигнал RM в измерении MDCT преобразуется в остаточный сигнал RQ в измерении QMF блоком 500b преобразования в другое измерение и затем передается на блок 200b многоканального декодирования.Then, the residual signal RM in the MDCT measurement is converted to the residual signal RQ in the QMF measurement by the conversion to another
Если измерение остаточного сигнала, обработанного и выведенного на блоке 400b остаточного декодирования, является входным измерением остаточного сигнала, обработанный остаточный сигнал может передаваться на блок 200b многоканального декодирования, не подвергаясь процессу преобразования в другое измерение.If the measurement of the residual signal processed and output to the
На фиг.3 показано, что в некоторых вариантах осуществления блок 500b преобразования в другое измерение преобразует остаточный сигнал RM в измерении MDCT в остаточный сигнал RQ в измерении QMF. В частности, блок 500b преобразования в другое измерение способен преобразовывать остаточный сигнал RM, выводимый из блока 400b остаточного декодирования, в остаточный сигнал RQ в измерении QMF.FIG. 3 shows that in some embodiments, the transform to
Как отмечено в вышеприведенном описании, может существовать совокупность измерений низведенного сигнала, что может приводить к разнице в синхронизации по времени между низведенным сигналом и пространственной информацией, которую, возможно, потребуется компенсировать. Ниже описаны различные варианты осуществления компенсации разницы в синхронизации по времени.As noted in the above description, there may be a plurality of measurements of the downmix signal, which can lead to a difference in time synchronization between the downmix signal and spatial information, which may need to be compensated. Various embodiments of compensating for differences in time synchronization are described below.
При обработке аудиосигнала согласно одному варианту осуществления настоящего изобретения генерируется многоканальный аудиосигнал путем декодирования кодированного аудиосигнала, включающего в себя низведенный сигнал и пространственную информацию.When processing an audio signal according to one embodiment of the present invention, a multi-channel audio signal is generated by decoding an encoded audio signal including a downmix signal and spatial information.
В ходе декодирования низведенный сигнал и пространственная информация подвергаются различным процессам, которые могут создавать разные задержки по времени.During decoding, the downmix signal and spatial information undergo various processes that can create different time delays.
В ходе кодирования низведенный сигнал и пространственная информация могут кодироваться с синхронизацией по времени.During the encoding, the downmix signal and spatial information can be time synchronized.
В таком случае низведенный сигнал и пространственную информацию можно синхронизировать по времени исходя из того, в каком измерении низведенный сигнал, обработанный на блоке 100, 100a или 100b низводящего декодирования, передается на блок 200, 200a или 200b многоканального декодирования.In this case, the downmix signal and spatial information can be synchronized in time based on the measurement in which the downmix signal processed at the
В некоторых вариантах осуществления в кодированный аудиосигнал может быть включен идентификатор низводящего кодирования для идентификации измерения, в котором установлена синхронизация по времени между низведенным сигналом и пространственной информацией. В таком случае идентификатор низводящего кодирования может указывать схему декодирования низведенного сигнала.In some embodiments, a downmix coding identifier may be included in the encoded audio signal to identify a measurement in which time synchronization is established between the downmix signal and spatial information. In this case, the downmix coding identifier may indicate a decoding scheme of the downmix signal.
Например, если идентификатор низводящего кодирования указывает схему декодирования «усовершенствованное аудиокодирование» (AAC), то кодированный аудиосигнал можно декодировать AAC-декодером.For example, if the downmix coding identifier indicates an Advanced Audio Coding (AAC) decoding scheme, then the encoded audio signal may be decoded by an AAC decoder.
В некоторых вариантах осуществления идентификатор низводящего кодирования также можно использовать для определения измерения, в котором установлена синхронизация по времени между низведенным сигналом и пространственной информацией.In some embodiments, the downmix coding identifier may also be used to determine a measurement in which time synchronization is established between the downmix signal and spatial information.
В способе обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения низведенный сигнал можно обрабатывать в измерении, отличном от измерения, в котором установлена синхронизация по времени, и затем передавать на блок 200, 200a или 200b многоканального декодирования. В этом случае блок 200, 200a или 200b декодирования компенсирует синхронизацию по времени между низведенным сигналом и пространственной информацией для генерации многоканального аудиосигнала.In the method for processing an audio signal according to one embodiment of the present invention, the downmix signal can be processed in a measurement other than a measurement in which time synchronization is set, and then transmitted to a
Способ компенсации разницы в синхронизации по времени между низведенным сигналом и пространственной информацией объяснен ниже со ссылкой на фиг.1 и фиг.4.A method of compensating for the difference in time synchronization between the downmix signal and spatial information is explained below with reference to FIG. 1 and FIG. 4.
На фиг.4 показана блок-схема блока 200 многоканального декодирования, показанного на фиг.1.FIG. 4 shows a block diagram of a
Согласно фиг.1 и фиг.4, в способе обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения, низведенный сигнал, обработанный на блоке 100 низводящего декодирования (фиг.1), может передаваться на блок 200 многоканального декодирования в одном из двух видов измерений. Согласно настоящему варианту осуществления предполагается, что низведенный сигнал и пространственная информация согласованы друг с другом посредством синхронизации по времени в измерении QMF. Возможны и другие измерения.According to FIG. 1 and FIG. 4, in an audio signal processing method according to one embodiment of the present invention, a downmix signal processed at the downmix decoding unit 100 (FIG. 1) can be transmitted to the
В примере, показанном на фиг.4, низведенный сигнал XQ1, обработанный в измерении QMF, передается на блок 200 многоканального декодирования для обработки сигнала.In the example shown in FIG. 4, the downmix signal XQ1 processed in the QMF measurement is transmitted to the
Переданный низведенный сигнал XQ1 объединяется с пространственной информацией SI1 на блоке 230 многоканальной генерации для генерации многоканального аудиосигнала XM1.The transmitted downmix signal XQ1 is combined with spatial information SI1 on the
В этом случае пространственная информация SI1 объединяется с низведенным сигналом XQ1 после задержки на время, соответствующее синхронизации по времени при кодировании. Задержка может представлять собой задержку кодирования. Поскольку пространственная информация SI1 и низведенный сигнал XQ1 синхронизированы по времени при кодировании, многоканальный аудиосигнал можно генерировать без особого процесса согласования синхронизации. Таким образом, в этом случае пространственная информация ST1 не испытывает задержку, равную задержке декодирования.In this case, the spatial information SI1 is combined with the downmix signal XQ1 after a time delay corresponding to time synchronization during encoding. The delay may be a coding delay. Since the spatial information SI1 and the downmix signal XQ1 are time synchronized during encoding, a multi-channel audio signal can be generated without a particular synchronization matching process. Thus, in this case, the spatial information ST1 does not experience a delay equal to the decoding delay.
Помимо XQ1, низведенный сигнал XT1, обработанный во временном измерении, передается на блок 200 многоканального декодирования для обработки сигнала. Согласно фиг.1, низведенный сигнал XQ1 в измерении QMF преобразуется в низведенный сигнал XT1 во временном измерении блоком 110 преобразования в другое измерение, и низведенный сигнал XT1 во временном измерении передается на блок 200 многоканального декодирования.In addition to XQ1, the downmix signal XT1 processed in the time dimension is transmitted to the
Согласно фиг.4, переданный низведенный сигнал XT1 преобразуется в низведенный сигнал XQ1 в измерении QMF блоком 210 преобразования в другое измерение.According to FIG. 4, the transmitted downmix signal XT1 is converted to the downmix signal XQ1 in the QMF measurement by the
При передаче низведенного сигнала XT1 во временном измерении на блок 200 многоканального декодирования, по меньшей мере, один из низведенного сигнала XQ1 и пространственной информации SI2 может передаваться на блок 230 многоканальной генерации по завершении компенсации задержки по времени.When transmitting the downmix signal XT1 in time measurement to the
Блок 230 многоканальной генерации может генерировать многоканальный аудиосигнал XM1 путем объединения переданного низведенного сигнала XQ1' и пространственной информации SI2'.The
Компенсация задержки по времени должна осуществляться на, по меньшей мере, одном из низведенного сигнала XQ1 и пространственной информации SI2, поскольку синхронизация по времени между пространственной информацией и низведенным сигналом установлена в измерении QMF при кодировании. Преобразованный в другое измерение низведенный сигнал XQ1 может поступать на блок 230 многоканальной генерации после компенсации разницы рассогласования синхронизации по времени на блоке 220 обработки задержки сигнала.The time delay compensation must be performed on at least one of the downmix signal XQ1 and spatial information SI2, since time synchronization between the spatial information and the downmix signal is established in the QMF measurement during encoding. The downmix signal XQ1 converted to another measurement may be supplied to the
Способ компенсации разницы в синхронизации по времени предусматривает обеспечение опережения низведенного сигнала XQ1 на величину разницы в синхронизации по времени. В этом случае разница в синхронизации по времени может быть суммой времени задержки, создаваемой блоком 110 преобразования в другое измерение, и времени задержки, создаваемой блоком 210 преобразования в другое измерение.A method of compensating for a difference in time synchronization provides for advancing the reduced signal XQ1 by the amount of the difference in time synchronization. In this case, the difference in time synchronization may be the sum of the delay time created by the conversion unit to another
Разницу в синхронизации по времени также можно компенсировать путем компенсации задержки по времени для пространственной информации SI2. В этом случае на блоке 240 обработки задержки пространственной информации обеспечивается отставание пространственной информации SI2 на величину разницы в синхронизации по времени, после чего эта информация передается на блок 230 многоканальной генерации.The difference in time synchronization can also be compensated by compensating for the time delay for spatial information SI2. In this case, at the spatial information
Значение задержки существенно задержанной пространственной информации соответствует сумме рассогласованной разницы в синхронизации по времени и времени задержки, для которого синхронизация по времени была согласована. Таким образом, задержанная пространственная информация задерживается на величину задержки кодирования и задержки декодирования. Эта сумма также соответствует суммарному значению разницы в синхронизации по времени между низведенным сигналом и пространственной информацией, создаваемой на блоке 100 низводящего декодирования (фиг.1), и разницы в синхронизации по времени, создаваемой на блоке 200 многоканального декодирования.The delay value of the substantially delayed spatial information corresponds to the sum of the mismatched difference in time synchronization and time delay, for which time synchronization was agreed. Thus, the delayed spatial information is delayed by the amount of coding delay and decoding delay. This sum also corresponds to the total value of the difference in time synchronization between the downmix signal and spatial information created on the downmix decoding unit 100 (FIG. 1) and the difference in time synchronization created on the
Значение задержки существенно задержанной пространственной информации SI2 можно определить исходя из производительности и задержки фильтра (например, QMF, смешанного блока фильтров).The delay value of the substantially delayed spatial information SI2 can be determined based on the performance and delay of the filter (for example, QMF, mixed filter block).
Например, значение задержки пространственной информации, с учетом производительности и задержки фильтра, может составлять 961 временных выборок. В случае анализа значения задержки пространственной информации разница в синхронизации по времени, создаваемая на блоке 100 низводящего декодирования, составляет 257 временных выборок, и разница в синхронизации по времени, создаваемая на блоке 200 многоканального декодирования, составляет 704 временных выборок. Хотя значение задержки выражается в количестве временных выборок, его также можно выражать в количестве квантов времени.For example, the spatial information delay value, taking into account the performance and filter delay, may be 961 time samples. In the case of analyzing the spatial information delay value, the time synchronization difference created on the
На фиг.5 показана блок-схема блока 200a многоканального декодирования, показанного на фиг.2.FIG. 5 shows a block diagram of a
Согласно фиг.2 и фиг.5, в способе обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения низведенный сигнал, обработанный на блоке 100a низводящего декодирования, может передаваться на блок 200a многоканального декодирования в одном из двух видов измерений. Согласно настоящему варианту осуществления предполагается, что низведенный сигнал и пространственная информация согласованы друг с другом посредством синхронизации по времени в измерении QMF. Возможны и другие измерения. Аудиосигнал, низведенный сигнал и пространственная информация которого согласованы в измерении отличном от временного измерения, можно обрабатывать.Referring to FIG. 2 and FIG. 5, in an audio signal processing method according to one embodiment of the present invention, the downmix signal processed at the
Согласно фиг.2, низведенный сигнал XT2, обработанный во временном измерении, передается на блок 200a многоканального декодирования для обработки сигнала.2, a downmix signal XT2 processed in a time domain is transmitted to a
Низведенный сигнал Xm в измерении MDCT преобразуется в низведенный сигнал XT2 во временном измерении блоком 110a преобразования в другое измерение.The downmix signal Xm in the MDCT measurement is converted to the downmix signal XT2 in the time dimension by the
Затем преобразованный низведенный сигнал XT2 передается на блок 200a многоканального декодирования.Then, the converted downmix signal XT2 is transmitted to the
Переданный низведенный сигнал XT2 преобразуется в низведенный сигнал Xq2 в измерении QMF блоком 210a преобразования в другое измерение и затем передается на блок 230a многоканальной генерации.The transmitted downmix signal XT2 is converted to the downmix signal Xq2 in the QMF measurement by the
Переданный низведенный сигнал Xq2 объединяется с пространственной информацией SI3 на блоке 230a многоканальной генерации для генерации многоканального аудиосигнала XM2.The transmitted downmix signal Xq2 is combined with spatial information SI3 on the
В этом случае пространственная информация SI3 объединяется с низведенным сигналом Xq2 после задержки на время, соответствующее синхронизации по времени при кодировании. Задержка может представлять собой задержку кодирования. Поскольку пространственная информация SI3 и низведенный сигнал Xq2 синхронизированы по времени при кодировании, многоканальный аудиосигнал можно генерировать без особого процесса согласования синхронизации. Таким образом, в этом случае пространственная информация SI3 не испытывает задержку, равную задержке декодирования.In this case, the spatial information SI3 is combined with the downmix signal Xq2 after a time delay corresponding to time synchronization during encoding. The delay may be a coding delay. Since the spatial information SI3 and the downmix signal Xq2 are time synchronized during encoding, a multi-channel audio signal can be generated without a particular synchronization matching process. Thus, in this case, the spatial information SI3 does not experience a delay equal to the decoding delay.
В некоторых вариантах осуществления низведенный сигнал XQ2, обработанный в измерении QMF, передается на блок 200a многоканального декодирования для обработки сигнала.In some embodiments, the downmix signal XQ2 processed in the QMF measurement is transmitted to a
Низведенный сигнал Xm, обработанный в измерении MDCT, выводится из блока 100a низводящего декодирования. Выведенный низведенный сигнал Xm преобразуется в низведенный сигнал XQ2 в измерении QMF блоком 300a преобразования в другое измерение. Преобразованный низведенный сигнал XQ2 затем передается на блок 200a многоканального декодирования.The downmix signal Xm processed in the MDCT measurement is output from the
Когда низведенный сигнал XQ2 в измерении QMF передается на блок 200a многоканального декодирования, по меньшей мере, один из низведенного сигнала XQ2 и пространственной информации SI4 может передаваться на блок 230a многоканальной генерации по завершении компенсации задержки по времени.When the downmix signal XQ2 in the QMF measurement is transmitted to the
Блок 230a многоканальной генерации может генерировать многоканальный аудиосигнал XM2 путем объединения переданного низведенного сигнала XQ2' и пространственной информации SI4'.The
Компенсация задержки по времени должна осуществляться на, по меньшей мере, одном из низведенного сигнала XQ2 и пространственной информации SI4 потому, что синхронизация по времени между пространственной информацией и низведенным сигналом установлена во временном измерении при кодировании. Преобразованный в другое измерение низведенный сигнал XQ2 может поступать на блок 230a многоканальной генерации после компенсации рассогласованной разницы в синхронизации по времени на блоке 220a обработки задержки сигнала.Compensation of the time delay should be carried out on at least one of the downmix signal XQ2 and spatial information SI4 because time synchronization between the spatial information and the downmix signal is established in the time dimension during encoding. The downmix signal XQ2 converted to another measurement may be supplied to the
Способ компенсации разницы в синхронизации по времени предусматривает обеспечение отставания низведенного сигнала XQ2 на величину разницы в синхронизации по времени. В этом случае разница в синхронизации по времени может быть разностью между временем задержки, создаваемой блоком 300a преобразования в другое измерение, и суммой времени задержки, создаваемой блоком 110a преобразования в другое измерение, и времени задержки, создаваемой блоком 210a преобразования в другое измерение.The method of compensating for the difference in time synchronization provides for the lag of the reduced signal XQ2 by the amount of the difference in time synchronization. In this case, the difference in time synchronization may be the difference between the delay time created by the
Разницу в синхронизации по времени также можно компенсировать путем компенсации задержки по времени для пространственной информации SI4. В этом случае для пространственной информации SI4 устанавливается опережение на величину разницы в синхронизации по времени на блоке 240a обработки задержки пространственной информации, после чего эта информация передается на блок 230a многоканальной генерации.The difference in time synchronization can also be compensated by compensating for the time delay for spatial information SI4. In this case, the spatial information SI4 is advanced by the amount of time synchronization difference on the spatial information
Значение задержки существенно задержанной пространственной информации соответствует сумме рассогласованной разницы в синхронизации по времени и времени задержки, для которого синхронизация по времени была согласована. Таким образом, задержанная пространственная информация SI4' задерживается на величину задержки кодирования и задержки декодирования.The delay value of the substantially delayed spatial information corresponds to the sum of the mismatched difference in time synchronization and time delay, for which time synchronization was agreed. Thus, the delayed spatial information SI4 ′ is delayed by the amount of coding delay and decoding delay.
Способ обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения включает в себя кодирование аудиосигнала, для которого синхронизация по времени между низведенным сигналом и пространственной информацией устанавливается согласно конкретной схеме декодирования, и декодирование кодированного аудиосигнала.An audio signal processing method according to one embodiment of the present invention includes encoding an audio signal for which time synchronization between a downmix signal and spatial information is set according to a specific decoding scheme, and decoding the encoded audio signal.
Существует несколько примеров схем декодирования, которые базируются на качестве (например, AAC высокого качества) или базируются на мощности (например, AAC низкой сложности). Схема декодирования с высоким качеством выводит многоканальный аудиосигнал, имеющий более высокое качество звучания, по сравнению с выходным сигналом схемы декодирования с пониженной мощностью. Схема декодирования с пониженной мощностью имеет сравнительно более низкое энергопотребление вследствие своей конфигурации, которая менее сложна по сравнению со схемой декодирования с высоким качеством.There are several examples of decoding schemes that are based on quality (e.g., high quality AAC) or based on power (e.g., low complexity AAC). A high-quality decoding circuit outputs a multi-channel audio signal having a higher sound quality compared to an output signal of a lower power decoding circuit. The low power decoding scheme has a relatively lower power consumption due to its configuration, which is less complicated compared to a high quality decoding scheme.
В нижеследующем описании схемы декодирования с высоким качеством и с низкой мощностью используются в качестве примеров для пояснения настоящего изобретения. Другие схемы декодирования в равной степени применимы к вариантам осуществления настоящего изобретения.In the following description, high quality and low power decoding schemes are used as examples to illustrate the present invention. Other decoding schemes are equally applicable to embodiments of the present invention.
На фиг.6 показана блок-схема для пояснения способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.6 is a flowchart for explaining a method for decoding an audio signal according to another embodiment of the present invention.
Согласно фиг.6, устройство декодирования, отвечающее настоящему изобретению, включает в себя блок 100c низводящего декодирования и блок 200c многоканального декодирования.6, a decoding apparatus according to the present invention includes a downmix decoding unit 100c and a multi-channel decoding unit 200c.
В некоторых вариантах осуществления низведенный сигнал XT4, обработанный на блоке 100c низводящего декодирования, передается на блок 200c многоканального декодирования, где сигнал объединяется с пространственной информацией SI7 или SI8 для генерации многоканального аудиосигнала M1 или M2. В этом случае обработанный низведенный сигнал XT4 является низведенным сигналом во временном измерении.In some embodiments, the downmix signal XT4 processed at the downmix decoding unit 100c is transmitted to a multi-channel decoding unit 200c, where the signal is combined with spatial information SI7 or SI8 to generate a multi-channel audio signal M1 or M2. In this case, the processed downmix signal XT4 is a downmix signal in the time dimension.
Кодированный низведенный сигнал DB передается на блок 100c низводящего декодирования и обрабатывается. Обработанный низведенный сигнал XT4 передается на блок 200c многоканального декодирования, который генерирует многоканальный аудиосигнал согласно одному из двух видов схем декодирования: схеме декодирования с высоким качеством и схеме декодирования с низкой мощностью.The encoded downmix DB signal is transmitted to the downmix decoding unit 100c and processed. The processed downmix signal XT4 is transmitted to a multi-channel decoding unit 200c that generates a multi-channel audio signal according to one of two types of decoding schemes: a high-quality decoding scheme and a low-power decoding scheme.
В случае, когда обработанный низведенный сигнал XT4 декодируется согласно схеме декодирования с низкой мощностью, низведенный сигнал XT4 передается и декодируется на тракте P2. Обработанный низведенный сигнал XT4 преобразуется в сигнал XRQ в действительном измерении QMF блоком 240c преобразования в другое измерение.In the case where the processed downmix signal XT4 is decoded according to a low power decoding scheme, the downmix signal XT4 is transmitted and decoded on path P2. The processed downmix signal XT4 is converted to the XRQ signal in the actual QMF measurement by another measurement conversion unit 240c.
Преобразованный низведенный сигнал XRQ преобразуется в сигнал XQC2 в комплексном измерении QMF блоком преобразования в другое измерение 250c. Преобразование низведенного сигнала XRQ в низведенный сигнал XQC2 является примером комплексного преобразования измерения.The converted downmix signal XRQ is converted to the signal XQC2 in the complex QMF measurement by the conversion unit to another measurement 250c. Converting a downmix XRQ signal to a downmix XQC2 is an example of a complex measurement conversion.
Затем сигнал XQC2 в комплексном измерении QMF объединяется с пространственной информацией SI8 на блоке 260c многоканальной генерации для генерации многоканального аудиосигнала M2.Then, the XQC2 signal in the complex QMF measurement is combined with spatial information SI8 on the multi-channel generation unit 260c to generate a multi-channel audio signal M2.
Таким образом, при декодировании низведенного сигнала XT4 согласно схеме декодирования с низкой мощностью отдельная процедура обработки задержки не требуется. Причина в том, что синхронизация по времени между низведенным сигналом и пространственной информацией уже согласована согласно схеме декодирования с низкой мощностью при кодировании аудиосигнала. Таким образом, в этом случае низведенный сигнал XRQ не испытывает задержку, равную задержке декодирования.Thus, when decoding the downmix signal XT4 according to the low power decoding scheme, a separate delay processing procedure is not required. The reason is that the time synchronization between the downmix signal and spatial information is already matched according to a low power decoding scheme for encoding an audio signal. Thus, in this case, the downmix XRQ signal does not experience a delay equal to the decoding delay.
В случае, когда обработанный низведенный сигнал XT4 декодируется согласно схеме декодирования с высоким качеством, низведенный сигнал XT4 передается и декодируется на тракте P1. Обработанный низведенный сигнал XT4 преобразуется в сигнал XCQ1 в комплексном измерении QMF блоком 210c преобразования в другое измерение.In the case where the processed downmix signal XT4 is decoded according to a high quality decoding scheme, the downmix signal XT4 is transmitted and decoded on path P1. The processed downmix signal XT4 is converted to the signal XCQ1 in the complex QMF measurement by the conversion to another measurement unit 210c.
Затем преобразованный низведенный сигнал XCQ1 задерживается на величину разницы в задержке по времени между низведенным сигналом XCQ1 и пространственной информацией SI7 на блоке 220c обработки задержки сигнала.Then, the converted downmix signal XCQ1 is delayed by the amount of time delay difference between the downmix signal XCQ1 and spatial information SI7 on the signal delay processing unit 220c.
Затем задержанный низведенный сигнал XCQ1' объединяется с пространственной информацией SI7 на блоке многоканальной генерации 230c, который генерирует многоканальный аудиосигнал M1.Then, the delayed downmix signal XCQ1 ′ is combined with the spatial information SI7 on the multi-channel generation unit 230c, which generates a multi-channel audio signal M1.
Таким образом, низведенный сигнал XCQ1 проходит через блок 220c обработки задержки сигнала. Причина в том, что разница в синхронизации по времени между низведенным сигналом XCQ1 и пространственной информацией SI7 создается вследствие кодирования аудиосигнала исходя из того, что будет использоваться схема декодирования с низкой мощностью.Thus, the downmix signal XCQ1 passes through the signal delay processing unit 220c. The reason is that the difference in time synchronization between the downmix signal XCQ1 and spatial information SI7 is created due to the encoding of the audio signal based on the fact that a low power decoding scheme will be used.
Разница в синхронизации по времени - это разница в задержке по времени, которая зависит от используемой схемы декодирования. Например, разница в задержке по времени появляется потому, что процесс декодирования, например, согласно схеме декодирования с низкой мощностью, отличается от процесса декодирования согласно схеме декодирования с высоким качеством. Разница в задержке по времени учитывается до момента времени объединения низведенного сигнала и пространственной информации, поскольку нет необходимости синхронизировать низведенный сигнал и пространственную информацию после момента времени объединения низведенного сигнала и пространственной информации.The difference in time synchronization is the difference in time delay, which depends on the decoding scheme used. For example, the time delay difference appears because the decoding process, for example, according to the low power decoding scheme, is different from the decoding process according to the high quality decoding scheme. The time delay difference is taken into account until the time of combining the downmix signal and spatial information, since there is no need to synchronize the downmix signal and spatial information after the time of combining the downmix signal and spatial information.
Согласно фиг.6, разница в синхронизации по времени равна разности между первым временем задержки, имеющим место до момента времени объединения низведенного сигнала XCQ2 и пространственной информации SI8, и вторым временем задержки, имеющим место до момента времени объединения низведенного сигнала XCQ1' и пространственной информации SI7. В этом случае временную выборку или квант времени можно использовать в качестве единицы задержки по времени.According to Fig.6, the difference in time synchronization is equal to the difference between the first delay time that occurs before the time of combining the downmix signal XCQ2 and spatial information SI8, and the second delay time that takes place before the time of combining the downmix signal XCQ1 'and spatial information SI7 . In this case, the time sampling or time slice can be used as a unit of time delay.
Если время задержки, имеющее место на блоке преобразования в другое измерение 210c, равно времени задержки, имеющему место на блоке преобразования в другое измерение 240c, блоку 220c обработки задержки сигнала достаточно задержать низведенный сигнал XCQ1 на время задержки, имеющее место на блоке 250c преобразования в другое измерение.If the delay time occurring on the conversion unit to another measurement 210c is equal to the delay time occurring on the conversion unit to another measurement 240c, it is sufficient for the signal delay processing unit 220c to delay the reduced signal XCQ1 by the delay time occurring on the conversion unit 250c measurement.
Согласно варианту осуществления, показанному на фиг.6, две схемы декодирования используются на блоке 200c многоканального декодирования. Альтернативно, одна схема декодирования может использоваться на блоке 200c многоканального декодирования.According to the embodiment shown in FIG. 6, two decoding schemes are used on the multi-channel decoding unit 200c. Alternatively, one decoding scheme may be used on the multi-channel decoding unit 200c.
Согласно вышеописанному варианту осуществления настоящего изобретения синхронизация по времени между низведенным сигналом и пространственной информацией устанавливается в соответствии со схемой декодирования с низкой мощностью. Однако настоящее изобретение дополнительно включает в себя случай, когда синхронизация по времени между низведенным сигналом и пространственной информацией устанавливается в соответствии со схемой декодирования с высоким качеством. В этом случае обеспечивается опережение низведенного сигнала в отличие от случая установления синхронизации по времени согласно схеме декодирования с низкой мощностью.According to the above embodiment, the time synchronization between the downmix signal and spatial information is set in accordance with a low power decoding scheme. However, the present invention further includes a case where time synchronization between a downmix signal and spatial information is established in accordance with a high quality decoding scheme. In this case, an advance of the downmix signal is provided, in contrast to the case of establishing time synchronization according to a low power decoding scheme.
На фиг.7 показана блок-схема для пояснения способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.7 is a flowchart for explaining a method for decoding an audio signal according to another embodiment of the present invention.
Согласно фиг.7, устройство декодирования, отвечающее настоящему изобретению, включает в себя блок 100d низводящего декодирования и блок 200d многоканального декодирования.7, a decoding apparatus of the present invention includes a
Низведенный сигнал XT4, обработанный на блоке 100d низводящего декодирования, передается на блок многоканального декодирования 200d, где низведенный сигнал объединяется с пространственной информацией SI7' или SI8 для генерации многоканального аудиосигнала M3 или M2. В этом случае обработанный низведенный сигнал XT4 является сигналом во временном измерении.The downmix signal XT4 processed at the
Кодированный низведенный сигнал DB передается на блок 100d низводящего декодирования и обрабатывается. Обработанный низведенный сигнал XT4 передается на блок 200d многоканального декодирования, который генерирует многоканальный аудиосигнал согласно одному из двух видов схем декодирования: схеме декодирования с высоким качеством и схеме декодирования с низкой мощностью.The encoded downmix signal DB is transmitted to the
В случае, когда обработанный низведенный сигнал XT4 декодируется согласно схеме декодирования с низкой мощностью, низведенный сигнал XT4 передается и декодируется на тракте P4. Обработанный низведенный сигнал XT4 преобразуется в сигнал XRQ в действительном измерении QMF блоком 240d преобразования в другое измерение.In the case where the processed downmix signal XT4 is decoded according to a low power decoding scheme, the downmix signal XT4 is transmitted and decoded on path P4. The processed downmix signal XT4 is converted to the XRQ signal in the actual QMF measurement by the conversion to another
Преобразованный низведенный сигнал XRQ преобразуется в сигнал XQC2 в комплексном измерении QMF блоком 250d преобразования в другое измерение. Преобразование низведенного сигнала XRQ в низведенный сигнал XCQ2 является примером комплексного преобразования измерения.The converted downmix signal XRQ is converted to the signal XQC2 in the complex QMF measurement by the
Затем сигнал XQC2 в комплексном измерении QMF объединяется с пространственной информацией SI8 на блоке 260d многоканальной генерации для генерации многоканального аудиосигнала M2.Then, the XQC2 signal in the complex QMF measurement is combined with spatial information SI8 on the
Таким образом, при декодировании низведенного сигнала XT4 согласно схеме декодирования с низкой мощностью отдельная процедура обработки задержки не требуется. Причина в том, что синхронизация по времени между низведенным сигналом и пространственной информацией уже согласована согласно схеме декодирования с низкой мощностью при кодировании аудиосигнала. Таким образом, в этом случае пространственная информация SI8 не испытывает задержку, равную задержке декодирования.Thus, when decoding the downmix signal XT4 according to the low power decoding scheme, a separate delay processing procedure is not required. The reason is that the time synchronization between the downmix signal and spatial information is already matched according to a low power decoding scheme for encoding an audio signal. Thus, in this case, the spatial information SI8 does not experience a delay equal to the decoding delay.
В случае, когда обработанный низведенный сигнал XT4 декодируется согласно схеме декодирования с высоким качеством, низведенный сигнал XT4 передается и декодируется на тракте P3. Обработанный низведенный сигнал XT4 преобразуется в сигнал XCQ1 в комплексном измерении QMF блоком 210d преобразования в другое измерение.In the case where the processed downmix signal XT4 is decoded according to a high quality decoding scheme, the downmix signal XT4 is transmitted and decoded on path P3. The processed downmix signal XT4 is converted to the signal XCQ1 in the complex QMF measurement by
Преобразованный низведенный сигнал XCQ1 передается на блок многоканальной генерации 230d, где он объединяется с пространственной информацией SI7' для генерации многоканального аудиосигнала M3. В этом случае пространственная информация SI7' является пространственной информацией, чья задержка по времени компенсируется, когда пространственная информация SI7 проходит через блок обработки 220d задержки пространственной информации.The converted downmix signal XCQ1 is transmitted to the
Таким образом, пространственная информация SI7 проходит через блок 220d обработки задержки пространственной информации. Причина в том, что разница в синхронизации по времени между низведенным сигналом XCQ1 и пространственной информацией SI7 возникает вследствие кодирования аудиосигнала исходя из того, что будет использоваться схема декодирования с низкой мощностью.Thus, the spatial information SI7 passes through the spatial information
Разница в синхронизации по времени - это разница в задержке по времени, которая зависит от используемой схемы декодирования. Например, разница в задержке по времени появляется потому, что процесс декодирования, например, согласно схеме декодирования с низкой мощностью, отличается от процесса декодирования согласно схеме декодирования с высоким качеством. Разница в задержке по времени учитывается до момента времени объединения низведенного сигнала и пространственной информации, поскольку нет необходимости синхронизировать низведенный сигнал и пространственную информацию после момента времени объединения низведенного сигнала и пространственной информации.The difference in time synchronization is the difference in time delay, which depends on the decoding scheme used. For example, the time delay difference appears because the decoding process, for example, according to the low power decoding scheme, is different from the decoding process according to the high quality decoding scheme. The time delay difference is taken into account until the time of combining the downmix signal and spatial information, since there is no need to synchronize the downmix signal and spatial information after the time of combining the downmix signal and spatial information.
Согласно фиг.7, разница в синхронизации по времени равна разности между первым временем задержки, имеющим место до момента времени объединения низведенного сигнала XCQ2 и пространственной информации SI8, и вторым временем задержки, имеющим место до момента времени объединения низведенного сигнала XCQ1 и пространственной информации SI7'. В этом случае временная выборка или квант времени может использоваться в качестве единицы задержки по времени.7, the difference in time synchronization is equal to the difference between the first delay time that occurs before the time of combining the downmix signal XCQ2 and spatial information SI8, and the second delay time that takes place before the time of combining the downmix signal XCQ1 and spatial information SI7 ' . In this case, the time sampling or time slice can be used as a unit of time delay.
Если время задержки, имеющее место на блоке 210d преобразования в другое измерение, равно времени задержки, имеющему место на блоке 240d преобразования в другое измерение, блоку 220d обработки задержки пространственной информации достаточно обеспечить опережение пространственной информации SI7 на время задержки, имеющее место на блоке 250d преобразования в другое измерение.If the delay time occurring on the block for converting to another
В показанном примере две схемы декодирования используются на блоке 200d многоканального декодирования. Альтернативно, одна схема декодирования может использоваться на блоке 200d многоканального декодирования.In the example shown, two decoding schemes are used on the
Согласно вышеописанному варианту осуществления настоящего изобретения синхронизация по времени между низведенным сигналом и пространственной информацией устанавливается в соответствии со схемой декодирования с низкой мощностью. Однако настоящее изобретение дополнительно включает в себя случай, когда синхронизация по времени между низведенным сигналом и пространственной информацией устанавливается в соответствии со схемой декодирования с высоким качеством. В этом случае низведенный сигнал задерживается, в отличие от случая установления синхронизации по времени согласно схеме декодирования с низкой мощностью.According to the above embodiment, the time synchronization between the downmix signal and spatial information is set in accordance with a low power decoding scheme. However, the present invention further includes a case where time synchronization between a downmix signal and spatial information is established in accordance with a high quality decoding scheme. In this case, the downmix signal is delayed, in contrast to the case of establishing time synchronization according to the low power decoding scheme.
Хотя на фиг.6 и фиг.7 показано, что один из блока 220c обработки задержки сигнала и блока 220d обработки задержки пространственной информации входит в состав блока 200c или 200d многоканального декодирования, настоящее изобретение включает в себя вариант осуществления, где блок 220d обработки задержки пространственной информации и блок 220c обработки задержки сигнала входят в состав блока 200c или 200d многоканального декодирования. В этом случае сумма времени компенсации задержки на блоке 220d обработки задержки пространственной информации и времени компенсации задержки на блоке 220c обработки задержки сигнала должна быть равна разнице в синхронизации по времени.Although FIGS. 6 and 7 show that one of the signal delay processing unit 220c and the spatial information
В вышеприведенном описании объяснены способ компенсации разницы в синхронизации по времени вследствие наличия совокупности входных измерений низведенного сигнала и способ компенсации разницы в синхронизации по времени вследствие наличия совокупности схем декодирования.In the above description, a method for compensating a difference in time synchronization due to the presence of a set of input measurements of a downmix signal and a method for compensating a difference in time synchronization due to a set of decoding schemes are explained.
Далее следует объяснение способа компенсации разницы в синхронизации по времени вследствие наличия совокупности входных измерений низведенного сигнала и наличия совокупности схем декодирования.The following is an explanation of the method of compensating for the difference in time synchronization due to the presence of a set of input measurements of the reduced signal and the presence of a set of decoding schemes.
На фиг.8 показана блок-схема для пояснения способа декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения.FIG. 8 is a flowchart for explaining a method for decoding an audio signal according to one embodiment of the present invention.
Согласно фиг.8, устройство декодирования, отвечающее настоящему изобретению, включает в себя блок 100e низводящего декодирования и блок 200e многоканального декодирования.8, a decoding apparatus of the present invention includes a
В способе обработки аудиосигнала согласно другому варианту осуществления настоящего изобретения низведенный сигнал, обработанный на блоке 100e низводящего декодирования, может передаваться на блок 200e многоканального декодирования в одном из двух видов измерений. Согласно настоящему варианту осуществления предполагается, что синхронизация по времени между низведенным сигналом и пространственной информацией установлена в измерении QMF согласно схеме декодирования с низкой мощностью. Альтернативно, настоящее изобретение предусматривает различные модификации осуществления.In the audio signal processing method according to another embodiment of the present invention, the downmix signal processed at the
Перейдем к описанию способа, согласно которому низведенный сигнал XQ5, обработанный в измерении QMF, обрабатывается путем передачи на блок 200e многоканального декодирования. В этом случае низведенный сигнал XQ5 может быть одним из сигнала XCQ5 в комплексном QMF и сигнала XRQ5 в действительном QMF. XCQ5 обрабатывается согласно схеме декодирования с высоким качеством на блоке 100e низводящего декодирования. XRQ5 обрабатывается согласно схеме декодирования с низкой мощностью на блоке 100e низводящего декодирования.Turning to the description of the method according to which the downmix signal XQ5 processed in the QMF measurement is processed by transmitting to the
Согласно настоящему варианту осуществления предполагается, что сигнал, обработанный согласно схеме декодирования с высоким качеством на блоке 100e низводящего декодирования, поступает на блок 200e многоканального декодирования схемы декодирования с высоким качеством, и сигнал, обработанный согласно схеме декодирования с низкой мощностью на блоке 100e низводящего декодирования, поступает на блок 200e многоканального декодирования схемы декодирования с низкой мощностью. Альтернативно, настоящее изобретение предусматривает различные модификации осуществления.According to the present embodiment, it is assumed that the signal processed according to the high quality decoding circuit on the
В случае, когда обработанный низведенный сигнал XQ5 декодируется согласно схеме декодирования с низкой мощностью, низведенный сигнал XQ5 передается и декодируется на тракте P6. В этом случае XQ5 является низведенным сигналом XRQ5 в действительном измерении QMF.In the case where the processed downmix signal XQ5 is decoded according to a low power decoding scheme, the downmix signal XQ5 is transmitted and decoded on path P6. In this case, XQ5 is the downmix signal of XRQ5 in the actual QMF measurement.
Низведенный сигнал XRQ5 объединяется с пространственной информацией SI10 на блоке 231e многоканальной генерации для генерации многоканального аудиосигнала M5.The downmix signal XRQ5 is combined with spatial information SI10 on the
Таким образом, при декодировании низведенного сигнала XQ5 согласно схеме декодирования с низкой мощностью отдельная процедура обработки задержки не требуется. Причина в том, что синхронизация по времени между низведенным сигналом и пространственной информацией уже согласована согласно схеме декодирования с низкой мощностью при кодировании аудиосигнала.Thus, when decoding the downmix XQ5 signal according to the low power decoding scheme, a separate delay processing procedure is not required. The reason is that the time synchronization between the downmix signal and spatial information is already matched according to a low power decoding scheme for encoding an audio signal.
В случае, когда обработанный низведенный сигнал XQ5 декодируется согласно схеме декодирования с высоким качеством, низведенный сигнал XQ5 передается и декодируется на тракте P5. В этом случае XQ5 является низведенным сигналом XCQ5 в комплексном измерении QMF. Низведенный сигнал XCQ5 объединяется с пространственной информацией SI9 на блоке 230e многоканальной генерации для генерации многоканального аудиосигнала M4.In the case where the processed downmix signal XQ5 is decoded according to a high quality decoding scheme, the downmix signal XQ5 is transmitted and decoded on path P5. In this case, XQ5 is the downmix signal of XCQ5 in the complex QMF measurement. The downmix signal XCQ5 is combined with spatial information SI9 on the
Теперь рассмотрим случай, когда низведенный сигнал XT5, обработанный во временном измерении, передается на блок 200e многоканального декодирования для обработки сигнала.Now, consider the case where the downmix signal XT5 processed in the time dimension is transmitted to the
Низведенный сигнал XT5, обработанный на блоке 100e низводящего декодирования, передается на блок 200e многоканального декодирования, где он объединяется с пространственной информацией SI11 или SI12 для генерации многоканального аудиосигнала M6 или M7.The downmix signal XT5 processed at the
Низведенный сигнал XT5 передается на блок 200e многоканального декодирования, который генерирует многоканальный аудиосигнал согласно одному из двух видов схем декодирования: схеме декодирования с высоким качеством и схеме декодирования с низкой мощностью.The downmix signal XT5 is transmitted to a
В случае, когда обработанный низведенный сигнал XT5 декодируется согласно схеме декодирования с низкой мощностью, низведенный сигнал XT5 передается и декодируется на тракте P8. Обработанный низведенный сигнал XT5 преобразуется в сигнал XR в действительном измерении QMF блоком 241e преобразования в другое измерение.In the case where the processed downmix signal XT5 is decoded according to a low power decoding scheme, the downmix signal XT5 is transmitted and decoded on path P8. The processed downmix signal XT5 is converted to the XR signal in the actual QMF measurement by the conversion to another
Преобразованный низведенный сигнал XR преобразуется в сигнал XC2 в комплексном измерении QMF блоком преобразования в другое измерение 250e. Преобразование низведенного сигнала XR в низведенный сигнал XC2 является примером комплексного преобразования измерения.The converted downmix signal XR is converted to the signal XC2 in the complex QMF measurement by the conversion unit to another
Затем сигнал XC2 в комплексном измерении QMF объединяется с пространственной информацией SI12' на блоке 233e многоканальной генерации, который генерирует многоканальный аудиосигнал M7.Then, the signal XC2 in the complex QMF measurement is combined with the spatial information SI12 ′ on the
В этом случае пространственная информация SI12' является пространственной информацией, чья задержка по времени компенсируется, когда пространственная информация SI12 проходит через блок 240e обработки задержки пространственной информации.In this case, the spatial information SI12 ′ is spatial information whose time delay is compensated when the spatial information SI12 passes through the spatial information
Таким образом, пространственная информация SI12 проходит через блок 240e обработки задержки пространственной информации. Причина в том, что разница в синхронизации по времени между низведенным сигналом XC2 и пространственной информацией SI12 генерируется вследствие кодирования аудиосигнала, осуществляемого согласно схеме декодирования с низкой мощностью, исходя из того, что измерение, в котором установлена синхронизация по времени между низведенным сигналом и пространственной информацией, является измерением QMF. При этом задержанная пространственная информация SI12' задерживается на величину задержки кодирования и задержки декодирования.Thus, the spatial information SI12 passes through the spatial information
В случае, когда обработанный низведенный сигнал XT5 декодируется согласно схеме декодирования с высоким качеством, низведенный сигнал XT5 передается и декодируется на тракте P7. Обработанный низведенный сигнал XT5 преобразуется в сигнал XC1 в комплексном измерении QMF блоком 240e преобразования в другое измерение.In the case where the processed downmix signal XT5 is decoded according to a high quality decoding scheme, the downmix signal XT5 is transmitted and decoded on path P7. The processed downmix signal XT5 is converted to the signal XC1 in the complex QMF measurement by the conversion to another
Преобразованный низведенный сигнал XC1 и пространственная информация SI11 компенсируются в отношении задержки по времени на величину разницы в синхронизации по времени между низведенным сигналом XC1 и пространственной информацией SI11 на блоке 250e обработки задержки сигнала и блоке 260e обработки задержки пространственной информации соответственно.The converted downmix signal XC1 and spatial information SI11 are compensated for with respect to time delay by the amount of time synchronization difference between the downmix signal XC1 and spatial information SI11 at the signal
Затем низведенный сигнал XC1', скомпенсированный в отношении задержки по времени, объединяется с пространственной информацией, скомпенсированной отношении задержки по времени, SI11' на блоке многоканальной генерации 232e, который генерирует многоканальный аудиосигнал M6.Then, the downmix signal XC1 ′ compensated for the time delay is combined with spatial information compensated for the time delay SI11 ′ on the
Таким образом, низведенный сигнал XC1 проходит через блок 250e обработки задержки сигнала, и пространственная информация SI11 проходит через блок 260e обработки задержки пространственной информации. Причина в том, что разница в синхронизации по времени между низведенным сигналом XC1 и пространственной информацией SI11 генерируется вследствие кодирования аудиосигнала исходя из того, что его декодирование будет осуществляться согласно схеме декодирования с низкой мощностью, а также исходя из того, что измерение, в котором установлена синхронизация по времени между низведенным сигналом и пространственной информацией, является измерением QMF.Thus, the downmix signal XC1 passes through the signal
На фиг.9 показана блок-схема для пояснения способа декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения.9 is a flowchart for explaining a method for decoding an audio signal according to one embodiment of the present invention.
Согласно фиг.9, устройство декодирования, отвечающее настоящему изобретению, включает в себя блок 100f низводящего декодирования и блок 200f многоканального декодирования.9, a decoding apparatus of the present invention includes a
Кодированный низведенный сигнал DB1 передается на блок 100f низводящего декодирования и затем обрабатывается. Низведенный сигнал DB1 кодируется с учетом двух схем низводящего декодирования, включающих в себя первую схему низводящего декодирования и вторую схему низводящего декодирования.The encoded downmix signal DB1 is transmitted to the
Низведенный сигнал DB1 обрабатывается согласно одной схеме низводящего декодирования на блоке низводящего 100f декодирования. Одна схема низводящего декодирования может быть первой схемой низводящего декодирования.The downmix signal DB1 is processed according to one downmix decoding scheme on the
Обработанный низведенный сигнал XT6 передается на блок 200f многоканального декодирования, который генерирует многоканальный аудиосигнал Mf.The processed downmix signal XT6 is transmitted to a
Обработанный низведенный сигнал XT6' задерживается на величину задержки декодирования на блоке 210f обработки сигнала. Низведенный сигнал XT6' может задерживаться на величину задержки декодирования. Низведенный сигнал XT6 задерживается потому, что схема низводящего декодирования, предполагаемая при кодировании, отличается от схемы низводящего декодирования, используемой при декодировании.The processed downmix signal XT6 'is delayed by the amount of decoding delay at the
Поэтому в ряде случаев может потребоваться повышающая дискретизация низведенного сигнала XT6'.Therefore, in some cases, upsampling of the downmix signal XT6 'may be required.
Задержанный низведенный сигнал XT6' подвергается повышающей дискретизации на блоке 220f повышающей дискретизации. Низведенный сигнал XT6' подвергается повышающей дискретизации потому, что количество выборок низведенного сигнала XT6' отличается от количества выборок пространственной информации SI13.The delayed downmix signal XT6 ′ is upsampled at
Обработку задержки низведенного сигнала XT6 и обработку повышающей дискретизации низведенного сигнала XT6' можно производить в любом порядке.The processing of the delay of the downmix signal XT6 and the processing of upsampling of the downmix signal XT6 'can be performed in any order.
Измерение низведенного сигнала UXT6 с повышенной дискретизацией преобразуется на блоке 230f обработки измерения. Преобразование низведенного сигнала UXT6 в другое измерение может включать в себя преобразование измерения F/T и комплексное преобразование измерения.The downsampled UXT6 downsampling measurement is converted to the
Затем низведенный сигнал UXTD6, преобразованный в другое измерение, объединяется с пространственной информацией SI13 на блоке 260d многоканальной генерации, который генерирует многоканальный аудиосигнал Mf.Then, the downmix signal UXTD6, converted to another dimension, is combined with spatial information SI13 on the
В вышеприведенном описании объяснен способ компенсации разницы в синхронизации по времени, генерируемой между низведенным сигналом и пространственной информацией.In the above description, a method for compensating for a difference in time synchronization generated between a downmix signal and spatial information is explained.
В нижеследующем описании объяснен способ компенсации разницы в синхронизации по времени, генерируемой между данными временного ряда и многоканальным аудиосигналом, сгенерированным одним из вышеописанных способов.In the following description, a method for compensating for a difference in time synchronization generated between time series data and a multi-channel audio signal generated by one of the above methods is explained.
На фиг.10 показана блок-схема устройства декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения.10 is a block diagram of an audio decoding apparatus according to one embodiment of the present invention.
Согласно фиг.10, устройство декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения включает в себя блок 10 декодирования данных временного ряда и блок 20 обработки многоканального аудиосигнала.10, an audio signal decoding apparatus according to one embodiment of the present invention includes a time series
Блок 20 обработки многоканального аудиосигнала включает в себя блок 21 низводящего декодирования, блок 22 многоканального декодирования и блок 23 компенсации задержки по времени.The multi-channel audio
Низведенный битовый поток IN2, который является примером кодированного низведенного сигнала, поступает на блок 21 низводящего декодирования для декодирования.The downmix bitstream IN2, which is an example of an encoded downmix signal, is input to a
В этом случае низведенный битовый поток IN2 можно декодировать и выводить в двух видах измерений. Доступные выходные измерения включают в себя временное измерение и измерение QMF. Обозначение '50' указывает низведенный сигнал, декодированный и выведенный во временном измерении, и обозначение '51' указывает низведенный сигнал, декодированный и выведенный в измерении QMF. Согласно настоящему варианту осуществления описаны два вида измерений. Однако настоящее изобретение включает в себя низведенные сигналы, декодированные и выведенные в других видах измерений.In this case, the reduced bitstream IN2 can be decoded and output in two types of measurements. Available output measurements include time measurement and QMF measurement. The designation '50' indicates the downmix signal decoded and output in the time dimension, and the designation '51' indicates the downmix signal decoded and output in the QMF measurement. According to the present embodiment, two kinds of measurements are described. However, the present invention includes downmix signals decoded and output in other types of measurements.
Низведенные сигналы 50 и 51 передаются на блок многоканального декодирования 22 и затем декодируются согласно двум видам схем декодирования 22H и 22L соответственно. В этом случае обозначение '22H' указывает схему декодирования с высоким качеством, и обозначение '22L' указывает схему декодирования с низкой мощностью.The downmix signals 50 and 51 are transmitted to the
В этом варианте осуществления настоящего изобретения применяются только два вида схем декодирования. Однако настоящее изобретение допускает применение большего количества схем декодирования.In this embodiment of the present invention, only two kinds of decoding schemes are used. However, the present invention allows the use of more decoding schemes.
Низведенный сигнал 50, декодированный и выведенный во временном измерении, декодируется согласно выбору одного из двух трактов P9 и P10. В этом случае тракт P9 указывает тракт для декодирования согласно схеме декодирования с высоким качеством 22H, и тракт P10 указывает тракт для декодирования согласно схеме декодирования с низкой мощностью 22L.The
Низведенный сигнал 50, передаваемый на тракте P9, объединяется с пространственной информацией SI согласно схеме декодирования с высоким качеством 22H для генерации многоканального аудиосигнала MHT. Низведенный сигнал 50, передаваемый на тракте P10, объединяется с пространственной информацией SI согласно схеме декодирования с низкой мощностью 22L для генерации многоканального аудиосигнала MLT.The
Другой низведенный сигнал 51, декодированный и выведенный в измерении QMF, декодируется согласно выбору одного из двух трактов P11 и P12. В этом случае тракт P11 указывает тракт для декодирования согласно схеме декодирования с высоким качеством 22H, и тракт P12 указывает тракт для декодирования согласно схеме декодирования с низкой мощностью 22L.Another
Низведенный сигнал 51, передаваемый на тракте P11, объединяется с пространственной информацией SI согласно схеме декодирования с высоким качеством 22H для генерации многоканального аудиосигнала MHQ. Низведенный сигнал 51, передаваемый на тракте P12, объединяется с пространственной информацией SI согласно схеме декодирования с низкой мощностью 22L для генерации многоканального аудиосигнала MLQ.The
По меньшей мере, один из многоканальных аудиосигналов MHT, MHQ, MLT и MLQ, генерируемых вышеописанными способами, проходит процесс компенсации задержки по времени на блоке 23 компенсации задержки по времени и затем выводится как OUT2, OUT3, OUT4 или OUT5.At least one of the multi-channel audio signals MHT, MHQ, MLT, and MLQ generated by the above methods undergoes a time delay compensation process at the time
Согласно настоящему варианту осуществления процесс компенсации задержки по времени способен предотвращать возникновение задержки по времени путем сравнения многоканального аудиосигнала MHQ, MLT или MKQ с нарушенной синхронизацией по времени с многоканальным аудиосигналом MHT, исходя из того, что синхронизация по времени между данными временного ряда OUT1, декодированными и выведенными на блоке 10 декодирования временного ряда, и вышеупомянутым многоканальным аудиосигналом MHT согласована. Конечно, если синхронизация по времени между данными временного ряда OUT1 и одним из многоканальных аудиосигналов MHQ, MLT и MLQ за исключением вышеупомянутого многоканального аудиосигнала MHT согласована, синхронизацию по времени с данными временного ряда OUT1 можно установить путем компенсации задержки по времени для одного из оставшихся многоканальных аудиосигналов, у которых синхронизация по времени нарушена.According to the present embodiment, the time delay compensation process is able to prevent the occurrence of a time delay by comparing the multi-channel audio signal MHQ, MLT, or MKQ with a disturbed time synchronization with the multi-channel audio signal MHT, based on the fact that the time synchronization between time series data OUT1 decoded and outputted to the time
Вариант осуществления также может предусматривать процесс компенсации задержки по времени в случае, когда данные временного ряда OUT1 и многоканальный аудиосигнал MHT, MHQ, MLT или MLQ не обрабатываются совместно. Например, задержка по времени многоканального аудиосигнала компенсируется и ее возникновение предотвращается с использованием результата сравнения с многоканальным аудиосигналом MLT. Это можно диверсифицировать по-разному.An embodiment may also include a time delay compensation process in the case where time series data OUT1 and the multi-channel audio signal MHT, MHQ, MLT or MLQ are not processed together. For example, the time delay of the multi-channel audio signal is compensated and its occurrence is prevented using the result of the comparison with the multi-channel audio signal MLT. It can be diversified in many ways.
Специалистам в данной области очевидно, что в настоящем изобретении можно предложить различные модификации и вариации, не отходя от сущности или объема изобретения. Таким образом, предполагается, что настоящее изобретение охватывает модификации и вариации этого изобретения при условии, что они согласуются с объемом прилагаемой формулы изобретения и ее эквивалентов.It will be apparent to those skilled in the art that various modifications and variations can be proposed in the present invention without departing from the spirit or scope of the invention. Thus, it is intended that the present invention cover the modifications and variations of this invention provided they come within the scope of the appended claims and their equivalents.
Промышленное применениеIndustrial application
Соответственно, настоящее изобретение обеспечивает следующие эффекты и преимущество.Accordingly, the present invention provides the following effects and advantage.
Во-первых, если возникает разница в синхронизации по времени между низведенным сигналом и пространственной информацией, настоящее изобретение препятствует ухудшению качества звучания за счет компенсации разницы в синхронизации по времени.Firstly, if there is a difference in time synchronization between the downmix signal and spatial information, the present invention prevents the deterioration of sound quality by compensating for the difference in time synchronization.
Во-вторых, настоящее изобретение позволяет компенсировать разницу в синхронизации по времени между данными временного ряда и многоканальным аудиосигналом, подлежащим обработке совместно с данными временного ряда движущегося изображения, текста, неподвижного изображения и пр.Secondly, the present invention allows to compensate for the difference in time synchronization between time series data and a multi-channel audio signal to be processed together with time series data of a moving image, text, still image, etc.
Claims (4)
принимают аудиосигнал, включающий в себя сигнал понижающего микширования временной области и пространственную информацию, причем пространственная информация задержана в пределах аудиосигнала;
осуществляют первое преобразование сигнала понижающего микширования временной области в сигнал понижающего микширования действительной области квадратурного зеркального фильтра (QMF);
осуществляют второе преобразование сигнала понижающего микширования действительной области QMF в сигнал понижающего микширования комплексной области QMF и
объединяют сигнал понижающего микширования комплексной области QMF с пространственной информацией,
при этом перед этапом приема аудиосигнала пространственная информация задерживается на промежуток времени, включающий в себя время, затраченное на первое и второе преобразования сигнала понижающего микширования.1. A method of decoding an audio signal, comprising stages in which:
receiving an audio signal including a downmix signal of a time domain and spatial information, the spatial information being delayed within the audio signal;
first converting the downmix signal of the time domain into the downmix signal of the real region of the quadrature mirror filter (QMF);
performing a second conversion of the downmix signal of the actual QMF into a downmix signal of the complex QMF and
combine the downmix signal of the complex QMF region with spatial information,
in this case, before the step of receiving the audio signal, the spatial information is delayed by a period of time including the time spent on the first and second conversions of the down-mix signal.
блок приема аудиосигнала, который принимает аудиосигнал,
включающий в себя сигнал понижающего микширования временной области и пространственную информацию, причем пространственная информация задержана в пределах аудиосигнала;
первый блок преобразования сигнала понижающего микширования, который преобразует сигнал понижающего микширования временной области в сигнал понижающего микширования действительной области квадратурного зеркального фильтра (QMF);
второй блок преобразования сигнала понижающего микширования, который преобразует сигнал понижающего микширования действительной области QMF в сигнал понижающего микширования комплексной области QMF; и
блок объединения пространственной информации, который объединяет сигнал понижающего микширования комплексной области QMF с пространственной информацией;
при этом перед приемом аудиосигнала пространственная информация задерживается на промежуток времени, включающий в себя время, затраченное на первое и второе преобразования сигнала понижающего микширования.3. An audio signal decoding apparatus comprising:
an audio signal receiving unit that receives an audio signal,
including a downmix signal of a time domain and spatial information, the spatial information being delayed within the audio signal;
a first downmix signal converting unit that converts the downmix signal of the time domain into a downmix signal of the real region of the quadrature mirror filter (QMF);
a second downmix signal converting unit that converts the downmix signal of the actual QMF to a downmix signal of the complex QMF; and
a spatial information combining unit that combines a downmix signal of the complex QMF region with spatial information;
in this case, before receiving the audio signal, the spatial information is delayed by a period of time including the time spent on the first and second conversions of the down-mix signal.
прием аудиосигнала, включающего в себя сигнал понижающего микширования временной области и пространственную информацию, причем пространственная информация задержана в пределах аудиосигнала;
первое преобразование сигнала понижающего микширования временной области в сигнал понижающего микширования действительной области квадратурного зеркального фильтра (QMF);
второе преобразование сигнала понижающего микширования действительной области QMF в сигнал понижающего микширования комплексной области QMF и
объединение сигнала понижающего микширования комплексной области QMF с пространственной информацией,
при этом перед приемом аудиосигнала объединенная пространственная информация задерживается на промежуток времени, включающий в себя время, затраченное на первый и второй процессы преобразования. 4. Computer-readable media selected from the group consisting of: non-volatile media, volatile media, and combinations thereof, the computer-readable medium stores instructions that, when executed by the processor, instruct the processor to:
receiving an audio signal including a downmix signal of a time domain and spatial information, the spatial information being delayed within the audio signal;
first converting the downmix signal of the time domain into the downmix signal of the real region of the quadrature mirror filter (QMF);
a second conversion of the downmix signal of the actual QMF region into a downmix signal of the complex QMF region and
combining the downmix signal of the complex QMF region with spatial information,
in this case, before receiving the audio signal, the combined spatial information is delayed for a period of time including the time spent on the first and second conversion processes.
Applications Claiming Priority (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72922505P | 2005-10-24 | 2005-10-24 | |
US60/729,225 | 2005-10-24 | ||
US75700506P | 2006-01-09 | 2006-01-09 | |
US60/757,005 | 2006-01-09 | ||
US60/786,740 | 2006-03-29 | ||
US79232906P | 2006-04-17 | 2006-04-17 | |
US60/792,329 | 2006-04-17 | ||
KR1020060078219A KR20070074442A (en) | 2006-01-09 | 2006-08-18 | A computer-readable recording medium having recorded thereon a method and method for recovering a multichannel audio and a program performed on the device. |
KR10-2006-0078218 | 2006-08-18 | ||
KR1020060078221A KR20070037984A (en) | 2005-10-04 | 2006-08-18 | Method for decoding multichannel audio signal and apparatus therefor |
KR10-2006-0078219 | 2006-08-18 | ||
KR10-2006-0078222 | 2006-08-18 | ||
KR10-2006-0078221 | 2006-08-18 | ||
KR10-2006-0078225 | 2006-08-18 | ||
KR1020060078223A KR20070037986A (en) | 2005-10-04 | 2006-08-18 | Multi channel audio signal processing method and apparatus |
KR10-2006-0078223 | 2006-08-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2008120661A RU2008120661A (en) | 2009-12-10 |
RU2389155C2 true RU2389155C2 (en) | 2010-05-10 |
Family
ID=41488830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008120661/09A RU2389155C2 (en) | 2005-10-24 | 2006-10-02 | Elimination of time delays on signal processing channels |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2389155C2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2158970C2 (en) * | 1994-03-01 | 2000-11-10 | Сони Корпорейшн | Method for digital signal encoding and device which implements said method, carrier for digital signal recording, method for digital signal decoding and device which implements said method |
US6295319B1 (en) * | 1998-03-30 | 2001-09-25 | Matsushita Electric Industrial Co., Ltd. | Decoding device |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
EP1396843A1 (en) * | 2002-09-04 | 2004-03-10 | Microsoft Corporation | Mixed lossless audio compression |
-
2006
- 2006-10-02 RU RU2008120661/09A patent/RU2389155C2/en active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2158970C2 (en) * | 1994-03-01 | 2000-11-10 | Сони Корпорейшн | Method for digital signal encoding and device which implements said method, carrier for digital signal recording, method for digital signal decoding and device which implements said method |
US6295319B1 (en) * | 1998-03-30 | 2001-09-25 | Matsushita Electric Industrial Co., Ltd. | Decoding device |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
EP1396843A1 (en) * | 2002-09-04 | 2004-03-10 | Microsoft Corporation | Mixed lossless audio compression |
Also Published As
Publication number | Publication date |
---|---|
RU2008120661A (en) | 2009-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2626132C (en) | Removing time delays in signal paths | |
KR100875429B1 (en) | How to compensate for time delays in signal processing | |
RU2389155C2 (en) | Elimination of time delays on signal processing channels | |
TWI450603B (en) | Removing time delays in signal paths | |
HK1126071B (en) | Method and apparatus for processing audio signal |