JPH11262100A - Audio signal encoding / decoding method and apparatus - Google Patents
Audio signal encoding / decoding method and apparatusInfo
- Publication number
- JPH11262100A JPH11262100A JP10062989A JP6298998A JPH11262100A JP H11262100 A JPH11262100 A JP H11262100A JP 10062989 A JP10062989 A JP 10062989A JP 6298998 A JP6298998 A JP 6298998A JP H11262100 A JPH11262100 A JP H11262100A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- encoding
- frame
- bit stream
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
(57)【要約】
【課題】 デジタルオーディオ信号を符号化/復号する
際に、左右方向感情報または拡がり感情報を同時に符号
化/復号することを目的とする。
【解決手段】 オーディオ信号の符号化方法において、
ビットストリームのアンシラリデータ中に左右方向感情
報または拡がり感情報を含んで符号化することにより、
オーディオ信号と左右方向感または拡がり感との同期を
取ることが容易になる。復号に際しては、再生した左右
方向感または拡がり感をオーディオ信号に付加して出力
する。
(57) [Summary] [PROBLEMS] To encode / decode left / right sense information or spread sense information simultaneously when encoding / decoding a digital audio signal. SOLUTION: In the encoding method of the audio signal,
By encoding the bitstream ancillary data including the left-right sense information or the spread sense information,
It becomes easy to synchronize the audio signal with the left-right sense or the spread sense. At the time of decoding, the reproduced left-right sense or spread sense is added to the audio signal and output.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、音像の左右方向感
および拡がり感も含めたオーディオ信号の符号化及び復
号の方法およびその装置に関するものである。[0001] 1. Field of the Invention [0002] The present invention relates to a method and apparatus for encoding and decoding an audio signal including a sense of right and left and a sense of spread of a sound image.
【0002】[0002]
【従来の技術】近年、デジタルオーディオ信号の符号化
方法の開発が活発になり、特に高品質のオーディオ符号
化方法として、MPEG1オーディオ符号化(ISO/IEC 1117
2-3)が知られている。2. Description of the Related Art In recent years, a digital audio signal encoding method has been actively developed. In particular, MPEG1 audio encoding (ISO / IEC 1117) has been proposed as a high quality audio encoding method.
2-3) is known.
【0003】図7はMPEG1オーディオ符号化の符号器の
基本構造を示すブロック図である。オーディオサンプル
が符号器71に入力されると、写像部72は、入力オー
ディオサンプルをフィルタ処理し、さらに間引いた表現
を生成する。聴覚心理モデル部73は、量子化及び符号
化を制御するデータの組を生成する。量子化及び符号化
部74は、レイヤ1、レイヤ2及びレイヤ3のいずれか
の符号化方法に従った処理を行う。フレーム組立部75
は、量子化及び符号化部74の出力データとアンシラリ
データから実際のビットストリームを組み立てて、その
他の情報(例:エラーチェック)を必要に応じて付加す
る。FIG. 7 is a block diagram showing a basic structure of an encoder for MPEG1 audio encoding. When audio samples are input to the encoder 71, the mapping unit 72 filters the input audio samples and generates a thinned representation. The psychoacoustic model unit 73 generates a data set that controls quantization and encoding. The quantization and coding unit 74 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. Frame assembly part 75
Constructs an actual bit stream from the output data of the quantization and encoding unit 74 and the ancillary data, and adds other information (eg, error check) as necessary.
【0004】図8はMPEG1オーディオ符号化の復号器の
基本構造を示すブロック図である。ビットストリームが
復号器81に入力されると、フレーム分解部82は、情
報の様々な部分を復元するために、ビットストリームを
分離する。復元部83は、一連の写像サンプルの量子化
形を復元する。逆写像部84は、これらの写像サンプル
をPCMオーディオサンプルに戻す。FIG. 8 is a block diagram showing a basic structure of a decoder for MPEG1 audio encoding. When the bit stream is input to the decoder 81, the frame decomposer 82 separates the bit stream to recover various parts of the information. The restoration unit 83 restores a quantized form of a series of mapping samples. The inverse mapping unit 84 returns these mapping samples to PCM audio samples.
【0005】MPEG1オーディオで生成されるビットスト
リームには、レイヤ1、レイヤ2およびレイヤ3という
3種類からなる。レイヤが増すにしたがって符号化のア
ルゴリズムの複雑さも増大するが、低ビットレートでも
音質のよい効率的な符号化を実現することができる。こ
こでは簡単のため、レイヤ1で説明する。[0005] A bit stream generated by MPEG1 audio is composed of three types: layer 1, layer 2 and layer 3. Although the complexity of the coding algorithm increases as the number of layers increases, efficient coding with good sound quality can be realized even at a low bit rate. Here, for the sake of simplicity, description will be made on layer 1.
【0006】レイヤ1のビットストリームを模式図で示
すと、図9のようになる。図9はMPEG1オーディオ符号
化レイヤ1のビットストリームフォーマットを示す。ビ
ットストリームは1つ以上の連続するフレームから構成
され、図9は1フレームのフォーマットである。フレー
ムは、ヘッダ、エラーチェック、オーディオデータであ
るビット割当て、スケールファクタ及びサンプル、並び
にアンシラリデータから成る。FIG. 9 is a schematic diagram showing a layer 1 bit stream. FIG. 9 shows a bit stream format of the MPEG1 audio encoding layer 1. The bit stream is composed of one or more consecutive frames, and FIG. 9 is a format of one frame. The frame is composed of a header, an error check, bit allocation as audio data, scale factors and samples, and ancillary data.
【0007】[0007]
【発明が解決しようとする課題】従来の方法では、文字
情報などのオーディオデータ以外の情報をビットストリ
ーム中に含める場合はアンシラリデータの中に符号化す
る。しかしながら、音像の左右方向感や拡がり感のよう
にオーディオ信号に関係した情報を符号化する方法が明
確に規定されていなかった。このため、本来、オーディ
オ信号とその信号の特性である左右方向感や拡がり感情
報が符号化されない、もしくはオーディオ信号とは別に
符号化されてしまうために、同期がとりにくい、といっ
た問題があった。In the conventional method, when information other than audio data such as character information is included in a bit stream, it is encoded in ancillary data. However, a method of encoding information related to an audio signal, such as a sense of right and left directions and a sense of spread of a sound image, has not been clearly defined. For this reason, there has been a problem that the audio signal and the characteristic of the signal, that is, the feeling in the left-right direction and the feeling of spread, are not encoded, or are encoded separately from the audio signal, so that it is difficult to achieve synchronization. .
【0008】本発明は、このような従来の問題点を解決
するものであり、入力されたオーディオ信号から抽出さ
れた音像の左右方向感および拡がり感を、オーディオ信
号と同期してオーディオビットストリームのアンシラリ
データ中に符号化し、それを復号するオーディオ信号の
符号化/復号方法およびその装置を提供することを目的
とするものである。SUMMARY OF THE INVENTION The present invention solves such a conventional problem. The present invention provides a method of extracting the right and left direction and the spread of a sound image extracted from an input audio signal in synchronization with the audio signal. An object of the present invention is to provide an audio signal encoding / decoding method and an apparatus for encoding and decoding ancillary data.
【0009】[0009]
【課題を解決するための手段】本発明は、上記目的を達
成するために、音像の左右方向感および拡がり感を抽出
し、オーディオのビットストリームのアンシラリデータ
中に音像の左右方向感情報および拡がり感情報を符号化
するようにしたものである。SUMMARY OF THE INVENTION In order to achieve the above object, the present invention extracts a sense of right and left direction and a sense of spread of a sound image, and includes information on right and left sense of the sound image in ancillary data of an audio bit stream. The spreading feeling information is encoded.
【0010】また、本発明は、上記目的を達成するため
に、オーディオのビットストリームのアンシラリデータ
中から音像の左右方向感情報および拡がり感情報を復号
し、オーディオ信号を再生するようにしたものである。Further, in order to achieve the above object, the present invention decodes left-right sense information and spread sense information of a sound image from ancillary data of an audio bit stream and reproduces an audio signal. It is.
【0011】[0011]
【発明の実施の形態】本発明の請求項1に記載の発明
は、オーディオ信号の符号化方法において、生成された
ビットストリーム中に音像の左右方向感情報が含まれる
ようにしたものであり、オーディオ信号とその信号の特
性である左右方向感情報の同期を取りながら符号化する
ことができるという作用を有する。According to a first aspect of the present invention, there is provided a method for encoding an audio signal, wherein information on a left and right direction of a sound image is included in a generated bit stream. This has the effect that encoding can be performed while synchronizing the audio signal and the left-right sense information, which is the characteristic of the audio signal.
【0012】請求項2に記載の発明は、オーディオ信号
の符号化方法において、生成されたビットストリーム中
に音像の拡がり感情報が含まれるようにしたものであ
り、オーディオ信号とその信号の特性である拡がり感情
報の同期を取りながら符号化することができるという作
用を有する。According to a second aspect of the present invention, in the audio signal encoding method, the generated bit stream includes information on a feeling of the spread of the sound image. This has an effect that encoding can be performed while synchronizing certain spread feeling information.
【0013】請求項3に記載の発明は、オーディオ信号
の復号方法において、ビットストリーム中に含まれた音
像の左右方向感情報を復号するようしたものであり、オ
ーディオ信号とその信号の特性である左右方向感情報の
同期を取りながら復号することができるという作用を有
する。According to a third aspect of the present invention, in the audio signal decoding method, the right and left direction sense information of the sound image included in the bit stream is decoded, and the audio signal and the characteristics of the signal are decoded. This has the effect that decoding can be performed while synchronizing the left-right direction sense information.
【0014】請求項4に記載の発明は、オーディオ信号
の復号方法において、生成されたビットストリーム中に
含まれた音像の拡がり感情報を復号するようにしたもの
であり、オーディオ信号とその信号の特性である拡がり
感情報の同期を取りながら復号することができるという
作用を有する。According to a fourth aspect of the present invention, in the audio signal decoding method, information on a feeling of spreading of a sound image included in a generated bit stream is decoded, and the audio signal and the signal of the signal are decoded. This has an effect that decoding can be performed while synchronizing the spread feeling information which is a characteristic.
【0015】請求項5に記載の発明は、入力されたオー
ディオサンプル信号に対しフィルタ処理および間引き処
理を行う写像部と、前記オーディオサンプル信号及び前
記写像部の出力から量子化及び符号化を制御するデータ
の組を生成する聴覚心理モデル部と、前記写像部の出力
を量子化及び符号化する量子化及び符号化部と、前記量
子化及び符号化部の出力とアンシラリデータから実際の
ビットストリームを組み立てるフレーム組立部とを備え
た符号器において、前記入力されたオーディオサンプル
信号の左右方向感情報を抽出して前記フレーム組立部に
送出する左右方向感抽出部を備え、前記フレーム組立部
が前記左右方向感情報をアンシラリデータに組み込むこ
とを特徴とする符号器であり、オーディオ信号とその信
号の特性である左右方向感情報の同期を取りながら符号
化することができるという作用を有する。According to a fifth aspect of the present invention, a mapping unit for performing a filtering process and a decimation process on an input audio sample signal, and controls quantization and encoding from the audio sample signal and the output of the mapping unit. A psychoacoustic model unit for generating a data set, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and an actual bit stream from the output of the quantization and encoding unit and ancillary data A frame assembling unit for assembling the input audio sample signal, comprising: a left-right sense extracting unit that extracts left-right sense information of the input audio sample signal and sends the information to the frame assembler; A coder that incorporates left-right sense information into ancillary data. An effect that can be encoded synchronously sense of direction information.
【0016】請求項6に記載の発明は、入力されたオー
ディオサンプル信号に対しフィルタ処理および間引き処
理を行う写像部と、前記オーディオサンプル信号及び前
記写像部の出力から量子化及び符号化を制御するデータ
の組を生成する聴覚心理モデル部と、前記写像部の出力
を量子化及び符号化する量子化及び符号化部と、前記量
子化及び符号化部の出力とアンシラリデータから実際の
ビットストリームを組み立てるフレーム組立部とを備え
た符号器において、前記入力されたオーディオサンプル
信号の拡がり感情報を抽出して前記フレーム組立部に送
出する拡がり感抽出部を備え、前記フレーム組立部が前
記拡がり感情報をアンシラリデータに組み込むことを特
徴とする符号器であり、オーディオ信号とその信号の特
性である拡がり感情報の同期を取りながら符号化するこ
とができるという作用を有する。According to a sixth aspect of the present invention, a mapping unit for performing a filtering process and a thinning-out process on an input audio sample signal, and controls quantization and encoding from the audio sample signal and the output of the mapping unit. A psychoacoustic model unit for generating a data set, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and an actual bit stream from the output of the quantization and encoding unit and ancillary data A frame assembling unit for assembling the input audio sample signal, wherein the frame assembling unit extracts a spreading feeling information of the input audio sample signal and sends the information to the frame assembling unit. A coder that incorporates information into ancillary data. An effect that can be encoded while synchronizing the broadcast.
【0017】請求項7に記載の発明は、入力された符号
化ビットストリームのフレームを分解するフレーム分解
部と、前記分解されたフレームのデータを復号する復元
部と、復号されたデータを元のオーディオサンプル信号
に戻す逆写像部とを備えた復号器において、前記フレー
ム分解部で得られたアンシラリデータから左右方向感情
報を再生し、前記逆写像部から出力されたオーディオサ
ンプル信号に前記左右方向感情報を付加して出力する左
右方向感再生部を備えた復号器であり、オーディオ信号
とその信号の特性である左右方向感情報の同期を取りな
がら復号することができるという作用を有する。According to a seventh aspect of the present invention, there is provided a frame decomposing unit for decomposing a frame of an input coded bit stream, a restoring unit for decoding the data of the decomposed frame, and A reverse mapping section for returning to an audio sample signal, the left and right direction information is reproduced from the ancillary data obtained by the frame decomposition section, and the left and right audio sample signals output from the reverse mapping section are converted to the left and right audio sample signals. The decoder is provided with a left / right sensation reproducing unit for adding and outputting directional perception information, and has an effect that decoding can be performed while synchronizing an audio signal with left / right sensation information which is a characteristic of the signal.
【0018】請求項8に記載の発明は、入力された符号
化ビットストリームのフレームを分解するフレーム分解
部と、前記分解されたフレームのデータを復号する復元
部と、復号されたデータを元のオーディオサンプル信号
に戻す逆写像部とを備えた復号器において、前記フレー
ム分解部で得られたアンシラリデータから拡がり感情報
を再生し、前記逆写像部から出力されたオーディオサン
プル信号に前記拡がり感情報を付加して出力する拡がり
感再生部を備えた復号器であり、オーディオ信号とその
信号の特性である拡がり感情報の同期を取りながら復号
することができるという作用を有する。The invention according to claim 8 is a frame decomposing unit for decomposing a frame of an input coded bit stream, a restoring unit for decoding the data of the decomposed frame, and An inverse mapping unit for returning to an audio sample signal, the information processing unit reproduces spread feeling information from the ancillary data obtained by the frame decomposing unit, and outputs the spread sense information to the audio sample signal output from the inverse mapping unit. This is a decoder including a spread feeling reproducing unit for adding and outputting information, and has an effect that decoding can be performed while synchronizing an audio signal and spread feeling information which is a characteristic of the signal.
【0019】以下、本発明の実施の形態について、図1
から図6を用いて説明する。 (実施の形態1)図1は実施の形態1におけるオーディ
オ信号および左右方向感が符号化されたビットストリー
ムフォーマットを示す。ビットストリームは1つ以上の
連続するフレームから構成され、図1には1フレームの
フォーマットのみを記述する。フレームは、ヘッダ、エ
ラーチェック、オーディオデータ、及びアンシラリデー
タから成る。Hereinafter, an embodiment of the present invention will be described with reference to FIG.
This will be described with reference to FIG. (Embodiment 1) FIG. 1 shows a bit stream format in which an audio signal and a sense of right and left directions are encoded in Embodiment 1. The bit stream is composed of one or more consecutive frames, and FIG. 1 describes only the format of one frame. The frame includes a header, an error check, audio data, and ancillary data.
【0020】アンシラリデータ中には音像の左右方向感
情報が符号化されている。左右方向感情報は、例えば、
0度を中心とすると、左右にそれぞれ90度の範囲で表
現することができるので、全体で180度分の情報が表
わされればよい。分解能を1度とすると、180通りの
データが表現されればよいこととなり、8ビットあれば
十分である。もし、分解能をもっと下げることが可能で
あれば、左右方向感を符号化するビット数を減らすこと
ができる。図1の場合は左右方向感が8ビットで表現さ
れ、その値は+40度である。In the ancillary data, left-right sense information of the sound image is encoded. The left / right direction sense information is, for example,
With 0 degrees as the center, it can be expressed in the range of 90 degrees to the left and right respectively, so that information of 180 degrees as a whole may be expressed. Assuming that the resolution is 1 degree, it is sufficient to represent 180 kinds of data, and 8 bits are sufficient. If the resolution can be further reduced, the number of bits for encoding the sense of right and left direction can be reduced. In the case of FIG. 1, the sense of right and left direction is represented by 8 bits, and its value is +40 degrees.
【0021】図2は符号器のブロックを示す。オーディ
オサンプルが符号器21に入力されると、写像部22
は、入力オーディオサンプルをフィルタ処理し、さらに
間引いた表現を生成する。聴覚心理モデル部23は、量
子化及び符号化を制御するデータの組を生成する。量子
化及び符号化部24は、レイヤ1、レイヤ2及びレイヤ
3のいずれかの符号化方法に従った処理を行う。左右方
向感抽出部26は、入力されたオーディオサンプルの左
右方向感を抽出し、フレーム組み立て部25に送る。フ
レーム組立部25は、量子化及び符号化部24の出力デ
ータ、左右方向感抽出部の出力データおよび符号器外部
から入力されたアンシラリデータから実際のビットスト
リームを組み立てて、その他の情報(例:エラーチェッ
ク)を必要に応じて付加する。FIG. 2 shows the blocks of the encoder. When the audio sample is input to the encoder 21, the mapping unit 22
Filters the input audio samples to produce a thinned representation. The psychoacoustic model unit 23 generates a data set for controlling quantization and encoding. The quantization and coding unit 24 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. The left / right sense extraction unit 26 extracts the left / right sense of the input audio sample and sends the extracted audio sample to the frame assembling unit 25. The frame assembling unit 25 assembles an actual bit stream from the output data of the quantization and encoding unit 24, the output data of the left / right sense extraction unit, and ancillary data input from outside the encoder, and outputs other information (eg, : Error check) is added as necessary.
【0022】(実施の形態2)図3は実施の形態2にお
けるオーディオ信号および拡がり感が符号化されたビッ
トストリームフォーマットを示す。ビットストリームは
1つ以上の連続するフレームから構成され、図3には1
フレームのフォーマットのみを記述する。フレームは、
ヘッダ、エラーチェック、オーディオデータ、及びアン
シラリデータから成る。(Embodiment 2) FIG. 3 shows an audio signal and a bit stream format in which a sense of spaciousness is encoded in Embodiment 2. A bit stream is made up of one or more consecutive frames,
Describe only the frame format. The frame is
It consists of a header, an error check, audio data, and ancillary data.
【0023】アンシラリデータ中には音像の拡がり感情
報が符号化されている。拡がり感情報は、例えば、0度
から180度の範囲で表現することができるので、全体
で180度分の情報が表わされればよい。分解能を1度
とすると、180通りのデータが表現されればよいこと
となり、8ビットあれば十分である。もし、分解能をも
っと下げることが可能であれば、拡がり感を符号化する
ビット数を減らすことができる。図3の場合は拡がり感
が8ビットで表現され、その値は+88度である。[0023] In the ancillary data, information about a feeling of spreading of a sound image is encoded. The spread feeling information can be expressed, for example, in a range from 0 degrees to 180 degrees, so that the information corresponding to 180 degrees as a whole may be expressed. Assuming that the resolution is 1 degree, it is sufficient to represent 180 kinds of data, and 8 bits are sufficient. If the resolution can be further reduced, the number of bits for encoding the feeling of spreading can be reduced. In the case of FIG. 3, the feeling of spreading is represented by 8 bits, and its value is +88 degrees.
【0024】図4は符号器のブロックを示す。オーディ
オサンプルが符号器41に入力されると、写像部42
は、入力オーディオサンプルをフィルタ処理し、さらに
間引いた表現を生成する。聴覚心理モデル部43は、量
子化及び符号化を制御するデータの組を生成する。量子
化及び符号化部44は、レイヤ1、レイヤ2及びレイヤ
3のいずれかの符号化方法に従った処理を行う。拡がり
感抽出部46は、入力されたオーディオサンプルの拡が
り感を抽出し、フレーム組み立て部45に送る。フレー
ム組立部45は、量子化及び符号化部44の出力デー
タ、拡がり感抽出部の出力データおよびと符号器外部か
ら入力されたアンシラリデータから実際のビットストリ
ームを組み立てて、その他の情報(例:エラーチェッ
ク)を必要に応じて付加する。FIG. 4 shows the blocks of the encoder. When the audio sample is input to the encoder 41, the mapping unit 42
Filters the input audio samples to produce a thinned representation. The psychoacoustic model unit 43 generates a data set for controlling the quantization and the encoding. The quantization and coding unit 44 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. The spaciousness extraction unit 46 extracts the spaciousness of the input audio sample and sends it to the frame assembling unit 45. The frame assembling unit 45 assembles an actual bit stream from the output data of the quantization and encoding unit 44, the output data of the spaciousness extracting unit, and the ancillary data input from outside the encoder. : Error check) is added as necessary.
【0025】(実施の形態3)図5は実施の形態3にお
ける復号器のブロックを示す。ビットストリームが復号
器51に入力されると、フレーム分解部52は、情報の
様々な部分を復元するために、ビットストリームを分離
する。復元部53は、一連の写像サンプルの量子化形を
復元する。逆写像部54は、これらの写像サンプルをP
CMオーディオサンプルに戻す。一方、左右方向感再生
部55は、アンシラリデータから左右方向感を復元し、
逆写像部54から出力されたPCMオーディオサンプル
に左右方向感情報を付加してオーディオサンプルを再生
する。(Embodiment 3) FIG. 5 shows a block diagram of a decoder according to Embodiment 3. When the bit stream is input to the decoder 51, the frame decomposer 52 separates the bit stream to recover various parts of the information. The restoration unit 53 restores a quantized form of a series of mapping samples. The inverse mapping unit 54 uses these mapping samples as P
Return to CM audio sample. On the other hand, the left / right sense reproduction unit 55 restores the left / right sense from the ancillary data,
The left and right sense information is added to the PCM audio sample output from the inverse mapping unit 54 to reproduce the audio sample.
【0026】(実施の形態4)図6は実施の形態4にお
ける復号器のブロックを示す。ビットストリームが復号
器61に入力されると、フレーム分解部62は、情報の
様々な部分を復元するために、ビットストリームを分離
する。復元部63は、一連の写像サンプルの量子化形を
復元する。逆写像部64は、これらの写像サンプルをP
CMオーディオサンプルに戻す。一方、拡がり感再生部
65は、アンシラリデータから拡がり感を復元し、逆写
像部64から出力されたPCMオーディオサンプルに拡
がり感情報を付加してオーディオサンプルを再生する。(Embodiment 4) FIG. 6 shows a block diagram of a decoder according to Embodiment 4. When the bit stream is input to the decoder 61, the frame decomposer 62 separates the bit stream to recover various parts of the information. The restoration unit 63 restores a quantized form of a series of mapping samples. The inverse mapping unit 64 converts these mapping samples into P
Return to CM audio sample. On the other hand, the spread feeling reproducing unit 65 restores the spread feeling from the ancillary data, and reproduces the audio sample by adding the spread feeling information to the PCM audio sample output from the inverse mapping unit 64.
【0027】[0027]
【発明の効果】以上のように、本発明によれば、MPEG1
オーディオのビットストリームのアンシラリデータ中に
音像の左右方向感および拡がり感情報を含むように符号
化することができるので、左右方向感および拡がり感情
報をオーディオ信号のビットストリームと分割して符号
化することがなく、このため、情報量が少なくなり、し
かもオーディオ信号と左右方向感および拡がり感ととの
同期を取ることが容易になる。As described above, according to the present invention, MPEG1
Since the ancillary data of the audio bit stream can be encoded so as to include the information on the sense of right and left and the sense of spread of the sound image, the information on the sense of right and left and spread is separated from the bit stream of the audio signal and encoded. Therefore, the amount of information is reduced, and it is easy to synchronize the audio signal with the left-right sense and the spread sense.
【0028】また、本発明によれば、音像の左右方向感
および拡がり感情報がアンシラリデータ中に含まれたビ
ットストリームを復号することができるので、オーディ
オ信号と同期した左右方向感および拡がり感情報を復号
し、PCMオーディオサンプルを再生することができる。Further, according to the present invention, since the bit stream in which the information about the sense of right and left and the spread of the sound image is included in the ancillary data can be decoded, the sense of right and left and the sense of spread synchronized with the audio signal can be decoded. The information can be decoded and the PCM audio samples can be played.
【図1】本発明の実施の形態1における左右方向感情報
を含むビットストリームフォーマット図FIG. 1 is a diagram illustrating a bit stream format including left-right sense information according to Embodiment 1 of the present invention.
【図2】本発明の実施の形態1における左右方向感情報
を含む符号器の構成を示すブロック図FIG. 2 is a block diagram showing a configuration of an encoder including left-right sense information according to Embodiment 1 of the present invention.
【図3】本発明の実施の形態2における拡がり感情報を
含むビットストリームフォーマット図FIG. 3 is a diagram illustrating a bit stream format including expansiveness information according to Embodiment 2 of the present invention.
【図4】本発明の実施の形態2における拡がり感情報を
含む符号器の構成を示すブロック図FIG. 4 is a block diagram showing a configuration of an encoder including spread feeling information according to Embodiment 2 of the present invention.
【図5】本発明の実施の形態3における左右方向感情報
を含む復号器の構成を示すブロック図FIG. 5 is a block diagram showing a configuration of a decoder including left-right sense information according to Embodiment 3 of the present invention.
【図6】本発明の実施の形態4における拡がり感情報を
含む復号器の構成を示すブロック図FIG. 6 is a block diagram showing a configuration of a decoder including spaciousness information according to Embodiment 4 of the present invention.
【図7】従来の符号器の構成を示すブロック図FIG. 7 is a block diagram showing a configuration of a conventional encoder.
【図8】従来の復号器の構成を示すブロック図FIG. 8 is a block diagram showing a configuration of a conventional decoder.
【図9】MPEG1レイヤ1のビットストリームフォーマッ
ト図FIG. 9 is a diagram illustrating a bit stream format of MPEG1 layer 1;
11,31,91 ヘッダ 12,32,92 エラーチェック 13,33,93 オーディオデータ 14,34,94 アンシラリデータ 15 左右方向感情報 21,41,71 符号器 22,42,72 写像部 23,43,73 聴覚心理モデル部 24,44,74 量子化及び符号化部 25,45,75 フレーム組立部 26 左右方向感抽出部 35 拡がり感情報 46 拡がり感抽出部 51,61,81 復号器 52,62,82 フレーム分解部 53,63,83 復元部 54,64,84 逆写像部 55 左右方向感再生部 65 拡がり感再生部 11, 31, 91 Header 12, 32, 92 Error check 13, 33, 93 Audio data 14, 34, 94 Ancillary data 15 Left / right direction sense information 21, 41, 71 Encoder 22, 42, 72 Mapping unit 23, 43 73, psychoacoustic model unit 24, 44, 74 quantization and encoding unit 25, 45, 75 frame assembling unit 26 left-right sense extracting unit 35 spreading sense information 46 spreading sense extracting unit 51, 61, 81 decoder 52, 62 , 82 Frame decomposing unit 53, 63, 83 Restoring unit 54, 64, 84 Inverse mapping unit 55 Left-right sense reproduction unit 65 Spread sense reproduction unit
Claims (8)
生成されたビットストリーム中に音像の左右方向感情報
が含まれることを特徴とするオーディオ信号の符号化方
法。1. A method for encoding an audio signal, comprising:
A method for encoding an audio signal, characterized in that the generated bit stream includes left-right sense information of a sound image.
生成されたビットストリーム中に音像の拡がり感情報が
含まれることを特徴とするオーディオ信号の符号化方
法。2. A method for encoding an audio signal, comprising:
A method for encoding an audio signal, characterized in that the generated bit stream includes information on a feeling of spreading of a sound image.
ットストリーム中に含まれた音像の左右方向感情報を復
号することを特徴とするオーディオ信号の復号方法。3. A method for decoding an audio signal, comprising decoding left-right sense information of a sound image included in a bit stream.
ットストリーム中に含まれた音像の拡がり感情報を復号
することを特徴とするオーディオ信号の復号方法。4. A method for decoding an audio signal, the method comprising: decoding information on a feeling of spreading of a sound image included in a bit stream.
しフィルタ処理および間引き処理を行う写像部と、前記
オーディオサンプル信号及び前記写像部の出力から量子
化及び符号化を制御するデータの組を生成する聴覚心理
モデル部と、前記写像部の出力を量子化及び符号化する
量子化及び符号化部と、前記量子化及び符号化部の出力
とアンシラリデータから実際のビットストリームを組み
立てるフレーム組立部とを備えた符号器において、前記
入力されたオーディオサンプル信号の左右方向感情報を
抽出して前記フレーム組立部に送出する左右方向感抽出
部を備え、前記フレーム組立部が前記左右方向感情報を
アンシラリデータに組み込むことを特徴とする符号器。5. An auditory unit for performing a filtering process and a decimation process on an input audio sample signal, and an auditory system for generating a set of data for controlling quantization and encoding from the audio sample signal and an output of the mapping unit. A psychological model unit, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and a frame assembling unit for assembling an actual bit stream from the output of the quantization and encoding unit and ancillary data. A coder for extracting left-right sense information of the input audio sample signal and sending the same to the frame assembler, wherein the frame assembler converts the left-right sense information into an ancillary image. An encoder characterized by being incorporated into data.
しフィルタ処理および間引き処理を行う写像部と、前記
オーディオサンプル信号及び前記写像部の出力から量子
化及び符号化を制御するデータの組を生成する聴覚心理
モデル部と、前記写像部の出力を量子化及び符号化する
量子化及び符号化部と、前記量子化及び符号化部の出力
とアンシラリデータから実際のビットストリームを組み
立てるフレーム組立部とを備えた符号器において、前記
入力されたオーディオサンプル信号の拡がり感情報を抽
出して前記フレーム組立部に送出する拡がり感抽出部を
備え、前記フレーム組立部が前記拡がり感情報をアンシ
ラリデータに組み込むことを特徴とする符号器。6. A mapping unit for performing a filtering process and a decimation process on an input audio sample signal, and an auditory system for generating a set of data for controlling quantization and encoding from the audio sample signal and an output of the mapping unit. A psychological model unit, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and a frame assembling unit for assembling an actual bit stream from the output of the quantization and encoding unit and ancillary data. An encoder having a spread extracting unit for extracting the spread sense information of the input audio sample signal and sending the spread sense information to the frame assembling unit, wherein the frame assembling unit incorporates the spread sense information into ancillary data An encoder characterized in that:
レームを分解するフレーム分解部と、前記分解されたフ
レームのデータを復号する復元部と、復号されたデータ
を元のオーディオサンプル信号に戻す逆写像部とを備え
た復号器において、前記フレーム分解部で得られたアン
シラリデータから左右方向感情報を再生し、前記逆写像
部から出力されたオーディオサンプル信号に前記左右方
向感情報を付加して出力する左右方向感再生部を備えた
復号器。7. A frame decomposer for decomposing a frame of an input coded bit stream, a decompression unit for decoding data of the decomposed frame, and an inverse mapping for returning the decoded data to an original audio sample signal. And a decoder comprising: a unit for reproducing left-right sense information from the ancillary data obtained by the frame decomposition unit, and adding the left-right sense information to an audio sample signal output from the inverse mapping unit. A decoder with a left-right directional sense reproduction unit that outputs.
レームを分解するフレーム分解部と、前記分解されたフ
レームのデータを復号する復元部と、復号されたデータ
を元のオーディオサンプル信号に戻す逆写像部とを備え
た復号器において、前記フレーム分解部で得られたアン
シラリデータから拡がり感情報を再生し、前記逆写像部
から出力されたオーディオサンプル信号に前記拡がり感
情報を付加して出力する拡がり感再生部を備えた復号
器。8. A frame decomposer for decomposing a frame of an input coded bit stream, a decompression unit for decoding data of the decomposed frame, and an inverse mapping for returning the decoded data to an original audio sample signal. And reproducing the spread sense information from the ancillary data obtained by the frame decomposing unit, and adding the spread sense information to the audio sample signal output from the inverse mapping unit and outputting the signal. A decoder with a spreading feeling reproduction unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10062989A JPH11262100A (en) | 1998-03-13 | 1998-03-13 | Audio signal encoding / decoding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10062989A JPH11262100A (en) | 1998-03-13 | 1998-03-13 | Audio signal encoding / decoding method and apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11262100A true JPH11262100A (en) | 1999-09-24 |
Family
ID=13216298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10062989A Pending JPH11262100A (en) | 1998-03-13 | 1998-03-13 | Audio signal encoding / decoding method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11262100A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006085183A (en) * | 2001-07-10 | 2006-03-30 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding application |
JP2009151183A (en) * | 2007-12-21 | 2009-07-09 | Ntt Docomo Inc | Multi-channel speech / acoustic signal encoding apparatus and method, and multi-channel speech / acoustic signal decoding apparatus and method |
US7698006B2 (en) | 2002-10-15 | 2010-04-13 | Electronics And Telecommunications Research Institute | Apparatus and method for adapting audio signal according to user's preference |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9431020B2 (en) | 2001-11-29 | 2016-08-30 | Dolby International Ab | Methods for improving high frequency reconstruction |
US9542950B2 (en) | 2002-09-18 | 2017-01-10 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
-
1998
- 1998-03-13 JP JP10062989A patent/JPH11262100A/en active Pending
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006085183A (en) * | 2001-07-10 | 2006-03-30 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding application |
US10902859B2 (en) | 2001-07-10 | 2021-01-26 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US10540982B2 (en) | 2001-07-10 | 2020-01-21 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
JP2011101406A (en) * | 2001-07-10 | 2011-05-19 | Dolby Internatl Ab | Efficient and scalable parametric stereo encoding for low bit rate audio encoding |
US8014534B2 (en) | 2001-07-10 | 2011-09-06 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8059826B2 (en) | 2001-07-10 | 2011-11-15 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8073144B2 (en) | 2001-07-10 | 2011-12-06 | Coding Technologies Ab | Stereo balance interpolation |
US8081763B2 (en) | 2001-07-10 | 2011-12-20 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8116460B2 (en) | 2001-07-10 | 2012-02-14 | Coding Technologies Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8243936B2 (en) | 2001-07-10 | 2012-08-14 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9218818B2 (en) | 2001-07-10 | 2015-12-22 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US10297261B2 (en) | 2001-07-10 | 2019-05-21 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9865271B2 (en) | 2001-07-10 | 2018-01-09 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9799340B2 (en) | 2001-07-10 | 2017-10-24 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US9799341B2 (en) | 2001-07-10 | 2017-10-24 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9792919B2 (en) | 2001-07-10 | 2017-10-17 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate applications |
US9792923B2 (en) | 2001-11-29 | 2017-10-17 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9779746B2 (en) | 2001-11-29 | 2017-10-03 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9761234B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9761236B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9761237B2 (en) | 2001-11-29 | 2017-09-12 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9812142B2 (en) | 2001-11-29 | 2017-11-07 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US9818418B2 (en) | 2001-11-29 | 2017-11-14 | Dolby International Ab | High frequency regeneration of an audio signal with synthetic sinusoid addition |
US11238876B2 (en) | 2001-11-29 | 2022-02-01 | Dolby International Ab | Methods for improving high frequency reconstruction |
US10403295B2 (en) | 2001-11-29 | 2019-09-03 | Dolby International Ab | Methods for improving high frequency reconstruction |
US9431020B2 (en) | 2001-11-29 | 2016-08-30 | Dolby International Ab | Methods for improving high frequency reconstruction |
US10115405B2 (en) | 2002-09-18 | 2018-10-30 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10013991B2 (en) | 2002-09-18 | 2018-07-03 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10157623B2 (en) | 2002-09-18 | 2018-12-18 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9990929B2 (en) | 2002-09-18 | 2018-06-05 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9542950B2 (en) | 2002-09-18 | 2017-01-10 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10418040B2 (en) | 2002-09-18 | 2019-09-17 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10685661B2 (en) | 2002-09-18 | 2020-06-16 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9842600B2 (en) | 2002-09-18 | 2017-12-12 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US11423916B2 (en) | 2002-09-18 | 2022-08-23 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US7698006B2 (en) | 2002-10-15 | 2010-04-13 | Electronics And Telecommunications Research Institute | Apparatus and method for adapting audio signal according to user's preference |
JP2009151183A (en) * | 2007-12-21 | 2009-07-09 | Ntt Docomo Inc | Multi-channel speech / acoustic signal encoding apparatus and method, and multi-channel speech / acoustic signal decoding apparatus and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2221329C2 (en) | Data coding method and device, data decoding method and device, data recording medium | |
JP4740548B2 (en) | Method and apparatus for encoding and decoding using bandwidth extension technology | |
JP3352406B2 (en) | Audio signal encoding and decoding method and apparatus | |
JP4063508B2 (en) | Bit rate conversion device and bit rate conversion method | |
JPWO2005081229A1 (en) | Audio encoder and audio decoder | |
JP2004004578A (en) | Apparatus and method for scalable lossless audio encoding / decoding | |
JP3466080B2 (en) | Digital data encoding / decoding method and apparatus | |
KR20040054235A (en) | Scalable stereo audio coding/encoding method and apparatus thereof | |
JPH11262100A (en) | Audio signal encoding / decoding method and apparatus | |
JP3331194B2 (en) | 3D color ultrasound image encoding and decoding system | |
WO2007136930B1 (en) | Video/image compression using model plus difference image | |
JP4835648B2 (en) | Speech encoding method and speech decoding method | |
JP4367450B2 (en) | Audio signal transmission method and audio signal decoding method | |
JP2904427B2 (en) | Missing voice interpolation device | |
JPH10178349A (en) | Audio signal encoding method and decoding method | |
US20010039495A1 (en) | Linking internet documents with compressed audio files | |
JPH10294943A (en) | Video signal encoding system, video signal encoding device, video signal decoding system, and video signal decoding device | |
CN1152843A (en) | Image/audio coding and decoding device | |
KR20050089868A (en) | Video coding and decoding method | |
JP4367449B2 (en) | Audio signal transmission method and audio signal decoding method | |
JP4367453B2 (en) | Audio signal transmission method and audio signal decoding method | |
JP4367451B2 (en) | Audio signal transmission method and audio signal decoding method | |
JP4367446B2 (en) | Audio signal transmission method, audio signal decoding method, and audio encoding method | |
JP4367452B2 (en) | Audio signal transmission method and audio signal decoding method | |
JP4367448B2 (en) | Audio signal transmission method and audio signal decoding method |