[go: up one dir, main page]

JPH11262100A - Audio signal encoding / decoding method and apparatus - Google Patents

Audio signal encoding / decoding method and apparatus

Info

Publication number
JPH11262100A
JPH11262100A JP10062989A JP6298998A JPH11262100A JP H11262100 A JPH11262100 A JP H11262100A JP 10062989 A JP10062989 A JP 10062989A JP 6298998 A JP6298998 A JP 6298998A JP H11262100 A JPH11262100 A JP H11262100A
Authority
JP
Japan
Prior art keywords
unit
encoding
frame
bit stream
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10062989A
Other languages
Japanese (ja)
Inventor
Michiyo Goto
藤 道 代 後
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10062989A priority Critical patent/JPH11262100A/en
Publication of JPH11262100A publication Critical patent/JPH11262100A/en
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

(57)【要約】 【課題】 デジタルオーディオ信号を符号化/復号する
際に、左右方向感情報または拡がり感情報を同時に符号
化/復号することを目的とする。 【解決手段】 オーディオ信号の符号化方法において、
ビットストリームのアンシラリデータ中に左右方向感情
報または拡がり感情報を含んで符号化することにより、
オーディオ信号と左右方向感または拡がり感との同期を
取ることが容易になる。復号に際しては、再生した左右
方向感または拡がり感をオーディオ信号に付加して出力
する。
(57) [Summary] [PROBLEMS] To encode / decode left / right sense information or spread sense information simultaneously when encoding / decoding a digital audio signal. SOLUTION: In the encoding method of the audio signal,
By encoding the bitstream ancillary data including the left-right sense information or the spread sense information,
It becomes easy to synchronize the audio signal with the left-right sense or the spread sense. At the time of decoding, the reproduced left-right sense or spread sense is added to the audio signal and output.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音像の左右方向感
および拡がり感も含めたオーディオ信号の符号化及び復
号の方法およびその装置に関するものである。
[0001] 1. Field of the Invention [0002] The present invention relates to a method and apparatus for encoding and decoding an audio signal including a sense of right and left and a sense of spread of a sound image.

【0002】[0002]

【従来の技術】近年、デジタルオーディオ信号の符号化
方法の開発が活発になり、特に高品質のオーディオ符号
化方法として、MPEG1オーディオ符号化(ISO/IEC 1117
2-3)が知られている。
2. Description of the Related Art In recent years, a digital audio signal encoding method has been actively developed. In particular, MPEG1 audio encoding (ISO / IEC 1117) has been proposed as a high quality audio encoding method.
2-3) is known.

【0003】図7はMPEG1オーディオ符号化の符号器の
基本構造を示すブロック図である。オーディオサンプル
が符号器71に入力されると、写像部72は、入力オー
ディオサンプルをフィルタ処理し、さらに間引いた表現
を生成する。聴覚心理モデル部73は、量子化及び符号
化を制御するデータの組を生成する。量子化及び符号化
部74は、レイヤ1、レイヤ2及びレイヤ3のいずれか
の符号化方法に従った処理を行う。フレーム組立部75
は、量子化及び符号化部74の出力データとアンシラリ
データから実際のビットストリームを組み立てて、その
他の情報(例:エラーチェック)を必要に応じて付加す
る。
FIG. 7 is a block diagram showing a basic structure of an encoder for MPEG1 audio encoding. When audio samples are input to the encoder 71, the mapping unit 72 filters the input audio samples and generates a thinned representation. The psychoacoustic model unit 73 generates a data set that controls quantization and encoding. The quantization and coding unit 74 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. Frame assembly part 75
Constructs an actual bit stream from the output data of the quantization and encoding unit 74 and the ancillary data, and adds other information (eg, error check) as necessary.

【0004】図8はMPEG1オーディオ符号化の復号器の
基本構造を示すブロック図である。ビットストリームが
復号器81に入力されると、フレーム分解部82は、情
報の様々な部分を復元するために、ビットストリームを
分離する。復元部83は、一連の写像サンプルの量子化
形を復元する。逆写像部84は、これらの写像サンプル
をPCMオーディオサンプルに戻す。
FIG. 8 is a block diagram showing a basic structure of a decoder for MPEG1 audio encoding. When the bit stream is input to the decoder 81, the frame decomposer 82 separates the bit stream to recover various parts of the information. The restoration unit 83 restores a quantized form of a series of mapping samples. The inverse mapping unit 84 returns these mapping samples to PCM audio samples.

【0005】MPEG1オーディオで生成されるビットスト
リームには、レイヤ1、レイヤ2およびレイヤ3という
3種類からなる。レイヤが増すにしたがって符号化のア
ルゴリズムの複雑さも増大するが、低ビットレートでも
音質のよい効率的な符号化を実現することができる。こ
こでは簡単のため、レイヤ1で説明する。
[0005] A bit stream generated by MPEG1 audio is composed of three types: layer 1, layer 2 and layer 3. Although the complexity of the coding algorithm increases as the number of layers increases, efficient coding with good sound quality can be realized even at a low bit rate. Here, for the sake of simplicity, description will be made on layer 1.

【0006】レイヤ1のビットストリームを模式図で示
すと、図9のようになる。図9はMPEG1オーディオ符号
化レイヤ1のビットストリームフォーマットを示す。ビ
ットストリームは1つ以上の連続するフレームから構成
され、図9は1フレームのフォーマットである。フレー
ムは、ヘッダ、エラーチェック、オーディオデータであ
るビット割当て、スケールファクタ及びサンプル、並び
にアンシラリデータから成る。
FIG. 9 is a schematic diagram showing a layer 1 bit stream. FIG. 9 shows a bit stream format of the MPEG1 audio encoding layer 1. The bit stream is composed of one or more consecutive frames, and FIG. 9 is a format of one frame. The frame is composed of a header, an error check, bit allocation as audio data, scale factors and samples, and ancillary data.

【0007】[0007]

【発明が解決しようとする課題】従来の方法では、文字
情報などのオーディオデータ以外の情報をビットストリ
ーム中に含める場合はアンシラリデータの中に符号化す
る。しかしながら、音像の左右方向感や拡がり感のよう
にオーディオ信号に関係した情報を符号化する方法が明
確に規定されていなかった。このため、本来、オーディ
オ信号とその信号の特性である左右方向感や拡がり感情
報が符号化されない、もしくはオーディオ信号とは別に
符号化されてしまうために、同期がとりにくい、といっ
た問題があった。
In the conventional method, when information other than audio data such as character information is included in a bit stream, it is encoded in ancillary data. However, a method of encoding information related to an audio signal, such as a sense of right and left directions and a sense of spread of a sound image, has not been clearly defined. For this reason, there has been a problem that the audio signal and the characteristic of the signal, that is, the feeling in the left-right direction and the feeling of spread, are not encoded, or are encoded separately from the audio signal, so that it is difficult to achieve synchronization. .

【0008】本発明は、このような従来の問題点を解決
するものであり、入力されたオーディオ信号から抽出さ
れた音像の左右方向感および拡がり感を、オーディオ信
号と同期してオーディオビットストリームのアンシラリ
データ中に符号化し、それを復号するオーディオ信号の
符号化/復号方法およびその装置を提供することを目的
とするものである。
SUMMARY OF THE INVENTION The present invention solves such a conventional problem. The present invention provides a method of extracting the right and left direction and the spread of a sound image extracted from an input audio signal in synchronization with the audio signal. An object of the present invention is to provide an audio signal encoding / decoding method and an apparatus for encoding and decoding ancillary data.

【0009】[0009]

【課題を解決するための手段】本発明は、上記目的を達
成するために、音像の左右方向感および拡がり感を抽出
し、オーディオのビットストリームのアンシラリデータ
中に音像の左右方向感情報および拡がり感情報を符号化
するようにしたものである。
SUMMARY OF THE INVENTION In order to achieve the above object, the present invention extracts a sense of right and left direction and a sense of spread of a sound image, and includes information on right and left sense of the sound image in ancillary data of an audio bit stream. The spreading feeling information is encoded.

【0010】また、本発明は、上記目的を達成するため
に、オーディオのビットストリームのアンシラリデータ
中から音像の左右方向感情報および拡がり感情報を復号
し、オーディオ信号を再生するようにしたものである。
Further, in order to achieve the above object, the present invention decodes left-right sense information and spread sense information of a sound image from ancillary data of an audio bit stream and reproduces an audio signal. It is.

【0011】[0011]

【発明の実施の形態】本発明の請求項1に記載の発明
は、オーディオ信号の符号化方法において、生成された
ビットストリーム中に音像の左右方向感情報が含まれる
ようにしたものであり、オーディオ信号とその信号の特
性である左右方向感情報の同期を取りながら符号化する
ことができるという作用を有する。
According to a first aspect of the present invention, there is provided a method for encoding an audio signal, wherein information on a left and right direction of a sound image is included in a generated bit stream. This has the effect that encoding can be performed while synchronizing the audio signal and the left-right sense information, which is the characteristic of the audio signal.

【0012】請求項2に記載の発明は、オーディオ信号
の符号化方法において、生成されたビットストリーム中
に音像の拡がり感情報が含まれるようにしたものであ
り、オーディオ信号とその信号の特性である拡がり感情
報の同期を取りながら符号化することができるという作
用を有する。
According to a second aspect of the present invention, in the audio signal encoding method, the generated bit stream includes information on a feeling of the spread of the sound image. This has an effect that encoding can be performed while synchronizing certain spread feeling information.

【0013】請求項3に記載の発明は、オーディオ信号
の復号方法において、ビットストリーム中に含まれた音
像の左右方向感情報を復号するようしたものであり、オ
ーディオ信号とその信号の特性である左右方向感情報の
同期を取りながら復号することができるという作用を有
する。
According to a third aspect of the present invention, in the audio signal decoding method, the right and left direction sense information of the sound image included in the bit stream is decoded, and the audio signal and the characteristics of the signal are decoded. This has the effect that decoding can be performed while synchronizing the left-right direction sense information.

【0014】請求項4に記載の発明は、オーディオ信号
の復号方法において、生成されたビットストリーム中に
含まれた音像の拡がり感情報を復号するようにしたもの
であり、オーディオ信号とその信号の特性である拡がり
感情報の同期を取りながら復号することができるという
作用を有する。
According to a fourth aspect of the present invention, in the audio signal decoding method, information on a feeling of spreading of a sound image included in a generated bit stream is decoded, and the audio signal and the signal of the signal are decoded. This has an effect that decoding can be performed while synchronizing the spread feeling information which is a characteristic.

【0015】請求項5に記載の発明は、入力されたオー
ディオサンプル信号に対しフィルタ処理および間引き処
理を行う写像部と、前記オーディオサンプル信号及び前
記写像部の出力から量子化及び符号化を制御するデータ
の組を生成する聴覚心理モデル部と、前記写像部の出力
を量子化及び符号化する量子化及び符号化部と、前記量
子化及び符号化部の出力とアンシラリデータから実際の
ビットストリームを組み立てるフレーム組立部とを備え
た符号器において、前記入力されたオーディオサンプル
信号の左右方向感情報を抽出して前記フレーム組立部に
送出する左右方向感抽出部を備え、前記フレーム組立部
が前記左右方向感情報をアンシラリデータに組み込むこ
とを特徴とする符号器であり、オーディオ信号とその信
号の特性である左右方向感情報の同期を取りながら符号
化することができるという作用を有する。
According to a fifth aspect of the present invention, a mapping unit for performing a filtering process and a decimation process on an input audio sample signal, and controls quantization and encoding from the audio sample signal and the output of the mapping unit. A psychoacoustic model unit for generating a data set, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and an actual bit stream from the output of the quantization and encoding unit and ancillary data A frame assembling unit for assembling the input audio sample signal, comprising: a left-right sense extracting unit that extracts left-right sense information of the input audio sample signal and sends the information to the frame assembler; A coder that incorporates left-right sense information into ancillary data. An effect that can be encoded synchronously sense of direction information.

【0016】請求項6に記載の発明は、入力されたオー
ディオサンプル信号に対しフィルタ処理および間引き処
理を行う写像部と、前記オーディオサンプル信号及び前
記写像部の出力から量子化及び符号化を制御するデータ
の組を生成する聴覚心理モデル部と、前記写像部の出力
を量子化及び符号化する量子化及び符号化部と、前記量
子化及び符号化部の出力とアンシラリデータから実際の
ビットストリームを組み立てるフレーム組立部とを備え
た符号器において、前記入力されたオーディオサンプル
信号の拡がり感情報を抽出して前記フレーム組立部に送
出する拡がり感抽出部を備え、前記フレーム組立部が前
記拡がり感情報をアンシラリデータに組み込むことを特
徴とする符号器であり、オーディオ信号とその信号の特
性である拡がり感情報の同期を取りながら符号化するこ
とができるという作用を有する。
According to a sixth aspect of the present invention, a mapping unit for performing a filtering process and a thinning-out process on an input audio sample signal, and controls quantization and encoding from the audio sample signal and the output of the mapping unit. A psychoacoustic model unit for generating a data set, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and an actual bit stream from the output of the quantization and encoding unit and ancillary data A frame assembling unit for assembling the input audio sample signal, wherein the frame assembling unit extracts a spreading feeling information of the input audio sample signal and sends the information to the frame assembling unit. A coder that incorporates information into ancillary data. An effect that can be encoded while synchronizing the broadcast.

【0017】請求項7に記載の発明は、入力された符号
化ビットストリームのフレームを分解するフレーム分解
部と、前記分解されたフレームのデータを復号する復元
部と、復号されたデータを元のオーディオサンプル信号
に戻す逆写像部とを備えた復号器において、前記フレー
ム分解部で得られたアンシラリデータから左右方向感情
報を再生し、前記逆写像部から出力されたオーディオサ
ンプル信号に前記左右方向感情報を付加して出力する左
右方向感再生部を備えた復号器であり、オーディオ信号
とその信号の特性である左右方向感情報の同期を取りな
がら復号することができるという作用を有する。
According to a seventh aspect of the present invention, there is provided a frame decomposing unit for decomposing a frame of an input coded bit stream, a restoring unit for decoding the data of the decomposed frame, and A reverse mapping section for returning to an audio sample signal, the left and right direction information is reproduced from the ancillary data obtained by the frame decomposition section, and the left and right audio sample signals output from the reverse mapping section are converted to the left and right audio sample signals. The decoder is provided with a left / right sensation reproducing unit for adding and outputting directional perception information, and has an effect that decoding can be performed while synchronizing an audio signal with left / right sensation information which is a characteristic of the signal.

【0018】請求項8に記載の発明は、入力された符号
化ビットストリームのフレームを分解するフレーム分解
部と、前記分解されたフレームのデータを復号する復元
部と、復号されたデータを元のオーディオサンプル信号
に戻す逆写像部とを備えた復号器において、前記フレー
ム分解部で得られたアンシラリデータから拡がり感情報
を再生し、前記逆写像部から出力されたオーディオサン
プル信号に前記拡がり感情報を付加して出力する拡がり
感再生部を備えた復号器であり、オーディオ信号とその
信号の特性である拡がり感情報の同期を取りながら復号
することができるという作用を有する。
The invention according to claim 8 is a frame decomposing unit for decomposing a frame of an input coded bit stream, a restoring unit for decoding the data of the decomposed frame, and An inverse mapping unit for returning to an audio sample signal, the information processing unit reproduces spread feeling information from the ancillary data obtained by the frame decomposing unit, and outputs the spread sense information to the audio sample signal output from the inverse mapping unit. This is a decoder including a spread feeling reproducing unit for adding and outputting information, and has an effect that decoding can be performed while synchronizing an audio signal and spread feeling information which is a characteristic of the signal.

【0019】以下、本発明の実施の形態について、図1
から図6を用いて説明する。 (実施の形態1)図1は実施の形態1におけるオーディ
オ信号および左右方向感が符号化されたビットストリー
ムフォーマットを示す。ビットストリームは1つ以上の
連続するフレームから構成され、図1には1フレームの
フォーマットのみを記述する。フレームは、ヘッダ、エ
ラーチェック、オーディオデータ、及びアンシラリデー
タから成る。
Hereinafter, an embodiment of the present invention will be described with reference to FIG.
This will be described with reference to FIG. (Embodiment 1) FIG. 1 shows a bit stream format in which an audio signal and a sense of right and left directions are encoded in Embodiment 1. The bit stream is composed of one or more consecutive frames, and FIG. 1 describes only the format of one frame. The frame includes a header, an error check, audio data, and ancillary data.

【0020】アンシラリデータ中には音像の左右方向感
情報が符号化されている。左右方向感情報は、例えば、
0度を中心とすると、左右にそれぞれ90度の範囲で表
現することができるので、全体で180度分の情報が表
わされればよい。分解能を1度とすると、180通りの
データが表現されればよいこととなり、8ビットあれば
十分である。もし、分解能をもっと下げることが可能で
あれば、左右方向感を符号化するビット数を減らすこと
ができる。図1の場合は左右方向感が8ビットで表現さ
れ、その値は+40度である。
In the ancillary data, left-right sense information of the sound image is encoded. The left / right direction sense information is, for example,
With 0 degrees as the center, it can be expressed in the range of 90 degrees to the left and right respectively, so that information of 180 degrees as a whole may be expressed. Assuming that the resolution is 1 degree, it is sufficient to represent 180 kinds of data, and 8 bits are sufficient. If the resolution can be further reduced, the number of bits for encoding the sense of right and left direction can be reduced. In the case of FIG. 1, the sense of right and left direction is represented by 8 bits, and its value is +40 degrees.

【0021】図2は符号器のブロックを示す。オーディ
オサンプルが符号器21に入力されると、写像部22
は、入力オーディオサンプルをフィルタ処理し、さらに
間引いた表現を生成する。聴覚心理モデル部23は、量
子化及び符号化を制御するデータの組を生成する。量子
化及び符号化部24は、レイヤ1、レイヤ2及びレイヤ
3のいずれかの符号化方法に従った処理を行う。左右方
向感抽出部26は、入力されたオーディオサンプルの左
右方向感を抽出し、フレーム組み立て部25に送る。フ
レーム組立部25は、量子化及び符号化部24の出力デ
ータ、左右方向感抽出部の出力データおよび符号器外部
から入力されたアンシラリデータから実際のビットスト
リームを組み立てて、その他の情報(例:エラーチェッ
ク)を必要に応じて付加する。
FIG. 2 shows the blocks of the encoder. When the audio sample is input to the encoder 21, the mapping unit 22
Filters the input audio samples to produce a thinned representation. The psychoacoustic model unit 23 generates a data set for controlling quantization and encoding. The quantization and coding unit 24 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. The left / right sense extraction unit 26 extracts the left / right sense of the input audio sample and sends the extracted audio sample to the frame assembling unit 25. The frame assembling unit 25 assembles an actual bit stream from the output data of the quantization and encoding unit 24, the output data of the left / right sense extraction unit, and ancillary data input from outside the encoder, and outputs other information (eg, : Error check) is added as necessary.

【0022】(実施の形態2)図3は実施の形態2にお
けるオーディオ信号および拡がり感が符号化されたビッ
トストリームフォーマットを示す。ビットストリームは
1つ以上の連続するフレームから構成され、図3には1
フレームのフォーマットのみを記述する。フレームは、
ヘッダ、エラーチェック、オーディオデータ、及びアン
シラリデータから成る。
(Embodiment 2) FIG. 3 shows an audio signal and a bit stream format in which a sense of spaciousness is encoded in Embodiment 2. A bit stream is made up of one or more consecutive frames,
Describe only the frame format. The frame is
It consists of a header, an error check, audio data, and ancillary data.

【0023】アンシラリデータ中には音像の拡がり感情
報が符号化されている。拡がり感情報は、例えば、0度
から180度の範囲で表現することができるので、全体
で180度分の情報が表わされればよい。分解能を1度
とすると、180通りのデータが表現されればよいこと
となり、8ビットあれば十分である。もし、分解能をも
っと下げることが可能であれば、拡がり感を符号化する
ビット数を減らすことができる。図3の場合は拡がり感
が8ビットで表現され、その値は+88度である。
[0023] In the ancillary data, information about a feeling of spreading of a sound image is encoded. The spread feeling information can be expressed, for example, in a range from 0 degrees to 180 degrees, so that the information corresponding to 180 degrees as a whole may be expressed. Assuming that the resolution is 1 degree, it is sufficient to represent 180 kinds of data, and 8 bits are sufficient. If the resolution can be further reduced, the number of bits for encoding the feeling of spreading can be reduced. In the case of FIG. 3, the feeling of spreading is represented by 8 bits, and its value is +88 degrees.

【0024】図4は符号器のブロックを示す。オーディ
オサンプルが符号器41に入力されると、写像部42
は、入力オーディオサンプルをフィルタ処理し、さらに
間引いた表現を生成する。聴覚心理モデル部43は、量
子化及び符号化を制御するデータの組を生成する。量子
化及び符号化部44は、レイヤ1、レイヤ2及びレイヤ
3のいずれかの符号化方法に従った処理を行う。拡がり
感抽出部46は、入力されたオーディオサンプルの拡が
り感を抽出し、フレーム組み立て部45に送る。フレー
ム組立部45は、量子化及び符号化部44の出力デー
タ、拡がり感抽出部の出力データおよびと符号器外部か
ら入力されたアンシラリデータから実際のビットストリ
ームを組み立てて、その他の情報(例:エラーチェッ
ク)を必要に応じて付加する。
FIG. 4 shows the blocks of the encoder. When the audio sample is input to the encoder 41, the mapping unit 42
Filters the input audio samples to produce a thinned representation. The psychoacoustic model unit 43 generates a data set for controlling the quantization and the encoding. The quantization and coding unit 44 performs a process according to any of the layer 1, layer 2, and layer 3 coding methods. The spaciousness extraction unit 46 extracts the spaciousness of the input audio sample and sends it to the frame assembling unit 45. The frame assembling unit 45 assembles an actual bit stream from the output data of the quantization and encoding unit 44, the output data of the spaciousness extracting unit, and the ancillary data input from outside the encoder. : Error check) is added as necessary.

【0025】(実施の形態3)図5は実施の形態3にお
ける復号器のブロックを示す。ビットストリームが復号
器51に入力されると、フレーム分解部52は、情報の
様々な部分を復元するために、ビットストリームを分離
する。復元部53は、一連の写像サンプルの量子化形を
復元する。逆写像部54は、これらの写像サンプルをP
CMオーディオサンプルに戻す。一方、左右方向感再生
部55は、アンシラリデータから左右方向感を復元し、
逆写像部54から出力されたPCMオーディオサンプル
に左右方向感情報を付加してオーディオサンプルを再生
する。
(Embodiment 3) FIG. 5 shows a block diagram of a decoder according to Embodiment 3. When the bit stream is input to the decoder 51, the frame decomposer 52 separates the bit stream to recover various parts of the information. The restoration unit 53 restores a quantized form of a series of mapping samples. The inverse mapping unit 54 uses these mapping samples as P
Return to CM audio sample. On the other hand, the left / right sense reproduction unit 55 restores the left / right sense from the ancillary data,
The left and right sense information is added to the PCM audio sample output from the inverse mapping unit 54 to reproduce the audio sample.

【0026】(実施の形態4)図6は実施の形態4にお
ける復号器のブロックを示す。ビットストリームが復号
器61に入力されると、フレーム分解部62は、情報の
様々な部分を復元するために、ビットストリームを分離
する。復元部63は、一連の写像サンプルの量子化形を
復元する。逆写像部64は、これらの写像サンプルをP
CMオーディオサンプルに戻す。一方、拡がり感再生部
65は、アンシラリデータから拡がり感を復元し、逆写
像部64から出力されたPCMオーディオサンプルに拡
がり感情報を付加してオーディオサンプルを再生する。
(Embodiment 4) FIG. 6 shows a block diagram of a decoder according to Embodiment 4. When the bit stream is input to the decoder 61, the frame decomposer 62 separates the bit stream to recover various parts of the information. The restoration unit 63 restores a quantized form of a series of mapping samples. The inverse mapping unit 64 converts these mapping samples into P
Return to CM audio sample. On the other hand, the spread feeling reproducing unit 65 restores the spread feeling from the ancillary data, and reproduces the audio sample by adding the spread feeling information to the PCM audio sample output from the inverse mapping unit 64.

【0027】[0027]

【発明の効果】以上のように、本発明によれば、MPEG1
オーディオのビットストリームのアンシラリデータ中に
音像の左右方向感および拡がり感情報を含むように符号
化することができるので、左右方向感および拡がり感情
報をオーディオ信号のビットストリームと分割して符号
化することがなく、このため、情報量が少なくなり、し
かもオーディオ信号と左右方向感および拡がり感ととの
同期を取ることが容易になる。
As described above, according to the present invention, MPEG1
Since the ancillary data of the audio bit stream can be encoded so as to include the information on the sense of right and left and the sense of spread of the sound image, the information on the sense of right and left and spread is separated from the bit stream of the audio signal and encoded. Therefore, the amount of information is reduced, and it is easy to synchronize the audio signal with the left-right sense and the spread sense.

【0028】また、本発明によれば、音像の左右方向感
および拡がり感情報がアンシラリデータ中に含まれたビ
ットストリームを復号することができるので、オーディ
オ信号と同期した左右方向感および拡がり感情報を復号
し、PCMオーディオサンプルを再生することができる。
Further, according to the present invention, since the bit stream in which the information about the sense of right and left and the spread of the sound image is included in the ancillary data can be decoded, the sense of right and left and the sense of spread synchronized with the audio signal can be decoded. The information can be decoded and the PCM audio samples can be played.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1における左右方向感情報
を含むビットストリームフォーマット図
FIG. 1 is a diagram illustrating a bit stream format including left-right sense information according to Embodiment 1 of the present invention.

【図2】本発明の実施の形態1における左右方向感情報
を含む符号器の構成を示すブロック図
FIG. 2 is a block diagram showing a configuration of an encoder including left-right sense information according to Embodiment 1 of the present invention.

【図3】本発明の実施の形態2における拡がり感情報を
含むビットストリームフォーマット図
FIG. 3 is a diagram illustrating a bit stream format including expansiveness information according to Embodiment 2 of the present invention.

【図4】本発明の実施の形態2における拡がり感情報を
含む符号器の構成を示すブロック図
FIG. 4 is a block diagram showing a configuration of an encoder including spread feeling information according to Embodiment 2 of the present invention.

【図5】本発明の実施の形態3における左右方向感情報
を含む復号器の構成を示すブロック図
FIG. 5 is a block diagram showing a configuration of a decoder including left-right sense information according to Embodiment 3 of the present invention.

【図6】本発明の実施の形態4における拡がり感情報を
含む復号器の構成を示すブロック図
FIG. 6 is a block diagram showing a configuration of a decoder including spaciousness information according to Embodiment 4 of the present invention.

【図7】従来の符号器の構成を示すブロック図FIG. 7 is a block diagram showing a configuration of a conventional encoder.

【図8】従来の復号器の構成を示すブロック図FIG. 8 is a block diagram showing a configuration of a conventional decoder.

【図9】MPEG1レイヤ1のビットストリームフォーマッ
ト図
FIG. 9 is a diagram illustrating a bit stream format of MPEG1 layer 1;

【符号の説明】[Explanation of symbols]

11,31,91 ヘッダ 12,32,92 エラーチェック 13,33,93 オーディオデータ 14,34,94 アンシラリデータ 15 左右方向感情報 21,41,71 符号器 22,42,72 写像部 23,43,73 聴覚心理モデル部 24,44,74 量子化及び符号化部 25,45,75 フレーム組立部 26 左右方向感抽出部 35 拡がり感情報 46 拡がり感抽出部 51,61,81 復号器 52,62,82 フレーム分解部 53,63,83 復元部 54,64,84 逆写像部 55 左右方向感再生部 65 拡がり感再生部 11, 31, 91 Header 12, 32, 92 Error check 13, 33, 93 Audio data 14, 34, 94 Ancillary data 15 Left / right direction sense information 21, 41, 71 Encoder 22, 42, 72 Mapping unit 23, 43 73, psychoacoustic model unit 24, 44, 74 quantization and encoding unit 25, 45, 75 frame assembling unit 26 left-right sense extracting unit 35 spreading sense information 46 spreading sense extracting unit 51, 61, 81 decoder 52, 62 , 82 Frame decomposing unit 53, 63, 83 Restoring unit 54, 64, 84 Inverse mapping unit 55 Left-right sense reproduction unit 65 Spread sense reproduction unit

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 オーディオ信号の符号化方法において、
生成されたビットストリーム中に音像の左右方向感情報
が含まれることを特徴とするオーディオ信号の符号化方
法。
1. A method for encoding an audio signal, comprising:
A method for encoding an audio signal, characterized in that the generated bit stream includes left-right sense information of a sound image.
【請求項2】 オーディオ信号の符号化方法において、
生成されたビットストリーム中に音像の拡がり感情報が
含まれることを特徴とするオーディオ信号の符号化方
法。
2. A method for encoding an audio signal, comprising:
A method for encoding an audio signal, characterized in that the generated bit stream includes information on a feeling of spreading of a sound image.
【請求項3】 オーディオ信号の復号方法において、ビ
ットストリーム中に含まれた音像の左右方向感情報を復
号することを特徴とするオーディオ信号の復号方法。
3. A method for decoding an audio signal, comprising decoding left-right sense information of a sound image included in a bit stream.
【請求項4】 オーディオ信号の復号方法において、ビ
ットストリーム中に含まれた音像の拡がり感情報を復号
することを特徴とするオーディオ信号の復号方法。
4. A method for decoding an audio signal, the method comprising: decoding information on a feeling of spreading of a sound image included in a bit stream.
【請求項5】 入力されたオーディオサンプル信号に対
しフィルタ処理および間引き処理を行う写像部と、前記
オーディオサンプル信号及び前記写像部の出力から量子
化及び符号化を制御するデータの組を生成する聴覚心理
モデル部と、前記写像部の出力を量子化及び符号化する
量子化及び符号化部と、前記量子化及び符号化部の出力
とアンシラリデータから実際のビットストリームを組み
立てるフレーム組立部とを備えた符号器において、前記
入力されたオーディオサンプル信号の左右方向感情報を
抽出して前記フレーム組立部に送出する左右方向感抽出
部を備え、前記フレーム組立部が前記左右方向感情報を
アンシラリデータに組み込むことを特徴とする符号器。
5. An auditory unit for performing a filtering process and a decimation process on an input audio sample signal, and an auditory system for generating a set of data for controlling quantization and encoding from the audio sample signal and an output of the mapping unit. A psychological model unit, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and a frame assembling unit for assembling an actual bit stream from the output of the quantization and encoding unit and ancillary data. A coder for extracting left-right sense information of the input audio sample signal and sending the same to the frame assembler, wherein the frame assembler converts the left-right sense information into an ancillary image. An encoder characterized by being incorporated into data.
【請求項6】 入力されたオーディオサンプル信号に対
しフィルタ処理および間引き処理を行う写像部と、前記
オーディオサンプル信号及び前記写像部の出力から量子
化及び符号化を制御するデータの組を生成する聴覚心理
モデル部と、前記写像部の出力を量子化及び符号化する
量子化及び符号化部と、前記量子化及び符号化部の出力
とアンシラリデータから実際のビットストリームを組み
立てるフレーム組立部とを備えた符号器において、前記
入力されたオーディオサンプル信号の拡がり感情報を抽
出して前記フレーム組立部に送出する拡がり感抽出部を
備え、前記フレーム組立部が前記拡がり感情報をアンシ
ラリデータに組み込むことを特徴とする符号器。
6. A mapping unit for performing a filtering process and a decimation process on an input audio sample signal, and an auditory system for generating a set of data for controlling quantization and encoding from the audio sample signal and an output of the mapping unit. A psychological model unit, a quantization and encoding unit for quantizing and encoding the output of the mapping unit, and a frame assembling unit for assembling an actual bit stream from the output of the quantization and encoding unit and ancillary data. An encoder having a spread extracting unit for extracting the spread sense information of the input audio sample signal and sending the spread sense information to the frame assembling unit, wherein the frame assembling unit incorporates the spread sense information into ancillary data An encoder characterized in that:
【請求項7】 入力された符号化ビットストリームのフ
レームを分解するフレーム分解部と、前記分解されたフ
レームのデータを復号する復元部と、復号されたデータ
を元のオーディオサンプル信号に戻す逆写像部とを備え
た復号器において、前記フレーム分解部で得られたアン
シラリデータから左右方向感情報を再生し、前記逆写像
部から出力されたオーディオサンプル信号に前記左右方
向感情報を付加して出力する左右方向感再生部を備えた
復号器。
7. A frame decomposer for decomposing a frame of an input coded bit stream, a decompression unit for decoding data of the decomposed frame, and an inverse mapping for returning the decoded data to an original audio sample signal. And a decoder comprising: a unit for reproducing left-right sense information from the ancillary data obtained by the frame decomposition unit, and adding the left-right sense information to an audio sample signal output from the inverse mapping unit. A decoder with a left-right directional sense reproduction unit that outputs.
【請求項8】 入力された符号化ビットストリームのフ
レームを分解するフレーム分解部と、前記分解されたフ
レームのデータを復号する復元部と、復号されたデータ
を元のオーディオサンプル信号に戻す逆写像部とを備え
た復号器において、前記フレーム分解部で得られたアン
シラリデータから拡がり感情報を再生し、前記逆写像部
から出力されたオーディオサンプル信号に前記拡がり感
情報を付加して出力する拡がり感再生部を備えた復号
器。
8. A frame decomposer for decomposing a frame of an input coded bit stream, a decompression unit for decoding data of the decomposed frame, and an inverse mapping for returning the decoded data to an original audio sample signal. And reproducing the spread sense information from the ancillary data obtained by the frame decomposing unit, and adding the spread sense information to the audio sample signal output from the inverse mapping unit and outputting the signal. A decoder with a spreading feeling reproduction unit.
JP10062989A 1998-03-13 1998-03-13 Audio signal encoding / decoding method and apparatus Pending JPH11262100A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10062989A JPH11262100A (en) 1998-03-13 1998-03-13 Audio signal encoding / decoding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10062989A JPH11262100A (en) 1998-03-13 1998-03-13 Audio signal encoding / decoding method and apparatus

Publications (1)

Publication Number Publication Date
JPH11262100A true JPH11262100A (en) 1999-09-24

Family

ID=13216298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10062989A Pending JPH11262100A (en) 1998-03-13 1998-03-13 Audio signal encoding / decoding method and apparatus

Country Status (1)

Country Link
JP (1) JPH11262100A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085183A (en) * 2001-07-10 2006-03-30 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding application
JP2009151183A (en) * 2007-12-21 2009-07-09 Ntt Docomo Inc Multi-channel speech / acoustic signal encoding apparatus and method, and multi-channel speech / acoustic signal decoding apparatus and method
US7698006B2 (en) 2002-10-15 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085183A (en) * 2001-07-10 2006-03-30 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding application
US10902859B2 (en) 2001-07-10 2021-01-26 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2011101406A (en) * 2001-07-10 2011-05-19 Dolby Internatl Ab Efficient and scalable parametric stereo encoding for low bit rate audio encoding
US8014534B2 (en) 2001-07-10 2011-09-06 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8059826B2 (en) 2001-07-10 2011-11-15 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8073144B2 (en) 2001-07-10 2011-12-06 Coding Technologies Ab Stereo balance interpolation
US8081763B2 (en) 2001-07-10 2011-12-20 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8116460B2 (en) 2001-07-10 2012-02-14 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8243936B2 (en) 2001-07-10 2012-08-14 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US10297261B2 (en) 2001-07-10 2019-05-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9865271B2 (en) 2001-07-10 2018-01-09 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9799340B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9799341B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9792923B2 (en) 2001-11-29 2017-10-17 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9779746B2 (en) 2001-11-29 2017-10-03 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761234B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761236B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761237B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9812142B2 (en) 2001-11-29 2017-11-07 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818418B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US11238876B2 (en) 2001-11-29 2022-02-01 Dolby International Ab Methods for improving high frequency reconstruction
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10685661B2 (en) 2002-09-18 2020-06-16 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US11423916B2 (en) 2002-09-18 2022-08-23 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US7698006B2 (en) 2002-10-15 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
JP2009151183A (en) * 2007-12-21 2009-07-09 Ntt Docomo Inc Multi-channel speech / acoustic signal encoding apparatus and method, and multi-channel speech / acoustic signal decoding apparatus and method

Similar Documents

Publication Publication Date Title
RU2221329C2 (en) Data coding method and device, data decoding method and device, data recording medium
JP4740548B2 (en) Method and apparatus for encoding and decoding using bandwidth extension technology
JP3352406B2 (en) Audio signal encoding and decoding method and apparatus
JP4063508B2 (en) Bit rate conversion device and bit rate conversion method
JPWO2005081229A1 (en) Audio encoder and audio decoder
JP2004004578A (en) Apparatus and method for scalable lossless audio encoding / decoding
JP3466080B2 (en) Digital data encoding / decoding method and apparatus
KR20040054235A (en) Scalable stereo audio coding/encoding method and apparatus thereof
JPH11262100A (en) Audio signal encoding / decoding method and apparatus
JP3331194B2 (en) 3D color ultrasound image encoding and decoding system
WO2007136930B1 (en) Video/image compression using model plus difference image
JP4835648B2 (en) Speech encoding method and speech decoding method
JP4367450B2 (en) Audio signal transmission method and audio signal decoding method
JP2904427B2 (en) Missing voice interpolation device
JPH10178349A (en) Audio signal encoding method and decoding method
US20010039495A1 (en) Linking internet documents with compressed audio files
JPH10294943A (en) Video signal encoding system, video signal encoding device, video signal decoding system, and video signal decoding device
CN1152843A (en) Image/audio coding and decoding device
KR20050089868A (en) Video coding and decoding method
JP4367449B2 (en) Audio signal transmission method and audio signal decoding method
JP4367453B2 (en) Audio signal transmission method and audio signal decoding method
JP4367451B2 (en) Audio signal transmission method and audio signal decoding method
JP4367446B2 (en) Audio signal transmission method, audio signal decoding method, and audio encoding method
JP4367452B2 (en) Audio signal transmission method and audio signal decoding method
JP4367448B2 (en) Audio signal transmission method and audio signal decoding method