[go: up one dir, main page]

JP2002042416A - Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium - Google Patents

Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium

Info

Publication number
JP2002042416A
JP2002042416A JP2000228270A JP2000228270A JP2002042416A JP 2002042416 A JP2002042416 A JP 2002042416A JP 2000228270 A JP2000228270 A JP 2000228270A JP 2000228270 A JP2000228270 A JP 2000228270A JP 2002042416 A JP2002042416 A JP 2002042416A
Authority
JP
Japan
Prior art keywords
signal
frequency
masking
level
masking level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000228270A
Other languages
Japanese (ja)
Inventor
Takao Yamabe
孝朗 山辺
Tomohiro Mori
智博 毛利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2000228270A priority Critical patent/JP2002042416A/en
Publication of JP2002042416A publication Critical patent/JP2002042416A/en
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve such a problem that a signal is instantaneous one which may be imperceivable for some person or in a case of some sound source since the signal in a level imperceivable as an original sound is singly added to a certain prescribed signal so that a sufficient effect to prevent copying is not obtained in a conventional manner. SOLUTION: A copy disturbing signal is generated by multiplying a making level by a level adjusting signal α which is set at each sub-band as a coefficient (step S13). The level adjusting signal α has a numerical value being <=1 and a larger value is selected when a copy disturbance effect is preferential. The copy disturbance signal is added to the whole frequency band of the signal of an original frequency area (step S14). Then a copy preventing signal is added even to a band where an information amount in the original frequency area signal is not required. The frequency area signal after addition is performed is converted into the PCM signal of a time area, outputted (step S15) and recorded in a recording medium (step S16).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声信号の記録方
法、伝送方法、記録装置、伝送装置、記録媒体及び伝送
媒体に係り、特にパルス符号変調(PCM)された音声
信号をデータ圧縮してコピーすることを制限する音声信
号の記録方法、伝送方法、記録装置、伝送装置、記録媒
体及び伝送媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal recording method, a transmission method, a recording device, a transmission device, a recording medium, and a transmission medium. The present invention relates to a recording method, a transmission method, a recording device, a transmission device, a recording medium, and a transmission medium of an audio signal for restricting the operation.

【0002】[0002]

【従来の技術】近年、音楽、映画等の著作物に対し、容
易にディジタルコピーができる市販の機器、若しくはパ
ソコンソフトなどが現れ、著作権保護が強く求められて
いる。この著作権保護のためには、法制で規制を行うこ
とと、技術面で保護を実施することと、そして消費者の
モラルを向上させることが必要である。特に技術面で保
護できれば、一番効果が大きい。
2. Description of the Related Art In recent years, commercially available devices or personal computer software capable of easily digitally copying copyrighted works such as music and movies have appeared, and copyright protection has been strongly demanded. In order to protect this copyright, it is necessary to regulate by law, to implement technical protection, and to improve morals of consumers. Especially if it can be protected technically, it will be most effective.

【0003】この技術面での著作権保護対策としては、
従来は、例えばコンパクトディスク(CD)等のリニア
PCMの音源からのPCM信号を圧縮してミニディスク
(MD)へコピーを行う場合、SCMS(Serial Copy
Management System)としてCDプレーヤのディジタル
インターフェースに、コピー禁止のフラグを立ててコピ
ーを禁止するようにしている。
[0003] As copyright protection measures in this technical aspect, there are:
Conventionally, when a PCM signal from a linear PCM sound source such as a compact disc (CD) is compressed and copied to a mini disc (MD), SCMS (Serial Copy) is used.
As a management system, a copy prohibition flag is set on the digital interface of the CD player to prohibit copying.

【0004】すなわち、このSCMSでは、CDプレー
ヤのディジタルインターフェース(IEC958)信号
にコピーコントロールのフラグを付けて、コピー可、
第一世代可、禁止と3つの状態制御を可能としてい
る。この対象となるレコーダは法令で定められたディジ
タル・オーディオ・テープレコーダ(DAT)、MDレ
コーダ、CD−Rレコーダなどのディジタル機器であ
る。
That is, in the SCMS, a copy control flag is added to a digital interface (IEC958) signal of a CD player so that copying is possible.
Three state controls are possible: first generation allowed and prohibited. The target recorder is a digital device such as a digital audio tape recorder (DAT), an MD recorder, a CD-R recorder, or the like, which is specified by law.

【0005】しかし、このSCMSでは、第一世代のコ
ピーを許可しているため、レコーダ側の記録メディアを
交換すれば無制限のコピーが可能である。更に、オリジ
ナルのCDのままでは情報量が多いので、これを近年の
高能率符号化技術の発達により圧縮し、MDやICメモ
リ等の従来より一層小型となった記録装置に、ディジタ
ルのままの高品質なコピーが簡単に行えるようになって
いる。
However, in the SCMS, since the first generation copy is permitted, unlimited copying is possible by exchanging the recording medium on the recorder side. Further, since the original CD has a large amount of information, it is compressed by the recent development of high-efficiency coding technology, and is stored in a smaller recording device such as an MD or an IC memory. High quality copies can be easily made.

【0006】一方、このような容易に複製物が製作可能
な状態を防ぐために、次世代オーディオとして規格化さ
れたDVD(Digital Versatile Disk)オーディオ等の
新しいオーディオメディアは、暗号と秘密鍵によりコピ
ー制限を行う技術を採用している。しかしながら、現
在、市場の大勢はCD中心であり、当面この状況を変え
ることは難しい。更に、インターネットに代表される情
報通信の発達により、音楽配信サービスが新たな市場を
形成し、これらのコンテンツの権利を保護するための手
段が早急に望まれている。
On the other hand, in order to prevent such a state that a duplicate can be easily produced, a new audio medium such as a DVD (Digital Versatile Disk) audio standardized as next-generation audio is copy-limited by encryption and a secret key. The technology to do is adopted. However, at present, the market is mainly CD-based, and it is difficult to change this situation for the time being. Further, with the development of information communication represented by the Internet, music distribution services have created a new market, and means for protecting the rights of these contents are urgently desired.

【0007】このような要求に対し、特に情報圧縮を利
用した複製物生成手段(MP3、MDなど)において、
その情報量削減の重要な技術的要素である、聴感特性を
利用した音声信号の圧縮コピー制限方法が従来より提案
されている。また、時間領域の瞬間的なマスキング効果
を利用した音声信号の圧縮コピー制限方法が従来より提
案されている(特開平11−232777号公報)。こ
の特開平11−232777号公報記載の従来の圧縮コ
ピー制限方法では、コピー元となる記録媒体の音声又は
画像の原データに特定信号を算入して記録し、原データ
を一旦圧縮してから再生した際に、前記特定信号が強調
されて再生信号が歪むようにしたものである。
[0007] In response to such a request, in particular, in a copy generating means (MP3, MD, etc.) utilizing information compression,
There has been proposed a method of restricting the compression copy of an audio signal using an audibility characteristic, which is an important technical element for reducing the amount of information. In addition, a method of restricting the compression copy of an audio signal using an instantaneous masking effect in a time domain has been conventionally proposed (Japanese Patent Laid-Open No. 11-232777). In the conventional compressed copy restriction method described in Japanese Patent Application Laid-Open No. H11-232777, a specific signal is added to the original audio or image data of the recording medium serving as the copy source and recorded, and the original data is once compressed and then reproduced. In this case, the specific signal is emphasized and the reproduced signal is distorted.

【0008】[0008]

【発明が解決しようとする課題】しかしながら、上記の
従来の音声信号の圧縮コピー制限方法は、共にある特定
信号に対し原音に知覚されないレベルの信号を単独で付
加するものであり、原信号全体にわたり圧縮符号化処理
後の音質劣化を与えるものではなく、瞬間的ゆえ人によ
っては、また音源によっては知覚されることがなく、複
製物を防止する効果が不十分な場合がある。また、SC
MS方式は孫にあたる複製物の生成を防止するものであ
り、第一世代については無数にコピーが可能である。
However, the above-mentioned conventional method of restricting the compression and copy of an audio signal adds a signal of a level which is not perceived as an original sound to a specific signal alone. This does not cause deterioration in sound quality after the compression encoding process, and is not perceived depending on the person or sound source because it is instantaneous, and the effect of preventing duplicates may be insufficient. Also, SC
The MS method prevents the generation of duplicates corresponding to grandchildren, and countless copies can be made for the first generation.

【0009】本発明は以上の点に鑑みなされたもので、
オリジナル音源に人間の聴覚特性に基づくコピー妨害信
号を全帯域にわたり挿入することで、圧縮後の信号品質
を著しく劣化させ、安易な複製物の生成を阻止し得る音
声信号の記録方法、伝送方法、記録装置、伝送装置、記
録媒体及び伝送媒体を提供することを目的とする。
[0009] The present invention has been made in view of the above points,
By inserting a copy interference signal based on human auditory characteristics into the original sound source over the entire band, the signal quality after compression is significantly deteriorated, and a recording method, a transmission method, and a sound signal of an audio signal capable of preventing generation of an easy duplicate, It is an object to provide a recording device, a transmission device, a recording medium, and a transmission medium.

【0010】[0010]

【課題を解決するための手段】上記の目的を達成するた
め、本発明の音声信号の記録方法は、パルス符号変調さ
れたPCM音声信号を、単位時間毎に周波数領域の信号
に変換する第1のステップと、第1のステップにより得
られた周波数領域の信号を人間の周波数分解能に対応し
た臨界帯域幅を単位とするサブバンドに区切り、各サブ
バンド毎にこの周波数領域信号についてマスキングレベ
ルを算出する第2のステップと、マスキングレベルを全
帯域にわたり畳み込み演算を行い、個々のサブバンドに
おける最終的なマスキングレベルを決定し、このマスキ
ングレベル以下の雑音信号をコピー妨害信号として各サ
ブバンド単位で計算して発生する第3のステップと、コ
ピー妨害信号を第1のステップにより得られた周波数領
域の信号に加算する第4のステップと、第4のステップ
で得られた信号を時間領域のPCM音声信号に変換する
第5のステップと、第5のステップにより得られたPC
M音声信号を記録媒体に記録する第6のステップとを含
むことを特徴とする。
In order to achieve the above object, a sound signal recording method according to the present invention provides a first method of converting a pulse code modulated PCM sound signal into a frequency domain signal per unit time. And dividing the frequency domain signal obtained in the first step into subbands each having a unit of a critical bandwidth corresponding to human frequency resolution, and calculating a masking level for this frequency domain signal for each subband A second step of performing a convolution operation on the masking level over the entire band to determine a final masking level in each subband, and calculate a noise signal below this masking level as a copy interference signal in each subband unit And a copy interference signal are added to the frequency domain signal obtained in the first step. A fourth step and a fifth step of converting the fourth PCM audio signal of the signal obtained with time domain step, PC obtained by the fifth step
Recording the M audio signal on a recording medium.

【0011】この発明では、周波数領域の信号の本来必
要でない帯域にマスキングレベルぎりぎりのコピー妨害
信号を挿入してから時間領域のPCM音声信号に変換す
ることにより、そのPCM音声信号の圧縮処理時に、本
来必要でない帯域にビットが割り当てられ、本来必要と
される聴感上重要な帯域に割り当てられるビット量を十
分な情報量が与えられないよう減少させることができ
る。
According to the present invention, a PCM audio signal in the time domain is converted into a PCM audio signal in the time domain by inserting a copy disturbing signal at the very end of the masking level into a band which is not originally necessary for the signal in the frequency domain. Bits are allocated to a band that is not originally required, and the bit amount allocated to a band that is originally required for audibility can be reduced so that a sufficient amount of information is not provided.

【0012】また、上記の目的を達成するため、本発明の
伝送方法では、上記記録方法の第6のステップに代え
て、第5のステップにより得られたPCM音声信号を伝
送媒体に伝送させるようにしたものである。
In order to achieve the above object, in the transmission method of the present invention, instead of the sixth step of the recording method, the PCM audio signal obtained in the fifth step is transmitted to a transmission medium. It was made.

【0013】また、上記の目的を達成するため、本発明の
記録装置又は伝送装置は、パルス符号変調されたPCM
音声信号を、単位時間毎に周波数領域の信号に変換する
時間−周波数変換回路と、時間−周波数変換回路により
得られた周波数領域の信号を人間の周波数分解能に対応
した臨界帯域幅を単位とするサブバンドに区切り、各サ
ブバンド毎にこの周波数領域信号についてマスキングレ
ベルを算出し、そのマスキングレベルを全帯域にわたり
畳み込み演算を行い、個々のサブバンドにおける最終的
なマスキングレベルを決定するマスキング量算出回路
と、マスキング量算出回路により決定されたマスキング
レベル以下の雑音信号をコピー妨害信号として各サブバ
ンド単位で計算して発生するコピー妨害信号生成回路
と、コピー妨害信号を時間−周波数変換回路から出力さ
れた周波数領域の信号に加算して出力する加算回路と、
加算回路から出力された信号を時間領域のPCM音声信
号に変換する周波数−時間変換回路と、周波数−時間変
換回路から出力されたPCM音声信号を記録媒体に記録
する記録手段、又は伝送媒体を伝送させる出力手段とを
有する構成としたものである。
In order to achieve the above object, a recording apparatus or a transmission apparatus according to the present invention comprises a pulse code modulated PCM.
A time-frequency conversion circuit for converting an audio signal into a frequency domain signal for each unit time, and a frequency domain signal obtained by the time-frequency conversion circuit in units of a critical bandwidth corresponding to human frequency resolution. A masking amount calculating circuit that divides into subbands, calculates a masking level for this frequency domain signal for each subband, performs a convolution operation on the masking level over the entire band, and determines a final masking level in each subband A copy interference signal generation circuit that generates a noise signal equal to or less than the masking level determined by the masking amount calculation circuit as a copy interference signal for each subband, and a copy interference signal that is output from the time-frequency conversion circuit. An addition circuit that adds the signal to the frequency domain signal and outputs the added signal.
A frequency-time conversion circuit for converting a signal output from the addition circuit into a PCM audio signal in the time domain, and a recording unit or a transmission medium for recording the PCM audio signal output from the frequency-time conversion circuit on a recording medium Output means.

【0014】この発明では、コピー妨害信号生成回路に
より生成したマスキングレベルぎりぎりのコピー妨害信
号を、周波数領域の信号の本来必要でない帯域に加算回
路では加算してから周波数−時間変換回路で時間領域の
PCM音声信号に変換した後記録することにより、記録
媒体から再生したPCM音声信号又は伝送媒体を介して
受信されたPCM音声信号の圧縮処理時に、本来必要で
ない帯域にビットが割り当てられ、本来必要とされる聴
感上重要な帯域に割り当てられるビット量を十分な情報
量が与えられないよう減少させることができる。
According to the present invention, the copy interference signal at the very end of the masking level generated by the copy interference signal generation circuit is added to an originally unnecessary band of the frequency domain signal by the addition circuit, and then the time domain signal is added by the frequency-time conversion circuit. By recording after converting to a PCM audio signal, bits are allocated to a band that is not originally required at the time of compression processing of a PCM audio signal reproduced from a recording medium or a PCM audio signal received via a transmission medium. It is possible to reduce the amount of bits allocated to the perceived important band so that a sufficient amount of information is not provided.

【0015】また、上記の目的を達成するため、本発明の
記録媒体又は伝送媒体は、パルス符号変調されたPCM
音声信号を、時間−周波数変換してから人間の周波数分
解能に対応した臨界帯域幅を単位とするサブバンドに区
切り、これらサブバンドのそれぞれについてマスキング
レベルを算出し、それらマスキングレベルを全帯域にわ
たり畳み込み演算を行い、個々のサブバンドにおける最
終的なマスキングレベルを決定し、各サブバンド単位で
計算したマスキングレベル以下の雑音信号をコピー妨害
信号として加算したPCM音声信号が記録されるか、又
は伝送される構成としたものである。
In order to achieve the above object, a recording medium or a transmission medium according to the present invention uses a pulse code modulated PCM.
The audio signal is subjected to time-frequency conversion and then divided into sub-bands in units of a critical bandwidth corresponding to the frequency resolution of human beings, a masking level is calculated for each of these sub-bands, and the masking levels are convolved over the entire band. An operation is performed to determine a final masking level in each subband, and a PCM audio signal in which a noise signal below the masking level calculated for each subband is added as a copy interference signal is recorded or transmitted. The configuration is as follows.

【0016】この発明の記録媒体又は伝送媒体は、再生
された又は受信されたPCM音声信号が、コピー記録の
際の圧縮処理時に本来必要でない帯域にビットが割り当
てられ、本来必要とされる聴感上重要な帯域に割り当て
られるビット量を十分な情報量が与えられないよう減少
させることができる。
According to the recording medium or transmission medium of the present invention, the reproduced or received PCM audio signal is assigned bits to a band which is not originally required at the time of compression processing at the time of copy recording, so that the originally required audibility is obtained. The amount of bits allocated to the important band can be reduced so that a sufficient amount of information is not provided.

【0017】[0017]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面と共に説明する。図1は本発明になる音声信号の
記録方法の一実施の形態の動作説明用フローチャートを
示す。この実施の形態は人為的にMNR(マスキングレ
ベル対量子化ノイズレベル比)による音質向上過程を誤
った方向へ導くことによって、コピーを制限しようとす
るものである。
Next, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a flowchart for explaining the operation of an embodiment of a method for recording an audio signal according to the present invention. This embodiment is intended to restrict copying by artificially guiding the sound quality improvement process by MNR (masking level to quantization noise level ratio) in the wrong direction.

【0018】ここで、図1の本実施の形態について説明
する前に、本発明の背景について説明する。現在、実際
に使用されている音声信号圧縮方式としては、ATRA
C(adaptive transform acoustic coding)、MP3(MPE
G-1 Audio Layer 3)、Dollby−Digital、
AACなどが存在する。これらの音声信号圧縮方式とし
ては、すべて適応変換符号化と呼ばれる部類に入る。基
本的な符号化処理は、時間軸上のPCMデータを直交変
換により周波数領域に展開し、音源の持つエネルギーを
人間の周波数分解能に対応した臨界帯域幅を単位とする
周波数帯(サブバンド)に区切り、この周波数領域信号に
ついて聴覚特性を利用した適応ビット割り当てを行うこ
とで情報圧縮を実現している。
Before describing the embodiment of FIG. 1, the background of the present invention will be described. At present, the audio signal compression scheme actually used is ATRA.
C (adaptive transform acoustic coding), MP3 (MPE
G-1 Audio Layer 3), Dollby-Digital,
AAC and the like exist. All of these audio signal compression methods fall into the category called adaptive transform coding. The basic encoding process is to expand the PCM data on the time axis into the frequency domain by orthogonal transform, and convert the energy of the sound source into a frequency band (sub-band) in units of a critical bandwidth corresponding to human frequency resolution. Information compression is realized by performing adaptive bit allocation using the auditory characteristics of the frequency domain signal at the break.

【0019】これら圧縮方式の音質を決定する要素は、
必要な帯域に必要な情報量が正しく与えられているかに
かかっている。仮に、この情報量(ビット配分)を誤れ
ば、当然音質も劣化することとなる。ビット配分を決め
る方法の一つに、MNR(マスキングレベル対量子化ノ
イズレベル比)を用いる手法が採られている。このMN
Rの基本的な考え方は、聴感特性の絶対可聴レベルと音
源によって生まれる相対可聴レベルを、ある帯域に限定
し畳み込み演算によって、その帯域のマスキングレベル
(瞬間的に限定された時間内での人間の耳に知覚されな
い周波数領域上のエネルギー)を求め、マスキングレベ
ル以下の量子化ノイズであれば、検知されないというも
のであり、MNRが大きければ大きいほど高音質である
といえる。これを個々の符号化方式が持つ分割された帯
域毎に求め、全体的なMNRの向上を図ることによっ
て、効果的な情報圧縮を実現している。
The factors that determine the sound quality of these compression methods are:
It depends on whether the necessary information amount is correctly given to the necessary band. If this information amount (bit allocation) is incorrect, the sound quality will naturally deteriorate. As one of the methods for determining the bit allocation, a method using MNR (masking level to quantization noise level ratio) is adopted. This MN
The basic idea of R is that the absolute audible level of the auditory characteristics and the relative audible level generated by the sound source are limited to a certain band, and the masking level of that band (human moment within a limited time instantaneously) is determined by convolution. Energy in the frequency domain that is not perceived by the ear) is obtained, and if the quantization noise is below the masking level, it is not detected. It can be said that the higher the MNR, the higher the sound quality. This is obtained for each of the divided bands of the individual coding schemes, and by improving the overall MNR, effective information compression is realized.

【0020】図5は上記のMNRによって求める一般的
なビット配分の動作説明用フローチャートを示す。ある
時間単位長のPCMサンプル群を周波数展開した後、人
間の周波数分解能(臨界帯域)に従った低域ほど狭い帯
域にまとめ、その個々の帯域毎にマスキングレベルを算
出し、全帯域において畳み込み演算をかけることによ
り、最終的なマスキングカーブを求める(ステップS
1)。
FIG. 5 is a flowchart for explaining the operation of general bit allocation obtained by the above-mentioned MNR. After frequency expansion of a PCM sample group of a certain time unit length, the lower band according to the human frequency resolution (critical band) is combined into a narrower band, a masking level is calculated for each band, and a convolution operation is performed in all bands. To obtain a final masking curve (step S
1).

【0021】続いて、このマスキングレベルと仮に配分
した量子化ビット長によって生じる量子化ノイズレベル
の比(MNR)を、それぞれの帯域で計算し(ステップ
S2)、全帯域内でMNRが最悪となる帯域を検索する
(ステップS3)。次に、検索したMNRが最悪の帯域
についてビット配分を所定量増加させ(ステップS
4)、増加後の全帯域の符号化量が許容情報量未満であ
るかどうか判定する(ステップS5)。量子化ビット長
の増加によりその帯域のMNRが向上する。
Subsequently, the ratio (MNR) between the masking level and the quantization noise level generated by the provisionally allocated quantization bit length is calculated for each band (step S2), and the MNR becomes the worst in all the bands. A band is searched (step S3). Next, the bit allocation is increased by a predetermined amount for the band having the worst MNR (step S
4), it is determined whether or not the coding amount of the entire band after the increase is less than the allowable information amount (step S5). The increase in the quantization bit length improves the MNR of the band.

【0022】符号化量が許容情報量未満であれば、再び
マスキングレベルと仮に配分した量子化ビット長によっ
て生じる量子化ノイズレベルの比(MNR)を、それぞ
れの帯域で計算し(ステップS2)、全帯域内でMNR
が最悪となる帯域を検索し(ステップS3)、検索した
MNRが最悪の帯域についてビット配分量を増加させ
(ステップS4)、増加後の符号化量が許容情報量未満
であるかどうか判定する(ステップS5)。以下、上記
と同様にして、全帯域内でMNRが最悪となる帯域から
順に量子化ビット長を増加していき、符号化レートで決
定される使用可能な情報量(ビット量)を超えない範囲
で上記の動作を繰り返す。符号化量が許容情報量以上と
なった時点で、ビット配分量が決定される(ステップS
6)。
If the coding amount is less than the allowable information amount, the ratio (MNR) of the masking level and the quantization noise level generated by the temporarily allocated quantization bit length is calculated again for each band (step S2), MNR in all bands
Search for the worst band (step S3), increase the bit allocation amount for the worst band with the searched MNR (step S4), and determine whether the increased coding amount is less than the allowable information amount (step S4). Step S5). Hereinafter, in the same manner as described above, the quantization bit length is sequentially increased from the band having the worst MNR in the entire band, and the usable information amount (bit amount) determined by the coding rate is not exceeded. The above operation is repeated. When the coding amount becomes equal to or larger than the allowable information amount, the bit allocation amount is determined (Step S).
6).

【0023】図6は通常の音源におけるマスキングレベ
ルと与えられたビット配分によって生じる量子化ノイズ
レベルとの一例の対比図を示す。同図において、Iはオ
リジナルの音源からの音声信号のある時間的な一部分を
抽出し、周波数領域上に展開した後、それぞれの帯域毎
にマスキング量を求め、畳み込み処理を経た最終的なマ
スキングレベルである。IIは図5のフローチャートに従
ってビット配分された結果による量子化ノイズレベルを
示す。この図6における音源は、後述するコピー妨害信
号が挿入されていない通常の音源を示す。
FIG. 6 is a comparison diagram showing an example of a masking level in a normal sound source and a quantization noise level generated by a given bit allocation. In the figure, I denotes a temporal portion of the audio signal from the original sound source, expands it on the frequency domain, finds the masking amount for each band, and obtains the final masking level after convolution processing. It is. II indicates the quantization noise level based on the result of bit allocation according to the flowchart of FIG. The sound source in FIG. 6 indicates a normal sound source in which a copy interference signal described later is not inserted.

【0024】これらから求めたMNRに従い、図5によ
りビット配分した例を図7に示す。図7に示すように、
レベルの高いスペクトル近辺、及び聴覚の性質上感度の
良い中周波数領域にビット配分が集中していることが分
かる。また、ビット配分されていない帯域が存在するこ
とも分かる。図5に示したビット配分のフローチャート
に従うため、信号が存在しない帯域を除いて、図6に示
すようにマスキングレベルと量子化ノイズレベルとの比
(距離)は、ほぼ一定となる。
FIG. 7 shows an example in which bits are allocated according to FIG. 5 in accordance with the MNR obtained from these. As shown in FIG.
It can be seen that bit allocation is concentrated near the high-level spectrum and in the middle frequency region where sensitivity is high due to the nature of hearing. It can also be seen that there is a band to which no bit is allocated. According to the bit allocation flowchart shown in FIG. 5, the ratio (distance) between the masking level and the quantization noise level is almost constant as shown in FIG. 6, except for the band where no signal exists.

【0025】ところで、上記のビット配分において、情
報量が本来必要であるべき帯域に十分配分されていない
と、量子化ノイズが知覚されないレベルを越えて、耳障
りな音となって現れてくる。人為的にこのMNRによる
音質向上過程を誤った方向へ導くことによって、必要で
はない帯域へ情報量を注ぎ込むような仕組みを誘発させ
ることができれば、全体的な音質劣化を引き起こさせる
ことが可能である。
By the way, in the above-mentioned bit allocation, if the information amount is not sufficiently allocated to the band which is originally required, the quantization noise exceeds the level which cannot be perceived and appears as annoying sound. By artificially guiding the sound quality improvement process by MNR in the wrong direction to induce a mechanism to pour the amount of information into unnecessary bands, it is possible to cause overall sound quality deterioration. .

【0026】また、マスキングレベル以下のレベルを持
った信号だからといって全くビットが配分されなくなる
のではなく、あくまで、符号化によって生じるその帯域
の量子化ノイズレベルとマスキングレベルとの比でビッ
ト配分量が決まる。従って、低域や高域に(周波数帯域
はそれほど重要ではないが、通常の音楽では中域に多く
のビットが割り当てられる傾向にあるため)マスキング
レベルぎりぎりの信号を挿入すると、この帯域(低域や
高域)にビットが割り当てられ、本来必要とされる帯域
(中域)に割り当てられるビット量が減少し、結果とし
て音質の劣化をもたらすのである。
Further, even if the signal has a level equal to or lower than the masking level, bits are not allotted at all, but the bit allocation amount is determined by the ratio of the quantization noise level of the band caused by encoding to the masking level. . Therefore, if a signal just below the masking level is inserted in the low or high band (frequency band is not so important, but in normal music many bits are allocated in the middle band), this band (low band) And high frequencies), and the amount of bits allocated to the originally required band (middle frequency) is reduced, resulting in deterioration of sound quality.

【0027】MNRの値が総合的に良好な数値を示すと
き、その該当する時間内サンプル(オーディオソース)
の音質は優れている、又は、符号化が簡単であるという
ことができる。逆に、MNRが総合的に悪い数値を示す
ときは、音質は劣化し、符号化困難なオーディオソース
であるということができる。従って、符号化音の品質を
悪くするには、このMNRの値を悪化させればよく、つ
まり、量子化ノイズレベルを全帯域において持ち上げれ
ばよいことがわかる。この量子化ノイズレベルを持ち上
げるには、帯域毎にマスクされる信号レベルから、ある
距離を持った聴感的に知覚されないレベルの雑音信号を
挿入することによって実現できる。
When the value of MNR indicates a good overall value, the corresponding sample in time (audio source)
Can be said to be excellent or easy to encode. Conversely, when the MNR indicates a poor overall value, the sound quality is degraded and it can be said that the audio source is difficult to encode. Therefore, it can be seen that to lower the quality of the coded sound, the value of the MNR should be lowered, that is, the quantization noise level should be raised in all bands. The quantization noise level can be raised by inserting a noise signal having a certain distance and not perceivable from the signal level masked for each band.

【0028】本実施の形態は以上の点に着目してなされ
たもので、図1に戻って説明するに、まず、時間軸上の
PCMデータを直交変換により周波数領域の信号に展開
する(ステップS11)。続いて、この周波数領域の信
号を人間の周波数分解能に対応した臨界帯域幅を単位と
する周波数帯(サブバンド)に区切り、この周波数領域
信号についてその個々の帯域毎にマスキングレベルを算
出し、このマスキング量を全帯域にわたって畳み込み演
算し、個々のサブバンドにおけるトータルマスキングレ
ベルを求める。更に、人間の聴感特性に基づく絶対可聴
レベルをサブバンド毎に考慮し、マスキングされる信号
レベルが高いほうを選択することによって、最終的なマ
スキングレベルを決定する(ステップS12)。
This embodiment has been made by focusing on the above points. Returning to FIG. 1, first, PCM data on the time axis is expanded into a signal in the frequency domain by orthogonal transformation (step S1). S11). Subsequently, the signal in this frequency domain is divided into frequency bands (sub-bands) in units of a critical bandwidth corresponding to human frequency resolution, and a masking level is calculated for each frequency band of this frequency domain signal. The amount of masking is convolved over the entire band to determine the total masking level in each subband. Further, the final masking level is determined by considering the absolute audible level based on human auditory characteristics for each sub-band and selecting the higher masked signal level (step S12).

【0029】続いて、上記のマスキングレベルに、サブ
バンド毎に設定されたレベル調整信号αを係数として乗
算してコピー妨害信号を生成する(ステップS13)。
上記のレベル調整信号αは1以下の数値を持ち、音質重
視であれば小さな値を選択し、コピー妨害効果を優先さ
せる場合は大きい値を選択する。
Subsequently, the above masking level is multiplied by a level adjustment signal α set for each subband as a coefficient to generate a copy interference signal (step S13).
The above-mentioned level adjustment signal α has a numerical value of 1 or less. A small value is selected when sound quality is emphasized, and a large value is selected when priority is given to the copy disturbance effect.

【0030】続いて、生成されたコピー妨害信号は、元
の周波数領域の信号の全周波数帯域にわたり加算される
(ステップS14)。これにより、元の周波数領域の信
号中の情報量が必要ではなかった帯域にも、上記のコピ
ー防止信号が加算されることとなる。そして、この加算
後の周波数領域の信号を時間領域のPCM信号に変換し
て出力する(ステップS15)。
Subsequently, the generated copy interference signal is added over the entire frequency band of the original frequency domain signal (step S14). As a result, the copy protection signal is added to the band in which the amount of information in the signal in the original frequency domain was not necessary. Then, the frequency domain signal after the addition is converted into a time domain PCM signal and output (step S15).

【0031】この出力PCM信号は、例えば、CDなど
の記録媒体に記録される(ステップS16)。そして、
この記録済みの記録媒体がプリレコーデッド媒体として
工場から市場へ出荷される。なお、本実施の形態をCD
などの記録媒体再生装置の出力側に設けるようにしても
よい。
The output PCM signal is recorded on a recording medium such as a CD (step S16). And
The recorded recording medium is shipped from the factory to the market as a pre-recorded medium. It should be noted that this embodiment is a CD
May be provided on the output side of a recording medium reproducing apparatus.

【0032】図2は本発明により検知できない程度のコ
ピー妨害信号を付加した音源におけるマスキングレベル
と与えられたビット配分によって生じる量子化ノイズレ
ベルとの一例の対比図を示す。
FIG. 2 is a diagram showing an example of a comparison between a masking level in a sound source to which a copy interference signal of a degree undetectable by the present invention is added and a quantization noise level caused by a given bit allocation.

【0033】同図において、IIIはオリジナルの音源か
らの音声信号にコピー妨害信号を付加した信号のある時
間的な一部分を抽出し、周波数領域上に展開した後、そ
れぞれの帯域毎にマスキング量を求め、畳み込み処理を
経た最終的なマスキングレベルである。IVは量子化ノイ
ズレベルを示す。図2に示すように、コピー妨害信号を
音声信号に付加すると、コピー妨害信号を付加しない通
常の音源に関する図6の対比図と比較し、従来必要では
なかった帯域の情報消費量が増加し、重要な帯域の量子
化ビット長が減ることによって、量子化ノイズレベルの
カーブIVが相対的にマスキングレベルのカーブIIIと接
近することが分かる。
In FIG. 3, III extracts a certain temporal portion of a signal obtained by adding a copy interference signal to an audio signal from an original sound source, develops it on a frequency domain, and then calculates a masking amount for each band. This is the final masking level after the calculation and convolution processing. IV indicates the quantization noise level. As shown in FIG. 2, when the copy interference signal is added to the audio signal, compared with the comparison diagram of FIG. 6 relating to a normal sound source to which the copy interference signal is not added, the information consumption of the band that was not necessary conventionally increases, It can be seen that the quantization noise level curve IV relatively approaches the masking level curve III by reducing the quantization bit length of the important band.

【0034】すなわち、コピー妨害信号を生成する際に
用いる前記レベル調整信号αは、量子化ノイズレベルの
カーブIVがマスキングレベルのカーブIIIにできるだけ
近付くようにサブバンド毎に設定される。ただし、オリ
ジナルのCDから音声信号を正常に再生した場合に、再
生装置の誤動作を避けるため、可聴周波数の上限周波数
付近及び下限周波数以下では量子化ノイズレベルはあま
り大きくならないようにレベル調整信号αが設定されて
いる。
That is, the level adjustment signal α used for generating the copy interference signal is set for each sub-band such that the quantization noise level curve IV approaches the masking level curve III as much as possible. However, when the audio signal is normally reproduced from the original CD, in order to avoid a malfunction of the reproducing apparatus, the level adjustment signal α is set so that the quantization noise level does not become too large near the upper limit frequency of the audible frequency and below the lower limit frequency. Is set.

【0035】図3はこれらから求めたMNRに従い、図
1の実施の形態によりビット配分した例を示す。図3に
示すように、従来必要では無かった帯域の情報消費量が
増加し、重要な帯域の量子化ビット長が減っている。す
なわち、本実施の形態では、元の周波数領域の信号中の
情報量が必要ではなかった帯域にも上記のコピー防止信
号を潜り込ませることにより、聴感上の重要な帯域に十
分な情報量が与えられないようにしたため、聴取者に音
質劣化が検知される。
FIG. 3 shows an example in which bits are allocated according to the embodiment of FIG. 1 in accordance with the MNR obtained from them. As shown in FIG. 3, the information consumption of a band that has not been necessary conventionally increases, and the quantization bit length of an important band decreases. That is, in the present embodiment, a sufficient amount of information is given to an important band in terms of audibility by making the copy protection signal sneak into a band where the amount of information in the signal in the original frequency domain was not necessary. As a result, sound quality degradation is detected by the listener.

【0036】このように、本実施の形態によれば、コピー
妨害信号がPCM音声信号に加算された信号を例えばC
Dに記録することにより、そのCDの購入者がCDを再
生した場合は、圧縮処理されず、かつ、コピー防止信号
は聴感上、認識されないレベルを持っているために、再
生されたとしても聴感上認識されることなく、PCM音
声信号の再生音が正常に再生される。
As described above, according to the present embodiment, the signal obtained by adding the copy interference signal to the PCM audio signal is, for example, a C signal.
By recording in D, if the purchaser of the CD reproduces the CD, the CD is not compressed, and the copy protection signal has a level that is not recognized in terms of audibility. The reproduction sound of the PCM audio signal is normally reproduced without being recognized above.

【0037】これに対し、購入者等がこのCDの再生P
CM信号を圧縮処理してMDやICメモリにコピー記録
し、そのMDあるいはICメモリからコピー記録した信
号を再生する場合は、図3に示したように、聴感上、最も
敏感で必要とされる例えば中域のビット配分(量子化ビ
ット長)が、本来必要とされるよりも少なく、かつ、本
来不必要な帯域にもビット配分がされた状態でPCM信
号が再生されるため、聴取者には再生音以外に雑音が聞
こえ、聴取に耐えない音が得られる。このため、コピー
を間接的に防止することができる。
On the other hand, when the purchaser or the like
When the CM signal is subjected to compression processing and copied and recorded on an MD or IC memory, and a signal copied and recorded from the MD or IC memory is reproduced, as shown in FIG. For example, since the PCM signal is reproduced in a state where the bit allocation (quantization bit length) of the middle band is smaller than originally required and the bit allocation is also performed to the originally unnecessary band, the listener is In addition to the reproduced sound, noise is heard, and a sound that cannot be heard is obtained. For this reason, copying can be indirectly prevented.

【0038】なお、CDプレーヤの出力回路などに上記
の実施の形態を適用した場合は、コピー妨害信号が記録
されていない既存のCDに対しても、本実施の形態によ
るコピー妨害動作を実現できる。
When the above embodiment is applied to an output circuit of a CD player or the like, the copy obstruction operation according to the present embodiment can be realized even for an existing CD on which no copy obstruction signal is recorded. .

【0039】次に、本発明になる記録装置について説明
する。図4は本発明になる記録装置の一実施の形態のブ
ロック図を示す。同図において、入力PCM音声信号
は、入力バッファからなる時間−周波数変換回路11に
供給され、ここで単位時間長毎にグループ化され、周波
数展開される。マスキング量算出回路12は、時間−周
波数変換回路11で得られた周波数スペクトルを基に前
述の臨界帯域幅によって区切られた帯域(サブバンド)
を単位として、まず、相対可聴レベルから決定される個
々の帯域毎のマスキング量を算出する。このマスキング
量を全帯域にわたって畳み込み演算し、個々のサブバン
ドにおけるトータルマスキングレベルを求める。更に、絶
対可聴レベルを帯域毎に考慮し、マスキングされる信号
レベルが高いほうを選択することによって、最終的なマ
スキングレベルを決定する。
Next, the recording apparatus according to the present invention will be described. FIG. 4 shows a block diagram of an embodiment of the recording apparatus according to the present invention. In the figure, an input PCM audio signal is supplied to a time-frequency conversion circuit 11 composed of an input buffer, where it is grouped by unit time length and developed in frequency. The masking amount calculation circuit 12 is based on the frequency spectrum obtained by the time-frequency conversion circuit 11, and is divided into sub-bands by the above-described critical bandwidth.
First, the masking amount for each band determined from the relative audible level is calculated. The amount of masking is convolved over the entire band to determine the total masking level in each subband. Further, the final masking level is determined by considering the absolute audible level for each band and selecting the higher masked signal level.

【0040】コピー妨害信号生成回路13は、マスキン
グ量算出回路12で算出されたマスキングレベルに、帯
域毎に設定されたレベル調整信号αを係数として乗算し
てコピー妨害信号を生成する。レベル調整信号αは1以
下の数値を持ち、音質重視であれば小さく、コピー妨害
効果を優先させる場合は大きい値を選択する。0Hzや
20kHzなどの可聴周波数以下あるいは可聴周波数上
限周波数近傍では、音楽信号再生装置の誤動作を避ける
ため、レベル調整信号αを小さくするとよい。このよう
にして、マスキングレベル以下のコピー妨害信号が生成
される。
The copy disturbing signal generating circuit 13 generates a copy disturbing signal by multiplying the masking level calculated by the masking amount calculating circuit 12 with a level adjustment signal α set for each band as a coefficient. The level adjustment signal α has a numerical value of 1 or less. A small value is selected when emphasizing sound quality, and a large value is selected when giving priority to the copy disturbance effect. Below the audible frequency such as 0 Hz or 20 kHz or near the audible frequency upper limit frequency, the level adjustment signal α may be reduced to avoid malfunction of the music signal reproducing device. In this way, a copy disturb signal equal to or lower than the masking level is generated.

【0041】加算回路14は、コピー妨害信号生成回路
13からのコピー妨害信号と、時間−周波数変換回路1
1から出力された元の周波数スペクトルの信号とを周波
数スペクトル上で加算する。そして、周波数−時間変換
回路15は、加算回路14から出力された加算信号に対
して、周波数領域から時間領域へ展開し、時間領域のコ
ピー防止効果のあるPCM信号を生成する。このように
して得られたPCM信号は、周知の記録手段(図示せ
ず)を通してCDその他所定の記録媒体(図示せず)に
記録される。
The adder circuit 14 receives the copy interference signal from the copy interference signal generation circuit 13 and the time-frequency conversion circuit 1
The signal of the original frequency spectrum output from 1 is added on the frequency spectrum. Then, the frequency-time conversion circuit 15 expands the addition signal output from the addition circuit 14 from the frequency domain to the time domain, and generates a PCM signal having a copy protection effect in the time domain. The PCM signal thus obtained is recorded on a CD or other predetermined recording medium (not shown) through well-known recording means (not shown).

【0042】このようにして記録されたPCM信号は、
コピー妨害信号が付加されているとしても、そのままで
再生された場合はコピー妨害信号が検知されることはな
く、本来の原信号と遜色の無い品質を維持することがで
きる。しかし、このようにして記録されたPCM信号
を、別の記録媒体にコピー記録すると、記録の際に圧縮
符号化処理が加えられるが、その圧縮符号化方式が特に
MDやMPEG1、DCC等の1/4以下の圧縮率で圧
縮する符号化方式では、付加されたコピー妨害信号に情
報量を消費され、全体的に量子化ビット量が不足するこ
とによって、音質劣化をもたらす。
The PCM signal thus recorded is
Even if a copy disturbing signal is added, when reproduced as it is, the copy disturbing signal is not detected, and the quality equivalent to the original signal can be maintained. However, when the PCM signal thus recorded is copied and recorded on another recording medium, a compression encoding process is added at the time of recording, and the compression encoding method is one of the MD, MPEG1, and DCC. In an encoding method that compresses at a compression ratio of / 4 or less, the amount of information is consumed by the added copy interference signal, and the amount of quantization bits becomes insufficient as a whole, resulting in sound quality deterioration.

【0043】よって、本実施の形態により、音声信号の
圧縮コピーに対し、圧縮符号化処理時に生じる品質劣化
によって、効果的に安易なコピーを防止することがで
き、コンテンツ制作者の権利を保護することが可能であ
る。
Thus, according to the present embodiment, it is possible to effectively prevent easy copying of a compressed copy of an audio signal due to quality deterioration occurring at the time of compression encoding, thereby protecting the rights of a content creator. It is possible.

【0044】なお、本発明は上記の実施の形態に限定さ
れるものではなく、例えばインターネット等を通じて配
信されるPCM音声信号、あるいは放送等により伝送さ
れるPCM音声信号に対して、本発明を適用することも
できる。また、本発明により記録された記録媒体や伝送
媒体そのものも本発明に含まれることは勿論である。
Note that the present invention is not limited to the above embodiment, and the present invention is applied to, for example, a PCM audio signal distributed through the Internet or the like or a PCM audio signal transmitted by broadcasting or the like. You can also. Further, it goes without saying that a recording medium or a transmission medium recorded according to the present invention is also included in the present invention.

【0045】[0045]

【発明の効果】以上説明したように、本発明によれば、
周波数領域の信号の本来必要でない帯域にマスキングレ
ベルぎりぎりのコピー妨害信号を挿入してから時間領域
のPCM音声信号に変換することにより、コピー記録時
の変換後のPCM音声信号の圧縮処理時に、本来必要で
ない帯域にビットが割り当てられ、本来必要とされる聴
感上重要な帯域に割り当てられるビット量を十分な情報
量が与えられないよう減少させるようにしたため、付加
されたコピー妨害信号に情報量を消費され、全体的に量
子化ビット量が不足することによって、音質劣化をもた
らすことができ、これによりコピー記録を間接的に防止
することができる。
As described above, according to the present invention,
By inserting a copy disturbing signal at the very end of the masking level into a band that is not required for the signal in the frequency domain and converting it into a PCM audio signal in the time domain, the compression processing of the converted PCM audio signal at the time of copy recording can be performed originally. Bits are allocated to bands that are not required, and the amount of bits allocated to bands that are originally required for auditory importance is reduced so as not to provide a sufficient amount of information. The consumption and the shortage of the quantization bit amount on the whole can cause sound quality degradation, thereby indirectly preventing copy recording.

【0046】また、本発明によれば、コピー妨害信号は
全帯域にわたって加算されているため、聴取者や音源の
相違によらず、音質劣化を確実に知覚させることがで
き、複製物防止効果を十分に得ることができ、第一世代
についても間接的にコピー記録を防止することができ
る。
Further, according to the present invention, since the copy disturbing signal is added over the entire band, the sound quality deterioration can be reliably perceived irrespective of the difference between the listener and the sound source, and the copy preventing effect can be obtained. It is possible to obtain a sufficient amount, and it is possible to indirectly prevent copy recording of the first generation.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明方法の一実施の形態の動作説明用フロー
チャートである。
FIG. 1 is a flowchart for explaining the operation of an embodiment of the method of the present invention.

【図2】本発明によりコピー妨害信号を付加した音源に
おけるマスキングレベルと与えられたビット配分によっ
て生じる量子化ノイズレベルとの一例の対比図である。
FIG. 2 is a comparison diagram of an example of a masking level in a sound source to which a copy interference signal is added according to the present invention and a quantization noise level generated by a given bit allocation;

【図3】本発明によりコピー妨害信号を付加した音源に
よるビット配分の一例を示す図である。
FIG. 3 is a diagram illustrating an example of bit allocation by a sound source to which a copy interference signal is added according to the present invention;

【図4】本発明装置の一実施の形態のブロック図であ
る。
FIG. 4 is a block diagram of an embodiment of the device of the present invention.

【図5】一般的なビット配分の一例の説明用フローチャ
ートである。
FIG. 5 is a flowchart illustrating an example of general bit allocation.

【図6】通常の音源におけるマスキングレベルと与えら
れたビット配分によって生じる量子化ノイズレベルとの
一例の対比図である。
FIG. 6 is a comparison diagram of an example of a masking level in a normal sound source and a quantization noise level generated by a given bit allocation.

【図7】通常の音源におけるビット配分の一例を示す図
である。
FIG. 7 is a diagram showing an example of bit allocation in a normal sound source.

【符号の説明】[Explanation of symbols]

11 時間−周波数変換回路 12 マスキング量算出回路 13 コピー妨害信号生成回路 14 加算回路 15 周波数−時間変換回路 Reference Signs List 11 time-frequency conversion circuit 12 masking amount calculation circuit 13 copy interference signal generation circuit 14 addition circuit 15 frequency-time conversion circuit

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D044 AB05 DE03 DE13 DE17 DE50 DE52 EF05 GK08 HL08 5D045 DA20  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5D044 AB05 DE03 DE13 DE17 DE50 DE52 EF05 GK08 HL08 5D045 DA20

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 パルス符号変調されたPCM音声信号
を、単位時間毎に周波数領域の信号に変換する第1のス
テップと、 前記第1のステップにより得られた周波数領域の信号を
人間の周波数分解能に対応した臨界帯域幅を単位とする
サブバンドに区切り、各サブバンド毎にこの周波数領域
信号についてマスキングレベルを算出する第2のステッ
プと、 前記マスキングレベルを全帯域にわたり畳み込み演算を
行い、個々の前記サブバンドにおける最終的なマスキン
グレベルを決定し、このマスキングレベル以下の雑音信
号をコピー妨害信号として各サブバンド単位で計算して
発生する第3のステップと、 前記コピー妨害信号を前記第1のステップにより得られ
た周波数領域の信号に加算する第4のステップと、 前記第4のステップで得られた信号を時間領域のPCM
音声信号に変換する第5のステップと、 前記第5のステップにより得られた前記PCM音声信号
を記録媒体に記録する第6のステップとを含むことを特
徴とする音声信号の記録方法。
A first step of converting a pulse code modulated PCM audio signal into a frequency domain signal for each unit time; and converting the frequency domain signal obtained in the first step into a human frequency resolution. A second step of dividing the subband into subbands each having a critical bandwidth corresponding to and calculating a masking level for this frequency domain signal for each subband; performing a convolution operation on the masking level over the entire band; A third step of determining a final masking level in the sub-band, calculating a noise signal lower than the masking level as a copy interference signal for each sub-band, and generating the copy interference signal. A fourth step of adding to the frequency domain signal obtained in the step, and a fourth step obtained in the fourth step. PCM of the issue time-domain
A method of recording an audio signal, comprising: a fifth step of converting the signal into an audio signal; and a sixth step of recording the PCM audio signal obtained in the fifth step on a recording medium.
【請求項2】 パルス符号変調されたPCM音声信号
を、単位時間毎に周波数領域の信号に変換する第1のス
テップと、 前記第1のステップにより得られた周波数領域の信号を
人間の周波数分解能に対応した臨界帯域幅を単位とする
サブバンドに区切り、各サブバンド毎にこの周波数領域
信号についてマスキングレベルを算出する第2のステッ
プと、 前記マスキングレベルを全帯域にわたり畳み込み演算を
行い、個々の前記サブバンドにおける最終的なマスキン
グレベルを決定し、このマスキングレベル以下の雑音信
号をコピー妨害信号として各サブバンド単位で計算して
発生する第3のステップと、 前記コピー妨害信号を前記第1のステップにより得られ
た周波数領域の信号に加算する第4のステップと、 前記第4のステップで得られた信号を時間領域のPCM
音声信号に変換する第5のステップと、 前記第5のステップにより得られた前記PCM音声信号
を伝送する第6のステップとを含むことを特徴とする音
声信号の伝送方法。
2. A first step of converting a pulse code modulated PCM audio signal into a frequency domain signal for each unit time, and converting the frequency domain signal obtained by the first step into a human frequency resolution. A second step of dividing the subband into subbands each having a critical bandwidth corresponding to and calculating a masking level for this frequency domain signal for each subband; performing a convolution operation on the masking level over the entire band; A third step of determining a final masking level in the sub-band, calculating a noise signal lower than the masking level as a copy interference signal for each sub-band, and generating the copy interference signal. A fourth step of adding to the frequency domain signal obtained in the step, and a fourth step obtained in the fourth step. PCM of the issue time-domain
A method for transmitting an audio signal, comprising: a fifth step of converting the signal into an audio signal; and a sixth step of transmitting the PCM audio signal obtained in the fifth step.
【請求項3】 パルス符号変調されたPCM音声信号
を、単位時間毎に周波数領域の信号に変換する時間−周
波数変換回路と、 前記時間−周波数変換回路により得られた周波数領域の
信号を人間の周波数分解能に対応した臨界帯域幅を単位
とするサブバンドに区切り、各サブバンド毎にこの周波
数領域信号についてマスキングレベルを算出し、そのマ
スキングレベルを全帯域にわたり畳み込み演算を行い、
個々の前記サブバンドにおける最終的なマスキングレベ
ルを決定するマスキング量算出回路と、 前記マスキング量算出回路により決定されたマスキング
レベル以下の雑音信号をコピー妨害信号として各サブバ
ンド単位で計算して発生するコピー妨害信号生成回路
と、 前記コピー妨害信号を前記時間−周波数変換回路から出
力された周波数領域の信号に加算して出力する加算回路
と、 前記加算回路から出力された信号を時間領域のPCM音
声信号に変換する周波数−時間変換回路と、 前記周波数−時間変換回路から出力された前記PCM音
声信号を記録媒体に記録する記録手段とを有することを
特徴とする記録装置。
3. A time-frequency conversion circuit for converting a pulse code modulated PCM audio signal into a frequency domain signal for each unit time, and converting a frequency domain signal obtained by the time-frequency conversion circuit into a human signal. Divided into subbands with a critical bandwidth corresponding to the frequency resolution as a unit, calculate a masking level for this frequency domain signal for each subband, perform a convolution operation on the masking level over the entire band,
A masking amount calculating circuit for determining a final masking level in each of the subbands; and a noise signal having a masking level equal to or less than the masking level determined by the masking amount calculating circuit is calculated and generated as a copy interference signal for each subband. A copy interference signal generation circuit, an addition circuit for adding the copy interference signal to a frequency domain signal output from the time-frequency conversion circuit and outputting the added signal, and a time domain PCM audio signal output from the addition circuit. A recording apparatus comprising: a frequency-time conversion circuit for converting a signal into a signal; and recording means for recording the PCM audio signal output from the frequency-time conversion circuit on a recording medium.
【請求項4】 パルス符号変調されたPCM音声信号
を、単位時間毎に周波数領域の信号に変換する時間−周
波数変換回路と、 前記時間−周波数変換回路により得られた周波数領域の
信号を人間の周波数分解能に対応した臨界帯域幅を単位
とするサブバンドに区切り、各サブバンド毎にこの周波
数領域信号についてマスキングレベルを算出し、そのマ
スキングレベルを全帯域にわたり畳み込み演算を行い、
個々の前記サブバンドにおける最終的なマスキングレベ
ルを決定するマスキング量算出回路と、 前記マスキング量算出回路により決定されたマスキング
レベル以下の雑音信号をコピー妨害信号として各サブバ
ンド単位で計算して発生するコピー妨害信号生成回路
と、 前記コピー妨害信号を前記時間−周波数変換回路から出
力された周波数領域の信号に加算して出力する加算回路
と、 前記加算回路から出力された信号を時間領域のPCM音
声信号に変換する周波数−時間変換回路と、 前記周波数−時間変換回路から出力された前記PCM音
声信号を伝送させる出力手段とを有することを特徴とす
る伝送装置。
4. A time-frequency conversion circuit that converts a pulse code modulated PCM audio signal into a frequency domain signal for each unit time, and converts a frequency domain signal obtained by the time-frequency conversion circuit into a human signal. Divided into subbands with a critical bandwidth corresponding to the frequency resolution as a unit, calculate a masking level for this frequency domain signal for each subband, perform a convolution operation on the masking level over the entire band,
A masking amount calculating circuit for determining a final masking level in each of the subbands; and a noise signal having a masking level equal to or less than the masking level determined by the masking amount calculating circuit is calculated and generated as a copy interference signal for each subband. A copy interference signal generation circuit, an addition circuit for adding the copy interference signal to a frequency domain signal output from the time-frequency conversion circuit and outputting the added signal, and a time domain PCM audio signal output from the addition circuit. A transmission apparatus comprising: a frequency-time conversion circuit that converts a signal into a signal; and an output unit that transmits the PCM audio signal output from the frequency-time conversion circuit.
【請求項5】 パルス符号変調されたPCM音声信号
を、時間−周波数変換してから人間の周波数分解能に対
応した臨界帯域幅を単位とするサブバンドに区切り、こ
れらサブバンドのそれぞれについてマスキングレベルを
算出し、それらマスキングレベルを全帯域にわたり畳み
込み演算を行い、個々の前記サブバンドにおける最終的
なマスキングレベルを決定し、各サブバンド単位で計算
した前記マスキングレベル以下の雑音信号をコピー妨害
信号として加算したPCM音声信号が記録されているこ
とを特徴とする記録媒体。
5. A pulse code modulated PCM audio signal is subjected to time-frequency conversion and then divided into sub-bands each having a critical bandwidth corresponding to human frequency resolution, and a masking level is set for each of these sub-bands. Calculate, perform a convolution operation on those masking levels over the entire band, determine the final masking level in each of the subbands, and add a noise signal below the masking level calculated for each subband as a copy interference signal. A recording medium characterized by recording a PCM audio signal.
【請求項6】 パルス符号変調されたPCM音声信号
を、時間−周波数変換してから人間の周波数分解能に対
応した臨界帯域幅を単位とするサブバンドに区切り、こ
れらサブバンドのそれぞれについてマスキングレベルを
算出し、それらマスキングレベルを全帯域にわたり畳み
込み演算を行い、個々の前記サブバンドにおける最終的
なマスキングレベルを決定し、各サブバンド単位で計算
した前記マスキングレベル以下の雑音信号をコピー妨害
信号として加算したPCM音声信号を、伝送することを
特徴とする伝送媒体。
6. A pulse code modulated PCM audio signal is subjected to time-frequency conversion and then divided into sub-bands each having a critical bandwidth corresponding to human frequency resolution, and a masking level is set for each of these sub-bands. Calculate, perform a convolution operation on those masking levels over the entire band, determine the final masking level in each of the subbands, and add a noise signal below the masking level calculated for each subband as a copy interference signal. A transmission medium for transmitting a PCM audio signal.
【請求項7】 前記第3のステップは、人間の聴感特性
に基づく絶対可聴レベルと相対可聴レベルから得られた
マスキングレベルを指標とし、個々の前記サブバンドに
与えられたレベル調整信号を前記マスキングレベルに乗
算することにより、前記コピー妨害信号を生成すること
を特徴とする請求項1記載の音声信号の記録方法。
7. The third step is to use a masking level obtained from an absolute audible level and a relative audible level based on a human auditory characteristic as an index, and to apply a level adjustment signal given to each of the sub-bands to the masking. The method according to claim 1, wherein the copy interference signal is generated by multiplying a level.
JP2000228270A 2000-07-28 2000-07-28 Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium Pending JP2002042416A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000228270A JP2002042416A (en) 2000-07-28 2000-07-28 Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000228270A JP2002042416A (en) 2000-07-28 2000-07-28 Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium

Publications (1)

Publication Number Publication Date
JP2002042416A true JP2002042416A (en) 2002-02-08

Family

ID=18721590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000228270A Pending JP2002042416A (en) 2000-07-28 2000-07-28 Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium

Country Status (1)

Country Link
JP (1) JP2002042416A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006041055A1 (en) * 2004-10-13 2006-04-20 Matsushita Electric Industrial Co., Ltd. Scalable encoder, scalable decoder, and scalable encoding method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006041055A1 (en) * 2004-10-13 2006-04-20 Matsushita Electric Industrial Co., Ltd. Scalable encoder, scalable decoder, and scalable encoding method
US8010349B2 (en) 2004-10-13 2011-08-30 Panasonic Corporation Scalable encoder, scalable decoder, and scalable encoding method

Similar Documents

Publication Publication Date Title
US7366907B1 (en) Information processing device and method and program storage medium
JP4504414B2 (en) Redundancy reduction method
US7372375B2 (en) Signal reproducing method and device, signal recording method and device, and code sequence generating method and device
Matsuoka Spread spectrum audio steganography using sub-band phase shifting
JP4431047B2 (en) Method and system for encoding and detecting multiple messages in voice data
JP3571068B2 (en) Method for compatible transmission and / or storage and decoding of auxiliary signals
JP3856652B2 (en) Hidden data embedding method and apparatus
US5864820A (en) Method, system and product for mixing of encoded audio signals
US20020009000A1 (en) Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
Cheng et al. Spread spectrum signaling for speech watermarking
JP2000163870A (en) Voice information control device and method
JP2000228632A (en) Encoding circuit and signal processor
KR20020002241A (en) Digital audio system
US5864813A (en) Method, system and product for harmonic enhancement of encoded audio signals
JPH11110913A (en) Voice information transmitting device and method and voice information receiving device and method and record medium
US6735252B1 (en) Encoding apparatus, decoding apparatus, decoding method, recording apparatus, recording method, reproducing apparatus, reproducing method, and record medium
KR20050074501A (en) Music information encoding device and method, and music information decoding device and method
JP3557674B2 (en) High efficiency coding method and apparatus
JP2004318126A (en) Digital audio processing
JP2002042416A (en) Voice signal recording method, its transmitting method, its recording device, its transmitting device, its recording medium and its transmitting medium
MXPA02003990A (en) Method and apparatus for reducing the word length of a digital input signal and method and apparatus for recovering the digital input signal.
Acevedo Audio watermarking: properties, techniques and evaluation
JP3503434B2 (en) Copyright information embedding device and recording medium
AU761944B2 (en) Method and apparatus for signal processing
JP2004088619A (en) Code string encryption method, apparatus and encryption release method, apparatus and recording medium