[go: up one dir, main page]

CN102222504A - 数字音频多层水印植入及提取方法 - Google Patents

数字音频多层水印植入及提取方法 Download PDF

Info

Publication number
CN102222504A
CN102222504A CN2011101553893A CN201110155389A CN102222504A CN 102222504 A CN102222504 A CN 102222504A CN 2011101553893 A CN2011101553893 A CN 2011101553893A CN 201110155389 A CN201110155389 A CN 201110155389A CN 102222504 A CN102222504 A CN 102222504A
Authority
CN
China
Prior art keywords
mrow
msub
watermark
audio signal
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101553893A
Other languages
English (en)
Inventor
杨智恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN JINGUANGYI TECHNOLOGY CO LTD
Original Assignee
SHENZHEN JINGUANGYI TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN JINGUANGYI TECHNOLOGY CO LTD filed Critical SHENZHEN JINGUANGYI TECHNOLOGY CO LTD
Priority to CN2011101553893A priority Critical patent/CN102222504A/zh
Publication of CN102222504A publication Critical patent/CN102222504A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本发明公开一种数字音频多层水印植入方法,其包括步骤:a、在原音频信号中确定插入第i层水印的第i频带;b、在插入第i层水印时,判断i-1是否为0,若不为0,转入步骤c,否则继续判断第i-1频带中是否已经植入了第i-1层水印,若是,则转入步骤c;c、在原音频信号的第i频带中插入第i层水印;其中,4≥i≥1,且i为正整数。本发明还公开一种数字音频多层水印提取方法。本发明利用量化音频信号的傅里叶变换,将音频信号从时间域转换到频率域植入或提取水印码,并扩展至特定的多层频谱上,具有可靠性高的优点。

Description

数字音频多层水印植入及提取方法
技术领域
本发明涉及数字信号处理技术,尤其是涉及一种针对原始音频数字信号的多层数字水印信息植入及提取的方法。
背景技术
标记水印是指将称为“水印”的机密信息嵌入如视频、图象、音频及文本的媒体中。嵌入的水印信息能够仅限于由了解该信息的人提取。具有水印的媒体在一般用户看来与普通媒体相同。
特别地,由于与类似媒体相比,其中通过电波或通信网络,存取、传输、编辑和保管容易而且数据分布时不产生数据消减的优势,数字媒体产生新的版权保护的问题。数字水印作为保护版权的方法而受到注意。
数字水印不仅用于插入信息来辨别所有者以保护版权,也用于插入反盗版、分布确认(distribution confirmation)、广播监控等的控制信息或用于将信息如演示时间控制信息、同步(lip-sync)、内容信息和歌词插入到实时媒体如音频、视频等并传送插入的信息。
依据应用范围,通常可以把数字水印划分为静态图像水印、视频图像水印和音频水印。近年来,对静态图像水印和视频图像水印的研究很多,而对于数字音频水印技术的研究却比较少,这是由于与图像和视频相比,音频信号在每个时间间隔内采样的点数要少得多,意味着音频信号中可植入的信息比可视媒体少得多。另外,人类听觉系统(HAS)要比人类视觉系统(HVS)灵敏得多,听觉上的不可知觉性实现起来要比视觉上困难。
在水印方法中,音频信号水印方法有多种实例,如LSB(最低有效位:Least Significant Bit)编码方法、回音隐藏(echo hiding)方法、及扩展频谱(spread spectrum)通信方法等。
在LSB编码方法中,量化的音频样本的最低有效位被变形以插入期望的信息。LSB编码方法利用了音频信号最低有效位的变形几乎不影响音质这一特征。LSB编码方法的优点在于,插入和检测易于进行并且音质较少地失真,但其缺点在于,对于信号处理如有损压缩或滤波来说易受攻击。
另外,在回音隐藏方法中,一个听不到的回音被插入到音频信号中。也就是说,回音隐藏方法根据将被插入的二进制水印信息,将具有不同时间延迟的回音插入并编码到以预定间隔细分的音频信号中。在解码过程中,通过检测每一细分的持续时间内的回音时间延迟,二进制信息被解码。这样,插入的信号不是噪声,而是具有与原始信号相同特性的音频信号本身。因此,即使插入的信号被听到,插入的信号也不会被识别为失真信号。插入信号还被认为提供更好的音色。因此,回音隐藏方法适用于高质量音频水印,但其缺点在于,因为通过倒谱(Cepstrum)操作进行检测,解码的操作数量非常高,而且如果在时域细分的持续时间同步缺失,便无法进行解码。
另外,扩展频谱通信方法是一种典型的水印方法,其在视频水印中流行并最多用于音频水印的研究。在扩展频谱通信方法中,音频信号通过离散傅立叶变换(DFT)变换为频率,并其后二进制水印信息被频率扩展到PN(伪噪声)序列以将扩展信息插入频率变换的音频信号中。利用PN序列的高自动关联特性,插入的水印能够通过相关器(correlator)检测,并具有抗干扰的鲁棒性以及优良的加密性的特性。反之,扩展频谱通信方法其缺点在于:声音质量下降,插入和检测的操作数量非常高,而且如果在插入有大功率水印以增强其鲁棒性时压缩编码不能被完成。
这样,概括传统的音频水印,传统的音频水印缺点在于:因为通常在原始信号被压缩和解码前水印信息被插入到原始信号中,其实现方法复杂,因此当其压缩时需要较多的操作数量并且原始信号容易变形。
发明内容
本发明提出一种音频数字多层数字水印植入及提取方法,以解决目前音频水印插入和提取操作复杂、难于实现的技术问题。
本发明采用如下技术方案实现:一种数字音频多层水印植入方法,其包括步骤:
a、在原音频信号中确定插入第i层水印的第i频带;
b、在插入第i层水印时,判断i-1是否为0,若不为0,转入步骤c,否则继续判断第i-1频带中是否已经植入了第i-1层水印,若是,则转入步骤c;
c、在原音频信号的第i频带中插入第i层水印;
其中,4≥i≥1,且i为正整数。
在一个优选实施例中,步骤c包括:
c1、确定第i层水印的水印码;
c2、依次读取预定时间长度的音频信号段,分别在每个音频信号段中植入水印码,将植入水印码的音频信号段写至一个新音频信号。
在一个优选实施例中,步骤c2包括:
c21、计算二进制的水印码中的每一位在原音频信号的时间轴上对应的植入时刻;
c22、将植入时刻的原音频信号做傅里叶变换,把时间域变换到频率域,在频率域中计算植入第i层水印的水印码后第i频带的新幅值。
在一个优选实施例中,在步骤c22中所述第i频带的新幅值的计算步骤包括:
c221、计算第i层水印的水印码每一位植入时刻,原音频信号中第i频带的上限频率fi和下限频率gi分别对应的幅值Afi,Agi
A fi = [ Σ n = 0 N - 1 cos ( 2 πf i F s ) x n ] 2 + [ Σ n = 0 N - 1 sin ( 2 πf i F s ) x n ] 2 ,
A gi = [ Σ n = 0 N - 1 cos ( 2 πg i F s ) x n ] 2 + [ Σ n = 0 N - 1 sin ( 2 πg i F s ) x n ] 2 ,
c222、如果植入的水印码二进制位为1,并且
Figure BDA0000067381010000043
则该植入时刻时第i频带的上限频率fi和下限频率gi分别对应的新幅值如下计算:
Figure BDA0000067381010000044
否则第i频带的上限频率fi和下限频率gi分别对应的新幅值等于步骤c221中计算出的幅值Afi和Agi
c223、如果植入的水印码二进制位为0,并且
Figure BDA0000067381010000045
则该植入时刻时第i频带的上限频率fi和下限频率gi分别对应的新幅值如下计算:
Figure BDA0000067381010000046
否则第i频带的上限频率fi和下限频率gi分别对应的新幅值等于步骤c221中计算出的幅值Afi和Agi
其中,N代表原音频信号的采样点数目;xn为原音频信号采样值序列,Fs为采样频率;γs为用户控制参数。
在一个优选实施例中,1<γs<10。
在一个优选实施例中,所述判断第i-1频带中是否已经植入了第i-1层水印,是通过对第i-1频带进行水印提取操作,如果发现水印,即认为第i-1频带中已经植入了第i-1层水印。
在一个优选实施例中,水印码为一个介于16至32位的二进制数值。
在一个优选实施例中,第1频带为500Hz-600Hz;第2频带为550Hz-650Hz;第3频带为700Hz-800Hz;第4频带为750Hz-850Hz。
另外,本发明还公开一种数字音频多层水印提取方法,其包括步骤:
对用户指定的频带,或是从默认的4个频带,进行水印提取操作;
由两个频率检测器确定第i频带中水印码在音频信号中的时刻信息;
将音频信号通过傅里叶变换转换成频率域,在频率域中计算水印码所在时刻第i频带的幅值;
通过第i频带上限频率fi对应的幅值
Figure BDA0000067381010000051
与下限频率gi对应的幅值
Figure BDA0000067381010000052
的幅值比:
Figure BDA0000067381010000053
得到水印码的二进制序列Bi,其中 B i = 1 , ( &Delta; i &GreaterEqual; 1 ) 0 , ( &Delta; i < 1 ) .
在一个优选实施例中,第i频带上限频率对应的幅值
Figure BDA0000067381010000055
与下限频率对应的幅值
Figure BDA0000067381010000056
分别为:
A ^ fi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;f i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;f i F s ) y n ] 2 ;
A ^ gi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;g i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;g i F s ) y n ] 2 ;
其中,yn表示带水印的音频信号,N代表原音频信号的采样点数目,Fs为采样频率。
与现有技术相比,本发明具有如下有益效果:
本发明利用量化音频信号的傅里叶变换,将音频信号从时间域转换到频率域植入或提取水印码,并扩展至特定的3层或4层频谱上,从而也避免了现有水印技术基本上都只嵌入一层水印,而无法形成对音乐知识产权产业链的保护的难题。
另外,本发明只对原音频信号进行很微小的改动,这意味着加入的数字水印对用户的听觉和视觉来说,是不可察觉的。除非对原始信号进行巨大的毁灭性的破坏,否则加入的水印也是不可被磨灭或修改的。同时水印具有高可靠性,能够抵抗各种格式转换,噪声,恶意篡改和攻击。
附图说明
图1是本发明实现数字音频多层水印植入的流程示意图;
图2是图1中步骤S14的具体流程示意图。
具体实施方式
本发明提出了一个基于音频数据的数字水印嵌入及提取的实现方法。针对音频信号的特性,利用音频信号多个相邻频谱间能量的变化关系,嵌入数字水印而不影响音频的品质,分别承受压缩、低通滤波、标准化处理、D/A转换和信号裁剪的攻击,依然能够保持数字水印的完整性。在对音频数据认证时,该数字水印侦测及取回技术不需原始音频信号,就能将数字水印数据快速取出。同时在数字水印中应用错误更正码和同步码搜寻方法,使得当音乐遭受攻击时,能大大提高水印数据的复原率,即使当音频被变换格式后,例如从wav格式变换至mp3格式后,数字水印也不会丢失。
本发明利用量化音频信号的快速横向自适应滤波(Fast Transversal Filter,FTF)系数,并扩展至音频信号的特定多层频谱上,从而也避免了现有水印技术基本上都只嵌入一道水印,而无法形成对音乐知识产权产业链的保护的难题。
由于音频文件中能容纳的信息量是有限的,如果水印信息太多,会严重削弱原始音频的质量,造成破坏。因此,一般在音频文件中插入的水印码的层数不能太大。在本发明的一个优选实施例中,在音频文件中插入四层水印码,水印码的前三层层次关系可以用来反映现实中的供应链关系,即版权方(Owner)——发行方(Distributor)——使用方(User),或者也可以用来代表2或3家平行的发行机构,第四层可留作备用。
如图1所示,本发明提出的数字音频多层水印植入方法包括实现步骤:
步骤S11:确定各层水印插入音频信号(原音频信号)的频带。
第1层水印插入原音频信号的第1频带(f1,g1);第2层水印插入原音频信号的第2频带(f2,g2);第3层水印插入原音频信号的第3频带(f3,g3);第4层水印插入原音频信号的第4频带(f4,g4)。其中,第1频带(f1,g1)、第2频带(f2,g2)、第3频带(f3,g3)、第4频带(f4,g4)均为100Hz至4000Hz频率范围内的频带。
此4个频带中,f1、g1、f2、g2、f3、g3、f4和g4都代表着频率,默认值为:f1=500Hz,g1=600Hz,f2=550Hz,g2=650Hz,f3=700Hz,g3=800Hz,f4=750Hz,g4=850Hz。
由于在音频信号中,人声和各种乐声是一种随机信号,其波形十分复杂,可听声音的频率范围一般可达20Hz-20KHz;其中语言的频谱范围约在150Hz-4KHz左右;而各种音乐的频谱范围可达40Hz-18KHz左右;其平均频谱的能量分布为:低音和中低音部分最大,中高音部分次之,高音部分最小(约为中、低音部分能量的1/10);人声的能量90%主要集中在200Hz-3.5KHz频率范围。这些可听声随机信号幅度的峰值比它的平均值的大10-15dB(甚至更高一点)。按照这样的原则,被选择的4个频带集中了原始音频信号的大部分能量。
这样确定插入水印的频带有两方面好处:第一,它保证有数量充足的持续时间来植入水印码,用来实施噪声保护;第二,在这样的频带选择中,当原音频信号被压缩时,原音频信号的波形基本上可以保证安全,例如,在当把wav文件压缩转换成mp3格式时。
步骤S12:在插入第i层(i≥1,且i为正整数)水印时,判断i-1是否为0。
水印码的植入逻辑顺序依次为第1层水印、第2层水印、第3层水印和第4层水印。如果未植入第1层水印,是无法植入第2层水印的,同理,未植入第2层水印,是无法植入第3层水印的。保证水印的植入顺序,也是对行业发行链规则的一种保护。当然,这每层水印的植入时间是不限的,比如植入第1层水印后,时隔一年再植入第2层水印。本发明在每次植入之前,会先检测是否已经植入了前一层水印(对第一层水印除外)。水印植入之后,就无法再从音频中把水印抹去。
基于几层水印插入之间的先后顺序,在插入第i层(i≥1,且i为正整数)水印时,需要先判断其上一层(第i-1层)是否已经植入水印;其中,若植入第1层水印时,其不存在上一层水印,因而无需判断该音频文件中是否已植入了上一层水印。因此,该步骤S12通过判断i-1是否为0,若等于0,说明当前是植入第1层水印,否则为植入第2、3或4层水印。
若i-1=0,则转入步骤S14,否则转入步骤S13。
步骤S13:判断第i-1层是否已经植入了水印,如第i-1层已经植入了水印,则转入步骤S14,否则无法植入第i层水印。
4层水印分别对应着上述4个频带,若用户指定需写入第i层(i为2、3或4)水印,则首先会对第i-1层水印在对应的第i-1频带(fi-1,gi-1)进行水印提取操作,如果发现水印,即认为已经植入了上一层水印。如果未发现频带(fi-1,gi-1)中包含水印,则认为未植入水印,就提示用户需要先植入第i-1层水印
步骤S14:在原音频信号的第i频带(fi,gi)插入第i层水印。
结合图2所示,具体来说,该步骤S14包括:
步骤S141:设定插入原音频信号第i频带(fi,gi)中的第i层水印的数值(或水印码)。
水印植入过程是向原始的数字音频信号中植入一个预设的、且具有唯一性的水印码,水印的数字是一个长度为mb位的二进制数,满足:
16≤mb≤32。
另外,水印的数字可以由用户预定义码表或者使用事先准备分配好的码表。
在一个音频信号(比如一首歌曲)中可以植入多层相互独立的水印码,缺省情况下,第1层水印为长度是32位的二进制数值(表示水印取值范围可取任意从1~232的整数,即1~4294967296),第2层水印为长度是24位的二进数值制,第3层和第4层水印的长度都是16位的二进制数值。
步骤S142:从原音频信号中依次读取时间长为Tx的音频信号段,目的是在每个音频信号段中插入第i层水印码。
假如:往原始的数字音频信号中写入1位(比特)信息的时间Tbit(单位:秒)满足下列条件:
0.05≤Tbit≤0.2
其中,为方便用户,Tbit的值可以也可以由用户指定。由于最长的水印码长度是32位二进制位,所以对于单次水印码的植入,最长的持续时间Tcode(单位:秒)满足:
1.6≤Tcode≤6.4。
确切的Tcode值,取决于所选的Tbit值。
拥有这些参数的水印码会在原始的数字音频信号持续时间内有间隔地植入多次(一般至少需要插入2次,因此,原始的数字音频信号的时间长至少为25秒)。因此,在原始的数字音频信号各个不同区段上对水印码的检测是需要保证的。根据国际惯例的推荐,本发明按最低区段时长为10秒来实现,即Tx=10秒。
对原始的音频数据按时间轴方向,水印植入时,每10秒重复植入一次水印信息,这样的冗余设计保证了水印的鲁棒性,当原始音频被截断成多段时,也可以保障水印信息的提取。当提取水印时,并不需要在整个音频时间范围内检测,只要连续二次检测到水印信息存在于音频文件中,就停止检测,并认为原始音频带有水印信息。
并且在一个优选实施例中,对mb和Tbit具体值的最佳选择,要根据原始的数字音频信号的时间和频率特性而定,即尽量使之满足mb*Tbit*n≈Ttrack,n为正整数,Ttrack为原音频信号的时长。
然后,由步骤S143和S144在读取的时间长为Tx的音频信号段中植入水印码,并将植入水印码的音频信号段写入至一个新音频信号。
步骤S143:计算出为二进制的水印码wm1中的每一位(bit)在原音频信号的时间轴上的位置。原音频信号的时间轴就是以开始位置为0,按照原音频信号的时长从0开始至原音频信号的末端的时间矢量。也就是说,是确定水印码wm1中的每一个位插入至原音频信号中以时间表示的具体位置,即植入时刻。
步骤S144:对于水印码wm1中的每一位的植入时刻,将植入时刻的原音频信号做傅里叶(Fourier)变换,把时间域变换到频率域,按下列水印算法公式(1)和(2)植入相应的水印位。
水印码的植入并不是在时间域上简单地修改音频信号的幅值,而是在变换域对信号的频率系数进行分析计算。原音频信号相当于通信信道,水印相当于通过信道传输的信号,按照扩频通信原理,将水印码的每一位分布在原始音频信号的多个频域系数中,加在每个频率系数上的信号能量很小且不可随意检测。
其中,将原始的数字音频信号表示为:xn,n=0,1,2,...,N-1,其中N为离散信号的采样点数。原音频信号的采样频率为Fs,常见的声音信号序列是WAV文件,如上所述,水印作为一个额外信号将植入原音频信号xn中。
对于在原音频信号的第i频带(fi,gi)中插入第i层水印,在水印的每一位植入时刻,原音频信号中第i频带(fi,gi)的上下限频率值分别对应的幅值Afi,Agi按下式进行计算:
A fi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;f i F s ) x n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;f i F s ) x n ] 2 - - - ( 1 )
A gi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;g i F s ) x n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;g i F s ) x n ] 2 - - - ( 2 )
其中,N代表原音频信号的采样点数目。
式中xn为原音频信号采样值序列,Fs为采样频率,fi、gi分别为所选第i频带(fi,gi)的上下限频率值。
如果植入的二进制位为1,并且则新值按下式计算:否则新值取计算出的Afi和Agi
水印植入时,分批读入原音频信号的数据到内存,水印算法对其进行计算和分析,然后分批写入到新音频信号中,即带水印的音频文件和原音频文件是两个不同的文件。
同样地,如果植入的二进制位为0,并且
Figure BDA0000067381010000114
则新值按下式计算:否则新值取计算出的Afi和Agi
γs为用户控制参数,通过它的值来对原始信号进行修正:
1<γs<10。
通过用户控制参数对原始信号进行修,用户控制参数的选取既要保证水印码能安全地植入,又要保证水印码能可靠地读出。
允许信号信道中频率特性的正常扭曲,实际上并没有改变幅值比,因为选择的频率处在相对狭窄的频率范围。
当然,本发明在植入水印码时,还可以紧着在水印码之后植入16位(二进制)的校验码,用来保证水印码的正确提取。在确定第i层水印码时,随机数发生器函数产生一个算法预定义好的任意整数值(即水印码);然后,水印码作为随机数发生器函数的种子,当输入相同的种子时,会得相同的一个随机数序列,此随机数序列用来计算水印码的循环冗余校验码,校验码长16位,在水印植入时会和水印码一同植入到音频信号中。例如:假设我们要向一首时长为201秒的音频文件植入第一层水印,水印值wm1=8564423,将其换算成二进制是:1000 0010 1010 1110 1100 0111,由于第一层水印字长为32位,所以在前面补上8个0,最后要植入的水印码为:0000 0000 1000 0010 10101110 1100 0111。若音频文件的总时长是201秒,水印码加上校验码一共48位,若取Tcode=2.01秒,得到Tbit=0.042秒,不满足Tbit条件,所以取Tcode=4.02秒,得到Tbit=0.084秒,这样各项参数均满足水印植入条件,按时间轴对原音频文件植入48位的水印(前32位为水印码,后16位为校验码)即可。
水印检测算法是水印植入算法的逆过程,为检测出水印码相邻的位(bit),设计了两个频率检测器。假设下一个相邻的位的值是:
Bi,i=0,1...mb-1,mb是水印值的二进制码的长度
水印提取时,由用户通过输入频带参数指定提取该频带中的水印码。如果用户不指定,则依次从默认的4个频带(第1频带(f1,g1)、第2频带(f2,g2)、第3频带(f3,g3)和第4频带(f4,g4))中依次执行水印提取动作,通过对带有水印的音频文件的时长和相应的频带水印码长度,可以计算出Tbit,通过取出Tbit时间间隔的开始时间点和结束时间点的音频信号,转换到频率域,即可计算出水印码所在的频带(fi,gi)。
计算出频带(fi,gi)中水印码所在时刻的音频信号的相应幅值,如下式:
A ^ fi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;f i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;f i F s ) y n ] 2 - - - ( 3 )
A ^ gi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;g i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;g i F s ) y n ] 2 - - - ( 4 )
其中,N表示音频采样点总数。
这里yn表示新音频信号(带有水印信息),幅值比为:
&Delta; i = A ^ f 1 A ^ gi
其中, B i = 1 , ( &Delta; i &GreaterEqual; 1 ) 0 , ( &Delta; i < 1 )
对新音频信号yn处理完的输出结果是一串位序列:
{Bi},i=0,1...,mb-1。
计算出的Δi的值将作为水印码位值可靠的判定标准。
通过频率检测确定计算水印码每一位是逻辑0或1,对带有水印码的音频数据进行遍历,得到符合相应频带水印码长度的水印信息,对该信息得进行自校验,抛弃不完整匹配的水印信息,直到得到完整无误的水印码。
由于各频带水印码长度是固定的,而且音频文件的时长也是固定的,可以计算出各频带水印码的每一位的持续时间和植入或提取时间。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数字音频多层水印植入方法,其特征在于,包括步骤:
a、在原音频信号中确定插入第i层水印的第i频带;
b、在插入第i层水印时,判断i-1是否为0,若不为0,转入步骤c,否则继续判断第i-1频带中是否已经植入了第i-1层水印,若是,则转入步骤c;
c、在原音频信号的第i频带中插入第i层水印;
其中,4≥i≥1,且i为正整数。
2.根据权利要求1所述数字音频多层水印植入方法,其特征在于,步骤c包括:
c1、确定第i层水印的水印码;
c2、依次读取预定时间长度的音频信号段,分别在每个音频信号段中植入水印码,将植入水印码的音频信号段写至一个新音频信号。
3.根据权利要求2所述数字音频多层水印植入方法,其特征在于,步骤c2包括:
c21、计算二进制的水印码中的每一位在原音频信号的时间轴上对应的植入时刻;
c22、将植入时刻的原音频信号做傅里叶变换,把时间域变换到频率域,在频率域中计算植入第i层水印的水印码后第i频带的新幅值。
4.根据权利要求3所述数字音频多层水印植入方法,其特征在于,在步骤c22中所述第i频带的新幅值的计算步骤包括:
c221、计算第i层水印的水印码每一位植入时刻,原音频信号中第i频带的上限频率fi和下限频率gi分别对应的幅值Afi,Agi
A fi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;f i F s ) x n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;f i F s ) x n ] 2 ,
A gi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;g i F s ) x n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;g i F s ) x n ] 2 ,
c222、如果植入的水印码二进制位为1,并且
Figure FDA0000067381000000021
则该植入时刻时第i频带的上限频率fi和下限频率gi分别对应的新幅值如下计算:
Figure FDA0000067381000000022
否则第i频带的上限频率fi和下限频率gi分别对应的新幅值等于步骤c221中计算出的幅值Afi和Agi
c223、如果植入的水印码二进制位为0,并且
Figure FDA0000067381000000023
则该植入时刻时第i频带的上限频率fi和下限频率gi分别对应的新幅值如下计算:
Figure FDA0000067381000000024
否则第i频带的上限频率fi和下限频率gi分别对应的新幅值等于步骤c221中计算出的幅值Afi和Agi
其中,N代表原音频信号的采样点数目;xn为原音频信号采样值序列,Fs为采样频率;γs为用户控制参数。
5.根据权利要求4所述数字音频多层水印植入方法,其特征在于,1<γs<10。
6.根据权利要求1所述数字音频多层水印植入方法,其特征在于,所述判断第i-1频带中是否已经植入了第i-1层水印,是通过对第i-1频带进行水印提取操作,如果发现水印,即认为第i-1频带中已经植入了第i-1层水印。
7.根据权利要求1所述数字音频多层水印植入方法,其特征在于,水印码为一个介于16至32位的二进制数值。
8.根据权利要求1-7任何一项所述数字音频多层水印植入方法,其特征在于,第1频带为500Hz-600Hz;第2频带为550Hz-650Hz;第3频带为700Hz-800Hz;第4频带为750Hz-850Hz。
9.一种数字音频多层水印提取方法,其特征在于,包括步骤:
对用户指定的频带,或是从默认的4个频带,进行水印提取操作;
由两个频率检测器确定第i频带中水印码在音频信号中的时刻信息;
将音频信号通过傅里叶变换转换成频率域,在频率域中计算水印码所在时刻第i频带的幅值;
通过第i频带上限频率fi对应的幅值与下限频率gi对应的幅值
Figure FDA0000067381000000032
的幅值比:
Figure FDA0000067381000000033
得到水印码的二进制序列Bi,其中 B i = 1 , ( &Delta; i &GreaterEqual; 1 ) 0 , ( &Delta; i < 1 ) .
10.一种数字音频多层水印提取方法,其特征在于,第i频带上限频率对应的幅值与下限频率对应的幅值
Figure FDA0000067381000000036
分别为:
A ^ fi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;f i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;f i F s ) y n ] 2 ;
A ^ gi = [ &Sigma; n = 0 N - 1 cos ( 2 &pi;g i F s ) y n ] 2 + [ &Sigma; n = 0 N - 1 sin ( 2 &pi;g i F s ) y n ] 2 ;
其中,yn表示带水印的音频信号,N代表原音频信号的采样点数目,Fs为采样频率。
CN2011101553893A 2011-06-10 2011-06-10 数字音频多层水印植入及提取方法 Pending CN102222504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101553893A CN102222504A (zh) 2011-06-10 2011-06-10 数字音频多层水印植入及提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101553893A CN102222504A (zh) 2011-06-10 2011-06-10 数字音频多层水印植入及提取方法

Publications (1)

Publication Number Publication Date
CN102222504A true CN102222504A (zh) 2011-10-19

Family

ID=44779038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101553893A Pending CN102222504A (zh) 2011-06-10 2011-06-10 数字音频多层水印植入及提取方法

Country Status (1)

Country Link
CN (1) CN102222504A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917989A (zh) * 2014-03-11 2015-09-16 移康智能科技(上海)有限公司 分级水印的添加方法及其系统
CN106331744A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互方法
CN107657958A (zh) * 2017-09-13 2018-02-02 厦门声连网信息科技有限公司 一种音乐识别系统、装置及音乐管理服务器和方法
CN110675304A (zh) * 2018-07-03 2020-01-10 山东华软金盾软件股份有限公司 一种图片水印编码方法
WO2022236451A1 (en) * 2021-05-08 2022-11-17 Microsoft Technology Licensing, Llc Robust authentication of digital audio

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050137876A1 (en) * 2003-12-17 2005-06-23 Kiryung Lee Apparatus and method for digital watermarking using nonlinear quantization
CN1638479A (zh) * 2003-12-27 2005-07-13 Lg电子有限公司 数字音频水印插入/检测装置及方法
CN1795494A (zh) * 2003-05-28 2006-06-28 皇家飞利浦电子股份有限公司 位流水印嵌入
JP2006186952A (ja) * 2004-12-28 2006-07-13 Nippon Hoso Kyokai <Nhk> 電子透かし埋込システム、電子透かし埋込装置、送信装置、受信装置、送信プログラム、及び受信プログラム
CN101124624A (zh) * 2005-01-21 2008-02-13 无限媒体股份有限公司 在有用信号中嵌入数字水印的方法
JP2010085737A (ja) * 2008-09-30 2010-04-15 Yamaha Corp 符号化装置及び情報通信システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1795494A (zh) * 2003-05-28 2006-06-28 皇家飞利浦电子股份有限公司 位流水印嵌入
US20050137876A1 (en) * 2003-12-17 2005-06-23 Kiryung Lee Apparatus and method for digital watermarking using nonlinear quantization
CN1638479A (zh) * 2003-12-27 2005-07-13 Lg电子有限公司 数字音频水印插入/检测装置及方法
JP2006186952A (ja) * 2004-12-28 2006-07-13 Nippon Hoso Kyokai <Nhk> 電子透かし埋込システム、電子透かし埋込装置、送信装置、受信装置、送信プログラム、及び受信プログラム
CN101124624A (zh) * 2005-01-21 2008-02-13 无限媒体股份有限公司 在有用信号中嵌入数字水印的方法
JP2010085737A (ja) * 2008-09-30 2010-04-15 Yamaha Corp 符号化装置及び情報通信システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《计算机应用》 20100531 杨晋霞等 基于小波包分析的数字音频双水印算法 3-5,7,8 第30卷, 第5期 *
杨晋霞等: "基于小波包分析的数字音频双水印算法", 《计算机应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917989A (zh) * 2014-03-11 2015-09-16 移康智能科技(上海)有限公司 分级水印的添加方法及其系统
CN106331744A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互方法
CN107657958A (zh) * 2017-09-13 2018-02-02 厦门声连网信息科技有限公司 一种音乐识别系统、装置及音乐管理服务器和方法
CN107657958B (zh) * 2017-09-13 2020-06-23 厦门声连网信息科技有限公司 一种音乐识别系统、装置及音乐管理服务器和方法
CN110675304A (zh) * 2018-07-03 2020-01-10 山东华软金盾软件股份有限公司 一种图片水印编码方法
WO2022236451A1 (en) * 2021-05-08 2022-11-17 Microsoft Technology Licensing, Llc Robust authentication of digital audio

Similar Documents

Publication Publication Date Title
Lie et al. Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification
Lin et al. Audio watermarking techniques
CN101271690B (zh) 保护音频数据的音频扩频水印处理方法
KR100492743B1 (ko) 신호의 특성값의 양자화에 의한 워터마크 삽입 및 검출방법
Wu et al. Robust and efficient digital audio watermarking using audio content analysis
CN100431355C (zh) 响应补充信息修改音频或视频感知编码系统的一个或多个参数
US8306811B2 (en) Embedding data in audio and detecting embedded data in audio
US8116514B2 (en) Water mark embedding and extraction
US7035700B2 (en) Method and apparatus for embedding data in audio signals
US20040059918A1 (en) Method and system of digital watermarking for compressed audio
Lie et al. Robust and high-quality time-domain audio watermarking subject to psychoacoustic masking
JP2001282265A (ja) コンピュータによる音声データ隠蔽方法および装置
CA2527011C (en) Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
CN102222504A (zh) 数字音频多层水印植入及提取方法
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
Wang et al. A new audio watermarking based on modified discrete cosine transform of MPEG/audio layer III
Park et al. Speech authentication system using digital watermarking and pattern recovery
Maha et al. A blind audio watermarking scheme based on neural network and psychoacoustic model with error correcting code in wavelet domain
Wu et al. Comparison of two speech content authentication approaches
Xu et al. Content-based digital watermarking for compressed audio
CN103745725B (zh) 一种基于常数q变换的音频水印嵌入方法
Hatada et al. Digital watermarking based on process of speech production
He et al. Efficiently Synchronized Spread‐Spectrum Audio Watermarking with Improved Psychoacoustic Model
Li et al. A novel audio watermarking in wavelet domain
Gopalan Robust watermarking of music signals by cepstrum modification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20111019

RJ01 Rejection of invention patent application after publication