CN1267920C - 信号处理方法与装置 - Google Patents
信号处理方法与装置 Download PDFInfo
- Publication number
- CN1267920C CN1267920C CNB988102927A CN98810292A CN1267920C CN 1267920 C CN1267920 C CN 1267920C CN B988102927 A CNB988102927 A CN B988102927A CN 98810292 A CN98810292 A CN 98810292A CN 1267920 C CN1267920 C CN 1267920C
- Authority
- CN
- China
- Prior art keywords
- piece
- section
- filter array
- window function
- synthetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000001914 filtration Methods 0.000 claims description 141
- 238000004458 analytical method Methods 0.000 claims description 119
- 230000004044 response Effects 0.000 claims description 117
- 238000003786 synthesis reaction Methods 0.000 claims description 109
- 239000002131 composite material Substances 0.000 claims description 90
- 230000015572 biosynthetic process Effects 0.000 claims description 86
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 230000014509 gene expression Effects 0.000 claims description 41
- 238000001228 spectrum Methods 0.000 claims description 35
- 230000009466 transformation Effects 0.000 claims description 19
- 230000011514 reflex Effects 0.000 claims description 15
- 230000007423 decrease Effects 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims 2
- 230000006870 function Effects 0.000 abstract description 170
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 abstract description 10
- 230000005236 sound signal Effects 0.000 abstract description 7
- 230000003595 spectral effect Effects 0.000 abstract 1
- 238000012937 correction Methods 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 17
- 238000003491 array Methods 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 4
- 238000009795 derivation Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Communication Control (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
可以按照不同的组合方式来使用几种音频信号处理技术,以改进通过拼接编辑两个以上的其他信息流而形成的一个信息流所代表的音质。在将音频信息跟视频信息捆绑在一起的各种应用中,这种技术是特别有用的。在一种技术中,在音频信息流中所载运的各增益控制字被用来对跨越一个接合部的回放声音电平进行内插计算。在另一种技术中,特定的各种滤波器阵列或者各种TDAC变换形式被用来抑制出现在一个接合部两侧的各种混叠伪差。在又一种技术中,特定的滤波器阵列或者交叉混合窗口函数被用来优化对产生于接合部的频谱邻频干扰的衰减。在再一种技术中,根据各种帧长度和频率来转换音频采样率,使得音频信息得以跟,例如,视频信息捆绑在一起。在还一种技术中,各音频块被动态地对准,使得在跨越一个接合部时,能保持良好的同步关系。讨论了一个(采样率为)48kHz的音频跟NTSC视频相组合的实例。
Description
技术领域
本发明涉及音频信号处理,在其中,音频信息流被排列成信息帧的形式。特别是,本发明涉及改进音频信息流的音质,上述音频信息流是通过将基于帧的诸音频信息流加以拼接而形成的。
背景技术
编辑音频或视频素材的过程实质上是将两段素材拼接或对接(其中之一)在一起的过程。一个简单的编辑范例就是剪接动画电影胶片的过程。待拼接的两段素材可以取自不同的来源,例如,音频信息的不同声道,或者它们可以取自相同的来源。无论在哪一种情况下,拼接过程通常会在音频或视频素材中产生可觉察的或不可觉察的不连续性。
音频编码
块处理
数字音频的日益增长的应用使得它难以在不产生可听见的各种伪差的条件下去编辑音频素材。这种情况的出现,部分地是由于必须以块的形式频繁地对诸数字样本块进行处理或编码。许多感知的或基于心理声学的音频编码系统利用滤波器阵列或者各种变换,将各信号样本块转换为已编码的子带信号样本的诸块或者各种变换系数,它们必须经过合成滤波或者被逆变换为各块,以便恢复原始信号的一个复制品。起码,必须在一个块的边界上来完成已处理的音频信号;否则,由剩余的部分块所代表的音频信息不能完全地被恢复。
在本文的以下部分中,诸如“编码”以及“编码器”这样的名词指的是用于信号处理的各种方法和装置,诸如“已编码的”这样的其他名词指的是这样的处理的诸结果。在这些名词中,没有一条隐含着任何特定的处理方式,例如在一组信号中降低信息的无关性或冗余度。例如,编码包括产生代表一组信号的脉冲编码调制(PCM)诸样本,并按照某种规格将信息排列成样板或格式。在本文中使用的诸如“块”和“帧”这样的名词指的是跟这些名词在别处(例如在ANSIS4.40-1992标准,有时也称为AES-3/EBU数字音频标准中)所指的对象不同的那些信息的诸分组或诸间隔,本文所使用的名词“滤波器”和“滤波器阵列”基本上包括任何形式的递归的和非递归的滤波方法,例如正交镜像滤波器(QMF)和变换,并且“已滤波”的信息是使用这样的滤波器所得到的结果。下面将对通过各种变换来实现的滤波器阵列作出更专门的说明。
使用重叠的块结构来处理和编码节目素材的各种编码系统对编辑工作产生了附加的限制。由于已编码的各块的重叠的性质,所以即使从已编码的诸样本或诸系数的一个完整的块,也无法完全地恢复原始信号。
借助于一种常用的重叠块变换,就能清楚地说明这种限制,这种修正的离散余弦变换(DCT),在Princen,Johnson和Bradley合写的题为《使用基于时域混叠抵消的滤波器阵列设计的子带/变换编码》的论文中对此作了叙述,该文被收入1987年国际声学、语音和信号处理会议论文集,1987年5月,第2161-2164页。这种变换是一种奇数堆栈临界采样单边带分析-合成系统的时域等价物,并且在本文中被称为奇数堆栈时域混叠抵消(O-TDAC)方法。对以半个块长互相重叠的诸样本块实施正变换,并且通过将诸变换系数除以2来获得临界采样;然而,由于这种缩减所带来的信息损失将在已恢复的信号中产生时域混叠。通过对诸变换系数的诸块实施逆变换以产生合成样本的诸块,对已合成样本的诸块施加一个形状合适的合成窗口函数,以及对窗口内的诸块进行重叠和相加,该合成过程就能抵消这种混叠。例如,若一个TDAC编码系统产生诸块B1-B2的一个序列,则处于块B1的后半部和块B2的前半部之中的混叠伪差将互相抵消。
若来自一个TDAC编码系统的两组已编码的信息流在一个块的边界处被拼接,则所得到的诸块的序列将不能抵消互相之间的混叠伪差。例如,假设一段已编码的信息流被剪断,使得它结束于介于诸块B1-B2之间的一个块边界上,并且另一个已编码的信息流被剪断,使得它开始于介于诸块A1-A2之间的一个块边界上。若这两段已编码的信息流被拼接,并使得块B1紧挨着块A2的前面,则处于块B1的后半部以及块A2的前半部的各种混叠伪差通常也将无法互相抵消。
现有技术的方法和装置不是忽略了这个问题就是提出了不能令人满意的解决方案。一种解决方案通过从每一组已编码的音频流中恢复或解码原始音频信号,来降低未被抵消的混叠伪差的可听度。将一组音频流交叉混合(平滑过渡)到另一组,并且将所得到的交叉混合流再编码为一组新的已编码音频流。不幸的是,解码/再编码过程使所得到的结果信号恶化,该过程的开销很大,使得它没有吸引力,并且由于交叉混合无法取消,所以紧挨着接合部两侧的原始信号不能独立地被恢复。
频谱邻频干扰
拼接编辑产生了现有技术无法解决的另一个问题。在分割频带的感知编码技术中,这个问题带来特别的麻烦。感知分割频带编码方法将一个滤波器阵列施加到输入信号上,以产生具有与人的听觉系统的临界带宽相当的带宽的诸子带信号或者诸变换系数组。理想地,用刚好足够的位数来对每一组子带信号或者变换系数组进行量化或编码,并且通过让噪声被原始信号中的频谱成分所掩盖,来使所得到的量化噪声变为听不见。编码性能显著地受到施加于输入信号以产生子带信号或诸变换系数的滤波器阵列的频率响应特性的影响。一般来说,通过在滤波器阻带的频率上增加衰减来换取较宽的滤波器通带,使这些特性得以优化。例如,见美国专利第5,109,417号。
拼接编辑倾向于在通常处于滤波器通带或介于通带与阻带之间的过渡区域内的频率范围内(并且不在滤波器阻带范围内),产生显著的假频谱成分或者“频谱邻频干扰”,因此,为了优化总的编码性能而设计的滤波器阵列对在拼接编辑中产生的频谱邻频干扰并不提供足够的衰减。由于这些伪差通常是如此之大,以致不能被原始信号所掩盖,所以它们通常是听得见的。
发明内容
本发明的一个目标是,在使用混叠抵消滤波器阵列来处理音频信息的诸实施例中,通过避免在接合部的两侧出现未被抵消的诸混叠伪差,来改进由拼接两个或多个基于帧的音频信息流而形成的一个音频信息流所代表的音质。
根据本发明的一个方面,提供了一种用于信号处理的方法,包括:接收包括诸帧的序列的输入信号,一个各自的输入信号帧包括信号样本的诸块的序列,所述诸块的序列包括一个起始块,一个或多个临时块以及一个终了块,所述诸块表示互相重叠的音频信息的诸间隔,其中所述起始块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;以及所述终了块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;响应于一个各自的输入信号帧,通过向所述起始块应用一个第1分析滤波器阵列,以提供时域混叠抵消,来产生一个第1已滤波信号块,通过向所述一个或多个临时块应用一个第2分析滤波器阵列,以提供时域混叠抵消,来产生一个或多个第2已滤波信号块,通过向所述终了块应用一个第3分析滤波器阵列,以提供时域混叠抵消,来产生一个第3已滤波信号块,其中所述第2已滤波信号块具有诸混叠伪差,所述第1已滤波信号块在起始块的第2区段中具有该音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与起始块的第2区段相重叠的音频信息的间隔,而在起始块的第1区段中,没有该音频信息的诸混叠伪差;以及所述第3已滤波信号块在终了块的第2区段中具有该音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与终了块的第2区段相重叠的音频信息的间隔,而在终了块的第3区段中,没有该音频信息的诸混叠伪差;以及通过将所述第1已滤波信号块、所述一个或多个第2已滤波信号块以及所述第3已滤波信号块组合到一个各自的输出信号帧,来产生一组适于传输或存储的输出信号,由此,响应于所述多个输入信号帧,通过将第1、第2和第3已滤波信号块加以组合,就能产生输出信号诸帧的一个序列。
根据本发明的另一个方面,提供了一种用于信号处理的方法接收一组包括诸帧的一个序列的输入信号,每一帧都由表示互相重叠的音频信息的诸间隔的诸信号样本的多个已滤波的诸信号块组成,一个各自的输入信号帧包括一个第1已滤波信号块,一个或多个第2已滤波信号块以及一个第3已滤波信号块;响应于一个各自的输入信号帧,通过向所述第1已滤波信号块施加一个第1合成滤波器阵列,以提供时域混叠抵消,来产生一个第1已合成的起始块,通过向所述一个或多个第2已滤波信号块施加一个第2合成滤波器阵列,以提供时域混叠抵消,来产生一个或多个已合成的临时块,通过向所述第3已滤波信号块施加一个第3合成滤波器阵列,以提供时域混叠抵消,来产生一个已合成的终了块;产生表示音频信息的输出信号诸帧的一个序列,一个各自的输出信号帧包括多个信号样本块,其中所述产生是将相邻的已合成的诸块重叠在一起,同时在互相重叠的已合成诸块中将对应的重叠样本相加,并且其中所述已合成的诸临时块具有诸混叠伪差,所述已合成的起始块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第1已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差,并且所述已合成的终了块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第3已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差。
根据本发明的另一方面,提供了一种用于信号处理的装置,包括:用于接收一组输入信号的装置,输入信号包括诸帧的一个序列,一个各自的输入信号帧由诸信号样本的诸块的一个序列组成,其中包括一个起始块,一个或多个临时块以及一个终了块,所述诸块表示互相重叠的音频信息的诸间隔,其中所述起始块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;以及所述终了块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;具有下列功能的装置:响应于所述各自的输入信号帧,通过向所述起始块应用一个第1分析滤波器阵列,以提供时域混叠抵消,来产生一个第1已滤波信号块,通过向所述一个或多个临时块应用一个第2分析滤波器阵列,以提供时域混叠抵消,来产生一个或多个第2已滤波信号块,通过向所述终了块应用一个第3分析滤波器阵列,以提供时域混叠抵消,来产生一个第3已滤波信号块,其中所述第2已滤波信号块具有诸混叠伪差,所述第1已滤波信号块在起始块的第2区段中具有音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与起始块的第2区段相重叠的音频信息的间隔,而在起始块的第1区段中,没有该音频信息的诸混叠伪差;以及所述第3已滤波信号块在终了块的第2区段中具有音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与终了块的第2区段相重叠的音频信息的间隔,而在终了块的第3区段中,没有该音频信息的诸混叠伪差;以及具有下列功能的装置:通过将所述第1已滤波信号块、所述一个或多个第2已滤波信号块以及所述第3已滤波信号块组合到一个各自的输出信号帧,来产生一组适于传输或存储的输出信号,由此,响应于所述多个输入信号帧,通过将第1、第2和第3已滤波信号块加以组合,就能产生输出信号诸帧的一个序列。
根据本发明的另一方面,提供了一种信号处理装置包括:用于接收一组输入信号的装置,输入信号包括诸帧的一个序列,每一帧都由表示互相重叠的音频信息的诸间隔的诸信号样本的多个已滤波的诸信号块组成,一个各自的输入信号帧包括一个第1已滤波信号块,一个或多个第2已滤波信号块以及一个第3已滤波信号块;具有下列功能的装置:响应于一个各自的输入信号帧,通过向所述第1已滤波信号块应用一个第1合成滤波器阵列,以提供时域混叠抵消,来产生一个第1已合成的起始块,通过向所述一个或多个第2已滤波信号块应用一个第2合成滤波器阵列,以提供时域混叠抵消,来产生一个或多个已合成的临时块,通过向所述第3已滤波信号块应用一个第3合成滤波器阵列,以提供时域混叠抵消,来产生一个已合成的终了块;产生表示音频信息的输出信号诸帧的一个序列的装置,一个各自的输出信号帧包括多个信号样本块,其中所述产生是将相邻的已合成的诸块重叠在一起,同时在互相重叠的已合成诸块中将对应的重叠样本相加,以及其中所述已合成的诸临时块具有诸混叠伪差,所述已合成的起始块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第1已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差,并且所述已合成的终了块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第3已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差。
附图说明
通过参照以下的讨论和诸附图,将能更好地理解本发明的各种特征及其优选的诸实施例,在若干附图中,相同的参考数字表示相同的元件。说明各种装置的诸附图表示出主要的部件,这对理解本发明是有帮助的。为了明确起见,这些附图省略了在实际的实施例中可能是重要的、但对理解本发明的概念来说是不重要的其他各种特征。为实践本发明所需的信号处理可以通过多种途径来完成,包括由微处理器、数字信号处理器、逻辑阵列以及其他形式的计算电路来执行的程序。实质上可以用任何方法来实现诸信号滤波器,包括递归的、非递归的以及格子数字滤波器。根据该项应用的各种需求和特性,可以按照不同的组合方式来使用数字的和模拟的技术。
关于处理音频和视频信息流的条件将作出更专门的说明,然而,本发明的诸方面可以在不包括视频信息处理的应用场合中来实行。以下的讨论和诸附图的内容仅作为实例而被说明,并且不应当被理解为对本发明的范围施加各种限制。
图1a和1b是被排列成各块、各帧和各超帧的视频和音频信息的概略的表示。
图2a到2c是被各窗口函数调制的各重叠块以及含有各窗口块的诸帧的所得到的增益包络的概略表示。
图3表示由一种混叠抵消变换产生的信号与诸混叠成分。
图4a到4c是表示在一个已编码的信息流中,生成、改变和响应于各增益控制字的诸装置的功能框图。
图5a和5b是采用替代的滤波器阵列来抑制在帧边界处的各种混叠伪差的功能框图。
图6a到6d是可以被用来抑制在帧边界处的各种混叠伪差的诸窗口函数的概略表示。
图7表示通过在各帧边界处使用各种窗口函数所得到的诸频率响应特性。
图8表示采用替代的滤波器阵列以增加在接合部处的频谱邻频干扰衰减的一个装置的功能框图。
图9、10a和11a是关于图8的装置的几个窗口函数的概略表示。
图10b和11b是在图8的装置中,通过使用各种窗口函数所得到的诸频率响应特性。
具体实施方式
诸信号及其处理
各信号块和各帧
图1a说明被排列在各音频(数据)块10到18的一个序列之中的已编码的音频信息流,以及被排列在一个视频帧(例如视频帧1)序列之中的视频信息流。在某些格式(制式)中,例如NTSC视频,每一个视频帧包括两个视频场,它们合起来定义一幅单独的画面或图像。各音频块11到17跟视频帧1组合为一个已编码的信号帧21。
某些应用具有这样的视频帧,它们不能把已编码的音频整除为整数个样本或诸变换系数之类。通过将已编码的诸信号帧的诸小组安排到各自的超帧中,就能适应这种情况。在图1b中示出了将5个已编码的信号帧21到25组合为超帧31的一种安排。这种特定的安排可以用于使用NTSC视频和每秒48k个样本的PCM音频的应用中。
已处理的诸信号块
已编码的音频信息块的序列可以表示一组音频信号的互相重叠的诸间隔。例如,某些分割频带的感知编码系统处理以半个块长互相重叠的诸音频样本块。典型地,在这些互相重叠的诸块中的诸样本被一个分析窗口函数所调制。
图2a表示将一个分析窗口函数施加到一个互相重叠的诸音频块的一个序列中的每一块之后所得到的诸调制包络61到67。重叠的长度等于块长的一半。长度间隔通常被某些信号分析-合成系统,例如上述的O-TDAC变换,所使用。
图2b表示针对一个已编码的信号帧而施加到互相重叠的各块的一个序列中去的一个窗口函数的所得到的调制包络。如图2b所示,这种调制的净效果或增益包络81就是在重叠的诸间隔中相邻各块的调制包络之和。最好是,跨越每一个重叠(块)的净效果应当是单位增益(译者注:即增益=1)。
图2c表示跨越相邻的已编码信号帧的窗口函数调制的总的效果。如图所示,增益包络80到82互相重叠并相加,使得净效果为单位增益。
在仅使用分析窗口函数的那些系统中,所有窗口函数调制的净效果等效于单独由分析窗口函数所产生的诸调制效果。通过保证分析窗口函数的调制包络互相重叠和相加为一个常数,就能得到理想的增益包络。
在使用分析和合成诸窗口函数的那些系统中,所有窗口函数调制的净效果等效于由分析窗口函数以及合成窗口函数的一个乘积所形成的一个“乘积”窗口函数。在这样的系统中,通过让在重叠间隔中的乘积窗口函数的调制包络相加为一个常数,就能得到理想的增益包络。
贯穿这次公开的是,针对使用分析与合成这两种窗口函数的各种编码系统和各种方法来进行叙述。在本文中,从互相重叠的诸分析窗口函数所得到的增益包络有时可以被说成是等于一个常数。类似地,从互相重叠的诸合成窗口函数所得到的增益轮廓有时可以被说成是等于一个常数。应当理解,这样的叙述旨在把问题归结为在该系统中所有窗口的净调制效果。
窗口函数
分析窗口函数的形状不仅影响到信号的增益包络,而且它还影响到一个对应的滤波器阵列的频率响应特性。
频谱邻频干扰
如上所述,在许多分割频带的感知编码系统中,通过增加在滤波器中的阻带诸频率上的衰减,以取代一个较宽的滤波器通带,从而使用具有为感知编码而优化的各种频率响应特性。不幸的是,在不属于滤波器阻带范围以内的一个频率范围内,拼接编辑倾向于产生显著的频谱伪差或者“频谱邻频干扰”。被设计用来优化总的感知编码性能的诸滤波器阵列不会提供足够的衰减,使得在拼接编辑过程中所产生的这些频谱伪差变为听不见。
TDAC变换混叠抵消
就O-TDAC而言,分析窗口函数,连同在应用合成变换之后所施加的一个合成窗口函数一起,还应当满足许多约束条件,以便抵消各种时域混叠伪差。
通过合成变换所恢复的信号可以被概念化为原始信号以及由分析变换所产生的时域混叠成分之和。在图3中,诸曲线91、93和95表示从逆变换或合成变换所恢复的、并且受到分析与合成窗口函数调制的一组输入信号的振幅包络的一些区段。诸曲线92、94和96表示从逆变换或合成变换所恢复的、并且受到分析与合成窗口函数调制的时域混叠成分。正如在图中可以看到的以及将在下面说明的那样,时域混叠成分是由于受到分析与合成窗口函数的调制而反射的原始输入信号的复制品。
分析与合成O-TDAC变换的诸核心函数被设计成用以产生各种时域混叠成分,它们是在一个数据块的每一个半块中用窗口截取的信号的端对端的反射物。如Princen等所公开的那样,O-TDAC变换在两个不同的区域中产生时域混叠成分。在区域2,时域混叠成分是在该区域中原始信号的一个用窗口截取的端对端反射物。在区域1,时域混叠成分是在该区域中输入信号的一个用窗口截取的端对端反射物。但该反射物的振幅被倒置(译者注:即正负号互换)。
例如,混叠成分94a是信号成分93a的一个用窗口截取的端对端反射物。除了反射成分的振幅被倒置以外,混叠成分92b也是信号成分91b的一个用窗口截取的端对端反射物。
通过让相邻的各数据块互相重叠和相加,使原始信号得以恢复,并且各混叠成分得以抵消。例如,诸信号成分91b和93a被叠加,以便恢复没有窗口函数调制影响的信号,并且诸混叠成分92b和94a被叠加,以便抵消混叠。类似地,诸信号成分93b和95a被相加,以便恢复信号,并且诸混叠成分94b和96a被叠加,以便抵消混叠。
由于紧挨着接合部前面的已合成的诸音频样本的半块中的诸混叠伪差不等于紧挨着接合部后面的已合成的诸音频块的半块的诸混叠伪差的倒置产物,所以在一个接合部边界两侧的诸时域混叠伪差通常不能互相抵消。
例如作者Princen和bradley在《基于时域混叠抵消的分析/合成滤波器阵列设计》一文中所述,类似的考虑也应用于其他的混叠抵消滤波器阵列(见《IEEE声学、语音和信号处理汇刊》,ASSP-34卷,1986年,第1153-1161页)。这种滤波器阵列系统是一个偶堆栈临界采样单边带分析-合成系统的时域等价物,并且在本文中被称为偶堆栈时域混叠抵消(E-TDAC)。
用以在帧边界处抑制混叠的诸滤波器阵列
在使用例如一种由TDAC变换所提供的一种混叠抵消形式的编码系统中,由于上面所讨论的原因,拼接编辑妨碍了在接合部每一侧的诸混叠伪差的互相抵消。通过在每一帧的开始和结尾对各音频块施加交替的滤波器阵列,就能避免这些未被抵消的混叠伪差。例如,参照图1a的帧21,一个第1滤波器阵列被施加于块11,一个第2滤波器阵列被施加于块12到16,以及一个第3滤波器阵列被施加于块17。这些滤波器阵列具有这样的特性,使得从每一帧所恢复的音频基本上不含有未被抵消的诸混叠伪差。
参照图5a,装置200包括缓冲存储器202,它接收各音频信息块,并且沿着通路203产生一个控制信号,以表明一个音频块是一帧中的第1或起始块,一帧中的最后或终了块,或者是一帧中的一个临时块。响应于从通路203接收的控制信号,开关204将每一帧中的第1或起始块引导到第1滤波器阵列205,将每一帧中的所有临时块引导到第2滤波器阵列206,将每一帧中的最后或终了块引导到第3滤波器阵列207。格式器208将从这3个滤波器阵列中的每一个所接收的已滤波的音频信息组合成一组输出信号,并沿着通路209传送。
图5b表示装置220,在其中,去格式器222从通路221接收一组输入信号,从中获得已编码的音频信息,它沿着通路224被传送。并沿着通路223产生一组控制信号,以表明已编码的音频信息是一帧中的第1或起始块,一帧中的最后或终了块,或者是一帧中的一个临时块。响应于从通路223接收的控制信号,开关225将将已编码的音频信息引导到3个合成滤波器阵列当中的一个。开关225将对应于第1块的已编码的音频信息引导到第1合成滤波器阵列226,将对应于各临时块的已编码音频信息引导到第2合成滤波器阵列227,将对应于最后块的已编码的音频信息引导到第3合成滤波器阵列228。响应于从3个合成滤波器阵列接收的已合成的各音频块,缓冲存储器229沿着通路230产生一组输出信号。
第2滤波器阵列
在一个编码器的一个实施例中,根据上面所引用的Princen等所公开的O-TDAC变换,通过一种N点修正的离散余弦变换(DCT)以及一个N点分析窗口函数来实现第2滤波器阵列。在一个互补的解码器中,根据O-TDAC变换,通过一种N点修正的逆DCT以及一个N点合成窗口函数来实现第2滤波器阵列。正向和逆向的O-TDAC变换分别示于表达式1和2:
式中,k=频率指标,
n=信号样本数,
M=样本块长度,
m=用于O-TDAC的相位项,
x(n)=被窗口截取的输入信号样本数n,以及
X(k)=变换系数k。
如图3所示,第2滤波器阵列的长度M=N,并且生成两个混叠反射区域,在一个块的中点处有一段介于这两个区域之间的边界。为生成这两个区域所需的TDAC相位项为m=N/2。
在一个优选实施例中,根据如下所述的一项技术来导出分析与合成诸窗口函数。在图6a中,通过曲线242来说明这些窗口函数的形状。为了便于讨论起见,这些窗口函数被称为W2(n)。
第1滤波器阵列
在同一实施例中,通过上面所示的修正的DCT以及窗口函数W2(n)的一种修正形式来实现在编码器和互补的解码器中的第1滤波器阵列。正向和逆向的O-TDAC变换分别示于表达式1和2。第1滤波器阵列的长度为M=3N/2,并且生成一个单独的混叠反射区域1。诸混叠伪差是在该块内信号的倒置的端到端反射。实际上,反射区域2的长度为0,并且介于这两个区域之间的边界位于该块的右边缘的前沿。为生成这个单独区域所需的TDAC相位项为m=0。
对应于第1滤波器阵列的分析与合成窗口函数W1(n)是相同的。在图6b中,通过曲线241来说明这些窗口函数的形状。它由3部分组成。第1和第2部分表示为区段1和2,跟上面所描述的并示于图6a的窗口函数W2(n)相同。第3部分表示为区段3,它等于0。
第1分析窗口函数W1(n)保证在区段3中的信号为0。其结果是,从区段3反射到区段1的混叠伪差也是0。从区段1反射到区段3的混叠伪差一般地将不是0;然而,当向合成的音频块施加第1合成窗口函数W1(n)时,反射到区段3的任何伪差将被消除。其结果是,混叠伪差仅存在于区段2。
第3滤波器阵列
在同一实施例中,通过上面所示的修正的DCT以及窗口函数W2(n)的一种修正形式来实现在编码器和互补的解码器中的第3滤波器阵列。正向和逆向的变换分别示于表达式1和2。第3滤波器阵列的长度为M=3N/2,并且生成一个单独的混叠反射区域2。诸混叠伪差是在该块内信号的一种端到端反射。实际上,反射区域1的长度为0,并且介于这两个区域之间的边界位于该块的左边缘的后沿。为生成这个单独区域所需的TDAC相位项为m=3N/2。
对应于第3滤波器阵列的分析与合成窗口函数W3(n)是相同的。在图6c中,通过曲线243来说明这些窗口函数的形状。它由3部分组成。表示为区段1的第1部分等于0。第2和第3部分,表示为区段2和3,跟上面所描述的并示于图6a的窗口函数W2(n)相同。
第3分析窗口函数W3(n)保证在区段1中的信号为0。其结果是,从区段1反射到区段3的混叠伪差也是0。从区段3反射到区段1的混叠伪差一般地将不是0;然而,当向合成的音频块施加第3合成窗口函数W3(n)时,反射到区段1的任何伪差将被消除。其结果是,混叠伪差仅存在于区段2。
图6d说明诸窗口函数W1(n),W2(n),W3(n)241到243是如何互相重叠的。增益包络240表示以端到端方式使用窗口函数的净效果,对TDAC来说,它是由对应的分析与合成诸窗口函数的乘积所形成的重叠的乘积窗口函数的一个序列。由分析-合成窗口函数W1(n)所加权的、在块11的区段2中的混叠伪差被由分析-合成窗口函数W2(n)所加权的、在块12的前半部中的混叠伪差所抵消。由分析-合成窗口函数W3(n)所加权的、在块17的区段2中的混叠伪差被由分析-合成窗口函数W2(n)所加权的、在块16的后半部中的混叠伪差所抵消。根据常规的TDAC来完成在临时块对(例如块12和13或者块15和16)中的信号恢复与混叠抵消。
各窗口函数的推导
使用在下列各段中所描述一项技术,就能从一个基本窗口函数推导出窗口函数W2(n)。虽然具有适当的重叠-相加特性的任何窗口函数都可以被用来作为基础窗口函数,但是在一个优选实施例中所使用的基础窗口函数是凯撒-贝塞尔窗口函数。
上式在0≤n<N的条件下成立
式中,α=凯撒-贝塞尔窗口函数的α因子,
n=窗口内的样本数目,
N=以样本数目来表示的窗口长度,以及
通过将凯撒-贝塞尔窗口函数WKB(n)跟一个长度等于块长N减去重叠间隔v的矩形窗口函数s(k)进行卷积运算,这样的推导就产生一个分析-合成乘积窗口函数WP(n),或:
上式在0≤n<N的条件下成立,此式可以简化为:
上式在0≤n<N的条件下成立
式中,n=乘积-窗口内的样本数目,
v=在窗口重叠间隔内的样本数目,
N=所希望的乘积-窗口长度,
WKB(n)=长度为v+1的基本窗口函数,
WP(n)=推导出来的长度为N的乘积-窗口,以及
s(k)=1对条件0≤k<N-v成立
=0对其他条件成立。
对于O-TDAC变换来说,重叠间隔v=N/2,并且分析窗口函数以及合成窗口函数都是如此,因此,可以从下式得到其中任何一个窗口函数:
上式在0≤n<N的条件下成立
在本文中,以这种方式推导出来的分析与合成窗口函数被称为一个凯撒-贝塞尔-导出(KBD)窗口函数。乘积窗口函数被称为一个KBD乘积窗口函数。可以选择基本凯撒-贝塞尔窗口函数的α因子以优化编码性能。在许多应用中,用于编码的最佳α因子处于2到6的范围内。
用以降低接合部的频谱邻频干扰的滤波器阵列
从优化感知编码这个意义上来说,处于上述范围内的α因子对许多编码应用来说是最佳的。如上所述,通常用增加在滤波器阻带内诸频率上的衰减,来取代一个较宽的滤波器通带,从而使编码得以优化。图7中的曲线342表示针对一个为感知编码而优化的一种典型的频率响应的一个例子。这条曲线表示一个使用KBD窗口函数的O-TDAC分析-合成系统的帧增益包络的频率响应,上述KBD窗口函数的α=6,并且具有等于256个样本的帧重叠间隔。虽然介于通带和阻带之间的边界没有明确地规定,但在本例中通带覆盖着高达200Hz的诸频率,并且阻带覆盖着大约1kHz以上的诸频率。一个过渡区域在这两个频带之间延伸。
在使用施加于256个样本块的变换的各种应用中,在约为200Hz到1kHz的滤波器的中心频率范围内,拼接编辑倾向于产生显著的假频谱成分或“频谱邻频干扰”。对于使用其他长度的(数据)块的应用来说,这个频率范围可以表示为两个常数除以块的长度;因此,显著的频谱邻频干扰出现在从大约50,000到256,000Hz(每一个都除以块长度)的频率范围内。
在图7所示的例子中,这些频率处于被认为是滤波器阻带的范围以外。被设计用于优化感知编码性能的诸滤波器阵列对在拼接编辑过程中所生成的频谱邻频干扰未能提供足够的衰减。这些伪差通常是可听的,因为它们通常是如此之大,以致于无法被信号所遮盖。
图7中的曲线341和曲线343表示两个其他的分析-合成系统的频率响应,该系统在阻带内提供显著地小的衰减,但在一个受到在接合部生成的频谱邻频干扰的影响的频率范围内,提供更大的衰减。通过牺牲在感知编码中的某些性能来增加对频谱邻频干扰的衰减。最好是,在一个对256个样本块进行滤波的系统中,在包括200Hz和600Hz的一个频率范围内,或者在大约50,000到150,000Hz的频率范围内,每一个都除以块长度,该频率响应使频谱能量的衰减得以优化。
有时,在满足对一般编码以及对在接合部处的交叉混合各帧的频率响应要求之间达到一种折衷。在不能达到这样一种折衷的各种应用中,要检出一个接合部,并且改变分析-合成系统的频率响应。由于分析滤波器阵列一般地不能预测拼接操作,所以这种改变应当结合合成滤波过程来完成。在本节中所描述的这种用于减少频谱邻频干扰的技术是一份共同未决的专利申请的主题,然而,可以有利地把它们跟上面所讨论的用于在帧边界处抑制诸混叠伪差的技术结合在一起使用,
图8表示通过改变一个分析-合成系统的端到端频率响应,装置320可以被用来减少频谱邻频干扰。在这个装置中,去格式器322从通路321接收一组输入信号,从中获得沿着通路324传送的已编码的音频信息,并沿着通路323产生一组控制信号,用以指示在一帧的开始或终了处,是否出现一个接合部。一个接合部的出现可以在输入信号中明确地表达,或者可以根据在信号中所表达的其他信息来推断。
例如,根据AES-3/EBU标准,连续的音频信息块所含有的块号码从0增加到255,然后反过来减少到0。两个邻接的而不按顺序的块号码表示一个接合部,然而,由于某些装置在处理AES/EBU数据流时并不增加这个号码,所以这种检验方法是不可靠的。若该音频流已被编码,则编码方案可能提供顺序的编号或者某些其他形式的可预测的信息。若该信息跟所预期的不相符,则可能产生一组信号以表明一个接合部的存在。
响应于从通路323接收的控制信号,开关325将已编码的音频流引导到3个合成滤波器阵列当中的一个。开关325将跟随在一个接合部后面的一帧中的对应于第1块的已编码的音频信息引导到第1合成滤波器阵列326,将前置于一个接合部前面的一帧中的对应于最后一块的已编码的音频信息引导到第3合成滤波器阵列328,以及将对应于其他各块的已编码音频信息引导到第2合成滤波器阵列327。另一方面,也可以根据以上结合图5b所讨论的技术,将对应于这些其他各块的已编码的音频信息引导到3个滤波器阵列当中的一个。响应于从这3个合成滤波器阵列所接收的已合成的各音频块,缓冲存储器329沿着通路330产生一组输出信号。
第1和第3合成滤波器阵列被设计成这样,使其在与某些分析滤波器相结合的条件下,能获得所需的频率响应。在许多应用中,这个分析滤波器被设计成这样,使其在与第2合成滤波器相结合的条件下,能优化总的编码性能。基本上可以通过能提供所需的总的频率响应的任何方式来实现第1和第3合成滤波器阵列。一般来说,这两个滤波器阵列将具有相同的频率响应,但将具有在时序上互为倒置的复制品那样的脉冲响应。在使用诸变换与诸窗口函数来实现诸滤波器阵列的那些应用中,通过使用在一个接合部两侧相邻的各帧之间增加重叠间隔的合成窗口函数,就能实现适当的滤波器阵列。
已合成音频的调制
可以通过几钟方法来完成这一步。一种方法就是对从合成滤波器阵列中恢复的已合成音频信号进行调制,使得在一个接合部两侧的各帧通过交叉混合融入对方。可以在一个装置(例如将在下面讨论并示于图4c的装置140)中完成这一步。解码器146降低在前置于接合部并跨越所需的接合部重叠间隔的帧中的已合成信号的幅度。实际上,在跨越这个间隔时,前置于接合部的帧的增益包络从1减少到某个较低的水平。解码器146还增加在跟随着接合部并跨越所需的接合部重叠间隔的帧中的已合成信号的幅度。实际上,在跨越这个间隔时,跟随着接合部的帧的增益包络从较低的水平增加到1。若在各增益包络的有效变化中考虑到分析-合成窗口的调制效应,则重叠的各帧的总的增益得以保留。
增益包络的有效变化可以是直线性的。图7中的曲线343表示一个宽度约为5毫秒的线性递减的帧增益包络的频率响应特性。在每秒48k个样本的采样率下,这个间隔对应于大约256个样本。在许多编码应用中,对具有256个样本的样本块实施变换;因此,在这些特定的应用中,一个含有256个样本的斜坡或线性递减的增益包络在延伸,它越过处于帧边界处的一个“终了”块,并且跨越一个跟这个终了块重叠的相邻块的一部分。这等效于将一个滤波器阵列施加于终了块,经另一个滤波器阵列施加于紧挨着的相邻块,以及将又一个滤波器阵列施加于该帧内部的其他各块。参看图8所示的装置320,它需要两个附加的合成滤波器阵列,用以处理邻接于并重叠于“终了”块的各块。
这个线性递减的斜坡的频率响应表示一个参照的响应,其他各种频率响应都可以相对于它而作出评估。一般来说,在减少产生于接合部的频谱邻频干扰方面,能优化针对这种参考响应的频谱能量衰减的各种滤波器阵列都是有效的。
修正的合成窗口函数
用以改变一个分析-合成系统的总的频率响应特性的另一种方法就是修改合成窗口函数,使得分析-合成窗口的净效应获得所需的响应。实际上,总的频率响应根据所得到的分析-合成乘积窗口函数而发生改变。
图7中的曲线341表示一种频率响应,它跟曲线343所表示的5毫秒的线性递减增益包络的频率响应相比,能在更大程度上衰减在各接合部的频谱邻频干扰。借助于O-TDAC分析-合成系统,使用256点变换以及α=1的KBD窗口函数来获得曲线341的响应。如上所述,曲线342对应于α=6的KBD窗口函数。
这些分析-合成系统的端到端频率响应等效于由分析窗口函数与合成窗口函数的乘积所形成的窗口的频率响应。用代数方法可以表示为:
WP6(n)=WA6(n)WS6(n)(5a)
WP1(n)=WA1(n)WS1(n)(5b)
式中,WA6(n)为α=6时的分析KBD窗口函数,
WS6(n)为α=6时的合成KBD窗口函数,
WP6(n)为α=6时的KBD乘积窗口函数,
WA1(n)为α=1时的分析KBD窗口函数,
WS1(n)为α=1时的合成KBD窗口函数,以及
WP1(n)为α=1时的KBD乘积窗口函数。
若一个合成窗口函数被修改成将端到端频率响应修改为所需的某种其他响应,则它应当被这样修改,使得它本身与分析窗口函数的乘积等于具有所需响应的乘积窗口。若希望得到对应于WP1的一个频率响应,并且分析窗口函数WA6被用于信号分析,则这种关系可以用代数方法表示为:
WP1(n)=WA6(n)WX(n)(5c)
式中,WX(n)=为转换频率响应所需的合成窗口函数。
上式可以写成:
若接合部重叠间隔延伸到在帧中跟“终了”块相重叠的一个相邻的音频块之上时,则窗口函数WX的形状跟表达式5d所表示的形状相比,显得更复杂一些。下面将对此进行更充分的讨论。在任何情况下,表达式5d精确地表示在终了块中不跟该帧中任何其他块重叠的那一部分。对于使用O-TDAC的诸系统来说,该部分等于块长的一半,或对应于0≤n<N/2。
若合成窗口函数WX被用来将端到端频率响应从较高的α轮廓转换到一个较低的α轮廓,则在接近帧边界处,它必须具有非常大的数值。图9示出了一个实例,在其中曲线351表示一个α=1的KBD分析或合成窗口函数,曲线352表示一个α=1的KBD乘积窗口。曲线356表示一个α=6的KBD分析或合成窗口函数,以及曲线359表示一个根据表达式5的的合成窗口函数。随着曲线356接近帧边界,它变得比曲线352小很多,因此,曲线359变得非常大。不幸的是,一个具有类似于曲线359(它在窗口函数WX的边缘处具有大的增加)的形状的合成窗口函数具有很差的频率响应特性,并将使被恢复信号的音质恶化。有两种技术可以被用来解决这个问题,这将在下面加以讨论。
舍弃样本
用于修正一个合成窗口函数的第1种技术通过在分析窗口函数具有最小值的帧边界处舍弃某一数目的样本来避免在窗口函数WX中的大量增加。通过改变被舍弃的样本的数目,就能调整为在帧重叠间隔中传送诸样本所需的带宽,从而抵消由于解码器的不良的频率响应特性而引起的系统编码性能的下降。
例如,通过修正对应于在一帧中的前3块的各合成窗口函数,以获得一种对应于乘积窗口函数WP1的所需的频率响应,以及用于信号分析的窗口函数为WA6,则所需的修正合成窗口函数如下式所示:
式中,
WX1(n)=对应于第1块的修正的合成窗口函数,
WX2(n)=对应于第2块的修正的合成窗口函数,
WX3(n)=对应于第3块的修正的合成窗口函数,以及
x=在帧边界处被舍弃的样本数目。
图10a表示,对于x的若干数值来说,修正的合成窗口函数的形状要求使用一个KBDα=6的分析窗口函数将一个256点O-TDAC分析-合成系统转换为一个这样的分析-合成系统,后者的频率响应等效于一个使用KBDα=1的、帧重叠间隔等于256个样本的分析与合成窗口函数。曲线361。362,363和364分别是对应于x=8,16,24和32个样本的修正的各合成窗口函数。
使用这些修正的窗口函数的各合成滤波器阵列的频率响应示于图10b。诸曲线372。373和374分别是对应于x=8,16和24个样本的频率响应。曲线371是使用一个α=1的KBD窗口函数的一个合成滤波器阵列的频率响应。如图所示,一个x=16的修正的合成窗口函数将大约200Hz以上的各频率衰减到跟使用α=1的KBD窗口函数的合成滤波器阵列所获得的衰减相同的程度。换句话说,一个舍弃了16个样本的合成滤波器阵列,当跟一个分析滤波器阵列以及一个α=6的分析窗口函数配合使用时,它所获得的端到端分析-合成系统频率响应等效于一个使用α=1的分析与合成窗口函数的系统的端到端频率响应,并且,与此同时,提供这样一种合成滤波器阵列频率响应,它对大约200Hz以上的各频率的衰减程度接近于一个使用α=1的合成窗口函数的合成滤波器阵列的衰减程度。
一般来说,将具有较低α数值的KBD窗口函数用于正常编码的各种系统将要求对合成窗口函数进行较小的修正,并且在帧的末尾舍弃较少的样本。在一帧的末尾处所需要的修正的合成窗口函数类似于在表达式6a到6c所示的各窗口函数,所不同的是发生了时序倒置。
对帧增益包络进行调制
用于修正一个合成窗口函数的第2种技术通过在一个接合部的两侧允许帧增益包络稍为偏离理想水平来避免在窗口函数WX中的大量增加。通过改变增益包络的偏离量,就能用该偏离量的可听度来抵消频谱邻频干扰的可听度。
这种技术使修正的合成窗口函数变得平滑,因此它在帧边界处或靠近帧边界处具有小的数值。当适当地完成这一步时,所得到的合成窗口函数将具有可接受的频率响应,并且在帧边界或靠近帧边界处(此处的增益相当低),帧增益包络将偏离理想的KBD乘积窗口函数。跟由一种理想的交叉混合的增益形状所提供的衰减相比,频谱邻频干扰的衰减将仅有轻微的降低。
例如,若必须修正对应于在一帧中前3块的合成窗口函数以获得所需的频率响应,则为第2和第3块所需的修正的合成窗口函数WX一般地相同于在x=0条件下由上面的表达式6b和6c所表示的情形。通过在平滑窗口函数长度的前半部逐点地跟一个平滑窗口函数相乘,就能使在上面的表达式6a中所表示的修正的合成窗口函数WX1变得平滑。所得到的对应于第1块的修正的合成窗口函数为:
式中,WM(n)=平滑窗口函数,以及
P=平滑窗口函数的长度,假设小于N。
在一帧终了处所需的修正的合成窗口函数也相同于这个窗口函数,所不同的是时序发生倒置。
平滑窗口函数WM基本上可以基于任何窗口函数,但是,一个KBD平滑窗口函数似乎工作得更好一些。在本例中,平滑窗口函数是一个长度为128、α=6的KBD窗口函数。在图11a中,曲线381表示未经平滑的修正的合成窗口函数的形状,而曲线382则表示经平滑后的修正的合成窗口函数的形状。
图11b表示对应于一个使用平滑后的修正的窗口函数的分析-合成系统的频率响应。曲线391表示使用平滑后的修正的窗口函数的频率响应。曲线341表示使用α=1的KBD窗口函数的一个分析-合成系统的频率响应,曲线393则表示使用上面所讨论的、并示于曲线343的、宽度约为5毫秒的线性递减帧交叉混合窗口函数所得到的频率响应的诸峰值的一个包络。从这份图中可以看出,一个经过平滑的修正的合成窗口函数获得一个类似于通过一个使用α=1的KBD窗口函数的分析-合成系统所获得的频率响应。
混合分析-合成窗口函数的修正
在以上所讨论的各项技术中,帧增益包络的所有变化都在信号合成过程中发生。作为另一种方法,分析过程也可以对处于帧边界处的各块使用具有一种频率响应的滤波器阵列,并且对内部各块使用另一种滤波器阵列。用于在帧边界处各块的各滤波器阵列可以被设计成减少在合成过程中所需的修正量,以便获得对产生于接合部的频谱邻频干扰的足够的衰减。
用以衰减在接合部的各种伪差的增益控制
一种可以用来降低由一个接合部产生的各种伪差的可听度的技术就是将多个增益控制字纳入到一组已编码的音频信号之中,上述增益控制字指示一个解码器或回放系统去改变回放信号的幅度。在以下各段中将讨论使用这些控制字的诸装置的简单的诸实施例。在本节中所描述的关于使用增益控制字的各项技术是一项共同未决的专利申请的主题,可以有利地把它们跟上面所讨论的用于抑制在帧边界处的诸混叠伪差以及用于减少频谱邻频干扰的各项技术结合在一起使用。
图4a表示装置100的一份功能框图,在其中,格式器111沿着通路112产生一组被排列为诸帧的输出信号,该信号包括视频信息、代表多条音频声道的已编码的音频信息,以及各增益控制字。响应于从通路108接收的一组信号(该信号被排列为运送视频信息以及针对多条音频声道的已编码的音频信息的诸帧的形式),并且响应于从运送各增益控制字的通路110接收的一组信号,格式器111产生输出信号。过程109从诸通路103a和103b接收多组控制信号,其中的每一组都跟多条音频声道中的一条有关,并且响应于每一组控制信号,沿着通路110为一条有关的音频声道产生一对增益控制字,它们表示在一个各自的帧里面的一个起始增益以及一个终了增益。为了简明起见,在图中仅示出了两组控制信号103和两条有关的音频声道102。必要时,这种增益控制技术可以应用于两条以上的声道。
在所示的实施例中,响应于从通路102a和102b接收的多组音频声道信号,编码器105沿着通路106a和106b为多条音频声道产生已编码的音频信息,并且通过以帧的形式来排列从通路101接收的视频信息以及从通路106a和106b接收的已编码的音频信息,成帧器107沿着通路108产生该信号。
增益控制技术可以用于类似于沿着通路108通过的信号的诸输入信号,因此,用不着编码器105,也用不着成帧器107。在含有编码器105的各实施例中,可以独立地对每一条音频声道进行编码,也可以联合地对多条音频声道进行编码。例如,可以联合地对两条或多条声道使用AC-3编码技术,通过取销或降低介于各声道之间的冗余度来降低总的带宽要求。
图4c表示装置140的一个功能框图,装置140根据在一组输入信号中的增益控制字来产生诸输出信号,以便再现或回放多条音频声道(的信息)。去格式器142从通路141接收一组被排列为帧的形式的输入信号,其中包括视频信息、已编码的音频信息,以及各增益控制字。去格式器142从每一帧输入信号中获得代表多条音频声道的已编码的音频信息,以及获得跟每一条音频声道有关的一对增益控制字。过程148从从通路145接收各增益控制字,并且作为响应,沿着通路149a和149b产生各增益控制字。解码器146从通路144a和144b接收多条声道的已编码的音频信息,并且作为响应,为每一条音频声道产生一组输出信号,因此,响应于一组有关的增益控制信号,每一组输出信号的幅度或电平将发生改变。
一对增益控制字表示在一个特定帧里面针对一条有关的音频声道的一个起始增益和一个终了增益。步骤148产生表示这对增益控制字的一个内插值的增益控制诸信号。可以遵循任何所希望的轨迹,例如直线、二次曲线、对数或指数曲线来进行内插。例如,在直线性内插的情况下,增益控制信号将代表在一个特定帧的范围内按线性规律发生变化的一个增益。
可以独立地对每一条音频声道进行解码,也可以联合地对多条音频声道进行解码。例如,解码过程对那些取消或降低介于各声道之间的冗余度的编码过程的各种形式来说,起到互补的作用。在使用一个合成滤波器阵列以及一个合成窗口函数的分割频带编码应用中,通过在应用合成滤波器阵列之前修改已编码的音频,通过在应用合成窗口函数之前修改从合成滤波器阵列中获得的合成音频,或者通过修改从应用合成窗口函数而获得的音频信息,就能根据一个增益控制信号来有效地调制输出信号。
图4b表示用以修改现有的各增益控制字的装置120的一份功能框图。去格式器123从通路121接收一组排列成诸帧的输入信号,其中包括视频信息、代表多条音频声道的已编码的音频信息,以及各输入控制字。去格式器123从输入信号中获得跟针对一条或多条音频声道的已编码音频信息有关的一个或多个输入增益控制字,并沿着通路124a和124b传送诸输入增益控制字。响应于从通路122接收的一组控制信号,步骤126通过修改一个或多个输入增益控制字,沿着通路127产生一个或多个输出增益控制字。格式器128沿着通路129产生一组被排列成诸帧的输出信号,其中包括视频信息、针对多条音频声道的已编码的音频信息,输出增益控制字,以及跟各输出增益控制字不相符合的各输入控制字。
在一种编辑应用中,控制信号122指示在输入信号中的一个接合部。作为响应,步骤126产生一个或多个输出增益控制字,它(们)将使得一个装置,例如装置140,在紧挨着接合部的前面去衰减一组回放信号,并且紧挨着接合部的后面,让衰减量按相反方向变回来。增益的改变可以延伸到跨越若干帧,然而,在许多应用中,这种改变被限制在接合部任何一侧的1帧上。通过平衡由增益改变乘以增益改变本身的可听度所产生的调制产物的可听度,就能确定增益改变的间隔。增益控制字技术不局限于编辑应用。
Claims (28)
1.一种用于信号处理的方法,包括:
接收包括诸帧(20-26)的序列的输入信号(201),一个各自的输入信号帧包括信号样本的诸块(11-17)的序列,所述诸块的序列包括一个起始块(11),一个或多个临时块(12-16)以及一个终了块(17),所述诸块表示互相重叠的音频信息的诸间隔,其中
所述起始块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;以及
所述终了块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;
响应于一个各自的输入信号帧,通过向所述起始块应用一个第1分析滤波器阵列(205),以提供时域混叠抵消,来产生一个第1已滤波信号块,通过向所述一个或多个临时块应用一个第2分析滤波器阵列(206),以提供时域混叠抵消,来产生一个或多个第2已滤波信号块,通过向所述终了块应用一个第3分析滤波器阵列(207),以提供时域混叠抵消,来产生一个第3已滤波信号块,其中
所述第2已滤波信号块具有诸混叠伪差,
所述第1已滤波信号块在起始块的第2区段中具有该音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与起始块的第2区段相重叠的音频信息的间隔,而在起始块的第1区段中,没有该音频信息的诸混叠伪差;以及
所述第3已滤波信号块在终了块的第2区段中具有该音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与终了块的第2区段相重叠的音频信息的间隔,而在终了块的第3区段中,没有该音频信息的诸混叠伪差;以及
通过将所述第1已滤波信号块、所述一个或多个第2已滤波信号块以及所述第3已滤波信号块组合到一个各自的输出信号帧,来产生一组适于传输或存储的输出信号(230),由此,响应于所述多个输入信号帧,通过将第1、第2和第3已滤波信号块加以组合,就能产生输出信号诸帧的一个序列。
2.根据权利要求1所述的方法,其中
借助于一个第1TDAC分析变换以及一个第1分析窗口函数(241)来实现所述第1分析滤波器阵列(205),其中所述第1分析窗口函数由3个区段组成,它们被应用到所述起始块(11)的各自的诸区段,并且第1分析窗口函数的第3区段为0,由此保证从第3区段反射到第1区段的诸混叠伪差为0。
借助于一个第2TDAC分析变换以及一个第2分析窗口函数(242)来实现所述第2分析滤波器阵列(206),第2分析窗口函数由2个区段组成,它们被应用到所述一个或多个临时块(12-16)的两个对应的区段,其中诸混叠伪差在第1和第2区段以内进行反射,以及
借助于一个第3TDAC分析变换以及一个第3分析窗口函数(243)来实现所述第3分析滤波器阵列(207),其中所述第3分析窗口函数由3个区段组成,它们被应用到所述终了块(17)的各自的诸区段,并且第3分析窗口函数的第1区段为0,由此保证从第1区段反射到第3区段的混叠伪差为0。
3.根据权利要求1或2所述的方法,其中所述第1、第2和第3分析滤波器阵列(205-207)分别具有一个各自的长度,所述第1和第2分析滤波器各自的长度不相等,并且所述第2和第3分析滤波器各自的长度也不相等。
4.根据权利要求1或2所述的方法,其中在所述各自的输入信号帧(20-26)中的所述诸块(11-17)表示以N/2个样本互相重叠的音频信息的诸间隔,
所述第1分析滤波器阵列(205)的长度为3N/2,并且具有这样的混叠抵消特性,使得,响应于所述第1已滤波信号块,一个互补的第1合成滤波器阵列(226)产生一个已恢复的诸信号样本的起始块,它在中间的N/2个样本处具有诸混叠伪差,并且在起始的N/2个样本处没有诸混叠伪差,
所述第2分析滤波器阵列(206)的长度为N,并且具有这样的混叠抵消特性,使得,响应于所述第2已滤波信号块,一个互补的第2合成滤波器阵列(227)产生一个或多个已恢复的诸信号样本的临时块,其中的每一个都具有诸混叠伪差,
所述第3分析滤波器阵列(207)的长度为3N/2,并且具有这样的混叠抵消特性,使得,响应于所述第3已滤波信号块,一个互补的第3合成滤波器阵列(228)产生一个已恢复的诸信号样本的终了块,它在中间的N/2个样本处具有诸混叠伪差,并且在最后的N/2个样本处没有诸混叠伪差。
5.根据权利要求4所述的方法,其中
通过一个第1分析变换以及一个长度为3N/2个样本的第1分析窗口函数(241)来实现所述第1分析滤波器阵列(205),其中所述第1分析窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及具有一个长度为N/2的第3区段,
通过一个第2分析变换以及一个长度为N个样本的第2分析窗口函数(242)来实现所述第2分析滤波器阵列(206),其中所述第2分析窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及
通过一个第3分析变换以及一个长度为3N/2个样本的第3分析窗口函数(243)来实现所述第3分析滤波器阵列(207),其中所述第3分析窗口函数具有一个长度为N/2的第1区段、以及具有不等于0的一个长度为N/2的第2区段和一个长度为N/2的第3区段。
6.根据权利要求2所述的方法,其中已经从一个凯撒-贝塞尔窗口函数推导出所述第1分析窗口函数(241)的第1和第2区段,已经从一个凯撒-贝塞尔窗口函数推导出所述第2分析窗口函数(242),已经从一个凯撒-贝塞尔窗口函数推导出所述第3分析窗口函数(243)的第2和第3区段。
7.一种信号处理方法,包括:
接收一组包括诸帧的一个序列的输入信号(221),每一帧都由表示互相重叠的音频信息的诸间隔的诸信号样本的多个已滤波的诸信号块组成,一个各自的输入信号帧包括一个第1已滤波信号块,一个或多个第2已滤波信号块以及一个第3已滤波信号块;
响应于一个各自的输入信号帧,通过向所述第1已滤波信号块应用一个第1合成滤波器阵列(226),以提供时域混叠抵消,来产生一个第1已合成的起始块,通过向所述一个或多个第2已滤波信号块应用一个第2合成滤波器阵列(227),以提供时域混叠抵消,来产生一个或多个已合成的临时块,通过向所述第3已滤波信号块应用一个第3合成滤波器阵列(228),以提供时域混叠抵消,来产生一个已合成的终了块;
产生表示音频信息的输出信号诸帧的一个序列,一个各自的输出信号帧包括多个信号样本块,其中所述产生是将相邻的已合成的诸块重叠在一起,同时在互相重叠的已合成诸块中将对应的重叠样本相加,以及
其中所述已合成的诸临时块具有诸混叠伪差,所述已合成的起始块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第1已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差,并且所述已合成的终了块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第3已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差。
8.根据权利要求7所述的方法,其中
借助于一个第1TDAC合成变换以及一个第1合成窗口函数(241)来实现所述第1合成滤波器阵列(226),其中所述第1合成窗口函数由3个区段组成,它们被应用到第1已滤波信号块的3个对应的区段,并且第1合成窗口函数的所述第3区段为0,由此避免诸混叠伪差从所述第1区段反射到所述第3区段,
借助于一个第2TDAC合成变换以及一个第2合成窗口函数(242)来实现所述第2合成滤波器阵列(227),其中所述第2合成窗口函数由2个区段组成,它们被应用到第2已滤波信号块的两个对应的区段,由此使得诸混叠伪差在所述第1和第2区段以内进行反射,以及
借助于一个第3TDAC合成变换以及一个第3合成窗口函数(243)来实现所述第3合成滤波器阵列(228),其中所述第3合成窗口函数由3个区段组成,它们被应用到第3已滤波信号块的3个对应的区段,并且第3合成窗口函数的所述第1区段为0,由此避免诸混叠伪差从所述第3区段反射到所述第1区段。
9.根据权利要求7或8所述的方法,其中所述第1、第2和第3合成滤波器阵列(226-228)分别具有一个各自的长度,所述第1和第2合成滤波器各自的长度不相等,并且所述第2和第3合成滤波器各自的长度也不相等。
10.根据权利要求7所述的方法,其中在一个各自的输出信号帧中的所述诸信号样本块表示以N/2个样本互相重叠的诸间隔,
所述第1合成滤波器阵列(226)的长度为3N/2,并且产生诸信号样本的所述起始块,上述诸信号样本在中间的N/2个样本处具有诸混叠伪差,并且在起始的N/2个样本处没有诸混叠伪差,
所述第2合成滤波器阵列(227)的长度为N,并且产生诸信号样本的一个或多个临时块,其中的每一个都具有诸混叠伪差,
所述第3合成滤波器阵列(228)的长度为3N/2,并且产生诸信号样本的所述终了块,上述诸信号样本在中间的N/2个样本处具有诸混叠伪差,并且在最后的N/2个样本处没有诸混叠伪差。
11.根据权利要求10所述的方法,其中
通过一个第1合成变换以及一个长度为3N/2个样本的第1合成窗口函数(241)来实现所述第1合成滤波器阵列(226),其中所述第1合成窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及具有一个长度为N/2的第3区段,
通过一个第2合成变换以及一个长度为N个样本的第2合成窗口函数(242)来实现所述第2合成滤波器阵列(227),其中所述第2合成窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及
通过一个第3合成变换以及一个长度为3N/2个样本的第3合成窗口函数(243)来实现所述第3合成滤波器阵列(228),其中所述第3合成窗口函数具有一个长度为N/2的第1区段、以及具有不等于0的一个长度为N/2的第2区段和一个长度为N/2的第3区段。
12.根据权利要求8所述的方法,其中已经从一个凯撒-贝塞尔窗口函数推导出所述第1合成窗口函数(241)的第1和第2区段,已经从一个凯撒-贝塞尔窗口函数推导出所述第2合成窗口函数(242),已经从一个凯撒-贝塞尔窗口函数推导出所述第3合成窗口函数(243)的第2和第3区段。
13.根据权利要求7,8,10,11或12所述的方法,还包括:
接收一组控制信号(323),它对在所述诸帧的序列以内的介于一个第1帧以及紧跟在所述第1帧后面的一个第2帧之间的边界加以标识,其中所述第1帧具有一个第3已滤波信号块,它跟随着在第1帧里面的一个临时的第2已滤波信号块,并且所述第2帧具有一个第1已滤波信号块,它领先于在第2帧里面的一个临时的第2已滤波信号块,并且其中所述第1已滤波信号块运载着由一个第1分析滤波器阵列来进行滤波的音频信息,所述第3已滤波信号块运载着由一个第3分析滤波器阵列来进行滤波的音频信息,所述临时的第2已滤波信号块运载着由一个第2分析滤波器阵列来进行滤波的音频信息;以及
响应于在第1和第2帧中的已滤波的诸信号块,产生由已合成的诸块所组成的一个第1合成帧,它紧挨着由已合成的诸块所组成的一个第2合成帧的前面,第1合成帧具有一个已合成的终了块,它跟随着在第1合成帧里面的一个第1已合成的临时块,并且第2合成帧具有一个已合成的起始块,它领先于在第2合成帧里面的一个第2已合成的临时块,其中,通过向第1已滤波信号块应用一个第4合成滤波器阵列(326),来产生已合成的起始块,通过向第3已滤波信号块应用一个第6合成滤波器阵列(328),来产生已合成的终了块,通过向第1帧里面的临时的第2已滤波信号块应用一个第5合成滤波器阵列(327),来产生第1临时合成块,并且通过向第2帧里面的临时的第2已滤波信号块应用一个第5合成滤波器阵列,来产生第2临时合成块,并且其中
通过由第4合成滤波器阵列与第1分析滤波器阵列相结合而形成的一个第1频率响应(341),使得相对于一个参考频率响应(343)而言的对频谱能量的衰减得以优化,以便跟从参考频率响应所获得的衰减相比,在第1频率响应的阻带内获得较小的衰减,而在第1频率响应的阻带以外,对频谱邻频干扰提供更大的衰减,其中参考频率响应对应于这样一种脉冲响应,它符合于在一个5毫秒的间隔内,一个线性递减的斜坡,
通过由第6合成滤波器阵列与第3分析滤波器阵列相结合而形成的一个第3频率响应(341),使得相对于参考频率响应而言的对频谱能量的衰减得以优化,以便跟从参考频率响应所获得的衰减相比,在第2频率响应的阻带内获得较小的衰减,而在第2频率响应的阻带以外,对频谱邻频干扰提供更大的衰减,以及
由第5合成滤波器阵列与第2分析滤波器阵列相结合而形成的一个第2频率响应(342)不同于第1频率响应以及第3频率响应;
其中,通过令从所述第4、第5和第6合成滤波器阵列中获得的相邻的各合成块互相重叠以及将对应的互相重叠的诸信号样本相加来产生诸输出信号帧。
14.根据权利要求13所述的方法,包括:
从所述第1帧获得多个增益控制字(145),它表示一个第1起始增益水平以及一个第1终了增益水平,并且从所述第2帧获得多个增益控制字(145),它表示一个第2起始增益水平以及一个第2终了增益水平;
产生一个第1增益控制信号(149a,149b),它表示第1起始和第1终了增益水平的一个内插值,并且产生一个第2增益控制信号(149a,149b),它表示第2起始和第2终了增益水平的一个内插值;以及
根据所述第1增益控制信号,调制所述已合成的终了块,以实现所述第6合成滤波器阵列(328),并且根据所述第2增益控制信号,调制所述已合成的起始块,以实现所述第4合成滤波器阵列(326)。
15.一种用于信号处理的装置,包括:
用于接收一组输入信号(201)的装置(202),输入信号包括诸帧(20-26)的一个序列,一个各自的输入信号帧由诸信号样本的诸块(11-17)的一个序列组成,其中包括一个起始块(11),一个或多个临时块(12-16)以及一个终了块(17),所述诸块表示互相重叠的音频信息的诸间隔,其中
所述起始块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;以及
所述终了块包括一个第1区段,其后跟随着一个第2区段,其后又跟随着一个第3区段;
具有下列功能的装置(204,205-207):响应于所述各自的输入信号帧,通过向所述起始块应用一个第1分析滤波器阵列(205),以提供时域混叠抵消,来产生一个第1已滤波信号块,通过向所述一个或多个临时块应用一个第2分析滤波器阵列(206),以提供时域混叠抵消,来产生一个或多个第2已滤波信号块,通过向所述终了块应用一个第3分析滤波器阵列(207),以提供时域混叠抵消,来产生一个第3已滤波信号块,其中
所述第2已滤波信号块具有诸混叠伪差,
所述第1已滤波信号块在起始块的第2区段中具有音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与起始块的第2区段相重叠的音频信息的间隔,而在起始块的第1区段中,没有该音频信息的诸混叠伪差;以及
所述第3已滤波信号块在终了块的第2区段中具有音频信息的诸混叠伪差,后者对在一个第2已滤波信号块中的诸混叠伪差产生抵消作用,上述第2已滤波信号块表示与终了块的第2区段相重叠的音频信息的间隔,而在终了块的第3区段中,没有该音频信息的诸混叠伪差;以及
具有下列功能的装置(229):通过将所述第1已滤波信号块、所述一个或多个第2已滤波信号块以及所述第3已滤波信号块组合到一个各自的输出信号帧,来产生一组适于传输或存储的输出信号(230),由此,响应于所述多个输入信号帧,通过将第1、第2和第3已滤波信号块加以组合,就能产生输出信号诸帧的一个序列。
16.根据权利要求15所述的装置,其中
借助于一个第1TDAC分析变换以及一个第1分析窗口函数(241)来实现所述第1分析滤波器阵列(205),其中所述第1分析窗口函数由3个区段组成,它们被应用到所述起始块(11)的各自的诸区段,并且第1分析窗口函数的第3区段为0,由此保证从第3区段反射到第1区段的诸混叠伪差为0,
借助于一个第2TDAC分析变换以及一个第2分析窗口函数(242)来实现所述第2分析滤波器阵列(206),第2分析窗口函数由2个区段组成,它们被应用到所述一个或多个临时块(12-16)的两个对应的区段,其中诸混叠伪差在第1和第2区段以内进行反射,以及
借助于一个第3TDAC分析变换以及一个第3分析窗口函数(243)来实现所述第3分析滤波器阵列(207),其中所述第3分析窗口函数由3个区段组成,它们被应用到所述终了块(17)的各自的诸区段,并且第3分析窗口函数的第1区段为0,由此保证从第1区段反射到第3区段的诸混叠伪差为0。
17.根据权利要求15或16所述的装置,其中所述第1、第2和第3分析滤波器阵列(205-207)分别具有一个各自的长度,所述第1和第2分析滤波器各自的长度不相等,并且所述第2和第3分析滤波器各自的长度也不相等。
18.根据权利要求15或16所述的装置,其中在所述各自的输入信号帧(20-26)中的所述诸块(11-17)表示以N/2个样本互相重叠的音频信息的诸间隔,
所述第1分析滤波器阵列(205)的长度为3N/2,并且具有这样的混叠抵消特性,使得,响应于所述第1已滤波信号块,一个互补的第1合成滤波器阵列(226)产生一个已恢复的诸信号样本的起始块,它在中间的N/2个样本处具有诸混叠伪差,并且在起始的N/2个样本处没有诸混叠伪差,
所述第2分析滤波器阵列(206)的长度为N,并且具有这样的混叠抵消特性,使得,响应于所述第2已滤波信号块,一个互补的第2合成滤波器阵列(227)产生一个或多个已恢复的诸信号样本的临时块,其中的每一个都具有诸混叠伪差,
所述第3分析滤波器阵列(207)的长度为3N/2,并且具有这样的混叠抵消特性,使得,响应于所述第3已滤波信号块,一个互补的第3合成滤波器阵列(228)产生一个已恢复的诸信号样本的终了块,它在中间的N/2个样本处具有诸混叠伪差,并且在最后的N/2个样本处没有诸混叠伪差。
19.根据权利要求18所述的装置,其中
通过一个第1分析变换以及一个长度为3N/2个样本的第1分析窗口函数(241)来实现所述第1分析滤波器阵列(205),其中所述第1分析窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及具有一个长度为N/2的第3区段,
通过一个第2分析变换以及一个长度为N个样本的第2分析窗口函数(242)来实现所述第2分析滤波器阵列(206),其中所述第2分析窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及
通过一个第3分析变换以及一个长度为3N/2个样本的第3分析窗口函数(243)来实现所述第3分析滤波器阵列(207),其中所述第3分析窗口函数具有一个长度为N/2的第1区段、以及具有不等于0的一个长度为N/2的第2区段和一个长度为N/2的第3区段。
20.根据权利要求16所述的装置,其中已经从一个凯撒-贝塞尔窗口函数推导出所述第1分析窗口函数(241)的第1和第2区段,已经从一个凯撒-贝塞尔窗口函数推导出所述第2分析窗口函数(242),已经从一个凯撒-贝塞尔窗口函数推导出所述第3分析窗口函数(243)的第2和第3区段。
21.一种信号处理装置,包括:
用于接收一组输入信号(221)的装置(222),输入信号包括诸帧的一个序列,每一帧都由表示互相重叠的音频信息的诸间隔的诸信号样本的多个已滤波的诸信号块组成,一个各自的输入信号帧包括一个第1已滤波信号块,一个或多个第2已滤波信号块以及一个第3已滤波信号块;
具有下列功能的装置(225,226-228):响应于一个各自的输入信号帧,通过向所述第1已滤波信号块应用一个第1合成滤波器阵列(226),以提供时域混叠抵消,来产生一个第1已合成的起始块,通过向所述一个或多个第2已滤波信号块应用一个第2合成滤波器阵列(227),以提供时域混叠抵消,来产生一个或多个已合成的临时块,通过向所述第3已滤波信号块应用一个第3合成滤波器阵列(228),以提供时域混叠抵消,来产生一个已合成的终了块;
产生表示音频信息的输出信号诸帧的一个序列的装置(229),一个各自的输出信号帧包括多个信号样本块,其中所述产生是将相邻的已合成的诸块重叠在一起,同时在互相重叠的已合成诸块中将对应的重叠样本相加,以及
其中所述已合成的诸临时块具有诸混叠伪差,所述已合成的起始块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第1已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差,并且所述已合成的终了块也具有诸混叠伪差,后者能抵消在已合成的诸临时块中的诸混叠伪差,上述已合成的诸临时块表示与由第3已滤波信号块所表示的间隔相重叠的音频信息的间隔,但没有其他各种混叠伪差。
22.根据权利要求21所述的装置,其中
借助于一个第1TDAC合成变换以及一个第1合成窗口函数(241)来实现所述第1合成滤波器阵列(226),其中所述第1合成窗口函数由3个区段组成,它们被应用到第1已滤波信号块的3个对应的区段,并且第1合成窗口函数的所述第3区段为0,由此避免诸混叠伪差从所述第1区段反射到所述第3区段。
借助于一个第2TDAC合成变换以及一个第2合成窗口函数(242)来实现所述第1合成滤波器阵列(227),其中所述第2合成窗口函数由2个区段组成,它们被应用到第2已滤波信号块的2个对应的区段,由此使得诸混叠伪差在所述第1和第2区段以内进行反射,以及
借助于一个第3TDAC合成变换以及一个第3合成窗口函数(243)来实现所述第3合成滤波器阵列(228),其中所述第3合成窗口函数由3个区段组成,它们被应用到第3已滤波信号块的3个对应的区段,并且第3合成窗口函数的所述第1区段为0,由此避免诸混叠伪差从所述第3区段反射到所述第1区段。
23.根据权利要求21或22所述的装置,其中所述第1、第2和第3合成滤波器阵列(226-228)分别具有一个各自的长度,所述第1和第2合成滤波器各自的长度不相等,并且所述第2和第3合成滤波器各自的长度也不相等。
24.根据权利要求21所述的装置,其中在一个各自的输出信号帧中的所述诸信号样本块表示以N/2个样本互相重叠的诸间隔,
所述第1合成滤波器阵列(226)的长度为3N/2,并且产生诸信号样本的所述起始块,上述诸信号样本在中间的N/2个样本处具有诸混叠伪差,并且在起始的N/2个样本处没有诸混叠伪差,
所述第2合成滤波器阵列(227)的长度为N,并且产生诸信号样本的一个或多个临时块,其中的每一个都具有诸混叠伪差,
所述第3合成滤波器阵列(207)的长度为3N/2,并且产生诸信号样本的所述终了块,上述诸信号样本在中间的N/2个样本处具有诸混叠伪差,并且在最后的N/2个样本处没有诸混叠伪差。
25.根据权利要求24所述的装置,其中
通过一个第1合成变换以及一个长度为3N/2个样本的第1合成窗口函数(241)来实现所述第1合成滤波器阵列(226),其中所述第1合成窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及具有一个长度为N/2的第3区段,
通过一个第2合成变换以及一个长度为N个样本的第2合成窗口函数(242)来实现所述第2合成滤波器阵列(227),其中所述第2合成窗口函数具有不等于0的一个长度为N/2的第1区段和一个长度为N/2的第2区段,以及
通过一个第3合成变换以及一个长度为3N/2个样本的第3合成窗口函数(243)来实现所述第3合成滤波器阵列(228),其中所述第3合成窗口函数具有一个长度为N/2的第1区段、以及具有不等于0的一个长度为N/2的第2区段和一个长度为N/2的第3区段。
26.根据权利要求22所述的装置,其中已经从一个凯撒-贝塞尔窗口函数推导出所述第1合成窗口函数(241)的第1和第2区段,已经从一个凯撒-贝塞尔窗口函数推导出所述第2合成窗口函数(242),已经从一个凯撒-贝塞尔窗口函数推导出所述第3合成窗口函数(243)的第2和第3区段。
27.根据权利要求21,22,24,25或26所述的装置,还包括:
用于接收一组控制信号(323)的装置,该控制信号对在所述诸帧的序列以内的介于一个第1帧以及紧跟在所述第1帧后面的一个第2帧之间的边界加以标识,其中所述第1帧具有一个第3已滤波信号块,它跟随着在第1帧里面的一个临时的第2已滤波信号块,并且所述第2帧具有一个第1已滤波信号块,它领先于在第2帧里面的一个临时的第2已滤波信号块,并且其中所述第1已滤波信号块运载着由一个第1分析滤波器阵列来进行滤波的音频信息,所述第3已滤波信号块运载着由一个第3分析滤波器阵列来进行滤波的音频信息,所述临时的第2已滤波信号块运载着由一个第2分析滤波器阵列来进行滤波的音频信息;以及
具有下列功能的装置(325,326-328):响应于在第1和第2帧中的已滤波的诸信号块,产生由已合成的诸块所组成的一个第1合成帧,它紧挨着由已合成的诸块所组成的一个第2合成帧的前面,第1合成帧具有一个已合成的终了块,它跟随在第1合成帧里面的一个第1已合成的临时块的后面,并且第2合成帧具有一个已合成的起始块,它领先于在第2合成帧里面的一个第2临时合成临时块,其中,通过向第1已滤波信号块应用一个第4合成滤波器阵列(326),来产生已合成的起始块,通过向第3已滤波信号块应用一个第6合成滤波器阵列(328),来产生已合成的终了块,通过向第1帧里面的临时的第2已滤波信号块应用一个第5合成滤波器阵列(327),来产生第1临时合成块,并且通过向第2帧里面的临时的第2已滤波信号块应用一个第5合成滤波器阵列,来产生第2临时合成块,并且其中
通过由第4合成滤波器阵列与第1分析滤波器阵列相结合而形成的一个第1频率响应(341),使得相对于一个参考频率响应(343)而言的对频谱能量的衰减得以优化,以便跟从参考频率响应所获得的衰减相比,在第1频率响应的阻带内获得较小的衰减,而在第1频率响应的阻带以外,对频谱邻频干扰提供更大的衰减,其中参考频率响应对应于这样一种脉冲响应,它符合于在一个5毫秒的间隔内,一个线性递减的斜坡,
通过由第6合成滤波器阵列与第3分析滤波器阵列相结合而形成的一个第3频率响应(341),使得相对于参考频率响应而言的对频谱能量的衰减得以优化,以便跟从参考频率响应所获得的衰减相比,在第2频率响应的阻带内获得较小的衰减,而在第2频率响应的阻带以外,对频谱邻频干扰提供更大的衰减,以及
由第5合成滤波器阵列与第2分析滤波器阵列相结合而形成的一个第2频率响应(342)不同于第1频率响应以及第3频率响应;
其中,通过令从所述第4、第5和第6合成滤波器阵列中获得的相邻的各合成块互相重叠以及将对应的互相重叠的诸信号样本相加来产生诸输出信号帧。
28.根据权利要求27所述的装置,包括:
装置(142),用于从所述第1帧获得多个增益控制字(145),表示一个第1起始增益水平以及一个第1终了增益水平,以及从所述第2帧获得多个增益控制字(145),表示一个第2起始增益水平以及一个第2终了增益水平;
装置(148),用于产生一个第1增益控制信号(149a,149b),它表示第1起始和第1终了增益水平的一个内插值,并且产生一个第2增益控制信号(149a,149b),它表示第2起始和第2终了增益水平的一个内插值;以及
装置(146),它根据所述第1增益控制信号,调制所述已合成的终了块,以实现所述第6合成滤波器阵列(328),以及根据所述第2增益控制信号,调制所述已合成的起始块,以实现所述第4合成滤波器阵列(326)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/953,121 US5913191A (en) | 1997-10-17 | 1997-10-17 | Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries |
US08/953,121 | 1997-10-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1276903A CN1276903A (zh) | 2000-12-13 |
CN1267920C true CN1267920C (zh) | 2006-08-02 |
Family
ID=25493597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988102927A Expired - Lifetime CN1267920C (zh) | 1997-10-17 | 1998-10-01 | 信号处理方法与装置 |
Country Status (16)
Country | Link |
---|---|
US (1) | US5913191A (zh) |
EP (1) | EP1023727B1 (zh) |
JP (1) | JP4236813B2 (zh) |
KR (1) | KR100567353B1 (zh) |
CN (1) | CN1267920C (zh) |
AT (1) | ATE211576T1 (zh) |
AU (1) | AU762707B2 (zh) |
BR (1) | BR9813863A (zh) |
CA (1) | CA2306113C (zh) |
DE (1) | DE69803402T2 (zh) |
DK (1) | DK1023727T3 (zh) |
ES (1) | ES2165704T3 (zh) |
HK (1) | HK1033195A1 (zh) |
MY (1) | MY123186A (zh) |
TW (1) | TW434529B (zh) |
WO (1) | WO1999021185A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100304092B1 (ko) * | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6163508A (en) * | 1999-05-13 | 2000-12-19 | Ericsson Inc. | Recording method having temporary buffering |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
FR2824978B1 (fr) * | 2001-05-15 | 2003-09-19 | Wavecom Sa | Dispositif et procede de traitement d'un signal audio |
US7369709B2 (en) * | 2003-09-07 | 2008-05-06 | Microsoft Corporation | Conditional lapped transform |
US7292902B2 (en) * | 2003-11-12 | 2007-11-06 | Dolby Laboratories Licensing Corporation | Frame-based audio transmission/storage with overlap to facilitate smooth crossfading |
ES2338117T3 (es) * | 2004-05-17 | 2010-05-04 | Nokia Corporation | Codificacion de audio con diferentes longitudes de trama de codificacion. |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
JP5057590B2 (ja) * | 2006-07-24 | 2012-10-24 | マーベル ワールド トレード リミテッド | 回転式データストレージデバイス用の制御システムおよびデータストレージデバイス |
JP4245030B2 (ja) * | 2006-09-27 | 2009-03-25 | ソニー株式会社 | 出力処理装置及びその制御方法 |
CN101179735B (zh) * | 2006-11-08 | 2010-07-14 | 中兴通讯股份有限公司 | 一种多媒体广播系统媒体数据流的封装方法 |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
TWI484481B (zh) | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
US9338523B2 (en) * | 2009-12-21 | 2016-05-10 | Echostar Technologies L.L.C. | Audio splitting with codec-enforced frame sizes |
WO2012048472A1 (en) | 2010-10-15 | 2012-04-19 | Huawei Technologies Co., Ltd. | Signal analyzer, signal analyzing method, signal synthesizer, signal synthesizing method, windower, transformer and inverse transformer |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
EP2830056A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
WO2017034874A1 (en) | 2015-08-24 | 2017-03-02 | Dolby Laboratories Licensing Corporation | Volume-levelling processing |
EP3382701A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
CN115237369B (zh) * | 2022-09-23 | 2022-12-13 | 成都博宇利华科技有限公司 | 一种高精度信息戳标记方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US577992A (en) * | 1897-03-02 | Gas-governor | ||
US4551688A (en) * | 1984-05-23 | 1985-11-05 | Rockwell International Corporation | Delay compensated automatic gain control |
US4625240A (en) * | 1984-07-25 | 1986-11-25 | Eeco, Inc. | Adaptive automatic gain control |
FR2613154A1 (fr) * | 1987-03-24 | 1988-09-30 | France Etat | Systeme de traitement numerique de signal a bancs de filtres |
US5142656A (en) * | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
CA2026213C (en) * | 1989-01-27 | 1995-04-04 | Louis Dunn Fielder | Low bit rate transform coder, decoder and encoder/decoder for high-quality audio |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5479562A (en) * | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
US5069210A (en) * | 1989-04-17 | 1991-12-03 | Jeutter Dean C | Cochlear implant employing frequency-division multiplexing and frequency modulation |
DE59108205D1 (de) * | 1990-12-05 | 1996-10-24 | Itt Ind Gmbh Deutsche | Verfahren zur Taktratenumsetzung eines digitalisierten Signals |
KR100228688B1 (ko) * | 1991-01-08 | 1999-11-01 | 쥬더 에드 에이. | 다차원 음장용 인코우더/디코우더 |
US5394508A (en) * | 1992-01-17 | 1995-02-28 | Massachusetts Institute Of Technology | Method and apparatus for encoding decoding and compression of audio-type data |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5451954A (en) * | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
AU697176B2 (en) * | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
DK0799531T3 (da) * | 1994-12-20 | 2000-07-10 | Dolby Lab Licensing Corp | Fremgangsmådeapparat til at anvende bølgeformsforudsigelse til underbånd af et kodningssystem, der vedrører sanseopfattelse |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US5732189A (en) * | 1995-12-22 | 1998-03-24 | Lucent Technologies Inc. | Audio signal coding with a signal adaptive filterbank |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
EP0827647B1 (en) * | 1996-03-19 | 2002-07-17 | Dolby Laboratories Licensing Corporation | Analysis/synthesis filtering system with efficient oddly-stacked single-sideband filter bank using time-domain aliasing cancellation |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
-
1997
- 1997-10-17 US US08/953,121 patent/US5913191A/en not_active Expired - Lifetime
-
1998
- 1998-10-01 AT AT98953234T patent/ATE211576T1/de active
- 1998-10-01 WO PCT/US1998/020751 patent/WO1999021185A1/en active IP Right Grant
- 1998-10-01 EP EP98953234A patent/EP1023727B1/en not_active Expired - Lifetime
- 1998-10-01 BR BR9813863-4A patent/BR9813863A/pt not_active Application Discontinuation
- 1998-10-01 JP JP2000517415A patent/JP4236813B2/ja not_active Expired - Lifetime
- 1998-10-01 DE DE69803402T patent/DE69803402T2/de not_active Expired - Lifetime
- 1998-10-01 CA CA002306113A patent/CA2306113C/en not_active Expired - Lifetime
- 1998-10-01 AU AU10656/99A patent/AU762707B2/en not_active Expired
- 1998-10-01 KR KR1020007002789A patent/KR100567353B1/ko not_active IP Right Cessation
- 1998-10-01 DK DK98953234T patent/DK1023727T3/da active
- 1998-10-01 CN CNB988102927A patent/CN1267920C/zh not_active Expired - Lifetime
- 1998-10-01 ES ES98953234T patent/ES2165704T3/es not_active Expired - Lifetime
- 1998-10-14 TW TW087117091A patent/TW434529B/zh not_active IP Right Cessation
- 1998-10-15 MY MYPI98004716A patent/MY123186A/en unknown
-
2001
- 2001-05-29 HK HK01103688A patent/HK1033195A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1023727A1 (en) | 2000-08-02 |
AU1065699A (en) | 1999-05-10 |
JP4236813B2 (ja) | 2009-03-11 |
CA2306113C (en) | 2005-08-02 |
TW434529B (en) | 2001-05-16 |
KR100567353B1 (ko) | 2006-04-04 |
CN1276903A (zh) | 2000-12-13 |
HK1033195A1 (en) | 2001-08-17 |
EP1023727B1 (en) | 2002-01-02 |
KR20010024051A (ko) | 2001-03-26 |
ATE211576T1 (de) | 2002-01-15 |
BR9813863A (pt) | 2000-09-26 |
ES2165704T3 (es) | 2002-03-16 |
DE69803402T2 (de) | 2002-08-01 |
MY123186A (en) | 2006-05-31 |
WO1999021185A1 (en) | 1999-04-29 |
CA2306113A1 (en) | 1999-04-29 |
DK1023727T3 (da) | 2002-02-11 |
AU762707B2 (en) | 2003-07-03 |
JP2001521259A (ja) | 2001-11-06 |
US5913191A (en) | 1999-06-15 |
DE69803402D1 (de) | 2002-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1267920C (zh) | 信号处理方法与装置 | |
CN1199179C (zh) | 在帧边界处衰减频谱邻频干扰的音频编码 | |
KR100621424B1 (ko) | 다이나믹 오디오 프레임 배열에 의해 비디오/오디오데이터 동기된 프레임 기반 오디오 코딩 | |
CN1065381C (zh) | 数字音频信号编码和/或译码方法 | |
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
CN100559465C (zh) | 保真度优化的可变帧长编码 | |
CN1030129C (zh) | 高效数字数据编码和译码装置 | |
CN1552060A (zh) | 通过降低前噪声改善低比特速率音频编码系统的瞬时性能 | |
KR100591009B1 (ko) | 이득 제어 워드들을 구비한 프레임 기반 오디오 코딩 | |
US9042558B2 (en) | Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus | |
CN1639770A (zh) | 根据频率变换重建具有不完全频谱的音频信号的频谱 | |
JP2001521309A5 (zh) | ||
JP4126682B2 (ja) | エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化 | |
CN1947172A (zh) | 方法、装置、编码器设备、解码器设备以及音频系统 | |
JP2001521308A5 (zh) | ||
JP2001521347A5 (zh) | ||
CN1879163A (zh) | 利用重叠来促进平滑交叉渐变的基于帧的音频传输/存储 | |
CN1201492C (zh) | 编码、解码装置及方法,记录、再现装置及方法,记录媒体 | |
CN1700757A (zh) | 用于以高质量的可变速度播放视听媒体的系统和方法 | |
Vernony et al. | Carrying multichannel audio in a stereo production and distribution infrastructure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20060802 |
|
CX01 | Expiry of patent term |