CN102959871B - 编码方法、解码方法、编码装置、解码装置、程序及记录介质 - Google Patents
编码方法、解码方法、编码装置、解码装置、程序及记录介质 Download PDFInfo
- Publication number
- CN102959871B CN102959871B CN201180031929.5A CN201180031929A CN102959871B CN 102959871 B CN102959871 B CN 102959871B CN 201180031929 A CN201180031929 A CN 201180031929A CN 102959871 B CN102959871 B CN 102959871B
- Authority
- CN
- China
- Prior art keywords
- coefficient
- value
- sample
- group
- gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
在编码中,输出索引信息,该索引信息表示多组与样本各自的位置相对应的预定的系数的组中、使样本的值与将样本的量化值和与样本各自的位置相对应的系数相乘的值之间的误差对于所有样本位置的和为最小的系数的组。在解码中,求出与输入的矢量量化索引对应的多个值作为与多个样本位置相对应的解码值,使用输入的索引信息表示的与多个样本位置相对应的预定的系数的组,输出将与各样本位置相对应的解码值和该系数相乘的值。
Description
技术领域
本发明涉及通过矢量量化对例如声音或音乐等音响,图像等信号序列进行编码或解码的技术。
背景技术
在专利文献1中记载的编码装置中,首先用归一化值除输入信号进行归一化。归一化值被量化,生成量化索引。归一化的输入信号被矢量量化,生成量化代表矢量的索引。生成的量化索引及量化代表矢量被输出到解码装置。在解码装置中,量化索引被解码生成归一化值。量化代表矢量的索引被解码生成样本列。生成的样本列各自的样本乘以归一化值而得到的值的列作为解码信号样本列。
另一方面,作为量化噪声少的高能率的矢量量化方法,广泛使用例如SVQ法(球形矢量量化(Spherical Vector Quantization),例如参照非专利文献1)等在预先设定的量化比特数的范围内,集中多个输入信号并进行量化的矢量量化方法。
在SVQ法中,使用量化归一化值对MDCT(Modified Discrete Cosine Transform,修改离散余弦变换)系数等输入信号的各样本进行归一化,归一化的各样本集中于每个子带并被量化。此时,根据每个子带的听觉重要度,动态分配与各子带对应的码的比特数(量化比特数)。另外,在SVQ法中,假设输入信号的稀疏性,输入信号的主要分量优先被量化。因此,可将如高次谐波或母音那样仅仅零星存在频域中的能量的输入信号(稀疏信号)高精度地量化。
但是,在用SVQ法将在许多频率中分布能量的输入信号的各样本进行了量化的情况下,在从量化值复原的解码信号中不存在理应存在于输入信号中的频率分量(解码信号缺损频率分量)的频度升高。这样,解码信号缺损频率分量的情况下,解码信号的某频率分量的有无在时间上不连续变化的频度升高。人们对这种频率分量的有无在时间上不连续变化较为敏感。输入信号 为例如音响信号的情况下,这种变化有时作为被称为音乐噪声的噪声而被感知。另外,在输入信号为图像信号的情况下,有时会产生相当于音响信号中所说的音乐噪声那样的块状噪声。下面,将音乐噪声及块状噪声统称为“音乐噪声等”。
与此相对,与SVQ法相比,有解码信号缺损频率分量的频度比较低的AVQ法(几何矢量量化(Algebraic Vector Quantization),例如参照非专利文献2)的矢量量化方法。AVQ法与SVQ法同样是假设了信号的稀疏性的方法,但能够获得可复原比SVQ法多的频率分量的量化值。
现有技术文献
专利文献
专利文献1:日本特开平7-261800号公报
非专利文献
非专利文献1:Recommendation ITU-T G.729.1,SERIES G:TRANSMISSION SYSTEMS AND MEDIA,DIGITAL SYSTEMS ANDNETWORKS,Digital terminal equipments-Coding of analogue signals bymethods other than PCM,G.729-based embedded variable bit-rate coder:An8-32kbit/s scalable wideband coder bitstream interoperable with G.729.
非专利文献2:Recommendation ITU-T G.718,SERIES G:TRANSMISSION SYSTEMS AND MEDIA,DIGITAL SYSTEMS ANDNETWORKS,Digital terminal equipments-Coding of voice and audio signals,Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audiofrom8-32kbit/s.
发明内容
发明要解决的课题
但是,与SVQ法相比,AVQ法的幅度的量化精度较粗。即使解码信号缺损频率分量的频度较低,如果幅度的量化精度较粗,也会产生音乐噪声等。这种问题不限于AVQ法,与基于量化精度产生音乐噪声等的情况是相同的。另外,这种问题不限于输入信号为频域的信号的情况,在输入信号为时域的信号的情况下也会产生。
在本发明中,提供一种降低基于量化精度产生的音乐噪声等的技术。
用于解决课题的手段
在编码中,输出索引信息,该索引信息表示多组与样本各自的位置相对应的预定的系数的组中、使样本的值与将样本的量化值和与样本各自的位置相对应的系数相乘的值之间的误差对于所有样本位置的和为最小的系数的组。在解码中,求出与输入的矢量量化索引对应的多个值,作为与多个样本位置相对应的解码值,使用输入的索引信息表示的与多个样本位置相对应的预定的系数的组,输出将与各样本位置相对应的解码值和该系数相乘的值。
发明效果
在编码中,输出表示与多个样本各自的量化值相乘的多个系数的组的索引信息,因此能够减小解码时的量化误差,并能够减小音乐噪声等。
在解码中,将索引信息表示的多个系数与多个解码值相乘,因此能够减小量化误差,并能够减小音乐噪声等。
附图说明
图1是编码装置及解码装置的例子的功能方框图。
图2是编码方法的例子的流程图。
图3是步骤E4的例子的流程图。
图4是解码方法的例子的流程图。
图5是步骤D3的例子的流程图。
图6是示例输入信号、量化值、斜度系数(斜率校正增益)之间的关系的图。
具体实施方式
下面,对该发明的一实施方式详细地进行说明。
(构成)
如图1所示,实施方式的编码装置11例如包含归一化值计算部112、归一化值量化部113、矢量量化部115及斜度计算部116(相当于“系数组选择部”)。如图1所例示,实施方式的解码装置12例如包含归一化值解码部121、矢量解码部122及斜度校正部124。根据需要,编码装置11例如也可以包含频域转换部111。解码装置12例如也可以包含时域转换部125、平滑化部126。
(编码处理)
编码装置11执行图2示例的编码方法的各步骤。
输入信号X(k)被输入归一化值计算部112、矢量量化部115及斜度计算部116。该例的输入信号X(k)为将音响信号等时间序列信号即时域信号x(n)转换到频域而得到的频域信号。频域的输入信号X(k)也可以直接输入编码装置11,频域转换部111也可以将输入的时域的输入信号x(n)转换为频域而生成频域的输入信号X(k)。频域转换部111生成频域的输入信号X(k)的情况下,频域转换部111将输入的时域的输入信号x(n)通过例如MDCT(Modified Discrete Cosine Transform)转换为频域的输入信号X(k)并输出。n为在时域中的信号的号码(离散时间号码),k为在频域的信号(样本)的号码(离散频率号码)。n的值越大对应的时间越晚。k的值越大对应的频率越高。设1帧由L个样本构成,则时域信号x(n)每帧均被转换为频域,生成构成L个频率分量的频域的输入信号X(k)(k=0,1,…,L-1)。L为规定的正数,例如64或80等比1大的整数。另外,在使用MDCT的情况下,由输入的时间序列信号即L个样本构成的每帧向频域转换,作为该转换对象的帧在每1/2帧,即每L/2个样本被偏移。
归一化值计算部112在每一帧计算代表被输入的输入信号X(k)的L个样本中的规定的个数C0的样本的值即归一化值τX0 -(步骤E1)。τX0 -是指τX0的上标横杠的值。在此,τ设定为对于1帧中的L个样本中由规定的个数C0的样本构成的各子带唯一分配的0以上的整数。
C0为L或1及L以外的L的公约数。另外,将C0设为L是指对每L个样本求出归一化值。将C0设为1及L以外的L的公约数是指将L个样本分割为子带,对构成各子带的每C0个样本求出归一化值。例如,在设定为L=64,且由八个频率分量构成子带的情况下,构成八个子带,计算各子带的归一化值。另外,在C0为L的情况下τ=0,归一化值τX0 -为代表L个样本的值。即,在C0为L的情况下,在每帧计算一个归一化值τX0 -。另一方面,在C0为1及L以外的L的公约数的情况下,τ为与1帧中的各子带对应的整数τ=0,…,(L/C0)-1,归一化值τX0 -为代表属于与τ对应的子帧的C0个样本的值。即,在C0为1及L以外的L的公约数的情况下,在每帧计算(L/C0)个归一化值τX0 -(τ=0,…,(L/C0)-1)。另外,与C0的值无关,k=τ·C0,…,(τ+1)·C0-1。由归一化值计算部112计算的τX0 -被送入归一化值量化部113。
[归一化值τX0 -的具体例]
归一化值τX0 -为代表C0个样本的值。换言之,归一化值τX0 -为与C0个样本对应的值。归一化值τX0 -的例子为对于如下的C0个样本的幂平均值的平方根。
[数1]
归一化值τX0 -的另一个例子为用C0除对于如下的C0个样本的幂合计值的平方根所得的值。
[数2]
归一化值τX0 -的另一例子为如下的C0个样本的平均幅度值。
[数3]
归一化值τX0 -不限定于上述的例子([归一化值τX0 -的具体例]的说明结束)。
归一化值量化部113求出将归一化值τX0 -进行量化所得的量化归一化值 τX-及与该量化归一化值τX-对应的归一化值量化索引(步骤E2)。τX-是指τX的上标横杠。量化归一化值τX-被送入矢量量化部115,与归一化值量化索引对应的码(比特流)被送入解码装置12。
矢量量化部115在每帧对输入的输入信号X(k)的L个样本中的多个样本X(k)集中进行矢量量化,生成矢量量化索引。矢量量化索引为表示量化代表矢量的索引。该例的矢量量化部115使用量化归一化值τX-将多个X(k)进行归一化,求出被归一化的多个样本X(k)’。例如,矢量量化部115通过用τX-除X(k),或在X(k)上乘以τX-的倒数而求出X(k)’。矢量量化部 115例如通过从存储于未图示的矢量编码本存储部的多个量化代表矢量中,选择与以多个X(k)’为分量的矢量最近的量化代表矢量,输出表示被选择的量化代表矢量的矢量量化索引,而进行矢量量化。矢量量化部115例如集中C0个X(k)’并进行矢量量化。矢量量化部115使用例如AVQ法(例如参照非专利文献2等)等矢量量化方法进行矢量量化,但也可以采用除此以外的矢量量化方法。另外,在C0为子带的样本数的情况下,对于考虑了人们的听觉特性的优先顺序较低的子带也可以不进行矢量量化。例如越是与人类容易感知的频率对应的子带,其优先顺序越高。例如,量化归一化值τX-越大的子带其优先顺序越高。
另外,通过矢量量化而得到的码的比特数根据输入信号而多种多样。有时因输入信号不同,通过矢量量化而得到的码(矢量量化索引等)的比特数,成为不足分配给矢量量化用的比特数,而分配给矢量量化用的比特的一部分剩余。另外,所谓“分配给矢量量化用的比特”是指分配给在从编码装置11传送到解码装置12的码中、通过矢量量化而得到的码(与矢量量化索引对应的码)的比特。“分配给矢量量化用的比特数”表示分配给矢量量化用的比特的比特数。“分配给矢量量化用的比特数”可以是在每帧决定的数,也可以是在每子带决定的数。另外,“分配给矢量量化用的比特数”是可以根据输入信号进行变动的数,也可以是与输入信号无关而被固定的数。矢量量化部115计算分配给矢量量化用的比特中、在实际的矢量量化中未使用的比特的比特数,作为未使用比特数U。在本方式的例子中,在每一帧(每L个样本)计算未使用比特数U。例如,矢量量化部115将从分配给处理对象的帧中的矢量量化用的比特数减去通过实际上属于该帧的L个样本的矢量量化而得到的矢量量化索引的比特数的总数所得的值作为未使用比特数U。U为0以上的整数。
进而,矢量量化部115输出将矢量量化索引进行了局部解码的值即多个量化值X^(k)。例如,矢量量化部115将使用量化归一化值τX-对由矢量量化索引表示的量化代表矢量的各分量X(k)’进行了逆归一化的值作为X(k)的量化值X^(k)而输出。例如,矢量量化部115将X(k)’和τX-的相乘值作为量化值X^(k)输出。该例的量化值X^(k)与用解码装置12获得的解码值X^(k)相等。未进行矢量量化的子带的量化值X^(k)成为0。另外,X^是指X的上标帽形。
矢量量化部115将矢量量化索引、未使用比特数U及量化值X^(k)传 送到斜度计算部116(步骤E3)。
斜度计算部116将MMAX组的由C0个斜度系数(斜率校正增益)构成的组保持于例如未图示的存储部。MMAX为2以上的整数。例如,斜度计算部116保持将以C0个斜度系数(斜率校正增益)γm(k)(k=0,…,C0-1)为要素的斜度系数矢量γm=[γm(0),…,γm(C0-1)](多个斜度系数的组)作为第m(m=0,…,MMAX-1)行的行矢量的式(1)所示的斜度矩阵γ。
[数4]
斜度计算部116在每帧,求出使以与输入的输入信号X(k)的L个样本中的C0个样本X(k)(k=0,…,C0-1)对应的值为要素的第一矢量、和以与用斜度系数矢量γm的各要素γm(k)对这些C0个样本X(k)的各个量化值X^(k)(k=0,…,C0-1)进行了修正所得的C0个修正值对应的值为要素的第二矢量的误差最小化的(例如成为最小的)斜度系数矢量的行号码m’,将表示行号码m’的索引信息idx写入在分配给矢量量化用的比特中未使用的比特的区域(称为“未使用比特区域”)。
换言之,斜度计算部116从将以多个斜度系数γm(k)为要素的斜度系数矢量γm作为行矢量的倾斜矩阵γ中,输出表示使以与多个样本X(k)对应的值为要素的第一矢量和以与用斜度系数矢量γm的各要素对多个量化值X^(k)进行了修正所得的多个修正值对应的值为要素的第二矢量之间的误差最小化的斜度系数矢量的行号码m’的索引信息idx,并配置于与矢量量化索引对应的码(比特流)的未使用比特区域。
即,斜度计算部116例如输出表示多组的与各个样本X(k)的位置相对应的预定的系数γm(k)的组中、使样本X(k)的值与将样本的量化值X^(k)和与各个样本的位置相对应的系数γm(k)相乘的值之间的误差对于所有样本位置的和为最小的系数γm的组的索引信息idx。另外,本方式的“各个样本X(k)的位置”是与各离散频率号码k对应的频率轴上的位置(步骤E4)。
由此,编码装置11能够有效利用未使用比特区域向解码装置12传送用 于修正幅度的量化误差的信息,并能够减小基于量化精度而产生的音乐噪声等。
斜度系数矢量γm的要素即C0个斜度系数γm(0)、…、γm(C0-1)彼此具有相关性。换言之,各斜度系数矢量γm是以彼此具有相关性的多个斜度系数γm(0)、…、γm(C0-1)为要素的矢量。X(0)、…、X(C0-1)大多为偏向以k为第一轴、以X(k)为第二轴的(k,X(k))平面上的直线或曲线而分布的情况。通过使用以考虑了这种X(0)、…、X(C0-1)的特性的斜度系数γm(0)、…、γm(C0-1)为要素的斜度系数矢量γm,可以高精度修正量化误差。例如,与同一行号码m对应的各斜度系数γm(0)、…、γm(C0-1),设定为偏向以k(与对应于乘以斜度系数γm(k)的量化值X^(k)的频率相对应的值,换言之,与对应于斜度系数γm(k)的频率对应的值)为第一轴、以γm(k)(斜度系数的值)为第二轴的(k,γm(k))平面上的直线或特定的曲线而分布的斜度系数。换言之,例如将偏向以与列号码对应的值k为第一轴、以该列号码中的斜度系数γm(k)为第二轴的(k,γm(k))平面上的直线或特定的曲线而分布的多个斜度系数γm(0)、…、γm(C0-1)为要素的矢量作为斜度系数矢量γm。更具体地说,例如与同一行号码m对应的各斜度系数γm(0)、…、γm(C0-1)设定为位于(k,γm(k))平面上的直线上或特定的曲线上。换言之,将以(k,γm(k))平面上的直线或特定的曲线上的各斜度系数γm(0)、…、γm(C0-1)为要素的矢量作为斜度系数矢量γm。(k,γm(k))平面上的直线上或特定的曲线,例如对每行号码m不同。下面示例倾斜矩阵γ。该例为C0=8、MMAX=3的情况。在该例中,各斜度系数γm(0)、…、γm(7)配置于对每行号码m(m=0,1,2)决定的直线上。
[数5]
第一矢量的例子是以C0个X(k)为要素的矢量、以C0个X(k)的大小|X(k)|为要素的矢量、以对C0个X(k)或|X(k)|乘以常数或变数的值为要素的矢量等。第二矢量的例子是以C0个修正值为要素的矢量、以C0个修正值的大小为要素的矢量、以对C0个修正值或大小乘以常数或变数的值为要素的矢量等。修正值的例子是表示X^(k)和γm(k)的积、X^(k)的 大小|X^(k)|和γm(k)的积、X^(k)和γm(k)的积的大小、X^(k)和γm(k)的积的大小的值,还有与X^(k)和γm(k)的积对应的值等。
第一矢量和第二矢量之间的误差的例子为第一矢量和第二矢量之间的距离。距离的定义没有限定,可以是曼哈顿距离、欧几里得距离及它们的变形等。使第一矢量和第二矢量的误差最小化的斜度系数矢量的例子为使第一矢量和第二矢量的误差最小的斜度系数矢量或在某搜索条件及搜索范围内使第一矢量和第二矢量的误差最小的斜度系数矢量等。
未使用比特区域例如可由被决定的未使用比特区域的标准位置(例如初始地址)和被输入的未使用比特数U进行确定。但是,可写入未使用比特区域的索引信息idx的比特数的上限为未使用比特数U。因此,不一定将所有的与行号码对应的索引信息idx写入未使用比特区域。于是,斜度计算部116例如将用可写入未使用比特区域的索引信息idx可识别的行号码的范围设定为搜索范围,选择行号码m’。换言之,斜度计算部116仅选择可写入未使用比特区域的索引信息idx表示的行号码m’。即,斜度计算部116仅选择可用分配给与矢量量化索引对应的码用的比特数中实际上未用于与矢量量化索引对应的码的比特数表现的索引信息idx可识别的行号码m’。例如,斜度计算部116从用可写入未使用比特区域的索引信息idx可识别的mMAX种类的行号码m=0、…、mMAX-1中确定如下的行号码m’,将与行号码m’对应的索引信息idx写入未使用比特区域。
[数6]
另外,||·||为·的模,argminm||·||是指将使||·||为最小的m设定为m’,argminm是指argmin的下标的m,χ=[X(0),…,X(C0-1)]、χ^=[X^(0),…,X^(C0-1)],Am是指以与如下的行号码m对应的斜度系数矢量γm=[γm(0),…,γm(C0-1)]作为对角分量的对角行列。
[数7]
如上所述的索引信息idx的比特数,为从分配给与矢量量化索引对应的 码用的比特数中减去实际用于与矢量量化索引对应的码的比特数而得到的数以下。由以上可知,仅使用未使用比特区域就可传送索引信息idx。
[步骤E4的具体例]
该例的斜度计算部116进行图3中记载的各处理,将表示选择的斜度系数矢量的行号码的索引信息idx写入未使用比特区域。在C0为L的情况下,在每帧执行图3的步骤E4的处理,在C0为1及L以外的L的公约数的情况下,对一帧中的各子带反复执行图3的步骤E4的处理。
斜度计算部116对输入的未使用比特数U和0进行比较(步骤E40),若不是U>0,则如以下所示,斜度计算部116不更新输入的多个量化值X^(0)、…、X^(C0-1),而结束步骤E4的处理(步骤E412)。
[数8]
若U>0,则斜度计算部116通过设m=0、idx=0将m及idx的值初始化(步骤E41),进入步骤E42。
在步骤E42中,斜度计算部116使用未使用比特数U,作为搜索范围决定用可写入未使用比特区域的索引信息idx可识别的行号码的范围,确定用于确定该搜索范围(行号码的范围)的搜索范围特定值mMAX。换言之,斜度计算部116求出确定用可写入未使用比特区域的索引信息idx可识别的行号码的种类的mMAX(步骤E42)。
通常,用未使用比特数U的比特可识别2U种行号码。因此,也可以将2U种行号码的范围作为搜索范围。但是,在该具体例中,将表示“不进行使用斜度系数矢量γm ’的修正”的值分配给索引信息idx可取的值之一,并将用剩余的2U-1个值可识别的2U-1种行号码作为搜索范围。搜索范围(行号码的范围)和mMAX的关系需要预先决定。该具体例的mMAX为1以上2U-1以下且MMAX以下的整数,搜索范围为行号码0、…、mMAX-1。斜度计算部116例如通过下面的式求出mMAX。
mMAX=max[min{2U-1,MMAX},1]
斜度计算部116进行以下的式所表示的计算(步骤E43)。
[数9]
斜度计算部116对m和mMAX进行比较(步骤E44),若m<mMAX,则斜度计算部116如下计算e(步骤E45),对eMIN和e进行比较(步骤E46),若不是eMIN>e,则斜度计算部116使m增值1(步骤E48),进入步骤E44。
[数10]
若eMIN>e,则斜度计算部116通过设idx=m+1及eMIN=e,更新idx及eMIN(步骤E47),使m增值1(步骤E48),进入步骤E44。
另一方面,在步骤E44中判定为不是m<mMAX的情况下,斜度计算部116向未使用比特区域写入idx(步骤E49)。该例的斜度计算部116设定为解码装置12可基于mMAX确定所需的idx配置于未使用比特区域的哪个位置。例如,由mMAX决定在未使用比特区域中的idx的储存位置。
接着,斜度计算部116判定是否为idx>0(是否为idx=0)(步骤E410)。若idx>0(不是idx=0),斜度计算部116对作为局部解码值的多个量化值X^(b·C0)、…、X^((b+1)·C0-1)如下进行更新(步骤E411),结束步骤E4的处理。
[数11]
若不是idx>0(为idx=0),则如以下所示,斜度计算部116不更新作为局部解码值的多个量化值X^(b·C0)、…、X^((b+1)·C0-1)(步骤E412),结束步骤E4的处理。
[数12]
其中,C0为L时b=0。在C0为1及L以外的L的公约数的情况下,b为与一帧中的各子带对应的整数0、…、(L/C0)-1的任何一个,例如为与最低的频率的子带对应的整数0([步骤E4的具体例]的说明结束)。
与包含矢量量化索引和写入未使用比特区域的索引信息idx的修正后矢量量化索引对应的码(比特流)被传送到解码装置12。
(解码处理)
解码装置12执行图4示例的解码方法的各步骤。
归一化值解码部121求出与输入解码装置12的归一化值量化索引对应的解码归一化值τX-(步骤D1)。解码归一化值τX-被传送到矢量解码部122。
在未图示的编码本存储部存储有与多个归一化值量化索引的每个对应的归一化值。归一化值解码部121以输入的归一化量化索引为关键并参照其编码本存储部,取得与该归一化量化索引对应的归一化值,作为解码归一化值τX -。
矢量解码部122求出与输入解码装置12的修正后矢量量化索引包含的矢量量化索引对应的多个值并将其作为多个解码值X^(k)。另外,矢量解码部122使用矢量量化索引计算未使用比特数U(步骤D2)。
在本方式中,在未图示的矢量编码本存储部存储有与多个矢量量化索引的每个对应的量化代表矢量。矢量解码部122以与输入的矢量量化索引对应的量化代表矢量为关键并参照该矢量编码本存储部,取得与该矢量量化索引对应的量化代表矢量。矢量解码部122输出用量化归一化值τX-将量化代表矢量的分量X(k)’逆归一化后所得的解码值X^(k)。例如矢量解码部122将X(k)’和τX-的相乘值作为解码值X^(k)而输出。
另外,矢量解码部122计算分配给矢量量化用的比特中、实际的矢量量化中未使用的比特的比特数,作为未使用比特数U。在本方式的例子中,在每一帧(每L个样本)计算未使用比特数U。例如,矢量解码部122将从分配给处理对象的帧中的矢量量化用的比特数中,减去与该帧对应的矢量量化索引的比特数的总数后所得的值作为未使用比特数U。
解码值X^(k)及未使用比特数U被传送至斜度校正部124。
斜度校正部124将与编码装置11中使用的相同的倾斜矩阵γ(参照式(1))保持在例如未图示的存储部。斜度校正部124从输入解码装置12的修正后矢量量化索引包含的未使用比特区域读出索引信息idx,使用idx表示的行号码m’的斜度系数矢量γm ’的各要素γm ’(k)(k=0,…,C0-1),对C0个解码值X^(k)(k=0,…,C0-1)进行修正。换言之,斜度校正部124使用将以多个斜度系数γm(k)为要素的斜度系数矢量γm作为行矢量的倾斜矩阵γ中的索引信息idx表示的行号码m’的斜度系数矢量γm ’的各要素γm ’(k),对多个解码值X^(k)进行修正(步骤D3)。例如,斜度校正部124将索引信息idx表示的行号码m’的斜度系数矢量γm ’的要素γm ’(k)和解码值X^(k)的相乘值作为解码值X^(k)的修正值X^UD(k)。斜度校正部124输出修正值X^UD(k)。即,斜度校正部124使用输入的索引信息idx表示的、与多个样本位置相对应的预定的系数γm ’(k)的组,输出将与各样本位置相对应的解码值X^(k)和系数γm ’(k)相乘的值。
[步骤D3的具体例]
该例的斜度校正部124进行图5中记载的各处理,对解码值X^(k)进行修正。
斜度校正部124对输入的未使用比特数U和0进行比较(步骤D30),若不是U>0,则如以下所示,斜度计算部116不更新输入的多个量化值X^(0)、…、X^(C0-1)(步骤D36),结束步骤D3的处理。
[数13]
若U>0,则斜度校正部124通过和上述的步骤E42相同的方法设定mMAX(步骤E32)。斜度校正部124例如由以下的式求出mMAX。
mMAX=max[min{2U-1,MMAX},1]
斜度校正部124基于mMAX从修正后矢量量化索引的未使用比特区域读入索引信息idx(步骤D33)。例如,斜度校正部124基于mMAX确定索引信息idx的储存位置,读入索引信息idx。
斜度校正部124判定是否为idx>0(是否为idx=0)(步骤D34)。若idx>0(不是idx=0),则斜度校正部124对多个解码值X^(b·C0)、…、X^((b+1)·C0-1)如下进行更新(步骤D35),结束步骤D3的处理。
[数14]
若不是idx>0(为idx=0),则如以下所示,斜度校正部124不对多个解码值X^(b·C0)、…、X^((b+1)·C0-1)进行更新(步骤D36),结束步骤D3的处理。
[数15]
以上结束[步骤D3的具体例]的说明。
在需要时域中的解码信号的情况下,从斜度校正部124输出的修正值X^ UD(k)被输入时域转换部125,时域转换部125将X^UD(k)例如通过傅里叶反变换而转换成时域信号z(n)输出。
(本方式的特征)
这样,在本方式中,由于解码装置12使用在编码装置11中选择的斜度系数矢量对多个解码值X^(k)进行修正,因此能够减轻基于量化误差的音乐噪声等。
另外,在本方式中,将以彼此具有相关性的斜度系数γm(0)、…、γm(C0-1)为要素的矢量作为斜度系数矢量γm。例如将以偏向(k,γm(k))平面上的直线或特定的曲线而分布的多个斜度系数γm(0)、…、γm(C0-1)为要素的矢量作为斜度系数矢量γm。声音信号或音响信号等输入信号的包络线,大多形成直线或曲线,通过使用反映这种输入信号的特性的斜度系数矢量γm,
可抑制索引信息idx的信息量,同时可高精度地修正量化误差。在图6的例子的情况下,k越大,k=0,…,63下的输入信号的大小|X(k)|越小。因此,通过使用以偏向(k,γm(k))平面上的斜度为负的直线而分布的斜度系数γm(0)、…、γm(63)为要素的斜度系数矢量γm对|X(0)|,…,|X(63)|进行修正,可减小其与量化值的大小|X^(0)|、…、|X^(63)|的误差。这样,通过对每子带使用适于输入信号的特性的斜度系数矢量γm能够有效地削减量化误差。
另外,用于特定在编码装置11中选择的斜度系数矢量γm ’的索引信息idx有效利用未使用比特区域被传送,因此,不需要用于传送索引信息idx的附加区域。
变形例:
另外,本发明不限定于上述的实施方式。例如,在解码装置12包含平滑化部126的情况下,平滑化部126将在步骤D3(图4)中获得的修正值X^UD(k)作为输入,在与修正值X^UD(k)相比过去的修正值X^UD(k)’不为0的情况下,将过去的修正值X^UD(k)’和修正值X^UD(k)加权相加的值作为平滑化值X^POST(k)输出。在X^UD(k)’为0的情况下,平滑化部126不进行修正值的加权相加即修正值的平滑化,而是将X^UD(k)作为X^POST(k)输出(图4/步骤D4)。过去的修正值X^UD(k)’的例子是在与修正值X^UD(k)对应的帧的过去一帧的步骤D3中获得的修正值、或在与修正值X^ UD(k)对应的帧的过去一帧的步骤D4中获得的平滑化值等。
X^POST(k)如下式表示。α和β为调节系数,根据要求的性能及规格适当决定。例如,α=0.85,β=0.15。α,β也可以根据所要求的性能及规格适当变更。表示·的正负码。
[数16]
由此,能够减轻因X^UD(k)的幅度特性的时间轴方向的不连续性产生的音乐噪声等。需要在时域的解码信号的情况下,从平滑化部126输出的X^ POST(k)向时域转换部125输入,时域转换部125将X^POST(k)例如通过傅里叶反变换转换成时域信号z(n)输出。
另外,输入信号X(k)无需为频域信号,可以为时域信号等任意的信号。即,该发明能够用于对频域信号以外的任意信号的编码、解码。在该情况下,与同一行号码m对应的各斜度系数γm(0)、…、γm(C0-1),设定为偏向例如采用k(与对应于乘以斜度系数γm(k)的量化值X^(k)的时间相对应的值,换言之,与对应于斜度系数γm(k)的时间相对应的值)为第一轴、采用γm(k)(斜度系数的值)为第二轴的(k,γm(k))平面上的直线或特定的曲线而分布。更具体地说,例如与同一行号码m对应的各斜度系数γm(0)、…、γm(C0-1)位于(k,γm(k))平面上的直线上或特定的曲线上。另外,在该变形例中,k为与离散时间对应的离散时间号码,“样本X(k)各自的位置”为与离散时间号码k对应的时间轴上的位置。在为k离散时间号码的情况下,k的值越大对应的时间越晚。
另外,也可以对每帧决定对于输入信号X(k)的归一化值FGAIN,矢量量化部115使用用归一化值FGAIN将X(k)归一化的值代替输入信号的各样本的值X(k),且使用用归一化值FGAIN将τX-归一化的值代替量化归一化值 τX-,执行步骤E3的处理。例如,也可以是X(k)被置换为X(k)/FGAIN, τX-被置换为τX-/FGAIN,也可以执行步骤E3的处理。另外,在该情况下,不存在归一化值计算部112,向归一化值量化部113输入用归一化值FGAIN将X(k)归一化的值而代替量化归一化值τX-。在该情况下,矢量量化部115也 可以使用用归一化值FGAIN将X(k)归一化的值的量化值,代替量化归一化值τX-进行步骤E3的处理。归一化值量化索引也可以是与用归一化值FGAIN归一化的值的量化值对应的索引。
另外,在上述实施方式中,编码装置11的斜度计算部116判定是否为idx>0,若idx>0,则对多个量化值X^(b·C0)、…、X^((b+1)·C0-1)进行更新,若不是idx>0则不进行更新(图3/步骤E410~E412)。另外,解码装置12的斜度校正部124判定是否为idx>0,若idx>0,则对多个量化值X^(b·C0)、…、X^((b+1)·C0-1)进行更新,若不是idx>0则不进行更新(图5/步骤D34~D36)。作为这些变形,在式(1)所示的倾斜矩阵γ上附加仅由1的要素构成的行号码m=-1的行矢量(斜度系数矢量)γ- 1=[γ- 1(0),…,γ- 1(C0-1)]=[1,…,1],与是否为idx>0无关,斜度计算部116及斜度校正部124也可以进行如下的运算。
[数17]
另外,示例的行号码m及索引信息idx的具体的数值不限定本发明,示例的m及idx的号码可以提前,也可以往后错,一部分号码也可以不使用。
另外,在上述的实施方式中,表示了将索引信息idx储存于未使用比特数U的未使用比特区域的例子,但也可以为索引信息idx不储存于未使用比特区域的方式。
另外,上述的各种处理,不仅可以按照记载以时间序列执行,而且可以根据执行处理的装置的处理能力或根据需要并列或单独地执行。另外,不用说,在不脱离本发明的主旨的范围可进行适当变更。
硬件、程序及记录介质:
上述的编码装置11及解码装置12,例如由包括CPU(central processing unit)或RAM(random-access memory)等的公知或专用的计算机和记述有上述的处理内容的特别的程序构成。在该情况下,特别的程序被读入CPU,CPU执行特别的程序,由此来实现各功能。另外,特别的程序可以由单一的程序列构成,也可以读出其它程序或程序库而实现目标功能。
这种程序能够事先记录于用计算机可读取的记录介质。作为用计算机可读取的记录介质,例如可以为磁记录装置、光盘、光磁记录介质、半导体存 储器等。用计算机可读取的记录介质的例子为非暂时性(non-transitory)记录介质。程序的流通例如通过出售、转让、出借记录有该程序的DVD、CD-ROM等便携式记录介质而进行。另外,也可以事先将程序储存于服务器计算机的存储装置中,经由网络,将该程序从服务器计算机转送到其它的计算机,由此使程序流通。
执行这种程序的计算机,例如首先将记录于便携式记录介质的程序或从服务器计算机转送的程序暂且储存于自己的存储装置。而且,在执行处理时,该计算机读取储存于自己的记录介质的程序,执行按照读取的程序的处理。另外,作为该程序的另一执行方式,也可以是,计算机从便携式记录介质直接读取程序,执行按照该程序的处理,进而,也可以是,每从服务器计算机向该计算机转送程序时,逐次执行按照接受的程序的处理。
另外,编码装置11及解码装置12的处理部的至少一部分也可以为特别的集成电路。
符号说明
11编码装置
111频域转换部
112归一化值计算部
113归一化值量化部
115矢量量化部
116斜度计算部
12解码装置
121归一化值解码部
122矢量解码部
124斜度校正部
125时域转换部
126平滑化部
Claims (14)
1.一种编码方法,其具有:
矢量量化步骤,集中多个样本并进行矢量量化,求出矢量量化索引和所述多个样本各自的量化值;以及
系数组选择步骤,输出索引信息,该索引信息表示多组与所述样本各自的位置相对应的预定的斜度系数的组中、使所述样本的值与将所述样本的量化值和与所述样本各自的位置相对应的斜度系数相乘的值之间的误差对于所有的所述样本的位置的和为最小的斜度系数的组,
所述样本的位置是与离散频率对应的频率轴上的位置、或者是与离散时间对应的时间轴上的位置,
所述斜度系数的组由处于平面上的直线上的系数构成,或者由偏向平面上的直线或特定的曲线而分布的系数构成,所述平面采用与对应于所述斜度系数所对应的样本的位置的时间或频率相对应的值作为第一轴,采用所述斜度系数的值作为第二轴。
2.根据权利要求1的编码方法,其中,
所述斜度系数的组由处于所述平面上的直线上的系数构成,
所述多组系数的组在所述平面上分别具有不同的斜率。
3.根据权利要求1的编码方法,其中,
所述斜度系数的组由偏向所述平面上的直线或特定的曲线而分布的系数构成,
所述多组斜度系数的组偏向与所述平面上的第一轴不平行的直线或特定的曲线而分布。
4.根据权利要求1~3中任一项的编码方法,其中,
所述系数组选择步骤输出的索引信息的比特数,为从分配用于与矢量量化索引对应的码的比特数中减去实际用于与所述矢量量化索引对应的码的比特数而得到的数以下。
5.一种解码方法,其具有:
矢量解码步骤,求出与输入的矢量量化索引对应的多个值,作为与多个样本位置相对应的解码值;以及
系数乘法步骤,使用输入的索引信息表示的与所述多个样本位置相对应的预定的斜度系数的组,输出与所述各样本位置相对应的、所述解码值和所述斜度系数相乘的值,
所述样本位置是与离散频率对应的频率轴上的位置、或者是与离散时间对应的时间轴上的位置,
所述斜度系数的组由处于平面上的直线上的系数构成,或者由偏向平面上的直线或特定的曲线而分布的系数构成,所述平面采用与对应于所述斜度系数所对应的样本的位置的时间或频率相对应的值作为第一轴,采用所述斜度系数的值作为第二轴。
6.根据权利要求5的解码方法,其中,
所述斜度系数的组由处于所述平面上的直线上的系数构成,
所述多组系数的组在所述平面上分别具有不同的斜率。
7.根据权利要求5的解码方法,其中,
所述斜度系数的组由偏向所述平面上的直线或特定的曲线而分布的系数构成,
所述多组斜度系数的组偏向与所述平面上的第一轴不平行的直线或特定的曲线而分布。
8.一种编码装置,其具有:
矢量量化部,集中多个样本并进行矢量量化,求出矢量量化索引和所述多个样本各自的量化值;以及
系数组选择部,输出索引信息,该索引信息表示多组与所述样本各自的位置相对应的预定的斜度系数的组中、使所述样本的值与将所述样本的量化值和与所述样本各自的位置相对应的斜度系数相乘的值之间的误差对于所有的所述样本的位置的和为最小的系数的组,
所述样本的位置是与离散频率对应的频率轴上的位置、或者是与离散时间对应的时间轴上的位置,
所述斜度系数的组由处于平面上的直线上的系数构成,或者由偏向平面上的直线或特定的曲线而分布的系数构成,所述平面采用与对应于所述斜度系数所对应的样本的位置的时间或频率相对应的值作为第一轴,采用所述斜度系数的值作为第二轴。
9.根据权利要求8的编码装置,其中,
所述斜度系数的组由处于所述平面上的直线上的系数构成,
所述多组系数的组在所述平面上分别具有不同的斜率。
10.根据权利要求8的编码装置,其中,
所述斜度系数的组由偏向所述平面上的直线或特定的曲线而分布的系数构成,
所述多组斜度系数的组偏向与所述平面上的第一轴不平行的直线或特定的曲线而分布。
11.根据权利要求8~10中任一项的编码装置,其中,
所述系数组选择步骤输出的索引信息的比特数,为从分配用于与矢量量化索引相对应的码的比特数中减去实际用于与所述矢量量化索引相对应的码的比特数而得到的数以下。
12.一种解码装置,其具有:
矢量解码部,求出与输入的矢量量化索引相对应的多个值,作为与多个样本位置相对应的解码值;以及
系数乘法部,使用输入的索引信息表示的与所述多个样本位置相对应的预定的斜度系数的组,输出与所述各样本位置相对应的、所述解码值和所述斜度系数相乘的值,
所述样本位置是与离散频率对应的频率轴上的位置、或者是与离散时间对应的时间轴上的位置,
所述斜度系数的组由处于平面上的直线上的系数构成,或者由偏向平面上的直线或特定的曲线而分布的系数构成,所述平面采用与对应于所述斜度系数所对应的样本的位置的时间或频率相对应的值作为第一轴,采用所述斜度系数的值作为第二轴。
13.根据权利要求12的解码装置,其中,
所述斜度系数的组由处于所述平面上的直线上的系数构成,
所述多组斜度系数的组在所述平面上分别具有不同的斜率。
14.根据权利要求12的解码装置,其中,
所述斜度系数的组由偏向所述平面上的直线或特定的曲线而分布的系数构成,
所述多组斜度系数的组偏向与所述平面上的第一轴不平行的直线或特定的曲线而分布。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010152970 | 2010-07-05 | ||
JP2010-152970 | 2010-07-05 | ||
PCT/JP2011/065275 WO2012005211A1 (ja) | 2010-07-05 | 2011-07-04 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102959871A CN102959871A (zh) | 2013-03-06 |
CN102959871B true CN102959871B (zh) | 2016-09-21 |
Family
ID=45441190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180031929.5A Active CN102959871B (zh) | 2010-07-05 | 2011-07-04 | 编码方法、解码方法、编码装置、解码装置、程序及记录介质 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9319645B2 (zh) |
EP (1) | EP2571170B1 (zh) |
JP (1) | JP5325340B2 (zh) |
CN (1) | CN102959871B (zh) |
CA (1) | CA2803273A1 (zh) |
ES (1) | ES2588745T3 (zh) |
WO (1) | WO2012005211A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2768090T3 (es) * | 2014-03-24 | 2020-06-19 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
ES2761681T3 (es) * | 2014-05-01 | 2020-05-20 | Nippon Telegraph & Telephone | Codificación y descodificación de una señal de sonido |
US9699461B2 (en) * | 2015-08-14 | 2017-07-04 | Blackberry Limited | Scaling in perceptual image and video coding |
CN111656445B (zh) * | 2017-10-27 | 2023-10-27 | 弗劳恩霍夫应用研究促进协会 | 解码器处的噪声衰减 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3087814B2 (ja) * | 1994-03-17 | 2000-09-11 | 日本電信電話株式会社 | 音響信号変換符号化装置および復号化装置 |
CN1275228A (zh) * | 1998-08-21 | 2000-11-29 | 松下电器产业株式会社 | 多模式语音编码装置及解码装置 |
WO2009093714A1 (ja) * | 2008-01-24 | 2009-07-30 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2088082C (en) | 1992-02-07 | 1999-01-19 | John Hartung | Dynamic bit allocation for three-dimensional subband video coding |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
JP3186007B2 (ja) | 1994-03-17 | 2001-07-11 | 日本電信電話株式会社 | 変換符号化方法、復号化方法 |
US5864798A (en) * | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6968092B1 (en) * | 2001-08-21 | 2005-11-22 | Cisco Systems Canada Co. | System and method for reduced codebook vector quantization |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US20060089836A1 (en) * | 2004-10-21 | 2006-04-27 | Motorola, Inc. | System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization |
ATE522901T1 (de) * | 2008-07-11 | 2011-09-15 | Fraunhofer Ges Forschung | Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
-
2011
- 2011-07-04 JP JP2012523858A patent/JP5325340B2/ja active Active
- 2011-07-04 CA CA2803273A patent/CA2803273A1/en not_active Abandoned
- 2011-07-04 US US13/807,156 patent/US9319645B2/en active Active
- 2011-07-04 EP EP11803545.0A patent/EP2571170B1/en active Active
- 2011-07-04 ES ES11803545.0T patent/ES2588745T3/es active Active
- 2011-07-04 CN CN201180031929.5A patent/CN102959871B/zh active Active
- 2011-07-04 WO PCT/JP2011/065275 patent/WO2012005211A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3087814B2 (ja) * | 1994-03-17 | 2000-09-11 | 日本電信電話株式会社 | 音響信号変換符号化装置および復号化装置 |
CN1275228A (zh) * | 1998-08-21 | 2000-11-29 | 松下电器产业株式会社 | 多模式语音编码装置及解码装置 |
WO2009093714A1 (ja) * | 2008-01-24 | 2009-07-30 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体 |
Non-Patent Citations (2)
Title |
---|
"A pitch synchronous innovation CELP (PSI-CELP) coder for 2-4 kbits";Satoshi Miki等;《Acoustics, Speech, and Signal Processing》;19940422;第II/113 - II/116页 * |
"single stage spectral quantization at 20 bits";Hedelin Per;《Acoustics, Speech, and Signal Processing》;19940422;第I/525 - I/528页 * |
Also Published As
Publication number | Publication date |
---|---|
ES2588745T3 (es) | 2016-11-04 |
EP2571170A4 (en) | 2014-09-03 |
JP5325340B2 (ja) | 2013-10-23 |
US20130101049A1 (en) | 2013-04-25 |
EP2571170A1 (en) | 2013-03-20 |
CA2803273A1 (en) | 2012-01-12 |
US9319645B2 (en) | 2016-04-19 |
EP2571170B1 (en) | 2016-06-01 |
CN102959871A (zh) | 2013-03-06 |
JPWO2012005211A1 (ja) | 2013-09-02 |
WO2012005211A1 (ja) | 2012-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8190425B2 (en) | Complex cross-correlation parameters for multi-channel audio | |
US9105271B2 (en) | Complex-transform channel coding with extended-band frequency coding | |
US9171550B2 (en) | Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method | |
US7953604B2 (en) | Shape and scale parameters for extended-band frequency coding | |
TWI380602B (en) | Apparatus and method for encoding an information signal | |
US8447591B2 (en) | Factorization of overlapping tranforms into two block transforms | |
CN101925950A (zh) | 音频编码器和解码器 | |
CN102959871B (zh) | 编码方法、解码方法、编码装置、解码装置、程序及记录介质 | |
CN103460287A (zh) | 编码方法、解码方法、编码装置、解码装置、程序、记录介质 | |
KR20190040063A (ko) | 인덱스 코딩 및 비트 스케줄링을 갖는 양자화기 | |
CN102812642A (zh) | 编码方法、解码方法、装置、程序及记录介质 | |
CN110491398B (zh) | 编码方法、编码装置以及记录介质 | |
CN102959623B (zh) | 编码方法、解码方法、编码装置、解码装置、程序及记录介质 | |
CN102959872A (zh) | 编码方法、解码方法、装置、程序及记录介质 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
WO2011021238A1 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JP3557164B2 (ja) | オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体 | |
JP2011009868A (ja) | 符号化方法、復号方法、符号化器、復号器およびプログラム | |
CN101345530B (zh) | 一种矢量量化方法及矢量量化器 | |
Zhang et al. | High-Fidelity Diffusion-Based Audio Codec | |
WO2011045927A1 (ja) | 符号化装置、復号装置およびこれらの方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |