[go: up one dir, main page]

CN102292769A - 一种立体声编码方法和装置 - Google Patents

一种立体声编码方法和装置 Download PDF

Info

Publication number
CN102292769A
CN102292769A CN2009801545991A CN200980154599A CN102292769A CN 102292769 A CN102292769 A CN 102292769A CN 2009801545991 A CN2009801545991 A CN 2009801545991A CN 200980154599 A CN200980154599 A CN 200980154599A CN 102292769 A CN102292769 A CN 102292769A
Authority
CN
China
Prior art keywords
frame
stereophonic signal
delay
current
adjustment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801545991A
Other languages
English (en)
Other versions
CN102292769B (zh
Inventor
吴文海
郎玥
苗磊
刘泽新
胡晨
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN102292769A publication Critical patent/CN102292769A/zh
Application granted granted Critical
Publication of CN102292769B publication Critical patent/CN102292769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

提供一种立体声编码的方法和装置。立体声编码的方法包括:提取立体声信号的当前声道间延时和与当前声道间延时相邻的上一延时(21);当前延时和上一延时不同时,则根据当前立体声信号特性进行调整帧判断(22);如果判断当前延时所在帧为调整帧时,则采用当前声道间延时对立体声信号进行延时调整(23)。

Description

一种立体声编码方法和装置 技术领域
本发明涉及立体声技术领域, 尤其涉及一种立体声编码的方法和装置。 背景技术
立体声的目的是传递或重建某一个特定的声场, 给倾听者再现原声场的 声音和空间特性。 近年来由于计算机技术、 数字信号处理技术的发展, 以及 由于高清晰度电视声系统、 家用视听系统发展的需要, 使得立体声技术有了 较大的发展, 同时这也对立体声技术尤其编解码技术提出了更高的要求。
现有的立体声编码方法可以分成两类, 一类是早期的基于波形的立体声 编码。 第二类是当前较为常用的参数立体声编码。 在参数立体声编码中, 通 常并不是直接对左右声道信号进行编码, 而是将左右声道信号进行下混, 对 下混之后的信号进行编码, 并编码一些额外的边带信息。 在解码端通过下混 信号和这些边带信息来恢复立体声信号。
立体声信号质量的好坏, [艮大程度上取决于下混信号的质量。 左右两个 声道信号越同步, 在下混的过程中损失的信息就会越少。 而通常情况, 发声 物体相对录制左右声道的两个麦克来说会有距离的变动或者距离差, 这样必 然造成左右两路信号之间有一定的延时。 不能完全同步。 如果在下混时能将 该延时进行调整, 也就是使得左右声道信号能够同步, 则可以很大程度上提 升立体声合成信号的质量。
参见图 1 , 图 1为现有技术中立体声编码方法的流程示意图。 首先对左右 两路信号进行下釆样 4, 进行线性预测编码(Linear Predictive Coding, LPC ) 分析和 LPC滤波之后, 得到残差信号。 然后分别提取左右两路信号的延时, 如果连续两帧左右两路信号的延时不同, 则在进行下混之前进行延时调整。
在实现本发明过程中, 发明人研究发现:
由于延时调整过程中需要对左右声道信号进行叠接相加, 这个过程会引 入失真, 而且不同特性的立体声信号在进行叠接相加时会对帧间数据的不连 续产生不同的失真影响。 由于现有技术本身并不区分延时调整时立体声信号 的特性, 只要连续两帧的左右两路信号的延时不同就立即进行延时调整, 这 时就有可能会带来非常严重的失真。 发明内容
本发明实施例提供一种立体声编码的方法和装置, 能够减少延时调整带 来的失真。
具体的, 本发明的一个实施例提供了一种立体声编码的方法, 包括: 提 取立体声信号的当前声道间延时和与所述当前声道间延时相邻的上一延时; 所述当前延时和所述上一延时不同时, 则根据当前立体声信号特性进行调整 帧判断; 如果判断所述当前延时所在帧为调整帧时, 则釆用所述当前声道间 延时对立体声信号进行延时调整。
本发明的另一个实施例提供了一种立体声编码的装置, 包括: 提取延时 单元, 用于获取立体声信号的当前声道间延时和与所述当前声道间延时相邻 的上一延时; 判断单元, 用于所述获取延时单元获取的当前延时和所述上一 延时不同时, 根据当前立体声信号特性进行调整帧判断; 延时调整单元, 用 于在所述判断单元判断所述当前延时所在帧为调整帧时, 釆用所述当前声道 间延时对立体声信号进行延时调整。
通过上述技术方案的描述可知, 通过提取立体声信号的当前声道间延时 和与所述当前声道间延时相邻的上一延时 , 在当前延时和所述上一延时不同 时, 根据当前立体声信号特性进行调整帧判断, 并仅在当前延时所在帧判断 为调整帧时, 釆用所述当前声道间延时对立体声信号进行延时调整, 使得延 时在适合进行调整的时候才进行调整, 从而能够减少延时调整带来的失真。 附图说明 施例或现有技术描述中所需要使用的附图作一简单地介绍, 显而易见地, 下 面描述中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为现有技术中立体声编码方法的流程示意图;
图 2为本发明实施例提供的一种立体声编码方法的流程图;
图 3为本发明实施例提供的一种立体声编码方法的流程示意图; 图 4为本发明实施例提供的一个声道内确定清浊音的流程图;
图 5为本发明实施例提供的一种立体声编码装置的结构示意图。 具体实施方式
为使本发明的目的、 技术方案、 及优点更加清楚明白, 下面结合附图并 举实施例, 对本发明提供的技术方案进一步详细描述。 显然, 所描述的实施 例仅仅是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施 例, 本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实 施例, 都属于本发明保护的范围。
参见图 2, 本发明实施例提供的一种立体声编码的方法, 包括:
步骤 21 , 提取立体声信号的当前声道间延时和与所述当前声道间延时相 邻的上一延时;
步骤 22, 所述当前延时和所述上一延时不同时, 则根据当前立体声信号 特性进行调整帧判断;
步骤 23 , 如果判断所述当前延时所在帧为调整帧时, 则釆用所述当前声 道间延时对立体声信号进行延时调整。
本发明实施例提供的立体声编码的方法, 通过提取立体声信号的当前声 道间延时和与所述当前声道间延时相邻的上一延时, 在当前延时和所述上一 延时不同时, 根据当前立体声信号特性进行调整帧判断, 并仅在当前延时所 在帧判断为调整帧时, 釆用所述当前声道间延时对立体声信号进行延时调整, 使得延时在适合进行调整的时候才进行调整, 从而能够减少延时调整带来的 失真。
参见图 3 , 本发明实施例提供的一种立体声编码方法流程示意图, 与现有 技术相比, 也是首先对左右两路信号进行下釆样 4, 进行 LPC分析和 LPC滤 波之后, 得到残差信号, 然后分别提取左右两路信号的延时, 如果连续两帧 左右两路信号的延时不同则在下混之前进行是否适合延时调整的判断。 当连 续两帧延时不同时, 在立体声需要进行延时调整的地方, 根据当前立体声信 号特性进行调整帧判断, 如果判断当前延时所在帧为调整帧时, 则釆用当前 声道间延时对立体声信号进行延时调整。
根据立体声信号特性进行调整帧判断本发明实施例提供如下几种判断方 法:
一种方法是, 根据立体声信号的类别进行判断。 该方法具体为在立体声 信号为清音帧或者静音帧时判断当前延时所在帧为调整帧; 在立体声信号为 浊音帧时判断当前延时所在帧为非调整帧。
参见图 4, 图 4所示为一个声道内确定清浊音的流程图。 该流程通过立体 声信号一个基音周期(pitch ) 的平均值、 最大值及过零率来判断信号的类别。 首先提取信号的基音周期, 初始化计数器 count为 0, 然后提取该基音周期内 的最大值和平均值, 将平均值与设定的平均值门限进行比较, 如果大于该平 均值门限就将 count+1 , 否则 count不变。 然后将该基音周期内的最大值与平 均值的比值与设定的比值门限进行比较, 如果大于该比值门限则 count+1 , 否 过零率门限则 count+1 , 否则 count不变。 最后比较 count是否大于 2, 如果大 于 2则判断为浊音, 否则判断成清音。
需要说明的是, 静音类别判断可以等同于清音来处理。 根据以上判断过 程, 在计算编程时可以在浊音帧时输出 1 , 而在清音帧或静音帧输出 0。
整个立体声信号的类别由左右两个声道信号的类别来确定。 只有当左右 声道信号类型同时为浊音时才判断该立体声信号为浊音。 另一种方法是, 根据立体声信号的能量进行判断。 该方法具体为: 在立 体声信号的帧能量小于某一设定的门限值时判断当前延时所在帧为调整帧; 在立体声信号的帧能量大于或等于所述某一设定的门限值时判断当前延时所 在帧为非调整帧。
再一种方法是, 根据立体声信号的类别和能量组合进行判断。 该方法具 体为: 在立体声信号为清音帧或者静音帧且立体声信号的帧能量小于某一设 定的门限值时, 判断当前延时所在帧为调整帧, 否则判断当前延时所在帧为 非调整帧。 或者, 在立体声信号为清音帧或者静音帧时, 或者立体声信号的 帧能量小于某一设定的门限值时, 判断当前延时所在帧为调整帧, 否则判断 当前延时所在帧为非调整帧。 别的限定。 比如, 对于背景噪声比较大的语音信号或者周期性不强的音乐信 号, 还可以釆用其它方法进行调整帧的判断。
参见图 5 , 本发明实施例还提供一种立体声编码的装置, 包括: 提取延时单元 51 , 用于获取立体声信号的当前声道间延时和与所述当前 声道间延时相邻的上一延时;
判断单元 52, 用于所述获取延时单元获取的当前延时和所述上一延时不 同时, 根据当前立体声信号特性进行调整帧判断;
延时调整单元 53 , 用于在所述判断单元判断所述当前延时所在帧为调整 帧时, 釆用所述当前声道间延时对立体声信号进行延时调整。
优选地, 所述判断单元 52包括如下任一模块:
类别判断模块, 用于根据立体声信号的类别进行调整帧判断;
能量判断模块, 用于根据立体声信号的能量进行调整帧判断;
类别能量判断模块, 用于根据立体声信号的类别和能量组合进行调整帧 判断。
具体地, 所述类别判断模块用于立体声信号为清音帧或者静音帧时判断当前延时 所在帧为调整帧, 立体声信号为浊音帧时判断当前延时所在帧为非调整帧。
所述能量判断模块用于立体声信号的帧能量小于某一设定的门限值时判 断当前延时所在帧为调整帧, 立体声信号的帧能量大于或等于所述某一设定 的门限值时判断当前延时所在帧为非调整帧。
所述类别能量判断模块用于立体声信号为清音帧或者静音帧且立体声信 号的帧能量小于某一设定的门限值时, 判断当前延时所在帧为调整帧, 否则 判断当前延时所在帧为非调整帧; 或者, 所述类别能量判断模块用于立体声 信号为清音帧或者静音帧时, 或者立体声信号的帧能量小于某一设定的门限 值时, 判断当前延时所在帧为调整帧, 否则判断当前延时所在帧为非调整帧。
当然, 判断单元并不局限于以上几种判断模块, 以上模块仅作为本发明 的优选实施例进行说明, 还可以釆用其他判断模块进行调整帧的判断, 本发 明并不做特别的限定。
本发明实施例提供的立体声编码的装置, 通过提取延时单元 51提取立体 声信号的当前声道间延时和与所述当前声道间延时相邻的上一延时 , 在当前 延时和所述上一延时不同时, 由判断单元 52根据当前立体声信号特性进行调 整帧判断, 并仅在当前延时所在帧判断为调整帧时, 由延时调整单元 53釆用 所述当前声道间延时对立体声信号进行延时调整, 使得延时在适合进行调整 的时候才进行调整, 从而能够减少延时调整带来的失真。
最后需要说明的是, 本领域普通技术人员可以理解实现上述实施例方法 中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成, 所 述的程序可存储于一计算机可读取存储介质中, 该程序在执行时, 可包括如 上述各方法的实施例的流程。 其中, 所述的存储介质可为磁碟、 光盘、 只读 存储记忆体 ( ROM )或随机存储记忆体 ( RAM )等。
本发明实施例中的各功能单元可以集成在一个处理模块中, 也可以是各 个单元单独物理存在, 也可以两个或两个以上单元集成在一个模块中。 上述 集成的模块既可以釆用硬件的形式实现, 也可以釆用软件功能模块的形式实 现。 所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售 或使用时, 也可以存储在一个计算机可读取存储介质中。 上述提到的存储介 质可以是只读存储器, 磁盘或光盘等。
上述具体实施例并不用以限制本发明, 对于本技术领域的普通技术人员 来说, 凡在不脱离本发明原理的前提下, 所作的任何修改、 等同替换、 改进 等, 均应包含在本发明的保护范围之内。

Claims (10)

  1. 权 利 要 求 书
    1、 一种立体声编码的方法, 其特征在于, 包括:
    提取立体声信号的当前声道间延时和与所述当前声道间延时相邻的上一延 时;
    所述当前延时和所述上一延时不同时, 则根据当前立体声信号特性进行调 整帧判断;
    如果判断所述当前延时所在帧为调整帧时, 则釆用所述当前声道间延时对 立体声信号进行延时调整。
  2. 2、 根据权利要求 1所述的方法, 其特征在于, 所述根据当前立体声信号特 性进行调整帧判断包括如下之一或组合:
    根据立体声信号的类别进行调整帧判断;
    或者, 根据立体声信号的能量进行调整帧判断。
  3. 3、 根据权利要求 2所述的方法, 其特征在于, 所述根据立体声信号的类别 进行调整帧判断具体为:
    立体声信号为清音帧或者静音帧时判断当前延时所在帧为调整帧; 立体声信号为浊音帧时判断当前延时所在帧为非调整帧。
  4. 4、 根据权利要求 2所述的方法, 其特征在于, 所述根据立体声信号的能量 进行调整帧判断具体为:
    立体声信号的帧能量小于某一设定的门限值时判断当前延时所在帧为调整 帧;
    立体声信号的帧能量大于或等于所述某一设定的门限值时判断当前延时所 在帧为非调整帧。
  5. 5、 根据权利要求 2所述的方法, 其特征在于, 所述根据立体声信号的类别 和能量组合进行调整帧判断具体为:
    立体声信号为清音帧或者静音帧且立体声信号的帧能量小于某一设定的门 限值时, 判断当前延时所在帧为调整帧, 否则判断当前延时所在帧为非调整帧; 或者, 立体声信号为清音帧或者静音帧时, 或者立体声信号的帧能量小于 某一设定的门限值时, 判断当前延时所在帧为调整帧, 否则判断当前延时所在 帧为非调整帧。
  6. 6、 一种立体声编码的装置, 其特征在于, 包括:
    提取延时单元, 用于获取立体声信号的当前声道间延时和与所述当前声道 间延时相邻的上一延时;
    判断单元, 用于所述获取延时单元获取的当前延时和所述上一延时不同时, 根据当前立体声信号特性进行调整帧判断;
    延时调整单元, 用于在所述判断单元判断所述当前延时所在帧为调整帧时, 釆用所述当前声道间延时对立体声信号进行延时调整。
  7. 7、 根据权利要求 6所述的装置, 其特征在于, 所述判断单元包括如下任一 模块:
    类别判断模块, 用于根据立体声信号的类别进行调整帧判断;
    能量判断模块, 用于根据立体声信号的能量进行调整帧判断;
    类别能量判断模块, 用于根据立体声信号的类别和能量组合进行调整帧判 断。
  8. 8、 根据权利要求 7所述的装置, 其特征在于,
    所述类别判断模块, 具体用于立体声信号为清音帧或者静音帧时判断当前 延时所在帧为调整帧, 立体声信号为浊音帧时判断当前延时所在帧为非调整帧。
  9. 9、 根据权利要求 7所述的装置, 其特征在于,
    所述能量判断模块, 具体用于立体声信号的帧能量小于某一设定的门限值 时判断当前延时所在帧为调整帧, 立体声信号的帧能量大于或等于所述某一设 定的门限值时判断当前延时所在帧为非调整帧。
  10. 10、 根据权利要求 7所述的装置, 其特征在于,
    所述类型能量判断模块, 具体用于立体声信号为清音帧或者静音帧且立体 声信号的帧能量小于某一设定的门限值时, 判断当前延时所在帧为调整帧, 否 则判断当前延时所在帧为非调整帧; 或者, 具体用于立体声信号为清音帧或者 静音帧时, 或者立体声信号的帧能量小于某一设定的门限值时, 判断当前延时 所在帧为调整帧, 否则判断当前延时所在帧为非调整帧。
CN2009801545991A 2009-02-13 2009-02-13 一种立体声编码方法和装置 Active CN102292769B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2009/070428 WO2010091555A1 (zh) 2009-02-13 2009-02-13 一种立体声编码方法和装置

Publications (2)

Publication Number Publication Date
CN102292769A true CN102292769A (zh) 2011-12-21
CN102292769B CN102292769B (zh) 2012-12-19

Family

ID=42561374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801545991A Active CN102292769B (zh) 2009-02-13 2009-02-13 一种立体声编码方法和装置

Country Status (4)

Country Link
US (1) US8489406B2 (zh)
EP (1) EP2395504B1 (zh)
CN (1) CN102292769B (zh)
WO (1) WO2010091555A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078123A1 (zh) * 2013-11-29 2015-06-04 华为技术有限公司 立体声相位参数的编码方法及装置
CN108431890A (zh) * 2015-12-18 2018-08-21 高通股份有限公司 多音频信号的编码
CN109215667A (zh) * 2017-06-29 2019-01-15 华为技术有限公司 时延估计方法及装置
CN111133509A (zh) * 2017-05-16 2020-05-08 华为技术有限公司 一种立体声信号处理方法及装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010091555A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
MY188370A (en) * 2015-09-25 2021-12-06 Voiceage Corp Method and system for decoding left and right channels of a stereo sound signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
US10074373B2 (en) 2015-12-21 2018-09-11 Qualcomm Incorporated Channel adjustment for inter-frame temporal shift variations
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
US10872611B2 (en) * 2017-09-12 2020-12-22 Qualcomm Incorporated Selecting channel adjustment method for inter-frame temporal shift variations

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US6377919B1 (en) * 1996-02-06 2002-04-23 The Regents Of The University Of California System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6865215B1 (en) * 2000-02-16 2005-03-08 Iowa State University Research Foundation, Inc. Spread spectrum digital data communication overlay system and method
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7358974B2 (en) * 2001-01-29 2008-04-15 Silicon Graphics, Inc. Method and system for minimizing an amount of data needed to test data against subarea boundaries in spatially composited digital video
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP2003243988A (ja) * 2002-02-20 2003-08-29 Tadahiro Omi データ処理装置
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7412376B2 (en) * 2003-09-10 2008-08-12 Microsoft Corporation System and method for real-time detection and preservation of speech onset in a signal
WO2006059567A1 (ja) * 2004-11-30 2006-06-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
KR101236259B1 (ko) * 2004-11-30 2013-02-22 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩하는 방법 및 장치
EP2138999A1 (en) * 2004-12-28 2009-12-30 Panasonic Corporation Audio encoding device and audio encoding method
US8036390B2 (en) * 2005-02-01 2011-10-11 Panasonic Corporation Scalable encoding device and scalable encoding method
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US8457319B2 (en) * 2005-08-31 2013-06-04 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
EP1953736A4 (en) * 2005-10-31 2009-08-05 Panasonic Corp STEREO CODING DEVICE AND STEREOSIGNAL PREDICTION PROCESS
WO2007091848A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
EP2013871A4 (en) * 2006-04-27 2011-08-24 Technologies Humanware Inc METHOD FOR TEMPORALLY NORMALIZING AN AUDIO SIGNAL
WO2007137232A2 (en) * 2006-05-20 2007-11-29 Personics Holdings Inc. Method of modifying audio content
CN1983909B (zh) * 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
KR101056325B1 (ko) * 2006-07-07 2011-08-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 복수의 파라미터적으로 코딩된 오디오 소스들을 결합하는 장치 및 방법
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
MX2008012246A (es) * 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
AU2007312598B2 (en) * 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP2010506232A (ja) * 2007-02-14 2010-02-25 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置
KR101411901B1 (ko) * 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
EP2201566B1 (en) * 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
WO2009081567A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
US8817992B2 (en) * 2008-08-11 2014-08-26 Nokia Corporation Multichannel audio coder and decoder
JP5602138B2 (ja) * 2008-08-21 2014-10-08 ドルビー ラボラトリーズ ライセンシング コーポレイション オ−ディオ及びビデオ署名生成及び検出のための特徴の最適化及び信頼性予測
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
US8504378B2 (en) * 2009-01-22 2013-08-06 Panasonic Corporation Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
WO2010091555A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
EP2413314A1 (en) * 2009-03-24 2012-02-01 Huawei Technologies Co., Ltd. Method and device for switching a signal delay
CN101848412B (zh) * 2009-03-25 2012-03-21 华为技术有限公司 通道间延迟估计的方法及其装置和编码器
CN102301748B (zh) * 2009-05-07 2013-08-07 华为技术有限公司 检测信号延迟的方法、检测装置及编码器
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
CN102157150B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078123A1 (zh) * 2013-11-29 2015-06-04 华为技术有限公司 立体声相位参数的编码方法及装置
US10008211B2 (en) 2013-11-29 2018-06-26 Huawei Technologies Co., Ltd. Method and apparatus for encoding stereo phase parameter
CN108431890A (zh) * 2015-12-18 2018-08-21 高通股份有限公司 多音频信号的编码
CN111133509A (zh) * 2017-05-16 2020-05-08 华为技术有限公司 一种立体声信号处理方法及装置
CN111133509B (zh) * 2017-05-16 2022-11-08 华为技术有限公司 一种立体声信号处理方法及装置
US11763825B2 (en) 2017-05-16 2023-09-19 Huawei Technologies Co., Ltd. Stereo signal processing method and apparatus
US12230283B2 (en) 2017-05-16 2025-02-18 Huawei Technologies Co., Ltd. Stereo signal processing method and apparatus
CN109215667A (zh) * 2017-06-29 2019-01-15 华为技术有限公司 时延估计方法及装置
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
US11304019B2 (en) 2017-06-29 2022-04-12 Huawei Technologies Co., Ltd. Delay estimation method and apparatus
US11950079B2 (en) 2017-06-29 2024-04-02 Huawei Technologies Co., Ltd. Delay estimation method and apparatus

Also Published As

Publication number Publication date
WO2010091555A1 (zh) 2010-08-19
EP2395504A4 (en) 2012-07-11
EP2395504B1 (en) 2013-09-18
EP2395504A1 (en) 2011-12-14
CN102292769B (zh) 2012-12-19
US20110301962A1 (en) 2011-12-08
US8489406B2 (en) 2013-07-16

Similar Documents

Publication Publication Date Title
CN102292769A (zh) 一种立体声编码方法和装置
US9552845B2 (en) Automatic generation of metadata for audio dominance effects
CN101253553B (zh) 解码音频信号的方法
CN106653036B (zh) 基于ott盒子的混音转码方法
CN1871856A (zh) 用于控制音频信号的播放的方法和装置
CN102768835A (zh) 用于编码和解码具有各种声道的多对象音频信号的设备和方法
CN101292428B (zh) 用于编码/解码的方法和装置
CN102436810A (zh) 一种基于信道模式噪声的录音回放攻击检测方法和系统
CN1941144B (zh) 数据记录和再现设备及方法
CN104078051A (zh) 一种人声提取方法、系统以及人声音频播放方法及装置
CN1213135A (zh) 高质量的音频编码/解码设备和数字通用盘
CN103050116A (zh) 语音命令识别方法及系统
CN113593601A (zh) 基于深度学习的视听多模态语音分离方法
US9153241B2 (en) Signal processing apparatus
CN102307323A (zh) 对多声道信号的声道延迟参数进行修正的方法
CN1941160B (zh) 音频播放模式自动选择装置及方法
CN118298827A (zh) 边缘智能语音识别方法及系统装置
CN107342877A (zh) 移动终端音频质量的测试方法及系统
CN116955693A (zh) 基于音视一致性感知的音视显著性检测方法
CN112233667B (zh) 基于深度学习的同期声识别方法
CN102414744A (zh) 数字信号再生装置以及数字信号压缩装置
KR100740807B1 (ko) 공간정보기반 오디오 부호화에서의 공간정보 추출 방법
US20240404512A1 (en) System and method to naturally join human talking sounds
JPH0854895A (ja) 再生装置
CN114944145B (zh) 一种声音复刻的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant