CN1244906C - 改变语音信号带宽的方法以及语音编码装置和解码装置 - Google Patents
改变语音信号带宽的方法以及语音编码装置和解码装置 Download PDFInfo
- Publication number
- CN1244906C CN1244906C CNB01809127XA CN01809127A CN1244906C CN 1244906 C CN1244906 C CN 1244906C CN B01809127X A CNB01809127X A CN B01809127XA CN 01809127 A CN01809127 A CN 01809127A CN 1244906 C CN1244906 C CN 1244906C
- Authority
- CN
- China
- Prior art keywords
- bandwidth
- frequency band
- branch
- change
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 61
- 230000008859 change Effects 0.000 claims abstract description 101
- 230000004044 response Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 19
- 230000001413 cellular effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims 3
- 239000002131 composite material Substances 0.000 claims 2
- 238000009499 grossing Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 11
- 238000005070 sampling Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000000254 damaging effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
语音编码或解码装置(711、721、811、821)包括语音信号输入端和多模式语音编码器(402)或解码器(411),用于对连接到语音信号输入端的语音信号进行编码或解码,其中的编码或解码模式可选用和第一带宽相关的第一编码或解码模式或者和第二带宽相关的第二编码或解码模式。所述装置包括具有输入端(IN)和输出端(OUT)的软带宽切换模块(401、412、500)。在语音编码装置中,输入端(IN)连接到语音信号输入端而输出端(OUT)连接到多模式语音编码器(402)。在解码装置中,输入端(IN)连接到多模式语音解码器(411)而输出端(OUT)是解码装置的输出端。软带宽切换模块(401、412、500)被配置为逐渐改变连接到多模式语音编码器或解码器的语音信号的带宽,作为对改变语音信号带宽的指令(421)的响应。
Description
技术领域
本发明一般涉及对通过电信连接传输的信号进行编码和解码的领域。具体地说,本发明涉及在电信连接过程中改变这种信号的信号带宽的过程。
背景技术
图1说明在数字蜂窝无线网络中将语音从第一终端向第二终端传送的一般原理。在第一终端100中,麦克风101、语音编码器102、信道编码器103、调制器104以及无线电发射机105串联在一起。在第一基站110中,无线电接收机111、解调器112、信道解码器113和线路发射机114串联在一起。从第一基站110到第二基站120存在网络连接115。第二基站110包括串联的线路接收机121、信道编码器122、调制器123以及无线电发射机124。在第二终端130中,无线电接收机131、解调器132、信道解码器133、语音解码器134和扬声器135串联在一起。
发送终端100中的语音编码器102采用某种语音编码方案,将来自麦克风101的模拟语音信号转变为数字信号。信道编码器103增加该数字信号的冗余,以便增强它在无线电接口处抗破坏影响的坚韧性。信道解码器113至少取消部分的信道解码,因为通过网络115的有线连接比无线连接可靠得多,而且过度的信道编码只会消耗网络中的传输容量。相应的信道编码122和信道解码133对位于第二无线电接口周围。语音解码器134采用与上述语音编码方案相反的方案将所述数字语音信号恢复为模拟信号。上述原理可以容易地概括为:通过用一般的数据源代替麦克风101,用源编码器代替语音编码器102,用对应的解码器代替语音解码器134,用一般的数据接收器代替扬声器135,从而在终端间传输任意信息。
编码和解码单元通常被称为编解码器。类似最初的GSM(全球移动电信系统),传统的数字蜂窝无线电系统的规范一般地定义了具有恒定的输出比特率并处理带宽恒定的语音(或源)信号的语音(或源)编解码器。传统的语音编解码器根据带宽被命名为窄带或宽带编解码器。例如,在编号为GSM06.10的GSM标准中描述的所谓RPE-LTP全速率语音编解码器就是一种窄带语音编解码器,它的带宽大约为3.5kHz。它的语音编码比特率是13kb/s,信道编码比特率为9.8kb/s,总和为22.8kb/s。代表性的宽带编解码器是那些由ITU(国际电信联盟)在名为G.722-64、G.722-56和G.722-48中标准化了的编解码器。它们的语音编码比特率分别为64、56和48kb/s,带宽大约为7kHZ。
最近对增强已知的语音(或源)编码的提议包括AMR或自适应多速率编码的概念。该思想为:让信道编码器103输出端的比特(或符号)速率保持恒定,但允许语音编码器102和信道编码器103在产生恒定比特率中的作用变化。这种语音编码器的输入带宽是恒定的(在GSMAMR中,带宽和在如上所述的基本GSM语音编解码器中一样为3.5kHZ),但是如果允许语音编码器每时间单位使用更多的比特,则可以取得更好的听觉质量。使用可用比特率的更大部分进行语音编码仅在噪声和干扰的破坏效应不是太坏时才是可能的。在接收端,AMR概念意味着在信道解码器133的输入端的比特(或符号)的速率为恒定,但信道解码器中消除的冗余量和语音解码器134中可用于重建原来的模拟语音信号的相应每时间单位的数字信息量可以发生变化。
在本专利申请的优先权日,即将采用已知的AMR语音编码原理进行未来用于GSM框架中的宽带或7kHz语音编解码器的标准化。可能在不久的将来,具有两种可选的语音(或源)带宽:3.5kHz和7kHz的通信设备将会投入使用。也可能定义更多的语音(或源)带宽。这些带宽可以和完全不同的编解码器结合,或者它们可只代表某种工作模式,被称为语音编码和解码装置的编解码模式或只是模式。应用AMR原理意味着,未来的语音(或源)编解码器可既有可选的带宽又有变化的比特率,其中后者通过将可用的总比特率在语音(或源)编码和信道编码之间作不同的分配而与不同的误差防护级别相关。
图2更详细地说明在已知的已定义了两种不同语音带宽的例示情况下,发射移动台中的语音编码器模块102和接收移动台中的语音解码器模块134的内容。这里对编码和解码概念作广义的理解,以便使例如模数转换(A/D)和数模转化(D/A)成为其中的部分。编码器102中的A/D转换器201既直接又通过向下采样模块203连接到切换模块202。切换模块203的输出连接到纯语音编码器204,该纯语音编码器能同时处理宽带和窄带输入信号。纯语音编码器204的输出和语音解码器模块134中相应的纯语音解码器220的输入之间的通信信道210一般包括:例如所有的信道编码/解码和发送/接收装置。纯语音解码器220能够同时对宽带和窄带语音信号进行解码,而且它的输出端既直接又通过向上采样模块222连接到切换模块221。切换模块221的输出端连接到语音合成器和D/A转换器223。
编码器模块102中的A/D转换器201和解码器模块134中的D/A转换器223都处理对所定义的最宽语音带宽足够高的采样速率。向下采样模块203通过收缩、滤波或者内插,将A/D转换器201产生的采样流的采样速率减小到更低的水平,而向上采样模块222通过一些计算装置将纯语音解码器220产生的采样流的采样速率提高到更高的水平。作为对带宽改变命令的响应,语音编码器204和解码器220切换到对应于新带宽的编码和解码程序,同时切换模块203和221要么选择直接连接(在带宽更宽的情况下),要么选择通过向下采样模块203和向上采样模块222(在带宽更窄的情况下)的那些连接。多种带宽可以这样取得:对语音编码器204和解码器220进行程序设计以得到多种带宽,并在发射台中提供多个并行的向下采样模块以及在接收台中提供多个并行的向上采样模块(或者通过对向下采样模块203和向上采样模块222进行程序设计以得到多个向下/向上采样比)。
现有的AMR装置的定义包含如下缺点:从一个源编码带宽变到另一个时往往会在发射信号中引起明显的人工听觉信号。例如,在两个具有不同带宽的不同语音编解码模式之间切换会使收听者在接收端注意到扬声器声音中的一种奇怪的听觉效果。
作为本发明的额外背景,我们简单描述无汇接操作或TFO装置,TFO装置被用于传送移动终端之间的连接(MS-MS连接,其中MS是移动台的缩写),这里使用了宽带语音编码。为简洁起见,我们将把携带用宽带(窄带)语音信号编码方法进行编码的语音的信号简单的表示为宽带(窄带)语音。
图1中所述的两对完整的编解码器的应用被称为汇接操作,它在网络连接115经过一般属性未知的公用交换电话网即PSTN时特别有必要。在更为有利的情况中,终端100和130是数字蜂窝无线电系统的移动台,以及网络连接115是真的数字连接并能够在工作于基站中的或受控于基站的某些码变换和速率适配单元即TRAU之间建立透明的数字信道。
图3说明一种装置,其中第一TRAU 300在功能上和第一基站110相关,第二TRAU 310在功能上和第二基站120相关。TRAU 300和310分别包括解码器301、311;上行链路TFO单元302、312;编码器303、313;下行链路TFO单元304、314;以及TFO协议单元305、315。在各个TRAU中,解码器301、311和上行链路TFO单元302、312并联,以接收来自移动台的上行链路帧,并且它们的输出通过使用组合器306、316得以组合。类似地,编码器303、313和下行链路TFO单元304、314并联,以接收来自另一TRAU的传输帧,并且它们的输出通过选择开关307、317。数字网络320由IPE(路径内设备)构成,图中示出了其中的IPE 321和322,它能够在TRAU之间建立双向的64kb/s透明信道。第一基站110在第一基站控制器330的控制下工作,后者又是由第一移动业务交换中心340所控制的通信域中的一部分。第二基站120在第二基站控制器350的控制下工作,后者又是由第二移动业务交换中心360所控制的通信域中的一部分。从基站控制器330和350到相应的TFO协议单元305和315存在控制连接。
由ETSI(欧洲电信标准协会)公布的文件“GSM 04.53版本1.6.0(1998-10);数字蜂窝电信系统(阶段2+);语音编解码器的带内无汇接操作(Tandem Free Operation,TFO);业务描述;阶段3”通过引用结合到本文中,该文件定义了一种带内信令协议,用于测试信道的透明性、两个TRAU的TFO支持能力和两个无线电接口处的语音编解码器的同一性(identicality)。如果这些测试成功,TFO协议单元305和315通过命令信号路径变得透明以及旁路TRAU 300和310中的解码器/编码器功能,从而建立TFO连接。TFO规范还定义了TFO突然中断的快速后退程序,并提供对编码解码失配情况的分辩以及网络的固定部分320中进行经济传输的支持。
和第一基站110通信的第一移动台370包括编码器371和解码器372。相应的,和第二基站120通信的第二移动台380包括解码器381和编码器382。以上提及的TFO程序用来建立从第一移动台370的编码器371到第二移动台380的解码器381之间的以及从第二移动台380的编码器382到第一移动台370的解码器372之间实际的透明连接。
发明内容
本发明的一个目的是要提供一种用于改变源信号带宽的方法和装置,其中没有先有技术装置的上述缺点。本发明的另一目的是提供一种用于改变源信号带宽的方法和装置,以便在带宽改变时电话连接端的用户基本不会注意到人工听觉信号。本发明的另一目的是提供一种上述类型的方法和装置,其实现的复杂性维持在合理水平。
本发明的目的通过引入软带宽切换概念而实现,其中的声带宽从对应于第一编解码模式的第一水平渐变到对应于第二编解码模式的第二水平。
本发明提供了一种语音编码装置,它包括:
语音信号输入端,以及
多模式语音编码器,用于对连接到所述语音信号输入端的语音信号进行编码,其中的编码模式可选用与第一带宽相关的第一编码模式或者与第二带宽相关的第二编码模式,
其特征在于,它包括软带宽切换模块,该模块的输入端连接到所述语音信号输入端,输出端连接到所述多模式语音编码器,所述软带宽切换模块包括:
频带分离装置,用于将语音信号分离成第一频带和第二频带;
第一处理分支,与所述频带分离装置相连,接收所述第一频带,并处理所述第一频带;
第二处理分支,与所述频带分离装置相连,接收所述第二频带,并处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中的可调装置,用于改变频带的加权;以及
频带组合装置,用于将所述第一和第二处理分支的输出组合成所述软带宽切换模块的一个输出;
所述软带宽切换模块被配置为逐渐改变连接到所述多模式语音编码器的语音信号的带宽,作为对改变语音信号带宽的指令的响应。
本发明还提供了一种语音解码装置,它包括:
语音信号输入端,以及
多模式语音解码器,用于对连接到所述语音信号输入端的语音信号进行解码,其中的解码模式可选用和第一带宽相关的第一解码模式或者和第二带宽相关的第二解码模式,
其特征在于,它包括具有输入端和输出端的软带宽切换模块,其中所述软带宽切换模块的所述输入端连接到所述多模式语音解码器,所述软带宽切换模块包括:
频带分离装置,用于将语音信号分离成第一频带和第二频带;
第一处理分支,与所述频带分离装置相连,接收所述第一频带,并处理所述第一频带;
第二处理分支,与所述频带分离装置相连,接收所述第二频带,并处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中的可调装置,用于改变频带的加权;以及
频带组合装置,用于将所述第一和第二处理分支的输出组合成所述软带宽切换模块的一个输出;
所述软带宽切换模块被配置为逐渐改变从所述多模式语音解码器收到的语音信号的带宽,作为对改变语音信号带宽的指令的响应。
此外,本发明适用于蜂窝无线电系统的数字无线电话以及码变换和速率适配单元,其特性在于:至少包括上述类型的语音编码装置或语音解码装置之一。
在大多数电话应用中,通过连接传送的声信号是语音,因此,我们不讨论一般的声带宽而讨论语音带宽。然而,使用术语“语音”不应该被解释成对本发明适用性的限制。
本发明还提供了一种改变与多模式语音编码或解码有关的语音信号的带宽的方法,其特征在于,它包括如下步骤:
接收改变语音信号带宽的指示,
将语音信号分离成第一频带和第二频带;
在第一处理分支中处理所述第一频带;
在第二处理分支中处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中改变频带的加权;
将所述第一和第二处理分支的输出组合成一个输出;
逐渐改变在多模式语音编码或解码装置中处理的语音信号的带宽,作为对所述改变语音信号带宽的指示的响应。
自然语音信号包括宽范围的频率成分,并且减少语音带宽不可避免地去掉了这些成分中的部分成分,从而导致不同程度的失真。在现有系统中,在有效通话期间会出现切换瞬间,以便突然改变语音带宽。这会引起人工听觉信号,因为失真大小和性质也会突然改变。根据本发明,引入一个平滑期,其间语言带宽逐渐变化。人类的感觉系统察觉语音失真中的逐渐变化不会象察觉突发变化那样容易,因此这种平滑期改善了用户所得到的听觉感受。
本发明可应用于编码装置中,其中平滑期最好在实际的语音编码器前引入或者作为它的一部分。本发明也可以应用于解码器中,其中平滑期最好在实际的解码器后引入或者作为它的一部分。在这两种情况(编码装置或解码装置)中,引入平滑期的装置一般包括并行信号路径上的可调增益单元,各路径分别传送部分声谱。可调增益单元可以用上述信号路径上的可调滤波器替换或补充。
关于更大的语音(或声)带宽,由于应用本发明的通信系统的性质和工作机制,并非总能得到附加频率成分。因此根据本发明的装置最好包括噪声发生器,该发生器可被用于替代丢失的附加频率成分。于是,宽带语音(或声)信号是基本频率成分、附加频率成分和噪声的加权组合。
被视为本发明的特征的新颖性特别在所附权利要求中陈述。然而,本发明本身就其结构和操作方法,连同它的其它目的和优点,将通过阅读以下结合附图对特定实施例的描述得到最好的理解。
附图说明
图1说明通信系统中语音传输的已知概念,
图2说明以下例示性的已知多速率编码结构,
图3说明已知的无汇接操作装置,
图4说明根据本发明的实施例的原理,
图5说明根据本发明的实施例的软带宽切换装置,
图6说明根据本发明的实施例的方法,
图7说明根据本发明的实施例的移动电信终端,以及
图8说明根据本发明的实施例的基站子系统的组成部分。
具体实施方式
图1到3的内容在先有技术的描述中进行了解释,因此,以下对本发明及其有利的实施例的描述将集中在图4到8。相同的标号指示附图中的相同部份。
图4说明通过通信信道210连接在一起的编码-解码装置对,其中通常包括例如所有必需的信道编码/解码和发射/接收装置。模块401和402是编码装置的部件,而模块411和412是解码装置的部件。图4中的编码和解码装置可以表示如图3中通信装置中的单个信号路径上的编码和解码装置的任意组合。
所述编码装置中有软带宽切换模块401和多带宽语音编码器402,其中的后者类似于图2中的纯语音编码器204。所述解码装置中有多带宽语音解码器411和软带宽切换模块412,其中的前者类似于图2中的纯语音解码器220。本发明不要求在编码装置和解码装置中同时拥有软带宽切换模块;这些模块同时出现在图4中只是为了说明可将本发明应用于信号传输链中的多个位置。
通信信道210包括负责发出带宽改变命令的控制器等。图4中的控制连接421和422说明在编码装置和解码装置对这些命令的接收。本发明不限制命令如何给出的形式,尽管在本发明的某些实施例中,这样做是有利的:如果至少某些带宽改变命令分成两部分,那么有关就要改变带宽命令的警告首先出现,一定时间之后出现纯命令。
图2中软带宽切换模块401和412的任务,或这些模块中在实际通信环境中使用的那些模块的任务,是为了在带宽改变之间实现平滑期,以便编码装置的输入语音带宽和/或解码装置的输出语音带宽不会突然变化。下面我们描述模块401和412的例示性硬件实现。
图5是软带宽切换模块的功能框图,它可以在考虑信号流中的变化时用作编码装置中的401模块或解码装置中的412模块。功能块之间的粗线表示信号路径,细线条表示控制连接。输入信号被连接到频带分离器502的输入端。在发射移动台中,输入信号是来自A/D转换器的原始未编码的语音信号,而在接收移动台或上行链路TRAU(这里没用TFO)中,输入信号是语音解码器的输出。在没用TFO的下行链路TRAU中,输入信号是来自网络的PCM采样信号列。频带分路装置的输出个数和需要单独处理的频带个数相同。频带分离器502的输出端数量一般等于已经在应用本发明的语音编码装置中定义的频带数量。在图5的例示性软带宽切换模块中,频带分离器502有两个输出端,它们分别连接到其自身的可调增益单元503或504的输入端。另外,还有第三可调增益单元505,它的输入端通过第一可调滤波单元507连接到白噪声发生器506的输出端。
为简洁起见,我们把频带分离器502的输出端表示为低频带输出端和高频带输出端。如果我们把图5的软带宽切换模块放入在先有技术的描述中提到的两种可选语音带宽的已知环境中,则低频带输出携带输入语音信号中只进入3.5kHz频带内的部分,而高频带输出携带输入语音信号中在3.5kHz到7kHz带宽之间的部分。低频带输出端连接到第一可调增益单元503,而高频带输出端连接到第二可调增益单元504。第二可调增益单元504和第三可调增益单元505的输出端连接到组合器508的输入端,而第一可调增益单元503的输出端连接到第二可调滤波单元509的输入端。所述组合器508的输出端连接到第三可调滤波器510的输入端。第二可调滤波器509和第三可调滤波器510的输出端都连接到频带组合器511的输入端,后者是频带分离器502的镜像。频带组合器511的输出端构成图5的整个软带宽切换模块的输出端。
在发射移动台或下行链路TRAU(其中没用TFO)中,输出信号是给实际的语音编码器的输入信号。在接收移动台中,输出信号是到D/A转换器的输入信号。在上行链路TRAU(其中没用TFO)中,输出信号是要通过网络传输的PCM采样链。
带宽切换控制单元即BSCU 512经连接既从502模块的输入和输出端接收输入信息,也从编码或解码装置的某些其它部分接收信息;这后一种输入至少包括改变带宽的命令,但是它也可能包括语音参数,这些参数描述传输的某一其它阶段所传输的语音信号的特征。BSCU 512也经连接而控制模块503、504、505、507、509和510的操作。
图5中的装置的操作如下。频带分离器502将输入信号分成两个频带;这里使用的术语“频带”必须从广义上理解,作为在低频带限制和高频带限制之间的连续频率范围的一种替代,频带分离器502产生的每个输出频带可包括若干取自语音频谱的不同位置的频率成分或子带。这里表示为低频带的这些频带之一总存在于编码语音信号中。这里表示为高频带的其它频带只在采用两种可选语音带宽中较宽的那种时才会出现在编码语音信号中。
白噪声发生器506和第一可调滤波器507共同产生所谓的人工高频带信号,它可以用来代替丢失的实际高频带信号。第一可调滤波器507的目的是修改来自例如白噪声发生器506的完全任意的噪声信号,从而形成它的频谱,从而使人工高频带信号组成假定的实际高频带语音信号和/或启动和现有低频带信号重叠的频率成分。发生在编码装置中图5的软带宽切换模块之后的语音编码过程,以及发生在解码装置中软带宽切换模块之前的语音解码过程,一般依赖于线性预测编码即LPC原理,其中滤波用已知的例如根据某些LPC系数的滤波方式进行。同样的LPC系数或者它的一部分可被用于调节第一可调滤波器507。或者可应用LPC(或者简称LP)滤波外插原理,这种原理公开在共同未决的专利申请号FI 20000524题为“语音解码器和解码语音的方法”中,这里通过引用结合到本文中。
带宽组合器511将来自第二和第三可调滤波器509和510的滤波信号简单地组合,以形成图5的软带宽切换模块的共同输出信号。
BSCU 512设置可调增益单元503、504和505的增益因子,并调节可调滤波器507、509和510。为简单起见,我们可假设每个可调增益单元的增益因子在0到1之间,于是当增益因子为1时,信号不受影响地通过;当增益因子为0时,没有信号通过;当增益因子介于0和1之间时,通过信号的幅度(或者功率,或者某些别的特征)为不受影响的信号特征的相应分数部分。第二和第三可调滤波器509和510分别对第一可调增益单元503和组合器508的输出进行滤波。滤波器的可调性意味着各滤波器的通带可以单独设置为介于0到对应于最高语音编码速率的频带的整个宽度之间的任何值。一方面可调增益单元503、504和505的功能和另一方面第二和第三可调滤波器509和510的功能彼此部分互相补充,因为二者都改变软带宽切换模块401的输出端上的低频带、高频带和人工高频带信号的相对强度。同时使用可调增益单元和可调滤波器不是必需的;根据本发明,只要其中之一就足以实现所述的软带宽切换功能。
可调增益单元503、504和505的增益因子的设置以及如果有必要对第二和第三可调滤波器509和510的通带的设置是基于对输入信号以及高和低频带信号的分析,这些信号是BSCU 512通过图5所示的控制信息连接接收的。控制信息对调节过程的影响将在以后作更详细地解释。编码器装置的BSCU也可以接收来自纯语音编码器的某些控制信息以及通过图4中的示意为421的连接传来的语音参数;这些连接在图5中示意为虚线。解码器装置的BSCU可以通过源自软带宽切换模块的输入的控制连接的语音参数。
根据本发明的带宽“软”改变意味着在以使用不同带宽为特征的编码或解码模式之间的逐步变化。它的反面是“硬”改变或突变,这或多或少是先有技术装置的特征。取决于软带宽切换模块是否位于发射移动台、上行链路TRAU、下行链路TRAU或者接收移动台中,软切换和硬切换具有某些特定的特征。下面将一个一个讨论这些特征。
1.编码器,由宽带向窄带切换
1A:编码器在上行链路MS中或编码器在下行链路TRAU中,硬改变
如上所述,由宽带向窄带的硬改变意味着收到进入窄带模式的命令,从而编码器必须立即开始产生代表窄带语音的参数。在它收到模式切换命令之后,完全没有宽带信息从上行链路MS或下行链路TRAU发送。如果任何人想完成平滑,则必须在解码器中完成。
1B:编码器在上行链路MS中,软改变
这种情况和情况1A的不同之处在于:或者允许上行链路MS延迟执行模式切换命令,或者它接收即将来临的模式切换命令的早期警告,从而它可以在实际命令来临之前开始平滑带宽之间的变化。其结果是不连续的平滑期,其间MS的编码器中软带宽切换模块执行宽带向窄带的逐渐变化。本发明没有限制平滑期的长度;它可以是预定常数或者可动态改变。在本专利申请的优先权日,假定平滑期的合适最大长度为1秒。渐变在实际中实现,以便带宽切换控制单元即BSCU 512逐渐把可调增益模块504的增益降到0或者调节可调滤波器510以便逐渐屏蔽高频带。对模块504和510操作的调节甚至可以同时进行。在上行链路MS中,宽带语音编码模式一直基于实际宽频带上的语音信号,因此不用模块505、506和507,而且在平滑期间也没有用到它们。在整个平滑期间,上行链路MS中的语音编码装置继续工作在宽带编码模式下,但在平滑期后可立即改变到工作于窄带模式。
1C:编码器在下行链路TRAU中,软改变
这种情况可以进一步根据下行链路TRAU是否一直通过网络收到宽带或窄带输入信息和有否使用TFO而进一步分为子情况。在本申请的优先权日之时的典型现有网络中,从网络接收宽带输入信息与使用TFO同义,但是,即使没有TFO,建设传送宽带语音的网络也是可能的。在使用TFO的过程中,下行链路TRAU中的编码器没有积极作用,因为来自下行链路MS的原始宽带语音信号通过网络透明传输。然而,编码装置必须运行,以便确保万一TFO失败时的快速退回位置。下行链路TRAU中的宽带编码器的输出仅当TFO不工作时才使用。在上述情况1B中给出的某些考虑适用:要么允许下行链路TRAU延迟执行模式切换命令,要么接收即将来临的模式切换命令的早期警告,以便它可以在实际的命令来临之前开始平滑带宽之间的变化,平滑期的长度可以为常数或者可动态改变,平滑期的持续时间的典型最大值假定为1秒。假如下行链路TRAU一直从网络接收宽带语音,甚至平滑期的实际实现也相似,然而,假如下行链路TRAU一直只从网络接收窄带语音,那么它一直使用模块505、506和507产生人工高频带。在这种子情况下,BSCU 512通过将可调增益模块505的增益逐渐降低到0和/或调节可调滤波器507和/或调节可调滤波器510来实现平滑,以便逐渐屏蔽人工高频带。
2.编码器,由窄带向宽带切换
2A:编码器在上行链路MS中,硬或软改变
在上行链路MS已收到模式切换命令之后,将语音编码器立即设置为宽带模式。然而,BSCU 512改变可调增益单元504的增益,以使在改变模式的时刻,该增益为0或者至少很小,在平滑期间,增益逐渐增加到在有效宽带操作期间所应该具有的值,例如1。同样的效果可以用如下方式取得:在平滑期间,逐渐调节可调滤波器510,以使得在模式改变的时刻,高频带基本上被屏蔽,以及在平滑期结束时,高频带具有有意义的宽度和幅度。平滑期的长度决定了改变的“硬度”,它可以根据输入语音信息的内容选择;所以有图5中从输入到BSCU的控制连接。例如,如果在语音信号中存在临时的静寂时间,则改变可以非常快,但如果正好有发清辅音信号,比如语音中的“s”音,为了不产生清晰的听觉人工信号,相对慢的改变是有利的。在选择平滑期长度时考虑的可选或另外的标准是最近的宽带和窄带模式之间任意方向的切换次数和/或频率。最近的改变次数和/或频率与相应的平滑期长度之间表示主观最佳的对应性可以通过实验得到。
2B:编码器在下行链路TRAU中,硬或软改变
如情况2A一样,在下行链路TRAU已收到模式切换命令之后,将语音编码器立即设置为宽带模式。BSCU 512改变处理高频带的可调增益单元的增益,从而在改变模式的时刻,增益为0或者至少很小,且在平滑期间,该增益逐渐增加到在有效宽带操作期间所应该具有的值,例如1。选择涉及的可调增益单元是模块504还是505取决于下行链路TRAU接收来自网络的是宽带还是窄带语音。而且可调滤波器510可被用于实现这种渐变,或者如果要产生人工高频带信号,则甚至可利用可调滤波器507。选择平滑期长度可根据输入语音信息的内容和/或最近在宽带和窄带模式之间任意方向的切换次数和/或频率。情况1C中出现的有关TFO的描述也适用于这种情况。
3.解码器,由宽带向窄带切换
3A:解码器在上行链路TRAU中,硬或软改变
在现有网络中,上行链路TRAU在TFO期间只能传输宽带语音信号,其中的解码器被旁路。因此,在这种情况下,只要上行链路TRAU遵循有关TFO和窄带传输的已知程序,则本发明对上行链路TRAU中的解码器的操作没有影响。然而,为了完整起见,我们可假定在未来的网络解决方案中,上行链路TRAU在也没有TFO的情况下传输宽带信号是可能的,在这种情况下,上行链路TRAU的解码器应该执行至少部分以下针对下行链路MS的解码器的描述的某些操作。
3B:解码器在下行链路MS中,硬改变
硬改变在这里意味着下行链路MS的语音解码器事先不知道要进行改变,在接收宽带语音一段时间之后,忽然得到改变解码模式的命令并开始只接收窄带语音信号。由于本发明,下行链路MS仍可通过产生人工高频带信号来平滑解码语音中改变的结果,然后可以逐渐屏蔽所产生的人工高频带信号。改变之后,白噪声发生器506立刻产生在可调滤波器507中被滤除的噪声信号,从而正确形成它的频谱。也是在改变之后,模块505的增益立即为1或者至少相对高,而模块504的增益为0,因为从频带分离器502得不到实际的高频带语音信号。逐渐屏蔽人工高频带信号意味着将模块505的增益减少到0或至少相对低的值。减少增益的速度又可以根据多种标准来确定;例如根据语音信号的内容或最近解码模式改变的次数和/或频率(见情况2A)。
3C:解码器在下行链路MS中,软改变
这种情况和情况3B的不同之处在于:下行链路MS中的解码器接收有关即将来临的解码模式改变的早期警告。我们可以首先假定该警告来得足够早,以致于改变可以通过只处理实际语音信号而充分完成。我们可以进一步假定将会使用X毫秒的平滑期。其中X为下行链路MS已知的正实数。在这些假设下,模块505的增益可以在整个改变过程中保持为0(或为相对低的值)。在宣称的改变时刻之前精确的X秒处,BSCU 512开始将模块504的增益从1(或相对高的值)向0(或相对低的值)减少,以便在改变瞬间该增益达到更小的值,从而进入窄带解码模式。然后,如果我们放弃我们的第一个假设,我们可作更一般的定义:在改变瞬间之前X1毫秒期间,减少模块504的增益同时模块505的增益保持为0(或相对低的值),正好在改变瞬间,模块504和模块505的作用和增益因子发生反转,并且模块506开始通过模块507、505和508向(人工)高频带馈送噪声,以及在改变之后的X2毫秒器件,模块505的增益减少到0(或相对低的值)。和我们的第二个假设保持一致,X1+X2=X,从而在X1=0时这种情况归结为情况3B。
4.解码器,由窄带向宽带切换
4A:解码器在上行链路TRAU中,硬或软改变
上行链路TRAU中的解码器可遵守有关宽带或窄带模式的命令,但是在现有网络中,无论模式如何,它的输出必须限制为窄带(3.5kHz),这是因为更宽的频带不能通过PSTN传输。宽带语音可以在TFO期间传输,但上行链路TRAU中的解码器件又被旁路。因此,本发明在这里所产生的影响不会超过情况3A。为完整起见,可能的未来网络的同样的考虑适用于此。
4B:解码器在下行链路MS中,硬或软改变
现在这种改变意味着下行链路MS的语音解码器事先知道或不知道改变要来,在接收窄带语音一段时间之后,得到一个改变解码模式的命令并开始接收宽带语音信号。本发明最有利的实施例是在解码模式中在改变的瞬间完成该改变,但首先保持模块504的增益为0(或为相对低的值),接着逐渐将该增益提高到1(或相对高的值)。增加增益的速度可以依赖于语音信号的内容和/或解码模式中最近改变的次数和/或频率(见情况2A)。如果有关即将来临的改变的早期警告来到,通过在模块506和507中产生成形的噪声信号,并在保持模块504的增益为低的同时在改变时刻之前逐渐提高模块505的增益,从而基本上可能“预先渐增”高频带。在改变时刻,模块504和505的作用及增益因子发生反转。然而,首先使用人造的高频带,随后只使用实际的高频带,这样做比只使用实际高频带一般更易于产生人工听觉信号。
图6是说明由使用第一编码或解码模式改变为使用第二编码或解码模式的一般流程图。在步骤601,编码器(解码器)利用其第一模式进行编码(解码),这种模式在上述上下文中要么是窄带模式要么是宽带模式。步骤602是检查是否已收到关于即将来临的模式改变的早期警告。如果已收到这样的早期警告,根据步骤603,在与所述编码器(解码器)相关的软带宽切换单元中开始逐渐改变带宽。步骤604检查是否已收到模式改变命令。如果既没有早期警告又没有命令,则编码(解码)装置不断的在步骤601、602和604之间循环。这里我们假设如果已收到早期警告,也将收到模式改变命令;则从步骤603到步骤604并跳回步骤601显然会导致错误。
在已经收到改变模式的命令时,编码(解码)装置在步骤605检查是否可能延迟执行该命令。如果不行,立刻在步骤606进行编码(解码)模式的改变。如果发现延迟执行该命令是可能的,则根据步骤607启动软带宽切换或“渐变”,且只在适当延时后执行步骤606。在步骤608检查已经完成的编码(解码)模式改变是否可以用“后渐变”步骤予以补充,在该步骤中,软带宽切换单元在编码(解码)模式改变之后逐渐改变带宽。如果不可以,则使用第二编码(解码)模式的编码(解码)如步骤609那样继续进行。如果发现后渐变是可能的,则在步骤610执行后渐变。
上述情况1A到4B的情况根据下述步骤列表,对应于图6的流程图中稍微不同的路径。
1A:601-602-604-605-606-608-609。
1B和1C,无早期警告:601-602-604-605-607-606-608-609。
1B和1C,有早期警告:601-602-603-604-605-606-608-609。
2A和2B:601-602-604-605-606-608-610-609。
3A,现有网络:601-602-604-605-606-608-609。
3B:601-602-604-605-606-608-610-609。
3C,无早期警告:和3B一样。
3C,有早期警告:601-602-603-604-605-606-608-(610)-609。
4A,现有网络:601-602-604-605-606-608-609。
4B:601-602-604-605-606-608-610-609。
带括号的步骤610的出现表示在模式改变之前没有足够时间完成预渐变步骤这种可能情况,因此必须对中断的渐变过程继续进行后渐变。
单独的语音编码器或解码器不足以将本发明的精神转化为用户所能想象的优点。图7说明数字无线电话,其中天线701连接到双工滤波器702,后者又连接到接收模块703和发射模块704,用于通过无线电接口接收和发射数字编码语音。接收模块703和发射模块704都连接到控制器模块707,分别用于传送接收到的控制信息和要发射的控制信息。另外,接收模块703和发射模块704连接到基带模决705,它包括基带频率功能,用于分别处理接收到的语音和要发射的语音。基带模块705和控制器模块707连接到用户接口706,后者一般由麦克风、扬声器、小键盘和显示器组成(未在图7中具体示出)。
图7更详细的示出了基带模块705的部件。接收模块703的最后部分是信道解码器,其输出由信道解码后的语音帧组成,这些帧需要进行语音解码、语音合成和D/A转换。从信道解码器获得的语音帧临时存储于帧缓冲器710,并从中读取到实际的语音解码装置711。后者实现从存储器712读出的语音编码算法。根据本发明的一个有利实施例,语音解码装置711包括位于纯语音解码器之后图5所示类型的软带宽切换单元,从而在图7的数字无线电话作为下行链路MS时实现软带宽切换。
在A/D转换器模块723中对来自麦克风的记录语音进行A/D转换。语音解码装置721根据从存储器722读到的编码算法进行语音编码。编码语音帧临时存储于帧缓冲区720,并从中被发送到发射模块704中的信道编码器。根据本发明的一个有利实施例,语音编码装置721包括位于纯语音编码器之前图5所示类型的软带宽切换模块,从而在图7的数字无线电话作为上行链路MS时执行软带宽切换。
和本发明相关的可想象的优点在于由图7的数字无线电话发送和/或接收的语音提高的主观质量。
图8说明一个基站,其中接收天线801连接到接收模块803,用于通过无线电接口接收数字编码语音。同时发射天线802连接到发射模块803,用于通过无线电接口发射数字编码语音。接收模块803和发射模块804都连接到控制器模块807,分别用于传送接收到的控制信息和要发送的控制信息。另外,接收模块803和发射模块804连接到基带模块805,后者包括分别用于处理接收到的语音和要发送的语音的基带频率功能。基带模块805和控制器模块807连接到网络接口806,该网络接口一般包括网络传输复用器,网络接收去复用器和若干发送、接收、放大和滤波部件(未在图8中具体示出)。
基带模块805的一部分在图8中更为详细的示出。接收模块803的最后部分是信道解码器,其输出由信道解码的语音帧组成,这些语音帧需要在被发送到网络之前进行语音解码(考虑未使用TFO)。从信道解码器获得的语音帧临时存储于帧缓冲器810,并从中读取到实际的语音解码装置811。后者执行从存储器812读出的语音解码算法。根据本发明的一个有利实施例,语音解码装置811包括位于纯语音解码器之后图5所示类型的软带宽切换单元,以便在图8的基站充当上行链路TRAU时执行软带宽切换。
帧分解模块823为编码准备从网络接收到的语音信号。语音编码装置821根据从存储器822读出的编码算法进行语音编码(考虑未使用TFO)。编码语音帧临时存储于帧存储器820,并从中读取到发射模块804中的信道编码器。根据本发明的一个有利实施例,语音编码装置821包括位于纯语音编码器之前图5所示类型的软带宽切换单元,以便在图8的基站充当下行链路TRAU时执行软带宽切换。
和本发明相关的可想象的优点在于由图8的基站处理的语音的提高的主观质量。
对上述实施例的各种变化和修改都是可能的,并不背离所附权利要求的范围。例如,在本发明的一个非常简单的实施例中,软带宽切换模块可以在处理分支处理窄(较低)频带中不用可调增益单元503和可调滤波器509而完整的实现。这在不同处理分支中的信号幅度部分和相对频谱特性可以被控制到一个合理的精度是可能的,而只在用于更高频带的处理分支中配置可调单元。除非明确指出,在附属权利要求中陈述的特性可以自由组合。
Claims (29)
1.一种语音编码装置(721、821),它包括:
语音信号输入端,以及
多模式语音编码器(402),用于对连接到所述语音信号输入端的语音信号进行编码,其中的编码模式可选用与第一带宽相关的第一编码模式或者与第二带宽相关的第二编码模式,
其特征在于,它包括软带宽切换模块(401、500),该模块的输入端连接到所述语音信号输入端,输出端连接到所述多模式语音编码器(402),所述软带宽切换模块(401、500)包括:
频带分离装置,用于将语音信号分离成第一频带和第二频带;
第一处理分支,与所述频带分离装置相连,接收所述第一频带,并处理所述第一频带;
第二处理分支,与所述频带分离装置相连,接收所述第二频带,并处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中的可调装置,用于改变频带的加权;以及
频带组合装置,用于将所述第一和第二处理分支的输出组合成所述软带宽切换模块的一个输出;
所述软带宽切换模块被配置为逐渐改变连接到所述多模式语音编码器的语音信号的带宽,作为对改变语音信号带宽的指令(421)的响应。
2.如权利要求1所述的语音编码装置,其特征在于,所述可调装置包括可调增益模块(503、504、505)。
3.如权利要求1所述的语音编码装置,其特征在于,所述可调装置包括可调滤波器(507、509、510)。
4.如权利要求1所述的语音编码装置,其特征在于,它包括噪声发生器(506)和可调滤波器(507),所述噪声发生器通过所述可调滤波器(507)连接到所述第二处理分支,用于可控地产生到所述第二处理分支的人工高频带信号。
5.如权利要求4所述的语音编码装置,其特征在于,它包括:
所述第二处理分支中的可调装置(504、505、507),用于改变语音信号的所述第二频带和所述人工高频带信号的频带的加权,以及
所述第二处理分支中的组合装置(508),用于将语音信号的所述第二频带和所述人工高频带信号组合成为所述第二处理分支的所述输出。
6.如权利要求1所述的语音编码装置,其特征在于,它包括带宽切换控制单元(512),该控制单元连接到所述可调装置(503、504、505、507、509、510),用于控制在所述第一和第二处理分支中处理的信号的频带的加权的变化。
7.一种数字无线电话,其特征在于,它包括如权利要求1所述的语音编码装置(721、821)。
8.一种蜂窝无线系统的码变换和速率适配单元,其特征在于,它包括如权利要求1所述的语音编码装置(721、821)。
9.一种语音解码装置(711、811),它包括:
语音信号输入端,以及
多模式语音解码器(411),用于对连接到所述语音信号输入端的语音信号进行解码,其中的解码模式可选用和第一带宽相关的第一解码模式或者和第二带宽相关的第二解码模式,
其特征在于,它包括具有输入端和输出端的软带宽切换模块(412、500),其中所述软带宽切换模块的所述输入端连接到所述多模式语音解码器(411),所述软带宽切换模块(412、500)包括:
频带分离装置,用于将语音信号分离成第一频带和第二频带;
第一处理分支,与所述频带分离装置相连,接收所述第一频带,并处理所述第一频带;
第二处理分支,与所述频带分离装置相连,接收所述第二频带,并处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中的可调装置,用于改变频带的加权;以及
频带组合装置,用于将所述第一和第二处理分支的输出组合成所述软带宽切换模块的一个输出;
所述软带宽切换模块被配置为逐渐改变从所述多模式语音解码器收到的语音信号的带宽,作为对改变语音信号带宽的指令(422)的响应。
10.如权利要求9所述的语音解码装置,其特征在于,所述可调装置包括可调增益模块(503、504、505)。
11.如权利要求9所述的语音解码装置,其特征在于,所述可调装置包括可调滤波器(507、509、510)。
12.如权利要求9所述的语音解码装置,其特征在于,它包括噪声发生器(506)和可调滤波器(507),所述噪声发生器通过所述可调滤波器(507)连接到所述第二处理分支,用于可控地产生到所述第二处理分支的人工高频带信号。
13.如权利要求12所述的语音解码装置,其特征在于,它包括:
所述第二处理分支中的可调装置(504、505、507),用于改变语音信号的所述第二频带和所述人工高频带信号的频带的加权,以及
所述第二处理分支中的组合装置(508),用于将语音信号的所述第二频带和所述人工高频带信号组合成为所述第二处理分支的所述输出。
14.如权利要求9所述的语音解码装置,其特征在于,它包括带宽切换控制单元(512),该控制单元连接到所述可调装置(503、504、505、507、509、510),用于控制在所述第一和第二处理分支中处理的信号的频带的加权的变化。
15.一种数字无线电话,其特征在于,它包括如权利要求9所述的语音解码装置(711、811)。
16.一种蜂窝无线系统的码变换和速率适配单元,其特征在于,它包括如权利要求9所述的语音解码装置(711、811)。
17.一种改变与多模式语音编码或解码有关的语音信号的带宽的方法,其特征在于,它包括如下步骤:
接收改变语音信号带宽的指示(602、604),
将语音信号分离成第一频带和第二频带;
在第一处理分支中处理所述第一频带;
在第二处理分支中处理所述第二频带;
在所述第一处理分支和所述第二处理分支的至少一个中改变频带的加权;
将所述第一和第二处理分支的输出组合成一个输出;
逐渐改变(603、607、610)在多模式语音编码或解码装置中处理的语音信号的带宽,作为对所述改变语音信号带宽的指示的响应。
18.如权利要求17所述的方法,其特征在于,
所述接收改变语音信号带宽的指示(602、604)的步骤包括接收关于即将来临的改变语音信号带宽的命令的早期警告(602),
所述方法包括开始逐渐改变(603)在多模式语音编码或解码装置中处理的语音信号的所述带宽的处理过程,作为对所述早期警告的响应,以及
所述方法包括基本上刚好在执行收到的改变语音信号带宽的命令(604)之前完成逐渐改变在多模式语音编码或解码装置中处理的信号的所述带宽的处理过程。
19.如权利要求17所述的方法,其特征在于,
所述接收改变语音信号带宽的指示(602、604)的步骤包括接收改变语音信号带宽的命令(604),
所述方法包括延迟(605)执行所述接收到的改变语音信号带宽的命令,
所述方法包括在收到所述改变语音信号带宽的命令之后但在执行它之前进行(607)逐渐改变在多模式语音编码或解码装置中处理的语音信号的所述带宽的处理过程,以及
所述方法包括通过使所述的多模式语音编码或解码装置从一种模式改变到所述多模式语音编码或解码装置的另一种模式来执行(606)所述改变语音信号带宽的命令。
20.如权利要求17所述的方法,其特征在于,
所述接收改变语音信号带宽的指示(602、604)的步骤包括接收改变语音信号带宽的命令(604)并通过使所述多模式语音编码或解码装置从一种模式改变到所述多模式语音编码或解码装置的另一种模式来执行(606)所述改变语音信号带宽的命令,
所述方法包括在执行了所述改变语音信号带宽的命令之后,进行逐渐改变(610)在多模式语音编码或解码装置中处理的语音信号的所述带宽的处理过程。
21.如权利要求17所述的方法,其特征在于,
所述接收改变语音信号带宽的指示(602、604)的步骤包括接收关于即将来临的改变语音信号带宽的命令的早期警告(602),
所述方法包括开始逐渐改变(603)在多模式语音编码或解码装置中处理的语音信号的所述带宽的处理过程,作为对所述早期警告的响应,
所述方法包括接收(604)改变语音信号带宽的命令并通过使所述多模式语音编码或解码装置从一种模式改变到所述多模式语音编码或解码装置的另一种模式来执行(606)所述改变语音信号带宽的命令,所述对所述改变语音信号带宽的命令的执行引起逐渐改变语音信号的所述带宽的过程的中断,以及
在执行所述改变语音信号带宽的命令之后,完成(610)逐渐改变在多模式语音编码或解码装置中处理的语音信号的所述带宽的处理过程。
22.如权利要求17所述的方法,其特征在于,所述逐渐改变在多模式语音编码或解码装置中处理的语音信号的所述带宽的步骤包括以下子步骤:
在第一处理分支(503、509)中处理语音信号的第一频带以及在第二处理分支(504、505、506、507、508、510)中处理语音信号的第二频带,以及
改变所述第二处理分支中的增益因子(504、505)。
23.如权利要求22所述的方法,其特征在于,
所述在第一处理分支(503、509)中处理语音信号的第一频带和在第二处理分支(504、505、506、507、508、510)中处理语音信号的第二频带的子步骤包括如下子步骤:引导从所述多模式语音编码或解码装置的语音信号输入端处出现的实际语音信号中析取(502)的所述第一频带通过第二可调增益单元(504),以及
所述改变所述第二处理分支中的增益因子的子步骤包括调节所述第二可调增益单元(504)中的增益的子步骤。
24.如权利要求22所述的方法,其特征在于,
所述在第一处理分支(503、509)中处理语音信号的第一频带和在第二处理分支(504、505、506、507、508、510)中处理语音信号的第二频带的子步骤包括如下子步骤:在所述多模式语音编码或解码装置中产生人工高频带信号(506、507)并引导所述人工高频带信号通过第三可调增益单元(505),以及
所述改变所述第二处理分支中的增益因子的子步骤包括调节所述第三可调增益单元(505)中的增益的子步骤。
25.如权利要求22所述的方法,其特征在于,
所述在第一处理分支(503、509)中处理语音信号的第一频带和在第二处理分支(504、505、506、507、508、510)中处理语音信号的第二频带的子步骤包括如下子步骤:
引导从在所述多模式语音编码或解码装置的语音信号输入端处出现的实际语音信号中析取(502)的所述第一频带通过第二可调增益单元(504),
在所述多模式语音编码或解码装置中产生人工高频带信号(506、507)以及指引所述人工高频带信号通过第三可调增益单元(505),以及
组合所述第二(504)和第三(505)可调增益单元的输出;以及
所述改变所述第二处理分支中的增益因子的子步骤包括调节所述第二(504)和第三(505)可调增益单元中的增益的子步骤。
26.如权利要求17所述的方法,其特征在于,所述逐渐改变(603、607、610)在多模式语音编码或解码装置中处理的语音信号的所述带宽的步骤包括如下子步骤:
在第一处理分支(503、509)中处理语音信号的第一频带和在第二处理分支(504、505、506、507、508、510)中处理语音信号的第二频带,以及
在所述第二处理分支中改变可调滤波器(507、510)的频率响应。
27.如权利要求17所述的方法,其特征在于,所述逐渐改变(603、607、610)在多模式语音编码或解码装置中处理的语音信号的所述带宽的步骤包括根据所述语音信号的瞬时内容确定渐变速率的子步骤。
28.如权利要求17所述的方法,其特征在于,所述逐渐改变(603、607、610)在多模式语音编码或解码装置中处理的语音信号的所述带宽的步骤包括根据最近发生的语音信号带宽改变的次数确定渐变速率的子步骤。
29.如权利要求17所述的方法,其特征在于,所述逐渐改变(603、607、610)在多模式语音编码或解码装置中处理的语音信号的所述带宽的步骤包括根据最近发生的语音信号带宽改变的频率确定渐变速率的子步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20001070A FI115329B (fi) | 2000-05-08 | 2000-05-08 | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
FI20001070 | 2000-05-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1427989A CN1427989A (zh) | 2003-07-02 |
CN1244906C true CN1244906C (zh) | 2006-03-08 |
Family
ID=8558346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB01809127XA Expired - Lifetime CN1244906C (zh) | 2000-05-08 | 2001-05-08 | 改变语音信号带宽的方法以及语音编码装置和解码装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6782367B2 (zh) |
EP (1) | EP1290679B1 (zh) |
JP (1) | JP5255172B2 (zh) |
CN (1) | CN1244906C (zh) |
AU (1) | AU2001258470A1 (zh) |
DE (1) | DE60118553T2 (zh) |
FI (1) | FI115329B (zh) |
WO (1) | WO2001086635A1 (zh) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1239455A3 (de) * | 2001-03-09 | 2004-01-21 | Alcatel | Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung |
KR100439422B1 (ko) * | 2001-12-19 | 2004-07-09 | 한국전자통신연구원 | 이동통신 단말기용 보코더의 동작 방법 |
JP2004061646A (ja) * | 2002-07-25 | 2004-02-26 | Fujitsu Ltd | Tfo機能を有する音声符号化器および方法 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
WO2004084181A2 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Simple noise suppression model |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
JP4370802B2 (ja) * | 2003-04-22 | 2009-11-25 | 富士通株式会社 | データ処理方法およびデータ処理装置 |
ATE503246T1 (de) * | 2003-06-17 | 2011-04-15 | Panasonic Corp | Empfangsvorrichtung, sendevorrichtung und übertragungssystem |
GB0321093D0 (en) * | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
US7450570B1 (en) | 2003-11-03 | 2008-11-11 | At&T Intellectual Property Ii, L.P. | System and method of providing a high-quality voice network architecture |
US20060034299A1 (en) * | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
US20060034481A1 (en) * | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
US8019449B2 (en) * | 2003-11-03 | 2011-09-13 | At&T Intellectual Property Ii, Lp | Systems, methods, and devices for processing audio signals |
AU2003304668A1 (en) * | 2003-11-14 | 2005-06-06 | Nokia Corporation | Generic trau frame structure |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
SE0402372D0 (sv) * | 2004-09-30 | 2004-09-30 | Ericsson Telefon Ab L M | Signal coding |
CN101107650B (zh) * | 2005-01-14 | 2012-03-28 | 松下电器产业株式会社 | 语音切换装置及语音切换方法 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
DE602006018618D1 (de) * | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8209187B2 (en) * | 2006-12-05 | 2012-06-26 | Nokia Corporation | Speech coding arrangement for communication networks |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
KR101377702B1 (ko) | 2008-12-11 | 2014-03-25 | 한국전자통신연구원 | 가변 대역 코덱 및 그 제어 방법 |
GB2476041B (en) * | 2009-12-08 | 2017-03-01 | Skype | Encoding and decoding speech signals |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
US9264094B2 (en) * | 2011-06-09 | 2016-02-16 | Panasonic Intellectual Property Corporation Of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
CN103209442B (zh) * | 2012-01-16 | 2017-12-15 | 华为终端有限公司 | 一种动态设置语音业务传输参数的方法及终端 |
US9544076B2 (en) * | 2012-05-04 | 2017-01-10 | Maxlinear, Inc. | Method and system for tunable upstream bandwidth utilizing an integrated multiplexing device |
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
JP6127708B2 (ja) * | 2013-05-16 | 2017-05-17 | 富士通株式会社 | コンテンツ再生装置、コンテンツ再生プログラム及びコンテンツ再生方法 |
TWI587290B (zh) | 2013-06-21 | 2017-06-11 | 弗勞恩霍夫爾協會 | 用以生成舒緩雜訊適應性頻譜形狀的裝置及方法、以及相關電腦程式 |
KR101864122B1 (ko) * | 2014-02-20 | 2018-06-05 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
US9831844B2 (en) * | 2014-09-19 | 2017-11-28 | Knowles Electronics, Llc | Digital microphone with adjustable gain control |
CN105632505B (zh) * | 2014-11-28 | 2019-12-20 | 北京天籁传音数字技术有限公司 | 主成分分析pca映射模型的编解码方法及装置 |
US10405288B2 (en) * | 2016-02-25 | 2019-09-03 | Lg Electronics Inc. | Supporting various bandwidth |
GB201620317D0 (en) * | 2016-11-30 | 2017-01-11 | Microsoft Technology Licensing Llc | Audio signal processing |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3432822B2 (ja) * | 1991-06-11 | 2003-08-04 | クゥアルコム・インコーポレイテッド | 可変速度ボコーダ |
JP3186412B2 (ja) * | 1994-04-01 | 2001-07-11 | ソニー株式会社 | 情報符号化方法、情報復号化方法、及び情報伝送方法 |
IT1281001B1 (it) | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
JP2669417B2 (ja) * | 1996-06-17 | 1997-10-27 | 株式会社日立製作所 | Adpcm復号器 |
JP3282661B2 (ja) * | 1997-05-16 | 2002-05-20 | ソニー株式会社 | 信号処理装置および方法 |
JP2000206996A (ja) * | 1999-01-13 | 2000-07-28 | Sony Corp | 受信装置及び方法、通信装置及び方法 |
US6496794B1 (en) * | 1999-11-22 | 2002-12-17 | Motorola, Inc. | Method and apparatus for seamless multi-rate speech coding |
US7113522B2 (en) | 2001-01-24 | 2006-09-26 | Qualcomm, Incorporated | Enhanced conversion of wideband signals to narrowband signals |
-
2000
- 2000-05-08 FI FI20001070A patent/FI115329B/fi not_active IP Right Cessation
-
2001
- 2001-05-08 EP EP01931767A patent/EP1290679B1/en not_active Expired - Lifetime
- 2001-05-08 DE DE60118553T patent/DE60118553T2/de not_active Expired - Lifetime
- 2001-05-08 AU AU2001258470A patent/AU2001258470A1/en not_active Abandoned
- 2001-05-08 CN CNB01809127XA patent/CN1244906C/zh not_active Expired - Lifetime
- 2001-05-08 WO PCT/FI2001/000436 patent/WO2001086635A1/en active IP Right Grant
- 2001-05-08 JP JP2001583502A patent/JP5255172B2/ja not_active Expired - Lifetime
- 2001-05-08 US US09/850,889 patent/US6782367B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003533717A (ja) | 2003-11-11 |
EP1290679A1 (en) | 2003-03-12 |
FI115329B (fi) | 2005-04-15 |
FI20001070L (fi) | 2001-11-09 |
EP1290679B1 (en) | 2006-04-05 |
DE60118553D1 (de) | 2006-05-18 |
WO2001086635A1 (en) | 2001-11-15 |
AU2001258470A1 (en) | 2001-11-20 |
US20010044712A1 (en) | 2001-11-22 |
CN1427989A (zh) | 2003-07-02 |
DE60118553T2 (de) | 2006-08-24 |
JP5255172B2 (ja) | 2013-08-07 |
US6782367B2 (en) | 2004-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1244906C (zh) | 改变语音信号带宽的方法以及语音编码装置和解码装置 | |
JP5199147B2 (ja) | 広帯域信号の狭帯域信号への強化された変換 | |
FI119533B (fi) | Audiosignaalien koodaus | |
EP2118891B1 (en) | Embedded silence and background noise compression | |
EP1368979B1 (en) | Mobile communications using wideband terminals allowing tandem-free operation | |
TW580691B (en) | Method and apparatus for interoperability between voice transmission systems during speech inactivity | |
JP6779280B2 (ja) | ハイバンド目標信号制御 | |
CN1552164A (zh) | 对音频信号进行代码变换的方法、码变换器、网元、无线通信网和通信系统 | |
CN1228867A (zh) | 改善串联声码器话音质量的方法与设备 | |
JP2001318694A (ja) | 信号処理装置、信号処理方法および記録媒体 | |
KR102778577B1 (ko) | 대역폭 트랜지션 주기 동안의 신호 재사용 | |
MXPA04007668A (es) | Comunicacion de voz de inter-sistemas de tandem libre. | |
US7653539B2 (en) | Communication device, signal encoding/decoding method | |
CN1246828C (zh) | 数据处理方法和装置以及数据传输系统 | |
JP2011512564A (ja) | 背景雑音情報の復号化方法および背景雑音情報の復号化手段 | |
JP2010515936A (ja) | 第1のビット・レートに関連する第1のパケットを、第2のビット・レートに関連する第2のパケットにディミング(dimming)するシステム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MANOR RESEARCH LTD. Free format text: FORMER OWNER: NOKIA OYJ Effective date: 20110913 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20110913 Address after: Delaware Patentee after: Phoenix Research Co Ltd Address before: Espoo, Finland Patentee before: Nokia Oyj |
|
CX01 | Expiry of patent term |
Granted publication date: 20060308 |
|
CX01 | Expiry of patent term |