CN1303580C - 处理语音信号的装置、方法以及传送语音的方法及其装置 - Google Patents
处理语音信号的装置、方法以及传送语音的方法及其装置 Download PDFInfo
- Publication number
- CN1303580C CN1303580C CNB2004100811440A CN200410081144A CN1303580C CN 1303580 C CN1303580 C CN 1303580C CN B2004100811440 A CNB2004100811440 A CN B2004100811440A CN 200410081144 A CN200410081144 A CN 200410081144A CN 1303580 C CN1303580 C CN 1303580C
- Authority
- CN
- China
- Prior art keywords
- word speed
- speed conversion
- signal
- voice signal
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 268
- 238000012545 processing Methods 0.000 title abstract description 48
- 238000006243 chemical reaction Methods 0.000 claims abstract description 458
- 230000005540 biological transmission Effects 0.000 claims abstract description 56
- 238000001514 detection method Methods 0.000 claims abstract description 6
- 230000008569 process Effects 0.000 claims description 237
- 230000008929 regeneration Effects 0.000 claims description 28
- 238000011069 regeneration method Methods 0.000 claims description 28
- 230000008859 change Effects 0.000 claims description 16
- 230000001172 regenerating effect Effects 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 30
- 238000004891 communication Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 7
- 238000012856 packing Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Communication Control (AREA)
Abstract
发送器(1)分解语音信号为包并复用这些包,同时发送伴随语音信号信息的语速转换执行信息。语速转换执行信息指示每个语音信号是否是其速率在发送端或前面的语音源中已转换的语音信号。语音信号处理装置(10A)检测在语速转换信息检测器(13)中复用和接收的信号中的语速转换执行信息。语速转换处理器(14)确定从语音信号解码器(12)输出的解码和选择的节目的选择语音信号是否在传输前经过语速转换处理。如果在传输前经过语速转换处理,语速转换处理器(14)关闭语速转换处理操作,避免在发送端和接收端以双重方式进行语速转换处理。如果在传输前未进行语速转换处理,语速转换处理器(14)执行语速转换处理。
Description
技术领域
本发明涉及一种处理语音信号装置和方法,特别是涉及用于处理语音信号的装置和方法,其包括被称作转换语速以帮助老年人容易听到语音的功能。
本发明还涉及用于传送语音的方法和装置,特别涉及在诸如蜂窝电话系统的语音传送系统中转换语速的方法和装置,该语音传送系统通常在清除接收条件下不传送语音。
背景技术
一个已经得到证实的事实是通常老年人在理解快速说出的语音时与年轻人相比有一定的困难。旨在帮助老年人,已经知道有一种用于处理语音信号的装置和方法,包括被称作转换语速的功能。转换语速的功能可通过以下实现。在输入的语音信号中识别出浊音语音中的停顿。利用停顿产生的时间,发声过程中产生的语音沿时间轴扩展而无需调整音阶高度,反而缩短了停断时间。相应地,浊音语音被整体转换为较慢的语音。(例如,参见日本专利申请公开号No.Hei.8-146985)。
在按照日本专利申请公开号No.Hei.8-146985用于处理语音信号的装置中,用于控制语速的语速控制信息预先存储在将被传输的数据、声音记录介质等中。然后,在声音再生装置或者用于声音记录介质的声音再生装置中基于语速控制信息控制语速,所述声音再生装置用于接收和再生所传输的数据。另外,已经开发了包括转换语速的功能的无线电技术(参见Imai,Takagi,Yomogida,Takeishi.“Choshukinou wo Sonaeta Rajio no Kaihatu[包括助听功能的无线电技术的发展]”。电子学研究所,信息及通信工程师,IEICE学报TL2003-7,2003年6月)。
顺便提及的是,这种语速转换技术已由广播代理机构积极地研究。可以想像的是,将来在电视和无线电广播中传送的语音信号领域中,传送者传递通过将语音经过速率转换处理得到语音信号,以方便收听的老年人。关于传送者已经变换语速的广播节目,很可能语速转换由接收者所执行的转换语速功能所复制。
这引起了一个问题,将语音经过语速转换处理得到语音信号被另一个语速转换处理的另外处理,因此转换的语速低于必需的语速,因而使得语音出乎预料地变得更加难以听清。对于传统的接收者,如果用户手动关闭转换语速的功能,这些问题就解决了。然而,对于每个广播节目,用户必须根据个节目是否已经经过语速转换处理而打开和关闭语速转换功能。这可能使用户感到厌烦。另外,当接收机在使用时期望老年人打开和关闭语速转换功能是不现实的。
另一方面,已经提出应用转换语速技术的电话装置并投入实际使用。该电话设备转换来话对方的语速(例如,参见日本专利申请公开No.Hei.2001-268175)。
根据日本专利申请公开No.Hei.2001-268175所公开的发明的安装于电话设备中用于传送语音的传统的装置使用显示对方电话号码的业务识别对方。这样,已经识别的对方的语音信号的时间轴相应于预先为每个对方寄存的语速延伸。
安装于电话设备中用于传送语音的传统的装置使电话设备将对方的语音信号经过语速转换处理。但是,在这种传统装置安装在蜂窝电话机中的情况下,很可能来自对方的语音信号包括很多噪音或者取决于无线电波的状况(也就是接收电话的条件)而被部分干扰。然而,如果这种在这样恶劣的接收条件下已接收的这种语音信号经过语速转换处理,这很可能带来一个问题,那就是该语音将出乎预料地变得难以收听。
发明内容
本发明是考虑了前述问题作出的。本发明的一个目的是提供用于处理语音信号的装置和方法,能够自动地防止利用附属于广播的语音信号的信息由发送者和接收者以复份的方式实现语速变换过程。
另外,本发明的另一个目的是供用于处理语音信号的装置和方法,能够不必根据接收的节目打开和关闭转换语速的功能。
本发明的又一个目的是供用于传送语音的方法和装置,通过将发送者的语音信号进行语速转换处理可以实现优选的语速转换处理,而不考虑无线电波条件。
为了实现上述目的,提供一种处理语音信号的装置,包括:一个接收器,接收通过复用语音信号和有关语速转换的附属信息获得的多路复用信号,所述附属信息表明在发送端该语音信号是否经过语速转换处理,该语速转换处理在时间上改变语音信号而不改变包含在语音信号中语音的音调;一个检测器,检测由接收器接收到的多路复用信号中的有关语速转换处理的附属信息并翻译该附属信息的内容;一个声音再生器,再生包含在由接收器接收到的多路复用信号中的语音信号;以及一个语速转换处理器,如果由检测器检测的有关语速转换的附属信息表明该语音信号在发送端没有经过语速转换处理,该语速转换处理器使由该声音再生器再生的语音信号经过语速转换处理,如果有关语速转换的附属信息表明该语音信号在发送端已经经受语速转换处理,该语速转换处理器不再使声音再生器再生的语音信号经受语速转换处理。
按照上述方面,接收语音信号以及从发送端发送的有关语速转换的附属信息,并且能够基于有关语速转换的附属信息自动地确定再生信息是否应该进行语速转换处理。
特别是,接收语音信号以及从发送端发送的有关语速转换的附属信息,并且能够基于有关语速转换的附属信息自动地确定再生语音信号是否应该进行语速转换处理。因此,在接收端的语音信号处理装置的用户一直能够听到从以最优选的语速转换设置已经收到的该语音信号再生的语音,该语音信号而不用对每个节目打开或关闭转换语速的功能。
而且,按照上述方面,已经经过语速转换处理的接收到的语音信号不再进行语速转换处理。为此,即使用户调谐到一个节目没有打开和关闭转换语速功能,也可以自动地防止在接收端和发送端以双重方式执行语速处理过程。
为了实现上述目的,提供一种处理语音信号的装置,包括:一个接收器,接收通过复用第一语音信号,指示第二语音信号是否存在的相应速率转换的语音存在/不存在信息,和如果该相应速率转换语音存在/不存在信息指示第二语音信号存在时的第二语音信号,所述第二语音信号是通过将第一语音信号经过语速转换处理得到的,该语速转换处理在时间上改变第一语音信号而不用改变包含在第一语音信号中语音的音调;一个检测器,检测由接收器接收的多路复用信号中的相应速率转换的语音存在/不存在信息并翻译相应的速率转换语音存在/不存在信息的内容;一个声音再生器,再生包含在该接收器所接收的多路复用信号中的第一语音信号或第二语音信号;以及一个语速转换处理器,如果第一语音信号不是经过语速转换处理的信号并且相应速率转换的语音存在/不存在信息指示相应于第一语音信号的第二语音信号存在,所述语速转换处理器选择地输出由声音再生器再生的第二语音信号,而如果第一语音信号不是经过语速转换处理的信号并且相应速率转换的语音存在/不存在信息指示相应于第一语音信号的第二语音信号不存在,所述语速转换处理器将声音再生器再生的第一语音信号进行语速转换处理。
按照上述方面,接收第一语音信号、指示相应于第一语音信号的第二语音信号是否存在的相应速率转换语音存在/不存在信息和如果该相应速率转换语音存在/不存在信息指示第二语音信号存在时的第二语音信号。如果第一信号不是经过语速转换处理的信号并且相应速率转换语音存在/不存在信息指示相应于第一语音信号的第二语音信号存在,将输出第二语音信号。如果相应速率转换语音存在/不存在信息指示相应于第一语音信号的第二语音信号不存在,则第一信号将进行语速转换处理。因此,已从发送端发送并且已经过语速转换处理的语音信号可能尽可能多地利用。
结果,当在接收端的语音信号处理装置中执行语速转换处理时,该装置在该再生语音中将不产生间断,并且能够避免语速转换本身不能以平滑的方式最大限度地执行的现象,另外,语音信号处理装置消耗的电能可以减少,因为按照本发明的语音信号处理装置被设计为尽可能使用发送器所发送的且经过语速转换处理的语音信号。
为了实现上述目的,提供一种处理语音信号的装置,包括:一个接收器,接收通过复用多个语音信号和语速转换适用性信息得到的多路复用信号,所述语速转换适用性信息指示多个语音信号中的每个语音信号是否适于进行语速转换处理,该语速转换处理在时间上改变语音信号而不改变包含在语音信号中语音的音调;一个检测器,检测接收器所接收到的多路复用信号中语速转换适用性信息并翻译语速转换适用性信息的内容;一个声音再生器,再生包含在接收器所接收到的多路复用信号中的每个语音信号;以及一个语速转换处理器,如果由检测器检测的语速转换适用性信息指示语音信号适于进行语速转换处理,该语速转换处理器使声音再生器再生的每个语音信号经过语速转换处理,如果由检测器检测的语速转换适用性信息指示语音信号不适于进行语速转换处理,该语速转换处理器不再使声音再生器再生的语音信号经受语速转换处理。
按照上述方面,接收到多个语音信号和指示多个语音信号中的每个语音信号是否适于进行语速转换处理的语速转换适用性信息,并且仅当语速转换适用性信息指示语音信号适于进行语速转换处理时对每个语音信号进行语速转换处理。
即根据这个方面,仅仅自动地确定适合于语速转换的语音信号并且进行语速转换处理。
为了达到上述目的,提供一种处理语音信号的方法,包括:第一步骤,接收通过复用语音信号和有关语速转换的附属信息得到多路复用信号,所述附属信息指示在发送端所述语音信号是否经过语速转换处理,所述语速转换处理在时间上改变语音信号而不改变包含于语音信号中语音的音调;第二步骤,检测在复用的和接收的信号中的有关语速转换的该附属信息,并翻译附属信息的内容;第三步骤,再生包含在所复用的和接收的信号中的语音信号;第四步骤,如果在第二步骤中检测的有关语速转换的附属信息指示该语音信号在发送终端没有经过语速转换处理,对再生语音信号进行语速转换处理;以及第五步骤,如果在第二步骤中检测到的有关语速转换的附属信息指示该语音信号在发送端已经经过语速转换处理,输出再生语音信号,而该再生信号不进行语速转换处理。
按照上述方面,接收语音信号和从发送端发送的有关语速转换处理的附属信息,并且基于该附属信息自动确定是否应当对所述再生信号进行语速转换处理。
另外,为了达到上述目的,提供一种处理语音信号的方法,包括:第一步骤,接收通过复用多个语音信号和语速转换适用性信息得到的多路复用信号,所述语速转换适用性信息指示多个语音信号的每个语音信号是否适合进行语速转换处理,所述语速转换处理在时间上改变语音信号而不改变包含于语音信号中语音的音调;第二步骤,检测复用的和接收的信号的语速转换适用性信息,并翻译语速转换适用性信息的内容;第三步骤,再生包含在复用的和接收的信号中的每个语音信号;第四步骤,如果在第二步骤中检测的语速转换适用性信息指示该语音信号适于进行语速转换处理,确定经过语速转换处理的、相应于在第三步骤中再生的语音信号的相应的语音信号是否包含在该复用的和接收的信号中;第五步骤,如果在第四步骤中确定该相应的语音信号包含在该复用的和接收的信号中,转换到并再生包含在该复用和接收的信号中的该相应的语音信号;第六步骤,如果在第四步骤中确定该相应的语音信号不包含在该复用的和接收的信号中,对第三步骤中再生的语音信号进行语速转换;以及第七步骤,如果在第二步骤中检测的语速转换适用性信息指示该语音信号不适于进行语速转换处理,输出第三步骤中再生的语音信号,而不对该语音信号进行语速转换处理。
根据上述方面,接收多个语音信号和指示多个语音信号的每个语音信号是否适合进行语速转换处理的语速转换适用性信息。然后,仅当伴随该语音信号的语速转换适用性信息指示该语音信号适于进行语速转换处理和经过语速转换处理的相应的语音信号相应于所述语音信号不包含在该复用的和接收的信号中时,对每个语音信号进行语速转换处理。
为了达到以上目的,提供一种传送语音方法,其中语音信号在第一终端和第二终端之间双向传送,该方法包括:第一步骤,从第一终端向第二终端发送语速转换请求信号;第二步骤,使第二终端接收语速转换请求信号;以及第三步骤,使已经接收该语速转换请求信号的第二终端对将待发送的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。
根据上述方面,已经接收语速转换请求信号的第二终端对将待发送的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。因此,第一终端可以接收经过语速转换处理的发送的语音信号。
换句话说,按照本方面,由于语速转换是通过给予发送终端优先权执行的,接收端的终端用户可收听到其速率被转换的语音,而不受传输线路的无线电波条件(接收呼叫的条件)的影响,因此,用户,即便是老年人,也能清晰地听到对方的语音。
此外,为了达到以上目的,提供一种传送语音方法,其中语音信号在第一终端和第二终端之间通过中继器进行双向传送,个方法包括:第一步骤,从第一终端向第二终端发送语速转换请求信号;第二步骤,使该中继器接收语速转换请求信号;以及第三步骤,使已经接收该语速转换请求信号的中继器将从第二终端发送到第一终端的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。
根据上述方面,已经接收语速转换请求信号的中继器对将从第二终端发送到第一终端的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。因此,第一终端可以从该中继器接收从第二终端传送的并且经过语速转换处理的语音信号。
因此,根据本方面,即使第一终端和第二终端均不具备转换语速功能,也可以听到经过语速转换处理的语音。
另外,为了达到以上目的,提供一种传送语音方法,其中语音信号在第一终端和第二终端之间双向传送,该方法包括:第一步骤,发送从第二终端和第一终端待发送的具有指示有声音段标记的语音信号;第二步骤,使第二终端接收所发送的语音信号和该标记;第三步骤,使已经接收所发送的语音信号和标记的第二终端检测该标记;以及第四步骤,已经接收所发送的语音信号和该标记的第二终端根据第三步骤中所检测标记仅对所接收的语音信号中的有声音段进行语速转换处理。
根据上述方面,已经接收所发送的语音信号和标记的第二终端检测所接收信号中的标记,并根据检测的标记仅对所接收的语音信号中的有声音段进行语速转换处理。因此,可避免对这些有声音段以外的任何有声音段进行语速转换处理。
相应地,与在发送端的第一终端具有转换语速的功能的情况相比可以缩短处理路径,而且第二终端能够确定地把语速转换处理仅应用于这些有声音段,即使接收条件并不理想。因此,可以避免在语速转换处理中的任何故障。
另外,为了达到以上目的,提供通过中继器与作为对方的终端双向传送语音信号的装置,该装置包括:一个操作单元,语速转换请求信号通过该操作单元输入;和一个语速转换请求信号发送单元,发送一个语速转换请求信号请求作为对方的终端或该中继器根据通过该操作单元输入的语速转换请求对作为对方的终端的语音信号进行语速转换处理。
根据上述方面,语音信号传送装置可以请求作为对方的终端或中继器对作为对方的终端的语音信号进行语速转换处理。
另外,为了达到以上目的,提供与作为对方的终端双向传送语音信号的装置,该装置包括:一个语速转换请求信号检测器,接收从作为对方的终端发送的信号,并检测在接收的信号中的语速转换请求信号;一个语速转换处理器,基于由语速转换请求信号检测器检测的语速转换请求信号对待发送的语音信号进行语速转换处理;以及一个发送器,将由语速转换处理器进行语速转换处理的语音信号发送至作为对方的终端。
根据上述方面,接收语速转换请求信号的语音信号传送装置可以对待发送的语音信号进行语速转换处理,并将其语速已经转换的语音信号发送至作为对方的终端。
另外,为了达到上述目的,提供一种放置在传输线上的传送语音信号的装置,通过该传输线该语音信号在第一终端和第二终端之间双向地发送以便中继该语音信号,该装置包括:一个语速转换请求信号检测器,检测在从第一终端和第二终端的一个终端发送的信号中的语速转请求信号;一个语速转换处理器,基于由语速转换请求信号检测器检测的语速转换请求信号对待发送至已经提出语速转换请求的终端的语音信号进行语速转换处理;以及一个中继器,将要由语速转换处理器作语速转换处理的语音信号中继至已经请求语速转换的终端。
按照上述方面,当中继信号的语音信号传送装置检测从第一终端和第二终端的一个终端发送的信号中的语速转请求信号时,该装置可以将待发送至已经请求语速转换的终端的语音信号进行语速转换处理。
当结合附图阅读时从下面的详细描述中本发明的特性、原理和适用性将更加明显。
附图说明
在下面的附图中:
图1是按照本发明第一实施例的语音信号处理装置的方框图;
图2是表示在第一实施例中发送和接收的语速转换执行信息的一个例子的图;
图3是描述图1的语速转换处理器的操作的流程图;
图4是按照本发明第二实施例的语音信号处理装置的方框图;
图5A,5B和5C是分别表示语音、相应的速率转换的语音存在信息以及语速转换适用性信息的图;
图6是描述按照图4所示的实施例的操作的流程图;
图7是描述按照本发明第三实施例的操作的流程图;
图8是按照适用于本发明的语音通信装置的第四实施例的语音通信系统的方框图;
图9是描述图8所示的操作的流程图;以及
图10是按照适用于本发明的语音通信装置的第五实施例的语音通信系统的方框图。
具体实施方式
下面将参照附图描述本发明的一个优选实施例。首先,要明确的是实施例适于控制转换语速功能的打开和关闭是假设附属于语音信号的信息已经由发送者发送。
图1是按照本发明适合于语音信号处理装置的第一实施例的方框图。在图1中,按照第一实施例的语音处理装置10A通过传输线3与发送器1相连。发送器1打包和复用语音信号的记号(score)并发送该多路复用信号。语音处理装置10A通过传输线3接收发送器1所发送的多路复用信号。而且,语音处理装置10A从所接收的信号中选择期望的信号并得到通过解码该期望的信号输出的语音,和转换待输出的语音的语速。
这里,该发送器1使打包器2分解语音信号(图1示出了第一至第五语音信号)为各个语音包,之后基于包含在各个语音包中、用于标识语音包的包标识(PID)通过相互划分语音包来发送该语音包。除了语音包,发送器发送有关控制和节目的信息包。为了使接收者能选择所期望的语音信号,在移动图片专家组(MPEG)中定义的诸如程序相关表(PAT)和程序映射表(PMT)的信息作为有关控制和节目的信息的一部分被发送。
关于包括特定PID的PAT,传送分组的视频和语音信息的有关PMT的PID的信息被发送,该视频和语音信息构成一个节目。在PMT中,构成该节目的视频和语音的包的PID对每个节目进行编码。这使得它能够通过使用这些条信息提取与所期望节目相关的视频和语音信号中特定的信号。
另外,根据本实施例,有关每个语音信号是否是其语速已经由发送端的一个装置转换的语音,或者每个语音信号是否是其语速已经在更前面的语音源(语速转换执行信息,示于图2中)中转换将作为附属于语音信号的信息发送。语速转换执行信息可设计为通常特定地以特殊的PID格式传送。或者,有关PID的信息可在PMT或类似物中进行编码,以使得在接收端的一个装置可得到该信息。在图2中,发送一个信息并附带语音包的PID,该信息在表格将“1”分配给其语速已经转换的语音包和将“0”分配给其语速未转换的语音包。
语音信号处理装置10A使接收器11通过传输线3接收有关控制和节目的信息的多路复用信号,包括语速转换执行信息,以及语音包。语音信号处理装置10A使语音信号解码器12解码接收的信号中的语音包,并且使语速转换信息检测器13通过获取PID中的接收信号的语速转换执行信息包检测语速转换执行信息。
语速转换处理器14基于语速转换信息检测器13检测的语速转换执行信息按照图3所示的流程图将从语音信号解码器12输出的已解码语音信号进行语速转换。换句话说,语速转换处理器14基于检测的语速转换执行信息确定从语音信号解码器12输出的解码的和选择的语音信号在发送以前是否已经经过语速转换处理(图3中的步骤S101)。如果语音信号解码器12输出的解码的和选择的语音信号在发送以前已经经过语速转换处理,在将语速转换处理的操作关闭时,所接收的语音信号被输出到输出终端15而不执行语速转换处理(图3中的步骤S102)。如果语音信号解码器12输出的解码的和选择的语音信号在发送以前没有经过语速转换处理,语速转换执行过程的操作被打开,所接收的语音信号在经过公知的语速转换处理后输出到输出终端15,所述语速转换处理压缩/扩展代表所接收语音信号的有声音段的信号的时间轴,且删除所接收信号的无声段,该无声段长于规定的长度(图3中的步骤S103)。
如上所述,按照本实施例,即使每次用户调谐到节目时不打开或关闭转换语速的功能,也可以自动地防止在发送端的装置和在接收端的装置以双重方式执行语速转换处理。由于下列机制这是可能的。指示每个语音信号是否是其语速已经由发送端的装置转换的语音或者每个语音信号是否是其语速已经在更前面的语音源中已转换的语音的语速转换执行信息将被发送。基于语速转换执行信息,语音信号处理装置10A设计为自动确定所接收的语音信号是否已经经过语速转换处理。另外,语速转换处理装置10A设计为使语速已经经过转换的接收的语音信号进行非语速转换处理。
下面描述本发明的第二实施例。图4是适用于按照本发明的信号处理装置的第二实施例的方框图。图中,与图1所示的相同的组成部件以相同的标号表示,且省略该部件的说明。在图4中,根据本发明第二实施例的语音信号处理装置10B通过传输线3与发送器4相连,并且接收多个节目,该多个节目特别由视频和多个语音的组合组成,由发送器4发送。
如图4所示,发送器4发送多个节目,每个节目由单个的视频信号和相应的多个语信号以该多个节目分为节目1#和节目2#的方式组成。这一点来说,对于每个程序,在相应的PID的基础上,打包器5分解视频信号和相应的语音信号为包并在识别视频信号和语音信号时复用这些包。每个节目的PMT信息以PMT形式发送。对于包含在每个节目中的视频信号和相应的语音信号,相关视频信号的PID和相应的语音信号的PID的表以PMT形式发送。这使得语音信号处理装置10B可使用该信息和该表识别包含期望的节目的视频信号和相应的语音信号的包。因此,可以通过解码包含在这些包中的信息得到视频和语音信号。
这里,语音信号处理装置10B使接收器11接收已经发送的打包和复用的信号。接收的和打包的信号中,诸如PAT和PMT的控制信号提供给微处理器17。基于这样得到的信息以及语音信号处理装置10B的用户通过人工接口装置16(按钮,键盘,显示屏幕以及需要时可以使用的光标移动键)输入的信息,提取用户期望的节目的视频和语音信号。在接收器11中纠错后,语音信号提供给该语音信号解码器12,而视频信号提供给视频信号解码器18。在这里,每个节目存在多个语音信号,并且语音信号处理装置10B被设计为使用户可选择哪个语音信号将被解码或从多个语音信号中输出。
根据诸如MPEG2的方案这样选择和解码的视频信号由视频信号解码器18解码并作为视频信号输出到视频输出终端19。另一方面,这样选择的语音信号由该语音信号解码器12解码,之后输入到语速转换处理器14。语音信号在逐个情况的基础上前进到下列二个情况之一。这里,如下面所述的,该语音信号经过进行语速转换处理。否则,在这里,通过关闭转换语速的功能或旁通语速转换处理器,该语音信号实际上不进行语速转换处理。从语速转换处理器14输出的语音信号通过D/A转换器以模拟语音信号的形式输出到语音输出终端15,这种情况未示出。
图5A示出节目的语音信号组合的一个例子。这个例子包括三种基本类型的语音信号:日语的主音级语音(mainvoice-grade speech),日语的次音级语音(subvoice-grade speech)以及英语语音。对于三种基本类型中的日语主音级语音和英语语音的信号,分别从日语主音级语音和英语语音的信号中分开发送在发送端的装置已经对其进行语速转换处理的语音信号。另外,发送仅包含音乐的语音信号,该音乐适于与该节目的视频一起再生作为背景音乐(BGM)。还发送“广播电台通知”的语音信号,提供有关新节目的信息、节目的广播时间变化等。从而该类型的语音信号数的总和达到7。
如果这些语音信号中的每个语音信号具有语音数据,该数据是通过将每个原始语音信号经过语速转换处理作为相应的速率已转换的语音数据得到的,每个原始的语音信号和相应的速率已转换的语音数据之间的相应关系也以表的形式被发送。图5B示出了该例子。这里,对于同一程序,写入图5B说明的右栏中的标号对应于写于对于相同节目的图5A中的每个语音信号说明的左栏中的标号。在这个表格中,原始的语音和相应的速率已转换的语音以这个顺序排列。这个表格列出了具有类似相关的所有语音。这个表格中指示的信息以放置在该列末尾的“End”信息终结。
在由包括PID的另一信息标记时可发送相应的速率已转换的语音数据,该PID对于在PMT中描述的这个传输是特有的。除此之外,语音信号处理装置10B提供图2所示的语速转换执行信息给微处理器17并且处理该信息。
图6示出微处器17按照语音信号处理装置10B中的语音信号执行操作的实例。与图3所示的相同步骤的图6中的步骤以相同的标号和符号表示。首先,微处理器17基于所检测的语速转换执行信息确定从语音信号解码器12输出的解码的和选择的节目的所选择的语音信号是否在传输前已经进行语速转换处理(图6中的步骤201)。
如果从语音信号解码器12输出的解码的和选择的节目的所选择的语音信号在发送前已经进行语速转换处理,通过关闭语速转换处理的操作将接收的语音信号输出到输出终端15而不执行语速转换处理(图6中的步骤S102)。另一方面,如果基于步骤S201中的语速转换执行信息判断从语音信号解码器12输出的解码的和选择的节目的所选择语音信号在发送前没有进行语速转换处理,微处理器17确定其语速已经转换的语音是否已经发送,该语音相对于该选择的语音信号(图6中的步骤S202)。这一确定可参照图5B中所示的相应的速率已转换语音存在信息进行。
如果在步骤S202中发现已经发送其语速已经转换的语音,该语音相对于该选择的语音信号,则在接收器11中提取的语音信号被转换为该语音信号(图6中的步骤S203)。在这种情况下,由于通过语音信号解码器12解码再生的语音信号是已经经过语速转换处理的语音信号,微处理器17前进到步骤S102,由语速转换处理器14执行的转换语速处理被关闭。另一方面,如果在步骤S202中发现未发送已经转换语速的语音语音,该语音相应于选择的语音信号,则微处理器17前进到步骤S103,从语音信号解码器12输出的语音信号由语速转换处理器14执行语速转换处理。
按照本实施例,当从发送器4发送其语速已转换的语音时,将尽可能按照上述使用该语音。其原因如下,只要使发送器4转换语速,通过记录锚定人(anchor persons)的声音和节目的安排(cast of a program)得到的语音可首先进行语速转换处理,之后可将背景音乐等叠加在已经过语速转换处理的语音上。相反,如果在接收终端的语速转换处理装置10B使得包括背景音乐等的语音经过语速转换处理,该背景音乐可以插入扰动的节拍,并且由于没有依赖于背景音乐水平的无声段,语速转换本身不可能以期望的方式实现。考虑到这些因素,优选地在发送终端执行语速转换处理,如果可能的话。另外,由于不要求接收端的语音信号处理装置10B执行语速转换处理,这可导致电能消耗减少。
下面将描述本发明的第三实施例。根据本实施例,代替在第一实施例中发送的语速转换执行信息,发送图5B所示的相应速率转换的语音存在信息和图5C所示的语速转换适用性信息。这样,在接收端的语音信号处理装置被设计为能够只对在发送端其语速未转换的并且适于语速转换的语音进行语速转换处理。
图5C示出语速转换适用性信息的例子,该语速转换适用性信息是这样得到的:如果语音适于语速转换,以“1”表示图5中节目的每个语音,或如果语音不适于语音转换,则以“0”表示每个语音。从这点来说,日语主音级语音(语音1),日语次音级语音(语音2)以及英语语音(语音3)被定义为适于语速转换。而且,第四和第五语音是通过将日语主音级语音以及英语语音分别进行语速转换处理得到的语音,因此第四和第五语音不适于语速转换。因此,第四和第五语音以“0”表示。另外,指定为“BGM”的第六语音的内容(语音6)是音乐而不是人的声音。鉴于此种原因,第六语音不适于作语速转换。指定为“广播电台通知”(语音7)的第七语音的内容是锚定人的发声的通知。因此,第七语音适于语音转换处理。
参照图7中的流程图,将描述处理的例子,该处理是在发送这种语速转换适用性信息的情况下由接收端的语音信号处理装置中的微处理器执行的。随便说说,与图3和图6所示的处理步骤相同的图7中的处理步骤以同样的标号和符号表示。首先,该微处理器确定选择的语音是否适于在接收端进行语速转换(图7中的步骤S301)。这个确定是通过提取并参照所发送的语速转换适用性信息而作出的。
如果在步骤S301判断选择的语音不适合在接收端进行语速转换,微处理器就不执行语速转换处理(图7中的步骤102)。在图5C所示的情形中,这是具有第四或第五语音信号的情形,如果选择第四和第五语音信号,第四或第五语音信号已经经过语速转换处理。这也是具有第六语音信号(BGM)的情形,它在发送端没有进行语速转换处理,如果选择选择第六语音信号,它本身是不适于进行语速转换。
另一方面,如果在步骤S301中判断选择的语音适于进行语速转换,微处理器确定是否已经发送其语速已经转换的语音,该语音相应于选择的语音(图7中的步骤S202)。这一确定可通过提取并参照在图5B所示的接收信号中的相应的速率已转换的语音存在信息而作出。
步骤S202之后的处理是与根据第二实施例所执行的处理相同。如果已经发送其语速已经转换的、相应于选择的语音的语音,则微处理器将处理切换到相应的语音,而在接收端不执行语速装换处理(图7中的步骤S203和步骤S102)。如果没有发送其语速已经转换的、相应于选择的语音的语音,微处理器在接收端执行语速转换处理(图7中的步骤S103)。
因此,根据本实施例,其语速已转换的、相应于第一语音(即日语主音级语音)和第三语音(即英语语音)的语音存在于图5B所示的情形中,并且微处理器17将处理切换到相应的语音(第四和第五语音信号分别相应于第一和第三语音)。另一方面,如图5C所示,虽然第二语音(即日语次音级语音)和第七语音(即“广播电台的通知”)适于进行语速转换,第二语音和第七语音在发送端没有经过语速转换处理。为此,接收端的语音信号处理装置执行语速转换处理。
根据本实施例,这样,如果选择的语音信号在发送端没有经过语速转换处理,则在接收端确定选择的语音信号是否适于进行语速转换,并且只有适于语速转换的语音信号通过自动地识别该语音信号在接收端可进行语速转换处理。
应当注意,本发明并不限于上述的实施例。例如,步骤S202和S203可从图7所示的流程图中删去,并且当选择的语音适于进行语速转换时,该选择的语音可前进到步骤S103,在此选择的语音经过语速转换处理。另外,本发明包括使语音信号处理装置10A和10B以计算机实现的计算机程序。在这种情况下,计算机程序可从记录介质装载到计算机。或者,计算机程序可通过通信网络下载到计算机。
接下来描述适于蜂窝电话机等语音通信的实施例。在语音通信中,请求在语音信号经过语速转换处理后发送的语音信号的信息被发送到对方或中继装置的终端,且使对方或每个中继设施的终端在使发声的语音经过语速转换处理后发送对方的发声的语音。通过接收这个发声的语音,可以听到其语速已经转换的语音。
图8是适于按照本发明第四实施例的语音通信装置的语音通信系统的方框图。在图8所示的语音通信系统中,便携式无线终端100和200通过传输线300以双向通信相互连接在一起。便携式无线终端100是按照本实施例的语音通信装置,并且也设计为包括和便携式终端几乎相同的结构。便携式无线终端100和200分别包括:在处理语音信号诸如调制和解调通信的语音信号后发送和接收该语音信号的发送和接收单元101和201;将高效解码处理用于待发送的语音信号以减小其信息量以及将解码处理用于已应用高效解码处理的接收的语音信号的编译码器(CODEC)102和202。
另外,便携式无线终端100和200分别包括:操作单元103和203,操作单元103和203包括10键键盘和用于输入期望信息的一个按钮;微处理104和204,基于操作单元103和203来的信号对各个终端作为整体进行总的控制;和语速转换器105和205,当认为必要时用于执行语速转换处理,语速转换处理器105和205分别与CODEC 102和202相连。
麦克风106和206分别通过A/D转换器107和207与语速转换处理器105和205相连,而语速转换处理器105和205分别通过D/A转换器108和208与扬声器109和209相连。麦克风106和206收集便携式无线终端100和200的用户说出的语音,并转换为作为电信号的模拟语音信号。此后,模拟语音信号由A/D转换器107和207转换为数字语音信号,且输入到语速转换装置105和205。另一方面,来自每个对方的语音从语速转换处理器105和205以数字信号的形式输出,并由D/A转换器108和208转换为模拟语音信号。然后,模拟信号由扬声器109和209以下面的方式进行电-声转换处理,语音以便携式无线终端的使用者可以收听的声音产生。这样,发送谈话的内容。
另外,在便携式无线终端100中,存储器110同微处理器104相连。通过控制微处理器104从存储器110中检索语速转换请求信号111,并通过无线电从接收和发送单元101发送到传输线300。这样,语速转换请求信号111被传送到对方的便携式无线终端200。
应当注意,虽然便携式无线终端200不包括对应于图8中的存储器104的存储器,便携式无线终端200当然可能包括等效的功能。语速转换请求信号111的规范可以下面的方式由发送和接收的信号格式来定义,语速转换请求信号111可照原样识别。
在这点上,基本上如果在接收语速转换请求信号端的便携式无线终端(在图8所示的情形中为便携式无线终端200)包括转换语速的功能,在接收语音信号端的便携式无线终端(在图8所示的情形中为便携式无线终端100)可不必包括转换语速的功能,该语音的速率已经由对方通过发送语音转换请求信号已经转换了。
然而,如果使在它们之间进行通信的便携式无线终端100和200分别包括语速转换处理器105和205,可预期达到以下通用性。而且当用作对方的便携式无线终端要接收速率转换的语音时,可执行语速转换。另外,当作为对方的便携式无线终端不包括转换语速的功能时,即使语速转换请求信号发送到作为对方的便携式无线终端,来自对方的语音可在接收端进行语速转换。
应当注意,虽然未示出,每个便携式无线终端100和200包括显示多条信息的显示面板。该显示面板显示对方的电话号码,或显示附属于通信的条件,如利用条形图显示无线接收的条件。另外,有关便携式无线终端100和200等的电话号码的信息以及用于控制的各种信号可在传输线300上通过输出一个信号发送到作为对方的便携式无线终端和诸如基站(未示出)的中继设备,所述信号是从微处理器104和204传送到发送和接收单元101和102。
接下来参照图9所示的流程图描述按照本实施例的操作,引述一种情形,语音转换请求信号111从便携式终端100输出。首先,微处理器104和204监视是否已经执行请求转换语速的操作(步骤S401)。在这时,由于便携式无线终端100的用户使用操作单元103执行请求语速转换的操作,微处理器104检测请求语速转换的操作已执行。微处理器104从存储器110中检索语速转换请求信号111,并将语速转换请求信号111提供给发送和接收单元101。之后,语速转换请求信号111通过无线电波从发送和接收单元101传送到传输线300(步骤S402)。
随后,微处理器104等待直至从便携式无线终端200发送指示语速转换处理可以执行的信号(步骤S403)。这一操作以如下方式执行,即微处理器104监视来自发送和接收单元101的信号,所述发送和接收单元101已经接收指示语速转换处理可以执行的信号。
换句话说,作为对方的便携式无线终端200通过传输线300接收语速转换请求信号111。当确认接收时,微处理器204从存储器检索指示语速转换处理可以执行的信号,这过程未示出,并且使发送和接收单元201通过无线电发送指示语速转换处理可以执行的信号给便携式无线终端100,所述便携式无线终端100最初已发送语速转换请求信号111。指示语速转换处理可以执行的信号是以信号可照原样识别的方式以信号格式定义,如在语速转换请求信号111的情形那样。
当微处理器104确认指示语速转换处理可以执行的信号已经从对方发送时,微处理器104在认为必要时作出诸如在显示面板上显示“语速转换进行中”等动作,之后结束处理。然后,便携式无线终端的用户开始通话。在这种情况下,即便是无线电波状况(无线电接收条件)很差,由于在发送终端的便携式无线终端200已经发送语速已经转换的语音信号,便携式无线终端的用户也可以收听到已经经过语速转换处理的语音而不受无线电波状况(无线电接收条件)的影响。因而,这使得便携式无线终端100的用户,即便该用户是老年人,也能够轻易听到对方的语音。
另一方面,当微处理器14不能确认已经收到指示语速转换处理可以执行的信号时,微处理器104检查是否收到“指示语速转换处理不能执行的信息”,或者微处理器104等待指示语速转换处理可以执行的信号的时间是否超过规定的时间长度(步骤是S404)。当接收“指示语速转换处理不能执行的信息”,或者微处理器104等待指示语速转换处理可以执行的信号的时间超过规定的时间长度时,微处理器104确定作为对方的便携式无线终端200无法满足转换微处理器所发送的语速的请求。于是,微处理器104采取次优的措施使包含在便携式终端100中的语速转换处理器105对所接收的语音信号进行语速转换处理(步骤S405)。
在这种情况下,由于无线电信号接收状态等较差,例如如果无线电接收电平低于一定的电平,如果最好不执行语速转换处理,微处理器104可强制地关闭转换语速的功能。正如在“语速转换请求信息”和“指示语速转换处理可以执行的信息”的情形下,“指示语速转换处理不能执行的信息”需要以它可照原样识别的方式以信号格式定义。
由于成本考虑等的原因,应该允许指示语速转换处理不能执行的信息从不包括转换语速功能的终端发送,但至少能够响应请求语速转换的输入信息。然而,当有关语速转换这样的信息没有被定义时,既不能从终端发送指示语速转换处理可以执行的信息,也不能从终端发送在过去已经产生的指示语速转换处理不能执行的信息,以及不能从不满足变换语速转换功能的电话服务公司的终端发送。
考虑到这些,按照本发明的这个实施例,如果在步骤S404中即使经过了一定的时间也没有出现响应,作为对方的终端可被视为不具备转换语速功能。在步骤S404中,当不能确认指示语速转换处理不能执行的信息的接收时,和微处理器104等待信号的时间不超过规定的时间长度,控制回到步骤403,微处理器104等待直至接收指示语速转换处理可以执行的信号。
下面描述本发明的第五实施例。图10是语音通信系统的方框图,采用根据本发明第五实施例的语音通信装置。图中,与图8所示的相同构成部件以相同的标号表示,并且省略对部件的说明。在图8所示的语音通信系统中,由作为通信对方的便携式无线终端200执行语速转换处理和语速已转换的语音的发送。然而,按照本实施例,提供转换语速的功能给传输线上的诸如基站400的中继设施,代替作为对方的便携式无线终端200。所述中继设施基于语速转换请求将从对方发送的语音信号进行语速转换处理。
换言之,便携式无线终端120和210并不装备语速转换处理器,但是中继设施的基站400装备了语速转换处理器404。基站400包括:中继器401,用于中继在便携式无线终端120和210之间传送的信号;语速转换请求信号检测器402,用于检测语速转换请求信号;解码器403,将解码过程应用于由中继器401接收的高效编码的语音信号;语速转换处理器404,用于将解码器403发送的语音信号进行语速转换处理;和编码器405,再次将高效编码处理用于其速率已转换的语音信号。
随便说说,基站400同位于基站400的无线覆盖区内的便携式无线终端120和210进行直接通信。另外,在便携式无线终端120和210之间的传输线上提供诸如基站等其它中继设施而不是基站400。然而,这些中继设施很方便地省略。
下面描述根据本实施例的操作,位于基站400的语速转换请求信号检测器402监视中继器401提供的信号并检查语速转换请求信号是否包括在通过基站400发送的语音信号中。如果语速转换请求信号检测器402检测到从便携式无线终端120寻址到便携式终端210的语速转换请求信号包含在所中继的信号中,语速转换请求信号检测器402给中继器401发布一个命令,即中继器401应当在对从便携式无线终端210发送至便携式无线终端120的语音信号进行语速转换处理后,在该通信中发送从便携式无线终端120寻址到便携式终端210的语音信号。
接收该命令的中继器401使所提供的语音信号进入以下处理,所述语音信号是从便携式无线终端120寻址到便携式终端210。
特别地,中继器401使解码器403预先解码所提供的语音信号,近而使语速转换处器404对提供的和解码的语音信号进行语速转换处理,进而使解码器405再次将高效的编码处理应用于其速率已经转换的语音信号,并输出高效编码的信号。然后,中继器401将这样处理的语音信号通过无线电发送至该便携式无线终端。
如上所述,根据本实施例,当语音信号通过中继设施即基站400中继时,执行语音信号的语速转换处理。因此,本实施例带来一个优点,即使作为要求转换语速的对方的的便携式无线终端210不包括如第四实施例的情况中的转换语速的功能,基站400能满足转换语速的要求。
然而,通过这个方法,关于从基站400到接收其语速已转换的语音信号的通信,由于在发送端执行语速转换处理,语速转换处理是在良好的条件下执行,而与无线电接收条件无关。然而,可信的是,当从作为对方的便携式无线终端210到在接收端的基站400的无线电波状态较差时,当在基站40对该语音进行语速转换处理时,在基站400之前该语音已经变成这样的状态,语音的质量变得太差而难以听清。
考虑上述情况,下面可作为本实施例的进一步改进方案。当作为对方的终端装备转换语速的功能时,该终端对其中的语音信号进行语速转换处理。并且只在作为对方的终端不装备转换语速的功能时,在基站执行语速转换处理。另外,如果语音信号通过多个基站发送,当多个基站之一对语音信号进行语速转换处理时,指示语速转换处理已经执行的标记加到该语音信号上,然后发送附带该标记的语音信号,之后检测该标记的其它基站不能执行语速转换处理。
根据图10所示的本发明的一个方面,基站400中需要执行语速转换处理的设施。可允许这些设施由付了特殊费用的用户使用,所述特殊费用是除了使用蜂窝电话的常规费用外的设备使用费,并且在确认对请求转换语速的电话机收取特殊费用后可执行语速转换处理。
应当注意,本发明不限于上述实施例和方面。例如,在图8和图10中,已描述的实施例和方面引述以下情况:便携式无线终端100和120的对方分别也是便携式无线终端,即终端200和210。本发明不限于这些情况。便携式无线终端100及其对方之一反而可能是固定电话终端。而且便携式无线终端120及其对方反而可能是固定电话终端。在这种情况下,传输线300由移动无线通信网和公共电话通信网组成。
另外,在发送端的终端可以传送具有指示相应于有声音段的语音信号段的标记的语音信号,而没有转换语速的功能,而在接收端的终端仅对其标记从语音信号中检测出来的有声音段进行语速转换处理。当无线电波状态(无线接收条件)差时,由于叠加在语音信号上的噪音而难于在有声音段和无声段之间区别开。因此,可能的是有声音段以外的段经受语速转换处理,使得它可能变得难以听清该语音。然而,根据本实施例,在接收端的终端可以使用标记识别有声音段,发送所述标记是为了加强抗错能力到这样的程度,可检测该有声音段而与该叠加的噪音无关。因此,可防止语速转换处理的任何故障(误操作),即使在噪音被叠加在所传输的语音信号上。
这使得在发送终端的负荷(诸如处理能力,电能消耗)与在该发送端执行语速转换理的情形相比降低了。随便说说,作为传送上述标记的特定方式,具有以下方式:一种方式,其中指示语音信号时间的相应点是否代表有声音段的标记在每个特定的时间周期中发送,以及一种方式,其中每个有声音段附加地发送指示语音段开始和结束的两个标记。
另外,虽然基站400装备用于在图10所示的方面中执行语速转换处理的设施,可以提供执行语速转换处理的设施给其它中继装置,诸如交换机,而不是基站400。另外,虽然在图8所示的实施例中已经说明从存储器110中检索语速转换请求信号111,微处理器104本身可基于来自操作单元103的信号通过算术运算产生语速转换请求信号,而不参照存储器110,并且通过无线电将所产生的语速转换请求信号111经由发送和接收单元101发送到传输线300。
应当懂得,本发明的许多改变和改进对于本领域人员变得清楚了,并且意图在所附的权利要求书的范围中包含这些显而易见的改变和变化。
Claims (11)
1.一种处理语音信号的装置(10A),包括:
一个接收器(11),接收通过复用语音信号和有关语速转换的附属信息得到的多路复用信号,所述附属信息指示在发送端该语音信号是否经过语速转换处理,该语速转换处理在时间上改变语音信号而不改变包含在该语音信号中语音的音调;
一个检测器(13),检测由接收器(11)接收的多路复用信号中有关语速转换的附属信息并翻译该附属信息的内容;
一个声音再生器(12),再生包含在由接收器(11)接收的多路复用信号中的语音信号;以及
一个语速转换处理器(14),如果该检测器(13)检测的有关语速转换的附属信息指示该语音信号在发送终端没有经过语速转换处理,该语速转换处理器(14)使由该声音再生器(12)再生的语音信号经过语速转换处理,而如果有关语速转换的该附属信息指示该语音信号在发送终端已经经过语速转换处理,该语速转换处理器(14)不再使由该声音再生器(12)再生的语音信号经过语速转换处理。
2.一种处理语音信号的装置(10B),包括:
一个接收器(11),接收通过复用第一语音信号、指示第二语音信号是否存在的相应的速率转换的语音存在/不存在信息和如果相应速率转换的语音存在/不存在信息指示第二语音信号存在的第二语音信号得到的多路复用信号,所述第二语音信号是通过将第一语音信号经过语速转换处理得到的,该语速转换处理在时间上改变第一语音信号而不改变包含在第一语音信号中语音的音调;
一个检测器(17),检测该接收器(11)接收的多路复用信号中的相应速率转换语音存在/不存在信息并翻译该相应速率转换语音存在/不存在信息的内容;
一个声音再生器(12),再生包含在由该接收器(11)接收的多路复用信号中的第一语音信号或第二语音信号;以及
一个语速转换处理器(14),如果第一语音信号不是经过语速转换处理的信号并且相应速率转换的语音存在/不存在信息指示相应于第一语音信号的第二语音信号存在,所述语速转换处理器(14)选择地输出该声音再生器(12)再生的第二语音信号,如果第一语音信号不是经过语速转换处理的信号并且相应速率转换的语音存在/不存在信息指示相应于第一语音信号的第二语音信号不存在,所述语速转换处理器(14)将声音再生器(12)再生的第一语音信号进行语速转换处理。
3.一种处理语音信号的装置(10B),包括:
一个接收器(11),接收通过复用多个语音信号和语速转换适用性信息得到的多路复用信号,所述语速转换适用性信息指示在该多个语音信号中的每个语音信号是否适于进行语速转换处理,该语速转换处理在时间上改变语音信号而不改变包含在语音信号中语音的音调;
一个检测器(17),检测由接收器(11)接收的多路复用信号中语速转换适用性信息并翻译该语速转换适用性信息的内容;
一个声音再生器(12),再生包含在接收器(11)接收的多路复用信号中的每个语音信号;以及
一个语速转换处理器(11),如果由该检测器(17)检测的该语速转换适用性信息指示该语音信号适于进行语速转换处理,该语速转换处理器(11)使由该声音再生器(12)再生的每个语音信号经过语速转换处理,如果该语速转换适用性信息指示该语音信号不适于进行语速转换处理,该语速转换处理器(11)不再使由该声音再生器(12)再生的语音信号经过语速转换处理。
4.一种处理语音信号的方法,包括:
第一步骤,接收通过复用语音信号和有关语速转换的附属信息得到多路复用信号,所述附属信息指示所述语音信号在发送终端是否经过语速转换处理,所述语速转换处理在时间上改变该语音信号而不改变包含在该语音信号中的语音的音调;
第二步骤,检测在复用的和接收的信号中有关语速转换的附属信息并翻译该附属信息的内容(S101);
第三步骤,再生包含在该复用的和接收的信号中的该语音信号;
第四步骤,如果在第二步骤检测的有关语速转换的附属信息指示该语音信号在发送端没有经过语速转换处理,则对该再生的语音信号进行语速转换处理(S103);以及
第五步骤,如果有关语速转换的附属信息指示该语音信号在发送端已经经过语速转换处理,则输出该再生的语音信号而不对该再生的语音信号进行语速转换处理(S102)。
5.一种处理语音信号的方法,包括:
第一步骤,接收通过复用多个语音信号和语速转换适用性信息得到的多路复用信号,所述语速转换适用性信息指示所述多个语音信号的每个语音信号是否适于进行语速转换处理,所述语速转换处理在时间上改变该语音信号而不改变包含在该语音信号中语音的音调;
第二步骤,检测在该复用的和接收的信号中的该语速转换适用性信息并翻译该语速转换适用性信息的内容(S301);
第三步骤,再生包含在该复用的和接收的信号中每个语音信号;
第四步骤,如果在第二步骤检测的该语速转换适用性信息指示该语音信号适于进行语速转换处理(S301中的“是”),确定经过语速转换处理的、相应于第三步骤再生的该语音信号的相应的语音信号是否包含在该复用的和接收的信号中(S202);
第五步骤,如果在第四步骤确定该相应的语音信号包含在该复用的和接收的信号(S202中的“是”)中,切换到并再生包含在该复用的和接收的信号中的该相应的语音信号(S203);
第六步骤,如果在第四步骤确定该相应的语音信号不包含在该复用的和接收的信号(S202中的“否”)中,对第三步骤再生的该语音信号进行语速转换处理(S103);以及
第七步骤,如果在第二步骤检测的语速转换适用性信息指示该语音信号不适于进行该语速转换处理(S301中的“否”),输出在第三步骤再生的该语音信号,而不对该语音信号进行该语速转换处理(S102)。
6.一种传送语音的方法,其中语音信号在第一终端和第二终端之间双向传送,该方法包括:
第一步骤,从第一终端向第二终端发送语速转换请求信号(S401);
第二步骤,使第二终端接收该语速转换请求信号;以及
第三步骤,使已经接收该语速转换请求信号的第二终端对通过将待发送的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。
7.一种传送语音方法,其中语音信号在第一终端和第二终端之间通过中继器双向传送,该方法包括:
第一步骤,从第一终端向第二终端发送语速转换请求信号;
第二步骤,使该中继器接收该语速转换请求信号;以及
第三步骤,使已经接收该语速转换请求信号的该中继器对从第二终端发送到第一终端的语音转换为电信号得到的语音信号进行语速转换处理,然后将得到的语音信号发送到第一终端。
8.一种传送语音的方法,其中该语音信号在第一终端和第二终端之间双向传送,该方法包括:
第一步骤,发送将被从第一终端发送的具有指示有声音段标记的语音信号;
第二步骤,使第二终端接收所发送的语音信号和该标记;
第三步骤,使已经接收所发送的语音信号和该标记的第二终端检测该标记;以及
第四步骤,已经接收所发送的语音信号和该标记的第二终端基于第三步骤所检测的该标记仅对所接收的语音信号中的有声音段进行语速转换处理。
9.一种装置(120),其通过中继器(400)与作为该装置的对方的终端(210)双向传送语音信号,该装置包括:
一个操作单元(103),通过它输入语速转换请求信号;以及
一个语速转换请求信号发送单元(101),基于通过操作单元(103)输入的该语速转换请求发送语速转换请求信号,该语速转换请求信号请求作为对方的终端(210)对将被发送的语音信号进行语速转换处理、或者请求中继器(400)对从接收器接收到的语音信号进行语速转换处理。
10.一种与作为对方的终端(120)双向传送语音信号的装置(210),该装置包括:
一个语速转换请求信号检测器(201,204),接收从作为对方的终端(120)发送的信号,并检测在接收的信号中的语速转换请求信号;
一个语速转换处理器(205),基于该语速转换请求信号检测器(201,204)检测的该语速转换请求信号对待发送的语音信号进行语速转换处理;以及
一个发送器(201),将由该语速转换处理器(205)进行该语速转换的该语音信号发送至对方的终端(120)。
11.一种放置在传输线(300)上传送语音信号的装置(400),通过该传输线在第一终端(210)和第二终端(210)之间进行双向传送语音信号以便中继该语音信号,该装置包括:
一个语速转换请求信号检测器(402),检测在第一终端(120)和第二终端(210)的一个终端发送的信号中的语速转换请求信号;
一个语速转换处理器(404),基于该语速转换请求信号检测器(402)检测的该语速转换请求信号对待发送至请求语速转换的终端的语音信号进行语速转换处理;以及
一个中继器(401),将由该语速转换处理器(404)进行该语速转换的该语音信号中继至请求语速转换的终端。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003345147 | 2003-10-03 | ||
JP2003345147A JP4385710B2 (ja) | 2003-10-03 | 2003-10-03 | 音声信号処理装置及び音声信号処理方法 |
JP2003354739 | 2003-10-15 | ||
JP2003354739A JP4207739B2 (ja) | 2003-10-15 | 2003-10-15 | 音声通信方法及び音声通信装置並びに中継局装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1604186A CN1604186A (zh) | 2005-04-06 |
CN1303580C true CN1303580C (zh) | 2007-03-07 |
Family
ID=34395656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100811440A Expired - Fee Related CN1303580C (zh) | 2003-10-03 | 2004-09-30 | 处理语音信号的装置、方法以及传送语音的方法及其装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7509255B2 (zh) |
CN (1) | CN1303580C (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7830862B2 (en) * | 2005-01-07 | 2010-11-09 | At&T Intellectual Property Ii, L.P. | System and method for modifying speech playout to compensate for transmission delay jitter in a voice over internet protocol (VoIP) network |
JP4533234B2 (ja) * | 2005-05-10 | 2010-09-01 | キヤノン株式会社 | 記録再生装置及び記録再生方法 |
TWI687918B (zh) * | 2010-12-03 | 2020-03-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
WO2014058270A1 (en) | 2012-10-12 | 2014-04-17 | Samsung Electronics Co., Ltd. | Voice converting apparatus and method for converting user voice thereof |
JP2014106247A (ja) * | 2012-11-22 | 2014-06-09 | Fujitsu Ltd | 信号処理装置、信号処理方法および信号処理プログラム |
CN103943112B (zh) * | 2013-01-21 | 2017-10-13 | 杜比实验室特许公司 | 利用响度处理状态元数据的音频编码器和解码器 |
BR122016011963B1 (pt) | 2013-01-21 | 2022-02-08 | Dolby Laboratories Licensing Corporation | Codificador e decodificador de áudio com sonoridade de programa e metadados de limite |
CN104810032B (zh) * | 2015-03-31 | 2017-08-01 | 广东欧珀移动通信有限公司 | 一种播放控制方法及终端 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146985A (ja) * | 1994-11-17 | 1996-06-07 | Sanyo Electric Co Ltd | 話速制御システム |
JP2001268175A (ja) * | 2000-03-23 | 2001-09-28 | Sanyo Electric Co Ltd | 話速変換機能を有する電話機 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0427953B1 (en) * | 1989-10-06 | 1996-01-17 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for speech rate modification |
JPH06311211A (ja) | 1993-04-23 | 1994-11-04 | Hitachi Ltd | 話速変換電話機および話速変換アダプタ |
US5848130A (en) | 1996-12-31 | 1998-12-08 | At&T Corp | System and method for enhanced intelligibility of voice messages |
JP3553828B2 (ja) | 1999-08-18 | 2004-08-11 | 日本電信電話株式会社 | 音声蓄積再生方法および音声蓄積再生装置 |
US8340972B2 (en) * | 2003-06-27 | 2012-12-25 | Motorola Mobility Llc | Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment |
-
2004
- 2004-09-28 US US10/951,033 patent/US7509255B2/en active Active
- 2004-09-30 CN CNB2004100811440A patent/CN1303580C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146985A (ja) * | 1994-11-17 | 1996-06-07 | Sanyo Electric Co Ltd | 話速制御システム |
JP2001268175A (ja) * | 2000-03-23 | 2001-09-28 | Sanyo Electric Co Ltd | 話速変換機能を有する電話機 |
Also Published As
Publication number | Publication date |
---|---|
CN1604186A (zh) | 2005-04-06 |
US7509255B2 (en) | 2009-03-24 |
US20050075860A1 (en) | 2005-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4624992B2 (ja) | 音声チャネルを介してデータを伝送するための方法及び装置 | |
CN1487679A (zh) | 传输系统及其操作方法 | |
CN103402171B (zh) | 在通话中分享背景音乐的方法和终端 | |
CN1578503A (zh) | 处理用于语音呼叫的多媒体音频信号的装置和方法 | |
WO2004062156A3 (en) | Method and apparatus for providing background audio during a communication session | |
CN101064807A (zh) | 用于接收数字多媒体广播的装置和方法 | |
CN1839614A (zh) | 具有无线电话接口的遥控设备 | |
CN1435988A (zh) | 移动图像数据发送方法、装置和系统 | |
CN1976501A (zh) | 在移动通信终端中发送和接收数据的设备和方法 | |
EP3229443B1 (en) | Data processing device, data processing method, and program | |
CN1303580C (zh) | 处理语音信号的装置、方法以及传送语音的方法及其装置 | |
CN1878203A (zh) | 一种可以进行语音及背景音合成的移动通信终端 | |
CN1902845A (zh) | 数字麦克风 | |
KR101184109B1 (ko) | 무선 전화기 네트워크의 음성 채널을 통한 데이터 전송을 위한 시스템, 방법 및 장치 | |
CN1606241A (zh) | 用于在移动通信终端中发送音频信号的装置和方法 | |
CN1969490B (zh) | 群呼通信中的通信方法和接收设备 | |
CN104468991A (zh) | 一种移动终端及其音频收发方法 | |
CN115442789A (zh) | 一种应急救援现场通信系统和方法 | |
CN1265352C (zh) | 一种在声音信道上进行语音识别的方法和装置 | |
CN1809077A (zh) | 影片播放器,移动终端和移动终端的数据处理方法 | |
JP4862262B2 (ja) | Dtmf信号処理方法、処理装置、中継装置、及び通信端末装置 | |
CN102348007B (zh) | 用于在分组交换域中实现双向通话录音的方法和移动终端 | |
JP4385710B2 (ja) | 音声信号処理装置及び音声信号処理方法 | |
JP2005073057A (ja) | デジタル通話装置 | |
JP2009194827A (ja) | 通信装置、通信制御方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: JVC KENWOOD CORPORATION Free format text: FORMER OWNER: VICTORY CO. LTD. Effective date: 20140304 |
|
TR01 | Transfer of patent right |
Effective date of registration: 20140304 Address after: Kanagawa Patentee after: JVC KENWOOD Corp. Address before: Kanagawa, Japan Patentee before: VICTOR COMPANY OF JAPAN, Ltd. |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070307 |
|
CF01 | Termination of patent right due to non-payment of annual fee |