[go: up one dir, main page]

JPH08146985A - 話速制御システム - Google Patents

話速制御システム

Info

Publication number
JPH08146985A
JPH08146985A JP6283641A JP28364194A JPH08146985A JP H08146985 A JPH08146985 A JP H08146985A JP 6283641 A JP6283641 A JP 6283641A JP 28364194 A JP28364194 A JP 28364194A JP H08146985 A JPH08146985 A JP H08146985A
Authority
JP
Japan
Prior art keywords
voice
speed control
signal
control information
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6283641A
Other languages
English (en)
Inventor
Koji Tanaka
浩司 田中
Masanori Miyatake
正典 宮武
Masayuki Iida
正幸 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP6283641A priority Critical patent/JPH08146985A/ja
Publication of JPH08146985A publication Critical patent/JPH08146985A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【目的】 この発明は、予め送信データ、録音メディア
等に話速を制御するための情報を入れておき、送信デー
タを受信して再生する再生装置または録音メディアの再
生装置において、話速制御情報に基づいて話速を制御で
きる話速制御システムを提供することを目的とする。 【構成】 話速制御システムにおいて、話速制御情報が
音声信号に付加された信号を生成する編集装置1、およ
び編集装置1によって生成された信号から音声信号と話
速制御情報とを分離し、かつ音声信号を話速制御情報に
したがって話速制御する再生装置2を備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、放送、電話などの通
信、パソコン、音声メール等の送信データに話速を制御
するための制御情報を入れておき、受信側において制御
情報に基づいて話速を制御する話速変換制御システム、
または録音テープ、光磁気ディスク、レーザディスク、
CD−ROM、ビデオCD、ICメモリ等の録音メディ
アに話速を制御するための制御情報を記録しておき、再
生時に制御情報に基づいて話速を制御する話速制御シス
テムに関する。
【0002】
【従来の技術】本出願人は、音声区間の入力音声信号の
時間長さを圧縮・伸長する手段および所定長さ以上の無
音区間の入力音声信号を削除する削除手段を有する話速
変換装置を開発している。このような話速変換装置で
は、入力された音声信号を分析して、分析結果に応じて
圧縮・伸長処理、削除処理等が行なわれている。
【0003】このような話速変換装置の入力音声信号と
しては、放送、電話などの通信、パソコン、音声メール
等の送信データ、録音テープ、光磁気ディスク、レーザ
ディスク、CD−ROM、ビデオCD、ICメモリ等の
録音メディアから読み出されたデータがある。
【0004】
【発明が解決しようとする課題】この発明は、予め送信
データ、録音メディア等に話速を制御するための情報を
入れておき、送信データを受信して再生する再生装置ま
たは録音メディアの再生装置において、話速制御情報に
基づいて話速を制御できる話速制御システムを提供する
ことを目的とする。
【0005】
【課題を解決するための手段】この発明による話速制御
システムは、話速制御情報が音声信号に付加された信号
を生成する編集装置、および編集装置によって生成され
た信号から音声信号と話速制御情報とを分離し、かつ音
声信号を話速制御情報にしたがって話速制御する再生装
置を備えていることを特徴とする。
【0006】編集装置としては、たとえば、話速制御情
報が音声信号に付加された信号を生成して、録音メディ
アに記録するものが用いられ、再生装置としては、たと
えば、上記録音メディアから話速制御情報が音声信号に
付加された信号を読み出して、音声信号と話速制御情報
とを分離し、かつ音声信号を話速制御情報にしたがって
話速制御するものが用いられる。
【0007】また、編集装置としては、たとえば、話速
制御情報が音声信号に付加された信号を生成して、送信
データを作成するものが用いられ、再生装置としては、
たとえば、上記送信データを受信して、受信した上記送
信データから音声信号と話速制御情報とを分離し、かつ
音声信号を話速制御情報にしたがって話速制御するもの
が用いられる。
【0008】話速制御情報を音声信号に付加する方法と
しては、時分割多重方式、周波数分割多重方式、切換伝
送方式等が用いられる。
【0009】再生装置として、たとえば、音声信号を時
間軸圧縮伸長処理する処理手段と、音声信号を削除処理
する処理手段とを有する話速変換部を備えたものが用い
られれる。話速制御情報としては、たとえば、音声信号
を時間軸伸長圧縮処理を行なうための情報と、音声信号
を削除処理するための情報とが用いられる。また、話速
制御情報としては、音声区間であることを示す情報と、
無音区間の継続数を示す情報とが用いられる。
【0010】この発明による編集装置は、音声信号を分
析して話速制御情報を生成する手段、および生成された
話速制御情報を音声信号に付加する手段を備えているこ
とを特徴とする。
【0011】この発明による再生装置は、話速制御情報
が付加された音声信号から音声信号と話速制御情報とを
分離する手段、および音声信号を話速制御情報にしたが
って話速制御する手段を備えていることを特徴とする。
【0012】
【作用】この発明による話速制御システムでは、話速制
御情報が音声信号に付加された信号が編集装置によって
生成される。そして、再生装置側で、編集装置によって
生成された信号から音声信号と話速制御情報とが分離さ
れ、かつ音声信号が話速制御情報にしたがって話速制御
される。
【0013】この発明による編集装置では、音声信号を
分析して話速制御情報が生成され、生成された話速制御
情報が音声信号に付加される。
【0014】この発明による再生装置では、話速制御情
報が付加された音声信号から音声信号と話速制御情報と
が分離され、音声信号が話速制御情報にしたがって話速
制御される。
【0015】
【実施例】以下、図面を参照して、この発明の実施例に
ついて説明する。
【0016】図1は、話速制御システムを示している。
話速制御システムは、話速制御情報が音声信号に付加さ
れた信号を生成する編集装置1と、編集装置1によって
生成された信号から音声信号と話速制御情報とを分離
し、かつ音声信号を話速制御情報にしたがって話速制御
する再生装置2とを備えている。
【0017】編集装置1としては、話速制御情報が音声
信号に付加された信号から送信データを作成するもの、
話速制御情報が音声信号に付加された信号を録音メディ
ア3に記録するものがある。前者の場合には、編集装置
1から話速制御情報が音声信号に付加された送信データ
が再生装置に送信される。後者の場合には、編集装置1
によって録音メディア3から話速制御情報が音声信号に
付加された信号が読み出される。
【0018】図2は、編集装置1の構成を示している。
編集装置1では、元となる音声信号が音声信号分析部1
1によって分析されて話速制御情報が生成される。生成
された話速制御情報は、コード化部12によってコード
化される。そして、元となる音声信号と生成されたコー
ドとが多重化部13によって多重化される。この多重化
信号に基づいて送信データが作成されるか、またはこの
多重化信号が録音メディアに記録される。
【0019】図3は、再生装置2の構成を示している。
再生装置2には、編集装置1によって作成された送信デ
ータまたは編集装置1によって多重化信号が記録された
録音メディアからの読み出しデータが入力される。
【0020】入力された多重化信号は、復調部21で復
調され、話速制御情報と音声信号とに分離される。音声
信号は、話速制御部22に入力される。話速制御部22
には、話速制御情報と復調部21からの音声/話速制御
情報同期用制御信号が制御信号として入力される。話速
制御部22では、話速制御情報に基づいて、入力音声の
話速が制御される。
【0021】多重化方式としては、周波数分割多重方
式、時分割多重方式等が用いられる。なお、編集装置1
において、音声信号が符号化されている場合には、復調
部21によって分離された音声信号は、復号化された後
に話速制御部22に送られる。
【0022】図4は、話速制御部22の構成を示してい
る。話速制御部22は、話速制御情報を解析する話速制
御情報解析部31、音声/話速制御情報同期用制御信号
に基づいて、話速制御情報解析部31に同期信号を送る
制御情報同期化部32および話速制御情報解析部31の
解析結果に基づいて音声信号を話速変換する話速変換部
33を備えている。
【0023】話速変換部33は、話速制御情報解析部3
1の解析結果に応じて、入力音声信号の圧縮伸長処理、
入力音声信号の削除処理等を行なう。
【0024】図5は、編集装置1の第1動作例を示して
いる。ここでは、映像と音声とを伴う放送番組の音声信
号が入力されているものとする。また、説明の便宜上、
再生装置2側で設定される再生速度としては、1倍速再
生と2倍速再生との2種があるとする。また、音声信号
に多重化される話速制御情報には、1倍速再生用と2倍
速再生用とがある。
【0025】まず、音声信号分析部11によって入力音
声信号の所定区間毎に入力音声信号のパワー平均値Pが
算出される(ステップ1)。次に、パワー平均値Pが所
定のしきい値Th以上か否かが判別される(ステップ
2)。パワー平均値Pが所定のしきい値Th以上(P≧
Th)である場合には、当該区間は音声区間であると判
別され、音声信号の時間長さを伸長する区間と判定され
る(ステップ3)。ここでは、音声区間以外の低レベル
の定常雑音や環境音も無音区間として取り扱われるよう
に、しきい値が設定されている。この後、圧縮率αが設
定される(ステップ4)。
【0026】2倍速再生用の圧縮率αは、たとえば、1
/2≦α≦1の範囲内の所定の値に設定される。圧縮率
αが2倍速再生時の一般的な圧縮率である1/2である
場合には、出力音声速度は入力音声速度の2倍となる。
圧縮率αが1である場合には、出力音声速度は入力音声
速度の1倍となる。したがって、出力音声速度が入力音
声速度の1倍以上で2倍以下となる範囲内で、圧縮率α
が設定される。
【0027】ここでは、圧縮率αが2/3に設定される
とする。この場合には、再生時において、音声の3ピッ
チ周期が2ピッチ周期に間引かれる。このため、再生時
においては、出力音声速度は入力音声速度の3/2倍と
なる。このように、圧縮率2/3で圧縮された場合に
は、2倍速再生時の一般的な圧縮率1/2の場合に比べ
て、2/3−1/2=1/6だけ、音声が伸長されるこ
とになる。
【0028】1倍速再生用の圧縮率αは、たとえば、1
≦α≦3/2の範囲内の所定の値に設定される。圧縮率
αが1倍速再生時において1である場合には、出力音声
速度は入力音声速度の1倍となる。圧縮率αが3/2で
ある場合には、出力音声速度は入力音声速度の2/3倍
となる。したがって、出力音声速度が入力音声速度の2
/3倍以上で1倍以下となる範囲内で、圧縮率αが設定
される。
【0029】ここでは、圧縮率αが3/2に設定される
とする。この場合には、再生時において、音声の2ピッ
チ周期が3ピッチ周期に伸長される。このため、再生時
においては、出力音声速度は入力音声速度の2/3倍と
なる。このように、圧縮率3/2で伸長された場合に
は、1倍速再生の通常再生時に対して、3/2−1=1
/2だけ、音声が伸長されることになる。
【0030】次に、1倍速再生速度および2倍速再生速
度に応じてそれぞれ設定された圧縮率αからなる話速制
御情報が生成され、コード化部12によってコード化さ
れる(ステップ5)。次に、多重化部13によって、当
該区間の入力音声信号と話速制御情報とが多重化される
(ステップ6)。そして、この多重化信号に基づいて送
信データが作成されるかまたはこの多重化信号が録音メ
ディアに記録される(ステップ7)。
【0031】上記ステップ2において、パワー平均値P
が所定のしきい値Thより小さいときには(P<T
h)、当該区間は無音区間であると判別され、無音区間
の継続数が算出される(ステップ8)。そして、無音区
間の継続数が所定数Tdel以上であるか否かが判別さ
れる(ステップ9)。無音区間の継続数が所定数Tde
lより少ないときには、音声信号の時間長さを伸長する
区間と判定される(ステップ10)。
【0032】次に、上記ステップ4と同様に、1倍速再
生用および2倍速再生用の圧縮率αが設定される(ステ
ップ11)。そして、1倍速再生および2倍速再生用の
圧縮率αからなる話速制御情報が生成され、コード化部
12によってコード化される(ステップ11)。次に、
多重化部13によって、当該区間の入力音声信号と話速
制御情報とが多重化される(ステップ6)。そして、こ
の多重化信号に基づいて送信データが作成されるかまた
はこの多重化信号が録音メディアに記録される(ステッ
プ7)。
【0033】上記ステップ9において、無音区間の継続
数が所定数Tdel以上であると判定されたときには、
当該区間は削除すべき区間と判定される(ステップ1
2)。そして、当該区間の入力音声信号を削除区間とす
る制御情報が生成され、コード化部12によってコード
化される(ステップ13)。
【0034】次に、多重化部13によって、当該区間の
入力音声信号と話速制御情報とが多重化される(ステッ
プ6)。そして、この多重化信号に基づいて送信データ
が作成されるかまたはこの多重化信号が録音メディアに
記録される(ステップ7)。
【0035】このようにして生成された多重化信号が再
生装置2側で再生される場合には、操作者によって再生
速度(1倍速または2倍速)が設定される。入力音声信
号のうち、設定された再生速度に対する圧縮率αが話速
制御情報として設定されている区間では、その圧縮率α
で入力音声信号が時間軸圧縮伸長処理された後、再生さ
れる。また、入力音声信号のうち、話速制御情報によっ
て削除される区間であると指定されている区間では、入
力音声信号が削除される。
【0036】図6は、編集装置1の第2動作例を示して
いる。ここでは、映像と音声とを伴う放送番組の音声信
号が入力されているものとする。また、説明の便宜上、
再生装置2側で設定される再生速度としては、1倍速再
生と2倍速再生との2種があるとする。また、音声信号
に多重化される話速制御情報には、1倍速再生用と2倍
速再生用とがある。
【0037】まず、音声信号分析部11によって入力音
声信号の所定区間毎に入力音声信号のパワー平均値Pが
算出される(ステップ21)。次に、パワー平均値Pが
所定のしきい値Th以上か否かが判別される(ステップ
22)。パワー平均値Pが所定のしきい値Th以上(P
≧Th)である場合には、当該区間は音声区間であると
判別され、音声信号の時間長さを伸長する区間と判定さ
れる(ステップ23)。そして、音声信号の時間長さを
伸長する区間とする旨の話速制御情報が生成され、コー
ド化部12によってコード化される(ステップ24)。
【0038】次に、多重化部13によって、当該区間の
入力音声信号と話速制御情報とが多重化される(ステッ
プ25)。この多重化信号に基づいて送信データが作成
されるかまたはこの多重化信号が録音メディアに記録さ
れる(ステップ26)。
【0039】上記ステップ22において、パワー平均値
Pが所定のしきい値Thより小さいときには(P<T
h)、当該区間は無音区間であると判別され、無音区間
の継続数が算出される(ステップ27)。そして、無音
区間の継続数を示す話速制御情報がコード化部12によ
って生成される(ステップ28)。
【0040】次に、多重化部13によって、当該区間の
入力音声信号と話速制御情報とが多重化される(ステッ
プ25)。この多重化信号に基づいて送信データが作成
されるかまたはこの多重化信号が録音メディアに記録さ
れる(ステップ26)。
【0041】このようにして生成された多重化信号が再
生装置2側で再生される場合には、操作者によって再生
速度(1倍速または2倍速)が設定される。また、設定
した再生速度に応じた圧縮率αが操作者によって設定さ
れる。また、削除区間を決定するための継続長Tdel
が操作者によって設定される。
【0042】そして、入力音声信号のうち、話速制御情
報によって伸長する区間であると指定された区間では、
操作者によって設定された圧縮率αで入力音声信号が時
間軸圧縮伸長処理される。また、入力音声信号のうち、
話速制御情報によって無音区間の継続数が指定されかつ
その継続長が操作者によって決定された継続長Tdel
以上である区間では、入力音声信号が削除される。ま
た、入力音声信号のうち、話速制御情報によって無音区
間の継続数が指定されかつその継続長が操作者によって
決定された継続長Tdel未満である区間では、操作者
によって設定された圧縮率αで入力音声信号が時間軸圧
縮伸長処理される。
【0043】図7は、編集装置1の第3動作例を示して
いる。ここでは、映像と音声とを伴う放送番組の音声信
号が入力されているものとする。また、説明の便宜上、
再生装置2側で設定される再生速度としては、1倍速再
生と2倍速再生との2種があるとする。また、音声信号
に多重化される話速制御情報には、1倍速再生用と2倍
速再生用とがある。
【0044】まず、音声信号分析部11によって入力音
声信号の所定区間毎に入力音声信号のパワー平均値Pが
算出される(ステップ31)。次に、パワー平均値Pが
所定のしきい値Th以上か否かが判別される(ステップ
32)。パワー平均値Pが所定のしきい値Th以上(P
≧Th)である場合には、当該区間は音声区間であると
判別され、音声信号の時間長さを伸長する区間と判定さ
れる(ステップ33)。
【0045】次に、現時点での音声の伸長量、すなわ
ち、再生時の入力信号に対する出力信号の遅延時間に応
じた値が、1倍速再生速度および2倍再生速度ごとに算
出される(ステップ34)。そして、1倍速再生速度お
よび2倍再生速度ごとに、伸長量に応じた圧縮率αが設
定される(ステップ35)。
【0046】2倍速再生用の圧縮率αは、たとえば、1
/2≦α≦1の範囲内で設定され、現時点での伸長量が
小さいほど圧縮率αは大きくされる。圧縮率αが2倍速
再生時の一般的な圧縮率である1/2である場合には、
出力音声速度は入力音声速度の2倍となり、圧縮率αが
1である場合には、出力音声速度は入力音声速度の1倍
となる。したがって、出力音声速度が入力音声速度の1
倍以上で2倍以下となる範囲内で、圧縮率αが設定され
る。
【0047】また、現時点での伸長量が大きいほど、出
力音声速度が速くなるように圧縮率αが設定される。こ
の理由は、入力信号に対する出力信号の遅延時間が所定
時間以上になるのを防止するためである。
【0048】1倍速再生用の圧縮率αは、たとえば、1
≦α≦3/2の範囲内の所定の値に設定され、現時点で
の伸長量が小さいほど圧縮率αは大きくされる。圧縮率
αが1倍速再生時において1である場合には、出力音声
速度は入力音声速度の1倍となる。圧縮率αが3/2で
ある場合には、出力音声速度は入力音声速度の2/3倍
となる。したがって、出力音声速度が入力音声速度の2
/3倍以上で1倍以下となる範囲内で、圧縮率αが設定
される。
【0049】1倍速再生用の圧縮率αについても、現時
点での伸長量が大きいほど、出力音声速度が速くなるよ
うに圧縮率αが設定される。この理由は、入力信号に対
する出力信号の遅延時間が所定時間以上になるのを防止
するためである。
【0050】次に、1倍速再生速度および2倍速再生速
度に応じてそれぞれ設定された圧縮率αからなる話速制
御情報が生成され、コード化部12によってコード化さ
れる(ステップ36)。次に、多重化部13によって、
当該区間の入力音声信号と話速制御情報とが多重化され
る(ステップ37)。そして、この多重化信号に基づい
て送信データが作成されるかまたはこの多重化信号が録
音メディアに記録される(ステップ38)。
【0051】上記ステップ32において、パワー平均値
Pが所定のしきい値Thより小さいときには(P<T
h)、当該区間は無音区間であると判別され、無音区間
の継続数が算出される(ステップ39)。そして、無音
区間の継続数が所定数Tdel以上であるか否かが判別
される(ステップ40)。無音区間の継続数が所定数T
delより少ないときには、音声信号の時間長さを伸長
する区間と判定される(ステップ41)。
【0052】次に、上記ステップ34と同様に、現時点
での音声の伸長量、すなわち、再生時の入力信号に対す
る出力信号の遅延時間に応じた値が、1倍速再生速度お
よび2倍再生速度ごとに算出される(ステップ42)。
そして、上記ステップ35と同様に、1倍速再生速度お
よび2倍再生速度こどに、伸長量に応じた圧縮率αが設
定される(ステップ43)。
【0053】そして、1倍速再生速度および2倍速再生
速度に応じてそれぞれ設定された圧縮率αからなる話速
制御情報が生成され、コード化部12によってコード化
される(ステップ44)。次に、多重化部13によっ
て、当該区間の入力音声信号と話速制御情報とが多重化
される(ステップ37)。そして、この多重化信号に基
づいて送信データが作成されるかまたはこの多重化信号
が録音メディアに記録される(ステップ38)。
【0054】上記ステップ40において、無音区間の継
続数が所定数Tdel以上であると判定されたときに
は、当該区間は削除すべき区間と判定される(ステップ
45)。そして、当該区間の入力音声信号を削除区間と
する制御情報がコード化部12によって生成される(ス
テップ46)。
【0055】次に、多重化部13によって、当該区間の
入力音声信号と話速制御情報とが多重化される(ステッ
プ37)。そして、この多重化信号に基づいて送信デー
タが作成されるかまたはこの多重化信号が録音メディア
に記録される(ステップ38)。
【0056】このようにして生成された多重化信号が再
生装置2側で再生される場合には、操作者によって再生
速度(1倍速または2倍速)が設定される。入力音声信
号のうち、設定された再生速度に対する圧縮率αが話速
制御情報として設定されている区間では、その圧縮率α
で入力音声信号が時間軸圧縮伸長処理された後、再生さ
れる。また、入力音声信号のうち、話速制御情報によっ
て削除される区間であると指定されている区間では、入
力音声信号が削除される。
【0057】この第3動作例においても図6の第2動作
例と同様に、無音区間と判別された場合には(ステップ
32でNO)、無音区間の継続長を話速制御情報として
生成するようにしてもよい。
【0058】図8は、編集装置1の第4動作例を示して
いる。ここでは、映像と音声とを伴う放送番組の音声信
号が入力されているものとする。また、説明の便宜上、
再生装置2側で設定される再生速度としては、1倍速再
生と2倍速再生との2種があるとする。また、音声信号
に多重化される話速制御情報には、1倍速再生用と2倍
速再生用とがある。
【0059】まず、音声信号分析部11によって入力音
声信号の所定区間毎に入力音声信号のパワー平均値Pが
算出される(ステップ51)。次に、パワー平均値Pが
所定のしきい値Th以上か否かが判別される(ステップ
52)。
【0060】パワー平均値Pが所定のしきい値Th以上
(P≧Th)である場合には、当該区間は音声区間であ
ると判別される。そして、フラグFの状態に基づいて、
前回の区間は継続数が所定数Tdel以上の無音区間で
あったか否かが判別される(ステップ53)。
【0061】前回の区間が、継続数が所定数Tdel以
上の無音区間でない場合(F=0)には、圧縮率αが現
在設定されている圧縮率に対して単調減少するように設
定される(ステップ54)。2倍速再生用の圧縮率α
は、たとえば、1/2≦α≦1の範囲内で設定される。
圧縮率αが2倍速再生時の一般的な圧縮率である1/2
である場合には、出力音声速度は入力音声速度の2倍と
なり、圧縮率αが1である場合には、出力音声速度は入
力音声速度の1倍となる。したがって、出力音声速度が
入力音声速度の1倍以上で2倍以下となる範囲内で、圧
縮率αが設定される。
【0062】ステップ54で、圧縮率αが単調減少され
るということは、2倍速再生時において、出力音声速度
が入力音声速度の1倍以上で2倍以下となる範囲内で、
再生時の出力音声速度が速くなるように圧縮率αが設定
されることを意味する。これは、2倍速再生時におい
て、入力音声信号に対する出力音声信号の遅延時間が所
定時間以上になるのを防止するためである。
【0063】1倍速再生用の圧縮率αは、たとえば、1
≦α≦3/2の範囲内で設定される。圧縮率αが1であ
る場合には、出力音声速度は入力音声速度の1倍とな
る。圧縮率αが3/2である場合には、出力音声速度は
入力音声速度の2/3倍となる。したがって、出力音声
速度が入力音声速度の2/3倍以上で1倍以下となる範
囲内で、圧縮率αが設定される。
【0064】ステップ54で、圧縮率αが単調減少され
るということは、1倍速再生時においては、出力音声速
度が入力音声速度の2/3倍以上で1倍以下となる範囲
内で、再生時の出力音声速度が速くなるように圧縮率α
が設定されることを意味する。これは、1倍速再生時に
おいて、入力音声信号に対する出力音声信号の遅延時間
が所定時間以上になるのを防止するためである。
【0065】次に、1倍速再生速度および2倍速再生速
度に応じてそれぞれ設定された圧縮設定αからなる話速
制御情報が生成され、コード化部12によってコード化
される(ステップ55)。次に、多重化部13によっ
て、当該区間の入力音声信号と話速制御情報とが多重化
される(ステップ56)。そして、この多重化信号に基
づいて送信データが作成されるかまたはこの多重化信号
が録音メディアに記録される(ステップ57)。
【0066】上記ステップ53において、前回の区間
が、継続数が所定数Tdel以上の無音区間である(F
=1)と判別された場合には、フラグFがリセット(F
=0)にされる(ステップ58)。そして、圧縮率αが
現在設定されている圧縮率に対して大きくなるように設
定される(ステップ59)。つまり、2倍速再生用の圧
縮率αが1/2≦α≦1の範囲内で設定される場合に
は、2倍速再生時において、出力音声速度が入力音声速
度の1倍以上で2倍以下となる範囲内で、再生時の出力
音声速度が遅くなるように2倍速再生用の圧縮率αが設
定される。また、1倍速再生用の圧縮率αが1≦α≦3
/2の範囲内で設定される場合には、1倍速再生時にお
いて、出力音声速度が入力音声速度の2/3倍以上で1
倍以下となる範囲内で、再生時の出力音声速度が遅くな
るように1倍速再生用の圧縮率αが設定される。
【0067】そして、1倍速再生速度および2倍速再生
速度に応じてそれぞれ設定された圧縮設定αからなる話
速制御情報が生成され、コード化部12によってコード
化される(ステップ55)。次に、多重化部13によっ
て、当該区間の入力音声信号と話速制御情報とが多重化
される(ステップ56)。そして、この多重化信号に基
づいて送信データが作成されるかまたはこの多重化信号
が録音メディアに記録される(ステップ57)。
【0068】上記ステップ52において、パワー平均値
Pが所定のしきい値Thより小さいときには(P<T
h)、当該区間は無音区間であると判別され、無音区間
の継続数が算出される(ステップ60)。そして、無音
区間の継続数が所定数Tdel以上であるか否かが判別
される(ステップ61)。無音区間の継続数が所定数T
delより少ないときには、フラグFがセット(F=
1)される(ステップ62)。また、音声信号の時間長
さを伸長する区間と判定される(ステップ63)。
【0069】次に、上記ステップ54と同様に、1倍速
再生用および2倍速再生用の圧縮率αが現在設定されて
いる対応する圧縮率に対して単調減少するように設定さ
れる(ステップ64)。そして、1倍速再生速度および
2倍速再生速度に応じてそれぞれ設定された圧縮設定α
からなる話速制御情報が生成され、コード化部12によ
ってコード化される(ステップ65)。次に、多重化部
13によって、当該区間の入力音声信号と話速制御情報
とが多重化される(ステップ56)。そして、この多重
化信号に基づいて送信データが作成されるかまたはこの
多重化信号が録音メディアに記録される(ステップ5
7)。
【0070】上記ステップ61において、無音区間の継
続数が所定数Tdel以上であると判定されたときに
は、当該区間は削除すべき区間と判定される(ステップ
66)。そして、当該区間の入力音声信号を削除区間と
する制御情報が生成され、コード化部12によってコー
ド化される(ステップ67)。
【0071】次に、多重化部13によって、当該区間の
入力音声信号と話速制御情報とが多重化される(ステッ
プ56)。そして、この多重化信号に基づいて送信デー
タが作成されるかまたはこの多重化信号が録音メディア
に記録される(ステップ57)。
【0072】このようにして生成された多重化信号が再
生装置2側で再生される場合には、操作者によって再生
速度(1倍速または2倍速)が設定される。入力音声信
号のうち、設定された再生速度に対する圧縮率αが話速
制御情報として設定されている区間では、その圧縮率α
で入力音声信号が時間軸圧縮伸長処理された後、再生さ
れる。また、入力音声信号のうち、話速制御情報によっ
て削除される区間であると指定されている区間では、入
力音声信号が削除される。
【0073】この第4動作例においても図6の第2動作
例と同様に、無音区間と判別された場合には(ステップ
52でNO)、無音区間の継続長を話速制御情報として
生成するようにしてもよい。
【0074】また、図9に示すように、所定数以上の無
音区間に挟まれた音声の1文章の長さを測定し、1文章
の長さに応じて圧縮率αを単調減少させるようにしても
よい。つまり、文頭は圧縮率αが大きく(出力音声速度
を遅く)なり、文末にいくに従って圧縮率αが小さく
(出力音声速度を速く)なるように、話速制御情報を作
成してもよい。
【0075】また、入力音声のピッチが急激に上昇した
地点では圧縮率αが大きく(出力音声速度を遅く)な
り、その後入力音声のピッチが下降するにしたがって、
圧縮率αが小さく(出力音声速度を速く)なるように、
話速制御情報を作成してもよい。
【0076】また、入力音声の発声速度を検出し、発声
速度に応じて圧縮率αを決定するようにしてもよい。す
なわち、発声速度が速い場合には、圧縮率αが大きく
(出力音声速度を遅く)なり、発声速度が遅い場合に
は、圧縮率αが小さく(出力音声速度を速く)なるよう
に、話速制御情報を作成してもよい。発声速度の検出方
法としては、単位時間当りの母音の数または母音の継続
長を検出する方法、単位時間当りの音声区間と無音区間
の割合を検出する方法等がある。
【0077】上記各実施例では、入力音声を音声区間と
無音区間とに区別しているが、入力音声を有声区間、無
声区間および無音区間に区別するようにしてもよい。こ
れらの判別は、パワー平均値により、まず、有声区間
と、無声区間および無音区間とを区別する。次に、無声
区間と無音区間との判別は、音声信号の零交差数(零レ
ベルとの単位時間当りの交差数)を計算し、零交差数が
所定数以上の区間を無声区間と判別し、零交差数が所定
数未満の区間を無音区間と判別する。有声区間に対して
は音声信号の時間長さを伸長する区間とし、所定長以上
の無音区間を削除区間とし、無声区間は処理しない区間
として、話速制御情報を作成する。また、有声区間の場
合には、自己相関法を用いて音声のピッチを抽出し、こ
のピッチ抽出情報を話速制御情報として作成してもよ
い。
【0078】また、音声信号が音楽である場合には、再
生装置側で圧縮処理が行なわれないようにするために、
話速制御情報として音楽であることを示す情報を入れる
ようにしてもよい。音楽であるか否かを判別する方法と
しては、入力音声信号を周波数分析し、高周波数域(4
KHz以上)の信号成分と、低周波域(4KHz未満)
の信号成分との割合を算出し、高周波数域成分が大きい
場合は音楽として判断する方法がある。
【0079】また、技術情報番組等においては、音声信
号を分析することによって所定の技術用語のフレーズを
検出し、検出した区間に所定のキーワードを話速制御情
報として付加しておき、再生時において操作者が上記キ
ーワードを再生装置に設定した場合には、キーワードに
対応する区間(上記技術用語のフレーズ)をゆっくり再
生するようにしてもよい。
【0080】なお、上記実施例では、編集装置において
音声信号と話速制御情報とが多重化されて出力されてい
るが、音声信号と話速制御情報とを切り替え伝送方式に
よって出力するようにしてもよい。
【0081】また、再生装置側において、1倍速再生、
2倍速再生の他、3倍速再生等が可能な場合にも、圧縮
率αを全ての再生倍率速度ごとに設定して、話速制御情
報とし音声信号に付加することが好ましい。
【0082】
【発明の効果】この発明によれば、予め送信データ、録
音メディア等に話速を制御するための情報を入れてお
き、受信側または再生側において、制御情報に基づいて
話速を制御できる話速変換システムが得られる。
【図面の簡単な説明】
【図1】話速制御システムの構成を示すブロック図であ
る。
【図2】編集装置の構成を示すブロック図である。
【図3】再生装置の構成を示すブロック図である。
【図4】再生装置の話速制御部の構成を示すブロック図
である。
【図5】編集装置の第1動作例を示すフローチャートで
ある。
【図6】編集装置の第2動作例を示すフローチャートで
ある。
【図7】編集装置の第3動作例を示すフローチャートで
ある。
【図8】編集装置の第4動作例を示すフローチャートで
ある。
【図9】所定長以上の無音区間に挟まれた1文章の区間
を示す模式図である。
【符号の説明】
1 編集装置 2 再生装置 11 音声信号分析部 12 話速制御情報コード化部 13 多重化部 21 復調部 22 話速制御部 31 話速制御情報解析部 32 制御情報同期化部 33 話速変換部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 話速制御情報が音声信号に付加された信
    号を生成する編集装置、および編集装置によって生成さ
    れた信号から音声信号と話速制御情報とを分離し、かつ
    音声信号を話速制御情報にしたがって話速制御する再生
    装置を備えている話速制御システム。
  2. 【請求項2】 編集装置は、話速制御情報が音声信号に
    付加された信号を生成して、録音メディアに記録するも
    のであり、再生装置は上記録音メディアから話速制御情
    報が音声信号に付加された信号を読み出して、音声信号
    と話速制御情報とを分離し、かつ音声信号を話速制御情
    報にしたがって話速制御するものである請求項1に記載
    の話速制御システム。
  3. 【請求項3】 編集装置は、話速制御情報が音声信号に
    付加された信号を生成して、送信データを作成するもの
    であり、再生装置は上記送信データを受信して、受信し
    た上記送信データから音声信号と話速制御情報とを分離
    し、かつ音声信号を話速制御情報にしたがって話速制御
    するものである請求項1に記載の話速制御システム。
  4. 【請求項4】 時分割多重または周波数分割多重方式に
    よって、話速制御情報が音声信号に付加されることを特
    徴とする請求項1、2および3のいずれかに記載の話速
    制御システム。
  5. 【請求項5】 切換伝送方式によって、話速制御情報が
    音声信号に付加されることを特徴とする請求項1、2お
    よび3のいずれかに記載の話速制御システム。
  6. 【請求項6】 再生装置は、音声信号を時間軸圧縮伸長
    処理する処理手段と、音声信号を削除処理する処理手段
    とを有する話速変換部を備えており、 話速制御情報は、音声信号を時間軸伸長圧縮処理を行な
    うための情報と、音声信号を削除処理するための情報と
    を少なくとも含んでいることを特徴とする請求項1、
    2、3、4および5のいずれかに記載の話速制御システ
    ム。
  7. 【請求項7】 再生装置は、音声信号を時間軸圧縮伸長
    処理する処理手段と、音声信号を削除処理する処理手段
    とを有する話速変換部を備えており、 話速制御情報は、音声区間であることを示す情報と、無
    音区間の継続数を示す情報とを少なくとも含んでいるこ
    とを特徴とする請求項1、2、3、4および5のいずれ
    かに記載の話速制御システム。
  8. 【請求項8】 音声信号を分析して話速制御情報を生成
    する手段、および生成された話速制御情報を音声信号に
    付加する手段を備えている編集装置。
  9. 【請求項9】 話速制御情報が付加された音声信号から
    音声信号と話速制御情報とを分離する手段、および音声
    信号を話速制御情報にしたがって話速制御する手段を備
    えている再生装置。
JP6283641A 1994-11-17 1994-11-17 話速制御システム Pending JPH08146985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6283641A JPH08146985A (ja) 1994-11-17 1994-11-17 話速制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6283641A JPH08146985A (ja) 1994-11-17 1994-11-17 話速制御システム

Publications (1)

Publication Number Publication Date
JPH08146985A true JPH08146985A (ja) 1996-06-07

Family

ID=17668157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6283641A Pending JPH08146985A (ja) 1994-11-17 1994-11-17 話速制御システム

Country Status (1)

Country Link
JP (1) JPH08146985A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312298A (ja) * 2000-04-27 2001-11-09 Nippon Hoso Kyokai <Nhk> 話速変換処理装置、話速変換処理方法、記録媒体および話速変換処理装置の使用法
WO2003019535A1 (fr) * 2000-02-28 2003-03-06 Linguamaster Corporation Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia
JP2003244081A (ja) * 2002-02-13 2003-08-29 Nippon Hoso Kyokai <Nhk> シルバー音声サービス方法および受信機
WO2004097800A1 (ja) * 2003-05-02 2004-11-11 Konami Corporation 音声再生プログラム、音声再生方法及び音声再生装置
CN1303580C (zh) * 2003-10-03 2007-03-07 日本胜利株式会社 处理语音信号的装置、方法以及传送语音的方法及其装置
JP2009075280A (ja) * 2007-09-20 2009-04-09 Nippon Hoso Kyokai <Nhk> コンテンツ再生装置
JP2009244912A (ja) * 2009-07-29 2009-10-22 Victor Co Of Japan Ltd 音声信号処理装置及び音声信号処理方法
US7728215B2 (en) 2004-09-16 2010-06-01 Sony Corporation Playback apparatus and playback method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003019535A1 (fr) * 2000-02-28 2003-03-06 Linguamaster Corporation Structure de donnees, procede de production, procede de lecture, procede d'enregistrement, support d'enregistrement et procede de distribution de donnees vocales, et procede de lecture de donnees multimedia
JP2001312298A (ja) * 2000-04-27 2001-11-09 Nippon Hoso Kyokai <Nhk> 話速変換処理装置、話速変換処理方法、記録媒体および話速変換処理装置の使用法
JP2003244081A (ja) * 2002-02-13 2003-08-29 Nippon Hoso Kyokai <Nhk> シルバー音声サービス方法および受信機
WO2004097800A1 (ja) * 2003-05-02 2004-11-11 Konami Corporation 音声再生プログラム、音声再生方法及び音声再生装置
CN100399421C (zh) * 2003-05-02 2008-07-02 科乐美数码娱乐株式会社 声音重放方法以及声音重放装置
CN1303580C (zh) * 2003-10-03 2007-03-07 日本胜利株式会社 处理语音信号的装置、方法以及传送语音的方法及其装置
US7509255B2 (en) 2003-10-03 2009-03-24 Victor Company Of Japan, Limited Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof
US7728215B2 (en) 2004-09-16 2010-06-01 Sony Corporation Playback apparatus and playback method
JP2009075280A (ja) * 2007-09-20 2009-04-09 Nippon Hoso Kyokai <Nhk> コンテンツ再生装置
JP2009244912A (ja) * 2009-07-29 2009-10-22 Victor Co Of Japan Ltd 音声信号処理装置及び音声信号処理方法

Similar Documents

Publication Publication Date Title
JP3346556B2 (ja) 音声符号化方法及び音声復号方法
KR101291474B1 (ko) 데이터 기록 재생 장치, 데이터 기록 재생 방법 및 그 프로그램이 기록된 기록매체
JPH08146985A (ja) 話速制御システム
US20060107820A1 (en) Sound data encoding apparatus and sound data decoding apparatus
JP4990375B2 (ja) 記録再生装置
US7479594B2 (en) Sound data encoding apparatus and sound decoding apparatus
JPH10247093A (ja) オーディオ情報分類装置
JP2000099097A (ja) 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP2002258900A (ja) 音声再生装置及び音声再生方法
JP2002297200A (ja) 話速変換装置
JPH09138698A (ja) 音声記録再生装置
JPH0854895A (ja) 再生装置
JPH09152889A (ja) 話速変換装置
JPH1056385A (ja) デコーダおよびmpegオーディオデコーダ
JP3081469B2 (ja) 話速変換装置
JP2867744B2 (ja) 音声再生装置
JPH09146587A (ja) 話速変換装置
JPH10285046A (ja) 情報信号処理装置、情報信号記録装置及び情報信号再生装置
JPH08237135A (ja) 符号化データ復号装置およびそれを用いた画像オーディオ多重化データ復号装置
JP3387084B2 (ja) 記録媒体、音声復号装置
JPH08292796A (ja) 再生装置
JP3344575B2 (ja) 記録媒体、音声復号装置
JP3346383B2 (ja) 音声符号化装置
JP3344573B2 (ja) 記録媒体、音声復号装置
JPH0983673A (ja) 音声通信システム、音声通信方法および送受信装置