JP2003032776A - 再生システム - Google Patents
再生システムInfo
- Publication number
- JP2003032776A JP2003032776A JP2001216695A JP2001216695A JP2003032776A JP 2003032776 A JP2003032776 A JP 2003032776A JP 2001216695 A JP2001216695 A JP 2001216695A JP 2001216695 A JP2001216695 A JP 2001216695A JP 2003032776 A JP2003032776 A JP 2003032776A
- Authority
- JP
- Japan
- Prior art keywords
- listener
- sound
- reproduction
- video
- sound image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Closed-Circuit Television Systems (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
(57)【要約】
【課題】 受聴者の位置にかからわず常に最適な処理を
再生装置から出力された音声信号に対して行うことを可
能とする再生システムを提供する。 【解決手段】 再生システム100は、受聴者101の
少なくとも一部を含む映像を取り込む映像取り込み手段
102と、音声を再生することにより音声信号を出力す
る再生装置107と、映像取り込み手段102から出力
された映像信号に基づいて、受聴者101の位置を検出
する検出手段106と、検出手段106によって検出さ
れた受聴者101の位置に応じた処理を再生装置107
から出力された音声信号に対して行う音声制御装置10
8とを備えている。
再生装置から出力された音声信号に対して行うことを可
能とする再生システムを提供する。 【解決手段】 再生システム100は、受聴者101の
少なくとも一部を含む映像を取り込む映像取り込み手段
102と、音声を再生することにより音声信号を出力す
る再生装置107と、映像取り込み手段102から出力
された映像信号に基づいて、受聴者101の位置を検出
する検出手段106と、検出手段106によって検出さ
れた受聴者101の位置に応じた処理を再生装置107
から出力された音声信号に対して行う音声制御装置10
8とを備えている。
Description
【0001】
【発明の属する技術分野】本発明は、AV(オーディ
オ、ビジュアル)機器などにおいて、受聴者にとって好
ましい音響再生を行うことを目的とした音声再生装置に
関する。
オ、ビジュアル)機器などにおいて、受聴者にとって好
ましい音響再生を行うことを目的とした音声再生装置に
関する。
【0002】
【従来の技術】音の伝播は、音源と受聴者の位置関係
や、音源と受聴者の間の環境によって異なる。そこで、
音の伝播の違いを検知して、受聴者はその音源の位置
や、環境の印象を知覚することができる。例えば、音源
位置が受聴者の正面に固定してある場合、左右の耳に到
達する音は、受聴者が顔を右に向ければ左の音が、左に
向ければ右の音が相対的に大きくなる。このような、受
聴者の位置の変化と両耳で受聴する音の変化との関係
で、受聴者はより鮮明に音源の存在を知覚することがで
きる。
や、音源と受聴者の間の環境によって異なる。そこで、
音の伝播の違いを検知して、受聴者はその音源の位置
や、環境の印象を知覚することができる。例えば、音源
位置が受聴者の正面に固定してある場合、左右の耳に到
達する音は、受聴者が顔を右に向ければ左の音が、左に
向ければ右の音が相対的に大きくなる。このような、受
聴者の位置の変化と両耳で受聴する音の変化との関係
で、受聴者はより鮮明に音源の存在を知覚することがで
きる。
【0003】これを利用し、受聴者の位置の変化を検知
して、所定の音声処理を行って受聴者に呈示することに
より、より臨場感あふれる音声の再生が可能となる。そ
の例として、特開平7−822235号公報に記載の映
像信号及び音響信号の再生装置などがある。これは、映
像信号再生手段上の仮想音源と受聴者の頭部との相対的
移動を検出する検出手段を備え、ヘッドホン再生におい
て受聴者の移動に対応した音像制御を実現することが可
能である。
して、所定の音声処理を行って受聴者に呈示することに
より、より臨場感あふれる音声の再生が可能となる。そ
の例として、特開平7−822235号公報に記載の映
像信号及び音響信号の再生装置などがある。これは、映
像信号再生手段上の仮想音源と受聴者の頭部との相対的
移動を検出する検出手段を備え、ヘッドホン再生におい
て受聴者の移動に対応した音像制御を実現することが可
能である。
【0004】ヘッドホンによる音像制御と同様、スピー
カを用いた音像制御も提案されている。スピーカを用い
て音像制御を行う方式は、トランスオーラル(tran
saural)方式と呼ばれる。トランスオーラル方式
は、原音場においての受聴者の両耳に達する音響信号と
等価な信号を、再生音場内のスピーカにより受聴者の両
耳に生成する方式である。つまり、原音場での右耳(右
チャンネル入力)の信号は再生音場での右耳にのみ、左
チャンネルの信号は左耳にのみ正確に到達することを理
想とする。しかしスピーカを用いることによって、片側
の信号が逆の耳に到達してしまうという現象(クロスト
ーク)が生じてしまう。これにより音像制御が行えなく
なってしまう。よって、トランスオーラル方式ではクロ
ストークを抑圧するため、DSP(Digital S
ignal Processor)によるディジタルフ
ィルタを用いて実現している。
カを用いた音像制御も提案されている。スピーカを用い
て音像制御を行う方式は、トランスオーラル(tran
saural)方式と呼ばれる。トランスオーラル方式
は、原音場においての受聴者の両耳に達する音響信号と
等価な信号を、再生音場内のスピーカにより受聴者の両
耳に生成する方式である。つまり、原音場での右耳(右
チャンネル入力)の信号は再生音場での右耳にのみ、左
チャンネルの信号は左耳にのみ正確に到達することを理
想とする。しかしスピーカを用いることによって、片側
の信号が逆の耳に到達してしまうという現象(クロスト
ーク)が生じてしまう。これにより音像制御が行えなく
なってしまう。よって、トランスオーラル方式ではクロ
ストークを抑圧するため、DSP(Digital S
ignal Processor)によるディジタルフ
ィルタを用いて実現している。
【0005】
【発明が解決しようとする課題】しかしながら、クロス
トーク抑圧は受聴者の位置が移動した場合正しく行われ
ず、音像制御の効果が劣化するという問題点がある。そ
こで、受聴者の位置を検知し、その変化に対して所定の
処理を行うことができれば、クロストークの抑圧が実現
され、想定した音像制御が実現される。また、同時に受
聴者の移動を検知し、例えば受聴者の移動に対応するよ
う仮想音源を移動させるのは臨場感ある音声再生を行う
ためには効果的である。
トーク抑圧は受聴者の位置が移動した場合正しく行われ
ず、音像制御の効果が劣化するという問題点がある。そ
こで、受聴者の位置を検知し、その変化に対して所定の
処理を行うことができれば、クロストークの抑圧が実現
され、想定した音像制御が実現される。また、同時に受
聴者の移動を検知し、例えば受聴者の移動に対応するよ
う仮想音源を移動させるのは臨場感ある音声再生を行う
ためには効果的である。
【0006】また、スピーカ再生においては、音が伝達
する範囲にいる人全てが受聴者となり得るなど、受聴者
が限定されない場合が多い。受聴者の位置の検出は受聴
者に検出装置をつけることなくできる方が、より簡便で
受聴者にとって好ましいといえる。
する範囲にいる人全てが受聴者となり得るなど、受聴者
が限定されない場合が多い。受聴者の位置の検出は受聴
者に検出装置をつけることなくできる方が、より簡便で
受聴者にとって好ましいといえる。
【0007】本発明は、上記問題点に鑑みてなされたも
のであり、受聴者の位置にかからわず常に最適な処理を
再生装置から出力された音声信号に対して行うことを可
能とする再生システムを提供することを目的とする。
のであり、受聴者の位置にかからわず常に最適な処理を
再生装置から出力された音声信号に対して行うことを可
能とする再生システムを提供することを目的とする。
【0008】
【課題を解決するための手段】本発明の再生システム
は、受聴者の少なくとも一部を含む映像を取り込む映像
取り込み手段と、音声を再生することにより音声信号を
出力する再生装置と、前記映像取り込み手段から出力さ
れた映像信号に基づいて、受聴者の位置を検出する検出
手段と、前記検出手段によって検出された前記受聴者の
位置に応じた処理を前記再生装置から出力された前記音
声信号に対して行う音声制御装置とを備えており、これ
により、上記目的が達成される。
は、受聴者の少なくとも一部を含む映像を取り込む映像
取り込み手段と、音声を再生することにより音声信号を
出力する再生装置と、前記映像取り込み手段から出力さ
れた映像信号に基づいて、受聴者の位置を検出する検出
手段と、前記検出手段によって検出された前記受聴者の
位置に応じた処理を前記再生装置から出力された前記音
声信号に対して行う音声制御装置とを備えており、これ
により、上記目的が達成される。
【0009】前記再生装置は、2チャネル以上の音声信
号を出力してもよい。
号を出力してもよい。
【0010】前記検出手段は、前記受聴者の頭部の位置
を検出してもよい。
を検出してもよい。
【0011】前記音声制御装置は、前記検出手段によっ
て検出された前記受聴者の位置に応じた音像制御処理を
前記再生装置から出力された前記音声信号に対して行っ
てもよい。
て検出された前記受聴者の位置に応じた音像制御処理を
前記再生装置から出力された前記音声信号に対して行っ
てもよい。
【0012】前記音声制御装置は、前記検出手段によっ
て検出された前記受聴者の位置に応じた指向性制御処理
を前記再生装置から出力された前記音声信号に対して行
ってもよい。
て検出された前記受聴者の位置に応じた指向性制御処理
を前記再生装置から出力された前記音声信号に対して行
ってもよい。
【0013】前記検出手段は、前記受聴者の人数をさら
に検出してもよい。
に検出してもよい。
【0014】前記再生システムは、携帯端末において使
用されてもよい。
用されてもよい。
【0015】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態を説明する。
の実施の形態を説明する。
【0016】(実施の形態1)図1は、本発明の実施の
形態1の再生システム100の構成の一例を示す。
形態1の再生システム100の構成の一例を示す。
【0017】再生システム100は、映像を取り込む映
像取り込み手段102と、音声を再生することにより音
声信号を出力する再生装置107と、再生装置107か
ら出力される音声信号に対して処理を行う音声制御装置
108とを含む。音声制御装置108から出力される音
声信号は、スピーカ103、104に出力される。
像取り込み手段102と、音声を再生することにより音
声信号を出力する再生装置107と、再生装置107か
ら出力される音声信号に対して処理を行う音声制御装置
108とを含む。音声制御装置108から出力される音
声信号は、スピーカ103、104に出力される。
【0018】なお、再生装置107は、音声信号を出力
することに加えて、映像を再生することにより映像信号
を出力してもよい。再生装置107から出力される映像
信号は、ディスプレイ105に出力される。
することに加えて、映像を再生することにより映像信号
を出力してもよい。再生装置107から出力される映像
信号は、ディスプレイ105に出力される。
【0019】再生装置107としては、例えば、CD、
MD、半導体プレーヤなどのオーディオ機器、DVD、
BSディジタルテレビの受信装置などのAV機器、パー
ソナルコンピュータなどのマルチメディア機器が好適に
使用され得る。
MD、半導体プレーヤなどのオーディオ機器、DVD、
BSディジタルテレビの受信装置などのAV機器、パー
ソナルコンピュータなどのマルチメディア機器が好適に
使用され得る。
【0020】映像取り込み手段102は、映像取り込み
手段102によって取り込まれる映像が受聴者101の
少なくとも一部(例えば、受聴者の頭部)を含むように
方向づけられている。映像取り込み手段102は、取り
込まれた映像に対応する映像信号を出力する。
手段102によって取り込まれる映像が受聴者101の
少なくとも一部(例えば、受聴者の頭部)を含むように
方向づけられている。映像取り込み手段102は、取り
込まれた映像に対応する映像信号を出力する。
【0021】映像取り込み手段102としては、例え
ば、カメラが好適に使用され得る。カメラは、例えば、
ディスプレイ105の上に設置される。受聴者の位置を
検出する精度を向上させるために、映像取り込み手段1
02として複数のカメラが使用されてもよい。
ば、カメラが好適に使用され得る。カメラは、例えば、
ディスプレイ105の上に設置される。受聴者の位置を
検出する精度を向上させるために、映像取り込み手段1
02として複数のカメラが使用されてもよい。
【0022】再生システム100は、映像取り込み手段
102から出力された映像信号に基づいて、受聴者の位
置を検出する検出手段106をさらに含む。音声制御装
置108は、検出手段106によって検出された受聴者
の位置に応じた処理(例えば、音像制御処理または指向
性制御処理)を再生装置107から出力された音声信号
に対して行う。なお、検出手段106は、受聴者の位置
として、例えば、受聴者の頭部の位置を検出してもよ
い。
102から出力された映像信号に基づいて、受聴者の位
置を検出する検出手段106をさらに含む。音声制御装
置108は、検出手段106によって検出された受聴者
の位置に応じた処理(例えば、音像制御処理または指向
性制御処理)を再生装置107から出力された音声信号
に対して行う。なお、検出手段106は、受聴者の位置
として、例えば、受聴者の頭部の位置を検出してもよ
い。
【0023】図2Aは、再生システム100の検出手段
106および音声制御装置108の構成の一例を示す。
106および音声制御装置108の構成の一例を示す。
【0024】検出手段106は、映像取り込み手段10
2から出力された映像信号に対して所定の信号処理(例
えば、輪郭の強調処理や色の強調処理)を行う映像信号
処理部202と、映像信号処理部202からの出力に基
づいて受聴者の位置を示す情報(例えば、受聴者の頭部
の位置を示す情報)を抽出する位置情報抽出部203と
を含む。受聴者の位置を示す情報は、音声制御装置10
8に入力される。
2から出力された映像信号に対して所定の信号処理(例
えば、輪郭の強調処理や色の強調処理)を行う映像信号
処理部202と、映像信号処理部202からの出力に基
づいて受聴者の位置を示す情報(例えば、受聴者の頭部
の位置を示す情報)を抽出する位置情報抽出部203と
を含む。受聴者の位置を示す情報は、音声制御装置10
8に入力される。
【0025】音声制御装置108は、メモリ(例えば、
ROM)に格納された複数のフィルタ係数のうち、入力
された受聴者の位置を示す情報に対応するフィルタ係数
を選択する係数選択部205と、係数選択部205によ
って選択されたフィルタ係数を用いて再生装置107か
ら出力された音声信号に対して音像制御処理を行う音像
制御部206とを含む。
ROM)に格納された複数のフィルタ係数のうち、入力
された受聴者の位置を示す情報に対応するフィルタ係数
を選択する係数選択部205と、係数選択部205によ
って選択されたフィルタ係数を用いて再生装置107か
ら出力された音声信号に対して音像制御処理を行う音像
制御部206とを含む。
【0026】音像制御処理の例としては、遅延制御、音
圧レベル制御、クロストークキャンセル、仮想音源から
の頭部伝達関数の畳み込み演算などの処理が挙げられ
る。音像制御部206から出力された信号は増幅装置2
08を介してスピーカ103、104に出力される。
圧レベル制御、クロストークキャンセル、仮想音源から
の頭部伝達関数の畳み込み演算などの処理が挙げられ
る。音像制御部206から出力された信号は増幅装置2
08を介してスピーカ103、104に出力される。
【0027】図2Aに示される例では、再生装置107
から出力される音声信号は、2チャンネルの信号であ
る。しかし、音声信号のチャンネル数は2に限定されな
い。再生装置107から出力される音声信号は、2チャ
ンネル以上の信号であり得る。例えば、再生装置107
は、DVDやBSディジタルテレビ放送などで取り扱わ
れている5.1チャンネルのマルチチャンネルの音声信
号を音像制御部206に出力するようにしてもよい。
から出力される音声信号は、2チャンネルの信号であ
る。しかし、音声信号のチャンネル数は2に限定されな
い。再生装置107から出力される音声信号は、2チャ
ンネル以上の信号であり得る。例えば、再生装置107
は、DVDやBSディジタルテレビ放送などで取り扱わ
れている5.1チャンネルのマルチチャンネルの音声信
号を音像制御部206に出力するようにしてもよい。
【0028】また、図2Aに示される例では、2チャン
ネルのスピーカ103、104が使用されている。しか
し、スピーカのチャンネル数は2に限定されない。音像
制御の精度を向上させるため、あるいは、2人以上の受
聴者や、受聴者近傍の多点を制御するために、2チャン
ネル以上のスピーカを使用することも可能である。
ネルのスピーカ103、104が使用されている。しか
し、スピーカのチャンネル数は2に限定されない。音像
制御の精度を向上させるため、あるいは、2人以上の受
聴者や、受聴者近傍の多点を制御するために、2チャン
ネル以上のスピーカを使用することも可能である。
【0029】図2Bは、再生システム100が実装され
た携帯電話120の構成の一例を示す。図2Bにおい
て、図1および図2Aに示される構成要素と同一の構成
要素には同一の参照番号を付し、その説明を省略する。
た携帯電話120の構成の一例を示す。図2Bにおい
て、図1および図2Aに示される構成要素と同一の構成
要素には同一の参照番号を付し、その説明を省略する。
【0030】図2Bに示される例では、携帯電話120
は、図1および図2Aに示される再生装置107に代え
て、音声信号を生成する音声生成部110を含む。音声
信号としては、midiやmld形式などで記録された
着信音や音楽、通話相手の音声などが考えられる。音声
信号生成部110は、左チャンネルの信号を音像制御部
206の入力端子Linに入力し、右チャンネルの信号
を音像制御部206の入力端子Rinに入力する。
は、図1および図2Aに示される再生装置107に代え
て、音声信号を生成する音声生成部110を含む。音声
信号としては、midiやmld形式などで記録された
着信音や音楽、通話相手の音声などが考えられる。音声
信号生成部110は、左チャンネルの信号を音像制御部
206の入力端子Linに入力し、右チャンネルの信号
を音像制御部206の入力端子Rinに入力する。
【0031】なお、再生システム100は、任意のタイ
プの携帯端末において使用され得る。
プの携帯端末において使用され得る。
【0032】図3は、検出手段106による受聴者の位
置の検出の具体例を示す。図3に示される例では、映像
取り込み手段102は、XY平面の原点に配置されてい
るものとする。
置の検出の具体例を示す。図3に示される例では、映像
取り込み手段102は、XY平面の原点に配置されてい
るものとする。
【0033】映像取り込み手段102の視野(図3にお
いてハッチングの部分)の範囲内に、受聴者303、3
04が存在すると仮定する。受聴者303、304の位
置は、視野角度と距離とによって表現される。ここで、
視野角度とは、映像取り込み手段の視野の基準線301
から反時計周りの角度をいい、距離とは、映像取り込み
手段102と受聴者303(または受聴者304)との
間の距離をいう。
いてハッチングの部分)の範囲内に、受聴者303、3
04が存在すると仮定する。受聴者303、304の位
置は、視野角度と距離とによって表現される。ここで、
視野角度とは、映像取り込み手段の視野の基準線301
から反時計周りの角度をいい、距離とは、映像取り込み
手段102と受聴者303(または受聴者304)との
間の距離をいう。
【0034】図3において、参照番号302は、映像取
り込み手段102によって取り込まれた映像を模式的に
示す。取り込み映像302は、受聴者303の映像30
5と、受聴者304の映像306とを含む。取り込み映
像302の横幅はaであり、映像305は、取り込み映
像302の右端からbの位置にあるものとする(a、b
の単位は例えばピクセルである)。
り込み手段102によって取り込まれた映像を模式的に
示す。取り込み映像302は、受聴者303の映像30
5と、受聴者304の映像306とを含む。取り込み映
像302の横幅はaであり、映像305は、取り込み映
像302の右端からbの位置にあるものとする(a、b
の単位は例えばピクセルである)。
【0035】映像取り込み手段102の視野角度をAと
し、受聴者303の視野角度をBとすると、(数1)が
成立する。
し、受聴者303の視野角度をBとすると、(数1)が
成立する。
【0036】
【数1】b/a=B/A
従って、受聴者303の視野角度Bは、(数2)によっ
て求められる。
て求められる。
【0037】
【数2】B=(b/a)*A
映像取り込み手段102と受聴者303との距離は、例
えば、取り込み映像302中の受聴者303の顔の大き
さを検出することにより、求めることができる。映像取
り込み手段102と受聴者との距離と取り込み映像30
2中の受聴者の顔の大きさとの関係は、あらかじめ測定
され、メモリ(図示せず)に格納される。取り込み映像
302においては、受聴者303の顔の大きさの方が受
聴者304の顔の大きさより大きい。これは、映像取り
込み手段102と受聴者303との距離の方が映像取り
込み手段102と受聴者304との距離より近いからで
ある。
えば、取り込み映像302中の受聴者303の顔の大き
さを検出することにより、求めることができる。映像取
り込み手段102と受聴者との距離と取り込み映像30
2中の受聴者の顔の大きさとの関係は、あらかじめ測定
され、メモリ(図示せず)に格納される。取り込み映像
302においては、受聴者303の顔の大きさの方が受
聴者304の顔の大きさより大きい。これは、映像取り
込み手段102と受聴者303との距離の方が映像取り
込み手段102と受聴者304との距離より近いからで
ある。
【0038】なお、人間の顔の大きさは個人により異な
るが、この距離の検出にあたっては人間の顔の大きさは
同一であると仮定しても差し支えない。また、受聴者の
顔の大きさがあらかじめわかっている場合には、映像取
り込み手段と受聴者との距離をより正確に求めることが
可能である。
るが、この距離の検出にあたっては人間の顔の大きさは
同一であると仮定しても差し支えない。また、受聴者の
顔の大きさがあらかじめわかっている場合には、映像取
り込み手段と受聴者との距離をより正確に求めることが
可能である。
【0039】さらに、2つの映像取り込み手段を異なる
位置に設置することが可能な場合には、2つの映像取り
込み手段から出力される映像信号の差分を利用して基準
点と受聴者との距離を求めることも可能である。
位置に設置することが可能な場合には、2つの映像取り
込み手段から出力される映像信号の差分を利用して基準
点と受聴者との距離を求めることも可能である。
【0040】このようにして、受聴者303の位置を示
す情報として、受聴者303の視野角度と、映像取り込
み手段102と受聴者303との距離とが検出され得
る。同様にして、受聴者304の位置を示す情報とし
て、受聴者304の視野角度と、映像取り込み手段10
2と受聴者304との距離とが検出され得る。
す情報として、受聴者303の視野角度と、映像取り込
み手段102と受聴者303との距離とが検出され得
る。同様にして、受聴者304の位置を示す情報とし
て、受聴者304の視野角度と、映像取り込み手段10
2と受聴者304との距離とが検出され得る。
【0041】受聴者の顔の大きさを検出する方法として
は、さまざまな方法が使用され得る。例えば、輪郭検出
を利用して受聴者の大まかな位置および形を検出し、次
に肌色検出を利用して受聴者の顔の大きさを検出する方
法が使用され得る。あるいは、肌色検出の代わりに、ま
たは、肌色検出に加えて、目、髪の毛、口などの顔の特
徴を利用して受聴者の顔の大きさを検出してもよい。
は、さまざまな方法が使用され得る。例えば、輪郭検出
を利用して受聴者の大まかな位置および形を検出し、次
に肌色検出を利用して受聴者の顔の大きさを検出する方
法が使用され得る。あるいは、肌色検出の代わりに、ま
たは、肌色検出に加えて、目、髪の毛、口などの顔の特
徴を利用して受聴者の顔の大きさを検出してもよい。
【0042】図4を参照して、ディジタルフィルタ処理
を用いて輪郭検出を行う一例を説明する。図4におい
て、四角いますめは1画素を示し、黒色の画素(図4に
おいてハッチングの部分)は値1を有しており、白色の
画素は値0を有しているとする。
を用いて輪郭検出を行う一例を説明する。図4におい
て、四角いますめは1画素を示し、黒色の画素(図4に
おいてハッチングの部分)は値1を有しており、白色の
画素は値0を有しているとする。
【0043】図4(a)は、映像取り込み手段102に
よって取り込まれた映像の一例を示す。このような映像
の輪郭は、例えば、係数[1−1]を有するFIRディジ
タルフィルタを用いて映像の縦方向および横方向にフィ
ルタ処理を行うことにより検出され得る。このFIRデ
ィジタルフィルタは、フィルタ処理されるデータの変化
を検出し、0以外の値を出力するという性質を有してい
るからである。
よって取り込まれた映像の一例を示す。このような映像
の輪郭は、例えば、係数[1−1]を有するFIRディジ
タルフィルタを用いて映像の縦方向および横方向にフィ
ルタ処理を行うことにより検出され得る。このFIRデ
ィジタルフィルタは、フィルタ処理されるデータの変化
を検出し、0以外の値を出力するという性質を有してい
るからである。
【0044】図4(b)は、そのFIRディジタルフィ
ルタを用いて図4(a)に示される映像をフィルタ処理
した結果を示す。このように、輪郭検出を利用して、受
聴者の大まかな位置および形を検出することができる。
ルタを用いて図4(a)に示される映像をフィルタ処理
した結果を示す。このように、輪郭検出を利用して、受
聴者の大まかな位置および形を検出することができる。
【0045】なお、受聴者の目を検出することが可能で
ある場合には、受聴者の顔の向きを検出することも可能
である。
ある場合には、受聴者の顔の向きを検出することも可能
である。
【0046】図5は、図2Aに示される音像制御部20
6の構成の一例を示す。音像制御部206は、2つの入
力端子Lin、Rinと、2つの出力端子Lout、R
outとを有している。
6の構成の一例を示す。音像制御部206は、2つの入
力端子Lin、Rinと、2つの出力端子Lout、R
outとを有している。
【0047】入力端子Linには、再生装置107(図
2A)から左チャンネルの音声信号が入力される。入力
端子Rinには、再生装置107(図2A)から右チャ
ンネルの音声信号が入力される。出力端子Loutから
出力される信号は、増幅装置208を介してスピーカ1
04に供給される。出力端子Routから出力される信
号は、増幅装置208を介してスピーカ103に供給さ
れる。
2A)から左チャンネルの音声信号が入力される。入力
端子Rinには、再生装置107(図2A)から右チャ
ンネルの音声信号が入力される。出力端子Loutから
出力される信号は、増幅装置208を介してスピーカ1
04に供給される。出力端子Routから出力される信
号は、増幅装置208を介してスピーカ103に供給さ
れる。
【0048】音像制御部206は、フィルタ501〜5
04と、加算器505、506とを含む。フィルタ50
1、502の入力は入力端子Linに接続されている。
フィルタ503、504の入力は入力端子Rinに接続
されている。加算器505は、フィルタ501の出力と
フィルタ503の出力とを加算し、その加算結果を出力
端子Loutに出力する。加算器506は、フィルタ5
02の出力とフィルタ504の出力とを加算し、その加
算結果を出力端子Routに出力する。
04と、加算器505、506とを含む。フィルタ50
1、502の入力は入力端子Linに接続されている。
フィルタ503、504の入力は入力端子Rinに接続
されている。加算器505は、フィルタ501の出力と
フィルタ503の出力とを加算し、その加算結果を出力
端子Loutに出力する。加算器506は、フィルタ5
02の出力とフィルタ504の出力とを加算し、その加
算結果を出力端子Routに出力する。
【0049】ここで、フィルタ501、502、50
3、504のフィルタ係数が、それぞれ、Xll、Xl
r、Xrl、Xrrであるとする。
3、504のフィルタ係数が、それぞれ、Xll、Xl
r、Xrl、Xrrであるとする。
【0050】図6は、図2Aに示される係数選択部20
5内のメモリ(例えば、ROM)に格納されるテーブル
600の一例を示す。テーブル600は、映像取り込み
手段102の視野範囲内に存在する受聴者が1人である
場合に使用される。図6において、C11、C12、・・
・、C(n+1)4のそれぞれは、数値の配列(例えば、
[0.1,0.2,0.3,−0.3,0.01])を示
す。配列内の数値の個数は制御性能に依存する。
5内のメモリ(例えば、ROM)に格納されるテーブル
600の一例を示す。テーブル600は、映像取り込み
手段102の視野範囲内に存在する受聴者が1人である
場合に使用される。図6において、C11、C12、・・
・、C(n+1)4のそれぞれは、数値の配列(例えば、
[0.1,0.2,0.3,−0.3,0.01])を示
す。配列内の数値の個数は制御性能に依存する。
【0051】テーブル600は、視聴者の位置を示す情
報(視野角度、距離)ごとに定義されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)を含む。
報(視野角度、距離)ごとに定義されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)を含む。
【0052】係数選択部205は、位置情報抽出部20
3から出力された受聴者の位置を示す情報(視野角度、
距離)に対応するフィルタ係数の組(Xll、Xlr、
Xrl、Xrr)を選択し、選択されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)を音像制御部2
06に出力する。その結果、選択されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)が、音像制御部
206に含まれるフィルタの組(フィルタ501、フィ
ルタ502、フィルタ503、フィルタ504)にそれ
ぞれ設定される。
3から出力された受聴者の位置を示す情報(視野角度、
距離)に対応するフィルタ係数の組(Xll、Xlr、
Xrl、Xrr)を選択し、選択されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)を音像制御部2
06に出力する。その結果、選択されたフィルタ係数の
組(Xll、Xlr、Xrl、Xrr)が、音像制御部
206に含まれるフィルタの組(フィルタ501、フィ
ルタ502、フィルタ503、フィルタ504)にそれ
ぞれ設定される。
【0053】例えば、受聴者が(視野角度、距離)=
(0°、0.5m)の位置に存在する場合には、係数選
択部205は、(0°、0.5m)に対応するフィルタ
係数の組(Xll、Xlr、Xrl、Xrr)=
(C11、C12、C13、C14)を選択する。選択されたフ
ィルタ係数の組(Xll、Xlr、Xrl、Xrr)=
(C11、C12、C13、C14)が、音像制御部206に含
まれるフィルタの組(フィルタ501、フィルタ50
2、フィルタ503、フィルタ504)にそれぞれ設定
される。
(0°、0.5m)の位置に存在する場合には、係数選
択部205は、(0°、0.5m)に対応するフィルタ
係数の組(Xll、Xlr、Xrl、Xrr)=
(C11、C12、C13、C14)を選択する。選択されたフ
ィルタ係数の組(Xll、Xlr、Xrl、Xrr)=
(C11、C12、C13、C14)が、音像制御部206に含
まれるフィルタの組(フィルタ501、フィルタ50
2、フィルタ503、フィルタ504)にそれぞれ設定
される。
【0054】このように、再生システム100に対する
受聴者の相対的な位置に応じて、音像制御部206のフ
ィルタ係数を更新することにより、受聴者の位置にかか
わらず常に最適な音像制御(例えば、音像を定位させる
音像定位の制御)を行うことが可能になる。音像制御部
206のフィルタ係数の更新は、受聴者の位置の変化に
追従してリアルタイムに行うことが好ましい。
受聴者の相対的な位置に応じて、音像制御部206のフ
ィルタ係数を更新することにより、受聴者の位置にかか
わらず常に最適な音像制御(例えば、音像を定位させる
音像定位の制御)を行うことが可能になる。音像制御部
206のフィルタ係数の更新は、受聴者の位置の変化に
追従してリアルタイムに行うことが好ましい。
【0055】通常、音像制御部206のフィルタ係数
は、受聴者が再生システム100の正面に位置している
ことを想定して1とおりに設計される。これに対し、本
発明では、音像制御部206のフィルタ係数は、受聴者
が再生システム100に対して複数の位置に存在するこ
とを想定して複数とおりに設計される。これにより、再
生システム100に対する受聴者の相対的な位置が変化
する場合でも、受聴者の位置に応じて音像制御部206
のフィルタ係数を更新することにより、常に最適な音像
制御を行うことが可能になる。
は、受聴者が再生システム100の正面に位置している
ことを想定して1とおりに設計される。これに対し、本
発明では、音像制御部206のフィルタ係数は、受聴者
が再生システム100に対して複数の位置に存在するこ
とを想定して複数とおりに設計される。これにより、再
生システム100に対する受聴者の相対的な位置が変化
する場合でも、受聴者の位置に応じて音像制御部206
のフィルタ係数を更新することにより、常に最適な音像
制御を行うことが可能になる。
【0056】図7は、図2Aに示される係数選択部20
5内のメモリ(例えば、ROM)に格納されるテーブル
700の一例を示す。テーブル700は、映像取り込み
手段102の視野範囲内に存在する受聴者が2人である
場合に使用される。図7において、C11’、C12’、・
・・、C34’のそれぞれは、数値の配列(例えば、
[0.1,0.2,0.3,−0.3,0.01])を示
す。配列内の数値の個数は制御性能に依存する。
5内のメモリ(例えば、ROM)に格納されるテーブル
700の一例を示す。テーブル700は、映像取り込み
手段102の視野範囲内に存在する受聴者が2人である
場合に使用される。図7において、C11’、C12’、・
・・、C34’のそれぞれは、数値の配列(例えば、
[0.1,0.2,0.3,−0.3,0.01])を示
す。配列内の数値の個数は制御性能に依存する。
【0057】テーブル700は、第1の受聴者の位置を
示す情報(視野角度、距離)および第2の受聴者の位置
を示す情報(視野角度、距離)の組ごとに定義されたフ
ィルタ係数の組(Xll、Xlr、Xrl、Xrr)を
含む。
示す情報(視野角度、距離)および第2の受聴者の位置
を示す情報(視野角度、距離)の組ごとに定義されたフ
ィルタ係数の組(Xll、Xlr、Xrl、Xrr)を
含む。
【0058】2つのスピーカを用いて音声を再生する場
合には、2つの制御点における音を制御することが可能
である。映像取り込み手段102の視野範囲内に1人の
受聴者のみが存在する場合には、その2つの制御点を受
聴者の両耳の近傍に配置することが好ましい。映像取り
込み手段102の視野範囲内に2人の受聴者が存在する
場合には、その2つの制御点を各受聴者の頭部の中心位
置に配置することが好ましい。受聴者が2人の場合に
は、受聴者が1人の場合に比べて、音像制御の性能は劣
るものの、ある程度の音像制御を実現することが可能で
ある。このように、映像取り込み手段102の視野範囲
内に存在する受聴者の人数に応じて、制御点の配置を変
更することにより、受聴者の人数に適合した適切な音像
制御を実現することが可能になる。
合には、2つの制御点における音を制御することが可能
である。映像取り込み手段102の視野範囲内に1人の
受聴者のみが存在する場合には、その2つの制御点を受
聴者の両耳の近傍に配置することが好ましい。映像取り
込み手段102の視野範囲内に2人の受聴者が存在する
場合には、その2つの制御点を各受聴者の頭部の中心位
置に配置することが好ましい。受聴者が2人の場合に
は、受聴者が1人の場合に比べて、音像制御の性能は劣
るものの、ある程度の音像制御を実現することが可能で
ある。このように、映像取り込み手段102の視野範囲
内に存在する受聴者の人数に応じて、制御点の配置を変
更することにより、受聴者の人数に適合した適切な音像
制御を実現することが可能になる。
【0059】なお、受聴者の位置を示す情報として、
(視野角度、距離)または(x、y)座標以外のものを
使用してもよい。
(視野角度、距離)または(x、y)座標以外のものを
使用してもよい。
【0060】また、受聴者の顔の向きを検出可能である
場合には、図6および図7に示されるテーブルに顔の向
きを示すパラメータを追加して、受聴者の位置を示す情
報および受聴者の顔の向きを示す情報の組ごとにフィル
タ係数の組(Xll、Xlr、Xrl、Xrr)を定義
しておくことが好ましい。これにより、受聴者の位置お
よび受聴者の顔の向きにかかわらず常に最適な音像制御
(例えば、音像を定位させる音像定位の制御)を行うこ
とが可能になる。
場合には、図6および図7に示されるテーブルに顔の向
きを示すパラメータを追加して、受聴者の位置を示す情
報および受聴者の顔の向きを示す情報の組ごとにフィル
タ係数の組(Xll、Xlr、Xrl、Xrr)を定義
しておくことが好ましい。これにより、受聴者の位置お
よび受聴者の顔の向きにかかわらず常に最適な音像制御
(例えば、音像を定位させる音像定位の制御)を行うこ
とが可能になる。
【0061】(実施の形態2)図8は、本発明の実施の
形態2の再生システム200の構成の一例を示す。図8
において、図2Aに示される構成要素と同一の構成要素
には同一の参照番号を付し、その説明を省略する。
形態2の再生システム200の構成の一例を示す。図8
において、図2Aに示される構成要素と同一の構成要素
には同一の参照番号を付し、その説明を省略する。
【0062】再生システム200は、車に搭載されるカ
ーステレオシステムである。再生装置200は、スピー
カ801〜804を含む。スピーカ801は左フロント
ドアに設置される。スピーカ802は右フロントドアに
設置される。スピーカ803は左リアダッシュボードに
設置される。スピーカ804は右リアダッシュボードに
設置される。
ーステレオシステムである。再生装置200は、スピー
カ801〜804を含む。スピーカ801は左フロント
ドアに設置される。スピーカ802は右フロントドアに
設置される。スピーカ803は左リアダッシュボードに
設置される。スピーカ804は右リアダッシュボードに
設置される。
【0063】映像取り込み手段102(例えば、カメ
ラ)は、例えば、ルームミラーまたはフロントダッシュ
ボードに設置される。
ラ)は、例えば、ルームミラーまたはフロントダッシュ
ボードに設置される。
【0064】音声制御装置808は、メモリ(例えば、
ROM)に格納された複数のフィルタ係数のうち、受聴
者の位置を示す情報に対応するフィルタ係数を選択する
係数選択部805と、係数選択部805によって選択さ
れたフィルタ係数を用いて再生装置107から出力され
た音声信号に対して音像制御処理を行う音像制御部80
6とを含む。
ROM)に格納された複数のフィルタ係数のうち、受聴
者の位置を示す情報に対応するフィルタ係数を選択する
係数選択部805と、係数選択部805によって選択さ
れたフィルタ係数を用いて再生装置107から出力され
た音声信号に対して音像制御処理を行う音像制御部80
6とを含む。
【0065】図9は、図8に示される音像制御部806
の構成の一例を示す。音像制御部806は、2つの入力
端子Lin、Rinと、4つの出力端子FLout、F
Rout、RLout、RRoutとを有している。
の構成の一例を示す。音像制御部806は、2つの入力
端子Lin、Rinと、4つの出力端子FLout、F
Rout、RLout、RRoutとを有している。
【0066】入力端子Linには、再生装置107(図
8)から左チャンネルの音声信号が入力される。入力端
子Rinには、再生装置107(図8)から右チャンネ
ルの音声信号が入力される。出力端子FLoutから出
力される信号は、増幅装置208を介してスピーカ80
1に供給される。出力端子FRoutから出力される信
号は、増幅装置208を介してスピーカ802に供給さ
れる。出力端子RLoutから出力される信号は、増幅
装置208を介してスピーカ803に供給される。出力
端子RRoutから出力される信号は、増幅装置208
を介してスピーカ804に供給される。
8)から左チャンネルの音声信号が入力される。入力端
子Rinには、再生装置107(図8)から右チャンネ
ルの音声信号が入力される。出力端子FLoutから出
力される信号は、増幅装置208を介してスピーカ80
1に供給される。出力端子FRoutから出力される信
号は、増幅装置208を介してスピーカ802に供給さ
れる。出力端子RLoutから出力される信号は、増幅
装置208を介してスピーカ803に供給される。出力
端子RRoutから出力される信号は、増幅装置208
を介してスピーカ804に供給される。
【0067】音像制御部806は、フィルタ911〜9
14、921〜924、931〜934、941〜94
4と、加算器951〜954、961〜964、971
〜974とを含む。
14、921〜924、931〜934、941〜94
4と、加算器951〜954、961〜964、971
〜974とを含む。
【0068】ここで、フィルタ911〜914のフィル
タ係数がそれぞれX11〜X14であり、フィルタ92
1〜924のフィルタ係数がそれぞれX21〜X24で
あり、フィルタ931〜934のフィルタ係数がそれぞ
れX31〜X34であり、フィルタ941〜944のフ
ィルタ係数がそれぞれX41〜X44であるとする。
タ係数がそれぞれX11〜X14であり、フィルタ92
1〜924のフィルタ係数がそれぞれX21〜X24で
あり、フィルタ931〜934のフィルタ係数がそれぞ
れX31〜X34であり、フィルタ941〜944のフ
ィルタ係数がそれぞれX41〜X44であるとする。
【0069】図10は、図8に示される係数選択部80
5内のメモリ(例えば、ROM)に格納されるテーブル
1000の一例を示す。図10において、C111、
C112、・・・、C444のそれぞれは、数値の配列(例え
ば、[0.1,0.2,0.3,−0.3,0.01])
を示す。配列内の数値の個数は制御性能に依存する。
5内のメモリ(例えば、ROM)に格納されるテーブル
1000の一例を示す。図10において、C111、
C112、・・・、C444のそれぞれは、数値の配列(例え
ば、[0.1,0.2,0.3,−0.3,0.01])
を示す。配列内の数値の個数は制御性能に依存する。
【0070】テーブル1000は、乗車パターンごとに
定義されたフィルタ係数の組(Xl1〜X14、X21
〜X24、X31〜X34、X41〜X44)を含む。
定義されたフィルタ係数の組(Xl1〜X14、X21
〜X24、X31〜X34、X41〜X44)を含む。
【0071】係数選択部805は、位置情報抽出部20
3から出力された受聴者の位置を示す情報(乗車パター
ン)に対応するフィルタ係数の組(Xl1〜X14、X
21〜X24、X31〜X34、X41〜X44)を選
択し、選択されたフィルタ係数の組(Xl1〜X14、
X21〜X24、X31〜X34、X41〜X44)を
音像制御部806に出力する。その結果、選択されたフ
ィルタ係数の組(Xl1〜X14、X21〜X24、X
31〜X34、X41〜X44)が、音像制御部806
に含まれるフィルタの組(フィルタ911〜914、フ
ィルタ921〜924、フィルタ931〜934、フィ
ルタ941〜944)にそれぞれ設定される。
3から出力された受聴者の位置を示す情報(乗車パター
ン)に対応するフィルタ係数の組(Xl1〜X14、X
21〜X24、X31〜X34、X41〜X44)を選
択し、選択されたフィルタ係数の組(Xl1〜X14、
X21〜X24、X31〜X34、X41〜X44)を
音像制御部806に出力する。その結果、選択されたフ
ィルタ係数の組(Xl1〜X14、X21〜X24、X
31〜X34、X41〜X44)が、音像制御部806
に含まれるフィルタの組(フィルタ911〜914、フ
ィルタ921〜924、フィルタ931〜934、フィ
ルタ941〜944)にそれぞれ設定される。
【0072】図10において、例えば、乗車パターン
(a)は、運転席に1人乗車を示し、乗車パターン
(b)は、運転席および助手席に2人乗車を示し、乗車
パターン(c)は、運転席、助手席およびリアシートに
4人乗車を示す。
(a)は、運転席に1人乗車を示し、乗車パターン
(b)は、運転席および助手席に2人乗車を示し、乗車
パターン(c)は、運転席、助手席およびリアシートに
4人乗車を示す。
【0073】このような乗車パターンは、実施の形態1
で説明したように受聴者の人数および位置を検出するこ
とによって判別され得る。ただし、車の座席の位置は固
定されているため、受聴者の位置も限定される。従っ
て、実施の形態1に比べて、受聴者の位置を示す情報の
検出を簡略化してもよい。
で説明したように受聴者の人数および位置を検出するこ
とによって判別され得る。ただし、車の座席の位置は固
定されているため、受聴者の位置も限定される。従っ
て、実施の形態1に比べて、受聴者の位置を示す情報の
検出を簡略化してもよい。
【0074】さらに、映像取り込み手段102および検
出手段106に代えて、人が座席に座ったことを検知す
るセンサ(例えば、圧力センサ)を座席に取り付けるこ
とにより、乗車パターンを判別するようにしてもよい。
出手段106に代えて、人が座席に座ったことを検知す
るセンサ(例えば、圧力センサ)を座席に取り付けるこ
とにより、乗車パターンを判別するようにしてもよい。
【0075】4つのスピーカを用いて音声を再生する場
合には、4つの制御点における音を制御することが可能
である。
合には、4つの制御点における音を制御することが可能
である。
【0076】図11は、乗車パターンと4つの制御点の
配置との関係を示す。図11において、xは制御点を示
す。
配置との関係を示す。図11において、xは制御点を示
す。
【0077】図11(a)に示されるように乗車パター
ンが運転席に1人乗車を示す場合には、4つの制御点を
運転席の受聴者の両耳の近傍に配置することが好まし
い。図11(b)に示されるように乗車パターンが運転
席および助手席に2人乗車を示す場合には、4つの制御
点のうちの2つの制御点を運転席の受聴者の両耳の近傍
に配置し、残りの2つの制御点を助手席の受聴者の両耳
の近傍に配置することが好ましい。図11(c)に示さ
れるように乗車パターンが運転席、助手席およびリアシ
ートに4人乗車を示す場合には、4つの制御点のそれぞ
れを各受聴者の頭部の中心位置に配置することが好まし
い。
ンが運転席に1人乗車を示す場合には、4つの制御点を
運転席の受聴者の両耳の近傍に配置することが好まし
い。図11(b)に示されるように乗車パターンが運転
席および助手席に2人乗車を示す場合には、4つの制御
点のうちの2つの制御点を運転席の受聴者の両耳の近傍
に配置し、残りの2つの制御点を助手席の受聴者の両耳
の近傍に配置することが好ましい。図11(c)に示さ
れるように乗車パターンが運転席、助手席およびリアシ
ートに4人乗車を示す場合には、4つの制御点のそれぞ
れを各受聴者の頭部の中心位置に配置することが好まし
い。
【0078】乗車パターンが4人乗車の場合には、乗車
パターンが1人乗車または2人乗車の場合に比べて、音
像制御の性能は劣るものの、ある程度の音像制御を実現
することが可能である。このように、映像取り込み手段
102の視野範囲内に存在する受聴者の人数に応じて、
制御点の配置を変更することにより、受聴者の人数に適
合した適切な音像制御を実現することが可能になる。
パターンが1人乗車または2人乗車の場合に比べて、音
像制御の性能は劣るものの、ある程度の音像制御を実現
することが可能である。このように、映像取り込み手段
102の視野範囲内に存在する受聴者の人数に応じて、
制御点の配置を変更することにより、受聴者の人数に適
合した適切な音像制御を実現することが可能になる。
【0079】なお、受聴者の年齢を検出可能な場合に
は、受聴者の年齢に応じた音像制御を行うようにしても
よい。例えば、受聴者が高齢者である場合には、音圧が
通常より高くなるように音声信号を処理することが好ま
しい。
は、受聴者の年齢に応じた音像制御を行うようにしても
よい。例えば、受聴者が高齢者である場合には、音圧が
通常より高くなるように音声信号を処理することが好ま
しい。
【0080】また、個人識別が可能な場合には、個人の
好みに応じた音像制御を行うようにしてもよい。
好みに応じた音像制御を行うようにしてもよい。
【0081】図8に示される例では、再生装置107か
ら出力される音声信号は、2チャンネルの信号である。
しかし、音声信号のチャンネル数は2に限定されない。
再生装置107から出力される音声信号は、2チャンネ
ル以上の信号であり得る。例えば、再生装置107は、
DVDやBSディジタルテレビ放送などで取り扱われて
いる5.1チャンネルのマルチチャンネルの音声信号を
音像制御部806に出力するようにしてもよい。
ら出力される音声信号は、2チャンネルの信号である。
しかし、音声信号のチャンネル数は2に限定されない。
再生装置107から出力される音声信号は、2チャンネ
ル以上の信号であり得る。例えば、再生装置107は、
DVDやBSディジタルテレビ放送などで取り扱われて
いる5.1チャンネルのマルチチャンネルの音声信号を
音像制御部806に出力するようにしてもよい。
【0082】また、図8に示される例では、4チャンネ
ルのスピーカ801〜804が使用されている。しか
し、スピーカのチャンネル数は4に限定されない。音像
制御の精度を向上させるため、あるいは、2人以上の受
聴者や、受聴者近傍の多点を制御するために、4チャン
ネル以上のスピーカを使用することも可能である。
ルのスピーカ801〜804が使用されている。しか
し、スピーカのチャンネル数は4に限定されない。音像
制御の精度を向上させるため、あるいは、2人以上の受
聴者や、受聴者近傍の多点を制御するために、4チャン
ネル以上のスピーカを使用することも可能である。
【0083】上述したように、実施の形態1および実施
の形態2では、音声制御装置が音像制御処理を行う例を
主として説明した。アプリケーションによっては、音声
制御装置が音像制御処理以外の処理を行うことも可能で
ある。また、映像取り込み手段によって取り込まれる映
像に応じて音像制御処理とその他の処理とを切り替える
ことも可能である。音像制御処理以外の処理としては、
例えば、指向性制御処理が挙げられる。指向性制御処理
とは、例えば、取り込み映像に基づいて目標とする受聴
者を検出し、その目標とする受聴者の方向のみに音が伝
わるように制御する処理をいう。
の形態2では、音声制御装置が音像制御処理を行う例を
主として説明した。アプリケーションによっては、音声
制御装置が音像制御処理以外の処理を行うことも可能で
ある。また、映像取り込み手段によって取り込まれる映
像に応じて音像制御処理とその他の処理とを切り替える
ことも可能である。音像制御処理以外の処理としては、
例えば、指向性制御処理が挙げられる。指向性制御処理
とは、例えば、取り込み映像に基づいて目標とする受聴
者を検出し、その目標とする受聴者の方向のみに音が伝
わるように制御する処理をいう。
【0084】マルチチャネルスピーカを用いた超指向性
スピーカの技術を用いることにより、音の鋭いビームを
実現することができる。これを受聴者の方向に向けるこ
とにより、受聴者のみに音を伝播させることが可能であ
る。また、音像制御処理と指向性制御処理とを切り替え
るようにしてもよい。
スピーカの技術を用いることにより、音の鋭いビームを
実現することができる。これを受聴者の方向に向けるこ
とにより、受聴者のみに音を伝播させることが可能であ
る。また、音像制御処理と指向性制御処理とを切り替え
るようにしてもよい。
【0085】なお、再生システム100または再生シス
テム200に含まれる各手段および各装置は、ハードウ
ェアで実現されてもよいし、ソフトウェアで実現されて
もよいし、ハードウェアとソフトウェアとの組み合わせ
によって実現されてもよい。
テム200に含まれる各手段および各装置は、ハードウ
ェアで実現されてもよいし、ソフトウェアで実現されて
もよいし、ハードウェアとソフトウェアとの組み合わせ
によって実現されてもよい。
【0086】
【発明の効果】本発明によれば、受聴者の位置にかから
わず常に最適な処理を再生装置から出力された音声信号
に対して行うことを可能とする再生システムを提供する
ことが可能になる。これにより、受聴者にとってより好
ましい、より臨場感ある音声再生を実現することが可能
になる。
わず常に最適な処理を再生装置から出力された音声信号
に対して行うことを可能とする再生システムを提供する
ことが可能になる。これにより、受聴者にとってより好
ましい、より臨場感ある音声再生を実現することが可能
になる。
【図1】本発明の実施の形態1の再生システム100の
構成の一例を示す図
構成の一例を示す図
【図2A】再生システム100の検出手段106および
音声制御装置108の構成の一例を示す図
音声制御装置108の構成の一例を示す図
【図2B】再生システム100が実装された携帯電話1
20の構成の一例を示す図
20の構成の一例を示す図
【図3】検出手段106による受聴者の位置の検出の具
体例を示す図
体例を示す図
【図4】ディジタルフィルタ処理を用いて輪郭検出を行
う一例を説明するための図
う一例を説明するための図
【図5】図2Aに示される音像制御部206の構成の一
例を示す図
例を示す図
【図6】図2Aに示される係数選択部205内のメモリ
に格納されるテーブル600の一例を示す図
に格納されるテーブル600の一例を示す図
【図7】図2Aに示される係数選択部205内のメモリ
に格納されるテーブル700の一例を示す図
に格納されるテーブル700の一例を示す図
【図8】本発明の実施の形態2の再生システム200の
構成の一例を示す図
構成の一例を示す図
【図9】図8に示される音像制御部806の構成の一例
を示す図
を示す図
【図10】図8に示される係数選択部805内のメモリ
(例えば、ROM)に格納されるテーブル1000の一
例を示す。
(例えば、ROM)に格納されるテーブル1000の一
例を示す。
【図11】乗車パターンと4つの制御点の配置との関係
を示す図
を示す図
100 再生システム
101 受聴者
102 映像取り込み手段
103、104 スピーカ
105 ディスプレイ
106 検出手段
107 再生装置
108 音声制御装置
─────────────────────────────────────────────────────
フロントページの続き
Fターム(参考) 5C054 AA01 AA05 CA04 CC02 CD03
CE01 CH01 DA08 EA01 FA00
FC03 FC12 FC13 FF03 HA17
5D020 BB03
Claims (7)
- 【請求項1】 受聴者の少なくとも一部を含む映像を取
り込む映像取り込み手段と、 音声を再生することにより音声信号を出力する再生装置
と、 前記映像取り込み手段から出力された映像信号に基づい
て、受聴者の位置を検出する検出手段と、 前記検出手段によって検出された前記受聴者の位置に応
じた処理を前記再生装置から出力された前記音声信号に
対して行う音声制御装置とを備えた、再生システム。 - 【請求項2】 前記再生装置は、2チャネル以上の音声
信号を出力する、請求項1に記載の再生システム。 - 【請求項3】 前記検出手段は、前記受聴者の頭部の位
置を検出する、請求項1に記載の再生システム。 - 【請求項4】 前記音声制御装置は、前記検出手段によ
って検出された前記受聴者の位置に応じた音像制御処理
を前記再生装置から出力された前記音声信号に対して行
う、請求項1に記載の再生システム。 - 【請求項5】 前記音声制御装置は、前記検出手段によ
って検出された前記受聴者の位置に応じた指向性制御処
理を前記再生装置から出力された前記音声信号に対して
行う、請求項1に記載の再生システム。 - 【請求項6】 前記検出手段は、前記受聴者の人数をさ
らに検出する、請求項1に記載の再生システム。 - 【請求項7】 前記再生システムは、携帯端末において
使用される、請求項1に記載の再生システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001216695A JP2003032776A (ja) | 2001-07-17 | 2001-07-17 | 再生システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001216695A JP2003032776A (ja) | 2001-07-17 | 2001-07-17 | 再生システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003032776A true JP2003032776A (ja) | 2003-01-31 |
Family
ID=19051139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001216695A Withdrawn JP2003032776A (ja) | 2001-07-17 | 2001-07-17 | 再生システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003032776A (ja) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004023180A (ja) * | 2002-06-12 | 2004-01-22 | Toshiba Corp | 音声伝送装置、音声伝送方法及びプログラム |
JP2005057488A (ja) * | 2003-08-04 | 2005-03-03 | Nec Corp | 携帯端末 |
JP2005057545A (ja) * | 2003-08-05 | 2005-03-03 | Matsushita Electric Ind Co Ltd | 音場制御装置及び音響システム |
JP2005192212A (ja) * | 2003-12-24 | 2005-07-14 | Samsung Electronics Co Ltd | 多数のマイクロホンを利用した指向性制御可能スピーカシステム及びその方法 |
JP2005327054A (ja) * | 2004-05-13 | 2005-11-24 | Toshiba Corp | 音声出力付き表示装置 |
WO2006067893A1 (ja) * | 2004-12-24 | 2006-06-29 | Matsushita Electric Industrial Co., Ltd. | 音像定位装置 |
JP2007214897A (ja) * | 2006-02-09 | 2007-08-23 | Kenwood Corp | 音響システム |
US7268677B2 (en) | 2004-06-07 | 2007-09-11 | Denso Corporation | Information processing system |
JP2008211834A (ja) * | 2004-12-24 | 2008-09-11 | Matsushita Electric Ind Co Ltd | 音像定位装置 |
JP2008227942A (ja) * | 2007-03-13 | 2008-09-25 | Pioneer Electronic Corp | コンテンツ再生装置及びコンテンツ再生方法 |
JP2011071685A (ja) * | 2009-09-25 | 2011-04-07 | Nec Corp | 映像音響処理システム、映像音響処理方法及びプログラム |
JP2012156865A (ja) * | 2011-01-27 | 2012-08-16 | Toshiba Corp | 音場制御装置及び方法 |
JP2012223357A (ja) * | 2011-04-19 | 2012-11-15 | Onkyo Corp | ビデオゲーム装置およびビデオゲーム制御方法 |
JP2013048412A (ja) * | 2011-07-28 | 2013-03-07 | Apple Inc | オーディオエンハンス型装置 |
JP2013529004A (ja) * | 2010-04-26 | 2013-07-11 | ケンブリッジ メカトロニクス リミテッド | 位置追跡を備えるスピーカ |
US8879761B2 (en) | 2011-11-22 | 2014-11-04 | Apple Inc. | Orientation-based audio |
CN106470379A (zh) * | 2015-08-20 | 2017-03-01 | 三星电子株式会社 | 用于基于扬声器位置信息处理音频信号的方法和设备 |
WO2019026140A1 (ja) * | 2017-07-31 | 2019-02-07 | 株式会社ソシオネクスト | 映像音響再生装置、映像音響再生方法、プログラム及び記録媒体 |
WO2019049409A1 (ja) * | 2017-09-11 | 2019-03-14 | シャープ株式会社 | 音声信号処理装置および音声信号処理システム |
-
2001
- 2001-07-17 JP JP2001216695A patent/JP2003032776A/ja not_active Withdrawn
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004023180A (ja) * | 2002-06-12 | 2004-01-22 | Toshiba Corp | 音声伝送装置、音声伝送方法及びプログラム |
JP2005057488A (ja) * | 2003-08-04 | 2005-03-03 | Nec Corp | 携帯端末 |
JP2005057545A (ja) * | 2003-08-05 | 2005-03-03 | Matsushita Electric Ind Co Ltd | 音場制御装置及び音響システム |
US7936886B2 (en) | 2003-12-24 | 2011-05-03 | Samsung Electronics Co., Ltd. | Speaker system to control directivity of a speaker unit using a plurality of microphones and a method thereof |
JP2005192212A (ja) * | 2003-12-24 | 2005-07-14 | Samsung Electronics Co Ltd | 多数のマイクロホンを利用した指向性制御可能スピーカシステム及びその方法 |
JP2005327054A (ja) * | 2004-05-13 | 2005-11-24 | Toshiba Corp | 音声出力付き表示装置 |
US7268677B2 (en) | 2004-06-07 | 2007-09-11 | Denso Corporation | Information processing system |
JP2006203850A (ja) * | 2004-12-24 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音像定位装置 |
JP2008211834A (ja) * | 2004-12-24 | 2008-09-11 | Matsushita Electric Ind Co Ltd | 音像定位装置 |
WO2006067893A1 (ja) * | 2004-12-24 | 2006-06-29 | Matsushita Electric Industrial Co., Ltd. | 音像定位装置 |
JP2007214897A (ja) * | 2006-02-09 | 2007-08-23 | Kenwood Corp | 音響システム |
JP2008227942A (ja) * | 2007-03-13 | 2008-09-25 | Pioneer Electronic Corp | コンテンツ再生装置及びコンテンツ再生方法 |
JP2011071685A (ja) * | 2009-09-25 | 2011-04-07 | Nec Corp | 映像音響処理システム、映像音響処理方法及びプログラム |
JP2013529004A (ja) * | 2010-04-26 | 2013-07-11 | ケンブリッジ メカトロニクス リミテッド | 位置追跡を備えるスピーカ |
JP2012156865A (ja) * | 2011-01-27 | 2012-08-16 | Toshiba Corp | 音場制御装置及び方法 |
US9497562B2 (en) | 2011-01-27 | 2016-11-15 | Kabushiki Kaisha Toshiba | Sound field control apparatus and method |
JP2012223357A (ja) * | 2011-04-19 | 2012-11-15 | Onkyo Corp | ビデオゲーム装置およびビデオゲーム制御方法 |
KR102111464B1 (ko) | 2011-07-28 | 2020-05-18 | 애플 인크. | 향상된 오디오를 갖는 디바이스 |
JP2013048412A (ja) * | 2011-07-28 | 2013-03-07 | Apple Inc | オーディオエンハンス型装置 |
US10771742B1 (en) | 2011-07-28 | 2020-09-08 | Apple Inc. | Devices with enhanced audio |
KR20190040155A (ko) * | 2011-07-28 | 2019-04-17 | 애플 인크. | 향상된 오디오를 갖는 디바이스 |
US10402151B2 (en) | 2011-07-28 | 2019-09-03 | Apple Inc. | Devices with enhanced audio |
US8879761B2 (en) | 2011-11-22 | 2014-11-04 | Apple Inc. | Orientation-based audio |
US10284951B2 (en) | 2011-11-22 | 2019-05-07 | Apple Inc. | Orientation-based audio |
CN106470379A (zh) * | 2015-08-20 | 2017-03-01 | 三星电子株式会社 | 用于基于扬声器位置信息处理音频信号的方法和设备 |
US10524077B2 (en) | 2015-08-20 | 2019-12-31 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal based on speaker location information |
WO2019026140A1 (ja) * | 2017-07-31 | 2019-02-07 | 株式会社ソシオネクスト | 映像音響再生装置、映像音響再生方法、プログラム及び記録媒体 |
CN110892712A (zh) * | 2017-07-31 | 2020-03-17 | 株式会社索思未来 | 影像声音再生装置、影像声音再生方法、程序以及记录介质 |
JPWO2019026140A1 (ja) * | 2017-07-31 | 2020-05-28 | 株式会社ソシオネクスト | 映像音響再生装置、映像音響再生方法、プログラム及び記録媒体 |
WO2019049409A1 (ja) * | 2017-09-11 | 2019-03-14 | シャープ株式会社 | 音声信号処理装置および音声信号処理システム |
JPWO2019049409A1 (ja) * | 2017-09-11 | 2020-10-22 | シャープ株式会社 | 音声信号処理装置および音声信号処理システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8571192B2 (en) | Method and apparatus for improved matching of auditory space to visual space in video teleconferencing applications using window-based displays | |
JP2003032776A (ja) | 再生システム | |
JP6078497B2 (ja) | 音声を定位知覚する技術 | |
JP3687099B2 (ja) | 映像信号及び音響信号の再生装置 | |
US6961439B2 (en) | Method and apparatus for producing spatialized audio signals | |
US8787602B2 (en) | Device for and a method of processing audio data | |
US20100328419A1 (en) | Method and apparatus for improved matching of auditory space to visual space in video viewing applications | |
JP4924119B2 (ja) | アレイスピーカ装置 | |
CN102256192A (zh) | 声音信号的分离 | |
KR20050056241A (ko) | 동적인 바이노럴 음향 캡쳐 및 재생 장치 | |
CN102860041A (zh) | 对收听者进行位置跟踪的扬声器 | |
KR20170106063A (ko) | 오디오 신호 처리 방법 및 장치 | |
US20230247384A1 (en) | Information processing device, output control method, and program | |
JP5754595B2 (ja) | トランスオーラルシステム | |
CN111630877B (zh) | 声音处理装置、声音处理方法和程序 | |
US20200301653A1 (en) | System and method for processing audio between multiple audio spaces | |
JP2022521244A (ja) | ハイブリッドスピーカ及びコンバータ | |
EP3837863B1 (en) | Methods for obtaining and reproducing a binaural recording | |
WO2010005413A1 (en) | Method and system for simultaneous rendering of multiple multi-media presentations | |
US11700497B2 (en) | Systems and methods for providing augmented audio | |
WO2016190460A1 (ko) | 입체 음향 재생 방법 및 장치 | |
JP2018191127A (ja) | 信号生成装置、信号生成方法およびプログラム | |
JPH0946800A (ja) | 音像制御装置 | |
Casey et al. | Vision steered beam-forming and transaural rendering for the artificial life interactive video environment (alive) | |
JP7321736B2 (ja) | 情報処理装置、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081007 |