JP2662825B2 - 会議通話端末装置 - Google Patents
会議通話端末装置Info
- Publication number
- JP2662825B2 JP2662825B2 JP2160492A JP16049290A JP2662825B2 JP 2662825 B2 JP2662825 B2 JP 2662825B2 JP 2160492 A JP2160492 A JP 2160492A JP 16049290 A JP16049290 A JP 16049290A JP 2662825 B2 JP2662825 B2 JP 2662825B2
- Authority
- JP
- Japan
- Prior art keywords
- sound image
- state
- speaker
- sound
- party
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000004807 localization Effects 0.000 claims description 34
- 230000004044 response Effects 0.000 claims description 20
- 230000005236 sound signal Effects 0.000 claims description 18
- 230000007480 spreading Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 9
- 210000005069 ears Anatomy 0.000 claims description 5
- 238000000034 method Methods 0.000 description 24
- 230000005540 biological transmission Effects 0.000 description 18
- 230000007704 transition Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 210000003128 head Anatomy 0.000 description 6
- 210000000883 ear external Anatomy 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 239000011358 absorbing material Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Landscapes
- Stereophonic System (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、会議通話用の音声回線で相互に接続された
複数の通話端末に配置された会議通話端末装置に利用す
る。
複数の通話端末に配置された会議通話端末装置に利用す
る。
本発明は、特に、個々の通話者端末において複数の通
話者から送話元を識別する場合、一人の話者状態から別
の一人の話者状態に遷移する際の音像移動定位の変化に
対する違和感を防止するようにした会議通話端末装置に
関する。
話者から送話元を識別する場合、一人の話者状態から別
の一人の話者状態に遷移する際の音像移動定位の変化に
対する違和感を防止するようにした会議通話端末装置に
関する。
電話会議のように多数の対地と対話を行う場合や、複
数人が二つの会議室にそれぞれ集合して2対地で対向し
て対話を行う場合、一般のハンドセット電話では発声者
が誰であるのか判明せず混乱する欠点がある。
数人が二つの会議室にそれぞれ集合して2対地で対向し
て対話を行う場合、一般のハンドセット電話では発声者
が誰であるのか判明せず混乱する欠点がある。
そこで、ヘッドホンの両耳受聴とすることで、この難
点を解消する方法がある。すなわち、ヘッドホンを使用
して頭外部に音像を定位させる方法が提案されている。
例えば、鹿島出版社刊のブラウエルト、森本、後藤共著
「空間音響」に記載されている。この方式は、頭部回析
によるインパルス応答HLおよびHRと、レシーバ対外耳道
入り口インパルス応答の逆特性RLおよびRRをあらかじめ
畳込んだ全インパルス応答hL(左耳用)およびhR(右耳
用)を畳込み両耳レシーバの入力とする。ただし、左右
の入力の全インパルス応答hは、 h=H*R の畳込み積分で表すことが可能となる。
点を解消する方法がある。すなわち、ヘッドホンを使用
して頭外部に音像を定位させる方法が提案されている。
例えば、鹿島出版社刊のブラウエルト、森本、後藤共著
「空間音響」に記載されている。この方式は、頭部回析
によるインパルス応答HLおよびHRと、レシーバ対外耳道
入り口インパルス応答の逆特性RLおよびRRをあらかじめ
畳込んだ全インパルス応答hL(左耳用)およびhR(右耳
用)を畳込み両耳レシーバの入力とする。ただし、左右
の入力の全インパルス応答hは、 h=H*R の畳込み積分で表すことが可能となる。
第5図は頭外音像定位技術を説明するための説明図で
ある。18は受聴者、17は両耳レシーバ、21、22、23、24
および25は通話者A、B、C、DおよびEのそれぞれの
音像定位である。
ある。18は受聴者、17は両耳レシーバ、21、22、23、24
および25は通話者A、B、C、DおよびEのそれぞれの
音像定位である。
第5図において、いま自分を含め、6対地あるいは6
人の通話者の(A、B、C、D、E、F)と話す音像定
位生成法を以下に述べる。なお音像定位とは発声する場
所の位置を意味している。
人の通話者の(A、B、C、D、E、F)と話す音像定
位生成法を以下に述べる。なお音像定位とは発声する場
所の位置を意味している。
通話者A、B、C、DおよびEのそれぞれの音像定位
21、22、23、24および25を前方に等分割に音像定位を配
置させるようにする。通常、テレビ会議や多対地接続の
音声会議においては平均6対地接続が一般的に多いと言
われている。このため、通話相手は5人もしくは、5対
地の相手接続となる。nの数が多くなればその音像位置
からの話者同定認識率は低下する。ここでは話を容易と
するために左90度、左45度、中央、右45度および右90度
の5箇所とする。
21、22、23、24および25を前方に等分割に音像定位を配
置させるようにする。通常、テレビ会議や多対地接続の
音声会議においては平均6対地接続が一般的に多いと言
われている。このため、通話相手は5人もしくは、5対
地の相手接続となる。nの数が多くなればその音像位置
からの話者同定認識率は低下する。ここでは話を容易と
するために左90度、左45度、中央、右45度および右90度
の5箇所とする。
まず、希望の音像発声位置から受聴者の外耳までのイ
ンパルス応答特性を測定する。第5図では通話者Fが受
聴者18となり、送話者Cの位置に発生する音像定位の場
合を示している。すなわち、前記インパルス応答特性と
はHCLおよびHCRである。その測定法は無響室内でインパ
ルス応答を測定する方法が用いられてきたが、文献(林
「ヘッドホンによる音場感再生とその主観評価」日本音
響学会聴覚研究会H−89−19、1989)によれば、頭外感
を自然に生じるためには、無響室よりも被測定者の後
方、同側方の壁および天井は強い反射をしない吸音材料
の条件を満たす防音室の方がより自然であり、実音場に
近似できるので、優れていると報告されている。拡声器
より広帯域雑音を放射し、被験者の左右外耳道入口にプ
ローブチューブマイクあるいは1/8インチ程度の小型マ
イクをセットし、この3点の信号を同時にアナログディ
ジタル変換する。これからクロススペクトル法をもって
インパルス応答を算出することが可能である。
ンパルス応答特性を測定する。第5図では通話者Fが受
聴者18となり、送話者Cの位置に発生する音像定位の場
合を示している。すなわち、前記インパルス応答特性と
はHCLおよびHCRである。その測定法は無響室内でインパ
ルス応答を測定する方法が用いられてきたが、文献(林
「ヘッドホンによる音場感再生とその主観評価」日本音
響学会聴覚研究会H−89−19、1989)によれば、頭外感
を自然に生じるためには、無響室よりも被測定者の後
方、同側方の壁および天井は強い反射をしない吸音材料
の条件を満たす防音室の方がより自然であり、実音場に
近似できるので、優れていると報告されている。拡声器
より広帯域雑音を放射し、被験者の左右外耳道入口にプ
ローブチューブマイクあるいは1/8インチ程度の小型マ
イクをセットし、この3点の信号を同時にアナログディ
ジタル変換する。これからクロススペクトル法をもって
インパルス応答を算出することが可能である。
一方、ヘッドセットの逆特性RLおよびRRを得るにはヘ
ッドセットの電気音響変換入力に対する外耳道音圧を測
定する。広帯域雑音をヘッドセットの電気入力とし、ヘ
ッドセットを被験者の外耳に装着し、ヘッドセットのレ
シーバの耳当てパッドに穴をあけプローブチューブまた
は1/8インチマイクロホンを挿入し外耳入口の音圧波形
を取り出す。電気入力信号と外実道音圧から変換された
電気信号をアナログディジタル変換し逆フィルタ特性を
得る。この方法は、時間領域の最小二乗誤差による逆フ
ィルタ構成法として周知である。従って、畳込んだ全イ
ンパルス応答hは、 h=R*H で求められる。
ッドセットの電気音響変換入力に対する外耳道音圧を測
定する。広帯域雑音をヘッドセットの電気入力とし、ヘ
ッドセットを被験者の外耳に装着し、ヘッドセットのレ
シーバの耳当てパッドに穴をあけプローブチューブまた
は1/8インチマイクロホンを挿入し外耳入口の音圧波形
を取り出す。電気入力信号と外実道音圧から変換された
電気信号をアナログディジタル変換し逆フィルタ特性を
得る。この方法は、時間領域の最小二乗誤差による逆フ
ィルタ構成法として周知である。従って、畳込んだ全イ
ンパルス応答hは、 h=R*H で求められる。
いま、受信された音声信号をP、レシーバの外耳入力
の音圧信号をQとすれば、 Q=P*h からなる畳込み積分でレシーバの外耳入力Qに対する音
声源Pの変換が可能となる。
の音圧信号をQとすれば、 Q=P*h からなる畳込み積分でレシーバの外耳入力Qに対する音
声源Pの変換が可能となる。
以上のディジタル演算により通話者の受聴するレシー
バからの音声は、あらかじめ計算された実空間にいるの
と同一の音声波形となるので、人間の聴覚真理的反応と
して、あたかも通話者はあたかも目の前1.5m程度を隔て
て相手と通話する間隔を得ることができ、この実空間に
いる自然な通話環境と感じられる。頭外間隔はその自然
な感覚の一部である。このため、ヘッドセット通話につ
きものの圧迫感や聴覚的および心理的疲労感を覚えるこ
となく快適に長時間の通話を楽しむことができる。
バからの音声は、あらかじめ計算された実空間にいるの
と同一の音声波形となるので、人間の聴覚真理的反応と
して、あたかも通話者はあたかも目の前1.5m程度を隔て
て相手と通話する間隔を得ることができ、この実空間に
いる自然な通話環境と感じられる。頭外間隔はその自然
な感覚の一部である。このため、ヘッドセット通話につ
きものの圧迫感や聴覚的および心理的疲労感を覚えるこ
となく快適に長時間の通話を楽しむことができる。
一方、送話音声信号とともに送話元を示す制御情報手
段に、CCITT(国際電信電話諮間委員会)勧告G.722、お
よび論文(島田、鈴木:「多対地音声会議通信システム
の対地識別音像生成方式」電子情報通信学会誌、vol.J7
0−B,No.9,1987年)に記載してある送話元制御情報符号
化法があり、この論文では複数の拡声器を用いて室内空
間での音像定位論が示されている。
段に、CCITT(国際電信電話諮間委員会)勧告G.722、お
よび論文(島田、鈴木:「多対地音声会議通信システム
の対地識別音像生成方式」電子情報通信学会誌、vol.J7
0−B,No.9,1987年)に記載してある送話元制御情報符号
化法があり、この論文では複数の拡声器を用いて室内空
間での音像定位論が示されている。
音声回線で各送話者の音声信号を加算して伝送し、複
数の送話者が同時にあるような会議通話システムの場合
には、複数人の音声信号の有無を送話元制御情報信号に
よって判断できたとしても、一度音声加算された信号は
各送話者ごとの音声信号に分離できない。たとえ分離で
きたとしても、その音声信号の特徴パラメータと送話者
音声信号との対応を認識(話者認識)して、そのあらか
じめ指定された送話者位置に音像を生成する技術は現在
の実用化レベルに達していない。
数の送話者が同時にあるような会議通話システムの場合
には、複数人の音声信号の有無を送話元制御情報信号に
よって判断できたとしても、一度音声加算された信号は
各送話者ごとの音声信号に分離できない。たとえ分離で
きたとしても、その音声信号の特徴パラメータと送話者
音声信号との対応を認識(話者認識)して、そのあらか
じめ指定された送話者位置に音像を生成する技術は現在
の実用化レベルに達していない。
さらにヘッドホンを用いて頭外部に音像を定位させる
方式では、複数同時音声の状態になると複数の音像定位
の中心に移動することになるので受聴者に対して違和感
を覚える。さらに前記島田らの論文では複数の発声音
源、すなわちあらかじめ送話元制御受聴信号によって分
けられた複数の拡声器(スピーカ)の制御法の議論がな
されているだけであり、ヘッドセットのように単に左右
の両耳のレシーバ駆動源信号からの提案はなされていな
い。そこで前述の点に注目し、本願発明者のうちの一人
により、複数の同時送話者が発生した場合、複数の音像
定位の間に音像の拡がり感を付与させることを特徴とす
る方式が既に提案されている(島田「会議通話端末装
置」特願平2−112341号、平成2年4月27日出願)。
方式では、複数同時音声の状態になると複数の音像定位
の中心に移動することになるので受聴者に対して違和感
を覚える。さらに前記島田らの論文では複数の発声音
源、すなわちあらかじめ送話元制御受聴信号によって分
けられた複数の拡声器(スピーカ)の制御法の議論がな
されているだけであり、ヘッドセットのように単に左右
の両耳のレシーバ駆動源信号からの提案はなされていな
い。そこで前述の点に注目し、本願発明者のうちの一人
により、複数の同時送話者が発生した場合、複数の音像
定位の間に音像の拡がり感を付与させることを特徴とす
る方式が既に提案されている(島田「会議通話端末装
置」特願平2−112341号、平成2年4月27日出願)。
しかし、一人の話者状態から別の一人の話者状態に急
激に遷移する場合、インパルス応答特性hと音声信号と
の畳込み積分を行っているので、このような状態遷移が
発生した場合、切り替える瞬間に受聴者に雑音が混入し
たり、音像定位の移動受聴感覚に不自然性が発生し、通
話品質を劣化させる恐れがある欠点がある。
激に遷移する場合、インパルス応答特性hと音声信号と
の畳込み積分を行っているので、このような状態遷移が
発生した場合、切り替える瞬間に受聴者に雑音が混入し
たり、音像定位の移動受聴感覚に不自然性が発生し、通
話品質を劣化させる恐れがある欠点がある。
本発明の目的は、この欠点を除去することにより、一
人の話者状態から別の話者状態に遷移した場合にも、通
話品質を良好に維持できるヘットセット会議通話装置を
提供することにある。
人の話者状態から別の話者状態に遷移した場合にも、通
話品質を良好に維持できるヘットセット会議通話装置を
提供することにある。
本発明の会議通話端末装置は、会議通話用の音声回線
から受信した音声信号を受聴者の両耳の位置で音声とし
て出力する二つの電気音響変換手段と、この二つの電気
音響変換手段により生成される音像を前記音声回線から
音声信号とともに受信した制御信号に従って定位する音
像定位手段とを備え、前記音像定位手段は、入力された
音声信号と、音像を受聴者の頭外に定位するために必要
な左右両耳インパルス応答との畳み込み演算を行う演算
手段を含む会議通話端末装置において、前記音声回線か
ら受信され前記音像定位手段を経由して前記二つの電気
音響変換手段に出力される音声信号に音像拡がり感を付
与する手段を備え、前記音像定位手段は、前記制御信号
により送話中の相手通話者の番号を検出するとともに、
第一の相手通話者による一人の話者状態から他の第二の
相手通話者による話者状態に遷移した場合に、前記第一
の相手通話者を示す制御信号が終了してから一定時間以
内に前記第二の相手通話者が話者状態となったときには
二人の話者状態と判断する手段と、一人の話者状態のと
きにはその相手通話者の番号により定められるひとつの
方向の頭外に音像が定位するように前記演算手段の用い
るインパルス応答を選択し、二人の話者状態のときには
それぞれ相手通話者番号により定められる二つの方向に
同時に音像が定位するように前記演算手段の用いるイン
パルス応答を選択する手段と、一人の話者状態のときに
は、前記音声回線から受信した音声信号を前記演算手段
に入力して得られる左右それぞれひとつの演算出力を、
前記音像拡がり感を付与する手段を経由することなく前
記二つの電気音響変換手段に出力し、二人の話者状態の
ときには、音声信号を前記演算手段に入力して前記二つ
の方向について得られる左右それぞれ二つの演算出力を
左右別々に加算するとともに、前記音像拡がり感を付与
する手段により音像拡がり感を付与して、前記二つの電
気音響変換手段に出力する手段とを含むことを特徴とす
る。
から受信した音声信号を受聴者の両耳の位置で音声とし
て出力する二つの電気音響変換手段と、この二つの電気
音響変換手段により生成される音像を前記音声回線から
音声信号とともに受信した制御信号に従って定位する音
像定位手段とを備え、前記音像定位手段は、入力された
音声信号と、音像を受聴者の頭外に定位するために必要
な左右両耳インパルス応答との畳み込み演算を行う演算
手段を含む会議通話端末装置において、前記音声回線か
ら受信され前記音像定位手段を経由して前記二つの電気
音響変換手段に出力される音声信号に音像拡がり感を付
与する手段を備え、前記音像定位手段は、前記制御信号
により送話中の相手通話者の番号を検出するとともに、
第一の相手通話者による一人の話者状態から他の第二の
相手通話者による話者状態に遷移した場合に、前記第一
の相手通話者を示す制御信号が終了してから一定時間以
内に前記第二の相手通話者が話者状態となったときには
二人の話者状態と判断する手段と、一人の話者状態のと
きにはその相手通話者の番号により定められるひとつの
方向の頭外に音像が定位するように前記演算手段の用い
るインパルス応答を選択し、二人の話者状態のときには
それぞれ相手通話者番号により定められる二つの方向に
同時に音像が定位するように前記演算手段の用いるイン
パルス応答を選択する手段と、一人の話者状態のときに
は、前記音声回線から受信した音声信号を前記演算手段
に入力して得られる左右それぞれひとつの演算出力を、
前記音像拡がり感を付与する手段を経由することなく前
記二つの電気音響変換手段に出力し、二人の話者状態の
ときには、音声信号を前記演算手段に入力して前記二つ
の方向について得られる左右それぞれ二つの演算出力を
左右別々に加算するとともに、前記音像拡がり感を付与
する手段により音像拡がり感を付与して、前記二つの電
気音響変換手段に出力する手段とを含むことを特徴とす
る。
ここで、音像拡がり感とは、人間の聴覚特性を生かし
たもので左右両耳に受聴される信号が互いに無相関の信
号であるならば、音源の位置をはっきり知覚することは
できず、むしろぼんやりとした拡がった音に聞こえると
いうものである。例えば、複数人が同時に話者となって
いる状態では、部屋の残響感により音源の位置は不鮮明
であり、特に笑い声などは同時に発生しやすい。その場
合、誰が笑っているのかは音声認識でわかるが、通信回
線を利用した音像定位においては、二人の音声が同時に
加算されて受聴されることになり、二人の音像を同時に
定位してしまうと二人の中間地点に音像が定位してしま
う。これは例えば拡声系ステレオ受聴のときでも同じで
ある。すなわち、同レベルの信号が左右両スピーカから
再生されると、その音像は二つの左右スピーカの中間地
点に生成される。このため、話者が遷移する状態におい
ては、音像を中間地点に定位させるのではなく、むしろ
拡がり感を付与されたほうがよい結果が得られる。拡が
り感処理方法については、例えば、シュロイダの論文、 “An Artificial Stereophonic Effect obtained from
a Single Audio Signal",J.A.E.S.,Vol.6,No.2,p.74,19
58 に示されている。
たもので左右両耳に受聴される信号が互いに無相関の信
号であるならば、音源の位置をはっきり知覚することは
できず、むしろぼんやりとした拡がった音に聞こえると
いうものである。例えば、複数人が同時に話者となって
いる状態では、部屋の残響感により音源の位置は不鮮明
であり、特に笑い声などは同時に発生しやすい。その場
合、誰が笑っているのかは音声認識でわかるが、通信回
線を利用した音像定位においては、二人の音声が同時に
加算されて受聴されることになり、二人の音像を同時に
定位してしまうと二人の中間地点に音像が定位してしま
う。これは例えば拡声系ステレオ受聴のときでも同じで
ある。すなわち、同レベルの信号が左右両スピーカから
再生されると、その音像は二つの左右スピーカの中間地
点に生成される。このため、話者が遷移する状態におい
ては、音像を中間地点に定位させるのではなく、むしろ
拡がり感を付与されたほうがよい結果が得られる。拡が
り感処理方法については、例えば、シュロイダの論文、 “An Artificial Stereophonic Effect obtained from
a Single Audio Signal",J.A.E.S.,Vol.6,No.2,p.74,19
58 に示されている。
拡がり付与手段は、一人の話者状態から別の一人の話
者状態に遷移した場合、受信された第一の送話元を示す
制御信号が終了してから一定時間以内は二人の話者が同
時に存在する複数話者状態とし、二人の音像定位の間に
音像の拡がり感を付与させる。
者状態に遷移した場合、受信された第一の送話元を示す
制御信号が終了してから一定時間以内は二人の話者が同
時に存在する複数話者状態とし、二人の音像定位の間に
音像の拡がり感を付与させる。
従って、一人の話者状態から別の一人の話者状態に急
激に遷移した場合にも、音像定位は送話者がより自然的
な一般の集合して会議するような雰囲気を生成すること
が可能となる。
激に遷移した場合にも、音像定位は送話者がより自然的
な一般の集合して会議するような雰囲気を生成すること
が可能となる。
以下、本発明の実施例について図面を参照して説明す
る。
る。
第1図は本発明の一実施例を示すブロック構成図であ
る。
る。
第1図によると、本実施例は、会議通話用の音声回線
から受信した音声信号に対する音像を人の両耳に対応す
る二つの電気音響変換手段としての両耳レシーバ17によ
り生成する音像生成手段としての、ディジタルアナログ
変換器(D/A)14、2個の低域フィルタ(LPF)15、およ
び2個の増幅器(AMP)16と、この音像生成手段により
生成される音像を前記音声回線から音声信号とともに受
信した送話元制御信号32に従って定位する音像定位手段
としての、信号分離回路1、切替制御回路2、リニア符
号化回路3、切替回路(1)4aおよび4b、記憶回路5、
切替回路(2)6a、ならびに加算器7および8とを備え
た会議通話端末装置において、 本発明の特徴とするところの、 前記音像定位手段は、一人の話者状態から他の一人の
話者状態に遷移した場合に、受信された第一の送話元を
示す制御信号が終了してから一定時間以内は二人の話者
が同時に存在する複数話者状態とし、二人の音像定位の
間に音像の拡がり感を付与する拡がり付与手段として
の、加算器9、遅延回路(DEL)11、高域フィルタ(HP
F)12、切替回路6b、加算器10および減算器13を含んで
いる。
から受信した音声信号に対する音像を人の両耳に対応す
る二つの電気音響変換手段としての両耳レシーバ17によ
り生成する音像生成手段としての、ディジタルアナログ
変換器(D/A)14、2個の低域フィルタ(LPF)15、およ
び2個の増幅器(AMP)16と、この音像生成手段により
生成される音像を前記音声回線から音声信号とともに受
信した送話元制御信号32に従って定位する音像定位手段
としての、信号分離回路1、切替制御回路2、リニア符
号化回路3、切替回路(1)4aおよび4b、記憶回路5、
切替回路(2)6a、ならびに加算器7および8とを備え
た会議通話端末装置において、 本発明の特徴とするところの、 前記音像定位手段は、一人の話者状態から他の一人の
話者状態に遷移した場合に、受信された第一の送話元を
示す制御信号が終了してから一定時間以内は二人の話者
が同時に存在する複数話者状態とし、二人の音像定位の
間に音像の拡がり感を付与する拡がり付与手段として
の、加算器9、遅延回路(DEL)11、高域フィルタ(HP
F)12、切替回路6b、加算器10および減算器13を含んで
いる。
第2図は送話元制御信号のフレームフォーマットの説
明図で、CCITT勧告H.221の64Kbps内の分割使用を示す。
また表は音像定位制御信号の符号フォーマット例であ
る。
明図で、CCITT勧告H.221の64Kbps内の分割使用を示す。
また表は音像定位制御信号の符号フォーマット例であ
る。
ISDN(ディジタルサービス統合網)の基本サービスに
は、64kbpsサービスの情報回線が2回線(B)と16kbps
サービスの情報制御回線(D)が1回線の2B+Dのチャ
ネルがある。この加入者相互間にサービスされたディジ
タル1リンク回線64kbpsを利用して、速度分割し、各送
話者に対し制御情報信号と音声信号とを同時に受聴者に
伝達する方式がある。すなわち、CCITTで勧告されてい
るH.221(G.722)のフレームフォーマットを使用して行
う方式である。この方式は64kbpsディジタル1リンク回
線を使用して、音声だけでなくディジタル画像信号やデ
ータ信号を同時に伝送することが可能な通信系に適用す
るものである。64kbpsチャネルは8kHzで伝送されるオク
テット構成(8ビットが一つの構成単位)とし、各々の
オクテットの8ビット目をサービスチャネルと呼び、さ
らにサービスチャネルは第2図に示すように3部分に分
かれる。フレーム・アライメント・シグナル(FAS)は
8ビットからなる基本フレームパターンをサービスチャ
ネルのフレームごとに交互に発生するマルチフレームで
構成されている。ビット・アロケション・シグナル(BA
S)は各種通信モードを規定している。また、アプリケ
ーションチャネル(AC)は1フレーム64ビットであり、
6.4kbps以下の伝送速度を有するデータサービス通信に
適用可能である。
は、64kbpsサービスの情報回線が2回線(B)と16kbps
サービスの情報制御回線(D)が1回線の2B+Dのチャ
ネルがある。この加入者相互間にサービスされたディジ
タル1リンク回線64kbpsを利用して、速度分割し、各送
話者に対し制御情報信号と音声信号とを同時に受聴者に
伝達する方式がある。すなわち、CCITTで勧告されてい
るH.221(G.722)のフレームフォーマットを使用して行
う方式である。この方式は64kbpsディジタル1リンク回
線を使用して、音声だけでなくディジタル画像信号やデ
ータ信号を同時に伝送することが可能な通信系に適用す
るものである。64kbpsチャネルは8kHzで伝送されるオク
テット構成(8ビットが一つの構成単位)とし、各々の
オクテットの8ビット目をサービスチャネルと呼び、さ
らにサービスチャネルは第2図に示すように3部分に分
かれる。フレーム・アライメント・シグナル(FAS)は
8ビットからなる基本フレームパターンをサービスチャ
ネルのフレームごとに交互に発生するマルチフレームで
構成されている。ビット・アロケション・シグナル(BA
S)は各種通信モードを規定している。また、アプリケ
ーションチャネル(AC)は1フレーム64ビットであり、
6.4kbps以下の伝送速度を有するデータサービス通信に
適用可能である。
この方式の実施例として前記の島田らの論文では、送
話元制御情報信号として表に示すような符号フォーマッ
ト例を用いている。すなわち、送話元の信号は送話者
A、B、C、D、E、Fに対応する送話元制御情報信号
をそれぞれ「100000」、「010000」、「001000」、「00
0100」、「000010」としている。前記論文では、この送
話元制御情報信号が互いに直交するような符号化系列で
あり複数の送話者があった場合でも論理処理が簡単化で
きるので、望ましい符号であることを述べている。
話元制御情報信号として表に示すような符号フォーマッ
ト例を用いている。すなわち、送話元の信号は送話者
A、B、C、D、E、Fに対応する送話元制御情報信号
をそれぞれ「100000」、「010000」、「001000」、「00
0100」、「000010」としている。前記論文では、この送
話元制御情報信号が互いに直交するような符号化系列で
あり複数の送話者があった場合でも論理処理が簡単化で
きるので、望ましい符号であることを述べている。
いま、遠隔会議通信システムで送話者となった音声信
号と各送話元制御情報信号とを同時に送信する。複数対
地を接続するノード装置では制御情報信号を論理処理し
て、受聴者側に音声信号と送話元制御情報信号を伝達す
る。受信側では送話元制御情報信号に対応して、あらか
じめ方向別に分割された音像位置にその音声を発生し、
あたかも、一つのテーブルに会議参加者が席についたご
とく音像を生成する。複数の送話者があった場合の送話
元制御受聴には少なくとも論理「1」の符号を複数個含
む。
号と各送話元制御情報信号とを同時に送信する。複数対
地を接続するノード装置では制御情報信号を論理処理し
て、受聴者側に音声信号と送話元制御情報信号を伝達す
る。受信側では送話元制御情報信号に対応して、あらか
じめ方向別に分割された音像位置にその音声を発生し、
あたかも、一つのテーブルに会議参加者が席についたご
とく音像を生成する。複数の送話者があった場合の送話
元制御受聴には少なくとも論理「1」の符号を複数個含
む。
次に、本実施例の具体的な動作説明を行う前に、第3
図に示す会議通話遷移図を用いて、本実施例の、基本的
な動作について説明する。
図に示す会議通話遷移図を用いて、本実施例の、基本的
な動作について説明する。
一般に会議通話状態は第3図に示すように、単独話
者状態(話者が一人でいる場合、通常はこの応対が全会
議通話状態の80〜90%を占有している)、複数話者状
態(複数人のあいづちや笑い声も含む)、および全無
音状態(通話者全員が喋っていない状態)の三つの状態
があり、これに矢印の状態遷移が加わる。これが会議の
通話状態である。
者状態(話者が一人でいる場合、通常はこの応対が全会
議通話状態の80〜90%を占有している)、複数話者状
態(複数人のあいづちや笑い声も含む)、および全無
音状態(通話者全員が喋っていない状態)の三つの状態
があり、これに矢印の状態遷移が加わる。これが会議の
通話状態である。
複数話者状態の場合ではいろいろな音像定位法が考え
られ、例えば音像の拡がり感付与などが挙げられる。こ
の方法については既に前述した。さらに全無音状態では
ヘッドホンのレシーバに入力される音圧を0とするので
はなく、各送話者から加算されたそのままの室内雑音や
回線雑音を付加して処理すればよい。従って、問題とな
るのは単独話者すなわち一人の話者が別の一人の話者へ
急激に状態遷移する場合である。
られ、例えば音像の拡がり感付与などが挙げられる。こ
の方法については既に前述した。さらに全無音状態では
ヘッドホンのレシーバに入力される音圧を0とするので
はなく、各送話者から加算されたそのままの室内雑音や
回線雑音を付加して処理すればよい。従って、問題とな
るのは単独話者すなわち一人の話者が別の一人の話者へ
急激に状態遷移する場合である。
本発明の基本的な考え方は、今送話元制御信号が第一
の話者から第二の話者に遷移するときに、第一の話者が
終了する時点を一定時間延長し、第二の話者の開始時点
と重複した場合に音像の拡がり感付与を行うものである
(第3図の点線の遷移)。この一定時間の値の設定は例
えば前記の畳込み演算に要する時間や受聴の不自然性等
から求められる。
の話者から第二の話者に遷移するときに、第一の話者が
終了する時点を一定時間延長し、第二の話者の開始時点
と重複した場合に音像の拡がり感付与を行うものである
(第3図の点線の遷移)。この一定時間の値の設定は例
えば前記の畳込み演算に要する時間や受聴の不自然性等
から求められる。
本実施例は、前記の基本的な考え方に基づいて構成さ
れたものであり、一つの通話者端末から音声信号が送信
されているときには、受信した制御信号に従って相手の
通話者ごとに発声位置が異なる音像を生成する。この方
式は異なる対地を接続し、複数の通話者と接続すること
により遠隔会議通信を可能とするもので、通話者ごとに
異なる位置に音像を生成することで通話者認識を容易に
させ、送話者が急激に変わる場合でもあたかも一つのテ
ーブルに会議参加者が席についたごとくの自然性ある会
議を構成する。
れたものであり、一つの通話者端末から音声信号が送信
されているときには、受信した制御信号に従って相手の
通話者ごとに発声位置が異なる音像を生成する。この方
式は異なる対地を接続し、複数の通話者と接続すること
により遠隔会議通信を可能とするもので、通話者ごとに
異なる位置に音像を生成することで通話者認識を容易に
させ、送話者が急激に変わる場合でもあたかも一つのテ
ーブルに会議参加者が席についたごとくの自然性ある会
議を構成する。
次に、本実施例の具体的な動作について第4図に示す
タイミングチャートを参照して説明する。ここで第4図
は切替回路(1)および(2)の動作を示す。
タイミングチャートを参照して説明する。ここで第4図
は切替回路(1)および(2)の動作を示す。
第1図において、音声信号+送話元制御情報31が前記
のCCITT勧告G.722またはH.221に準拠したフレームフォ
ーマット(第2図参照)で同時に伝送されてくる。すな
わち、ディジタル伝送路64kbpsの中で情報ビット高速56
kbpsと制御情報速度8kbpsが分離して通信されてくる。
この8kbpsを用いて前記の制御信号を送信する。信号分
離回路1はこれら二つの信号を分離し、音声信号はディ
ジタル信号処理演算が可能なようにリニア符号化回路3
でディジタルリニア符号となる。一方、送話元制御信号
32は切替制御回路2で今受信した音声が単独話者なのか
複数の話者なのかを送話元制御信号32から判断する。次
に、切替回路(1)4aおよび4bで切替制御回路2からの
指令内容によって音声信号に対応する話者の音像定位生
成のためのインパルス応答hを選択する。このインパル
ス応答特性情報(h)は頭外に音像定位を生成するため
に用意されるものであり、あらかじめ測定した各音像定
位(第5図の通話者A、B、C、DおよびEの音像)の
インパルス応答特性情報(h)を格納した記憶回路5を
切替回路(1)4aおよび4bで選択する。第1図では送話
者Aから送話者Bへ遷移する場合の切替回路(1)14a
および4bの様子を示している。
のCCITT勧告G.722またはH.221に準拠したフレームフォ
ーマット(第2図参照)で同時に伝送されてくる。すな
わち、ディジタル伝送路64kbpsの中で情報ビット高速56
kbpsと制御情報速度8kbpsが分離して通信されてくる。
この8kbpsを用いて前記の制御信号を送信する。信号分
離回路1はこれら二つの信号を分離し、音声信号はディ
ジタル信号処理演算が可能なようにリニア符号化回路3
でディジタルリニア符号となる。一方、送話元制御信号
32は切替制御回路2で今受信した音声が単独話者なのか
複数の話者なのかを送話元制御信号32から判断する。次
に、切替回路(1)4aおよび4bで切替制御回路2からの
指令内容によって音声信号に対応する話者の音像定位生
成のためのインパルス応答hを選択する。このインパル
ス応答特性情報(h)は頭外に音像定位を生成するため
に用意されるものであり、あらかじめ測定した各音像定
位(第5図の通話者A、B、C、DおよびEの音像)の
インパルス応答特性情報(h)を格納した記憶回路5を
切替回路(1)4aおよび4bで選択する。第1図では送話
者Aから送話者Bへ遷移する場合の切替回路(1)14a
および4bの様子を示している。
単独話者(話者が一人)の場合、切替回路(2)6aお
よび6bは「オフ」となって、加算回路7、8および10や
減算回路13を介して、ディジタルアナログ変換器14でア
ナログ信号に変換され、量子化雑音を除去するための低
域フィルタ15に接続される。これをヘッドホンセットの
両耳レシーバ17に最適な音量とするための増幅器16を介
して、受聴者18のヘッドホンセットの両耳レシーバ17に
頭外音像定位した処理情報を伝達する。
よび6bは「オフ」となって、加算回路7、8および10や
減算回路13を介して、ディジタルアナログ変換器14でア
ナログ信号に変換され、量子化雑音を除去するための低
域フィルタ15に接続される。これをヘッドホンセットの
両耳レシーバ17に最適な音量とするための増幅器16を介
して、受聴者18のヘッドホンセットの両耳レシーバ17に
頭外音像定位した処理情報を伝達する。
次に、送話者Aの単独話者状態から送話者Bの単独話
者状態へ急激に遷移した場合の例について説明する。
者状態へ急激に遷移した場合の例について説明する。
第4図において、各送話者A、B、C、D、Eおよび
Fに対応する送話元制御信号32は、それぞれ「10000
0」、「010000」、「001000」、「000100」、および「0
00010」であるので、送話元制御信号32は最初は「10000
0」であり、その後、「010000」と遷移することにな
る。前述のように、このときの切替回路(1)4aおよび
4bのスイッチの位置はA端子と接続されているので、イ
ンパルス応答はhARおよびhALが選択され、入力音声信号
との畳込み積分が行われている。ところが第4図に示す
ように、1フレーム分だけの遅延後に別の一人の話者、
ここでは送話者Bが話始めたとすると、演算遅延や音像
定位の移動に違和感が生じる。
Fに対応する送話元制御信号32は、それぞれ「10000
0」、「010000」、「001000」、「000100」、および「0
00010」であるので、送話元制御信号32は最初は「10000
0」であり、その後、「010000」と遷移することにな
る。前述のように、このときの切替回路(1)4aおよび
4bのスイッチの位置はA端子と接続されているので、イ
ンパルス応答はhARおよびhALが選択され、入力音声信号
との畳込み積分が行われている。ところが第4図に示す
ように、1フレーム分だけの遅延後に別の一人の話者、
ここでは送話者Bが話始めたとすると、演算遅延や音像
定位の移動に違和感が生じる。
これを防止するために、送話者Aが終了した時点から
一定時間終了するまで、その送話者Aが話者状態を継続
しているとし、この一定時間内に送話者Bが話始めたと
すれば、この送話者Aと送話者Bが同時に話者となる複
数話者状態と理解し、音像の拡がり感付与の演算を行
う。すなわち、切替回路(1)4aおよび4bは一定時間の
中間でB端子を「オン」にすると同時に切替回路(2)
6aおよび6bを「オン」とする。そして、切替回路(2)
6aおよび6bは一定時間終了と同時に「オフ」とする。
一定時間終了するまで、その送話者Aが話者状態を継続
しているとし、この一定時間内に送話者Bが話始めたと
すれば、この送話者Aと送話者Bが同時に話者となる複
数話者状態と理解し、音像の拡がり感付与の演算を行
う。すなわち、切替回路(1)4aおよび4bは一定時間の
中間でB端子を「オン」にすると同時に切替回路(2)
6aおよび6bを「オン」とする。そして、切替回路(2)
6aおよび6bは一定時間終了と同時に「オフ」とする。
このように送話元制御信号32から抽出した各送話元の
情報から、一定時間まではその話者が保留している状態
を生成することにより、音像定位の不自然の移動や演算
の途中中止による雑音発生を防止するこができる。
情報から、一定時間まではその話者が保留している状態
を生成することにより、音像定位の不自然の移動や演算
の途中中止による雑音発生を防止するこができる。
以上説明したように、本発明は、会議通話状態である
単独話者が急激に別の単独話者の状態に遷移した場合で
も、前の単独話者の状態を一定時間保留していることか
ら、音像定位は送話者がより自然的な一般の集合して会
議するような雰囲気を生成することができ、通話品質を
良好に維持することができる効果がある。
単独話者が急激に別の単独話者の状態に遷移した場合で
も、前の単独話者の状態を一定時間保留していることか
ら、音像定位は送話者がより自然的な一般の集合して会
議するような雰囲気を生成することができ、通話品質を
良好に維持することができる効果がある。
第1図は本発明の一実施例を示すブロック構成図。 第2図はその送話元制御信号のフレームフォーマットを
示す説明図。 第3図はその会議通話遷移図。 第4図はその動作を示すタイミングチャート。 第5図は頭外音像定位の方法を示す説明図。 1……信号分離回路、2……切替制御回路、3……リニ
ア符号化回路、4a、4b……切替回路(1)、5……記憶
回路、6a、6b……切替回路(2)、7〜10……加算回
路、11……遅延回路(DEL)、12……高域フィルタ(HP
F)、13……減算回路、14……ディジタルアナログ変換
器(D/A)、15……低域フィルタ(LPF)、16……増幅器
(AMP)、17……両耳レシーバ、18……受聴者、21〜25
……音像位置、31……音声+送話元制御信号、32……送
話元制御信号。
示す説明図。 第3図はその会議通話遷移図。 第4図はその動作を示すタイミングチャート。 第5図は頭外音像定位の方法を示す説明図。 1……信号分離回路、2……切替制御回路、3……リニ
ア符号化回路、4a、4b……切替回路(1)、5……記憶
回路、6a、6b……切替回路(2)、7〜10……加算回
路、11……遅延回路(DEL)、12……高域フィルタ(HP
F)、13……減算回路、14……ディジタルアナログ変換
器(D/A)、15……低域フィルタ(LPF)、16……増幅器
(AMP)、17……両耳レシーバ、18……受聴者、21〜25
……音像位置、31……音声+送話元制御信号、32……送
話元制御信号。
Claims (1)
- 【請求項1】会議通話用の音声回線から受信した音声信
号を受聴者の両耳の位置で音声として出力する二つの電
気音響変換手段と、 この二つの電気音響変換手段により生成される音像を前
記音声回線から音声信号とともに受信した制御信号に従
って定位する音像定位手段と を備え、 前記音像定位手段は、入力された音声信号と、音像を受
聴者の頭外に定位するために必要な左右両耳インパルス
応答との畳み込み演算を行う演算手段を含む 会議通話端末装置において、 前記音声回線から受信され前記音像定位手段を経由して
前記二つの電気音響変換手段に出力される音声信号に音
像拡がり感を付与する手段を備え、 前記音像定位手段は、 前記制御信号により送話中の相手通話者の番号を検出す
るとともに、第一の相手通話者による一人の話者状態か
ら他の第二の相手通話者による話者状態に遷移した場合
に、前記第一の相手通話者を示す制御信号が終了してか
ら一定時間以内に前記第二の相手通話者が話者状態とな
ったときには二人の話者状態と判断する手段と、 一人の話者状態のときにはその相手通話者の番号により
定められるひとつの方向の頭外に音像が定位するように
前記演算手段の用いるインパルス応答を選択し、二人の
話者状態のときにはそれぞれ相手通話者番号により定め
られる二つの方向に同時に音像が定位するように前記演
算手段の用いるインパルス応答を選択する手段と、 一人の話者状態のときには、前記音声回線から受信した
音声信号を前記演算手段に入力して得られる左右それぞ
れひとつの演算出力を、前記音像拡がり感を付与する手
段を経由することなく前記二つの電気音響変換手段に出
力し、二人の話者状態のときには、音声信号を前記演算
手段に入力して前記二つの方向について得られる左右そ
れぞれ二つの演算出力を左右別々に加算するとともに、
前記音像拡がり感を付与する手段により音像拡がり感を
付与して、前記二つの電気音響変換手段に出力する手段
と を含む ことを特徴とする会議通話端末装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2160492A JP2662825B2 (ja) | 1990-06-18 | 1990-06-18 | 会議通話端末装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2160492A JP2662825B2 (ja) | 1990-06-18 | 1990-06-18 | 会議通話端末装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0449757A JPH0449757A (ja) | 1992-02-19 |
JP2662825B2 true JP2662825B2 (ja) | 1997-10-15 |
Family
ID=15716112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2160492A Expired - Lifetime JP2662825B2 (ja) | 1990-06-18 | 1990-06-18 | 会議通話端末装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2662825B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10147425B2 (en) | 2016-05-24 | 2018-12-04 | Samsung Electronics Co., Ltd. | Electronic devices having speech recognition functionality and operating methods of electronic devices |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4509450B2 (ja) * | 1999-12-24 | 2010-07-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 一体化されたマイクロホンを有するヘッドホン |
US7876903B2 (en) * | 2006-07-07 | 2011-01-25 | Harris Corporation | Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5758843Y2 (ja) * | 1976-12-08 | 1982-12-16 |
-
1990
- 1990-06-18 JP JP2160492A patent/JP2662825B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
電子情報通信学会論文誌、J70−B〔9〕(1987)島田正治、鈴木純司、多対地音声会議通信システムの対地識別音像生成方式、p.1017−1023 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10147425B2 (en) | 2016-05-24 | 2018-12-04 | Samsung Electronics Co., Ltd. | Electronic devices having speech recognition functionality and operating methods of electronic devices |
Also Published As
Publication number | Publication date |
---|---|
JPH0449757A (ja) | 1992-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4166435B2 (ja) | 通信会議システム | |
US8503655B2 (en) | Methods and arrangements for group sound telecommunication | |
US5020098A (en) | Telephone conferencing arrangement | |
US20100248704A1 (en) | Process and device for the acquisition, transmission, and reproduction of sound events for communication applications | |
US20090010441A1 (en) | Forwarding an audio signal in an immersive audio conference system | |
CN110891216A (zh) | 一种耳机装置 | |
EP1657961A1 (en) | A spatial audio processing method, a program product, an electronic device and a system | |
JPH0974446A (ja) | 音声通信制御装置 | |
JPH08125738A (ja) | Isdnによる話者特定機能付音声会議システム | |
JP2662825B2 (ja) | 会議通話端末装置 | |
JP2006074572A (ja) | 情報端末 | |
CN110856068B (zh) | 一种耳机装置的通话方法 | |
JPH07303148A (ja) | 通信会議装置 | |
JP2662824B2 (ja) | 会議通話端末装置 | |
US20050069140A1 (en) | Method and device for reproducing a binaural output signal generated from a monaural input signal | |
JP2768055B2 (ja) | 会議電話サービスの通話方式 | |
JP2019066601A (ja) | 音響処理装置、プログラム及び方法 | |
EP1657892A1 (en) | Three dimensional audio announcement of caller identification | |
JP2502539B2 (ja) | 拡声通話装置 | |
JPH02238800A (ja) | 頭外定位ヘッドセット通話システム | |
WO1998042161A2 (en) | Telephonic transmission of three-dimensional sound | |
JPH0736583B2 (ja) | 会議通話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090620 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090620 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100620 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term |