JPH04150652A - Conference talking equipment - Google Patents
Conference talking equipmentInfo
- Publication number
- JPH04150652A JPH04150652A JP2275939A JP27593990A JPH04150652A JP H04150652 A JPH04150652 A JP H04150652A JP 2275939 A JP2275939 A JP 2275939A JP 27593990 A JP27593990 A JP 27593990A JP H04150652 A JPH04150652 A JP H04150652A
- Authority
- JP
- Japan
- Prior art keywords
- sound image
- control information
- image localization
- stereo
- localization control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004807 localization Effects 0.000 claims description 86
- 230000006854 communication Effects 0.000 abstract description 38
- 238000004891 communication Methods 0.000 abstract description 38
- 230000005540 biological transmission Effects 0.000 abstract description 32
- 238000000034 method Methods 0.000 abstract description 25
- 230000003068 static effect Effects 0.000 abstract 5
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Landscapes
- Stereophonic System (AREA)
- Interface Circuits In Exchanges (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は多地点間の通信に利用する。特に、複数の通話
端末間を相互に接続する会議通話装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention is used for communication between multiple points. In particular, the present invention relates to a conference call device that interconnects a plurality of call terminals.
本発明は、複数の対地を接続する会議通話装置において
、ステレオ信号から音像定位制御情報を生成し、その音
像定位制御情報に基づいて受聴側の音像を生成すること
により、簡単な構成でステレオによる会議通話を可能と
するものである。The present invention provides a conference call device that connects a plurality of destinations by generating sound image localization control information from a stereo signal and generating a sound image on the listening side based on the sound image localization control information. This allows conference calls.
会議通話装置における音像定位方式には、一般に、大き
く分けて、nチャネルの信号により送話系の音像をその
まま受話系で再生するステレオ方式と、音像定位のため
の制御情報を送受する音像定位制御情報通信方式とがあ
る。第4図にステレオ方式を用いた従来例会議通話装置
のブロック構成図を示し、第5図に音像定位制御情報通
信方式を用いた従来例会議通話装置のブロック構成図を
示す。Generally speaking, sound image localization methods for conference call devices are broadly divided into stereo methods, in which the sound image of the transmitting system is reproduced as is on the receiving system using n-channel signals, and sound image localization control, in which control information for sound image localization is transmitted and received. There is an information communication system. FIG. 4 shows a block diagram of a conventional conference call apparatus using a stereo system, and FIG. 5 shows a block diagram of a conventional conference call apparatus using a sound image localization control information communication system.
第4図に示した例は、T1=2チャネルのステレオ方式
により対向通信を行うものである。各通話端末には、2
個のマイクロホン1および2個のスピーカ9がそれぞれ
配置される。これらのマイクロホン1とスピーカ9とは
、送話系および受話系の組み合わせ毎に、独立した2チ
ヤネル伝送路3により接続される。この構成により、送
話系での音像をそのまま受話系で再生できる。In the example shown in FIG. 4, two-way communication is performed using a stereo system with T1=2 channels. Each call terminal has 2
Microphones 1 and two speakers 9 are respectively arranged. These microphones 1 and speakers 9 are connected by independent two-channel transmission paths 3 for each combination of a transmitting system and a receiving system. With this configuration, the sound image in the transmitting system can be reproduced as is in the receiving system.
第5図に示した例は、1チヤネルの伝送路6を用い、複
数人の送受話者が対向して通信会議を行うだめのもので
ある。各通話端末には、送話者数に応じた個数のマイク
ロホン4と、対向する相手数に応じた個数のスピーカ1
1とが設けられ、さらに、音像定位制御情報送信機5と
、音像定位制御情報受信機10とが設けられる。In the example shown in FIG. 5, a single channel transmission line 6 is used, and a plurality of transmitters and receivers face each other to conduct a communication conference. Each call terminal has a number of microphones 4 corresponding to the number of callers and a number of speakers 1 corresponding to the number of opposite parties.
1 is provided, and furthermore, a sound image localization control information transmitter 5 and a sound image localization control information receiver 10 are provided.
音像定位制御情報送信機5は、送話系の音源位置を検出
し、その音源(送話者)位置に対応する番号を音像定位
制御情報として生成し、音声情報と共に、同一伝送路内
のアウトスロットチャネルで、あるいはアドレス表示の
あるパケットで送信する。音像定位制御情報受信機10
は、受信した音像定位制御情報から、その音声が受聴者
の好む位置に生成させる。The sound image localization control information transmitter 5 detects the sound source position of the transmitting system, generates a number corresponding to the sound source (speaker) position as sound image localization control information, and generates a number corresponding to the sound source (speaker) position as sound image localization control information. Send on a slot channel or in a packet with an address indication. Sound image localization control information receiver 10
generates the sound at a position desired by the listener based on the received sound image localization control information.
音像定位制御情報通信方式の詳細については、例えば、
島田、鈴木、他、「多対地音声会議通信システムの対地
識別音像生成方式」、電子情報通信学会誌、第J70−
B巻第9号1987年に示されている。For details on the sound image localization control information communication method, see, for example,
Shimada, Suzuki et al., “Ground identification sound image generation method for multi-site audio conference communication system”, Journal of the Institute of Electronics, Information and Communication Engineers, No. J70-
B, No. 9, 1987.
しかし、島田、[通信網における信号処理技術の一展開
ハ信学技報、第90巻第180号、論文番号DSP90
−57.1990年8月23日に指摘されているように
、ステレオ方式は送信側の音像再生技術であり、通信に
おいては対向通信や放送型通信での利用が考えられるが
、ステレオ方式を多地点間の会議通話装置に利用する場
合には、受聴者の好む位置に音像を定位させることはで
きず、しかも実現が困難となる欠点がある。これについ
て以下に説明する。However, Shimada, [Development of signal processing technology in communication networks, IEICE Technical Report, Vol. 90, No. 180, Paper number DSP90]
-57.As pointed out on August 23, 1990, the stereo system is a sound image reproduction technology on the transmitting side, and in communication, it can be used for two-way communication and broadcast type communication, but the stereo system is often used. When used in a point-to-point conference call device, there is a drawback that the sound image cannot be localized at a position preferred by the listener, and furthermore, it is difficult to achieve this. This will be explained below.
第6図は多地点間外方向通信でステレオ方式を用いる場
合の構成を示す。FIG. 6 shows a configuration when a stereo system is used in multipoint outward communication.
複数の送話者のそれぞれの端末には、二つのマイクロホ
ン1および2チャネルステレオ送信機2がそれぞれ設け
られる。各端末の2チヤネルステレオ送信8!2は、そ
れぞれ別個の2チヤネル伝送路3を介して、共通の受聴
者端末の別々のスピーカ9に接続される。Each terminal of a plurality of speakers is provided with two microphones 1 and a two-channel stereo transmitter 2, respectively. The two-channel stereo transmissions 8!2 of each terminal are connected via separate two-channel transmission paths 3 to separate speakers 9 of the common listener terminal.
このような構成のだ2r5. m対地接続ではmx2(
n=2の場合)チャネルの伝送路が必要となる。This is the configuration of 2r5. For m ground connection, mx2 (
(If n=2) A channel transmission path is required.
さらに、双方間の会議通話装置に利用するためには、2
チヤネルの伝送路が(m−1>xm本も必要となる。Furthermore, in order to use it as a conference call device between both parties, 2
(m-1>xm channel transmission paths are also required.
また、対向通信における拡声系では、第4図に示したよ
うに、スピーカ9からマイクロホン1に回り込むエコー
経路が4種類形成される。このエコー経路によるエコー
を消去するためには、4台のエコー制御装置が必要であ
る。m対地では、必要なエコー制御装置の数は4Xm台
となる。しかも、この場合のエコー消去時間はスピーカ
からマイクロホンに回り込む空間伝播時間だけでなく、
メシ二網を考慮した通信網全体の安定性(ハウリングや
エコー〉の問題がある。したがって、伝送路コストや装
置コストが膨大なものになると予想される。Furthermore, in the loudspeaker system for two-way communication, four types of echo paths are formed from the speaker 9 to the microphone 1, as shown in FIG. Four echo control devices are required to eliminate the echo caused by this echo path. m ground, the required number of echo control devices is 4Xm. Moreover, the echo cancellation time in this case is not only the spatial propagation time from the speaker to the microphone.
There are problems with the stability (howling and echo) of the entire communication network considering the Messianic network.Therefore, it is expected that the cost of transmission paths and equipment will be enormous.
このように、多地点間通信でエコー消去を含むステレオ
方式を実現しようとすると、経済的にも技術的にもかな
りの困難がある。As described above, attempting to implement a stereo system that includes echo cancellation in multipoint communications poses considerable economical and technical difficulties.
本発明は、以上の課題を解決し、ステレオ方式による多
地点の接続が可能な会議通話装置を提供することを目的
とする。SUMMARY OF THE INVENTION An object of the present invention is to solve the above problems and provide a conference call device capable of connecting multiple points using a stereo system.
本発明の会議通話装置は、複数mの対地からそれぞれ到
来するnチャネルステレオ信号(nは2以上の整数)か
ら送話者側の音源位置を検出する手段と、この検出する
手段の出力に対応してその音源位置を表す音像定位制御
情報を生成する手段と、各対地からの音声情報を受聴側
の対地毎に分配する手段と、分配された音声情報とその
音像定位制御情報とからステレオ信号を受信する対地毎
にnチャネルのステレオ信号を生成する手段とを備えた
ことを特徴とする。The conference call device of the present invention includes a means for detecting a sound source position on a speaker side from n-channel stereo signals (n is an integer of 2 or more) arriving from a plurality of m destinations, and an output of this detecting means. means for generating sound image localization control information representing the position of the sound source; means for distributing the audio information from each location to each receiving side; and generating a stereo signal from the distributed audio information and the sound image localization control information. The present invention is characterized by comprising means for generating n-channel stereo signals for each receiving ground.
音像定位制御情報としては、対地の話者毎に割り当てら
れた論理番号を用いることができる。As the sound image localization control information, a logical number assigned to each speaker can be used.
音源位置を検出する手段は、ステレオ信号を構成するn
チャネルの間のレベル差、レベル差と時間差、相互相関
関数、あるいは直交変換法によって送話者側の音像位置
を検出することができる。The means for detecting the position of the sound source consists of
The sound image position on the speaker side can be detected using a level difference between channels, a level difference and a time difference, a cross-correlation function, or an orthogonal transformation method.
音像制御情報を生成する手段は、音源位置を検出する手
段が全送話者側の音源位置を検出した後に、その位置毎
に互いに異なる論理番号を音像制御情報を生成すること
が望ましい。It is preferable that the means for generating the sound image control information generates the sound image control information with a different logical number for each position after the means for detecting the sound source position detects the sound source positions of all speakers.
ステレオ信号を生成する手段は、音像定位制御情報の内
容によって、nチャネルの間の信号のレベル差、あるい
はレベル差と時間差とを制御する手段を含むことができ
る。The means for generating the stereo signal may include means for controlling the signal level difference between the n channels, or the level difference and time difference, depending on the content of the sound image localization control information.
検出する手段、音像定位制御情報を生成する手段、分配
する手段およびステレオ信号を生成する手段はセンタ装
置に設けられてもよく、その一部、すなわち検出する手
段、音像定位制御情報を生成する手段およびステレオ信
号を生成する手段のいずれか、またはこれらの手段のさ
らにその一部を端末に設けることもできる。The means for detecting, the means for generating sound image localization control information, the means for distributing, and the means for generating stereo signals may be provided in the center device, and some of them, that is, the means for detecting, the means for generating sound image localization control information and means for generating a stereo signal, or even a part of these means may be provided in the terminal.
本発明の会議通話装置はまた、音像定位制御情報通信方
式の対地を接続することもできる。すなわち、対地から
到来する音声情報をその音像定位制御情報と共に受信す
る手段と、分配する手段により分配された音声情報とそ
の音像定位制御情報とを対応する対地に送出する手段と
をさらに備えることができる。The conference call device of the present invention can also be connected to a destination using a sound image localization control information communication system. That is, the apparatus may further include means for receiving the audio information arriving from the ground together with its sound image localization control information, and means for transmitting the sound information distributed by the distributing means and the sound image localization control information to the corresponding ground. can.
会議通話装置では、各送話者の座席位置から発声する音
源が点音源であり、オーケストラ等の楽音のような開時
に複数の音源が広い領域内で発声する面音源とは異なる
。In a conference call device, the sound source emitted from the seat position of each speaker is a point sound source, which is different from a surface sound source such as a musical sound such as an orchestra, in which a plurality of sound sources emit sound within a wide area at the beginning of an opening.
そこで、あらかじめ各送話者毎に互いに異なる論理番号
を付与し、各対地からのnチャネルのステレオ信号から
送話者位置を検出し、すべての対地について現在の送話
者が誰であるのかを検出した後、その送話者に対応する
論理番号から各対地毎に再度nチャネルのステレオ信号
を生成したものを各受聴者側の伝送路に送信する。Therefore, by assigning a different logical number to each speaker in advance, and detecting the speaker's position from the n-channel stereo signal from each station, we can determine who the current speaker is for all stations. After the detection, an n-channel stereo signal is generated again for each destination from the logical number corresponding to the speaker and transmitted to the transmission path of each listener.
また、受聴側が音像定位制御情報通信方式による端末で
ある場合には、論理番号を音像定位制御情報とし、音声
情報と合わせて伝える。Furthermore, if the listening side is a terminal using the sound image localization control information communication method, the logical number is used as the sound image localization control information and is transmitted together with the audio information.
このようにして、ステレオ音声による会議通話を可能と
するとともに、ステレオ方式と音像定位制御情報通信方
式との相互変換を可能とすることができる。In this way, it is possible to make a conference call using stereo audio, and also to enable mutual conversion between the stereo system and the sound image localization control information communication system.
第1図は本発明実施例会議通話装置のブロック構成図で
ある。ここでは、n=2、すなわち2チヤネルのステレ
オ方式で本発明を実施した例を示す。また、煩雑さを避
けるため、一方向通信の例を示す。FIG. 1 is a block diagram of a conference call device according to an embodiment of the present invention. Here, an example will be shown in which the present invention is implemented in a stereo system with n=2, that is, two channels. Also, to avoid complexity, an example of one-way communication will be shown.
送話者側となる対地には、ステレオ方式または音像定位
制御情報通信方式を採用する送信端末が設置される。ス
テレオ方式の送信端末には、二つのマイクロホン1と、
2チャネルステレオ送信機2とが設けられる。音像定位
制御情報通信方式の送信端末には、送話者数に対応する
数のマイクロホン4と、音像定位制御情報送信機5とが
設けられる。A transmitting terminal that employs a stereo method or a sound image localization control information communication method is installed on the opposite side of the caller's side. The stereo transmission terminal includes two microphones 1,
A two-channel stereo transmitter 2 is provided. A transmitting terminal for the sound image localization control information communication system is provided with microphones 4 of a number corresponding to the number of speakers and a sound image localization control information transmitter 5.
受聴者側となる対地には、ステレオ方式または音像定位
制御情報通信方式を採用する受信端末が設置される。ス
テレオ方式の受信端末には、2チャネルステレオ受信機
8と、二つのスピーカ9とが設けられる。音像定位制御
情報通信方式の受信端末には、音像定位制御情報受信機
10と、送話者数に対応する数のスピーカ11とが設け
られる。A receiving terminal that employs a stereo system or a sound image localization control information communication system is installed on the ground that is the listener's side. A stereo receiving terminal is provided with a two-channel stereo receiver 8 and two speakers 9. A receiving terminal for the sound image localization control information communication system is provided with a sound image localization control information receiver 10 and a number of speakers 11 corresponding to the number of speakers.
ステレオ方式の端末は、それぞれ2チヤネル伝送路3を
介して音像定位変換機7に接続され、音像定位制御情報
通信方式の端末は、それぞれ伝送路6を介して音像定位
変換機7に接続される。The stereo type terminals are each connected to the sound image localization converter 7 via the two-channel transmission line 3, and the sound image localization control information communication type terminals are each connected to the sound image localization converter 7 via the transmission line 6. .
ステレオ方式の送信端末では、マイクロホン1に入力さ
れた音声信号が、2チャネルステレオ送信機2を介して
2チヤネル伝送路3に送出される。In a stereo transmission terminal, an audio signal input to a microphone 1 is sent to a two-channel transmission line 3 via a two-channel stereo transmitter 2.
音像定位制御情報通信方式の送信端末では、音像定位制
御情報送信機5が、マイクロホン4から音源位置を検出
し、送話者の識別を行う。さらに音像定位制御情報送信
機5は、その送話者にあらかじめ割り当てられた論理番
号の音像定位制御情報を付与するとともに、マイクロホ
ン4のそれぞれから出力される音声信号を加算またら抽
出して、この音声信号と音像定位制御情報とを伝送路6
に送出する。In the transmission terminal of the sound image localization control information communication system, the sound image localization control information transmitter 5 detects the position of the sound source from the microphone 4 and identifies the speaker. Furthermore, the sound image localization control information transmitter 5 gives the sound image localization control information of a logical number assigned in advance to the speaker, and adds or extracts the audio signals output from each of the microphones 4. The audio signal and the sound image localization control information are transmitted through the transmission path 6.
Send to.
このようにして送出された複数の対地からの信号は、受
聴側が2チャネルステレオ方式か音像定位情報通信方式
かにしたがって、音像定位変換機7により音像定位変換
処理される。The signals transmitted from a plurality of stations in this manner are subjected to sound image localization conversion processing by the sound image localization converter 7, depending on whether the listening side uses the two-channel stereo system or the sound image localization information communication system.
ここで、
(1)音像制御情報通信方式の送信端末のマイクロホン
4から音源位置を検出して送話者を識別し、その音像定
位制御情報を付与する方法、(2)複数の対地からの入
力に対して音像定位変換処理を行う方法
について以下に順を追って説明する。Here, (1) a method of detecting the sound source position from the microphone 4 of the transmitting terminal of the sound image control information communication system, identifying the speaker, and adding the sound image localization control information; (2) input from multiple ground sources; A method of performing sound image localization conversion processing on the following will be explained step by step.
まず、音像定位制御情報通信方式の送信端末の動作につ
いて説明する。First, the operation of the transmitting terminal of the sound image localization control information communication system will be explained.
送話者を識別するには、複数のマイクロホンから「台錐
が送話者であるのか」を検出する必要がある。この検出
方法としては、音源位置検出法とよばれる技術が知られ
ている。この方法における一番汎用的で簡単な方法とし
ては、
(a) 各マイクロホンの入力信号で一番音声入力レ
ベルの大きいマイクロホンを選び、そのマイクロホンに
対応する通話者を送話者とする方法、(b) 複数の
マイクロホンに入力される音声信号の中で、いち早く信
号が到達したマイクロホンに対応する通話者を送話者と
する方法、
(C) 各マイクロホン間の行程時間差(マイクロホ
ン間の距離)に対する入力信号の相互相関関数をとり、
その最大値をとる行程時間差から送話者の位置(音源位
置)を検出する方法、(d) 二つのマイクロホンに
それぞれ入力された信号の各振幅サンプリング量から直
交変換を行う方法
などが知られている。(C)の方法については、例えば
、野戸、安部、城戸、「帯域信号の包路線を利用した音
源位置の推定」、電子通信学会電気音響研究会資料EA
82−3.1982年に示されている。また、(d)の
方法については、例えば、鈴木、「最適直交変換による
ステレオ音声信号の分析」、電子情報通信学会誌論文(
A)、第J71−A巻第2号、1988年に示されてい
る。To identify the speaker, it is necessary to detect from multiple microphones whether the frustum is the speaker. As this detection method, a technique called a sound source position detection method is known. The most general and simplest method of this method is: (a) Select the microphone with the highest audio input level among the input signals of each microphone, and use the person corresponding to that microphone as the person speaking. b) A method in which the speaker corresponding to the microphone whose signal reaches the earliest among audio signals input to multiple microphones becomes the speaker, (C) A method for determining the difference in travel time between each microphone (distance between the microphones) Take the cross-correlation function of the input signal,
A method of detecting the speaker's position (sound source position) from the travel time difference that takes the maximum value, and (d) a method of performing orthogonal transformation from the amplitude sampling amount of each signal input to two microphones are known. There is. Regarding the method (C), see, for example, Noto, Abe, Kido, "Estimation of sound source position using envelope line of band signal", IEICE Electroacoustic Research Group Material EA.
82-3. Shown in 1982. Regarding the method (d), for example, Suzuki, "Analysis of stereo audio signals by optimal orthogonal transformation", IEICE journal paper (
A), Vol. J71-A, No. 2, 1988.
(a)、ら)の方法は複数のマイクロホンがある場合に
有効である。これに対して(c)、(d)の方法は、二
つのマイクロホンから複数の音源位置を検出するのに役
立つ。すなわち、(C)または(d)の方法を利用し、
二つのマイクロホンの間の行程時間差から二つの音声入
力信号を演算することにより、かなり精度の高い音源位
置検出が可能となり、また、複数の音源位置の検出も可
能となる。このような位置検出は、2チヤネルのステレ
オ信号からも容易に行うことができる。The methods (a) and et al. are effective when there are multiple microphones. On the other hand, methods (c) and (d) are useful for detecting multiple sound source positions from two microphones. That is, using method (C) or (d),
By calculating two audio input signals from the travel time difference between the two microphones, it is possible to detect a sound source position with considerably high accuracy, and it is also possible to detect a plurality of sound source positions. Such position detection can be easily performed using two-channel stereo signals.
次に音像定位変換処理について説明する。Next, sound image localization conversion processing will be explained.
第2図は音像定位変換機7の詳細を示すブロック構成図
である。ここでは、第1図の場合と異なり、双方向通信
の場合について説明する。FIG. 2 is a block diagram showing details of the sound image localization converter 7. As shown in FIG. Here, unlike the case in FIG. 1, a case of bidirectional communication will be explained.
この音像定位変換機7は、複数mの対地からそれぞれ到
来するn=2チヤネルステレオ信号から送話者側の音源
位置を検出する手段として音像位置検出回路12を備え
、この回路の出力に対応してその音源位置を表す音像定
位制御情報を生成する手段として音像定位制御情報作成
回路13を備え、各対地からの音声情報を受聴側の対地
毎に分配する手段として加算回路15および音声加算分
配回路16を備え、分配された音声情報とその音像定位
制御情報とからステレオ信号を受信する対地毎にn=2
チャネルのステレオ信号を生成する手段として2チャネ
ルステレオ生成回路14を備える。This sound image localization converter 7 is equipped with a sound image position detection circuit 12 as means for detecting the sound source position on the speaker side from n=2 channel stereo signals arriving from a plurality of m points of ground, and corresponds to the output of this circuit. A sound image localization control information generation circuit 13 is provided as a means for generating sound image localization control information representing the position of the sound source, and an adder circuit 15 and an audio addition/distribution circuit are provided as means for distributing audio information from each location to each listening location. 16, and n=2 for each ground receiving a stereo signal from the distributed audio information and its sound image localization control information.
A two-channel stereo generation circuit 14 is provided as means for generating channel stereo signals.
2チヤネル伝送路3から入力されたステレオ信号は、そ
れぞれ対応する音源位置検出回路12に入力される。音
像位置検出回路12は、前述した(C)あるいは(d)
の方法により、2チヤネルの音声信号から音源位置情報
を検出する。The stereo signals input from the two-channel transmission line 3 are input to the corresponding sound source position detection circuits 12, respectively. The sound image position detection circuit 12 has the above-mentioned (C) or (d).
According to the method described above, sound source position information is detected from two-channel audio signals.
ここで、通信を開始する前に、通信相手が何人存在し、
それが誰であるのかがわかっているとする。すなわち、
各通話者毎に番号が付与されており、例えば一番目の2
チヤネル伝送路3からは誰と誰の音声が到来するかわか
っている。したがって、一番目の2チヤネル伝送路3に
対応した音源位置検出回路12では、送話があった場合
のみ、その論理番号を音像定位制御情報作成回路13に
送出する。同様に、r番目(rはステレオ方式の送信端
末の数を越えない整数)の2チヤネル伝送路3から到来
する音声信号については、対応するr番目の音源位置検
出回路12で論理番号を付与し、音像定位制御情報作成
回路13に送られる。Here, before starting communication, how many communication partners exist,
Suppose you know who it is. That is,
A number is assigned to each caller, for example, the first 2
It is known who's voice will arrive from the channel transmission line 3. Therefore, the sound source position detection circuit 12 corresponding to the first two-channel transmission path 3 sends the logical number to the sound image localization control information creation circuit 13 only when there is a call. Similarly, for the audio signal arriving from the r-th (r is an integer not exceeding the number of stereo transmitting terminals) two-channel transmission path 3, the corresponding r-th sound source position detection circuit 12 assigns a logical number. , is sent to the sound image localization control information creation circuit 13.
伝送路6から到来した信号については、すでに音像定位
制御情報が付与されているので、そのまま音像定位制御
情報作成回路13に送られる。Since sound image localization control information has already been added to the signal arriving from the transmission path 6, the signal is sent as is to the sound image localization control information creation circuit 13.
音像定位制御情報作成回路13は、入力された音像定位
制御情報から、受聴側の端末で音像を生成するための音
像定位制御情報を作成する。音像定位制御情報として前
述した島田、鈴木らの論文に記載されている論理信号を
用いるならば、音像定位制御情報作成回路13は、論理
話と排他的論理話とを組み合わせた回路で実現される。The sound image localization control information creation circuit 13 creates sound image localization control information for generating a sound image at the listening side terminal from the input sound image localization control information. If the logic signal described in the paper by Shimada, Suzuki et al. mentioned above is used as the sound image localization control information, the sound image localization control information creation circuit 13 is realized by a circuit that combines a logic story and an exclusive logic story. .
このようにして、それぞれの送話者に互いに独立な論理
番号を与えれば、複数の通話者が同時に送話者となった
場合でも問題は生じない。By giving independent logical numbers to each caller in this way, no problem will occur even if a plurality of callers act as talkers at the same time.
2チヤネル伝送路3から入力されたステレオ信号はまた
、それぞれ、対応する加算回路15により左右両チャネ
ルの信号が加算される。この加算された信号は、音声加
算分配回路16に送られる。伝送路6から入力された音
声情報も音声加算分配回路16に送られる。For the stereo signals inputted from the two-channel transmission line 3, the signals of both left and right channels are added by corresponding adder circuits 15, respectively. This added signal is sent to the audio addition/distribution circuit 16. Audio information input from the transmission path 6 is also sent to the audio addition/distribution circuit 16.
音声加算分配回路16は、対地毎にその対地以外の音声
信号を加算し、対応する対地がステレオ方式であれば、
対応する2チャネルステレオ生成回路14に送出する。The audio addition/distribution circuit 16 adds audio signals for each destination other than that destination, and if the corresponding destination is a stereo system,
It is sent to the corresponding two-channel stereo generation circuit 14.
2チャネルステレオ生成回路14は、音像定位制御情報
作成回路13からの音像定位制御情報にしたがって、左
右の音声情報のレベル差、あるいはレベル差と時間差と
を制御し、2チヤネルのステレオ信号を生成する。The two-channel stereo generation circuit 14 controls the level difference between left and right audio information, or the level difference and time difference, according to the sound image localization control information from the sound image localization control information creation circuit 13, and generates a two-channel stereo signal. .
対応する対地が音声定位制御情報通信方式である場合に
は、音声加算分配回路16は、対応する音声信号出力を
そのまま伝送路6に送出する。このとき、音像定位制御
情報生成回路13からの音声制御情報も一緒に送出する
。When the corresponding destination is an audio localization control information communication system, the audio addition/distribution circuit 16 sends the corresponding audio signal output to the transmission path 6 as is. At this time, audio control information from the sound image localization control information generation circuit 13 is also sent out.
このようにして、ステレオ方式の端末に対して、その端
末以外の端末から到来した音声情報をステレオ信号とし
て供給できる。また、音像定位制御情報通信方式の端末
に対しては、他の端末からの音声情報と、それに対応す
る音像定位制御情報とを供給できる。In this way, audio information arriving from a terminal other than the stereo terminal can be supplied as a stereo signal to the stereo terminal. Further, to a terminal using the sound image localization control information communication system, audio information from another terminal and the corresponding sound image localization control information can be supplied.
レベル差の制御方法については、多くの文献が知られて
いる。例えば、照性、「音像の拡がり感と距離感J、N
HK技研月報、昭和58年5月号や、二階堂、「ステレ
オ音響の話題からJ 、NHK技研月報、昭和51年4
月号などがある。Many documents are known regarding methods for controlling level differences. For example, illumination, the sense of spread and distance of the sound image J, N
HK Giken Monthly Report, May 1983 issue, Nikaido, “From the Topic of Stereo Acoustics, J, NHK Giken Monthly Report, 1975 April
There are monthly issues, etc.
すなわち、二つのスピーカの真中に音像を定位させたい
場合には、基準受聴音量レベルを「1」として、左右両
チャネルの信号レベルをそれぞれ1/2に設定する。ま
た、正面を0度とし、音像定位が生成される角度をθ、
スピーカの方向をθ。、左右の信号レベルの比をkとす
れば、
sinθ= (1−k)/(1+k) x sinθ。That is, when it is desired to localize a sound image in the middle of two speakers, the standard listening volume level is set to "1", and the signal levels of both the left and right channels are set to 1/2, respectively. Also, assuming that the front is 0 degrees, the angle at which sound image localization is generated is θ,
Set the direction of the speaker to θ. , if the ratio of the left and right signal levels is k, then sin θ = (1-k)/(1+k) x sin θ.
の関係があると言われている。したがって、音声情報か
らこの左右のレベル差を制御することによって、2チヤ
ネルステレオを信号を生成することができる。It is said that there is a relationship between Therefore, by controlling this left and right level difference from audio information, a two-channel stereo signal can be generated.
時間差については、一般に、左右同レベルでも先に耳に
達した方向に音像定位が生じる先行音定位という方法が
知られている。例えばハース、「ザ・インフルーエンス
・オン・ア・シングル・エコー・オン・ザ・オウディビ
リティ・オン・スピーチ」、ジャーナル・オン・ザ・オ
ーディオ・工ンジニアリング・ソサエティ、1972年
、第20巻3月号には、左右2チャネルの信号に時間差
を設けた場合に、39m5ec以内ならば、先に耳に到
着した方向に音像が引き込まれることが示されている。Regarding the time difference, there is generally known a method called advance sound localization in which the sound image is localized in the direction that reaches the ear first, even if the left and right sound levels are the same. See, for example, Haas, “The Influence on a Single Echo on the Audibility on Speech,” Journal on the Audio Engineering Society, 1972, Vol. 20. The March issue shows that when a time difference is set between the left and right two channel signals, the sound image will be drawn in the direction in which it reaches the ear first if it is within 39m5ec.
この論文にはまた、音像定位制御を行う場合に、0〜5
m5ec以内の制御を行えば自由に音像を定位できる
ことが示されている。This paper also states that when performing sound image localization control, 0 to 5
It has been shown that if control is performed within m5ec, it is possible to freely localize the sound image.
次に、音像定位制御情報作成回路13の論理的な動作に
ついて説明する。Next, the logical operation of the sound image localization control information creation circuit 13 will be explained.
第3図は各対地に対して抽出された音源位置の配置を示
す。FIG. 3 shows the arrangement of sound source positions extracted for each ground.
aSb、cSd、eS f、°”X% 7% Zは、全
会議参加者の音像番号を仮想的に示している。すなわち
、対地番号1からはa、bScの3名の会議参加者、対
地番号2からはdSe、fの3名の会議参加者、そして
対地番号mからはx、ySzの3名の会議参加者があっ
た例である。aSb, cSd, eS f, °” In this example, there are three conference participants dSe and f from number 2, and three conference participants x and ySz from destination number m.
ここで、まず対地番号総数mをビット数とし、対地番号
1には00・・・01、対地番号2にはOO・・・10
、そして対地番号mには10・・・00を割り当てる。Here, first, let the total number of destination numbers m be the number of bits, 00...01 for destination number 1, OO...10 for destination number 2, etc.
, and 10...00 is assigned to the destination number m.
さらに、各対地の会議参加最大数をビット数とし、対地
番号1の会議参加者aには001、会議参加者すには0
10、会議参加者Cには100を割り当てる。Furthermore, the maximum number of conference participants for each destination is the number of bits, 001 for conference participant a of destination number 1, 0 for conference participant
10. Assign 100 to conference participant C.
また、対地番号2の会議参加者dには001を割り当て
る。Furthermore, 001 is assigned to conference participant d with destination number 2.
これにより全会議参加者が、〔対地番号十各対地の会議
参加者番号〕の番号で表される。この番号はそれぞれ互
いに独立であり、直交した符号化系列を構成する。した
がって、複数の参加者が話者となったときでも、論理和
を求めることにより、何人が同時話者となっているのか
を容易に判断できる。As a result, all conference participants are represented by the number of [destination number 10 conference participant numbers of each destination]. These numbers are mutually independent and form orthogonal coded sequences. Therefore, even when a plurality of participants are speakers, it is possible to easily determine how many people are simultaneously speaking by calculating the logical sum.
以上の実施例において、すべての対地がステレオ方式で
双方向通信を行うとすると、m対地接続で必要なnチャ
ネルの伝送路は2%mとなり、従来例に比較して少ない
伝送路でステレオ方式の会議通話を実現できる。また、
送話端末にその信号を返送していないので、エコー消去
の必要もない。In the above embodiment, assuming that all destinations perform two-way communication using the stereo system, the number of n-channel transmission paths required for m-ground connections is 2% m, which means that the stereo system requires fewer transmission paths than the conventional example. conference calls can be realized. Also,
Since the signal is not sent back to the transmitting terminal, there is no need for echo cancellation.
以上の実施例は、検出する手段、音像定位制御情報を生
成する手段、分配する手段およびステレオ信号を生成す
る手段をセンタ装置に設けた例について説明した。本発
明は、これらの一部を端末側に設けても同様に実施でき
る。In the above embodiments, an example has been described in which the center device is provided with detecting means, sound image localization control information generating means, distributing means, and stereo signal generating means. The present invention can be similarly implemented even if some of these are provided on the terminal side.
以上説明したように、あらかじめすべての通話者に論理
番号を付与しておき、各対地から受信されるnチャネル
のステレオ信号から音像定位を検出し、検出した送話者
に対する音像位置を論理信号で符号化し、これを複数人
同時話者になる場合は論理処理を施し、その論理信号か
ら再びnチャネルのステレオ信号を生成することにより
、少ない伝送路量でステレオ方式の会議通話を実現でき
る効果がある。As explained above, logical numbers are assigned to all callers in advance, sound image localization is detected from the n-channel stereo signals received from each destination, and the sound image position for the detected caller is determined using logical signals. If multiple people are talking at the same time, this signal is encoded, then subjected to logical processing, and an n-channel stereo signal is generated again from the logical signal. This has the effect of realizing a stereo conference call with a small amount of transmission path. be.
また、送話端末にその信号を返送しないようにすれば、
エコー消去の必要がなく、装置構成がさらに簡単化され
る効果がある。Also, if you prevent the signal from being sent back to the transmitting terminal,
There is no need for echo cancellation, which has the effect of further simplifying the device configuration.
さらに、ステレオ信号から装置内で音像定位制御情報を
生成するので、ステレオ方式でありながら音像定位制御
情報通信方式との接続が可能であり、実用上の柔軟性を
得られる効果がある。Furthermore, since the sound image localization control information is generated within the apparatus from the stereo signal, it is possible to connect to the sound image localization control information communication system even though it is a stereo system, and there is an effect of obtaining practical flexibility.
第1図は本発明実施例会議通話装置のブロック構成図。
第2図は音像定位変換機の詳細を示すブロック構成図。
第3図は各対地に対して抽出された音源位置の配置を示
す図。
第4図はステレオ方式を用いた従来例会議通話装置のブ
ロック構成図。
第5図は音像定位制御情報通信方式を用いた従来例会議
通話装置のブロック構成図。
第6図は多地点間片方向通信でステレオ方式を用いる場
合の構成を示す図。
1.4・・・マイクロホン、2・・・2チャネルステレ
オ送信機、3・・・2チヤネル伝送路、5・・・音像定
位制御情報送信機、6・・・伝送路、7・・・音像定位
変換機、8・・・2チャネルステレオ受信機、9.11
・・・スピーカ、10・・・音像定位制御情報受信機、
12・・・音像位置検出回路、13・・・音像定位制御
情報作成回路、14・・・2チャネルステレオ生成回路
、15・・・加算回路、16・・・音声加算分配回路。FIG. 1 is a block diagram of a conference call device according to an embodiment of the present invention. FIG. 2 is a block diagram showing details of the sound image localization converter. FIG. 3 is a diagram showing the arrangement of sound source positions extracted for each ground. FIG. 4 is a block diagram of a conventional conference call device using a stereo system. FIG. 5 is a block diagram of a conventional conference call device using a sound image localization control information communication system. FIG. 6 is a diagram showing a configuration when a stereo system is used in unidirectional communication between multiple points. 1.4...Microphone, 2...2 channel stereo transmitter, 3...2 channel transmission line, 5...Sound image localization control information transmitter, 6...Transmission line, 7...Sound image Localization converter, 8...2 channel stereo receiver, 9.11
... Speaker, 10 ... Sound image localization control information receiver,
12...Sound image position detection circuit, 13...Sound image localization control information creation circuit, 14...2 channel stereo generation circuit, 15...Addition circuit, 16...Audio addition and distribution circuit.
Claims (1)
mの対地のからそれぞれ到来するnチャネルステレオ信
号から送話者側の音源位置を検出する手段と、 この検出する手段の出力に対応してその音源位置を表す
音像定位制御情報を生成する手段と、各対地からの音声
情報を受聴側の対地毎に分配する手段と、 分配された音声情報とその音像定位制御情報とからステ
レオ信号を受信する対地毎にnチャネルのステレオ信号
を生成する手段と を備えたことを特徴とする会議通話装置。 2、音像定位制御情報は対地の送話者毎に割り当てられ
た論理番号である請求項1記載の会議通話装置。 3、検出する手段、音像定位制御情報を生成する手段、
分配する手段およびステレオ信号を生成する手段はセン
タ装置に設けられた請求項1記載の会議通話装置。 4、検出する手段、音像定位制御情報を生成する手段お
よびステレオ信号を生成する手段の一部が端末に設けら
れた請求項1記載の会議通話装置。[Claims] 1. In a conference call device that connects a plurality of destinations, means for detecting the position of a sound source on the speaker side from n-channel stereo signals arriving from each of a plurality of destinations; and this detecting means. means for generating sound image localization control information representing the position of the sound source in response to the output of the sound source, means for distributing the audio information from each location to each location on the listening side, and distributing the distributed audio information and its sound image localization control information. and means for generating an n-channel stereo signal for each destination receiving the stereo signal from the conference call device. 2. The conference call device according to claim 1, wherein the sound image localization control information is a logical number assigned to each caller at the destination. 3. means for detecting, means for generating sound image localization control information,
2. The conference call device according to claim 1, wherein the means for distributing and the means for generating the stereo signal are provided in the center device. 4. The conference call device according to claim 1, wherein a portion of the detecting means, the sound image localization control information generating means, and the stereo signal generating means are provided in the terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2275939A JP2588793B2 (en) | 1990-10-15 | 1990-10-15 | Conference call device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2275939A JP2588793B2 (en) | 1990-10-15 | 1990-10-15 | Conference call device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04150652A true JPH04150652A (en) | 1992-05-25 |
JP2588793B2 JP2588793B2 (en) | 1997-03-12 |
Family
ID=17562537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2275939A Expired - Fee Related JP2588793B2 (en) | 1990-10-15 | 1990-10-15 | Conference call device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2588793B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002366146A (en) * | 2001-06-13 | 2002-12-20 | Dainippon Printing Co Ltd | Encoding method for sound signal |
WO2007007444A1 (en) * | 2005-07-08 | 2007-01-18 | Yamaha Corporation | Audio transmission system and communication conference device |
JP2011521551A (en) * | 2008-05-13 | 2011-07-21 | ストーミングスイス・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング | Angle-dependent motion apparatus or method for obtaining a pseudo-stereoscopic audio signal |
JP2011182142A (en) * | 2010-02-26 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Sound signal false localization system, method thereof, sound signal false localization decoding device and program |
JP2011182141A (en) * | 2010-02-26 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Sound signal false localization system, method and program |
-
1990
- 1990-10-15 JP JP2275939A patent/JP2588793B2/en not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002366146A (en) * | 2001-06-13 | 2002-12-20 | Dainippon Printing Co Ltd | Encoding method for sound signal |
JP4601865B2 (en) * | 2001-06-13 | 2010-12-22 | 大日本印刷株式会社 | Method for encoding an acoustic signal |
WO2007007444A1 (en) * | 2005-07-08 | 2007-01-18 | Yamaha Corporation | Audio transmission system and communication conference device |
JP2007019907A (en) * | 2005-07-08 | 2007-01-25 | Yamaha Corp | Speech transmission system, and communication conference apparatus |
JP2011521551A (en) * | 2008-05-13 | 2011-07-21 | ストーミングスイス・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング | Angle-dependent motion apparatus or method for obtaining a pseudo-stereoscopic audio signal |
KR101433235B1 (en) * | 2008-05-13 | 2014-08-22 | 슈트로밍스위스 게엠베하 | Angle-dependent operating device or method for obtaining a pseudo-stereophonic audio signal |
JP2011182142A (en) * | 2010-02-26 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Sound signal false localization system, method thereof, sound signal false localization decoding device and program |
JP2011182141A (en) * | 2010-02-26 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Sound signal false localization system, method and program |
Also Published As
Publication number | Publication date |
---|---|
JP2588793B2 (en) | 1997-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5991385A (en) | Enhanced audio teleconferencing with sound field effect | |
US7848738B2 (en) | Teleconferencing system with multiple channels at each location | |
US5020098A (en) | Telephone conferencing arrangement | |
KR20090098993A (en) | Distributed Teleconferencing Multichannel Architecture, Systems, Methods, and Computer Program Products | |
US7983406B2 (en) | Adaptive, multi-channel teleconferencing system | |
EP1298904A2 (en) | Method for background noise reduction and performance improvement in voice conferencing over packetized networks | |
US6813360B2 (en) | Audio conferencing with three-dimensional audio encoding | |
KR20140103290A (en) | Method and arrangement for echo cancellation in conference systems | |
JPH01319360A (en) | Voice conference equipment | |
JPH01260967A (en) | Voice conference equipment for multi-channel signal | |
US7433716B2 (en) | Communication apparatus | |
US7924995B2 (en) | Teleconferencing system with multi-channel imaging | |
JPH04150652A (en) | Conference talking equipment | |
JPH0974446A (en) | Voice communication controller | |
Yensen et al. | Synthetic stereo acoustic echo cancellation structure for multiple participant VoIP conferences | |
Botros et al. | Stereophonic speech teleconferencing | |
US20100272249A1 (en) | Spatial Presentation of Audio at a Telecommunications Terminal | |
JP2635684B2 (en) | Stereo audio transmission system | |
JPH05316239A (en) | Conference system | |
JPS62190962A (en) | Conference talk system | |
Pitroda et al. | A digital conference circuit for an instant speaker algorithm | |
JPH0449756A (en) | Conference speech device | |
JPS6331255A (en) | Conference speech system | |
JPH0449757A (en) | Conference speech terminal equipment | |
JP3426472B2 (en) | Meeting audio signal transmission system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |