JP4804014B2 - Audio conferencing equipment - Google Patents
Audio conferencing equipment Download PDFInfo
- Publication number
- JP4804014B2 JP4804014B2 JP2005047369A JP2005047369A JP4804014B2 JP 4804014 B2 JP4804014 B2 JP 4804014B2 JP 2005047369 A JP2005047369 A JP 2005047369A JP 2005047369 A JP2005047369 A JP 2005047369A JP 4804014 B2 JP4804014 B2 JP 4804014B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- channel
- audio
- stereo
- monaural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 claims description 108
- 238000012545 processing Methods 0.000 claims description 35
- 230000005540 biological transmission Effects 0.000 claims description 26
- 230000004807 localization Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Headphones And Earphones (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は音声会議装置に関し、例えば、多人数二地点間でのステレオ音声信号による音声会議装置及びシステムに適用し得るものである。 The present invention relates to an audio conference apparatus, and can be applied to, for example, an audio conference apparatus and system using a stereo audio signal between two points of a large number of people.
企業内LANやADSLなどの広帯域なブロードバンドIP回線の普及により、多人数二地点間(二つのグループが別々の場所にいる)のテレビ会議システムが普及してきている。このようなテレビ会議システムに適用される音声会議システムとして、非特許文献1に記載のようなVoIPに対応したものも提案されている。この音声会議システムは、スピーカとマイクロフォンとを有する端末を利用したものである。
しかしながら、上述の非特許文献1の音声会議システムでは、話者を特定すること(誰がしゃべっているか)が困難であるという問題があった。
However, the audio conference system of Non-Patent
このような不都合を解決するため、スピーカとマイクロフォンとをそれぞれ、一対設置してステレオ対応とすることが考えられる。しかしながら、音声会議システムの場合、多人数に聴取させるべく、スピーカの音量を大きくしているため、スピーカとマイクロフォンとを1個ずつ設けた場合でもエコーの問題が大きく、スピーカとマイクロフォンとをステレオ対応にした場合には、エコーの問題は一段と大きくなって、エコーキャンセラの構成が複雑、高価となってしまう。 In order to solve such inconvenience, it is conceivable to install a pair of speakers and microphones so as to be stereo-compatible. However, in the case of an audio conference system, since the volume of the speaker is increased so that a large number of people can listen, even if one speaker and one microphone are provided, the problem of echo is large, and the speaker and microphone are compatible with stereo. In this case, the problem of echo is further increased, and the configuration of the echo canceller becomes complicated and expensive.
そのため、話者特定問題とエコー問題とを共に解決し得る音声会議装置が望まれている。 Therefore, an audio conference apparatus that can solve both the speaker identification problem and the echo problem is desired.
第1の本発明は、最大N人(Nは3以上)の参加者に対応できる、会議に係る2地点のそれぞれの地点に設けられる音声会議装置において、(1)各参加者の口元近傍に設けられる指向性のモノラルマイクロフォンと、(2)対応するモノラルマイクロフォンからのモノラル音声信号を、当該モノラル/ステレオ変換手段によって定まる方向性が付加されたRチャンネル音声信号及びLチャンネル音声信号でなるステレオ音声信号に変換するモノラル/ステレオ変換手段と、(3)上記各モノラル/ステレオ変換手段からのRチャンネル音声信号を合成して合成Rチャンネル音声信号を得ると共に、上記各モノラル/ステレオ変換手段からのLチャンネル音声信号を合成して合成Lチャンネル音声信号を得、合成Rチャンネル音声信号及び合成Lチャンネル音声信号を対向する音声会議装置に送信するステレオ音声送信手段と、(4)Rチャンネル用のスピーカ及びLチャンネル用のスピーカと、(5)対向する音声会議装置からの合成Rチャンネル音声信号をRチャンネル用の上記スピーカに与えると共に、対向する音声会議装置からの合成Lチャンネル音声信号をLチャンネル用の上記スピーカに与える受信分配手段とを有することを特徴とする。 The first aspect of the present invention is an audio conference apparatus provided at each of two locations related to a conference that can accommodate up to N participants (N is 3 or more). (1) In the vicinity of each participant's mouth (1) stereo sound composed of an R channel audio signal and an L channel audio signal to which a direction determined by the monaural / stereo conversion means is added to a monaural audio signal from the corresponding monaural microphone; Monaural / stereo conversion means for converting into signals , and (3) combining the R channel audio signals from each of the monaural / stereo conversion means to obtain a synthesized R channel audio signal, and Synthesize the channel audio signal to obtain the synthesized L channel audio signal, Stereo audio transmission means for transmitting an L channel audio signal to the opposing audio conference device, (4) an R channel speaker and an L channel speaker, and (5) a synthesized R channel audio signal from the opposing audio conference device And receiving and distributing means for supplying the L channel speaker with a synthesized L channel audio signal from the opposite audio conference apparatus.
本発明の音声会議装置によれば、ステレオ音声信号を送受信するに際して、参加者毎のヘッドフォンを利用したり、又は及び、参加者毎の指向性モノラルマイクロフォンを利用したりすることにより、話者を特定できると共にエコーの発生を抑圧できるようになる。 According to the audio conferencing apparatus of the present invention, when transmitting and receiving a stereo audio signal, a speaker can be selected by using headphones for each participant or using a directional monaural microphone for each participant. This makes it possible to identify and suppress the occurrence of echoes.
(A)第1の実施形態
以下、本発明の音声会議装置を、多人数二地点間の音声会議システムに適用した第1の実施形態を、図面を参照しながら説明する。
(A) 1st Embodiment Hereinafter, the 1st Embodiment which applied the audio conference apparatus of this invention to the audio conference system between many people two points is described, referring drawings.
図1は、第1の実施形態の音声会議装置の概略構成を示している。かかる構成の音声会議装置10が対向している2地点にそれぞれ設けられることにより、第1の実施形態の音声会議システムが構成される。 FIG. 1 shows a schematic configuration of the audio conference apparatus according to the first embodiment. The audio conference system according to the first embodiment is configured by providing the audio conference apparatus 10 having such a configuration at two opposing points.
音声会議装置10は、自地点からのステレオ音声信号を送信する送信構成と、他地点捕捉のステレオ音声信号を受信する構成とからなっている。 The audio conference apparatus 10 has a transmission configuration for transmitting a stereo audio signal from its own location and a configuration for receiving a stereo audio signal captured at another location.
音声会議装置10の送信構成は、一対のマイクロフォン21R、21Lと、音声多重送信部22とを有する。
The transmission configuration of the audio conference apparatus 10 includes a pair of
許容し得る最大人数(N人)の会議参加者1−1〜1−N(図1の例ではNは4)が所定の直線又は曲線(例えば円弧)上に位置した場合でも、どの参加者の音声も十分にしかも対向するステレオ発音で位置の相違が生じるように、一対のマイクロフォン21R、21Lが設置されている。設置は固定設置に限定されるものではないが、一対のマイクロフォン21R及び21L間の距離が、左右の耳間の平均的な距離程度になっていることが好ましい。
Even if the maximum allowable number (N) of conference participants 1-1 to 1-N (N in the example of FIG. 1 is 4) is located on a predetermined straight line or curve (for example, arc), any participant A pair of
音声多重送信部22は、マイクロフォン21RからのRチャンネル音声信号及びマイクロフォン21LからのLチャンネル音声信号を多重して得たステレオ音声信号を、対向する音声会議装置に送信するものである。ここで、多重、送信方法は既存のいかなる方法を適用するようにしても良い。音声多重送信部22は、例えば、Rチャンネル音声信号及びLチャンネル音声信号をそれぞれ、デジタル信号に変換した後、符号化し、その後に多重するようにしても良く、さらに、使用するネットワークなどに合わせて、通信路変調などを施すようにしたり、パケット化したりしても良い。
The audio
音声会議装置10の受信構成は、受信分配部31と、各参加者用のヘッドフォン32−1〜32−Nとを有する。
The reception configuration of the audio conference apparatus 10 includes a
受信分配部31は、対向する音声会議装置が送信したステレオ音声信号を、Rチャンネル音声信号及びLチャンネル音声信号に分離すると共に、分離して得た一対のRチャンネル音声信号及びLチャンネル音声信号を、各参加者用のヘッドフォン32−1、…、32−Nに分配するものである。各参加者用のヘッドフォン32−1、…、32−Nへの分配機能を除けば、受信分配部31は、上述した音声多重送信部22の逆処理を行うものである。例えば、音声多重送信部22が通信路変調を施すものであれば受信分配部31は通信路復調を行い、音声多重送信部22がパケットの組立てを行うものであれば受信分配部31は受信パケットの分解を行い、音声多重送信部22が音声信号の符号化を施すものであれば受信分配部31は復号化を行う。
The receiving / distributing
なお、受信分配部31は、ヘッドフォンジャックを有し、ヘッドフォンのプラグが挿入されていないジャックへは、一対のRチャンネル音声信号及びLチャンネル音声信号を分配しないものであっても良い。
The
また、上述した一部の機能を受信分配部31ではなく、各ヘッドフォン32−1、…、32−Nに担うようにさせても良い。
Further, some of the functions described above may be assigned to the headphones 32-1,..., 32-N instead of the
各ヘッドフォン32−1、…、32−Nはそれぞれ、受信分配部31から与えられたRチャンネル音声信号及びLチャンネル音声信号に係る音声を、該当する耳側の受聴部から発音出力させるものである。
Each of the headphones 32-1,..., 32 -N is for outputting the sound related to the R channel audio signal and the L channel audio signal given from the
ここで、各ヘッドフォン32−1、…、32−Nとしては、周囲音を透過する構造のものであることが、同一地点の他の参加者の音声を聴取させることができて好ましい。 Here, it is preferable that each of the headphones 32-1,..., 32-N has a structure that allows ambient sounds to pass therethrough so that the voices of other participants at the same point can be heard.
以下、音声会議に供している一方の地点Aの参加者の発音内容を、他方の地点Bの参加者が聴取する場合の動作を説明する。以下の説明においては、地点Aの構成要素の符号には、その末尾に「A」を付与し、地点Bの構成要素の符号には、その末尾に「B」を付与する。 Hereinafter, an operation when the participant at the other point B listens to the pronunciation of the participant at one point A provided for the audio conference will be described. In the following description, “A” is added to the end of the component of the point A, and “B” is added to the end of the reference of the component of the point B.
一方の地点Aの参加者1−nAが発言すると、その発音音声は、音声会議装置10Aの一対のマイクロフォン21RA、21LAによって捕捉され、Rチャンネル音声信号及びLチャンネル音声信号に変換されて音声多重送信部22Aに与えられる。音声多重送信部22Aにおいて、Rチャンネル音声信号及びLチャンネル音声信号は多重され、得られたステレオ音声信号が、対向する音声会議装置10Bに向けて送信される。 When the participant 1-nA at one point A speaks, the pronunciation sound is captured by the pair of microphones 21RA and 21LA of the audio conference apparatus 10A, converted into an R channel audio signal and an L channel audio signal, and audio multiplexed transmission. Is given to the part 22A. In the audio multiplex transmission unit 22A, the R channel audio signal and the L channel audio signal are multiplexed, and the obtained stereo audio signal is transmitted to the opposite audio conference apparatus 10B.
このような送信信号を、音声会議装置10Bの受信分配部31Bが受信する。受信分配部31Bは、対向する音声会議装置10Aが送信したステレオ音声信号を、Rチャンネル音声信号及びLチャンネル音声信号に分離すると共に、分離して得た一対のRチャンネル音声信号及びLチャンネル音声信号を、各参加者のヘッドフォン32−1B、…、32−NBに分配する。 Such a transmission signal is received by the reception distributing unit 31B of the audio conference apparatus 10B. The reception distributor 31B separates the stereo audio signal transmitted by the opposing audio conference device 10A into an R channel audio signal and an L channel audio signal, and a pair of R channel audio signal and L channel audio signal obtained by the separation. Are distributed to the headphones 32-1B,..., 32-NB of each participant.
各参加者のヘッドフォン32−1B、…、32−NBはそれぞれ、受信分配部31Bから与えられたRチャンネル音声信号及びLチャンネル音声信号に対応する音声を、該当する耳側の受聴部から発音出力させる。 Each of the headphones 32-1B,..., 32-NB of each participant generates a sound corresponding to the R channel audio signal and the L channel audio signal given from the reception distribution unit 31B from the corresponding ear listening unit. Let
ヘッドフォン32−1B、…、32−NBを装着している参加者1−1B〜1−NBはそれぞれ、参加者1−nAの発音音声をステレオで聴取するので、参加者1−nAの位置を、他の参加者1−1A〜1−NA(但し1−nAを除く)と区別でき、他方の地点であっても、臨場感を感じつつ発音音声を聴取することができる。 Since each of the participants 1-1B to 1-NB wearing the headphones 32-1B,..., 32-NB listens to the sound of the participant 1-nA in stereo, the positions of the participants 1-nA are determined. It can be distinguished from the other participants 1-1A to 1-NA (except 1-nA), and even at the other point, it is possible to listen to the pronunciation sound while feeling a sense of reality.
上記第1の実施形態によれば、一対のマイクロフォンが捕捉したステレオ音声信号を他方の地点に送信しても音声信号の発音手段がヘッドフォンであるので、エコーが問題となることがなく、また、ステレオによる聴取であるので、話者や話者の位置なども聴取者が認識し易いものとなっている。このような効果を奏するための構成は、簡易、安価にすることができる。 According to the first embodiment, even if the stereo sound signal captured by the pair of microphones is transmitted to the other point, the sound signal is generated by the headphones, so that the echo does not become a problem. Since the listening is performed by stereo, the listener and the position of the speaker are easily recognized by the listener. The configuration for producing such an effect can be simplified and inexpensive.
(B)第2の実施形態
次に、本発明の音声会議装置を、多人数二地点間の音声会議システムに適用した第2の実施形態を、図面を参照しながら説明する。
(B) Second Embodiment Next, a voice conference apparatus of the present invention, the second embodiment applied to a voice conference system between multiplayer point-to-point, will be described with reference to the drawings.
図2は、第2の実施形態の音声会議装置の概略構成を示している。かかる構成の音声会議装置11が対向している2地点にそれぞれ設けられることにより、第2の実施形態の音声会議システムが構成される。 FIG. 2 shows a schematic configuration of the audio conference apparatus according to the second embodiment. The audio conference system 11 according to the second embodiment is configured by providing the audio conference apparatus 11 having such a configuration at two points facing each other.
第2の実施形態の音声会議装置11も、自地点からのステレオ音声信号を送信する送信構成と、他地点捕捉のステレオ音声信号を受信する構成とからなっている。 The audio conference apparatus 11 of the second embodiment also has a transmission configuration for transmitting a stereo audio signal from its own location and a configuration for receiving a stereo audio signal captured at another location.
第2の実施形態の音声会議装置11の送信構成は、参加者毎のマイクロフォン21―1〜21−Nと、参加者毎の定位処理部41−1〜41−Nと、音声多重送信部22とを有する。
The transmission configuration of the audio conference apparatus 11 according to the second embodiment includes microphones 21-1 to 21 -N for each participant, localization processing units 41-1 to 41-N for each participant, and an audio
参加者毎の1個のマイクロフォン21−1〜21−Nは、モノラル出力型のマイクロフォンであって、対応する参加者の口元の近傍に設けられる指向性が高いものである。マイクロフォン21−1〜21−Nを、例えば、ヘッドセットのような取り付け具を介して参加者の口元の近傍に設けるようにしても良く、また例えば、ピンマイクを適用し、参加者の衣服などにピンによって取り付けて参加者の口元の近傍に設けるようにしても良く、さらに、テーブルの上などに載置された取付けスタンドを利用して参加者の口元の近傍に設けるようにしても良い。各マイクロフォン21−1〜21−Nからのモノラル音声信号は、各マイクロフォン21−1〜21−Nに対応する定位処理部41−1〜41−Nに与えられるようになされている。 Each microphone 21-1 to 21-N for each participant is a monaural output type microphone and has high directivity provided in the vicinity of the corresponding participant's mouth. The microphones 21-1 to 21-N may be provided in the vicinity of the participant's mouth, for example, via an attachment such as a headset. For example, a pin microphone may be applied to the participant's clothes. It may be attached by a pin and provided near the participant's mouth, or may be provided near the participant's mouth using an attachment stand placed on a table or the like. The monaural audio signals from the microphones 21-1 to 21-N are given to the localization processing units 41-1 to 41-N corresponding to the microphones 21-1 to 21-N.
各定位処理部41−1〜41−Nはそれぞれ、対応するマイクロフォン21−1〜21−Nからのモノラル音声信号に対し、HRTFを用いた既存の定位処理を実施して方向性を付加したステレオ音声信号(Rチャンネル音声信号及びLチャンネル音声信号)を形成するものである。ここで、方向性は、参加者毎に予め固定的に設定しておく。なお、既存の定位処理については、例えば、特開2002−209300号公報や特開2003−102099号公報に記載のものを適用し得る。各定位処理部41−1〜41−Nはそれぞれ、形成したステレオ音声信号を音声多重送信部22に与える。
Each of the localization processing units 41-1 to 41-N performs stereo processing using HRTFs on the monaural audio signals from the corresponding microphones 21-1 to 21-N to add directionality. An audio signal (R channel audio signal and L channel audio signal) is formed. Here, the directionality is fixedly set in advance for each participant. As for the existing localization processing, for example, those described in JP-A-2002-209300 and JP-A-2003-102099 can be applied. Each of the localization processing units 41-1 to 41-N supplies the formed stereo audio signal to the audio
この第2の実施形態の音声多重送信部22は、各定位処理部41−1〜41−Nからのステレオ音声信号を、Rチャンネル及びLチャンネル別に合成し、その後、合成Rチャンネル音声信号及び合成Lチャンネル音声信号を多重し、得られたた合成ステレオ音声信号を、対向する音声会議装置に送信するものである。
The audio
第2の実施形態の音声会議装置11の受信構成は、受信分配部31と、Rチャンネル及びLチャンネル用のスピーカ32R、32Lとを有する。
The reception configuration of the audio conference apparatus 11 according to the second embodiment includes a
受信分配部31は、対向する音声会議装置が送信した合成ステレオ音声信号を、合成Rチャンネル音声信号及び合成Lチャンネル音声信号に分離すると共に、分離して得た一対の合成Rチャンネル音声信号及び合成Lチャンネル音声信号をそれぞれ、Rチャンネル及びLチャンネル用のスピーカ32R、32Lに与えるものである。
The receiving / distributing
Rチャンネル及びLチャンネル用のスピーカ32R、32Lはそれぞれ、受信分配部31から与えられた合成Rチャンネル音声信号及び合成Lチャンネル音声信号を発音出力させるものである。
The R-channel and L-
以下、音声会議に供している一方の地点Aの参加者の発音内容を、他方の地点Bの参加者が聴取する場合の動作を説明する。以下の説明においては、地点Aの構成要素の符号には、その末尾に「A」を付与し、地点Bの構成要素の符号には、その末尾に「B」を付与する。 Hereinafter, an operation when the participant at the other point B listens to the pronunciation of the participant at one point A provided for the audio conference will be described. In the following description, “A” is added to the end of the component of the point A, and “B” is added to the end of the reference of the component of the point B.
一方の地点Aの参加者1−nAが発言すると、その発音音声は、音声会議装置11Aのその参加者1−nA用のモノラルマイクロフォン21−nAによって捕捉され、モノラル音声信号が定位処理部41−nAに与えられる。この定位処理部41−nAにより、モノラル音声信号は、方向性が付加されたステレオ音声信号(Rチャンネル音声信号及びLチャンネル音声信号)に変換される。このような方向性が付加されたステレオ音声信号(Rチャンネル音声信号及びLチャンネル音声信号)は、音声多重送信部22によって、他の定位処理部41−1A〜41−NA(但し41−nAを除く)からのステレオ音声信号と、チャンネル別に合成された後、チャンネル多重されて、対向する音声会議装置11Bに向けて送信される。 When the participant 1-nA at one point A speaks, the pronunciation sound is captured by the monaural microphone 21-nA for the participant 1-nA of the audio conference apparatus 11A, and the monaural audio signal is localized processing unit 41- given to nA. By this localization processing unit 41-nA, the monaural audio signal is converted into a stereo audio signal (R channel audio signal and L channel audio signal) to which directionality is added. The stereo audio signal (R channel audio signal and L channel audio signal) to which such directionality is added is transmitted to the other localization processing units 41-1A to 41-NA (41-nA by the audio multiplex transmission unit 22). Are combined with the stereo audio signal from each other, and then channel-multiplexed and transmitted to the opposite audio conference apparatus 11B.
このような送信信号を、音声会議装置11Bの受信分配部31Bが受信する。受信分配部31Bは、対向する音声会議装置11Aが送信した合成ステレオ音声信号を、合成Rチャンネル音声信号及び合成Lチャンネル音声信号に分離すると共に、分離して得た一対の合成Rチャンネル音声信号及び合成Lチャンネル音声信号を、Rチャンネル及びLチャンネル用のスピーカ32R、32Lに与えて発音出力させる。これにより、受信側の各参加者1−1B〜1−NBは、定位処理された合成Rチャンネル音声及び合成Lチャンネル音声を聴取する。
Such a transmission signal is received by the reception distribution unit 31B of the audio conference apparatus 11B. The reception distributor 31B separates the synthesized stereo audio signal transmitted by the opposing audio conference device 11A into a synthesized R channel audio signal and a synthesized L channel audio signal, and a pair of synthesized R channel audio signals obtained by the separation and The synthesized L-channel audio signal is applied to the R-channel and L-
地点Aにおいて、参加者1−nA以外の参加者は発音していない場合であると、受信側の各参加者1−1B〜1−NBが聴取する合成Rチャンネル音声及び合成Lチャンネル音声は、参加者1−nAに係るモノラル音声を定位処理した音声だけとなり、各参加者1−1B〜1−NBは、発音参加者1−nAが誰であるかや、位置等を認識する。 When the participant other than the participant 1-nA does not sound at the point A, the synthesized R channel sound and the synthesized L channel sound that are received by the respective participants 1-1B to 1-NB on the receiving side are: Only the monaural sound related to the participant 1-nA is localized, and each participant 1-1B to 1-NB recognizes who the pronunciation participant 1-nA is, the position, and the like.
上記第2の実施形態によれば、発音者の口元近傍のモノラルマイクロフォンが捕捉したモノラル音声信号を定位処理して方向性を付与したステレオ音声信号に変換して他方の地点に送信するようにしたので、音声信号の発音手段がステレオスピーカであっても、エコーが問題となることがなく、また、ステレオによる聴取であるので、話者や話者の位置なども聴取者が認識し易いものとなっている。 According to the second embodiment, the monaural sound signal captured by the monaural microphone near the mouth of the speaker is localized and converted into a stereo sound signal with directionality and transmitted to the other point. Therefore, even if the sound signal is generated by a stereo speaker, the echo does not become a problem, and since the listening is performed by stereo, the listener and the position of the speaker can be easily recognized by the listener. It has become.
ここで、定位処理を利用しているので、方向性の設定によっては実際の席順と別の仮想的な席順を対向グループに認識させることが可能となり、第1の実施形態に比べて、より多彩な音声会議を実現することが可能となっている。 Here, since the localization process is used, depending on the setting of directionality, it becomes possible to make the opposing group recognize the virtual seating order different from the actual seating order, and it is more versatile than the first embodiment. It is possible to realize a voice conference.
第2の実施形態の変形実施形態としては、各定位処理部41−1〜41−Nが付与する方向性が固定ではなく、可変設定できるものを挙げることができる。すなわち、図示は省略するが、各定位処理部41−1〜41−Nに対し、外部から角度情報D1〜DNを入力でき、各定位処理部41−1〜41−Nはそれぞれ、その角度情報D1〜DNが規定している方向性を付与する。 As a modified embodiment of the second embodiment, the directionality provided by each localization processing unit 41-1 to 41-N is not fixed but can be variably set. That is, although illustration is omitted, angle information D1 to DN can be input from the outside to each of the localization processing units 41-1 to 41-N, and each of the localization processing units 41-1 to 41-N has its angle information. The directionality defined by D1 to DN is given.
このような変形実施形態によれば、発話者の方向性操作に自由度が増し、より臨場感のある音声会議を実現することができる。 According to such a modified embodiment, the degree of freedom is increased in the directional operation of the speaker, and a more realistic voice conference can be realized.
(C)第3の実施形態
次に、本発明の音声会議装置を、多人数二地点間の音声会議システムに適用した第3の実施形態を、図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment in which the audio conference apparatus of the present invention is applied to an audio conference system between two points of a large number of people will be described with reference to the drawings.
図3は、第3の実施形態の音声会議装置の概略構成を示しており、第2の実施形態に係る図2との同一、対応部分には同一符号を付して示している。かかる構成の音声会議装置12が対向している2地点にそれぞれ設けられることにより、第3の実施形態の音声会議システムが構成される。 FIG. 3 shows a schematic configuration of the audio conference apparatus according to the third embodiment, and the same reference numerals are given to the same and corresponding parts as in FIG. 2 according to the second embodiment. The audio conference system 12 according to the third embodiment is configured by providing the audio conference apparatus 12 having such a configuration at two points facing each other.
第3の実施形態の音声会議装置12は、第2の実施形態に比較すると、モノラル音声信号からステレオ音声信号を生成する定位処理部41−1〜41−Nが、バランス処理部(送信側のバランス処理部)51−1〜51−Nに置き換わっている点が異なり、その他の点は、第2の実施形態と同様である。 Compared to the second embodiment, the audio conference device 12 according to the third embodiment includes localization processing units 41-1 to 41-N that generate stereo audio signals from monaural audio signals. (Balance processing unit) 51-1 to 51-N are different, and the other points are the same as in the second embodiment.
n(nは1〜N)番目のバランス処理部51−nは、入力されたモノラル音声信号Snから、Lチャンネル音声信号STn(L)、Rチャンネル音声信号STn(R)を以下の式に従って生成する。 The n (n is 1 to N) -th balance processing unit 51-n generates an L channel audio signal STn (L) and an R channel audio signal STn (R) from the input monaural audio signal Sn according to the following formula. To do.
STn(L)=Sn*(1−An) STn(R)=Sn*An
但し、An=(n−1)/(N−1)
第3の実施形態によれば、第2の実施形態と同様な効果を奏することができる。さらに、第2の実施形態より簡単な処理によって方向性を付与することができる。
STn (L) = Sn * (1-An) STn (R) = Sn * An
However, An = (n-1) / (N-1)
According to the third embodiment, the same effects as those of the second embodiment can be obtained. Furthermore, directionality can be imparted by a simpler process than in the second embodiment.
第3の実施形態の変形実施形態としては、各バランス処理部51−1〜51−Nが付与する方向性が固定ではなく、可変設定できるものを挙げることができる。すなわち、図示は省略するが、各バランス処理部51−1〜51−Nに対し、外部から方向性情報A1〜ANを入力でき、各バランス処理部51−1〜51−Nはそれぞれ、その方向性情報A1〜ANが規定している方向性を付与する。 As a modified embodiment of the third embodiment, the directionality provided by each balance processing unit 51-1 to 51-N is not fixed but can be variably set. That is, although illustration is omitted, directionality information A1 to AN can be input from the outside to each balance processing unit 51-1 to 51-N, and each balance processing unit 51-1 to 51-N has its direction. The directionality defined by the sex information A1 to AN is given.
このような変形実施形態によれば、発話者の方向性操作に自由度が増し、より臨場感のある音声会議を実現することができる。 According to such a modified embodiment, the degree of freedom is increased in the directional operation of the speaker, and a more realistic voice conference can be realized.
(D)第4の実施形態
次に、本発明の音声会議装置を、多人数二地点間の音声会議システムに適用した第4の実施形態を、図面を参照しながら説明する。
(D) Fourth Embodiment Next, a fourth embodiment in which the audio conference apparatus according to the present invention is applied to an audio conference system between two points of a large number of people will be described with reference to the drawings.
図4は、第4の実施形態の音声会議装置の概略構成を示しており、第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。かかる構成の音声会議装置13が対向している2地点にそれぞれ設けられることにより、第4の実施形態の音声会議システムが構成される。 FIG. 4 shows a schematic configuration of the audio conference apparatus according to the fourth embodiment, and the same or corresponding parts as those in FIG. 1 according to the first embodiment are denoted by the same reference numerals. The audio conference system 13 according to the fourth embodiment is configured by providing the audio conference apparatus 13 having such a configuration at two points facing each other.
第4の実施形態の音声会議装置13は、第1の実施形態に比較すると、受信分配部31とヘッドフォン32−1〜32−Nとの間に、バランス処理部(受信側のバランス処理部)61−1〜61−Nが設けられている点、各ヘッドフォン32−1〜32−Nが対応するバランス処理部61−1〜61−Nに距離測定用信号(無線、赤外線等)を送信する機能を有している点が異なっている。
Compared to the first embodiment, the audio conference apparatus 13 according to the fourth embodiment has a balance processing unit (a receiving side balance processing unit) between the
各ヘッドフォン32−1〜32−Nはそれぞれ、左耳受聴部から距離測定用信号を送信すると共に、右耳受聴部から距離測定用信号を送信する。 Each of the headphones 32-1 to 32-N transmits a distance measurement signal from the left ear listening unit and transmits a distance measurement signal from the right ear listening unit.
各バランス処理部61−1〜61−Nはそれぞれ、対応するヘッドフォン32−1〜32−Nの左耳受聴部及び右耳受聴部から送信された距離測定用信号を受信し、左耳受聴部及び右耳受聴部までの距離r1、r2を得て、受信分配部31からのステレオ音声信号(Rチャンネル音声信号R、Lチャンネル音声信号L)を下記のように補正して、補正したステレオ音声信号(Rチャンネル音声信号RM、Lチャンネル音声信号LM)を対応するヘッドフォン32−1〜32−Nに与える。
Each balance processing unit 61-1 to 61-N receives the distance measurement signal transmitted from the left ear listening unit and the right ear listening unit of the corresponding headphones 32-1 to 32-N, and the left ear listening unit. And the distances r1 and r2 to the right ear listening unit, and the stereo audio signals (R channel audio signal R and L channel audio signal L) from the
LM=L*r2/(r1+r2)
RM=R*r1/(r1+r2)
第4の実施形態によれば、第1の実施形態と同様な効果を奏することができる。さらに、聴取者の向きによらずに、話者が同一位置に居るように感じることができ、第1の実施形態より、臨場感のある音声会議が可能となる。
LM = L * r2 / (r1 + r2)
RM = R * r1 / (r1 + r2)
According to the fourth embodiment, the same effect as that of the first embodiment can be obtained. Furthermore, it is possible to feel that the speaker is in the same position regardless of the orientation of the listener, and a voice conference with a sense of reality is possible from the first embodiment.
例えば、聴取者1−nが、図5(A)に示すようにバランス処理部61−nに向いていても、また、図5(B)に示すようにバランス処理部61−nより左側を向いていても、バランス処理部61−nの補正処理により、話者が同一位置に居るように感じることができる。因みに、第1の実施形態の場合、聴取者1−nの向きにより話者が居ると感じる位置も変化するものであった。 For example, even if the listener 1-n is facing the balance processing unit 61-n as shown in FIG. 5A, the listener 1-n is placed on the left side of the balance processing unit 61-n as shown in FIG. Even if it is facing, it can be felt that the speaker is at the same position by the correction processing of the balance processing unit 61-n. Incidentally, in the case of the first embodiment, the position at which the speaker feels changes depending on the direction of the listener 1-n.
第4の実施形態においては、ヘッドフォンとバランス処理部との通信により、聴取者の頭部の向き情報を得るものを示したが、頭部の向きの検出方法はこれに限定されないことは勿論である。また、ステレオ音声信号の頭部向きに応じた補正方法も、上述した式による補正方法に限定されず、頭部向きの検出方法に合わせて、適宜選定すれば良い。 In the fourth embodiment, it has been shown that the head direction of the listener is obtained by communication between the headphones and the balance processing unit. However, the head direction detection method is not limited to this. is there. Also, the correction method according to the head direction of the stereo audio signal is not limited to the correction method based on the above-described formula, and may be appropriately selected according to the head direction detection method.
(E)他の実施形態
第iの実施形態(その変形実施形態を含む)の送信構成と、第j(jはiと異なる)の実施形態(その変形実施形態を含む)の受信構成とを、組み合わせ可能ならば、組み合わせて音声会議装置を実現するようにしても良い。例えば、第3の実施形態の送信構成と、第4の実施形態の受信構成とを有する音声会議装置であっても良い。
(E) Other Embodiments The transmission configuration of the i-th embodiment (including the modified embodiment) and the receiving configuration of the j-th (j is different from i) embodiment (including the modified embodiment). If possible, a voice conference device may be realized by combining. For example, an audio conference device having the transmission configuration of the third embodiment and the reception configuration of the fourth embodiment may be used.
本発明の音声会議装置及び音声会議システムは、テレビ会議などの音声処理部として実現されても良く、単独の音声会議装置として実現されても良い。 The audio conference apparatus and audio conference system of the present invention may be realized as an audio processing unit such as a video conference, or may be realized as a single audio conference apparatus.
10〜13…音声会議装置、21R、21L、21−1〜21−N…マイクロフォン、22…音声多重送信部、31…受信分配部、32−1〜32−N…ヘッドフォン、32R、32L…スピーカ、41−1〜41−N…定位処理部、51−1〜51−N…送信側のバランス処理部、61−1〜61−N…受信側のバランス処理部。
10 to 13: Audio conferencing apparatus, 21R, 21L, 211-1 to 21-N: Microphone, 22: Audio multiplexing transmission unit, 31: Reception distribution unit, 32-1 to 32-N: Headphone, 32R, 32L ... Speaker , 41-1 to 41-N: localization processing unit, 51-1 to 51-N ... balance processing unit on transmission side, 61-1 to 61-N ... balance processing unit on reception side.
Claims (4)
各参加者の口元近傍に設けられる指向性のモノラルマイクロフォンと、
対応するモノラルマイクロフォンからのモノラル音声信号を、当該モノラル/ステレオ変換手段によって定まる方向性が付加されたRチャンネル音声信号及びLチャンネル音声信号でなるステレオ音声信号に変換するモノラル/ステレオ変換手段と、
上記各モノラル/ステレオ変換手段からのRチャンネル音声信号を合成して合成Rチャンネル音声信号を得ると共に、上記各モノラル/ステレオ変換手段からのLチャンネル音声信号を合成して合成Lチャンネル音声信号を得、合成Rチャンネル音声信号及び合成Lチャンネル音声信号を対向する音声会議装置に送信するステレオ音声送信手段と、
Rチャンネル用のスピーカ及びLチャンネル用のスピーカと、
対向する音声会議装置からの合成Rチャンネル音声信号をRチャンネル用の上記スピーカに与えると共に、対向する音声会議装置からの合成Lチャンネル音声信号をLチャンネル用の上記スピーカに与える受信分配手段と
を有することを特徴とする音声会議装置。 In the audio conference apparatus provided at each of the two locations related to the conference, which can accommodate up to N participants (N is 3 or more),
A directional monaural microphone provided near the mouth of each participant;
Monaural / stereo conversion means for converting a monaural audio signal from a corresponding monaural microphone into a stereo audio signal composed of an R channel audio signal and an L channel audio signal to which a direction determined by the monaural / stereo conversion means is added ;
The R channel audio signal from each of the monaural / stereo conversion means is synthesized to obtain a synthesized R channel audio signal, and the L channel audio signal from each of the monaural / stereo conversion means is synthesized to obtain a synthesized L channel audio signal. Stereo audio transmission means for transmitting the synthesized R channel audio signal and the synthesized L channel audio signal to the opposing audio conference device;
An R channel speaker and an L channel speaker;
Receiving and distributing means for providing a synthesized R channel audio signal from the opposite audio conference device to the R channel speaker and providing a synthesized L channel audio signal from the opposite audio conference device to the L channel speaker. An audio conference apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005047369A JP4804014B2 (en) | 2005-02-23 | 2005-02-23 | Audio conferencing equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005047369A JP4804014B2 (en) | 2005-02-23 | 2005-02-23 | Audio conferencing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006237839A JP2006237839A (en) | 2006-09-07 |
JP4804014B2 true JP4804014B2 (en) | 2011-10-26 |
Family
ID=37045038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005047369A Expired - Lifetime JP4804014B2 (en) | 2005-02-23 | 2005-02-23 | Audio conferencing equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4804014B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006048295B4 (en) * | 2006-10-12 | 2008-06-12 | Andreas Max Pavel | Method and device for recording, transmission and reproduction of sound events for communication applications |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9191516B2 (en) * | 2013-02-20 | 2015-11-17 | Qualcomm Incorporated | Teleconferencing using steganographically-embedded audio data |
US11418874B2 (en) | 2015-02-27 | 2022-08-16 | Harman International Industries, Inc. | Techniques for sharing stereo sound between multiple users |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02206272A (en) * | 1989-02-03 | 1990-08-16 | Fujitsu Ltd | Stereo audio conference equipment |
JP2768055B2 (en) * | 1991-06-18 | 1998-06-25 | 株式会社日立製作所 | Conference call service |
JPH05316239A (en) * | 1992-05-08 | 1993-11-26 | Toshiba Corp | Conference system |
JPH08223305A (en) * | 1995-02-15 | 1996-08-30 | Nec Corp | Voice conference system |
JPH09307870A (en) * | 1996-05-16 | 1997-11-28 | Nec Corp | Camera automatic direction controller in video conference system |
JP4499206B2 (en) * | 1998-10-30 | 2010-07-07 | ソニー株式会社 | Audio processing apparatus and audio playback method |
JP2002005675A (en) * | 2000-06-16 | 2002-01-09 | Matsushita Electric Ind Co Ltd | Acoustic navigation apparatus |
JP3435141B2 (en) * | 2001-01-09 | 2003-08-11 | 松下電器産業株式会社 | SOUND IMAGE LOCALIZATION DEVICE, CONFERENCE DEVICE USING SOUND IMAGE LOCALIZATION DEVICE, MOBILE PHONE, AUDIO REPRODUCTION DEVICE, AUDIO RECORDING DEVICE, INFORMATION TERMINAL DEVICE, GAME MACHINE, COMMUNICATION AND BROADCASTING SYSTEM |
-
2005
- 2005-02-23 JP JP2005047369A patent/JP4804014B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2006237839A (en) | 2006-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11991315B2 (en) | Audio conferencing using a distributed array of smartphones | |
US9049339B2 (en) | Method for operating a conference system and device for a conference system | |
US8670583B2 (en) | Hearing aid system | |
US7245710B1 (en) | Teleconferencing system | |
US20080273476A1 (en) | Device Method and System For Teleconferencing | |
US20050281421A1 (en) | First person acoustic environment system and method | |
US20030044002A1 (en) | Three dimensional audio telephony | |
US20050280701A1 (en) | Method and system for associating positional audio to positional video | |
JP2012505617A (en) | Method for rendering binaural stereo in a hearing aid system and hearing aid system | |
WO2007059437A2 (en) | Method and apparatus for improving listener differentiation of talkers during a conference call | |
CN101658050A (en) | Method and apparatus for recording, transmitting and reproducing acoustic events for communication applications | |
JP2020088516A (en) | Video conference system | |
JP4804014B2 (en) | Audio conferencing equipment | |
EP1646215A1 (en) | Stereo mobile terminal and method for calling using the stereo mobile terminal | |
JP2009246528A (en) | Voice communication system with image, voice communication method with image, and program | |
JP3898673B2 (en) | Audio communication system, method and program, and audio reproduction apparatus | |
JP4548147B2 (en) | Audio conferencing system and processing unit for speaker identification | |
US20160302004A1 (en) | Switching to a Second Audio Interface Between a Computer Apparatus and an Audio Apparatus | |
JP2004072354A (en) | Audio teleconference system | |
JP2588793B2 (en) | Conference call device | |
US20100272249A1 (en) | Spatial Presentation of Audio at a Telecommunications Terminal | |
WO2017211448A1 (en) | Method for generating a two-channel signal from a single-channel signal of a sound source | |
JP2019066601A (en) | Acoustic processing device, program and method | |
JP2635684B2 (en) | Stereo audio transmission system | |
JP2010166424A (en) | Multi-point conference system, server device, sound mixing device, and multi-point conference service providing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100219 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100622 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100702 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100910 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4804014 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |