JP2007078545A - Object detection system and voice conference system - Google Patents
Object detection system and voice conference system Download PDFInfo
- Publication number
- JP2007078545A JP2007078545A JP2005267885A JP2005267885A JP2007078545A JP 2007078545 A JP2007078545 A JP 2007078545A JP 2005267885 A JP2005267885 A JP 2005267885A JP 2005267885 A JP2005267885 A JP 2005267885A JP 2007078545 A JP2007078545 A JP 2007078545A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- search
- audio
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
この発明は、スピーカアレイからの音声ビーム及びマイクアレイからの集音ビームを用いて対象物の検出を行う対象物検出装置及び音声会議装置に関する。 The present invention relates to an object detection apparatus and an audio conference apparatus that detect an object using an audio beam from a speaker array and a collected sound beam from a microphone array.
従来、スピーカから出力した音声をマイクロフォンで集音し、集音した音声信号を用いて、障害物や人等の対象物を検出する対象物検出装置が知られている。例えば、特許文献1には、車両の周囲に位置する障害物を検出して運転者に提示する運転支援装置が記載されている。この運転支援装置では、可聴帯域の信号波を送信器(無指向性スピーカ)が広角度に送信する。障害物に当たり反射したこの信号波を複数の受信器(マイク)が配列されて成る受信器アレイ(マイクアレイ)が検出する。
2. Description of the Related Art Conventionally, there is known an object detection device that collects sound output from a speaker with a microphone and detects an object such as an obstacle or a person using the collected sound signal. For example,
このマイクアレイの各マイクで検出した信号波に対して位相補正を行う。すなわち、運転支援装置は、検出領域を複数に区分し、この区分領域からの音声が各マイクに入力されるまでの各遅延時間を各区分領域に応じて記憶する。そして、運転支援装置は、各マイクで検出した信号波に対して対応する区分領域に応じた遅延時間を付与することで位相補正を行う。この位相補正は、全区分領域分だけ行われる。 Phase correction is performed on the signal wave detected by each microphone of the microphone array. That is, the driving support apparatus divides the detection area into a plurality of areas, and stores each delay time until the sound from the division area is input to each microphone according to each division area. And a driving assistance apparatus performs phase correction by providing the delay time according to the division area corresponding to the signal wave detected with each microphone. This phase correction is performed for all the divided areas.
運転支援装置は、位相補正後の各信号を重ね合わせて合成する。これによって、対応する区分領域からの音声成分についてのみ、各信号の位相が合致して強められる。一方、その他の音声成分については位相が合わずに弱められる。このため、対応する区分領域からの音声に特化して集音する(指向性を持つ)集音ビームを形成し、これによって、この区分領域からの音声に特化して集音することができる。 The driving support device combines the signals after phase correction by superimposing them. As a result, only the sound components from the corresponding segmented regions are intensified by matching the phases of the signals. On the other hand, other audio components are weakened because the phases are not matched. For this reason, a sound collecting beam (having directivity) that collects sound specialized to the sound from the corresponding segmented region is formed, and thereby, it is possible to collect sound specialized to the sound from the segmented region.
運転支援装置は、この各区分領域の集音ビームを用いて、各区分領域の音声を集音してこの集音した各音声の強度を示す強度分布を生成する。そして、運転支援装置は、この強度分布において強度が強い位置に障害物があると検出する。この様にして、従来の運転支援装置では障害物の有無及び障害物の位置を検出することができる。
従来の対象物検出装置では、無指向性スピーカを用いて可聴帯域の信号波を広角度に送信する。そして、各区分領域の音声を集音ビームで集音することで、各区分領域の検出音声の強度が取得され、この強度が高い区分領域に障害物等の対象物が位置すると検出される。このため、障害物で反射した音声が障害物のある区分領域の他の区分領域に回りこみノイズとなる。この様な、探査する区分領域の他の領域からのノイズを集音してしまうマルチパスによって、障害物の検出を正確に行うことができない場合がある。 In the conventional object detection device, a signal wave in the audible band is transmitted at a wide angle using an omnidirectional speaker. Then, by collecting the sound of each divided area with the sound collecting beam, the intensity of the detected sound of each divided area is acquired, and it is detected that an object such as an obstacle is located in the divided area having a high intensity. For this reason, the sound reflected by the obstacle wraps around the other partitioned area where the obstacle exists and becomes noise. Obstacles may not be detected accurately due to such multipath that collects noise from other areas to be searched.
そこで、本発明は、上記課題を解決するために、対象物をより正確に検出することができる対象物検出装置及び音声会議装置を提供することを目的としている。 Accordingly, an object of the present invention is to provide an object detection apparatus and an audio conference apparatus that can detect an object more accurately in order to solve the above problems.
上記課題を解決するために本発明では以下の手段を採用している。 In order to solve the above problems, the present invention employs the following means.
(1)本発明は、スピーカアレイに音声信号を入力するとともに、マイクアレイから音声信号を入力する機能を備え、探査用音声信号を生成して前記スピーカアレイに入力する信号生成部と、スピーカアレイからの音声ビームの焦点合わせを行う第1ビーム調整部と、マイクアレイの集音ビームの焦点合わせを行う第2ビーム調整部と、音声ビームの焦点と集音ビームの焦点を重ならせるように第1及び第2ビーム調整部の焦点合わせを制御する指向性制御部と、スピーカアレイから音声が出力されてから焦点位置で反射してマイクアレイに入力されるまでの探査時間を計時する計時部と、前記探査時間に、マイクアレイから入力された音声信号に前記探査用音声信号の成分が含まれるかを探査する探査部と、前記探査部によって前記探査用音声信号の成分が含まれると検出された場合に、前記スピーカアレイから焦点までの音声ビームの経路に対象物があると判断する判断部と、を備えたことを特徴とする対象物検出装置である。 (1) The present invention has a function of inputting an audio signal to a speaker array and inputting an audio signal from a microphone array, generating a search audio signal and inputting the audio signal to the speaker array, and the speaker array A first beam adjusting unit for focusing the sound beam from the sound source, a second beam adjusting unit for focusing the sound collecting beam of the microphone array, and the focus of the sound beam and the sound collecting beam are overlapped with each other. A directivity control unit that controls the focusing of the first and second beam adjustment units, and a time measuring unit that measures the search time from when the sound is output from the speaker array until it is reflected at the focal position and input to the microphone array A search unit for searching whether the audio signal input from the microphone array includes a component of the search audio signal at the search time; and An object detection apparatus comprising: a determination unit configured to determine that there is an object in a path of an audio beam from the speaker array to a focus when it is detected that a component of a voice signal is included. is there.
上記本発明の構成によれば、信号生成部によって、探査用音声信号が生成されてスピーカアレイに入力される。このスピーカアレイからの探査用音声信号の音声(探査用音声)の焦点合わせが第1ビーム調整部によって行われる。これとともに、マイクアレイからの集音ビームの焦点合わせが第2ビーム調整部によって行われる。ここで、この音声ビーム及び集音ビームの焦点は重なるように指向性制御部によって制御される。 According to the configuration of the present invention, the search sound signal is generated and input to the speaker array by the signal generator. The first beam adjustment unit focuses the sound of the sound signal for search from the speaker array (sound for search). At the same time, the second beam adjustment unit performs focusing of the collected sound beam from the microphone array. Here, the focal points of the sound beam and the sound collecting beam are controlled by the directivity control unit so as to overlap.
対象物が音声ビームの出力方向に位置する場合に、この対象物に音声ビームが反射するが、焦点位置の近傍であれば、この反射音が集音ビームによって集音される。探査部によって、マイクアレイから入力された音声信号に探査用音声信号の成分が含まれるかが探査される。そして、探査部によって探査用音声信号の成分が含まれると検出された場合に、スピーカアレイから焦点までの音声ビームの経路に対象物があると判断される。 When the object is located in the output direction of the sound beam, the sound beam is reflected by the object. If the object is near the focal position, the reflected sound is collected by the sound collecting beam. The search unit searches for whether or not the audio signal input from the microphone array includes the component of the search audio signal. Then, when the search unit detects that the component of the audio signal for search is included, it is determined that there is an object in the path of the audio beam from the speaker array to the focal point.
この様に、従来技術のように無指向性スピーカではなくスピーカアレイを用いて音声ビームを出力するため、探査範囲外の領域(方向)に音声が出力されず、探査範囲外の反射音がマイクに周り込むマルチパスを効果的に防止することが可能となる。 As described above, since the sound beam is output using the speaker array instead of the omnidirectional speaker as in the prior art, the sound is not output to the region (direction) outside the search range, and the reflected sound outside the search range is It is possible to effectively prevent multipaths that wrap around.
また、スピーカアレイから出力した音声が焦点位置で反射してマイクアレイに入力されるまでの探査時間が、計時部によって計時される。そして、探査部によって、計時時間に限って、マイクアレイから入力された音声信号に探査用音声信号の成分が含まれるかが探査される。これによって、焦点位置を越えた位置で反射した反射音をマイクアレイで受信してしまい、対象物を誤検出してしまうことが防止される。 In addition, the search time until the sound output from the speaker array is reflected at the focal position and input to the microphone array is measured by the timer unit. Then, the search unit searches for whether or not the audio signal input from the microphone array includes the component of the search audio signal only during the time measurement. Accordingly, it is possible to prevent the reflected sound reflected at the position beyond the focal position from being received by the microphone array and erroneously detecting the object.
(2)本発明は、上記対象物検出装置において、前記判断部は、音声ビームのスピーカアレイからの出力タイミング、マイクアレイへの探査用音声信号の成分の入力タイミング及び音声ビームの出力方向を用いて、前記対象物の位置を検出する。 (2) In the above object detection apparatus according to the present invention, the determination unit uses the output timing of the sound beam from the speaker array, the input timing of the component of the sound signal for exploration to the microphone array, and the output direction of the sound beam. Then, the position of the object is detected.
この構成によれば、音速及び上記出力タイミングと入力タイミングを用いてスピーカアレイやマイアレイからの対象物の距離を測定することが可能となる。また、音声ビームの出力方向によって対象物の位置方向を測定することが可能となる。このため、対象物の距離及び位置方向から対象物の位置を検出することが可能となる。 According to this configuration, it is possible to measure the distance of the object from the speaker array or the my array using the sound speed and the output timing and input timing. Further, the position direction of the object can be measured by the output direction of the sound beam. For this reason, it is possible to detect the position of the object from the distance and the position direction of the object.
(1)で上述したように、無指向性スピーカを用いる従来技術と比較して、対象物の位置方向をより正確に測定することが可能である。また、対象物の距離も正確に測定することができるため、従来より正確に対象物の検出位置を測定することが可能となる。 As described above in (1), it is possible to measure the position direction of the object more accurately as compared with the conventional technique using an omnidirectional speaker. In addition, since the distance of the object can be accurately measured, the detection position of the object can be measured more accurately than before.
(3)本発明は、上記対象物検出装置において、前記信号生成部は、非周期的なパルス列を探査用音声信号として生成する。これによって、判断部が探査用音声信号の成分の入力タイミングを取得することが容易になる。すなわち、周期的なパルス列が探査用音声信号として用いられると、所定周期(例えば1周期)ずれた位置からのパルス形状が開始位置からのパルス形状と同様になる。このため、マイクアレイからの探査用音声信号の入力開始タイミングの誤検出が行われ易い。 (3) In the object detection device according to the present invention, the signal generation unit generates an aperiodic pulse train as a search audio signal. This facilitates the determination unit to acquire the input timing of the component of the search audio signal. That is, when a periodic pulse train is used as the search audio signal, the pulse shape from a position shifted by a predetermined cycle (for example, one cycle) becomes the same as the pulse shape from the start position. For this reason, erroneous detection of the input start timing of the exploration audio signal from the microphone array is likely to be performed.
一方、非周期的なパルス列が探査用音声信号として用いられると、ずれた位置からのパルス形状も開始位置からのパルス形状とは異なることになるため、探査用音声信号の成分の入力タイミングの取得が周期的なパルス列の探査用音声信号を用いる場合と比較して容易になる。 On the other hand, when a non-periodic pulse train is used as a sound signal for exploration, the pulse shape from the shifted position will be different from the pulse shape from the start position. However, this is easier than using a periodic pulse train search audio signal.
(4)本発明は、上記対象物検出装置において、請求項1〜3の何れかに記載の対象物検出装置を用いた音声会議装置であって、信号生成部は、探査用音声信号として可聴音の周波数成分から成る音声信号を生成し、判断部は、前記対象物として会議出席者を検出することを特徴とする音声会議装置。
(4) The present invention is the audio conference device using the object detection device according to any one of
上記本発明の構成によれば、信号生成部によって、探査用音声信号として可聴音の周波数成分から成る音声信号が生成される。この探査用音声によって会議出席者の位置方向が検出される。音声会議装置は、可聴音を出力するための構成は通常備える。本発明では、可聴音の周波数成分から成る音声信号が用いられるため、音声会議装置が通常備える可聴音を出力する構成を用いて探査用音声を出力することが可能となる。また、可聴音は直進性が弱いが、スピーカアレイによって音声ビームとして出力されるため、この直進性の弱さを補うことが可能となる。 According to the configuration of the present invention, the signal generation unit generates an audio signal composed of the frequency component of the audible sound as the search audio signal. The position and direction of the attendees of the conference are detected by the search voice. Audio conferencing devices typically have a configuration for outputting audible sounds. In the present invention, since an audio signal composed of frequency components of audible sound is used, it is possible to output search sound using a configuration that outputs audible sound that is normally provided in an audio conference apparatus. In addition, the audible sound is weak in straightness, but is output as a sound beam by the speaker array, so that this weakness in straightness can be compensated.
本発明によれば、スピーカアレイを用いて音声ビームを出力するため、探査範囲外に音声が出力されず、探査範囲外の反射音を集音してしまうマルチパスを効果的に防止することができる。また、スピーカアレイから出力した音声信号が焦点位置で反射してマイクアレイに入力されるまでの計時時間に限って、マイクアレイから入力された音声信号に探査用音声信号の成分が含まれるかが探査される。これによって、焦点位置を越えた位置で反射した反射音をマイクアレイで受信してしまうマルチパスを効果的に防止し、対象物を誤検出してしまうことを防止することができる。 According to the present invention, since the sound beam is output using the speaker array, it is possible to effectively prevent multipath that does not output sound outside the search range and collects reflected sound outside the search range. it can. Also, whether the audio signal input from the microphone array contains the component of the audio signal for exploration only during the time measured until the audio signal output from the speaker array is reflected at the focal position and input to the microphone array. Explored. As a result, it is possible to effectively prevent multipath in which reflected sound reflected at a position beyond the focal position is received by the microphone array, and to prevent erroneous detection of an object.
上述のように、探査範囲の他の領域(方向)での反射音のマルチパスを効果的に防止することができるとともに、焦点位置を越えた位置での反射音のマルチパスを効果的に防止することができるため、対象物の検出の正確さを向上させることができる。 As described above, multipath of reflected sound in other areas (directions) of the search range can be effectively prevented, and multipath of reflected sound at positions beyond the focal position can be effectively prevented. Therefore, the accuracy of detection of the object can be improved.
図1〜図6を参照して本発明の実施形態である音声会議装置について詳細に説明する。音声会議装置1は、遠隔地にある他の(相手方の)音声会議装置1(区別するために相手方装置1´と記載する)との間で通話信号の送受信を行うことで、本音声会議装置1のユーザ(会議出席者h)と相手方装置1´を使用する相手方話者との間で音声会議を行うための装置である。
With reference to FIGS. 1-6, the audio conference apparatus which is embodiment of this invention is demonstrated in detail. The
図1は、音声会議装置1を上方から見た外観及び音声会議用音声の伝搬及び集音範囲を示す図である。本図では、音声会議装置1は、会議机上に配置されることで、着座した会議出席者hの頭部近傍の高さ位置で配置されている。なお、本図において、音声会議装置1の前方側を−Y側、後方側をY側、右側をX側、左側を−X側と記載する。
FIG. 1 is a diagram showing the appearance of the
音声会議装置1は、長尺の略直方体状である筐体1Aを備え、この筐体1Aの−Y側の上段にスピーカアレイ2を備える。なお、スピーカアレイ2は筐体1Aに内蔵されているため、本来外観視できないが、同図では、説明の便宜のため透視的に記載している。また、同様に説明の便宜のため、スピーカアレイ2を−Y側ではなくY側に記載している。
The
スピーカアレイ2は、長尺方向に亘ってライン状に配列された8個のスピーカユニットSP(SP1〜SP8)から成る。各スピーカユニットSPは−Y側に放音面が位置する様に配置され、スピーカユニットSP1〜SP8に音声信号が入力されると、スピーカアレイ2から音声ビームが−Y方向に向かうように出力される。このスピーカアレイ2からの音声ビームは、相手方装置1´から受信した相手方通話者の音声を内容とする。
The
各スピーカユニットSPに入力する音声信号に付加する遅延時間によって、スピーカアレイ2からの音声ビームの指向性(指向方向及び指向範囲)を制御することができる。すなわち、各スピーカユニットSPからの音声が同タイミングで焦点Pに到達するような遅延時間(図中の太字矢印で示す時間)を各スピーカユニットSPに入力する各信号に付加する。これによって、焦点Pに音声ビームを指向させるように焦点合わせを行うことができる。
The directivity (directivity direction and directivity range) of the sound beam from the
この様にして、スピーカアレイ2からの音声ビームを会議出席者h(h1〜h3)を含む狭い指向範囲で指向させることで、会議出席者hのみに対して会議用音声を提供することができる。すなわち、会議出席者hの他の者に対する会議用音声の音漏れを効果的に防止することができ、会議室ではなく通常のオフィスルームで遠隔地との間で音声会議を行っても、オフィスルームの会議出席者の他の者の業務を妨げない。
In this way, by directing the sound beam from the
また、筐体1Aの−Y側の下段、すなわちスピーカアレイ2の下段にはマイクアレイ3が配設されている。なお、マイクアレイ3は筐体1Aに内蔵されているため、本来外観視できないが、同図では、説明の便宜のため透視的に記載している。また、正確にはスピーカアレイ2がマイクアレイ3の上側に重なって位置するが、同図では、説明の便宜のためスピーカアレイ2とマイクアレイ3とが水平方向で並列するように図示する。
Further, a
マイクアレイ3は、長尺方向に亘ってライン状に配列された8個のマイクM(M1〜M8)から成る。各マイクMは集音側が−Y側に向くように配置されている。マイクアレイ3は、所定の探査位置への指向性を持たせた集音ビームによって探査位置の音声に特化して音声を集音することができる。すなわち、音声会議装置1は、探査位置からの音声が各マイクMに至るまでの各遅延時間を記憶し、各マイクMで集音した音声信号に対して対応する遅延時間で位相調整を行う。この位相調整によって、探査位置からの音声成分については、各マイクMで集音した音声信号同士の位相が一致することになる。
The
一方、探査位置から離れた位置からの音声成分については、位相調整後の各マイクMで集音した音声信号同士の位相が不一致になる。このため、各マイクMで集音した音声信号同士を位相調整後に重ね合わせて合成することにより、探査位置からの音声成分が強められ、探査位置から離れた位置に由来する音声成分ほど弱められる。これによって、マイクアレイ3によって、探査位置の音声に特化して音声を集音することができる。
On the other hand, for audio components from positions away from the search position, the phases of the audio signals collected by the respective microphones M after phase adjustment become inconsistent. For this reason, by combining the audio signals collected by the microphones M after phase adjustment, the audio components from the search position are strengthened, and the audio components originating from a position away from the search position are weakened. As a result, the
本音声会議装置1では、会議出席者hの位置に集音ビームの焦点合わせが行われる。これによって、会議出席者hの音声のみに特化して集音することができ、環境音等のノイズを集音してしまうことによって会議出席者hの音声が聴こえにくくなることが効果的に防止される。
In the
また、会議出席者hが複数居る場合、例えば同図のように3人の会議出席者h1〜h3が居る場合には、この3人の会議出席者h1〜h3の位置(位置P1〜P3)に集音ビームの焦点合わせを行う。そして、音声会議装置1は、集音した位置P1〜P3の各音声の強度を比較して、強度に応じて位置P1〜P3の各音声の重み付けをつけて加算合成する。
Further, when there are a plurality of meeting attendees h, for example, when there are three meeting attendees h1 to h3 as shown in the figure, the positions of these three meeting attendees h1 to h3 (positions P1 to P3). Focus the sound collecting beam. Then, the
この加算合成後の音声信号は、音声会議装置1から相手方装置1´に出力される。これによって、相手方装置1´には、会議出席者hの音声に特化した通話音声を送信することができる。この様にして、ノイズ成分によって会議出席者hの音声が聴こえにくくなることを効果的に防止し、本音声会議装置1と相手方装置1´との間で好適に音声会議を行わせることができる。
The voice signal after the addition synthesis is output from the
上述したように、本実施形態では、音声会議装置1を用いて相手方装置1´との間で音声会議を行うときに、スピーカアレイ2から会議出席者hの位置に焦点Pが合うように音声ビームが出力される。また、会議出席者hの位置に集音ビームの焦点合わせを行う。このために、音声会議装置1は、音声会議前に、会議出席者h(対象物)の位置を音声会議前に予め検出する処理(位置検出処理)を行う。音声会議装置1は、この位置検出処理によって取得した会議出席者hの位置を用いて音声ビーム及び集音ビームの焦点合わせを行う。
As described above, in the present embodiment, when a voice conference is performed with the
以下図2を用いて、音声会議装置1の実行する位置検出処理を説明する。図2は、位置検出処理が実行されている場合の音声ビームの伝搬範囲及び集音ビームの集音範囲を示す図である。音声会議装置1はスピーカアレイ2から探査用音声を音声ビームとして出力する。ここで、位置検出処理では、スピーカアレイ2からの音声ビームの焦点Pの位置及びマイクアレイ3の集音ビームの焦点位置が重なるように焦点合わせが行われる。
Hereinafter, a position detection process executed by the
これによって、音声ビームの出力方向に会議出席者hが居る場合には、この会議出席者hに音声ビームが反射して集音ビームによって集音される。このスピーカアレイ2からの探査用音声の出力タイミングからマイクアレイ3による探査用音声の入力タイミングとを用いて、下記式(1)により会議出席者hから音声会議装置1の前方側面までの距離L1を測定することができる。
As a result, when there is a meeting attendee h in the output direction of the sound beam, the sound beam is reflected by the meeting attendee h and collected by the sound collecting beam. Using the search sound output timing from the
距離L1=時間t1/2×C・・・式(1)
なお、時間t1は探査用音声の出力タイミングからマイクアレイ3による探査用音声の入力タイミングまでの時間であり、Cは音速である。
Distance L1 = time t1 / 2 × C (1)
The time t1 is the time from the search sound output timing to the search sound input timing by the
そして、音声ビームの出力方向と距離L1を用いて、会議出席者hの位置を検出することができる。この様にして、スピーカアレイ2によって音声ビームを出力し、この音声ビームの反射音を集音ビームで集音することで、会議出席者hの位置検出を行う。このため、音声ビームの伝播範囲(探査範囲)外に音声が出力されず、探査範囲外の反射音を集音してしまうマルチパスを効果的に防止することができる。
Then, the position of the meeting attendee h can be detected using the output direction of the sound beam and the distance L1. In this way, the
また、位置検出処理では、音声会議装置1は音声ビームの焦点Pで反射した反射音声が集音されるまでの探査時間t2を下記式(2)を用いて算出する。そして、この探査時間t2内でのみマイクアレイ3からの入力信号に探査用音声の成分が含まれるか判断される。これによって、焦点Pで焦点した後に更に前方(同図の−Y方向)に伝播した音声ビームが会議出席者hの他の物や者に反射し、この反射音が集音されるマルチパスを防止することができる。
In the position detection process, the
t2=L2/C×2・・・式(2)
なお、L2は、各マイクMのうち最も焦点Pに遠いマイクMの位置から焦点Pまでの距離である。最も焦点Pに遠いマイクMを基準としたのは、最も焦点Pに遠いマイクMで焦点Pからの反射音が入力された状態でなければ、各マイクMからの各入力信号を位相調整して加算合成することで、焦点Pに指向性を持つ集音ビームを形成することができないからである。
t2 = L2 / C × 2 Formula (2)
L2 is the distance from the position of the microphone M farthest from the focal point P to the focal point P among the microphones M. When the microphone M farthest from the focal point P is used as a reference, if the reflected sound from the focal point P is not input by the microphone M farthest from the focal point P, the phase of each input signal from each microphone M is adjusted. This is because a sound collecting beam having directivity at the focal point P cannot be formed by the addition synthesis.
上述したように、会議出席者hの検出範囲は、音声会議装置1と焦点Pとの間の領域に限定される。もっとも、音声会議装置1と焦点Pとの間の領域であっても、集音ビームによって集音されるため、焦点Pから離れる程集音しにくくなる。このため、会議出席者hの位置が焦点Pの近傍位置である場合に有効な位置検出方法である。
As described above, the detection range of the conference attendee h is limited to the area between the
上述した様な位置検出方法が、焦点Pの位置を探査領域内(会議出席者が着座する可能性のあるエリア)で移動させながら実行される。これによって、探査領域内において会議出席者の位置を検出することができる。なお、同図では焦点Pは奥行き方向の位置を維持しながら左右方向にスライドする様に移動されているが、奥行き方向の位置を移動させてもよい。上述したように、焦点Pから離れる程集音しにくくなるため、この構成によると、より正確に会議出席者hの位置を検出することができる。 The position detection method as described above is executed while moving the position of the focal point P within the search area (an area where a conference attendee may be seated). As a result, the position of the conference attendee can be detected in the search area. In the figure, the focal point P is moved so as to slide in the left-right direction while maintaining the position in the depth direction, but the position in the depth direction may be moved. As described above, the farther away from the focal point P, the less likely it is to collect sound, so this configuration makes it possible to detect the position of the meeting participant h more accurately.
図3は、図1で示す音声会議装置1の構成を概略的に示すブロック図である。装置本体1Aには、相手方装置1´からの受信音声を出力するための構成として、スピーカユニットSP1〜SP8の他に、入出力インタフェース11、エコーキャンセラ12、遅延部13、D/A(digital/analog)コンバータ14及びアンプ15及びコントロール部16を備える。
FIG. 3 is a block diagram schematically showing the configuration of the
入出力インタフェース11は、接続端子17に接続された通信ケーブル(図略)等を介して、この通信ケーブルに接続された相手方装置1´との間でデジタル音声信号の送受信を行う。エコーキャンセラ12は、相手方装置1´から入出力インタフェース11を介して受信した通話音声信号(受信音声信号)が入力される。エコーキャンセラ12は、この入力信号を用いて、スピーカアレイ2から出力されてマイクアレイ3に帰還されるエコー成分を擬似した擬似信号を生成する。そして、エコーキャンセラ12は、マイクアレイ3から入力した音声信号(後述)から擬似信号を除去することでエコー成分を除去する。
The input / output interface 11 transmits / receives a digital audio signal to / from a
遅延部13は、本願発明の第1ビーム調整部に対応し、スピーカユニットSP1〜SP8の個数分だけ(8個)設けられている。以下、それぞれの遅延部13を区別する場合には、スピーカユニットSP1〜SP8のうち対応するものと同様の数字を添え字として付す。例えば、スピーカユニットSP1に対応する遅延部13は、遅延部13−1と記載する。遅延部13−1〜13−8は、それぞれD/Aコンバータ14に受信音声信号を入力する。
The
遅延部13−1〜13−8は、それぞれエコーキャンセラ12から受信音声信号が入力される。遅延部13−1〜13−8には、それぞれ遅延時間D1〜D8が設定されている。遅延部13−1〜13−8は、入力された受信音声信号を遅延時間D1〜D8だけ遅延させて、D/Aコンバータ14を介して対応するアンプ15に入力することで、音声ビームの焦点合わせを行う。すなわち、入力した受信音声信号に付与する遅延時間D1〜D8の値によって、遅延部13−1〜13−8は音声ビームの焦点Pが会議出席者hの位置になるように焦点合わせを行う。
Each of the delay units 13-1 to 13-8 receives the received audio signal from the
遅延時間D1〜D8の値によって音声ビームの指向性が制御される原理を説明する。各スピーカユニットからは放射状(円形)に伝播するように音声が出力される。各遅延時間D1〜D8を同じ時間とし、各スピーカユニットからの各音声が同時に出力されると、互いに平行に向かって伝播する成分のみが位相が一致して強め合う。そして、この他の方向に伝播する成分は隣接するスピーカユニットSPからの音声同士で干渉し合って打ち消される。これによって、スピーカユニットSP1〜SP8からの合成音声は音声ビームとなる。この音声ビームは正面方向に指向するとともに、焦点Pでのビーム幅がスピーカユニットSP1−スピーカユニットSP8間の距離と略同幅になる。 The principle that the directivity of the sound beam is controlled by the values of the delay times D1 to D8 will be described. Sound is output from each speaker unit so as to propagate radially (circular). When the delay times D1 to D8 are set to the same time and the sounds from the speaker units are simultaneously output, only the components propagating parallel to each other are in phase and intensified. The components propagating in the other direction interfere with each other from the adjacent speaker units SP and are canceled out. Thereby, the synthesized speech from the speaker units SP1 to SP8 becomes an audio beam. The sound beam is directed in the front direction, and the beam width at the focal point P is substantially the same as the distance between the speaker unit SP1 and the speaker unit SP8.
これに対して、各遅延時間D1〜D8を同じ時間とするのではなく、各スピーカユニットSPからの音声が焦点Pに同時にかつ所定のビーム幅で到達するような遅延時間(例えば図1の太字矢印で示す遅延時間)に遅延時間D1〜D8を設定することで、焦点Pに焦点するように制御することができる。 On the other hand, the delay times D1 to D8 are not set to the same time, but the delay times (for example, bold letters in FIG. 1) for the sound from the speaker units SP to reach the focal point P simultaneously and with a predetermined beam width. By setting the delay times D1 to D8 in (delay time indicated by an arrow), the focus P can be controlled.
D/Aコンバータ14は、遅延部13の個数だけ設けられている。これらのD/Aコンバータ14(14−1〜14−8)は、それぞれ対応する遅延部13から遅延時間の付与された受信音声信号が入力される。D/Aコンバータ14−1〜14−8は入力された受信音声信号をデジタル信号からアナログ信号に変換して対応するアンプ15に入力する。
There are as many D /
アンプ15は、入力された音声信号の信号レベルを増幅する。アンプ15は、スピーカユニットSP1〜SP8に対応する個数だけ設けられている。以下、それぞれのアンプ15を区別する場合には、スピーカユニットSP1〜SP8のうち対応するものと同様の数字を添え字として付す。
The
アンプ15−1〜アンプ15−8は、遅延部13−1〜13−8からD/Aコンバータ14(14−1〜14−8)を介して受信音声信号が入力される。アンプ15−1〜アンプ15−8は、入力された受信音声信号の信号レベルを増幅して対応するスピーカユニットSP1〜SP8に入力する。これによって、スピーカユニットSP1〜SP8から受信音声信号の音声が放音され、相手方装置1´からの相手方の話声が放音される。 The amplifier 15-1 to amplifier 15-8 receives the received audio signal from the delay units 13-1 to 13-8 via the D / A converter 14 (14-1 to 14-8). The amplifiers 15-1 to 15-8 amplify the signal level of the input reception audio signal and input the amplified signal levels to the corresponding speaker units SP1 to SP8. As a result, the voice of the received voice signal is emitted from the speaker units SP1 to SP8, and the voice of the other party from the other party apparatus 1 'is emitted.
コントロール部16は、例えばCPU(Central Processing Unit)やメモリ等の記憶部、操作部等のユーザインタフェース等を備える。メモリに記憶されたプログラムを実行することで、コントロール部16は例えば音声会議装置1´との間の通話等、音声会議装置1の各部の動作を制御する。例えば、コントロール部16は、位置検出処理を実行することで、会議出席者hの位置を検出する。そして、コントロール部16はこの検出した位置に音声ビームが焦点となるような遅延時間D1〜D8を算出して遅延部13−1〜13−8に設定する。
The
また、音声会議装置1は、相手方装置1´に会議出席者hの音声信号を出力するための構成として、マイクアレイ3及び上記構成に加えて、マイクアンプ21、A/D変換部22、集音ビーム形成部23、バンドパスフィルタ24及び信号処理部25を備える。
In addition to the
マイクアンプ21は、マイクアレイ3の各マイクMで集音した音声の各信号がマイクアレイ3から入力され、この各入力信号を増幅する。A/D変換部22は、マイクアンプ21から入力された増幅後の各アナログ信号をデジタル信号に変換する。A/D変換部22は変換後の各デジタル信号を集音ビーム形成部23に入力する。
The
集音ビーム形成部23は、本願発明の第2ビーム調整部に対応し、位相補正部231及び加算部232を備える。位相補正部231は、A/D変換部22から入力した各デジタル信号の位相調整を行い、加算部232は位相補正後の各デジタル信号を加算合成する。この位相調整は、上述したように、探査位置からの音声が各マイクMに至るまでの遅延時間D11〜D18を用いて行われる。これによって、入力信号のうち探査位置からの音声成分の位相を合致させ、その他の成分の位相を不一致にさせることができる。
The sound collection
このため、加算合成後の各デジタル信号は、探査位置からの音声成分のレベルが強められ、その他の成分のレベルは弱められることになる。これによって、探査位置からの音声に特化して音声を集音することができる集音ビームが形成される。この探査位置は、上述したように、会議出席者hの位置とされる。 For this reason, in each digital signal after addition synthesis, the level of the sound component from the search position is strengthened, and the levels of the other components are weakened. As a result, a sound collecting beam is formed that can collect the sound specifically for the sound from the search position. This search position is the position of the meeting attendee h as described above.
集音ビーム形成部23は、複数チャンネル用意され(ここでは、集音ビーム形成部23A〜23Cの3チャンネル)、各チャンネル23A〜23Cは会議出席者h1〜h3の位置に焦点する集音ビームを形成する。この各チャンネル23A〜23Cによる加算合成後の各音声信号はそれぞれバンドパスフィルタ24に入力される。
The sound collecting
なお、位相補正部231は、例えば、シフトレジスタ等の遅延時間バッファメモリ(図略)等で実現される。遅延時間バッファメモリは、A/D変換部22から入力した各デジタル信号を格段に記憶するとともに、この記憶された値が位相補正の分だけ遅延させて読み出されて加算部232に入力される。これによって、所定の遅延時間で位相補正を行うことができるようになっている。また、この位相補正はコントロール部16によって制御される。すなわち、コントロール部16は後述する位置検出処理によって会議出席者hの位置を検出し、この検出位置を焦点位置とする集音ビームを形成するように位相補正を制御する。
The phase correction unit 231 is realized by, for example, a delay time buffer memory (not shown) such as a shift register. The delay time buffer memory stores each digital signal input from the A /
バンドパスフィルタ24は、入力した音声信号に対して、人の音声の周波数帯域の他の周波数帯域をカットするためのフィルタ係数を畳み込み演算して信号処理部25(本願発明の探査部に対応)に入力する。これによって、人の音声の周波数帯域の成分のみが抽出されて信号処理部25に入力される。
The band-
信号処理部25には、会議出席者h1〜h3それぞれの位置に特化して集音された各音声信号が各チャンネル23A〜23Cからバンドパスフィルタ24を介して入力される。信号処理部25は、入力された各音声信号のレベルを比較し、このレベル比に応じた重み付けで、各音声信号を加算合成する。信号処理部25は、加算合成後の音声信号(送信音声信号)をエコーキャンセラ12に入力する。これによって、発言している会議出席者h1の位置の音声信号を送信音声信号に多く反映させることができる。なお、信号処理部25は、例えばDSP等で実現される。
Audio signals collected specifically for the positions of the conference attendees h1 to h3 are input to the
エコーキャンセラ12では、上述した様に、信号処理部25から入力された通話音声信号から擬似信号を除去することでエコー成分が除去される。このエコー成分の除去後の通話音声信号は、入出力インタフェース11及び接続端子17を介して相手方装置1´に送信される。これによって、本音声会議装置1´で集音した音声が相手方装置1´に入力されて、相手方との間で音声会議を行うことができる。
In the
更に、音声会議装置1は、探査用信号生成部26(本願発明の信号生成部に対応)を備え、この探査用信号生成部26及び上述した各部の構成を用いて位置検出処理を実行する。以下に位置検出処理における各部の機能を説明する。
Furthermore, the
コントロール部16は、記憶したプログラムの実行によって、指向性制御部161、位置検出部162、タイマ163及び位置記憶部164として機能する。
The
指向性制御部161は、音声ビームの焦点が所定の探査位置になるように遅延部13−1〜13−8それぞれに設定する遅延時間D1〜D8を算出して遅延部13−1〜13−8に設定する。これとともに、指向性制御部161は、音声ビームの焦点位置に重なる位置に集音ビームを焦点させるように位相補正部231に設定する遅延時間D11〜D18を算出して位相補正部231に設定する。なお、遅延時間D11〜D18は集音ビーム形成部23A〜23Cのうち1チャンネルにのみ設定されればよい。
The
位置検出部162は、本願発明の判断部に対応し、探査用信号生成部26に探査用音声信号の生成を指示するとともに、タイマ163(本願発明の計時部に対応)を作動させて計時を開始させる。位置検出部162は、音声ビームをスピーカアレイ2から出力(探査用音声信号を発生)して焦点位置で反射してマイクアレイ3で集音されるまでの時間、すなわち上述した探査時間t2を算出する。そして、位置検出部162は、計時開始時から探査時間t2が経過するまでの間だけ信号処理部25に探査用音声成分の検出を行わせる。これによって、上述したように焦点より奥行き方向に位置する物や者に反射した探査用音声がマイクアレイ3に入力され、会議出席者hが居ると誤検出されることが効果的に防止される。
The
また、位置検出部162は、信号処理部25が探査用音声成分を検出したときに、検出開始タイミングの通知を受ける。位置検出部162は、探査用音声信号の発生時から探査用音声成分の検出の通知時までの時間を時間t1として、上述した式(1)を用いて、会議出席者hから音声会議装置1の前方側面までの距離L1を算出する。
In addition, the
なお、距離L1の算出において、時間を無視できる程の軽微な時間であるため、探査用音声信号の生成からスピーカアレイ2に入力されるまでの時間、及びマイクアレイ3に探査用音声が入力されて探査用音声成分が信号処理部25で検出されるまでの時間が無視される。しかしながら、無視できない程長時間である場合にはこの時間分補正を行った上で距離L1を算出してもよい。
In calculating the distance L1, the time is negligible so that the time can be ignored. Therefore, the time from the generation of the search audio signal to the input to the
位置検出部162は、算出した距離L1と音声ビームの出力方向とを用いて会議出席者hの位置検出を行う。位置検出部162は検出した位置を位置記憶部164に記憶させる。なお、位置検出処理の終了後には、指向性制御部161は、検出した位置に音声ビーム及び集音ビームを焦点させるような遅延時間D1〜D8,D11〜D18を算出して、遅延部13及び位相補正部231に設定する。これによって、会議出席者h1の位置に音声ビームが焦点するとともに集音ビームが焦点し、会議出席者h1の位置に指向性を持たせて音声ビームを出力することができるとともに、会議出席者h1の位置からの音声に特化して集音することができる。このため、相手方装置1´を用いる相手方との間で好適に音声会議を行うことができる。
The
探査用信号生成部26は、位置検出部162の指示によって、探査用音声信号を生成して各遅延部13−1〜13−8に入力する。この探査用音声信号は、可聴音の周波数成分から成る。これによって、音声会議装置1が音声会議を行うために通常備えるスピーカアレイ2やD/Aコンバータ14の構成を用いて探査用音声を出力することができる。なお、可聴音は直進性が悪いが、この直進性の悪さはスピーカアレイ2によって音声ビームとして出力されることで補うことができる。
The search
また、探査用音声信号は、非周期的なパルス列で構成される。この非周期的なパルス列の生成方法の一例を以下に説明する。図4は、探査用音声信号の生成方法を説明するための図である。まず、探査用信号生成部26は、波形a1で示すような連続的した波形のデジタル音声信号(搬送波信号)を生成する。探査用信号生成部26は、搬送波信号とともに、擬似乱数系列b1を発生させる。この擬似乱数系列b1は、例えばM系列やゴールド符号等を用いた2値の乱数である。
The search audio signal is composed of an aperiodic pulse train. An example of this non-periodic pulse train generation method will be described below. FIG. 4 is a diagram for explaining a method for generating an audio signal for search. First, the
そして、探査用信号生成部26は擬似乱数系列b1で搬送波信号をオンオフ(振幅変調)して、探査用音声信号c1を生成する。具体的には、探査用信号生成部26はクロックタイミングの到来時に擬似乱数を発生する。クロック周期は例えば1秒間隔であり、同図において、太字矢印の位置がクロックタイミングを示す。通常、探査用信号のマイクアレイ3への入力タイミングの検出時刻精度は、クロック周期によって決まり、クロック周期の1/10程度となる。
Then, the
すなわち、探査用信号生成部26は擬似乱数として「0」か「1」の二つの値のいずれかを発生する。「0」を発生したときには、搬送波信号a1のレベルが0に変調され、「1」を発生したときには、搬送波信号a1のレベルは変更されない。これによって探査用音声信号c1が生成される。同図の例では、擬似乱数系列b1は「001101011」であり、探査用音声信号c1は、この「1」の期間のパルスで構成されたパルス列となる。なお、この探査用音声信号の周波数は例えば900〜7kHzである。もっとも周波数はスピーカユニットSP間の幅や、スピーカアレイ2の全長によって好ましい値が変わる。また、時間長さは、擬似乱数の系列長によって好ましい寸法が変わり、誤検出防止や検出タイミングの精度等を確保できる程度の長さがあり、かつ探査時間をできるだけ短く抑えることができるように長すぎないことが好ましい。
That is, the
探査用信号生成部26で生成された探査用音声信号は、遅延部13に入力される。遅延部13では、音声ビームを探査位置に焦点させるための遅延時間D1〜D8が付与され、遅延時間が付与された音声信号はD/Aコンバータ14−アンプ15を介してスピーカアレイ2に入力される。
The search audio signal generated by the search
スピーカアレイ2から出力された音声ビームは、音声ビームの経路に会議出席者hが居る場合には、この会議出席者hに反射してマイクアレイ3に集音される。各マイクMで集音された各信号はマイクアンプ21−A/D変換部22を介して集音ビーム形成部23に入力される。なお、各信号は遅延時間D11〜D18が設定されているチャンネルに入力される。集音ビーム形成部23は、設定された遅延時間D11〜D18で入力された各信号の位相調整を行って、位相調整後の各信号を加算合成することで、焦点Pからの音声に特化して集音する集音ビームを形成する。集音ビーム形成部23は、加算合成後の音声信号をバンドパスフィルタ24に入力する。
The audio beam output from the
バンドパスフィルタ24は、探査用音声の周波数帯域の他の成分をカットするフィルタ係数が設定される。バンドパスフィルタ24は入力した音声信号をこのフィルタ係数で畳み込み演算して、信号処理部25に入力する。これによって、入力した音声信号のうち探査用音声の周波数帯域の成分のみを抽出して信号処理部25に入力することができる。
The
信号処理部25は、バンドパスフィルタ24から入力した音声信号の中に探査用音声の成分が含まれるかを探査する。上述した様に、非周期的なパルス列が探査用音声信号として用いられているため、探査用音声のマイクアレイ3への入力タイミングの検出が容易かつ正確になる。図5は、探査用音声の入力タイミングの検出方法を示す図である。
The
信号処理部25は、探査用音声信号のパルス波形a2と入力した音声信号の波形b2とを比較することで探査用音声成分を検出する。すなわち、コントロール部16は探査用音声信号のパルス波形a2が探査用信号生成部26から通知され、コントロール部16はこのパルス波形a2を信号処理部25に通知する。信号処理部25は、通知されたパルス波形a2と、バンドパスフィルタ24から入力された音声信号のパルス波形b2とを比較してゆき、両パルス波形a2,b2が一致した場合に探査用音声成分を検出したと判断する。
The
同図(a)は、仮に探査用音声信号が周期的なパルス列である場合に、パルス波形a2とパルス波形b2とを比較する様子を示す図である。同図(b)は非周期的なパルス列である本実施形態の場合に、パルス波形a2とパルス波形b2とを比較する様子を示す図である。なお、点線の位置がクロックタイミングであり、各クロックタイミングから波形の一致の比較が開始される。 FIG. 5A is a diagram showing a state in which the pulse waveform a2 and the pulse waveform b2 are compared when the search audio signal is a periodic pulse train. FIG. 4B is a diagram showing a state in which the pulse waveform a2 and the pulse waveform b2 are compared in the case of the present embodiment, which is an aperiodic pulse train. Note that the position of the dotted line is the clock timing, and the comparison of waveform matching is started from each clock timing.
パルス列が周期的である場合には、(a)で示すように、探査用音声成分の開始時点のクロックタイミングT1から半周期ずれた時点のクロックタイミングT2では、両パルス波形a2,b2の形状は一致しない。しかしながら、一周期ずれたクロックタイミングT3では、両パルス波形a2,b2は一致してしまう。このため、探査用音声成分の開始位置がクロックタイミングT1であるのかクロックタイミングT3であるのかの判断が困難である。 When the pulse train is periodic, as shown in (a), the shape of both pulse waveforms a2 and b2 is as shown in (a) at the clock timing T2 at a time deviated from the clock timing T1 at the start of the search audio component. It does not match. However, at the clock timing T3 shifted by one cycle, both pulse waveforms a2 and b2 coincide. For this reason, it is difficult to determine whether the start position of the search audio component is the clock timing T1 or the clock timing T3.
一方、探査用音声信号が非周期的なパルス列で構成される場合には、(b)で示すように、探査用音声成分の開始時点T1からのパルス波形b2のみがパルス波形a2と合致し、ずれた時点からのパルス波形b2とパルス波形a2とは一致しない。このため、探査用音声成分の開始時点を検出することが容易であり、正確に開示時点を検出することができる。 On the other hand, when the search audio signal is composed of an aperiodic pulse train, only the pulse waveform b2 from the start time T1 of the search audio component matches the pulse waveform a2, as shown in (b), The pulse waveform b2 and the pulse waveform a2 from the time of deviation do not match. For this reason, it is easy to detect the start time of the sound component for search, and it is possible to accurately detect the time of disclosure.
信号処理部25は、波形の一致の開始時点を探査用音声の入力タイミングとしてコントロール部16に通知する。上述したように、コントロール部16は、通知された探査用音声の入力タイミング及び探査用音声の出力タイミングを用いて会議出席者hの位置を算出する。
The
図6は、図3で示す音声会議装置1の実行する位置検出処理を示すフローチャートである。この位置検出処理は、コントロール部16を構成する操作部を用いてユーザが位置検出処理の実行を指示した場合に実行される。まず、指向性制御部161は、上述した遅延時間D1〜D8を算出して、遅延部13−1〜13−8に設定することで音声ビームの焦点合わせを行う(S1)。これとともに、指向性制御部161は、上述した遅延時間D11〜D18を算出して、位相補正部231に設定することで集音ビームの焦点合わせを行う(S2)。
FIG. 6 is a flowchart showing position detection processing executed by the
この後、位置検出部162は、探査用音声信号の生成を探査用信号生成部26に指示し(S3)、これとともにタイマ163を用いて計時を開始する(S4)。探査用信号生成部26は探査用音声信号を生成して遅延部13−D/Aコンバータ14−アンプ15を介してスピーカアレイ2に入力する。位置検出部162は、信号処理部25に探査用音声成分の検出を開始させる(S5)。
Thereafter, the
位置検出部162は、探査用音声の入力タイミングが信号処理部25から通知されたかどうかを判断する(S6)。探査用音声の入力タイミングが通知された場合には(S6でYES)、位置検出部162は入力タイミング及び探査用音声の出力タイミング(探査用音声信号の発生タイミング)を用いて上述した方法によって会議出席者h1の位置を算出し、位置記憶部164に記憶させる(S7)。
The
この後、位置検出部162は、指向性制御部161に音声ビーム及び集音ビームの焦点位置が探査領域の全ての方向に移動されたかを判断させる(S8)。全ての方向に焦点位置が移動されたと指向性制御部161が判断した場合には(S8でYES)、位置検出部162は本処理を終了させる。一方、全ての方向に焦点位置が移動されていないと指向性制御部161が判断した場合には(S8でNO)、位置検出部162は本処理をステップS1に戻し、ステップS1では焦点が別の位置に変更される。
Thereafter, the
一方、位置検出部162は、探査用音声の入力タイミングが信号処理部25から通知されてないと判断した場合には(S6でNO)、探査時間t2が経過したかどうかを判断する(S9)。探査時間t2が経過したと判断していない場合には(S9でNO)、位置検出部162は本処理をステップS6に戻し、探査時間t2が経過したと判断した場合には(S9でYES)、位置検出部162は上述したステップS8を実行する。
On the other hand, when the
上述した位置検出処理によって、本実施形態では、マイクアレイ3の集音ビームの焦点とスピーカアレイ2の音声ビームの焦点とが重なるように指向性制御部161によって制御される。そして、スピーカアレイ2から探査用音声のビームが出力され、この音声ビームの経路に会議出席者hが居る場合には、この会議出席者hに反射した探査用音声がマイクアレイ3によって集音される。この探査用音声の入力及び出力タイミングと音声ビームの出力方向によって、会議出席者hの位置が位置検出部162によって検出される。これによって、従来技術に比較して、より会議出席者hの位置検出を正確に行うことができる。
According to the position detection process described above, in this embodiment, the
すなわち、無指向性スピーカを用いて広角度に探査用音声が出力する従来技術とは異なり、スピーカアレイ2を用いて音声ビームを出力する。このため、、探査範囲外に音声が出力されず、探査範囲外の反射音を集音してしまうマルチパスを効果的に防止することができる。また、スピーカアレイ2から出力した音声信号が焦点位置で反射してマイクアレイ3に入力されるまでの計時時間に限って、マイクアレイ3から入力された音声信号に探査用音声信号の成分が含まれるかが探査される。これによって、焦点位置を越えた位置で反射した反射音をマイクアレイで受信してしまい(マルチパス)、会議出席者hを誤検出してしまうことを防止することができる。
That is, unlike the conventional technique in which sound for exploration is output at a wide angle using an omnidirectional speaker, a sound beam is output using the
上述のように、探査範囲の他の領域(方向)での反射音のマルチパスを効果的に防止することができるとともに、焦点位置を越えた位置での反射音のマルチパスを効果的に防止することができるため、会議出席者hの位置検出の正確さを向上させることができる。 As described above, multipath of reflected sound in other areas (directions) of the search range can be effectively prevented, and multipath of reflected sound at positions beyond the focal position can be effectively prevented. Therefore, it is possible to improve the accuracy of position detection of the meeting attendee h.
本実施形態は、以下の変形例を採用することができる。 The present embodiment can employ the following modified examples.
(1)本実施形態では、スピーカユニットSPの個数は8個であるが、この個数に限定されず、音声ビームの指向性及びビーム幅を制御できるだけの個数が少なくとも配設されていればよい。 (1) In the present embodiment, the number of speaker units SP is eight. However, the number is not limited to this, and it is sufficient that at least the number capable of controlling the directivity and beam width of the sound beam is provided.
(2)本実施形態では、本発明の対象物検出装置を音声会議装置に適用しているがこれに限定されず、対象物を検出する機能を備えた装置であれば本発明を適用することができる。例えば、本発明は、車両の周囲に位置する障害物を検出して運転者に提示する運転支援装置等に適用されてもよい。 (2) In the present embodiment, the object detection device of the present invention is applied to an audio conference device. However, the present invention is not limited to this, and the present invention is applied to any device having a function of detecting an object. Can do. For example, the present invention may be applied to a driving support device that detects an obstacle located around the vehicle and presents it to the driver.
(3)本実施形態では、スピーカユニットSPをライン状に配列したスピーカアレイ2やマイクMをライン状に配列したマイクアレイ3を用いているが、本発明はこのスピーカアレイ2及びマイクアレイ3の構成に限定されない。例えば、マトリクス状、ハニカム状、円形状等に配列されたスピーカユニットSPやマイクMを備えたスピーカアレイ2やマイクアレイ3が用いられても良い。この場合には、対象物の高さ方向の位置等も検出することができる。
(3) In this embodiment, the
1−音声会議装置 1´−相手方装置 2−スピーカアレイ 3−マイクアレイ 13−遅延部(第1ビーム調整部) 16−コントロール部 161−指向性制御部 162−位置検出部(判断部) 163−タイマ(計時部) 23(23A〜23C)−集音ビーム形成部(第2ビーム調整部) 25−信号処理部(探査部) 26−探査用信号生成部(信号生成部) c1−探査用音声信号 h(h1〜h3)−会議出席者 P−焦点 1-voice conference device 1'-partner device 2-speaker array 3-microphone array 13-delay unit (first beam adjustment unit) 16-control unit 161-directivity control unit 162-position detection unit (determination unit) 163- Timer (timer) 23 (23A to 23C) -sound collecting beam forming unit (second beam adjusting unit) 25-signal processing unit (searching unit) 26-searching signal generating unit (signal generating unit) c1-searching sound Signal h (h1-h3)-Conference attendee P-Focus
Claims (4)
探査用音声信号を生成して前記スピーカアレイに入力する信号生成部と、
スピーカアレイからの音声ビームの焦点合わせを行う第1ビーム調整部と、
マイクアレイの集音ビームの焦点合わせを行う第2ビーム調整部と、
音声ビームの焦点と集音ビームの焦点を重ならせるように第1及び第2ビーム調整部の焦点合わせを制御する指向性制御部と、
スピーカアレイから音声が出力されてから焦点位置で反射してマイクアレイに入力されるまでの探査時間を計時する計時部と、
前記探査時間に、マイクアレイから入力された音声信号に前記探査用音声信号の成分が含まれるかを探査する探査部と、
前記探査部によって前記探査用音声信号の成分が含まれると検出された場合に、スピーカアレイから焦点までの音声ビームの経路に対象物があると判断する判断部と、
を備えたことを特徴とする対象物検出装置。 A function to input audio signals from the microphone array and input audio signals to the speaker array,
A signal generation unit for generating a search sound signal and inputting the sound signal to the speaker array;
A first beam adjustment unit for focusing an audio beam from the speaker array;
A second beam adjustment unit for focusing the sound collection beam of the microphone array;
A directivity control unit that controls the focusing of the first and second beam adjustment units so that the focus of the sound beam and the focus of the sound collection beam overlap.
A timekeeping unit that measures the exploration time from when the sound is output from the speaker array until it is reflected at the focal position and input to the microphone array;
An exploration unit for exploring whether the audio signal input from the microphone array includes the component of the audio signal for exploration at the exploration time;
A determination unit that determines that there is an object in the path of the sound beam from the speaker array to the focal point when the search unit detects that the component of the search sound signal is included;
An object detection apparatus comprising:
ことを特徴とする請求項1に記載の対象物検出装置。 The determination unit detects the position of the object using the output timing of the sound beam from the speaker array, the input timing of the component of the sound signal for exploration to the microphone array, and the output direction of the sound beam.
The object detection apparatus according to claim 1.
前記信号生成部は、探査用音声信号として可聴音の周波数成分から成る音声信号を生成し、
前記判断部は、前記対象物として会議出席者を検出する、
ことを特徴とする音声会議装置。 An audio conference device using the object detection device according to claim 1,
The signal generation unit generates an audio signal composed of frequency components of audible sound as an audio signal for exploration,
The determination unit detects meeting attendees as the object.
An audio conference apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005267885A JP2007078545A (en) | 2005-09-15 | 2005-09-15 | Object detection system and voice conference system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005267885A JP2007078545A (en) | 2005-09-15 | 2005-09-15 | Object detection system and voice conference system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007078545A true JP2007078545A (en) | 2007-03-29 |
Family
ID=37939028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005267885A Pending JP2007078545A (en) | 2005-09-15 | 2005-09-15 | Object detection system and voice conference system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007078545A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1983799A1 (en) | 2007-04-17 | 2008-10-22 | Harman Becker Automotive Systems GmbH | Acoustic localization of a speaker |
WO2008142979A1 (en) * | 2007-05-16 | 2008-11-27 | Yamaha Corporation | Video conference device |
JP2008294600A (en) * | 2007-05-23 | 2008-12-04 | Yamaha Corp | Sound emission and collection apparatus and sound emission and collection system |
WO2009004983A1 (en) * | 2007-06-29 | 2009-01-08 | Yamaha Corporation | Loudspeaker apparatus |
EP2320676A1 (en) * | 2008-08-19 | 2011-05-11 | Huawei Device Co., Ltd. | Method, communication device and communication system for controlling sound focusing |
JP2012008157A (en) * | 2010-06-22 | 2012-01-12 | Nippon Telegr & Teleph Corp <Ntt> | Sound reproducing apparatus, and method and program for reproducing sound |
WO2017056706A1 (en) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | Vehicle-mounted acoustic device |
CN111602414A (en) * | 2018-01-16 | 2020-08-28 | 谷歌有限责任公司 | Controlling audio signal focused speakers during video conferencing |
CN113938792A (en) * | 2021-09-27 | 2022-01-14 | 歌尔科技有限公司 | Audio playback optimization method, device and readable storage medium |
-
2005
- 2005-09-15 JP JP2005267885A patent/JP2007078545A/en active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9338549B2 (en) | 2007-04-17 | 2016-05-10 | Nuance Communications, Inc. | Acoustic localization of a speaker |
EP1983799A1 (en) | 2007-04-17 | 2008-10-22 | Harman Becker Automotive Systems GmbH | Acoustic localization of a speaker |
US20120294118A1 (en) * | 2007-04-17 | 2012-11-22 | Nuance Communications, Inc. | Acoustic Localization of a Speaker |
WO2008142979A1 (en) * | 2007-05-16 | 2008-11-27 | Yamaha Corporation | Video conference device |
JP2008294600A (en) * | 2007-05-23 | 2008-12-04 | Yamaha Corp | Sound emission and collection apparatus and sound emission and collection system |
WO2009004983A1 (en) * | 2007-06-29 | 2009-01-08 | Yamaha Corporation | Loudspeaker apparatus |
EP2320676A1 (en) * | 2008-08-19 | 2011-05-11 | Huawei Device Co., Ltd. | Method, communication device and communication system for controlling sound focusing |
EP2320676A4 (en) * | 2008-08-19 | 2011-09-28 | Huawei Device Co Ltd | Method, communication device and communication system for controlling sound focusing |
JP2012008157A (en) * | 2010-06-22 | 2012-01-12 | Nippon Telegr & Teleph Corp <Ntt> | Sound reproducing apparatus, and method and program for reproducing sound |
WO2017056706A1 (en) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | Vehicle-mounted acoustic device |
CN111602414A (en) * | 2018-01-16 | 2020-08-28 | 谷歌有限责任公司 | Controlling audio signal focused speakers during video conferencing |
CN113938792A (en) * | 2021-09-27 | 2022-01-14 | 歌尔科技有限公司 | Audio playback optimization method, device and readable storage medium |
CN113938792B (en) * | 2021-09-27 | 2022-08-19 | 歌尔科技有限公司 | Audio playing optimization method and device and readable storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8204248B2 (en) | Acoustic localization of a speaker | |
KR101715779B1 (en) | Apparatus for sound source signal processing and method thereof | |
US9924290B2 (en) | Method and system for generation of sound fields | |
JP4984683B2 (en) | Sound emission and collection device | |
JP4887968B2 (en) | Audio conferencing equipment | |
JP2007142595A (en) | Remote conference device | |
JP2009017137A (en) | Speaker array apparatus | |
SE0303388D0 (en) | Method and apparatus for detecting position of mobile robot | |
DE60136945D1 (en) | NONINVASIVE DEVICE AND METHOD FOR FOCUSING SOUND WAVES | |
JP3352098B2 (en) | Object inspection system by ultrasonic echograph | |
EP1578169A1 (en) | Method and device for measuring sound wave propagation time between loudspeaker and microphone | |
JP2007078545A (en) | Object detection system and voice conference system | |
KR101091646B1 (en) | Sonar and how to drive it | |
CN112104928A (en) | Intelligent sound box and method and system for controlling intelligent sound box | |
KR101613683B1 (en) | Apparatus for generating sound directional radiation pattern and method thereof | |
JP4375355B2 (en) | Speaker array device and audio beam setting method for speaker array device | |
JP4285492B2 (en) | Signal processing device | |
JP4802708B2 (en) | Sound emission and collection device | |
JP2008061186A (en) | Directional characteristic control apparatus, sound collecting device and sound collecting system | |
JPH08271627A (en) | Distance measuring device between loudspeaker and microphone | |
JP2010025802A (en) | Sound source search apparatus | |
JP4247168B2 (en) | Sound field characteristic measurement system | |
JP7111103B2 (en) | Imaging system, imaging device and imaging method | |
JP2007121092A (en) | Method and device for detecting flaw with guide wave pulse compression accompanied by direction controllability | |
JPH09133657A (en) | Method and apparatus for ultrasonic flaw detection |