JP5780096B2 - Audio processing apparatus, audio processing method, and audio processing program - Google Patents
Audio processing apparatus, audio processing method, and audio processing program Download PDFInfo
- Publication number
- JP5780096B2 JP5780096B2 JP2011217119A JP2011217119A JP5780096B2 JP 5780096 B2 JP5780096 B2 JP 5780096B2 JP 2011217119 A JP2011217119 A JP 2011217119A JP 2011217119 A JP2011217119 A JP 2011217119A JP 5780096 B2 JP5780096 B2 JP 5780096B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- processing device
- volume
- speaker
- specifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Description
本発明は、音の入出力処理を行い、且つ、他の音声処理装置と接続して通信を行うことが可能な音声処理装置、音声処理方法、および音声処理プログラムに関する。 The present invention relates to a sound processing device, a sound processing method, and a sound processing program that can perform sound input / output processing and can communicate with another sound processing device.
マイクによって集音した音声を、遠隔地に設置された他の音声処理装置に対してネットワークを介して送信すると同時に、ネットワークを介して遠隔地の音声を受信し、スピーカから出力する音声処理装置が知られている。このような音声処理装置は、遠隔会議システム等において広く使用されている。音声処理装置の一例として、スピーカフォンが挙げられる。音声処理装置には、通常、エコー除去の機能が搭載されている。音声処理装置は、エコー除去を機能させることによって、エコーやハウリングの発生を抑止することができる。例えば特許文献1では、エコー除去の機能を応用し、音響結合の利得を軽減させることによって、2以上のスピーカおよびマイクを備えた系においてエコーやハウリングの発生を抑止する技術が開示されている。
An audio processing device that transmits audio collected by a microphone to another audio processing device installed at a remote location via the network, and simultaneously receives audio from the remote location via the network and outputs it from a speaker. Are known. Such a voice processing apparatus is widely used in a remote conference system or the like. A speakerphone is an example of the sound processing device. An audio processing device is usually equipped with an echo removal function. The sound processing apparatus can suppress the occurrence of echoes and howling by making echo cancellation function. For example,
同一拠点内で複数の音声処理装置を相互に接続し、使用することが可能な音声処理装置が知られている。このような音声処理装置では、拠点内の広い領域に音声処理装置を点在させることによって、会議音声の可聴範囲、および発話音の集音範囲を広げることができる。 2. Description of the Related Art There is known a speech processing device that can connect and use a plurality of speech processing devices within the same site. In such an audio processing device, the audio processing device can be spread over a wide area in the base, thereby expanding the audible range of the conference audio and the sound collection range of the uttered sound.
従来のエコー除去は、単一の音声処理装置のスピーカおよびマイクが使用された場合に機能するように設定されている。このため、同一拠点内で複数の音声処理装置が接続された場合、従来のエコー除去ではエコーやハウリングの発生を十分抑止することができない可能性がある。一方で、特許文献1に記載された技術を用いた場合、同一拠点内で複数の音声処理装置が接続された場合でも、エコーやハウリングの発生を抑止することができることが想定される。しかしながらこの場合、音響結合の利得を制御するための複雑なアルゴリズムを音響処理装置に実装しなければならない。従って、音声処理装置の構成が複雑化したり、装置に含まれる部品点数が増加したりすることで、音声処理装置を安価に提供できないという問題点がある。
Conventional echo cancellation is set to work when a speaker and microphone of a single audio processing device is used. For this reason, when a plurality of speech processing devices are connected in the same site, there is a possibility that the conventional echo removal cannot sufficiently suppress the occurrence of echoes and howling. On the other hand, when the technique described in
本発明の目的は、装置構成の複雑化や、装置に含まれる部品点数の増加を抑制しつつ、複数の音声処理装置を相互に接続して使用する場合にエコーやハウリングの発生を抑止することができる音声処理装置、音声処理方法、および音声処理プログラムを提供することである。 An object of the present invention is to suppress the occurrence of echoes and howling when a plurality of audio processing devices are connected to each other while suppressing the complexity of the device configuration and the increase in the number of parts included in the device. A voice processing apparatus, a voice processing method, and a voice processing program.
本発明の第一態様に係る音声処理装置は、マイクおよびスピーカを備えた音声処理装置であって、他の音声処理装置と通信を行う通信制御手段と、前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段と、前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信手段と、前記他の音声処理装置によって送信された前記変更通知を受信する受信手段と、前記受信手段によって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段とを備えを備えている。 An audio processing apparatus according to a first aspect of the present invention is an audio processing apparatus including a microphone and a speaker, and communication control means for communicating with another audio processing apparatus, and the other audio processing by the communication control means. By communicating with a device, a first specifying means for specifying a timing for outputting a predetermined sound from the speaker, and outputting the predetermined sound from the speaker at a predetermined volume at the timing specified by the first specifying means. The predetermined sound obtained when the predetermined sound output at the predetermined volume from the other speaker connected to the other sound processing device and the predetermined sound volume is acquired via the microphone. A second specifying means for specifying the volume and the direction of arrival of the sound, and the sound processing device based on the volume and the direction of arrival specified by the second specifying means. First adjustment means for adjusting the overall directivity, which is a directivity of sensitivity to incoming sound, wherein the overall directivity is adjusted so that sensitivity to sound coming from a specific direction toward the voice processing device is attenuated; A first adjustment means for adjusting, and a change notification for notifying information for specifying the changed volume when the volume when the sound is output from the speaker is changed, to the other audio processing device Transmitting means for transmitting to, receiving means for receiving the change notification transmitted by the other audio processing device, and the information notified by the change notification when the change notification is received by the receiving means. And second adjusting means for readjusting the overall directivity adjusted by the first adjusting means .
第一態様によれば、複数の音声処理装置が相互に接続された状態で使用される場合であっても、他の音声処理装置から出力された音が要因でエコーやハウリングが発生することを抑止することができる。また、音声処理装置が通常備える周知のエコー除去機能をそのまま利用することができるため、新たにエコー除去のための特別な機能を音声処理装置に実装する必要がない。このため、音声処理装置の構成の複雑化や、装置に含まれる部品点数の増加を抑制しつつ、複数の音声処理装置が接続された場合のエコーやハウリングの発生を効率的に抑止することができる。又、他の音声処理装置のスピーカから出力される音の音量が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整する必要がある。これに対して本態様では、他の音声処理装置のスピーカから出力される音の変更後の音量に基づいて全体指向性を再調整することによって、音声処理装置に対して到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、全体指向性を最適な状態に再調整することができる。また、全体指向性は自動的に調整されるので、再度、他の音声処理装置のスピーカから所定音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。 According to the first aspect, even when a plurality of sound processing devices are used in a state of being connected to each other, echoes and howling are caused by the sound output from other sound processing devices. Can be deterred. In addition, since the well-known echo removal function that is normally provided in the speech processing apparatus can be used as it is, it is not necessary to newly install a special function for echo removal in the speech processing apparatus. For this reason, it is possible to efficiently suppress the occurrence of echoes and howling when a plurality of sound processing devices are connected while suppressing the complexity of the structure of the sound processing device and the increase in the number of components included in the device. it can. In addition, when the volume of the sound output from the speaker of another audio processing device is changed, the overall directivity necessary to suppress the occurrence of echo and howling needs to be adjusted again. On the other hand, in this aspect, the sound coming from the direction of arrival with respect to the sound processing device is readjusted by re-adjusting the overall directivity based on the volume after the change of the sound output from the speaker of the other sound processing device. The sensitivity to can be attenuated. As a result, the speech processing apparatus can readjust the overall directivity to an optimum state. Also, since the overall directivity is automatically adjusted, it is possible to save the trouble of resetting the overall directivity from the beginning by outputting a predetermined sound from the speaker of another audio processing device again.
第一態様において、前記第一調整手段は、前記第二特定手段によって特定された前記音量が所定閾値以上である場合に、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整してもよい。他の音声処理装置から出力される音の入力レベルを選択的に減衰させることで、エコーやハウリングの発生を効果的に抑止することができる。 In the first aspect, the first adjustment means attenuates the sensitivity in the direction of arrival corresponding to the volume when the volume specified by the second specifying means is equal to or greater than a predetermined threshold, thereby The directivity may be adjusted. By selectively attenuating the input level of sound output from other sound processing devices, it is possible to effectively suppress the occurrence of echoes and howling.
第一態様において、前記第一調整手段は、前記マイクを介して前記所定音を取得した場合の音量が前記所定閾値以内となるように、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整してもよい。これによって、他の音声処理装置から出力される音の入力レベルを、エコーやハウリングが発生しないレベルまで減衰させることができる。これによって、エコーやハウリングの発生を更に効果的に抑止することができる。 In the first aspect, the first adjustment means attenuates the sensitivity in the direction of arrival corresponding to the volume so that the volume when the predetermined sound is acquired via the microphone is within the predetermined threshold. The overall directivity may be adjusted as follows. As a result, the input level of the sound output from another audio processing device can be attenuated to a level at which no echo or howling occurs. As a result, the occurrence of echoes and howling can be more effectively suppressed.
第一態様において、前記送信手段は、変更前後での前記音量の差分を算出し、前記差分を通知するための前記変更通知を送信し、前記第二調整手段は、前記変更通知によって通知された前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整してもよい。音声処理装置は、他の音声処理装置のスピーカから出力される音の音量の変更前後での差分に基づいて、全体指向性を再調整し、到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、他の音声処理装置のスピーカから出力される音の音量の変化の程度に応じ、全体指向性を最適な状態に調整することができる。 In the first aspect, the transmission unit calculates the difference in the volume before and after the change, transmits the change notification for notifying the difference, and the second adjustment unit is notified by the change notification. Based on the difference, the overall directivity adjusted by the first adjusting means may be readjusted. The sound processing device may readjust the overall directivity based on the difference between before and after the change in the volume of the sound output from the speaker of the other sound processing device, and attenuate the sensitivity to the sound coming from the direction of arrival. it can. Thus, the sound processing device can adjust the overall directivity to an optimal state according to the degree of change in the volume of the sound output from the speaker of the other sound processing device.
本発明の第二態様に係る音声処理装置は、マイクおよびスピーカを備えた音声処理装置であって、他の音声処理装置と通信を行う通信制御手段と、前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段と、前記マイクが音を集音する場合の感度が変更された場合に、変更前後での前記感度の差分を算出し、算出した前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段とを備えたことを特徴とする。第二態様によれば、複数の音声処理装置が相互に接続された状態で使用される場合であっても、他の音声処理装置から出力された音が要因でエコーやハウリングが発生することを抑止することができる。また、音声処理装置が通常備える周知のエコー除去機能をそのまま利用することができるため、新たにエコー除去のための特別な機能を音声処理装置に実装する必要がない。このため、音声処理装置の構成の複雑化や、装置に含まれる部品点数の増加を抑制しつつ、複数の音声処理装置が接続された場合のエコーやハウリングの発生を効率的に抑止することができる。又、マイクの感度が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整する必要がある。これに対して本発明では、感度の変更前後での差分を算出し、差分に基づいて全体指向性を再調整することによって、到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、マイクの感度の変化の程度に応じ、全体指向性を最適な状態に再調整することができる。また、差分に応じて全体指向性は自動的に調整されるので、再度、他の音声処理装置のスピーカから所定音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。 The audio processing apparatus according to the second aspect of the present invention is an audio processing apparatus including a microphone and a speaker, and communication control means for communicating with another audio processing apparatus, and the other audio processing by the communication control means. By communicating with a device, a first specifying means for specifying a timing for outputting a predetermined sound from the speaker, and outputting the predetermined sound from the speaker at a predetermined volume at the timing specified by the first specifying means. The predetermined sound obtained when the predetermined sound output at the predetermined volume from the other speaker connected to the other sound processing device and the predetermined sound volume is acquired via the microphone. A second specifying means for specifying the volume and the direction of arrival of the sound, and the sound processing device based on the volume and the direction of arrival specified by the second specifying means. First adjustment means for adjusting the overall directivity, which is a directivity of sensitivity to incoming sound, wherein the overall directivity is adjusted so that sensitivity to sound coming from a specific direction toward the voice processing device is attenuated; When the sensitivity when the microphone collects sound is changed , the first adjustment means to adjust, the difference of the sensitivity before and after the change is calculated, and the first adjustment based on the calculated difference And second adjusting means for readjusting the overall directivity adjusted by the means. According to the second aspect, even when a plurality of sound processing devices are used in a state of being connected to each other, echoes and howling are caused by the sound output from other sound processing devices. Can be deterred. In addition, since the well-known echo removal function that is normally provided in the speech processing apparatus can be used as it is, it is not necessary to newly install a special function for echo removal in the speech processing apparatus. For this reason, it is possible to efficiently suppress the occurrence of echoes and howling when a plurality of sound processing devices are connected while suppressing the complexity of the structure of the sound processing device and the increase in the number of components included in the device. it can. In addition, when the sensitivity of the microphone is changed, it is necessary to adjust the overall directivity necessary for suppressing the occurrence of echoes and howling again. On the other hand, in the present invention, the sensitivity with respect to the sound coming from the arrival direction can be attenuated by calculating the difference before and after the sensitivity change and readjusting the overall directivity based on the difference. As a result, the speech processing apparatus can readjust the overall directivity to an optimum state according to the degree of change in the sensitivity of the microphone. Also, since the overall directivity is automatically adjusted according to the difference, it is possible to save the trouble of resetting the overall directivity from the beginning by outputting a predetermined sound again from the speaker of another audio processing device. .
第一態様及び第二態様において、前記第一特定手段は、前記通信制御手段によって、前記音声処理装置および前記他の音声処理装置に対して順番に割り当てられる識別情報に基づいて、前記タイミングを決定してもよい。音声処理装置は、所定音を出力するタイミングを容易に決定することができる。音声処理装置を使用するユーザや、音声処理装置を制御する制御機器によって、音声処理装置から所定音を所定のタイミングで出力させることを要することなく、音声処理装置は、独自にタイミングを判断して所定音を出力することができる。 In the first aspect and the second aspect , the first specifying unit determines the timing based on identification information sequentially assigned to the voice processing device and the other voice processing device by the communication control unit. May be. The voice processing device can easily determine the timing for outputting the predetermined sound. The voice processing device independently determines the timing without requiring the user to use the voice processing device or the control device that controls the voice processing device to output the predetermined sound from the voice processing device at the predetermined timing. A predetermined sound can be output.
本発明の第三態様に係る音声処理方法は、他の音声処理装置と通信を行う通信制御ステップと、前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと、前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信ステップと、前記他の音声処理装置によって送信された前記変更通知を受信する受信ステップと、前記受信ステップによって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整ステップによって調整された前記全体指向性を再調整する第二調整ステップとを備えている。第三態様によれば、第一態様と同様の効果を奏することができる。 The speech processing method according to the third aspect of the present invention includes a communication control step for communicating with another speech processing device, and a speaker for the speech processing device by communicating with the other speech processing device through the communication control step. A first specifying step for specifying a timing for outputting a predetermined sound from the output control step for performing control for outputting the predetermined sound at a predetermined volume from the speaker at the timing specified by the first specifying step; When the predetermined sound output at the predetermined volume from another speaker connected to another audio processing apparatus is acquired via the microphone of the audio processing apparatus, the volume and direction of arrival of the acquired predetermined sound are indicated. Based on the second specifying step to specify, the volume and the direction of arrival specified by the second specifying step, the sound processing device A first adjustment step of adjusting the overall directivity, which is a directivity of sensitivity to an incoming sound, wherein the overall directivity is set so that sensitivity to a sound coming from a specific direction toward the voice processing device is attenuated. A first adjustment step for adjusting, and a change notification for notifying information for specifying the changed volume when the volume when the sound is output from the speaker is changed, to the other audio processing device A transmitting step for transmitting to the receiving device; a receiving step for receiving the changing notification transmitted by the other audio processing device; and the information notified by the changing notification when the changing notification is received by the receiving step. And a second adjustment step for readjusting the overall directivity adjusted by the first adjustment step . According to the 3rd aspect, there can exist an effect similar to a 1st aspect.
本発明の第四態様に係る音声処理プログラムは、他の音声処理装置と通信を行う通信制御ステップと、前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、前記他の音声処理装置の制御によって、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと、前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信ステップと、前記他の音声処理装置によって送信された前記変更通知を受信する受信ステップと、前記受信ステップによって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整ステップによって調整された前記全体指向性を再調整する第二調整ステップとを前記音声処理装置のコンピュータに実行させる。第四態様によれば、第一態様と同様の効果を奏することができる。 The audio processing program according to the fourth aspect of the present invention includes a communication control step for communicating with another audio processing device, and a speaker of the audio processing device by communicating with the other audio processing device through the communication control step. A first specifying step for specifying a timing for outputting a predetermined sound from the output control step for performing control for outputting the predetermined sound at a predetermined volume from the speaker at the timing specified by the first specifying step; Acquired when the predetermined sound output at the predetermined volume from another speaker connected to the other audio processing device is acquired through the microphone of the audio processing device under the control of the other audio processing device. A second specifying step for specifying the volume and the direction of arrival of the predetermined sound, and the volume specified by the second specifying step. And a first adjustment step for adjusting the overall directivity, which is the directivity of sensitivity to the sound arriving at the sound processing device, based on the arrival direction, and the sound arriving from a specific direction toward the sound processing device A first adjustment step for adjusting the overall directivity so that the sensitivity to the sound is attenuated, and notification of information for specifying the changed sound volume when the sound volume when the sound is output from the speaker is changed Transmitting the change notification to the other voice processing device, receiving the change notification transmitted by the other voice processing device, and receiving the change notification by the receiving step. A second adjustment for readjusting the global directivity adjusted by the first adjustment step based on the information notified by the change notification. To execute the steps in the computer of the audio processing device. According to the 4th aspect, there can exist an effect similar to a 1st aspect.
以下、本発明の一実施形態について、図面を参照して説明する。これらの図面は、本発明が採用しうる技術的特徴を説明するために用いられるものである。記載されている装置の構成、各種処理のフローチャート等は、それのみに限定する趣旨ではなく、単なる説明例である。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. These drawings are used to explain technical features that can be adopted by the present invention. The configuration of the apparatus, the flowcharts of various processes, and the like that are described are not intended to be limited to only that, but are merely illustrative examples.
図1を参照し、会議システム1の概要について説明する。会議システム1は、音声処理装置11、12、13、およびPC15を備えている。音声処理装置11、12、13、およびPC15は、同一拠点(以下、自拠点ともいう)内に設置されている。音声処理装置11、12、13、およびPC15は、通信ケーブルによってディジーチェーン接続している。ディジーチェーンとは、複数の装置を数珠つなぎに連結する接続方法を示す。音声処理装置11は、PC15および音声処理装置12と接続している。音声処理装置12は、音声処理装置11、13と接続している。PC15は、インターネット網16にも接続している。従って会議システム1では、(インターネット網16、)PC15、音声処理装置11、12、13の順に接続されていることになる。以下、音声処理装置11、12、13を区別しない場合または総称する場合、これらを音声処理装置10という。
An overview of the
音声処理装置10は、PC15およびインターネット網16を介し、自拠点とは異なる他拠点に設置された他のPC(図示外)および他の音声処理装置(図示外)と通信を行うことができる。音声処理装置10は、マイク25(後述)によって集音した音声のデータを、インターネット網16を介して他の音声処理装置に送信すると同時に、インターネット網16を介して他の音声処理装置から音声のデータを受信し、スピーカ24から音声を出力する。音声処理装置10を使用する自拠点のユーザは、他の音声処理装置を使用する他拠点の他のユーザとの間で、音声による遠隔会議を行うことができる。
The
また会議システム1では、音声処理装置11、12、13を自拠点内の広い領域に点在させることができる。そして、他拠点に設置された他の音声処理装置から送信された音声のデータに基づく音声を、音声処理装置11、12、13のスピーカ24(後述)から出力させることができる。これによって、スピーカ24から出力される音声が広範にわたる領域で聞こえるようにすることができる。また音声処理装置10は、自拠点内の音声を隅々まで集音し、他拠点に設置された他の音声処理装置に対して音声データを送信することができる。
In the
なお図1のシステム構成は本発明の一例であり、他のシステム構成であってもよい。例えばインターネット網16の代わりに、固定電話網、移動電話網、専用通信網等、周知の様々な外部通信網が使用され、自拠点と他拠点との間で通信が実行されてもよい。音声処理装置10は、PC15の代わりに、音声処理装置10以外の様々な機器(固定電話機、携帯電話機、ルータ、モデム等)を介して外部通信網と接続してもよい。また音声処理装置10は、外部通信網と直接接続してもよい。
The system configuration in FIG. 1 is an example of the present invention, and other system configurations may be used. For example, various known external communication networks such as a fixed telephone network, a mobile telephone network, and a dedicated communication network may be used in place of the
また会議システム1において、PC15にディスプレイおよびカメラが接続されてもよい。PC15は、カメラによって撮影された自拠点の映像のデータを、インターネット網16を介して他のPCに送信すると同時に、インターネット網16を介して他のPCから映像のデータを受信し、ディスプレイに映像を表示してもよい。これによって自拠点のユーザは、他拠点の他のユーザとの間で、映像および音声による遠隔会議を行うことができる。
In the
音声処理装置10の電気的構成について説明する。音声処理装置10は、音声処理装置10の制御を司るCPU20を備えている。CPU20は、ROM21、RAM22、フラッシュメモリ23、スピーカ24、マイク25、通信インタフェース(以下、通信I/Fという。)26、および入力部27と電気的に接続している。ROM21には、ブートプログラム、BIOS、OS等が記憶される。RAM22には、タイマやカウンタ、一時的なデータが記憶される。またRAM22には、スピーカ24から出力される音の音量の設定値、およびマイク25の感度の設定値が記憶される。以下、スピーカ24から出力される音の音量の設定値としてRAM22に記憶された情報を、スピーカ音量という。マイク25の感度の設定値としてRAM22に記憶された情報を、マイク感度という。ユーザは、入力部27(後述)を操作することによって、スピーカ音量およびマイク感度を設定することができる。
The electrical configuration of the
フラッシュメモリ23には、CPU20の制御プログラムが記憶される。またフラッシュメモリ23には、後述する状態テーブル231(図2参照)が記憶される。更にフラッシュメモリ23には、後述するテスト音のデータ、およびテスト音の音量であるテスト音量が記憶される。スピーカ24は、RAM22に記憶されたスピーカ音量で音を出力することができる。マイク25は、RAM22に記憶されたマイク感度で音を集音することができる。マイク25は、音声処理装置10の周囲に複数設けられている。CPU20は、其々のマイク25によって集音した音の音量、および、其々のマイク25における音の集音タイミングの時間差に基づき、集音した音の到来方向を特定することができる。またCPU20は、其々のマイク25によって集音した音の増幅度を調節することによって、マイク25全体としての指向性を調整することができる。以下、マイク25全体としての指向性を、全体指向性という。通信I/F26は、他の音声処理装置10およびPC15と通信を行うためのインタフェースである。なお音声処理装置10は、異なる二つの他の装置と接続することによってディジーチェーン接続を実現している。このため、異なる二つの他の装置の其々と通信を行うために、通信I/F26は二つ以上設けられる。入力部27は、スピーカ音量およびマイク感度を設定するためのボタンである。
The
音声処理装置10には、周知のエコー除去機能が搭載されている。音声処理装置10は、音声処理装置10のスピーカ24から出力された音をマイク25が集音することによって発生するエコーやハウリングを、エコー除去を機能させることによって抑止することができる。しかしながら、例えば音声処理装置11のマイク25によって、音声処理装置12、13のスピーカ24から出力された音が集音された場合、音声処理装置11はエコー除去を有効に機能させることができない場合がある。エコー除去の機能は、マイク25によって集音された音に基づき、自装置のスピーカ24から出力される音をフィードバック制御によって調節し、エコーやハウリングを抑止するためである。従って音声処理装置11は、接続されている他の音声処理装置12、13のスピーカ24から出力された音がエコーやハウリングの要因となっている場合、音声処理装置12、13のスピーカ24から出力される音を調節することができないため、エコーやハウリングを抑止することができない。
The
これに対して本実施形態における音声処理装置11は、全体指向性を調整し、音声処理装置12、13のスピーカ24から出力された音がマイク25によって集音される場合の音量を小さくする。これによって音声処理装置11は、音声処理装置12、13のスピーカ24から出力された音が要因となってエコーやハウリングが発生することを抑止することができる。また音声処理装置11は、音声処理装置11のスピーカ24から出力された音が要因となってエコーやハウリングが発生することを、周知のエコー除去機能を利用して抑止することができる。従って音声処理装置11は、相互に接続した音声処理装置12、13が自拠点内に設置される場合でも、エコーやハウリングのないクリアな音声環境で遠隔会議を行うことができる。以下詳説する。
On the other hand, the
図2を参照し、音声処理装置11のフラッシュメモリ23に記憶された状態テーブル231について説明する。状態テーブル231は、音声処理装置11が全体指向性を調整する場合に参照するテーブルである。状態テーブル231には、受信音量および音の到来方向を示す情報が、音声処理装置10のIDに対応付けて記憶されている。受信音量は、到来方向から到来した音を集音した場合の音量である。到来方向は、音声処理装置10の所定方向に対する角度で示されている。状態テーブル231の作成方法、および参照方法についての詳細は後述する。
The state table 231 stored in the
図3から図5を参照し、音声処理装置10が実行するメイン処理について説明する。以下説明するメイン処理は、フラッシュメモリ23に記憶されている音声処理プログラムに従って、音声処理装置10のCPU20が実行する。メイン処理は、音声処理装置10の電源がONされた場合に、フラッシュメモリ23に記憶されたメイン処理用のプログラムが起動されて開始される。そして、CPU20がこのプログラムを実行することにより行われる。なおCPU20では、メイン処理以外にも様々な周知の音響処理(エコーキャンセル処理など)が並列して実行されている。これらについての説明は、以下では省略している。なおRAM22には、メイン処理の起動時において、変数ID、X、およびMが定義される。
With reference to FIG. 3 to FIG. 5, main processing executed by the
メイン処理が開始されると、CPU20は、IDに0を記憶することによってIDを初期化する(S11)。CPU20は、他の音声処理装置10またはPC15が通信I/F26(図1参照)を介して接続されたかを判断する(S13)。他の音声処理装置10またはPC15が接続されていないと判断した場合(S13:NO)、他の音声処理装置10またはPC15が接続されるのを継続して監視するために、処理はS13に戻る。一方、音声処理装置10またはPC15が接続されたと判断した場合(S13:YES)、CPU20は、PC15が接続されたかを判断する(S15)。具体的には、通信ケーブルに含まれている信号の電気的な状態(例えばプルアップ状態など)を検出することによって、PC15が接続されたか否かを判断する。なお、PC15が接続されたか否かを判断する方法はこの方法に限定されない。例えば装置間が通信ケーブルを介して接続された場合、互いの種別を通知するための初期通信が実行されてもよい。CPU20は、初期通信によってPC15が接続されたか否かを判断してもよい。PC15が接続されたと判断した場合(S15:YES)、CPU20は、IDに1を記憶する(S17)。これによって、音声処理装置10のIDが決定される。CPU20は、決定したIDを通知するためのID通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S19)。処理はS29に進む。
When the main process is started, the
一方、S15で、PC15が接続されていないと判断した場合(S15:NO)、音声処理装置10には他の音声処理装置10が接続されたことになる。CPU20は、接続された状態のPC15または他の音声処理装置10から送信されたID通知データを受信したかを判断する(S21)。ID通知データを受信したと判断した場合(S21:YES)、CPU20は、受信したID通知データによって通知されたIDに1を加算した値を、IDに記憶する(S23)。これによって、音声処理装置10のIDが決定される。CPU20は、決定したIDを通知するためのID通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S25)。処理はS29に進む。
On the other hand, when it is determined in S15 that the
他方、S21で、ID通知データを受信していないと判断した場合(S21:NO)、CPU20は、ディジーチェーン接続の終端に接続した状態であるかを判断する(S27)。CPU20は、通信I/F26の一方側に他の音声処理装置10またはPC15が接続されており、他方側に他の音声処理装置10およびPC15のいずれも接続されていない場合、ディジーチェーン接続の終端に接続した状態であると判断する。ディジーチェーン接続の終端に接続した状態であると判断した場合(S27:YES)、他の音声処理装置10またはPC15が新たに接続されるのを継続して監視するために、処理はS13に戻る。一方、ディジーチェーン接続の終端に接続した状態でないと判断した場合(S27:NO)、PC15または他の音声処理装置10から送信されたID通知データを受信するのを継続して監視するために、処理はS21に戻る。
On the other hand, if it is determined in S21 that the ID notification data has not been received (S21: NO), the
S29において、CPU20は、S19またはS25でID通知データを送信してから所定時間が経過したかを判断する(S29)。所定時間が経過していないと判断した場合(S29:NO)、処理はS29に戻る。所定時間が経過したと判断した場合(S29:YES)、処理はS31(図4参照)に進む。
In S29, the
例えば、音声処理装置10が図1に示すようにディジーチェーン接続している場合、音声処理装置11は、PC15が接続された場合(S15:YES)、IDとして1を決定し(S17)、通信ケーブルを介して接続した音声処理装置12に対してID通知データを送信する(S19)。音声処理装置12は、音声処理装置11からID通知データを受信し(S21:YES)、IDとして2を決定する(S23)。音声処理装置12は、通信ケーブルを介して接続した音声処理装置13に対してID通知データを送信する(S25)。音声処理装置13は、音声処理装置12からID通知データを受信し(S21:YES)、IDとして3を決定する(S23)。以上のようにして、音声処理装置11、12、13のIDが、其々1、2、3として決定される。
For example, when the
図4に示すように、CPU20は、Xに1を記憶することによって初期化する(S31)。CPU20は、状態テーブル231(図2参照)に記憶されたID、受信音量、および到来方向を削除し、状態テーブル231をクリアする(S33)。CPU20は、RAM22に記憶されたスピーカ音量に0を記憶する(S35)。
As shown in FIG. 4, the
CPU20は、ディジーチェーン接続した音声処理装置10の総数とXとが等しいかを判断する(S37)。Xが総数よりも小さい場合(S37:NO)、CPU20は、XとIDとが一致するかを判断する(S39)。XとIDとが一致すると判断した場合(S39:YES)、CPU20は、RAM22のスピーカ音量に、フラッシュメモリ23のテスト音量を記憶する(S41)。CPU20は、フラッシュメモリ23のテスト音のデータに基づき、スピーカ24からテスト音を出力する(S43)。テスト音はテスト音量でスピーカ24から出力される。スピーカ24からのテスト音の出力が終了した後、CPU20は、RAM22のスピーカ音量に0を記憶する(S45)。CPU20は、Xに1を加算することによってXを更新する(S47)。処理はS37に戻る。
The
一方、S39で、XとIDとが一致しないと判断した場合(S39:NO)、CPU20は、他の音声処理装置10のスピーカ24からテスト音が出力されているかを判断する(S49)。マイク25を介してテスト音を受信することができない場合、CPU20は、他の音声処理装置10がテスト音を出力していないと判断する(S49:NO)。この場合、継続してテスト音の受信を監視するために、処理はS49に戻る。一方、マイク25を介してテスト音を受信した場合、他の音声処理装置10のスピーカ24からテスト音が出力されたと判断する(S49:YES)。CPU20は、マイク25を介して受信したテスト音の受信音量と到来方向を特定する(S51)。CPU20は、この時点でのXを、テスト音を出力した他の音声処理装置10のIDとして特定する。CPU20は、特定した受信音量および到来方向を、特定した他の音声処理装置10のIDに対応付けて、状態テーブル231(図2参照)に記憶する(S53)。CPU20は、Xに1を加算することによってXを更新する(S55)。処理はS37に戻る。
On the other hand, if it is determined in S39 that X and ID do not match (S39: NO), the
S47、およびS55においてXが繰り返し更新され、Xが総数と等しくなった場合(S37:YES)、処理はS61(図5参照)に進む。 When X is repeatedly updated in S47 and S55 and X becomes equal to the total number (S37: YES), the process proceeds to S61 (see FIG. 5).
例えば図1において、音声処理装置11、12、13のIDが、其々1、2、3として決定されている場合、はじめにID 1の音声処理装置11のスピーカ24から、テスト音がテスト音量で出力される(S43)。音声処理装置12、13は、音声処理装置11のスピーカ24から出力されたテスト音を、マイク25を介して受信し、その受信音量および到来方向を特定する(S51)。音声処理装置12、13は、特定した受信音量および到来方向を、ID 1に対応付けて、フラッシュメモリ23の状態テーブル231(図2参照)に記憶する。次に、ID 2の音声処理装置12のスピーカ24から、テスト音がテスト音量で出力される(S43)。音声処理装置11、13は、音声処理装置12のスピーカ24から出力されたテスト音を、マイク25を介して受信し、その受信音量および到来方向を特定する(S51)。音声処理装置11、13は、特定した受信音量および到来方向を、ID 2に対応付けて、状態テーブル231(図2参照)に記憶する。同様の処理が、音声処理装置13のスピーカ24からテスト音が出力された場合にも繰り返される。
For example, in FIG. 1, when the IDs of the
図5に示すように、CPU20は、Mに1を記憶することによって初期化する(S61)。CPU20は、状態テーブル231のうちID Mに対応する受信音量が、所定値(例えば70dB)以上であるかを判断する(S63)。なお所定値は、他の音声処理装置10のスピーカ24から出力された音がマイク25を介して受信された場合に、ハウリングやエコーが発生する可能性のある最小の音量に設定される。ID Mに対応する受信音量が所定値未満である場合(S63:NO)、ID Mの音声処理装置10のスピーカ24から出力される音の音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。CPU20は、Mに1を加算することによってMを更新する(S69)。更新したMに基づいて受信音量の判断を繰り返し実行するために、処理はS63に戻る。
As shown in FIG. 5, the
一方、状態テーブル231のうちID Mに対応する受信音量が所定値以上である場合(S63:YES)、ID Mの音声処理装置10のスピーカ24から出力される音の音量は大きく、エコーやハウリングの発生の要因となる可能性が高い。従って、ID Mの音声処理装置10のスピーカ24から出力される音がマイク25によって集音される場合の受信音量を小さくすることによって、エコーやハウリングの発生を抑制する必要がある。CPU20は、状態テーブル231のうちID Mに対応する到来方向の感度を下げることによって、全体指向性を調整する(S65)。CPU20は、ディジーチェーン接続した音声処理装置10の総数とMとが等しいかを判断する(S67)。Mが総数よりも小さい場合(S67:NO)、CPU20は、Mに1を加算することによってMを更新する(S69)。更新したMに基づいて受信音量の判断を繰り返し実行するため、処理はS63に戻る。S69においてMが繰り返し更新され、Mが総数と等しくなった場合(S67:YES)、全体指向性の調整は終了する。処理はS71に進む。
On the other hand, if the reception volume corresponding to ID M in the state table 231 is greater than or equal to a predetermined value (S63: YES), the volume of the sound output from the
図6は、S61〜S69の処理によって調整された、音声処理装置11〜13の全体指向性のパターンを示している。音声処理装置11(ID:1)、12(ID:2)、13(ID:3)は、左から右側に向かって順番に一直線上に並んで配置されていたとする。そして、音声処理装置11において、図2に示す状態テーブル231が作成されたとする。音声処理装置11、12間の距離は小さいため、図2にて示されているように、音声処理装置12(ID:2)から出力されたテスト音が音声処理装置11において集音された場合の受信音量は大きくなっている(75dB)。この値は所定値(70dB)よりも大きいため(S63:YES、図5参照)、全体指向性が調整される(S65、図5参照)。調整の具体的な方法は次のとおりである。音声処理装置11は、音声処理装置12から送信されたテスト音を受信した場合の受信音量(75dB)が所定値(70dB)以下となるように、到来方向(0deg、図2参照)に近い位置に配置されているマイク25の感度を減衰させる。これによって、音声処理装置11に対して到来方向(0deg)から到来する音の感度を5dB分減衰させる。
FIG. 6 shows the pattern of overall directivity of the
一方、音声処理装置11、13間の距離は十分大きいため、音声処理装置13(ID:3)から出力されたテスト音が音声処理装置11において集音された場合の受信音量は小さくなっている(63dB、図2参照)。この値は所定値(70dB)よりも小さいため(S63:NO、図5参照)、全体指向性は調整されない。以上の結果、図6に示すように、音声処理装置11の全体指向性のパターン31は、音声処理装置11に対して音声処理装置12が配置されている方向(図6の右方向)の感度が、他の方向の感度に比べて5dB分小さくなっている。
On the other hand, since the distance between the
一方、音声処理装置12では、音声処理装置11との間の距離、および、音声処理装置13との間の距離の両方が小さくなっている。従って音声処理装置12の全体指向性のパターン32は、音声処理装置12に対して音声処理装置11が配置されている方向(図6の左方向)、および、音声処理装置12に対して音声処理装置13が配置されている方向(図6の右方向)の両方の感度が、他の方向の感度に比べて小さくなっている。
On the other hand, in the
以上のように音声処理装置10では、音声処理装置10に向けて特定の方向から到来する音に対する感度を減衰させることによって、他の音声処理装置10から出力された音を受信した場合の受信音量を選択的に減衰させることができる。これによって音声処理装置10は、他の音声処理装置10から出力された音が要因となってエコーやハウリングが発生することを効果的に抑止できる。また音声処理装置10は、他の音声処理装置10から出力された音を受信した場合の受信音量が所定値以下となるように、特定の方向に近い位置に配置されたマイク25の感度を調整し、全体指向性を調整する。これによって、エコーやハウリングが発生しないレベルまで受信音量を効率的に減衰させることができる。これによって音声処理装置10は、エコーやハウリングの発生を更に効果的に抑止することができる。
As described above, the
図5に示すように、全体指向性が調整された後、CPU20は、他拠点に設置された他の音声処理装置との間で音声のデータの通信を行うことによって、音声による遠隔会議を開始する。遠隔会議の開始後、CPU20は、スピーカ音量を変更する操作が入力部27を介してユーザによって行われたかを判断する(S71)。スピーカ音量を変更する操作が行われたと判断した場合(S71:YES)、CPU20は、変更後のスピーカ音量をRAM22に記憶する。CPU20は、スピーカ24から出力される音の音量を、RAM22に記憶したスピーカ音量に基づいて変更する。
As shown in FIG. 5, after the overall directivity is adjusted, the
音声処理装置10のスピーカ音量が変更された場合、他の音声処理装置10では、S65で調整した全体指向性を、変更後のスピーカ音量に基づいて再調整する必要がある。CPU20は、変更前のスピーカ音量と変更後のスピーカ音量との差分を他の音声処理装置10に対して通知するための変更通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S73)。処理はS61に戻る。
When the speaker volume of the
S71で、スピーカ音量を変更する操作が行われていないと判断した場合(S71:NO)、CPU20は、他の音声処理装置10から変更通知データを受信したかを判断する(S75)。変更通知データを受信したと判断した場合(S75:YES)、CPU20は、ディジーチェーン接続された全ての音声処理装置10に変更通知データが到達するように、変更通知データを中継転送する。例えば音声処理装置12(図1参照)が音声処理装置11(図1参照)から変更通知データを受信した場合、音声処理装置12のCPU20は、受信した変更通知データを音声処理装置13(図1参照)に対して中継転送する。次にCPU20は、受信した変更通知データによって通知された差分に基づいて、状態テーブル231の内容を更新する。具体的には以下の通りである。
If it is determined in S71 that the operation for changing the speaker volume has not been performed (S71: NO), the
CPU20は、状態テーブル231のうち、変更通知データを送信した音声処理装置10のIDに対応する受信音量を選択する。CPU20は、受信した変更通知データによって通知された差分を、選択した受信音量に加算することによって、状態テーブル231を更新する(S79)。例えば、他の音声処理装置10においてスピーカ音量が10dB分大きくなるように変更されていたとする。この場合、変更通知データによって通知される差分は+10dBとなる。CPU20は、通知された差分+10dBを、状態テーブル231から選択した受信音量に加算することで、状態テーブル231を更新する。処理はS61に戻る。
The
CPU20は、更新した状態テーブル231に基づいて、其々のIDに対応する受信音量が所定値以上であるかを判断する(S63)。受信音量が所定値未満である場合(S63:NO)、変更後のスピーカ音量で他の音声処理装置10のスピーカ24から出力される音野音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。この場合、全体指向性は再調整されない。一方、受信音量が所定値以上である場合(S63:YES)、変更後のスピーカ音量で他の音声処理装置10のスピーカ24から出力される音の音量は大きく、エコーやハウリングの発生の要因となる可能性が高い。従って、エコーやハウリングの発生を抑制するために、CPU20は全体指向性を再調整する(S65)。具体的には、スピーカ音量が変更された他の音声処理装置10が配置されている方向を、状態テーブル231の到来方向によって特定し、特定した方向に近い位置に配置されたマイク25の感度を減衰させることによって、全体指向性を再調整する。詳細は、テスト音を使用して実行された全体指向性の調整方法と同一であるので、説明を省略する。
Based on the updated state table 231, the
他の音声処理装置10のスピーカ音量が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整される必要がある。これに対して本実施形態では、他の音声処理装置10における変更後のスピーカ音量に基づいて、全体指向性を再調整することができる。これによって音声処理装置10は、全体指向性を最適な状態に再調整することができる。また、スピーカ音量の変更前後での差分に応じて全体指向性が調整されるので、再度、他の音声処理装置10のスピーカ24からテスト音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。従って音声処理装置10は、全体指向性を迅速に再調整することができる。
When the speaker volume of another
さらに音声処理装置10は、他の音声処理装置10のスピーカ音量の変更前後での差分に基づいて全体指向性を再調整することによって、他の音声処理装置10のスピーカ24から出力される音の音量の変化の程度に応じ、全体指向性を最適な状態に調整することができる。
Furthermore, the
S75で、変更通知データを受信していないと判断した場合(S75:NO)、CPU20は、マイク感度を変更する操作が入力部27を介してユーザによって行われたかを判断する(S77)。マイク感度を変更する操作が行われていないと判断した場合(S77:NO)、処理はS81に進む。一方、マイク感度を変更する操作が行われたと判断した場合(S77:YES)、CPU20は、変更後のマイク感度をRAM22に記憶する。CPU20は、マイク25を介して音を集音する場合の感度を、RAM22に記憶したマイク感度に基づいて変更する。
If it is determined in S75 that the change notification data has not been received (S75: NO), the
音声処理装置10のマイク感度が変更された場合、S65で調整した全体指向性を、変更後のマイク感度に基づいて再調整する必要がある。CPU10は、変更前後でのマイク感度の差分を算出する。CPU20は、算出した差分を、状態テーブル231に記憶されているすべての受信音量に加算することによって、状態テーブル231を更新する(S79)。例えば、マイクの感度が10dB分小さくなるように変更されていたとする。この場合、変更前後でのマイク感度の差分は−10dBとなる。CPU20は、算出された差分−10dBを、状態テーブル231に記憶されたすべての受信音量に加算することで、状態テーブル231を更新する。処理はS61に戻る。
When the microphone sensitivity of the
CPU20は、更新した状態テーブル231に基づいて、其々のIDに対応する受信音量が所定値以上であるかを判断する(S63)。受信音量が所定値未満である場合(S63:NO)、変更後のマイク感度で他の音声処理装置10のスピーカ24から出力された音を受信した場合、受信音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。この場合、全体指向性は再調整されない。一方、受信音量が所定値以上である場合(S63:YES)、変更後のマイク感度で他の音声処理装置10のスピーカ24から出力された音を受信した場合、受信音量は大きくなり、エコーやハウリングの発生の要因となる可能性が高い。従って、エコーやハウリングの発生を抑制するために、CPU20は全体指向性を再調整する(S65)。具体的には、状態テーブル231のうち所定値よりも大きい受信音量に対応する到来方向の近くに配置されたマイク25の感度を減衰させることによって、全体指向性を再調整する。詳細は、テスト音を使用して実行されたマイク25の指向性の調整方法と同一であるので、説明を省略する。
Based on the updated state table 231, the
マイク25の感度が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も再度調整される必要がある。これに対して本実施形態では、感度の変更前後での差分を算出し、差分に基づいて全体指向性を再調整することができる。これによって音声処理装置10は、マイク25の感度の変化の程度に応じ、全体指向性を最適な状態に再調整することができる。また、差分に応じて全体指向性が調整されるので、再度、他の音声処理装置10のスピーカ24からテスト音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。従って音声処理装置10は、全体指向性を迅速に再調整することができる。
When the sensitivity of the
S81において、CPU20は、ディジーチェーン接続された状態の音声処理装置10に対して新たに別の音声処理装置10が接続されたかを判断する(S81)。別の音声処理装置10が接続されたと判断した場合(S81:YES)、テスト音を出力することによって全体指向性を調整する処理を最初から実行するために、処理はS31(図4参照)に戻る。別の音声処理装置10が接続されていないと判断した場合(S81:NO)、処理はS71に戻る。
In S81, the
以上説明したように、音声処理装置10は、複数の音声処理装置10が相互に接続され、同一拠点内に設置された状態で使用される場合であっても、他の音声処理装置10から出力された音が要因でエコーやハウリングが発生することを抑止することができる。また、音声処理装置10が通常備える周知のエコー除去機能をそのまま利用することができるため、新たにエコー除去のための特別な機能を音声処理装置10に実装する必要がない。このため、音声処理装置10のコストを抑制しつつ、複数の音声処理装置10が接続された場合のエコーやハウリングの発生を効率的に抑止することができる。
As described above, the
また音声処理装置10は、ID通知データの通信を行うことによって、テスト音を出力するタイミングを容易に決定することができる。従って、音声処理装置10を使用するユーザや、音声処理装置10を制御する制御機器によって、音声処理装置10からテスト音を所定のタイミングで出力させる制御を行うことを要することなく、音声処理装置10は、独自にタイミングを判断してテスト音を出力することができる。
The
なお、S19、S25の処理を行うCPU20が本発明の「通信制御手段」に相当する。S39の処理を行うCPU20が本発明の「第一特定手段」に相当する。S43の処理を行うCPU20が本発明の「出力制御手段」に相当する。S51の処理を行うCPU20が本発明の「第二特定手段」に相当する。S65の処理を行うCPU20が本発明の「第一調整手段」「第二調整手段」に相当する。S73の処理を行うCPU20が本発明の「送信手段」に相当する。S75の処理を行うCPU20が本発明の「受信手段」に相当する。S19、S25の処理が本発明の「通信制御ステップ」に相当する。S23の処理が本発明の「第一特定ステップ」に相当する。S43の処理が本発明の「出力制御ステップ」に相当する。S51の処理が本発明の「第二特定ステップ」に相当する。S65の処理が本発明の「第一調整ステップ」に相当する。
The
なお本発明は上述の実施形態に限定されず、種々の変更が可能である。上述では、音声処理装置10はディジーチェーン接続されていたが、他の接続形態、例えばツリー型、リング型、スター型等の接続形態で音声処理装置10が接続されてもよい。音声処理装置10は、通信ケーブルによって相互に接続されていたが、音声処理装置10は無線によって相互に接続されてもよい。音声処理装置10は、スピーカ24およびマイク25を備えていない構成であってもよく、外部のスピーカおよびマイクを接続可能とする構成であってもよい。
In addition, this invention is not limited to the above-mentioned embodiment, A various change is possible. In the above description, the
上述では、音声処理装置10間でID通知データの通信を行うことによって、其々の音声処理装置10がIDを決定していた。また音声処理装置10は、決定したIDの順番でテスト音を送信していた。これに対し、PC15が音声処理装置10にID通知データを送信することによって、PC15が音声処理装置10のIDを一括決定してもよい。また、PC15が音声処理装置10に制御信号を送信することによって、其々の音声処理装置10がテスト音を出力するタイミングが制御されてもよい。例えば音声処理装置10は、PC15から通知されたタイミングで、テスト音を出力してもよい。
In the above description, each
例えば音声処理装置10は、テスト音を出力するタイミングで、RAM22のスピーカ音量にテスト音量を記憶する制御のみを行ってもよい。PC15は、音声処理装置10に対して継続的にテスト音のデータを送信してもよい。音声処理装置10は、PC15から受信したテスト音のデータに基づき、スピーカ音量にテスト音量が記憶されている場合にのみ、テスト音をスピーカ24から出力してもよい。
For example, the
音声処理装置10は、状態テーブル231に記憶された受信音量を到来方向毎に加算してもよい。音声処理装置10は、加算した受信音量が所定値以上となった場合に、対応する到来方向の感度が減衰するように全体指向性を調整してもよい。
The
全体指向性の調整方法は、上述の実施形態に限定されない。上述において音声処理装置10は、状態テーブル231の受信音量が所定値以上である場合に、受信音量が所定値となる様にマイク25の感度を調整していた。これに対し、所定値から所定のマージン分を減算し、受信音量がこの値となるように、マイク25の感度を調整してもよい。
The method of adjusting the overall directivity is not limited to the above-described embodiment. In the above description, the
上述において音声処理装置10は、スピーカ音量の差分を通知する変更通知データを他の音声処理装置10に対して送信していた。これに対して音声処理装置10は、変更後のスピーカ音量を通知する変更通知データを他の音声処理装置10に対して送信してもよい。また音声処理装置10は、このような変更通知データを他の音声処理装置10から受信した場合、受信した変更通知データによって通知された変更後のスピーカ音量をテスト音量から減算することによって差分を算出してもよい。音声処理装置10は、算出した差分に基づいて、全体指向性を再調整してもよい。
In the above description, the
状態テーブル231に記憶された情報に基づき、音声処理装置10のネットワーク構成を特定してもよい。例えば図8に示す状態テーブル231が音声処理装置11において作成されたとする。ID 3の音声処理装置13から出力されたテスト音が集音された場合の受信音量(85dB)の方が、ID 2の音声処理装置12から出力されたテスト音が集音された場合の受信音量(75dB)よりも大きくなっている。この場合、音声処理装置12よりも音声処理装置13の方が、音声処理装置11の近くに配置されていることになる。またID 3の音声処理装置13から出力されたテスト音の到来方向は45degとなっている。従って音声処理装置11は、図9に示すように、音声処理装置11、12が並んで配置されており、音声処理装置13が音声処理装置11側に近づくように且つ音声処理装置11に対して45度の位置に配置されていることを認識する。音声処理装置11は、認識したネットワーク構成に基づいて全体指向性を調節することができるようになる。このように音声処理装置11は、テスト音の受信音量および到来方向に基づいて、音声処理装置11、12、13のネットワーク構成を特定し、特定したネットワーク構成に基づいて全体指向性を調節することができる。
Based on the information stored in the state table 231, the network configuration of the
1 会議システム
10、11、12、13 音声処理装置
23 フラッシュメモリ
24 スピーカ
25 マイク
231 状態テーブル
1
Claims (8)
他の音声処理装置と通信を行う通信制御手段と、
前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、
前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、
前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、
前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段と、
前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信手段と、
前記他の音声処理装置によって送信された前記変更通知を受信する受信手段と、
前記受信手段によって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段と
を備えたことを特徴とする音声処理装置。 An audio processing device including a microphone and a speaker,
Communication control means for communicating with other audio processing devices;
First specifying means for specifying timing for outputting a predetermined sound from the speaker by communicating with the other sound processing device by the communication control means;
Output control means for performing control to output the predetermined sound at a predetermined volume from the speaker at the timing specified by the first specifying means;
When the predetermined sound output at the predetermined volume from another speaker connected to the other audio processing device is acquired via the microphone, the volume and direction of arrival of the acquired predetermined sound are specified. Two specific means;
First adjusting means for adjusting overall directivity, which is directivity of sensitivity to sound arriving at the sound processing device, based on the volume and the arrival direction specified by the second specifying means, the sound processing; First adjusting means for adjusting the overall directivity so that sensitivity to sound coming from a specific direction toward the device is attenuated ;
A transmission means for transmitting a change notification for notifying information for specifying the volume after the change to the other audio processing device when the volume when the sound is output from the speaker is changed;
Receiving means for receiving the change notification transmitted by the other audio processing device;
Second adjustment means for readjusting the overall directivity adjusted by the first adjustment means based on the information notified by the change notification when the change notification is received by the reception means; A speech processing apparatus comprising:
前記第二特定手段によって特定された前記音量が所定閾値以上である場合に、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整することを特徴とする請求項1に記載の音声処理装置。 The first adjusting means includes
The overall directivity is adjusted by attenuating sensitivity in the direction of arrival corresponding to the volume when the volume specified by the second specifying unit is equal to or greater than a predetermined threshold. The speech processing apparatus according to 1.
前記マイクを介して前記所定音を取得した場合の音量が前記所定閾値以内となるように、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整することを特徴とする請求項2に記載の音声処理装置。 The first adjusting means includes
The global directivity is adjusted by attenuating the sensitivity in the arrival direction corresponding to the volume so that the volume when the predetermined sound is acquired via the microphone is within the predetermined threshold. The speech processing apparatus according to claim 2.
前記第二調整手段は、
前記変更通知によって通知された前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整することを特徴とする請求項1から3のいずれかに記載の音声処理装置。 The transmission means calculates the difference in the volume before and after the change, transmits the change notification for notifying the difference,
The second adjusting means is
Based on the difference notified by the change notification, a voice processing device according to any one of claims 1 to 3, characterized in that the re-adjust the whole directional adjusted by the first adjusting means.
他の音声処理装置と通信を行う通信制御手段と、
前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、
前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、
前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、
前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段と、
前記マイクが音を集音する場合の感度が変更された場合に、変更前後での前記感度の差分を算出し、算出した前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段と
を備えたことを特徴とする音声処理装置。 An audio processing device including a microphone and a speaker,
Communication control means for communicating with other audio processing devices;
First specifying means for specifying timing for outputting a predetermined sound from the speaker by communicating with the other sound processing device by the communication control means;
Output control means for performing control to output the predetermined sound at a predetermined volume from the speaker at the timing specified by the first specifying means;
When the predetermined sound output at the predetermined volume from another speaker connected to the other audio processing device is acquired via the microphone, the volume and direction of arrival of the acquired predetermined sound are specified. Two specific means;
First adjusting means for adjusting overall directivity, which is directivity of sensitivity to sound arriving at the sound processing device, based on the volume and the arrival direction specified by the second specifying means, the sound processing; First adjusting means for adjusting the overall directivity so that sensitivity to sound coming from a specific direction toward the device is attenuated;
When the sensitivity when the microphone collects sound is changed, the difference between the sensitivity before and after the change is calculated, and the omnidirectional adjusted by the first adjustment unit based on the calculated difference features and to Ruoto voice processing apparatus further comprising a <br/> a second adjusting means for readjusting sex.
前記通信制御手段によって、前記音声処理装置および前記他の音声処理装置に対して順番に割り当てられる識別情報に基づいて、前記タイミングを特定することを特徴とする請求項1から5のいずれかに記載の音声処理装置。 The first specifying means includes
By the communication control means, based on the identification information sequentially assigned to the voice processing device and the other speech processing apparatus, according to any one of claims 1 to 5, characterized in that identifying the timing Voice processing device.
前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、
前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、
前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、
前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと、
前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信ステップと、
前記他の音声処理装置によって送信された前記変更通知を受信する受信ステップと、
前記受信ステップによって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整ステップによって調整された前記全体指向性を再調整する第二調整ステップと
を備えたことを特徴とする音声処理方法。 A communication control step for communicating with other audio processing devices;
A first specifying step of specifying a timing for outputting a predetermined sound from a speaker of the sound processing device by performing communication with the other sound processing device in the communication control step;
An output control step for performing control to output the predetermined sound from the speaker at a predetermined volume at the timing specified by the first specifying step;
When the predetermined sound output at the predetermined volume from another speaker connected to the other audio processing apparatus is acquired via the microphone of the audio processing apparatus, the volume and direction of arrival of the acquired predetermined sound A second identification step for identifying
A first adjustment step of adjusting a global directivity, which is a directivity of sensitivity to sound arriving at the sound processing device, based on the volume and the arrival direction specified by the second specifying step, the sound processing A first adjustment step of adjusting the global directivity so that sensitivity to sound coming from a specific direction toward the device is attenuated ;
A transmission step of transmitting, to the other audio processing device, a change notification for notifying information for specifying the volume after the change when the volume when the sound is output from the speaker is changed;
A receiving step of receiving the change notification transmitted by the other audio processing device;
A second adjustment step for readjusting the global directivity adjusted by the first adjustment step based on the information notified by the change notification when the change notification is received by the reception step; A speech processing method characterized by comprising:
前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、
前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、
前記他の音声処理装置の制御によって、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、
前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと、
前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信ステップと、
前記他の音声処理装置によって送信された前記変更通知を受信する受信ステップと、
前記受信ステップによって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整ステップによって調整された前記全体指向性を再調整する第二調整ステップと
を前記音声処理装置のコンピュータに実行させるための音声処理プログラム。 A communication control step for communicating with other audio processing devices;
A first specifying step of specifying a timing for outputting a predetermined sound from a speaker of the sound processing device by performing communication with the other sound processing device in the communication control step;
An output control step for performing control to output the predetermined sound from the speaker at a predetermined volume at the timing specified by the first specifying step;
When the predetermined sound output at the predetermined volume from another speaker connected to the other sound processing device is acquired through the microphone of the sound processing device under the control of the other sound processing device. A second specifying step of specifying the volume and direction of arrival of the acquired predetermined sound;
A first adjustment step of adjusting a global directivity, which is a directivity of sensitivity to sound arriving at the sound processing device, based on the volume and the arrival direction specified by the second specifying step, the sound processing A first adjustment step of adjusting the global directivity so that sensitivity to sound coming from a specific direction toward the device is attenuated ;
A transmission step of transmitting, to the other audio processing device, a change notification for notifying information for specifying the volume after the change when the volume when the sound is output from the speaker is changed;
A receiving step of receiving the change notification transmitted by the other audio processing device;
A second adjustment step for readjusting the global directivity adjusted by the first adjustment step based on the information notified by the change notification when the change notification is received by the reception step; Is a voice processing program for causing the computer of the voice processing apparatus to execute the program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011217119A JP5780096B2 (en) | 2011-09-30 | 2011-09-30 | Audio processing apparatus, audio processing method, and audio processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011217119A JP5780096B2 (en) | 2011-09-30 | 2011-09-30 | Audio processing apparatus, audio processing method, and audio processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013078010A JP2013078010A (en) | 2013-04-25 |
JP5780096B2 true JP5780096B2 (en) | 2015-09-16 |
Family
ID=48481165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011217119A Expired - Fee Related JP5780096B2 (en) | 2011-09-30 | 2011-09-30 | Audio processing apparatus, audio processing method, and audio processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5780096B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111613248A (en) * | 2020-05-07 | 2020-09-01 | 北京声智科技有限公司 | Pickup testing method, device and system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07254870A (en) * | 1994-03-16 | 1995-10-03 | Mitsubishi Electric Corp | Method and device for preventing howling in communication system |
JP4675088B2 (en) * | 2004-11-19 | 2011-04-20 | ティーオーエー株式会社 | Conference system |
JP5175262B2 (en) * | 2009-12-02 | 2013-04-03 | 日本電信電話株式会社 | Voice acquisition device |
-
2011
- 2011-09-30 JP JP2011217119A patent/JP5780096B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013078010A (en) | 2013-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8644517B2 (en) | System and method for automatic disabling and enabling of an acoustic beamformer | |
CN107231473B (en) | Audio output regulation and control method, equipment and computer readable storage medium | |
WO2020019821A1 (en) | Microphone hole-blockage detection method and related product | |
CN110459221A (en) | The method and apparatus of more equipment collaboration interactive voices | |
CN103501375A (en) | Method and device for controlling sound effect | |
JP7230188B2 (en) | Transmission processing method, terminal and control node | |
CN107785027B (en) | Audio processing method and electronic equipment | |
US20090214010A1 (en) | Selectively-Expandable Speakerphone System and Method | |
WO2020063069A1 (en) | Audio playing method and apparatus, electronic device and computer-readable medium | |
WO2013127302A1 (en) | Method and terminal for preventing voice crosstalk between external loudspeaker and microphone | |
CN104023144A (en) | Mobile terminal ring tone control method and device | |
EP3098721B1 (en) | Communication method and terminal | |
WO2020019857A1 (en) | Microphone hole blocking detection method and related product | |
WO2023005125A1 (en) | Bluetooth headset mode control method and device, and computer-readable storage medium | |
JP5973289B2 (en) | Portable terminal, voice control program, and voice control method | |
JP5845787B2 (en) | Audio processing apparatus, audio processing method, and audio processing program | |
KR101950305B1 (en) | Acoustical signal processing method and device of communication device | |
CN111371705A (en) | Download task execution method and electronic equipment | |
WO2023116769A1 (en) | Audio data processing method and electronic device | |
JP5780096B2 (en) | Audio processing apparatus, audio processing method, and audio processing program | |
CN103238312A (en) | Controlling audio signals | |
JP2014131096A (en) | Sound controller, sound control method, and sound control program | |
CN112312273B (en) | Sound playing method, sound receiving method and electronic equipment | |
CN110677770A (en) | Sound production control method, electronic device, and medium | |
CN109831583B (en) | Audio playing control method and terminal equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5780096 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |