JP5051235B2 - Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device - Google Patents
Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device Download PDFInfo
- Publication number
- JP5051235B2 JP5051235B2 JP2009536910A JP2009536910A JP5051235B2 JP 5051235 B2 JP5051235 B2 JP 5051235B2 JP 2009536910 A JP2009536910 A JP 2009536910A JP 2009536910 A JP2009536910 A JP 2009536910A JP 5051235 B2 JP5051235 B2 JP 5051235B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound signal
- signal
- echo
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、音信号に基づいて音を出力する音出力装置と、音が入力される音入力装置と、該音入力装置が入力した音から、前記音出力装置が出力した音に基づくエコーを抑圧するエコー抑圧装置とを備えるエコー抑圧システム、該エコー抑圧システムに適用されるエコー抑圧方法、前記エコー抑圧システムにて用いられるエコー抑圧装置を実現するためのエコー抑圧プログラム、前記エコー抑圧システムにて用いられるエコー抑圧装置及び音出力装置に関する。 The present invention relates to a sound output device that outputs sound based on a sound signal, a sound input device to which sound is input, and an echo based on the sound output by the sound output device from the sound input by the sound input device. In an echo suppression system comprising an echo suppression device for suppression, an echo suppression method applied to the echo suppression system, an echo suppression program for realizing an echo suppression device used in the echo suppression system, and the echo suppression system about the echo suppressor and a sound output equipment used.
例えば、従来のカーナビゲーションシステムにおける音声認識では、話者が発声する前に発話スイッチを押下することにより、カーナビゲーションシステムを消音し、カーナビゲーションシステムのスピーカから出力された音が、エコーとしてマイクロホンに回り込み、音声の誤認識の要因となることを防止している。これに対し、出力音を消音することなく音声認識による操作を行いたいという使用者からの要望がある。この様な要望に応えるためにはスピーカからマイクロホンに回り込む音を抑圧するエコー抑圧方法が必要となる。また車両内の音響、即ちカーオーディオシステムでは、マルチチャネルに対応すべく複数のスピーカが用いられているため、マルチチャネルのカーオーディオシステムから音声認識等の用途に用いられるマイクロホンに回り込むエコーに対応するエコー抑圧方法が要求される。 For example, in speech recognition in a conventional car navigation system, the car navigation system is muted by pressing the utterance switch before the speaker speaks, and the sound output from the speaker of the car navigation system is echoed to the microphone. This prevents wraparound and misrecognition of voice. On the other hand, there is a request from the user to perform an operation by voice recognition without muting the output sound. In order to meet such a demand, an echo suppression method for suppressing the sound that circulates from the speaker to the microphone is required. In addition, in a car audio system, that is, in a car audio system, a plurality of speakers are used to support multi-channel, so that it corresponds to an echo that circulates from a multi-channel car audio system to a microphone used for voice recognition or the like. An echo suppression method is required.
そこでモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置が提案されている。図1は、従来の第1のエコー抑圧装置の構成を示す模式図である。図1中1000は、エコー抑圧装置であり、エコー抑圧装置1000は、マルチチャネルオーディオ2000から出力された複数チャネルの音信号を、複数のスピーカ2001,2001,…へ出力し、各スピーカ2001,2001,…は、夫々の音信号に基づく出力を行う。そしてエコー抑圧装置1000は、マイクロホン2002にて受音した音から、出力された複数チャネルの音に基づくエコーを除去する。エコーの除去は、受音した音に基づく観測音信号y(t)から、出力する複数チャネル(n)の音に基づく参照音信号x1(t),…,xn(t)を、夫々のチャネルの参照音信号x1(t),…,xn(t)に対応した複数の抑圧機構(エコーキャンセラ)1001−1,…,1001−nにて夫々に対応するエコーを抑圧することにより行う。
Therefore, an echo suppression apparatus has been proposed in which an echo suppression method corresponding to a monaural channel audio system is applied to a multi-channel audio system. FIG. 1 is a schematic diagram showing a configuration of a conventional first echo suppressor. In FIG. 1,
またモノラルチャネルのオーディオシステムに対応するエコー抑圧方法をマルチチャネルのオーディオシステムに適用したエコー抑圧装置は、図1以外の形態についても提案されている。図2は、従来の第2のエコー抑圧装置の構成を示す模式図である。第2のエコー抑圧装置1000は、複数チャネルの音に基づく参照音信号x1(t),…,xn(t)を加算する加算機構1002にて加算参照音信号x(t)を生成し、一の抑圧機構1001にて、観測音信号y(t)から、加算参照音信号x(t)に基づいてエコーを抑圧する。
An echo suppressor that applies an echo suppression method corresponding to a monaural channel audio system to a multi-channel audio system has also been proposed for forms other than FIG. FIG. 2 is a schematic diagram showing a configuration of a conventional second echo suppression device. The
図3は、従来のエコー抑圧装置が備える抑圧機構1001の機能構成を示す機能ブロック図である。抑圧機構1001は、話者が発声しているダブルトークの状態及び発声していないシングルトークの状態を検出する検出部10010と、学習同定法を用いた適応処理により、エコーの推定に要するフィルタ係数を更新するフィルタ係数更新部10011と、フィルタ係数を用いた数百次の積和演算により、参照音信号x(t)から、エコー信号x'(t)を推定する線形FIRフィルタ部10012と、観測音信号y(t)からエコー信号x'(t)を減算することによりエコーの抑圧を行った抑圧結果r(t)を出力する減算部10013とを備えている。検出部10010は、抑圧結果r(t)の強度変化に基づいてシングルトークの状態とダブルトークの状態とを検出し、ダブルトークの状態時には、フィルタ係数更新部10011のフィルタ係数の更新を停止させる。フィルタ係数更新部10011は、抑圧結果r(t)に基づいてフィルタ係数を算出する。
FIG. 3 is a functional block diagram showing a functional configuration of a
なお図1に示したエコー抑圧装置1000では、図3に示す抑圧機構1001を参照音信号x1(t),…,xn(t)毎に備えている。この様なエコー抑圧方法は、例えば特許文献1に開示されている。
しかしながら図1に示した様に各チャネルに対応する抑圧機構を要する方法では、コストの増加、装置の大型化等の問題がある。特に設置スペースの制約が大きいカーナビゲーションシステムに適用する場合、大型化の問題は深刻である。 However, the method requiring a suppression mechanism corresponding to each channel as shown in FIG. 1 has problems such as an increase in cost and an increase in the size of the apparatus. In particular, when applied to a car navigation system having a large installation space restriction, the problem of enlargement is serious.
さらに図2に示した様に参照音信号を加算してモノラルチャネルの加算参照音信号とした場合には、抑圧できていない残留エコーが大きくなるという問題が生じる。これはマルチチャネルオーディオ2000による音楽等の音の出力では、各スピーカの再生音及び強度が独立して変化するため、複数経路のエコーを一の適応処理にて学習すると、推定精度が低下するためである。
Further, as shown in FIG. 2, when the reference sound signals are added to obtain a mono channel addition reference sound signal, there arises a problem that the residual echo that cannot be suppressed increases. This is because in the output of sound such as music by the
本発明は斯かる事情に鑑みてなされたものであり、複数チャネルの音信号に対して異なる周波数帯域の成分を通過させ、また夫々異なる周波数帯域の成分の複数の音信号を加算した参照音信号及び入力された音を変換した観測音信号に基づいて、観測音信号に含まれるエコーを抑圧することにより、一つの抑圧機構で複数チャネルに対応するエコーの抑圧を行うことができるので、コストの増加及び装置の大型化を抑制することが可能であり、また観測音信号の任意の周波数には、一のチャネルの音信号に基づく一の経路のエコーのみが含まれているため、エコーの推定精度を上げることができ、残留エコーを抑制することが可能なエコー抑圧システム、該エコー抑圧システムに適用されるエコー抑圧方法、前記エコー抑圧システムにて用いられるエコー抑圧装置を実現するためのエコー抑圧プログラム、前記エコー抑圧システムにて用いられるエコー抑圧装置及び音出力装置の提供を目的とする。 The present invention has been made in view of such circumstances, and a reference sound signal in which components of different frequency bands are passed through a sound signal of a plurality of channels and a plurality of sound signals of components of different frequency bands are added. In addition, by suppressing the echo included in the observation sound signal based on the observation sound signal obtained by converting the input sound, it is possible to suppress the echo corresponding to a plurality of channels with a single suppression mechanism. It is possible to suppress an increase in the size and size of the apparatus, and since an arbitrary frequency of the observation sound signal includes only one path echo based on the sound signal of one channel, it is possible to estimate the echo. Echo suppression system capable of increasing accuracy and suppressing residual echo, echo suppression method applied to the echo suppression system, used in the echo suppression system Echo suppressing program for realizing the echo suppressor which is directed to the provision of the echo suppressor and a sound output equipment used in the echo suppressing system.
第1のエコー抑圧システムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを備えるエコー抑圧システムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部とを有することを要件とする。 A first echo suppression system includes: a sound output device that outputs sound based on a sound signal; a sound input device that converts an input sound into a sound signal; and a sound input from the sound input device, In an echo suppression system comprising an echo suppression device that suppresses echo based on sound output from an output device, the sound output device includes a passing unit that allows a plurality of sound signals to pass through components in different frequency bands, and A plurality of sound output units that output sounds based on the plurality of sound signals that have passed through the passage unit, respectively, and an addition unit that generates a reference sound signal by adding the plurality of sound signals that have passed through the passage unit. The echo suppression device suppresses an echo included in the observation sound signal based on the input unit that receives the sound signal from the sound input device as an observation sound signal, and the observation sound signal and the reference sound signal. The above view It is a requirement to have a correcting unit for correcting a sound signal.
第2のエコー抑圧システムは、第1のエコー抑圧システムにおいて、前記通過部は、複数の音信号を夫々周波数軸上の成分に変換する第1変換部と、周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる帯域通過フィルタ部と、夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、夫々時間軸上の音信号に変換する第2変換部とを有することを要件とする。 The second echo suppression system is the first echo suppression system, wherein the passing unit includes a first conversion unit that converts a plurality of sound signals into components on the frequency axis, and a plurality of components that are converted into components on the frequency axis. A plurality of sound signals converted to components on the frequency axis through which the components of the different frequency bands are passed and the components on the frequency axis through which the components of the respective frequency bands are passed. It is a requirement to have a second conversion unit for converting into the above sound signal.
第3のエコー抑圧システムは、第2のエコー抑圧システムにおいて、前記通過部が夫々異なる周波数帯域の成分を通過させる複数の音信号は、第1音信号、第2音信号、第1音信号及び/又は第2音信号を所定の加工方法で加工した加工音信号であり、前記帯域通過フィルタ部は、音信号毎にフィルタ係数が設定されてあり、第1音信号に対して第1フィルタ係数、第2音信号に対して第2フィルタ係数、並びに加工音信号に対して加工方法に応じた第1フィルタ係数及び/又は第2フィルタ係数に基づく加工フィルタ係数が夫々設定されていることを要件とする。 The third echo suppression system is the second echo suppression system, wherein the plurality of sound signals through which the passing section passes components of different frequency bands are a first sound signal, a second sound signal, a first sound signal, and And / or a processed sound signal obtained by processing the second sound signal by a predetermined processing method, wherein the band-pass filter unit has a filter coefficient set for each sound signal, and the first filter coefficient for the first sound signal The second filter coefficient is set for the second sound signal, and the first filter coefficient and / or the processing filter coefficient based on the second filter coefficient corresponding to the processing method is set for the processed sound signal. And
第4のエコー抑圧システムは、第3のエコー抑圧システムにおいて、前記加工音信号は、前記第1音信号及び前記第2音信号の和である和音信号、前記第1音信号を所定時間遅延させた遅延第1音信号、並びに前記第2音信号を所定時間遅延させた遅延第2音信号であり、前記加工フィルタ係数は、和音信号に対して第1音信号及び第2音信号の和に基づくフィルタ係数、遅延第1音信号に対して第1フィルタ係数に基づくフィルタ係数、並びに遅延第2音信号に対して第2フィルタ係数に基づくフィルタ係数が夫々設定されていることを要件とする。 The fourth echo suppression system is the third echo suppression system, wherein the processed sound signal delays the chord signal, which is the sum of the first sound signal and the second sound signal, and the first sound signal by a predetermined time. The delayed first sound signal and the delayed second sound signal obtained by delaying the second sound signal for a predetermined time, and the processing filter coefficient is the sum of the first sound signal and the second sound signal with respect to the chord signal. It is a requirement that a filter coefficient based on the first filter coefficient is set for the delayed first sound signal, and a filter coefficient based on the second filter coefficient is set for the delayed second sound signal.
第5のエコー抑圧システムは、第1乃至第4のいずれかのエコー抑圧システムにおいて、前記通過部は、等間隔に分割した周波数帯域の成分を通過させる様にしてあることを要件とする。 According to a fifth echo suppression system, in any one of the first to fourth echo suppression systems, the passage section is configured to pass components in a frequency band divided at equal intervals.
第6のエコー抑圧システムは、第1乃至第4のいずれかのエコー抑圧システムにおいて、前記通過部は、対数値が等間隔となるように分割した周波数帯域の成分を通過させる様にしてあることを要件とする。 In a sixth echo suppression system, in any one of the first to fourth echo suppression systems, the passing unit allows a frequency band component divided so that logarithmic values are equally spaced to pass. Is a requirement.
第7のエコー抑圧システムは、第1乃至第6のいずれかのエコー抑圧システムにおいて、前記音出力装置は、予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させない様にしてあり、前記補正部は、前記参照音信号を、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、前記観測音信号の補正に要する補正量を導出する補正用フィルタ部と、前記補正後の観測音信号に基づいて、前記補正用フィルタのフィルタ係数の算出及び更新を行う係数更新部と、前記観測音信号の除去帯域の成分に基づいて、前記係数更新部による更新の可否を判定する更新可否判定部とを有することを要件とする。 According to a seventh echo suppression system, in any one of the first to sixth echo suppression systems, the sound output device applies a frequency band component corresponding to a preset removal band to any sound signal. The correction unit performs correction for deriving a correction amount required for correcting the observed sound signal by filtering the reference sound signal with a filter coefficient set for each frequency. A filter unit; a coefficient update unit that calculates and updates a filter coefficient of the correction filter based on the corrected observation sound signal; and the coefficient update unit based on a component of the removal band of the observation sound signal It is a requirement to have an update availability determination unit that determines whether update is possible.
第8のエコー抑圧システムは、第1乃至第7のいずれかのエコー抑圧システムにおいて、前記音出力装置は、更に、周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、前記一の音信号のみを通過させる様にしてあることを要件とする。 An eighth echo suppression system according to any one of the first to seventh echo suppression systems, wherein the sound output device further compares amplitudes of a plurality of sound signals for each frequency band by a predetermined method. A comparator that determines whether or not a value indicating a comparison result between the amplitude of one sound signal having the maximum amplitude and the amplitudes of all other sound signals is equal to or greater than a predetermined value; The passage section is required to pass only the one sound signal for the frequency band determined by the comparison section to be equal to or greater than a predetermined value.
第9のエコー抑圧システムは、第1乃至第7のいずれかのエコー抑圧システムにおいて、前記音出力装置は、更に、周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、全ての音信号を通過させる様にしてあることを要件とする。 A ninth echo suppression system according to any one of the first to seventh echo suppression systems, wherein the sound output device further compares amplitudes of a plurality of sound signals for each frequency band by a predetermined method. A comparator that determines whether or not a value indicating a comparison result between the amplitude of one sound signal having the maximum amplitude and the amplitudes of all other sound signals is equal to or greater than a predetermined value; The passage section is required to pass all sound signals for the frequency band determined by the comparison section to be equal to or greater than a predetermined value.
第10のエコー抑圧システムは、第1乃至第9のいずれかのエコー抑圧システムにおいて、前記通過部は、通過させる音信号毎の周波数帯域の成分を、経時的に変更する様にしてあることを要件とする。 According to a tenth echo suppression system, in any one of the first to ninth echo suppression systems, the passing section changes a frequency band component for each sound signal to be passed with time. As a requirement.
第11のエコー抑圧方法は、音信号に基づいて音を出力する音出力装置と、音を入力される音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置とを用いたエコー抑圧方法において、前記音出力装置により、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過手順と、夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音を夫々出力する音出力手順と、前記音入力装置により、入力された音を音信号に変換する音入力手順と、前記エコー抑圧装置により、夫々異なる周波数帯域の成分が通過した複数の音信号を加算して参照音信号を生成する加算手順と、前記音入力装置から音信号を観測音信号として入力される入力手順と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順とを含むことを要件とする。 An eleventh echo suppression method includes: a sound output device that outputs sound based on a sound signal; a sound input device that receives sound; and a sound input device that outputs the sound from the sound output device. In an echo suppression method using an echo suppressor that suppresses echo based on sound, the sound output device causes a plurality of sound signals to pass through components in different frequency bands, and in each of the different frequency bands. The sound output procedure for outputting sounds based on a plurality of sound signals through which the component has passed, the sound input procedure for converting the input sound into a sound signal by the sound input device, and the frequency different by the echo suppression device, respectively. An addition procedure for generating a reference sound signal by adding a plurality of sound signals through which band components have passed, an input procedure for inputting a sound signal from the sound input device as an observation sound signal, and the observation sound signal Based on the fine the reference sound signal, it is required for the containing and correction procedure for correcting the observation sound signal so as to suppress the echo contained in the observed sound signal.
第12のエコー抑圧プログラムは、音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧させる手順をエコー抑圧装置に実行させるエコー抑圧プログラムにおいて、前記エコー抑圧装置に、前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して生成した参照音信号と、前記音入力装置にて生成された音信号である観測音信号とに基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順を実行させることを要件とする。 The twelfth echo suppression program cooperates with a sound output device that outputs a sound based on a sound signal and a sound input device that generates a sound signal based on an input sound, and the sound input by the sound input device In an echo suppression program for causing an echo suppression apparatus to execute a procedure for suppressing an echo based on the sound output from the sound output apparatus, the echo suppression apparatus includes components of different frequency bands output from the sound output apparatus. Based on a reference sound signal generated by adding a plurality of sound signals passed through and an observation sound signal which is a sound signal generated by the sound input device, echoes contained in the observation sound signal are suppressed. Therefore, it is necessary to execute a correction procedure for correcting the observation sound signal.
第13のエコー抑圧装置は、音信号に基づいて音を出力する音出力装置、及び入力された音に基づいて音信号を生成する音入力装置と連携し、前記音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置において、前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して参照音信号を生成する加算部と、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部とを有することを要件とする。 The thirteenth echo suppressor cooperates with a sound output device that outputs sound based on the sound signal and a sound input device that generates sound signal based on the input sound, and the sound input by the sound input device In the echo suppressor for suppressing echo based on the sound output from the sound output device, a reference sound signal is obtained by adding a plurality of sound signals that have passed through components of different frequency bands output from the sound output device. Based on the observation sound signal and the reference sound signal, and an echo contained in the observation sound signal is suppressed, based on the addition part that generates the sound signal from the sound input device as an observation sound signal Therefore, it is necessary to have a correction unit that corrects the observation sound signal.
第14の音出力装置は、複数の音信号に基づく音を出力する複数の音出力部を備えており、入力された音に基づいて音信号を生成する音入力装置及び該音入力装置が入力された音から前記音出力部から出力した音に基づくエコーを抑圧するエコー抑圧装置と連携する音出力装置において、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部を有し、前記複数の音出力部は、前記通過部を通過した複数の音信号に基づく音を夫々出力する様に構成してあることを要件とする。 The fourteenth sound output device includes a plurality of sound output units that output sound based on a plurality of sound signals, and the sound input device that generates a sound signal based on the input sound and the sound input device input A sound output device that cooperates with an echo suppression device that suppresses echo based on the sound output from the sound output portion from the generated sound, and has a passing portion that allows components of different frequency bands to pass through for each of the plurality of sound signals It is a requirement that the plurality of sound output units are configured to output sounds based on the plurality of sound signals that have passed through the passage unit.
第15のオーディオシステムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、前記音出力装置、音入力装置及びエコー抑圧装置の少なくとも一を制御する制御部を有する制御装置とを備えたオーディオシステムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正部が補正した観測音信号を前記制御装置へ出力する出力部とを有し、前記制御装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、認識部による認識結果に基づき制御を行うことを要件とする。 A fifteenth audio system includes: a sound output device that outputs sound based on a sound signal; a sound input device that converts an input sound into a sound signal; and the sound output from the sound input to the sound input device An audio system comprising: an echo suppression device that suppresses echo based on sound output from a device; and a control device that has a control unit that controls at least one of the sound output device, the sound input device, and the echo suppression device. The output device has a passage unit that allows components of different frequency bands to pass through a plurality of sound signals, and a plurality of sound output units that respectively output sounds based on the plurality of sound signals that have passed through the passage unit. An adder that generates a reference sound signal by adding a plurality of sound signals that have passed through the passage, and the echo suppression device is an input unit that receives the sound signal from the sound input device as an observation sound signal A correction unit that corrects the observation sound signal to suppress an echo included in the observation sound signal based on the observation sound signal and the reference sound signal, and the control unit that corrects the observation sound signal corrected by the correction unit. And an output unit that outputs the corrected observation sound signal that has been output to the input unit, and an audio signal based on the corrected observation sound signal that has been input from the input unit. A recognition unit that performs a recognition process, and the control unit performs control based on a recognition result of the recognition unit.
第16のナビゲーションシステムは、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、ナビゲーション処理を行う制御部を有するナビゲーション装置とを備えるナビゲーションシステムにおいて、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正した観測音信号を前記ナビゲーション装置へ出力する出力部とを有し、前記ナビゲーション装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、前記認識部による認識結果に基づいてナビゲーション処理を行うことを要件とする。 A sixteenth navigation system includes a sound output device that outputs a sound based on a sound signal, a sound input device that converts an input sound into a sound signal, and the sound output from the sound input to the sound input device. In a navigation system including an echo suppression device that suppresses echo based on sound output from a device and a navigation device having a control unit that performs navigation processing, the sound output device has different frequency bands for a plurality of sound signals, respectively. And a plurality of sound output units for outputting sounds based on a plurality of sound signals that have passed through the passage unit, and adding a plurality of sound signals that have passed through the passage unit. An adder for generating a reference sound signal, wherein the echo suppressor includes an input unit that receives a sound signal from the sound input device as an observation sound signal, the observation sound signal, and the observation sound signal. A correction unit that corrects the observation sound signal to suppress an echo included in the observation sound signal based on the illuminating signal, and an output unit that outputs the corrected observation sound signal to the navigation device; The navigation device includes an input unit that receives the output of the corrected observation sound signal that has been output, and a recognition unit that performs speech recognition processing based on the corrected observation sound signal that has been input from the input unit. The control unit is required to perform navigation processing based on the recognition result by the recognition unit.
第17の移動体は、音信号に基づいて音を出力する音出力装置と、入力された音を音信号に変換する音入力装置と、該音入力装置が入力された音から、前記音出力装置から出力した音に基づくエコーを抑圧するエコー抑圧装置と、ナビゲーション処理を行う制御部を有するナビゲーション装置とを備える移動体において、前記音出力装置は、複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部とを有し、前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、前記エコー抑圧装置は、前記音入力装置から音信号を観測音信号として入力される入力部と、前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と、該補正した観測音信号を前記ナビゲーション装置へ出力する出力部とを有し、前記ナビゲーション装置は、前記出力された補正後の観測音信号を入力される入力部と、該入力部から入力された補正後の観測音信号に基づいて音声認識処理を行う認識部とを有し、前記制御部は、前記認識部による認識結果に基づいてナビゲーション処理を行うことを要件とする。 The seventeenth moving body includes a sound output device that outputs a sound based on a sound signal, a sound input device that converts an input sound into a sound signal, and the sound output from the sound input to the sound input device. In a moving body including an echo suppression device that suppresses echo based on sound output from a device and a navigation device having a control unit that performs navigation processing, the sound output device has different frequency bands for a plurality of sound signals, respectively. And a plurality of sound output units for outputting sounds based on a plurality of sound signals that have passed through the passage unit, and adding a plurality of sound signals that have passed through the passage unit. The echo suppression device includes an adder that generates a reference sound signal, and the echo suppression device is based on an input unit that receives a sound signal from the sound input device as an observation sound signal, and the observation sound signal and the reference sound signal. The observed sound A correction unit that corrects the observation sound signal so as to suppress the echo included in the signal, and an output unit that outputs the corrected observation sound signal to the navigation device, and the navigation device outputs the correction An input unit to which a later observation sound signal is input; and a recognition unit that performs speech recognition processing based on the corrected observation sound signal input from the input unit; and the control unit is configured by the recognition unit It is a requirement to perform navigation processing based on the recognition result.
第1、第2、第5及び第6のエコー抑圧システム、第11のエコー抑圧方法、第12のエコー抑圧プログラム、第13のエコー抑圧装置、第14の音出力装置、第15のオーディオシステム、第16のナビゲーションシステム並びに第17の移動体では、周波数毎に音信号が異なることから、観測音信号の任意の周波数に対し、一の音信号に基づく一の経路のエコーのみが含まれているため、エコーの推定精度を上げることができるので、残留エコーを抑制することが可能である。しかも複数の音信号の夫々に対してエコーを抑圧するための補正部を設ける必要がなく、一の補正部にて複数の音信号によるエコーを抑圧することができるので、補正部の増設に伴うコストの増加及び装置の大型化を防止することが可能である。 First, second, fifth and sixth echo suppression systems, eleventh echo suppression method, twelfth echo suppression program, thirteenth echo suppression device, fourteenth sound output device, fifteenth audio system, In the sixteenth navigation system and the seventeenth moving body, since the sound signal is different for each frequency, only one path echo based on one sound signal is included for an arbitrary frequency of the observed sound signal. Therefore, since the estimation accuracy of echo can be increased, residual echo can be suppressed. In addition, it is not necessary to provide a correction unit for suppressing echoes for each of a plurality of sound signals, and one correction unit can suppress echoes caused by a plurality of sound signals. It is possible to prevent an increase in cost and an increase in size of the apparatus.
第3及び第4のエコー抑圧システムでは、例えば第1音信号及び第2音信号の和に基づく和音信号、第1音信号を所定時間遅延させた遅延第1音信号、第2音信号を遅延させた遅延第2音信号等の加工音信号を用いて擬似5チャネルステレオを実現する場合に、加工音信号に対しては、第1音信号に用いる第1フィルタ係数及び第2音信号に用いる第2フィルタ係数を転用して周波数帯域の割り当てを行うことにより、二種類のフィルタで三種類以上の音信号に対する処理を行うことができるので、音出力装置のリソースを効率的に利用することが可能となる。 In the third and fourth echo suppression systems, for example, a chord signal based on the sum of the first sound signal and the second sound signal, a delayed first sound signal obtained by delaying the first sound signal for a predetermined time, and a second sound signal are delayed. When a pseudo 5-channel stereo is realized using the processed sound signal such as the delayed second sound signal, the processed sound signal is used for the first filter coefficient and the second sound signal used for the first sound signal. By diverting the second filter coefficient and allocating the frequency band, it is possible to process three or more types of sound signals with two types of filters, so that the resources of the sound output device can be used efficiently. It becomes possible.
第7のエコー抑圧システムでは、例えば人の声に対応する周波数帯を除去帯域として設定し、観測音信号の除去帯域の成分に基づいて、話者が発声しているダブルトークの状態であるか発声していないシングルトークの状態であるかを検出し、例えばダブルトークの状態であると判定した場合に、フィルタ係数の更新を停止させることにより、音声が含まれている区間の認識精度を向上させ、音声認識処理の精度を向上させることが可能である。 In the seventh echo suppression system, for example, a frequency band corresponding to a human voice is set as a removal band, and based on a component of the removal band of the observation sound signal, whether the speaker is in a double talk state. Detecting whether it is in a single talk state that is not speaking, for example, if it is determined that it is in a double talk state, the update of the filter coefficient is stopped, thereby improving the recognition accuracy of the section containing speech Thus, it is possible to improve the accuracy of the voice recognition process.
第8及び第9のエコー抑圧システムでは、一の音信号の振幅の大きさが他の全ての音信号の振幅の大きさに対して、所定の条件以上大きい場合に、一の音信号が通過部で遮断されることを防止するので、複数チャネルで違和感のない音を出力させることが可能である。 In the eighth and ninth echo suppression systems, one sound signal passes when the amplitude of one sound signal is greater than the amplitude of all other sound signals by a predetermined condition or more. Therefore, it is possible to output a sound with no sense of incongruity in a plurality of channels.
第10のエコー抑圧システムでは、夫々の音信号で出力に偏りがある場合でも、特定の周波数帯域において、特定の音信号が遮断され続けることがないので、複数チャネルで違和感のない音を出力させることが可能である。 In the tenth echo suppression system, even when there is a bias in the output of each sound signal, the specific sound signal does not continue to be blocked in a specific frequency band, so that a sound with no sense of incongruity is output in a plurality of channels. It is possible.
本願は、マルチチャネルオーディオ等の複数の音信号に対し、夫々異なる周波数帯域の成分を通過させ、夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音をスピーカ等の複数の音出力部から夫々出力する。マイク等の音入力部を有する音入力装置は、入力された音を音信号に変換する。そしてエコー抑圧装置は、夫々異なる周波数帯域の成分を有する複数の音信号を加算した参照音信号と、音入力装置から入力された音信号である観測音信号とに基づいて、観測音信号に含まれるエコーを抑圧すべく観測音信号を補正するという技術を開示する。 The present application relates to a plurality of sound output units such as a speaker and the like based on a plurality of sound signals through which components of different frequency bands pass through a plurality of sound signals such as multi-channel audio. Respectively. A sound input device having a sound input unit such as a microphone converts an input sound into a sound signal. The echo suppressor is included in the observed sound signal based on a reference sound signal obtained by adding a plurality of sound signals having components of different frequency bands, and an observed sound signal that is a sound signal input from the sound input device. Disclosed is a technique for correcting an observed sound signal so as to suppress echoes generated.
この構成により、本願では、周波数毎に割り当てられている音信号が異なることから、観測音信号の任意の周波数に対し、一の音信号に基づく一の経路のエコーのみが含まれているため、出力した音の任意の周波数による影響は、入力した音の同じ周波数に出現するという線形性を利用して、エコーの推定精度を上げることができるので、残留エコーを抑制することが可能である等、優れた効果を奏する。しかも本発明では、複数の音信号の夫々に対してエコーを抑圧するための補正部を設ける必要がなく、一の補正部にて複数の音信号によるエコーを抑圧することができるので、補正部の増設に伴うコストの増加及び装置の大型化を防止することが可能である等、優れた効果を奏する。 In this application, since the sound signal assigned for each frequency is different in this application, for any frequency of the observed sound signal, only the echo of one path based on one sound signal is included. Since the influence of an arbitrary frequency of the output sound appears at the same frequency of the input sound, it is possible to improve the estimation accuracy of the echo, so that the residual echo can be suppressed, etc. Has an excellent effect. In addition, in the present invention, it is not necessary to provide a correction unit for suppressing the echo for each of the plurality of sound signals, and the correction unit can suppress the echo due to the plurality of sound signals with one correction unit. As a result, it is possible to prevent an increase in cost and an increase in the size of the apparatus due to the increase in the number of devices.
また本願は、複数の音信号として、第1音信号、第2音信号、第1音信号及び/又は第2音信号を所定の加工方法で加工した加工音信号を用いる場合、例えば第1音信号及び第2音信号が、2チャネルのステレオ信号である場合で、第1音信号及び第2音信号の和に基づく和音信号、第1音信号を所定時間遅延させた遅延第1音信号、第2音信号を遅延させた遅延第2音信号等の加工音信号を用いて擬似5チャネルステレオを実現するときに、加工音信号に対しては、第1音信号に用いる第1フィルタ係数及び第2音信号に用いる第2フィルタ係数を転用して周波数帯域の割り当てを行う技術を開示する。 In the present application, when a processed sound signal obtained by processing the first sound signal, the second sound signal, the first sound signal and / or the second sound signal by a predetermined processing method is used as the plurality of sound signals, for example, the first sound signal When the signal and the second sound signal are two-channel stereo signals, a chord signal based on the sum of the first sound signal and the second sound signal, a delayed first sound signal obtained by delaying the first sound signal for a predetermined time, When the pseudo 5-channel stereo is realized using the processed sound signal such as the delayed second sound signal obtained by delaying the second sound signal, the first filter coefficient used for the first sound signal and the processed sound signal A technique for allocating a frequency band by diverting a second filter coefficient used for a second sound signal is disclosed.
この構成により、本願では、二種類のフィルタで三種類以上の音信号に対する処理を行うことができるので、音出力装置のリソースを効率的に利用することが可能となる等、優れた効果を奏する。 With this configuration, in the present application, since it is possible to perform processing on three or more types of sound signals with two types of filters, it is possible to effectively use the resources of the sound output device, and thus have excellent effects. .
さらに本願は、音出力装置において、例えば人の声に対応する周波数帯を除去帯域として予め設定しておき、除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させないようにする。そしてエコー抑圧装置では、観測音信号の除去帯域の成分に基づいて、話者が発声しているダブルトークの状態であるか発声していないシングルトークの状態であるかを検出し、シングルトークの状態であると判定した場合、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、観測音信号の補正に要する補正量を導出する補正用フィルタ部のフィルタ係数の算出及び更新を行い、ダブルトークの状態であると判定した場合、フィルタ係数の更新を停止させる技術を開示する。 Further, in the present invention, in the sound output device, for example, a frequency band corresponding to a human voice is set as a removal band in advance, and a component of the frequency band corresponding to the removal band is not allowed to pass through any sound signal. To. Then, the echo suppressor detects whether the speaker is uttering a double talk state or not singing a single talk state based on the component of the observed sound signal removal band, When it is determined that the state is in a state, the filter coefficient of the correction filter unit for deriving the correction amount necessary for correcting the observation sound signal is calculated and updated by filtering with the filter coefficient set for each frequency, and doubled. Disclosed is a technique for stopping the update of the filter coefficient when it is determined that the state is a talk state.
この構成により、本願では、音声が含まれている区間の認識精度を向上させ、音声認識精度を向上させることが可能である等、優れた効果を奏する。 With this configuration, in the present application, there are excellent effects such as improving the recognition accuracy of the section including the speech and improving the speech recognition accuracy.
さらに本願は、複数の音信号の振幅の大きさを所定の方法で比較して、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上であると判定した周波数帯域に対しては、全ての音信号又は大きさが最大である一の音信号のみを通過させる技術を開示する。 Further, the present application compares the amplitudes of a plurality of sound signals by a predetermined method, and compares the amplitude of one sound signal having the maximum amplitude with the amplitudes of all other sound signals. For a frequency band in which the value indicating the value is determined to be greater than or equal to a predetermined value, a technique is disclosed in which all sound signals or only one sound signal having the maximum magnitude is passed.
この構成により、本願では、例えばオーケストラにおけるソロ演奏の様に、一の音信号の振幅が他の音信号に対して、所定値以上である場合に、一の音信号が通過部で遮断されることを防止するので、複数チャネルで違和感のない音を出力させることが可能である等、優れた効果を奏する。 With this configuration, in the present application, for example, in the case of solo performance in an orchestra, when the amplitude of one sound signal is greater than or equal to a predetermined value relative to other sound signals, the one sound signal is blocked at the passage portion. As a result, it is possible to output an uncomfortable sound on a plurality of channels, and the effects are excellent.
さらに本願は、通過させる音信号毎の周波数帯域の成分を、経時的に変更する技術を開示する。 Furthermore, the present application discloses a technique for changing a frequency band component for each sound signal to be passed with time.
この構成により、本願では、夫々の音信号で出力に偏りがある場合でも、特定の周波数帯域において、特定の音信号が遮断され続けることがないので、複数チャネルで違和感のない音を出力させることが可能である等、優れた効果を奏する。 With this configuration, in the present application, even when there is a bias in the output of each sound signal, since the specific sound signal is not continuously blocked in a specific frequency band, it is possible to output a sound that does not feel uncomfortable in multiple channels. It is possible to achieve an excellent effect.
1 エコー抑圧装置
10 第1入力機構
11 第2入力機構
12 抑圧機構
120 加算部
121 補正部
1210 線形FIRフィルタ部
1211 減算部
1212 フィルタ係数更新部
1213 検出部
1214 除去帯域通過フィルタ部
13 出力機構
2 音出力装置
20 音出力機構
21 音信号生成機構
22 通過機構
220 FFT変換部
221 帯域通過フィルタ部
222 IFFT変換部
223 除去部
224 比較部
225 係数部
23 操作機構
24 切替機構
3 音入力装置
30 音入力機構
4 音処理装置
40 入力機構
41 認識機構
42 制御機構
5 移動体
100 エコー抑圧プログラムDESCRIPTION OF
以下、本発明をその実施の形態を示す図面に基づいて詳述する。 Hereinafter, the present invention will be described in detail with reference to the drawings illustrating embodiments thereof.
実施の形態1.
図4は、本発明の実施の形態1に係るエコー抑圧システムの構成例を模式的に示すブロック図である。図4中1は、カーナビゲーションシステム等のシステムに適用されるエコー抑圧システムにて用いられるエコー抑圧装置であり、エコー抑圧装置1は、複数チャネルの音を出力するスピーカ等の複数の音出力機構20,20,…を有するマルチチャネルオーディオ等の音出力装置2、コンデンサマイク等のマイクロホンを用いた音入力機構30を有する音入力装置3、及び音声認識システム等の音処理装置4と連携して動作する。そしてエコー抑圧装置1、音出力装置2、音入力装置3及び音処理装置4は、車両等の移動体5に搭載されている。なお本発明のエコー抑圧システムは、図4に例示したカーナビゲーションシステムに限らず、オーディオシステム、テレビ会議システム等の様々なシステムに適用することが可能である。
FIG. 4 is a block diagram schematically showing a configuration example of the echo suppression system according to
音出力装置2は、例えば音データを記録する音楽CD(Compact Disc)、DVD(Digital Versatile Disc)等の記録媒体から音データを読み取り、読み取った音データに基づいて複数チャネル分の音信号を生成し、生成した複数の音信号をマルチチャネルオーディオ信号として出力する音信号生成機構21と、複数チャネル分の音信号に対し、夫々異なる周波数帯域の成分を通過させるDSP(Digital Signal Processor)にて構成された通過機構22とを備え、通過機構22を通過した複数チャネル分の音信号は、音出力機構20,20,…から複数チャネルの音として出力される。また音出力装置2は、通過機構22を通過した複数チャネル分の音信号をエコー抑圧装置1へ送信する。なお音信号生成機構21から出力される音信号は、アナログ信号であり、図示しないA/D(Analog to Digital )変換器にてデジタル信号に変換後、通過機構22へ出力される。また通過機構22からはデジタル信号である音信号を出力し、図示しないD/A(Digital to Analog )変換器にてアナログ信号に変換後、音出力機構20,20,…及びエコー抑圧装置1へ出力する。音出力機構20,20,…は、夫々チャネルが割り当てられており、通過機構22を通過した各音信号はチャネルが対応している音出力機構20,20,…へ夫々出力される。なお本発明のエコー抑圧システムは、音出力機構20,20,…にデジタル信号である音信号に基づいて音を出力する機能を持たせ、各機構及び装置間の入出力を全てデジタル信号で行う等、適宜設計することが可能である。
The
音入力装置3は、音入力機構30により、入力された音に基づいてアナログ信号である音信号を生成し、生成した音信号をゲインアンプ等の図示しない増幅器にて増幅し、増幅した音信号を図示しないA/D変換器にて8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換し、デジタル信号に変換した音信号をエコー抑圧装置1へ出力する。
The
エコー抑圧装置1は、音出力装置2から出力された複数チャネル分の音信号を入力される第1入力機構10と、音入力装置3から出力された音信号を観測音信号として入力される第2入力機構11と、観測音信号に含まれるエコー成分を抑圧するDSP等の抑圧機構12と、抑圧機構12にてエコー成分を抑圧した観測音信号を音処理装置4へ出力する出力機構13とを備えている。
The
抑圧機構12には、エコー抑圧プログラム100及びデータ等のファームウェアが組み込まれており、ファームウェアとして組み込まれた本発明のエコー抑圧プログラム100を実行することにより、第1入力機構10にて入力された複数チャネル分の音信号を加算して参照音信号を生成する加算部120、観測音信号及び参照音信号に基づいて、観測音信号に含まれるエコーを抑圧すべく観測音信号を補正する補正部121等の各種プログラムモジュールを生成する。そして生成した各種プログラムモジュールを実行することにより、エコー抑圧装置1が備える抑圧機構12は、音出力機構20,20,…から夫々出力された音に基づくエコーを、音入力機構30に入力された音から除去するエコーキャンセラとして機能する。
The
また第1入力機構10は、音出力装置2から入力されるアナログ信号である複数チャネル分の音信号をデジタル信号に変換するA/D変換器を備えている。但し、第1入力機構10からデジタル信号として音信号が入力される場合、A/D変換器は不要となる。また音入力装置3が備える増幅器及びA/D変換器の機能を第2入力機構11に備えさせる様にしても良い。
Further, the first input mechanism 10 includes an A / D converter that converts sound signals for a plurality of channels, which are analog signals input from the
図4に示した構成例は、本発明の無限にある形態の一を例示したに過ぎず、必要に応じて適宜ハードウェア及びソフトウェア構成を変更することも可能である。例えば各プログラムモジュールは、VLSI等の演算回路を用いたハードウェアとして構成することも可能であり、更には加算部120の機能を音出力装置2に備えさせる等、適宜、実装形態を変更することができる。また加算部120を、抑圧機構12外のハードウェアとして構成する場合、アナログ信号をミキシングするミキシング回路を用いた加算部120を用いて構成するようにしても良く、その場合、音出力装置2から入力されたアナログ信号である複数チャネルの音信号は、加算部120にてミキシング(加算)された後、図示しないA/D変換器によりデジタル信号に変換される。
The configuration example shown in FIG. 4 is merely an example of an infinite form of the present invention, and the hardware and software configurations can be changed as necessary. For example, each program module can also be configured as hardware using an arithmetic circuit such as a VLSI, and the implementation form can be changed as appropriate, for example, by providing the
図4において、1ch,…,nch(nは自然数)は、複数のチャネルを示しており、x1(t),…,xn(t)は、音出力機構20から通過機構22へ出力される1チャネルからnチャネルまでの音信号を示している。なお変数tは、アナログ信号である音信号を8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換した際の各サンプルを特定するサンプル番号である。またx1_f(t),…,xn_f(t)は、通過機構22を通過した1チャネルからnチャネルまでの音信号を示しており、通過機構22を通過した音信号x1_f(t),…,xn_f(t)を加算することにより、参照音信号x_f(t)が生成される。またy(t)は、観測音信号を示しており、r(t)は、抑圧機構12にて観測音信号y(t)のエコー成分が抑圧された抑圧結果を示す音信号であり、抑圧結果r(t)は、音処理装置4へ出力され、音処理装置4にて音声認識等の処理がなされる。
4, 1ch,..., Nch (n is a natural number) indicate a plurality of channels, and x1 (t),..., Xn (t) are output from the
図5は、本発明の実施の形態1に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。DSPを用いた通過機構22は、入力された複数チャネルの音信号をFFT(高速フーリエ変換:Fast Fourier Transformation)処理にて夫々周波数軸上の成分の音信号に変換するFFT変換部220,220,…、周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる複数の帯域通過フィルタ部221,221,…、夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、IFFT(逆フーリエ変換)処理にて夫々時間軸上の音信号に変換する複数のIFFT変換部222,222,…等の各種プログラムモジュールを実行する。FFT変換部220は、音信号の変換に際し、例えば512サンプル分の信号を1フレームとしたフレーム単位の音信号を生成する。なお各フレームは、128〜256サンプル分程度ずつオーバーラップしており、各フレームに対しては、ハミング窓、ハニング窓等の窓関数、高域強調フィルタによるフィルタリング等の音声認識の分野で一般的なフレーム処理が施される。そしてFFT変換部220は、生成したフレーム単位の音信号に対してFFT処理を行う。帯域通過フィルタ部221,221,…は、夫々チャネルに対応しており、周波数軸上の成分に変換された各音信号は、チャネルが対応している帯域通過フィルタ部221,221,…を通過する。また各帯域通過フィルタ部221,221,…は、周波数毎の透過度を示した夫々異なるフィルタ係数が予め設定されており、設定されているフィルタ係数に基づいて音信号に対するフィルタリングを行う。
FIG. 5 is a functional block diagram showing a configuration example of the
図5において、x1(t),…,xn(t)は、FFT変換部220,220,…に入力された複数のチャネルの音信号であり、FFT変換部220,220,…は、複数チャネルの音信号x1(t),…,xn(t)を周波数軸上の成分に変換した複数の音信号X1(f),…,Xn(f)を帯域通過フィルタ部221,221,…へ出力する。なお変数fは、周波数を示す。また帯域通過フィルタ部221,221,…は、夫々の周波数帯域の成分を通過させた複数の音信号X1_f(f),…,Xn_f(f)をIFFT変換部222,222,…へ出力する。さらにIFFT変換部222,222,…は、夫々の周波数帯域の成分を通過させた複数の音信号X1_f(f),…,Xn_f(f)をIFFT処理にて夫々時間軸上の音信号x1_f(t),…,xn_f(t)に変換する。
5, x1 (t),..., Xn (t) are sound signals of a plurality of channels input to the
図6は、本発明の実施の形態1に係る音出力装置2が備える通過機構22の帯域通過フィルタ部221のフィルタ係数を示すグラフである。図6(a),(b),(c)は、夫々第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。フィルタ係数とは、音信号に乗じられる周波数毎に設定された係数であり、各帯域通過フィルタ部221,221,…とは、夫々設定されているフィルタ係数を周波数軸上の成分に変換された音信号に乗じる処理を行うプログラムモジュールである。帯域通過フィルタ部221の処理により、フィルタ係数が1.0である周波数帯の成分は、帯域通過フィルタ部221を通過することになるが、フィルタ係数が0.0である周波数帯の成分は、帯域通過フィルタ部221の通過の際に振幅が0となり、帯域通過フィルタ部221で除去されることになる。図6(a),(b),(c)に示す様に、各帯域通過フィルタ部221,221,…のフィルタ係数は、夫々異なる周波数帯域の成分を通過させる様に設定されている。
FIG. 6 is a graph showing the filter coefficient of the band
各帯域通過フィルタ部221,221,…では、周波数帯域を等間隔に分割し、分割した夫々の周波数帯域の成分が、いずれかの帯域通過フィルタ部221のみを通過する様にフィルタ係数が設定されている。図6の様なフィルタ係数を設定することにより、各帯域通過フィルタ部221,221,…は、櫛形フィルタとして機能する。なお帯域通過フィルタ部221,221,…のフィルタ係数の設定に際し、周波数の対数値が等間隔となる様に分割し、分割した夫々の周波数帯域の成分が、いずれかの帯域通過フィルタ部221のみを通過する様にフィルタ係数を設定して櫛形フィルタを形成する様にしても良く、対数値を用いて周波数帯域を分割することにより、聴取時に違和感の少ない音を出力させることが可能となる。
In each of the band
図7は、本発明の実施の形態1に係るエコー抑圧装置1が備える抑圧機構12の構成例を示す機能ブロック図である。DSPを用いた抑圧機構12は、前述した様に加算部120、補正部121等のプログラムモジュールを実行する。
FIG. 7 is a functional block diagram showing a configuration example of the
さらに補正部121は、エコーの推定に要する周波数毎に設定されているフィルタ係数を用いた数百次の積和演算にて、参照音信号x_f(t)をフィルタリングすることにより、観測音信号y(t)の補正に要する補正量として、エコー信号x'(t)を導出する線形FIRフィルタ(補正用フィルタ)部1210と、観測音信号y(t)からエコー信号x'(t)を減算することにより、観測音信号y(t)を補正し、エコー成分を抑圧した観測音信号を抑圧結果r(t)として出力する減算部1211と、補正後の観測音信号、即ち抑圧結果r(t)に基づいて、学習同定法を用いた適応処理により、線形FIRフィルタ部1210のフィルタ係数の算出及び更新を行うフィルタ係数更新部1212と、抑圧結果r(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出する検出部1213とをサブモジュールとして実行する。そして検出部1213は、抑圧結果r(t)の強度変化に基づいてシングルトークの状態とダブルトークの状態とを検出し、ダブルトークの状態時には、フィルタ係数更新部1212によるフィルタ係数の算出及び更新を停止させる。なお補正部121の処理に際し、必要に応じて、参照音信号x_f(t)及び観測音信号y(t)に対してフレーム化及び周波数軸上の成分へ変換するFFT処理が行われた上でエコー抑圧処理がなされ、更に時間軸上の成分へ変換するIFFT処理が行われた抑圧結果r(t)が出力される様に構成することも可能である。
Further, the
図8は、本発明の実施の形態1に係る音処理装置4の構成例を示すブロック図である。音処理装置4は、エコー抑圧装置1の出力機構13から出力された抑圧結果r(t)を入力される入力機構40と、入力機構40から入力された抑圧結果r(t)に基づいて音声認識処理を行う認識機構41と、認識機構41による認識結果に基づいてナビゲーション処理の制御を行う制御機構42とを備えている。制御機構42による制御とは、話者が発声した音声から認識した命令に基づく移動体5の目的地の入力、走行経路の導出、走行経路の表示等のカーナビゲーションシステム本来の処理である。なお本発明のシステムをオーディオシステムに適用する場合、音処理装置4は、エコー抑圧装置1、音出力装置2及び音入力装置3を制御する制御装置として機能し、話者が発生した音声による命令、例えば音源切替、再生開始、音声認識終了等の命令に基づいて、制御機構42は、エコー抑圧装置1、音出力装置2及び音入力装置3を制御する。
FIG. 8 is a block diagram showing a configuration example of the sound processing device 4 according to
次に本発明の実施の形態1に係るエコー抑圧システムが備える各装置の処理について説明する。図9は、本発明の実施の形態1に係る音出力装置2の音出力処理の一例を示すフローチャートである。音出力装置2は、音信号生成機構21により、複数チャネル分の音信号x1(t),…,xn(t)を生成し(S101)、生成した音信号x1(t),…,xn(t)を通過機構22へ出力する。
Next, processing of each device provided in the echo suppression system according to
音出力装置2の通過機構22は、入力された複数チャネルの音信号x1(t),…,xn(t)をデジタル信号に変換し、フレーム化して、各FFT変換部220,220,…により、複数の音信号をFFT処理にて夫々周波数軸上の成分の音信号X1(f),…,Xn(f)に変換し(S102)、周波数軸上の成分に変換した各音信号X1(f),…,Xn(f)を、夫々帯域通過フィルタ部221,221,…へ渡す。ステップS102において、周波数軸上の成分に変換する方法としては、必ずしもFFTを用いる必要はなく、DCT(離散コサイン変換:Discrete Cosine Transform )等の他の変換方法を用いてもよい。
The
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…により、周波数軸上の成分に変換された複数の音信号X1(f),…,Xn(f)に対し、夫々異なる周波数帯域の成分X1_f(f),…,Xn_f(f)を通過させ(S103)、IFFT変換部222,222,…により、IFFT処理にて夫々時間軸上の音信号x1_f(t),…,xn_f(t)に変換し(S104)、アナログ信号に変換して、音出力機構20,20,…へ出力し、またエコー抑圧装置1へ出力する(S105)。
The
音出力装置2の音出力機構20,20,…は、入力された音信号x1_f(t),…,xn_f(t)に基づいて音を出力する(S106)。
The
図10は、本発明の実施の形態1に係る音入力装置3の音入力処理の一例を示すフローチャートである。音入力装置3は、音入力機構30により、音を入力し(S201)、入力された音に基づいて音信号を生成し、生成した音信号を観測音信号y(t)としてエコー抑圧装置1へ出力する(S202)。ステップS201において、音入力装置3は、音出力装置2が音を出力する音場からの音が入力される。従って音入力装置3が入力される音には、音出力装置2から出力された音が混入する可能性がある。
FIG. 10 is a flowchart showing an example of sound input processing of the
図11は、本発明の実施の形態1に係るエコー抑圧装置1のエコー抑圧処理の一例を示すフローチャートである。エコー抑圧装置1は、第1入力機構10により、音出力装置2から出力された複数チャネル分の音信号x1_f(t),…,xn_f(t)を入力し(S301)、入力された音信号x1_f(t),…,xn_f(t)をデジタル信号に変換して抑圧機構12へ渡し、また第2入力機構11により、音入力装置3から出力された観測音信号y(t)を入力し(S302)、入力された観測音信号y(t)をデジタル信号に変換して抑圧機構12へ渡す。なおステップS301及びステップS302の処理は、実質的に並行して行われる。
FIG. 11 is a flowchart showing an example of echo suppression processing of the
エコー抑圧装置1の抑圧機構12は、加算部120により、音出力装置2から出力された複数チャネル分の音信号x1_f(t),…,xn_f(t)を加算して参照音信号x_f(x)を生成し(S303)、生成した参照音信号x_f(x)を補正部121へ渡す。
The
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、線形FIRフィルタ部1210にて、設定されているフィルタ係数を用いた積和演算により、参照音信号x_f(x)をフィルタリングすることで、観測音信号y(t)の補正に要する補正量としてエコー信号x'(t)を導出し(S304)、導出した補正量であるエコー信号x'(t)を減算部1211へ渡す。
The
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、減算部1211により、観測音信号y(t)からエコー信号x'(t)を減算することで観測音信号y(t)を補正し(S305)、補正した観測音信号y(t)である抑圧結果r(t)をアナログ信号に変換し、変換した抑圧結果r(t)を音処理装置4へ出力する(S306)。そして音処理装置4では、入力された抑圧結果r(t)に基づいて音声認識等の処理を実行する。
The
図12は、本発明の実施の形態1に係るエコー抑圧装置1のフィルタ係数更新処理の一例を示すフローチャートである。エコー抑圧装置1では、図11を用いたエコー抑圧処理と並行して、エコー信号の導出に用いるフィルタ係数の更新処理を実行する。エコー抑圧装置1の抑圧機構12は、補正部121の処理として、検出部1213により、減算部1211から出力される抑圧結果r(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出し(S401)、検出した結果を示す検出結果をフィルタ係数更新部1212へ渡す。
FIG. 12 is a flowchart showing an example of the filter coefficient update process of the
エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212により、検出部1213から受け付けた検出結果に基づいて、フィルタ係数の算出及び更新の要否を判定する(S402)。ステップS402では、検出結果がシングルトークを示す場合、フィルタ係数の算出及び更新を実行し、ダブルトークを示す場合、フィルタ係数の算出及び更新を停止する。
The
ステップS402において、フィルタ係数の算出及び更新を要すると判定した場合(S402:YES)、エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212により、減算部1211から出力される抑圧結果r(t)に基づいて、学習同定法を用いた適応処理にてフィルタ係数を算出し(S403)、線形FIRフィルタ部1210にて用いられているフィルタ係数を、ステップS403にて算出したフィルタ係数に更新し(S404)、ステップS401へ戻り、以降の処理を繰り返す。
If it is determined in step S402 that the filter coefficient needs to be calculated and updated (S402: YES), the
ステップS402において、フィルタ係数の算出及び更新を要しないと判定した場合(S402:NO)、エコー抑圧装置1の抑圧機構12は、補正部121の処理として、フィルタ係数更新部1212によるフィルタ係数の算出及び更新を行わず、ステップS401へ戻り、以降の処理を繰り返す。
When it is determined in step S402 that calculation and update of the filter coefficient are not required (S402: NO), the
音出力装置2から音場に対して複数チャネルの音が出力されている場合、当該音場から入力された音信号には音出力装置2から出力された音に基づくエコーが含まれる。当該音場が音に対する線形性を保っている場合、音出力装置2から出力された音は、その周波数を維持して音入力装置3に入力される。また参照音信号x_f(t)は、夫々異なる周波数帯域が割り当てられた複数チャネルの音信号x1_f(t),…,xn_f(t)を加算した信号であるから、任意の周波数fにおいて、参照音信号x_f(t)及び観測音信号y(t)の関係は、1チャネルの音を出力する場合の関係と等価であると見なすことができる。従って本願のエコー抑圧システムでは、複数チャネルの音信号を出力する場合であっても、1チャネルの音信号を出力する場合と同等の精度でエコーを抑圧することが可能である。
When sounds of a plurality of channels are output from the
実施の形態2.
実施の形態2は、実施の形態1において、原音信号を所定の方法で加工した加工音信号を用いて実現される複数チャネルの音信号に対し、効率的なフィルタリングを実現する形態である。ここでは実施の形態2として、L(Left)チャネルの第1音信号、R(Right)チャネルの第2音信号、第1音信号及び第2音信号の和であるC(Center)チャネルの和音信号、第1音信号を所定時間遅延させたsL(Surround Left)チャネルの遅延第1音信号、及び第2音信号を所定時間遅延させたsR(Surround Right)チャネルの遅延第2音信号による擬似5チャネルのステレオシステムに適用する例について説明する。擬似5チャネルにおいて、第1音信号及び第2音信号は、原音信号であり、和音信号、遅延第1音信号及び遅延第2音信号は、原音信号を加算又は遅延により加工した加工音信号である。但し、本発明の実施の形態2に係るエコー抑圧システムは、必ずしも擬似5チャネルに限らず、第1音信号、第2音信号、遅延第1音信号及び遅延第2音信号からなる擬似4チャネルのステレオシステムに適用する形態、和音信号を遅延させた遅延和音信号を擬似信号として用いる形態等、様々な形態に展開することが可能である。
The second embodiment is a form in which efficient filtering is realized for the sound signals of a plurality of channels realized by using the processed sound signal obtained by processing the original sound signal by a predetermined method in the first embodiment. Here, as the second embodiment, the first sound signal of the L (Left) channel, the second sound signal of the R (Right) channel, the chord of the C (Center) channel that is the sum of the first sound signal and the second sound signal. Signal, a delayed first sound signal of an sL (Surround Left) channel obtained by delaying the first sound signal by a predetermined time, and a pseudo second sound signal of an sR (Surround Right) channel obtained by delaying the second sound signal by a predetermined time. An example applied to a 5-channel stereo system will be described. In the pseudo 5 channel, the first sound signal and the second sound signal are original sound signals, and the chord signal, the delayed first sound signal and the delayed second sound signal are processed sound signals processed by adding or delaying the original sound signals. is there. However, the echo suppression system according to the second embodiment of the present invention is not necessarily limited to the pseudo 5 channel, but the pseudo 4 channel including the first sound signal, the second sound signal, the delayed first sound signal, and the delayed second sound signal. The present invention can be developed in various forms such as a form applied to the stereo system and a form using a delayed chord signal obtained by delaying the chord signal as a pseudo signal.
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態2におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 In the following description, components similar to those in the first embodiment are denoted by the same reference numerals as those in the first embodiment, and detailed description thereof is omitted. Since the configuration example of the echo suppression system in the second embodiment is the same as that in the first embodiment shown in FIG. 4, the first embodiment is referred to and the description thereof is omitted.
図13は、本発明の実施の形態2に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態2に係る音出力装置2の通過機構22の構成は、実質的に実施の形態1と同様である。なお図13において、xL(t),xR(t),xC(t),xsL(t),xsR(t)は、FFT変換部220,220,…に入力された第1音信号、第2音信号、和音信号、遅延第1音信号及び遅延第2音信号を示す。またこれらの音信号xL(t),xR(t),xC(t),xsL(t),xsR(t)をFFT変換部220,220,…により、周波数軸上の成分に変換した音信号がXL(f),XR(f),XC(f),XsL(f),XsR(f)である。さらに周波数軸上の成分に変換したこれらの音信号XL(f),XR(f),XC(f),XsL(f),XsR(f)が夫々帯域通過フィルタ部221,221,…を通過した音信号がXL_f(f),XR_f(f),XC_f(f),XsL_f(f),XsR_f(f)である。そしてこれらの音信号XL_f(f),XR_f(f),XC_f(f),XsL_f(f),XsR_f(f)をIFFT変換部222,222,…にて変換した時間軸上の音信号がxL_f(t),xR_f(t),xC_f(t),xsL_f(t),xsR_f(t)である。
FIG. 13 is a functional block diagram showing a configuration example of the passing
図14は、本発明の実施の形態2に係る音出力装置2が備える通過機構22の帯域通過フィルタ部221のフィルタ係数を示すグラフである。図14(a),(b),(c),(d),(e)は、夫々Lチャネルの第1音信号XL(f)、Rチャネルの第2音信号XR(f)、Cチャネルの和音信号XC(f)、sLチャネルの遅延第1音信号XsL(f)及びsRチャネルの遅延第2音信号XsR(f)に対する係数フィルタCL(f)、CR(f)、CC(f)、CsL(f)及びCsR(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。
FIG. 14 is a graph showing filter coefficients of the band
図14(a)に示した第1音信号XL(f)に対する係数フィルタCL(f)及び図14(b)に示した第2音信号XR(f)に対する係数フィルタCR(f)は、夫々異なる周波数帯域の成分を通過させるように設定されたフィルタである。和音信号XC(f)は、第1音信号XL(f)及び第2音信号XR(f)を加算した音信号であるので、和音信号XC(f)に対しては、第1音信号XL(f)に対する係数フィルタCL(f)及び第2音信号XR(f)に対する係数フィルタCR(f)の和である図14(c)に示した係数フィルタCC(f)が用いられる。実施の形態2として示す例では、係数フィルタCC(f)は、図14(c)に示す様にフィルタ処理の対象となる全周波数帯域の成分を通過させるフィルタであり、周波数に関わらずフィルタ係数が1.0となる。また遅延第1音信号XsL(f)は、第1音信号XL(f)を遅延した音信号であるので、遅延第1音信号XsL(f)に対しては、第1音信号XL(f)に対する係数フィルタCL(f)を転用(複写)した図14(d)に示す係数フィルタCsL(f)が用いられる。従って第1音信号XL(f)に対する係数フィルタCL(f)と、遅延第1音信号XsL(f)に対する係数フィルタCsL(f)とは、同一のフィルタである。さらに遅延第2音信号XsR(f)は、第2音信号XR(f)を遅延した音信号であるので、遅延第2音信号XsR(f)に対しては、第2音信号XR(f)に対する係数フィルタCR(f)を転用(複写)した図14(e)に示す係数フィルタCsR(f)が用いられる。従って第2音信号XR(f)に対する係数フィルタCR(f)と、遅延第2音信号XsR(f)に対する係数フィルタCsR(f)とは、同一のフィルタ係数を持つフィルタである。 The coefficient filter CL (f) for the first sound signal XL (f) shown in FIG. 14A and the coefficient filter CR (f) for the second sound signal XR (f) shown in FIG. It is a filter set to pass components of different frequency bands. Since the chord signal XC (f) is a sound signal obtained by adding the first sound signal XL (f) and the second sound signal XR (f), the chord signal XC (f) has a first sound signal XL. The coefficient filter CC (f) shown in FIG. 14C, which is the sum of the coefficient filter CL (f) for (f) and the coefficient filter CR (f) for the second sound signal XR (f), is used. In the example shown as the second embodiment, the coefficient filter CC (f) is a filter that passes the components of the entire frequency band to be filtered as shown in FIG. 14C, and the filter coefficient regardless of the frequency. Becomes 1.0. Since the delayed first sound signal XsL (f) is a sound signal obtained by delaying the first sound signal XL (f), the first sound signal XL (f The coefficient filter CsL (f) shown in FIG. 14 (d) obtained by diverting (copying) the coefficient filter CL (f) to () is used. Therefore, the coefficient filter CL (f) for the first sound signal XL (f) and the coefficient filter CsL (f) for the delayed first sound signal XsL (f) are the same filter. Further, since the delayed second sound signal XsR (f) is a sound signal obtained by delaying the second sound signal XR (f), the second sound signal XR (f) ) Is used (copied) as a coefficient filter CsR (f) shown in FIG. 14E. Accordingly, the coefficient filter CR (f) for the second sound signal XR (f) and the coefficient filter CsR (f) for the delayed second sound signal XsR (f) are filters having the same filter coefficient.
この様に実施の形態2において、帯域通過フィルタ部221,221,…は、5チャネル分の信号を処理するため、5チャネル分の信号を格納するメモリ及びフィルタ処理を行うプログラムモジュールにて構成される。夫々のプログラムモジュールにて用いられるフィルタ係数として、第1音信号XL(f)及び第2音信号XR(f)に対しては夫々独自に設定されたフィルタ係数が用いられる。また和音信号XC(f)に対しては第1音信号XL(f)のフィルタ係数及び第2音信号XR(f)のフィルタ係数の和として算出されるフィルタ係数が用いられる。さらに遅延第1音信号XsL(f)に対しては、第1音信号XL(f)のフィルタ係数を複写したフィルタ係数が用いられ、遅延第2音信号XsR(f)に対しては、第2音信号XR(f)のフィルタ係数を複写したフィルタ係数が用いられる。なお各チャネルのフィルタ処理を行うプログラムモジュールは、一のプログラムモジュールを時分割で使用し、信号毎にフィルタ係数を設定し直すようにしても良い。
As described above, in the second embodiment, the
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 Since other configurations and processes are the same as those in the first embodiment, the first embodiment will be referred to and description thereof will be omitted.
実施の形態3.
実施の形態3は、実施の形態1において、音信号生成機構が生成した複数チャネル分の音信号に対し、人が発声する音声に対応する周波数帯域等の予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させないようにし、除去帯域に該当する周波数帯域の成分に基づいてダブルトーク及びシングルトークを検出する形態である。
The third embodiment corresponds to a preset removal band such as a frequency band corresponding to a voice uttered by a person with respect to sound signals for a plurality of channels generated by the sound signal generation mechanism in the first embodiment. In this configuration, the frequency band component is not allowed to pass through any sound signal, and double talk and single talk are detected based on the frequency band component corresponding to the removal band.
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態3におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 In the following description, components similar to those in the first embodiment are denoted by the same reference numerals as those in the first embodiment, and detailed description thereof is omitted. Since the configuration example of the echo suppression system in the third embodiment is the same as that in the first embodiment shown in FIG. 4, the first embodiment is referred to and the description thereof is omitted.
図15は、本発明の実施の形態3に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態3に係る通過機構22は、予め設定されている除去帯域f_cutに該当する周波数帯域の成分を除去する除去部223,223,…を備えている。除去部223,223,…は、帯域通過フィルタ部221,221,…を通過した周波数軸上の成分に変換されている複数の音信号X1_f(f),…,Xn_f(f)から、除去帯域f_cutに該当する周波数帯域の成分を除去し、除去帯域f_cutの成分を除去した信号X1_f_c(f),…,Xn_f_c(f)をIFFT変換部222,222,…へ出力する。IFFT変換部222,222,…は、除去部223,223,…を通過させた複数の音信号X1_f_c(f),…,Xn_f_c(f)をIFFT処理にて夫々時間軸上の音信号x1_f_c(t),…,xn_f_c(t)に変換する。そしてIFFT変換部222,222,…は、各音信号x1_f_c(t),…,xn_f_c(t)を、チャネルが対応している音出力機構20,20,…及びエコー抑圧装置1へ出力する。
FIG. 15 is a functional block diagram showing a configuration example of the
図16は、本発明の実施の形態3に係る音出力装置2が備える通過機構22の除去部223のフィルタ係数を示すグラフである。図16は、除去用係数フィルタCCUT(f)を示しており、横軸を周波数とし、縦軸をフィルタ係数として、その関係を示したグラフである。図16に示すように除去用係数フィルタCCUT(f)は、人の発声に対応する除去帯域f_cutのフィルタ係数が0.0であり、その他の帯域については1.0となっている。この様にして実施の形態3に係る音出力装置2は、除去帯域f_cutを設定することで、出力する全てのチャネルの音から除去帯域f_cutに対応する周波数成分を除去することになる。なお除去部223を設けるのではなく、帯域通過フィルタ部221,221,…が、除去帯域f_cutに該当する周波数の成分を遮断する様に各帯域通過フィルタ部221,221,…のフィルタ係数を設定するようにしても良い。
FIG. 16 is a graph showing filter coefficients of the
図17は、本発明の実施の形態3に係るエコー抑圧装置1が備える抑圧機構12の構成例を示す機能ブロック図である。実施の形態3に係る抑圧機構12の補正部121は、観測音信号y(t)から除去帯域f_cutに対応する周波数成分のみを通過させる除去帯域通過フィルタ部1214を、サブモジュールとして実行する。そして検出部1213は、除去帯域通過フィルタ部1214を通過した検出用観測音信号y_p(t)に基づいてシングルトークの状態かダブルトークの状態かを検出する。音出力装置2が複数チャネルの音を出力する音場が、音に対する線形性を保っている場合、観測音信号y(t)の除去帯域f_cutには、出力した音に基づくエコー成分が含まれていない筈である。従って除去帯域f_cutの成分のみを通過させた検出用観測音信号y_p(t)に基づいて、シングルトークの状態とダブルトークの状態とを検出する場合、実施の形態1に示した様に抑圧結果r(t)から検出する場合と比べて、高精度に状態の検出を行うことが可能である。
FIG. 17 is a functional block diagram showing a configuration example of the
図18は、本発明の実施の形態3に係るエコー抑圧装置1が備える抑圧機構12の除去帯域通過フィルタ部1214のフィルタ係数を示すグラフである。図18は、除去帯域通過フィルタ部1214に設定された除去帯域通過係数フィルタCPASS(f)を示しており、横軸を周波数とし、縦軸をフィルタ係数として、その関係を示したグラフである。図18に示すように除去帯域通過係数フィルタCPASS(f)は、除去帯域f_cutのフィルタ係数が1.0であり、その他の帯域については0.0となっている。この様にして実施の形態3に係る除去帯域通過フィルタ部1214は、観測音信号y(t)から除去帯域f_cutに対応する周波数成分のみを通過させることになる。
FIG. 18 is a graph showing filter coefficients of the removal band-
次に本発明の実施の形態3に係るエコー抑圧システムが備える各装置の処理について説明する。図19は、本発明の実施の形態3に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態3では、実施の形態1に係る音出力処理のフローチャートに示したステップS101〜S103の処理を実行後、通過機構22の除去部223により、除去帯域f_cutに対応する周波数成分を除去する処理を実行する。
Next, processing of each device provided in the echo suppression system according to
音出力装置2は、実施の形態1にて示したステップS101〜S103の処理を実行する。そして音出力装置2の通過機構22は、除去部223により、帯域通過フィルタ部221,221,…を通過した周波数軸上の成分に変換されている複数の音信号X1_f(f),…,Xn_f(f)から、除去帯域f_cutに該当する周波数帯域の成分を除去し(S501)、除去帯域f_cutの成分を除去した信号X1_f_c(f),…,Xn_f_c(f)をIFFT変換部222,222,…へ出力する。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS104以降の処理を実行する。
The
実施の形態3に係る音入力装置3の音入力処理及びエコー抑圧装置1のエコー抑圧処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。ただしエコー抑圧処理において、抑圧機構12の加算部120は、除去帯域f_cutの成分が除去された複数チャネル分の音信号x1_f_c(t),…,xn_f_c(t)を加算して参照音信号x_f'(x)を生成する。
Since the sound input process of the
図20は、本発明の実施の形態3に係るエコー抑圧装置1のフィルタ係数更新処理の一例を示すフローチャートである。エコー抑圧装置1の抑圧機構12は、補正部121の処理として、検出部1213により、除去帯域通過フィルタ部1214を通過した検出用観測音信号y_p(t)に基づいて、話者が発声しているダブルトークの状態か発声していないシングルトークの状態かを検出し(S601)、検出した結果を示す検出結果をフィルタ係数更新部1212へ渡す。そしてエコー抑圧装置1は、実施の形態1のフィルタ係数更新処理にて示したステップS402以降の処理を実行する。
FIG. 20 is a flowchart showing an example of filter coefficient update processing of the
実施の形態4.
実施の形態4は、実施の形態1において、カーナビゲーションシステムの発話スイッチの押下等の所定の操作を行った場合に限り、本発明のエコー抑圧方法を実行する形態である。なお以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。Embodiment 4 FIG.
The fourth embodiment is a form in which the echo suppression method of the present invention is executed only when a predetermined operation such as pressing a speech switch of the car navigation system is performed in the first embodiment. In the following description, components similar to those in the first embodiment are denoted by the same reference numerals as those in the first embodiment, and detailed description thereof is omitted.
図21は、本発明の実施の形態4に係るエコー抑圧システムの構成例を模式的に示すブロック図である。実施の形態4に係る音出力装置2は、発話スイッチとして機能する操作機構23と、操作機構23の操作に基づき信号経路の切替処理を行うスイッチ等の切替機構24,24,…を備えている。切替機構24,24,…は、音信号生成機構21から通過機構22へ複数チャネルの音信号を伝送する各信号線上に夫々配設されており、音信号生成機構21から出力された複数チャネルの音信号を、通過機構22又は複数の音出力機構20,20,…へ出力する。
FIG. 21 is a block diagram schematically showing a configuration example of an echo suppression system according to Embodiment 4 of the present invention. The
話者が操作機構23に対する押下等の操作を行った場合、操作機構23は、切替機構24,24,…へ操作信号を出力し、切替機構24,24,…は、操作信号を入力中又は操作信号の入力から一定時間の間、音信号生成機構21から出力された複数チャネルの音信号を通過機構22へ出力するように信号経路の切替処理を行う。複数チャネルの音信号が通過機構22へ出力されている間、本発明のエコー抑圧システムは、実施の形態1にて説明した各種処理を行う。
When the speaker performs an operation such as pressing the operation mechanism 23, the operation mechanism 23 outputs an operation signal to the switching
話者が操作機構23に対する操作を行っていない場合、又は操作から一定時間が経過した場合、切替機構24,24,…は、音信号生成機構21から出力された複数チャネルの音信号を音出力機構20,20,…へ出力する様に信号経路を設定する。
When the speaker does not operate the operation mechanism 23, or when a certain time has elapsed since the operation, the switching
この様に実施の形態4では、話者が操作を行った場合にのみ本発明のエコー抑圧方法を実行し、操作を行っていない通常時においては、音信号生成機構21から出力された複数チャネルの音信号をそのまま音出力機構20,20,…へ出力することにより、音信号の周波数成分の選択通過が行われないため、出力する音の音質を維持することができる。
As described above, in the fourth embodiment, the echo suppression method of the present invention is executed only when the speaker performs an operation, and in a normal time when the operation is not performed, a plurality of channels output from the sound
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 Since other configurations and processes are the same as those in the first embodiment, the first embodiment will be referred to and description thereof will be omitted.
実施の形態5.
実施の形態5は、実施の形態1において、音信号間の相関に基づいて通過機構による処理を動的に変更する形態である。
The fifth embodiment is a form in which the processing by the passage mechanism is dynamically changed based on the correlation between sound signals in the first embodiment.
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態5におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 In the following description, components similar to those in the first embodiment are denoted by the same reference numerals as those in the first embodiment, and detailed description thereof is omitted. Since the configuration example of the echo suppression system in the fifth embodiment is the same as that in the first embodiment shown in FIG. 4, the first embodiment is referred to and the description thereof is omitted.
図22は、本発明の実施の形態5に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態5に係る通過機構22は、フレーム単位で周波数軸上の成分に変換されている夫々のチャネルの音信号X1(f),…,Xn(f)の振幅を比較し、比較した振幅の相関に基づいて各帯域通過フィルタ部221,221,…のフィルタ係数を動的に変更させる比較部224を備えている。なお各音信号X1(f),…,Xn(f)の振幅を比較するのではなく、振幅の二乗であるパワーを振幅の代替値として比較する様にしても良い。
FIG. 22 is a functional block diagram showing a configuration example of the passing
比較部224は、所定数のフレーム単位又は所定の時間間隔で、周波数帯域毎に各音信号X1(f),…,Xn(f)間の相関を導出する。相関の導出は、夫々の音信号の振幅の大きさを比較することにより行われる。そして比較により他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在すると判定した場合、各音信号X1(f),…,Xn(f)間の相関が弱いと判断し、またその場合に最も振幅が大きい一の音信号を導出する。一の音信号と他の音信号との振幅の比較は、例えば他の音信号の振幅に対する一の音信号の振幅の比、一の音信号の振幅から他の音信号の振幅を減じた差、振幅の絶対値の比或いは差、振幅の二乗であるパワーの比或いは差等の所定の方法で比較した比較結果が、予め設定されている所定値以上であるか否かを判定することにより行われる。比較に用いる所定値は、一の音信号の振幅に対して他の全ての音信号の振幅が無視できる程度に小さいと言える条件を満たす様に設定されている。
The
例えば周波数fにおける第nチャネルnchの振幅を、nch(f)で表し、所定値をαとすると、下記の式(1)が成立する場合、各音信号X1(f),…,Xn(f)間の相関が弱く、最も振幅が大きい音信号は第nチャネルnchの音信号Xn(f)であると判定する。 For example, when the amplitude of the n-th channel nch at the frequency f is represented by nch (f) and the predetermined value is α, each sound signal X1 (f),..., Xn (f ) Is weak and the sound signal having the largest amplitude is determined to be the sound signal Xn (f) of the nth channel nch.
nch(f)/1ch(f)≧α,nch(f)/2ch(f)≧α,… 式(1) nch (f) / 1ch (f) ≧ α, nch (f) / 2ch (f) ≧ α, Formula (1)
比較部224は、各音信号X1(f),…,Xn(f)間の相関が弱いと判定した周波数fを示す偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を導出する。比較部224は、振幅が最大であるチャネルの音信号に係る帯域通過フィルタ部221のフィルタ係数として1.0を導出し、他のチャネルの音信号に係る帯域通過フィルタ部221のフィルタ係数として0.0を導出する。そして比較部224は偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す。
The
帯域通過フィルタ部221,221,…では、偏向周波数fdにおけるフィルタ係数を受け付けた場合、偏向周波数fdにおけるフィルタ係数を、受け付けたフィルタ係数に変更する。即ち振幅が最大である音信号のみを通過させる様に設定する。
When the band
比較部224の比較により、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合、各音信号X1(f),…,Xn(f)間の相関が強いと判断する。相関が強いと判断した場合、比較部224は、偏向周波数fd及びフィルタ係数の導出を行わない。従って帯域通過フィルタ部221,221,…では、前述した実施の形態1と同様の処理を実行することになる。
When it is determined by comparison of the
各音信号X1(f),…,Xn(f)間の相関が低く、一の音信号に係る振幅が他の音信号に係る振幅に対して大きくなる状況は、例えば複数チャネルのオーケストラ演奏を再生する場合における、いずれかのチャネルに出力が偏ったソロ演奏時に発生する。この様な状況において、ソロ演奏を行う楽器に係る音信号が帯域通過フィルタ部221,221,…で抑制された場合、聴取者は出力される音に違和感を覚えることになる。実施の形態5では、この様な状況において、ソロ演奏を行う楽器に係る音信号に基づく音を、出力する音として選択することになるので、違和感の少ない音を出力させることが可能となる。
A situation in which the correlation between the sound signals X1 (f),..., Xn (f) is low and the amplitude related to one sound signal is larger than the amplitude related to the other sound signal is, for example, a multi-channel orchestra performance. Occurs during a solo performance in which the output is biased to one of the channels during playback. In such a situation, if the sound signal related to the instrument performing the solo performance is suppressed by the band-
次に本発明の実施の形態5に係るエコー抑圧システムが備える各装置の処理について説明する。図23は、本発明の実施の形態5に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態5では、実施の形態1に係る音出力処理のステップS101〜S102の処理を実行する。そして音出力装置2の通過機構22は、比較部224により、周波数帯域毎に各音信号X1(f),…,Xn(f)の振幅の大きさを比較し、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定する(S701)。
Next, processing of each device provided in the echo suppression system according to
ステップS701において、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して所定値以上大きい振幅を有する一の音信号が存在すると判定した場合(S701:YES)、音出力装置2の通過機構22は、比較部224により、当該周波数f、即ち偏向周波数fdにおいて、最も振幅が大きい一の音信号を特定し、特定した音信号に基づいて各帯域通過フィルタ部221,221,…のフィルタ係数を導出し(S702)、導出したフィルタ係数を夫々対応する帯域通過フィルタ部221,221,…へ偏向周波数fdにおけるフィルタ係数として渡す。ステップS702では、最も振幅が大きい一の音信号に係る帯域通過フィルタ部221のフィルタ係数が1.0として導出され、他の音信号に係る帯域通過フィルタ部221,221,…のフィルタ係数が0.0として導出される。
In step S701, it is determined that the correlation between the sound signals X1 (f),..., Xn (f) is weak, and there is one sound signal having an amplitude greater than a predetermined value with respect to the amplitudes of all other sound signals. In the case (S701: YES), the
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…の偏向周波数fdにおけるフィルタ係数の設定を、夫々受け付けたフィルタ係数に変更する(S703)。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
The passing
ステップS701において、各音信号X1(f),…,Xn(f)間の相関が強く、他の全ての音信号の振幅に対して所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合(S701:NO)、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定の変更を解除する(S704)。ステップS704の変更の解除とは、ステップS703でフィルタ係数の設定が変更されていた場合に、その変更された設定を解除して、元のフィルタ係数の設定に戻す処理である。従ってフィルタ係数が変更されていない場合、実質的な処理は行われない。但し、フィルタ係数の設定が変更されていたとしても、当該周波数において、一の音信号の成分のみを通過させるという本来の処理は行われているため、必ずしも元のフィルタ係数の設定に戻す必要はない。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
In step S701, if there is a strong correlation between the sound signals X1 (f),..., Xn (f) and there is no sound signal having an amplitude greater than a predetermined value with respect to the amplitudes of all other sound signals. When it determines (S701: NO), the
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 Since other configurations and processes are the same as those in the first embodiment, the first embodiment will be referred to and description thereof will be omitted.
図24は、本発明の実施の形態5に係る音出力装置2が備える通過機構22の処理の例を概念的に示す説明図である。図24は、ある時点における周波数fに対する振幅の大きさを音信号に係るチャネル毎に示したグラフであり、図24(a)は、第1チャネルch1(f)、図24(b)は、第2チャネルch2(f)、そして図24(c)は、第nチャネルchn(f)を夫々示している。周波数f1では、各チャネル間の相関が高いため、通過機構22では、予め設定されているフィルタ係数に基づいて処理が行われる。周波数f2では、相関が低く、第1チャネルch1(f)に係る音信号の振幅が大きいため、第1チャネルch1(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。また周波数f3では、相関が低く、第2チャネルch2(f)に係る音信号の振幅が大きいため、第2チャネルch2(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。さらに周波数f4では、相関が低く、第nチャネルchn(f)に係る音信号の振幅が大きいため、第nチャネルchn(f)に係る帯域通過フィルタ部221のフィルタ係数は1.0となり、他のチャネルに係る帯域通過フィルタ部221,221,…のフィルタ係数は0.0となる。
FIG. 24 is an explanatory diagram conceptually showing an example of processing of the
実施の形態6.
実施の形態6は、実施の形態5において、フィルタ係数の設定方法を変更する形態である。Embodiment 6 FIG.
The sixth embodiment is a form in which the filter coefficient setting method is changed in the fifth embodiment.
以降の説明において、実施の形態5又は実施の形態5の元となる実施の形態1と同様の構成については、実施の形態5又は実施の形態1を参照するものとし、その説明を省略する。実施の形態6におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 In the following description, the fifth embodiment or the first embodiment is referred to for the same configuration as the first embodiment that is the basis of the fifth embodiment or the fifth embodiment, and the description thereof is omitted. Since the configuration example of the echo suppression system in the sixth embodiment is the same as that in the first embodiment shown in FIG. 4, the first embodiment is referred to and the description thereof is omitted.
図25は、本発明の実施の形態6に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。通過機構22が備える比較部224は、実施の形態5と同様に、所定数のフレーム単位又は所定の時間間隔で、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定し、存在すると判定した場合、当該周波数、即ち偏向周波数fdを各帯域通過フィルタ部221,221,…へ渡す。
FIG. 25 is a functional block diagram showing a configuration example of the
帯域通過フィルタ部221,221,…では、偏向周波数fdを受け付けた場合、受け付けた偏向周波数fdにおけるフィルタ係数を1.0に変更する。この様に全ての帯域通過フィルタ部221,221,…のフィルタ係数を1.0に設定することにより、全ての音信号X1(f),…,Xn(f)を通過させることになる。一の音信号の振幅に対して、他の全ての音信号の振幅は、無視できる程度に小さいため、全ての音信号X1(f),…,Xn(f)を通過させた場合でも、実質的に実施の形態5と同様の効果が得られる。
When the deflection frequency fd is received, the band
比較部224の比較により、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合、各音信号X1(f),…,Xn(f)間の相関が強いと判断する。相関が強いと判断した場合、比較部224は、偏向周波数fdの導出を行わない。従って帯域通過フィルタ部221,221,…では、前述した実施の形態1と同様の処理を実行することになる。なお比較部224から帯域通過フィルタ部221,221,…へ、偏向周波数fdのみを渡すのではなく、偏向周波数fdにおける各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す様にしても良い。この場合、比較部224から帯域通過フィルタ部221,221,…へ渡すフィルタ係数は、全て1.0である。
When it is determined by comparison of the
次に本発明の実施の形態6に係るエコー抑圧システムが備える各装置の処理について説明する。図26は、本発明の実施の形態6に係る音出力装置2の音出力処理の一例を示すフローチャートである。実施の形態6では、実施の形態1に係る音出力処理のステップS101〜S102の処理を実行する。そして音出力装置2の通過機構22は、比較部224により、周波数帯域毎に各音信号X1(f),…,Xn(f)の振幅の大きさを比較し、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在するか否かを判定する(S801)。
Next, processing of each device provided in the echo suppression system according to Embodiment 6 of the present invention will be described. FIG. 26 is a flowchart showing an example of sound output processing of the
ステップS801において、各音信号X1(f),…,Xn(f)間の相関が弱く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在すると判定した場合(S801:YES)、音出力装置2の通過機構22は、比較部224から各帯域通過フィルタ部221,221,…へ、偏向周波数fdを渡す。
In step S801, if the correlation between the sound signals X1 (f),..., Xn (f) is weak and there is one sound signal having an amplitude greater than a predetermined value with respect to the amplitudes of all other sound signals. If it is determined (S801: YES), the
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…の偏向周波数fdにおけるフィルタ係数の設定を夫々1.0に変更する(S802)。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
The
ステップS801において、各音信号X1(f),…,Xn(f)間の相関が強く、他の全ての音信号の振幅に対して、所定値以上大きい振幅を有する一の音信号が存在しないと判定した場合(S801:NO)、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定の変更を解除する(S803)。ステップS803の変更の解除とは、ステップS802でフィルタ係数の設定が変更されていた場合に、その変更された設定を解除して、元のフィルタ係数の設定に戻す処理である。従ってフィルタ係数が変更されていない場合、実質的な処理は行われない。そして音出力装置2は、実施の形態1の音出力処理にて示したステップS103以降の処理を実行する。
In step S801, the correlation between the sound signals X1 (f),..., Xn (f) is strong, and there is no one sound signal having an amplitude greater than a predetermined value with respect to the amplitudes of all other sound signals. (S801: NO), the
ステップS801〜S803の処理後に実行されるステップS103の処理として、音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…により、周波数軸上の成分に変換された複数の音信号X1(f),…,Xn(f)に対し、夫々異なる周波数帯域の成分X1_f(f),…,Xn_f(f)を通過させる。なお各周波数fにおいて、通過する音信号は一つであるが、偏向周波数fdの成分については、全ての音信号X1(fd),…,Xn(fd)が通過する。
As a process of step S103 executed after the processes of steps S801 to S803, the
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 Since other configurations and processes are the same as those in the first embodiment, the first embodiment will be referred to and description thereof will be omitted.
実施の形態7.
実施の形態7は、実施の形態1において、各帯域通過フィルタ部のフィルタ係数を経時的に変化させる形態である。Embodiment 7 FIG.
The seventh embodiment is a form in which the filter coefficient of each bandpass filter unit is changed over time in the first embodiment.
以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付すものとし、その詳細な説明を省略する。実施の形態7におけるエコー抑圧システムの構成例は、図4を用いて示した実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 In the following description, components similar to those in the first embodiment are denoted by the same reference numerals as those in the first embodiment, and detailed description thereof is omitted. Since the configuration example of the echo suppression system in the seventh embodiment is the same as that in the first embodiment shown in FIG. 4, the first embodiment is referred to and the description thereof is omitted.
図27は、本発明の実施の形態7に係る音出力装置2の通過機構22の構成例を示す機能ブロック図である。実施の形態7に係る通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数を変更する係数部225を備えている。
FIG. 27 is a functional block diagram showing a configuration example of the passing
係数部225は、時刻を取得する図示しない時計回路を有し、所定の時間間隔で、各帯域通過フィルタ部221,221,…のフィルタ係数を導出する。係数部225は、一の帯域通過フィルタ部221のフィルタ係数として1.0を導出し、他の帯域通過フィルタ部221,221,…のフィルタ係数として0.0を導出する。なおフィルタ係数が1.0となる帯域通過フィルタ部221は毎回変化する。係数部225は、例えば予め時間に対応付けてフィルタ係数を記録したテーブルの使用、フィルタ係数を出力する所定の関数の使用等の様々な方法によりフィルタ係数を導出する。そして導出した各帯域通過フィルタ部221,221,…のフィルタ係数を、夫々対応する帯域通過フィルタ部221,221,…へ渡す。
The
帯域通過フィルタ部221,221,…では、夫々フィルタ係数を受け付けたフィルタ係数に変更する。係数部225は、所定の時間間隔で毎回変更されるフィルタ係数を導出することにより、各帯域通過フィルタ部221,221,…のフィルタ係数は、所定の時間間隔で、即ち経時的に変更されることになる。またこれにより通過機構22は、通過させる音信号毎の周波数帯域の成分を、経時的に変更することになる。なお時計回路が示す時刻に基づいてフィルタ係数を変更するのではなく、所定のフレーム数毎にフィルタ係数を変更することで、経時的に変更する様にしても良い。
In the band
次に本発明の実施の形態7に係るエコー抑圧システムが備える各装置の処理について説明する。図28は、本発明の実施の形態7に係る音出力装置2の係数変更処理の一例を示すフローチャートである。音出力装置2の通過機構22は、係数部225により、時計回路を参照し、予め設定されている所定時間が経過したか否かを判定する(S901)。
Next, processing of each device provided in the echo suppression system according to Embodiment 7 of the present invention will be described. FIG. 28 is a flowchart showing an example of coefficient change processing of the
ステップS901において、所定時間が経過したと判定した場合(S901:YES)、音出力装置2の通過機構22は、係数部225により、各帯域通過フィルタ部221,221,…のフィルタ係数を導出し(S902)、導出したフィルタ係数を夫々対応する帯域通過フィルタ部221,221,…へ渡す。ステップS901において、所定時間が経過していないと判定した場合(S901:NO)、ステップS901の処理を繰り返す。
If it is determined in step S901 that the predetermined time has elapsed (S901: YES), the
音出力装置2の通過機構22は、各帯域通過フィルタ部221,221,…のフィルタ係数の設定を夫々変更する(S903)。係数変更処理により、通過機構22は、通過させる音信号毎の周波数帯域の成分を、経時的に変更することになる。
The
その他の構成及び処理は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。 Since other configurations and processes are the same as those in the first embodiment, the first embodiment will be referred to and description thereof will be omitted.
図29は、本発明の実施の形態7に係る音出力装置2が備える通過機構22の各帯域通過フィルタ部221,221,…のフィルタ係数の経時変化の例を示す説明図である。図29(a),(b),(c)は、夫々第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示しており、横軸を周波数fとし、縦軸をフィルタ係数として、その関係を示したグラフである。そして図29(d),(e),(f)は、夫々図29(a),(b),(c)に示す状態から所定時間経過後の第1チャネル1ch、第2チャネル2ch、及び第nチャネルnchの音信号X1(f)、X2(f)、及びXn(f)に対する係数フィルタC1(f)、C2(f)、及びCn(f)を示している。図29(a),(b),(c)と、図29(d),(e),(f)とを比較すると明らかな様に、各チャネルの係数フィルタの値、即ちフィルタ係数が経時的に変更されている。そして通過する音信号毎の周波数帯域の成分が、経時的に変化することになる。
FIG. 29 is an explanatory diagram illustrating an example of a change over time of the filter coefficients of the band
前記実施の形態1乃至7は、本発明の無限にある実施の形態の一部を例示したに過ぎず、各種ハードウェア及びソフトフェア等の構成は、適宜設定することが可能であり、また例示した基本的な処理以外にも様々な処理を組み合わせることが可能である。例えば本発明のエコー抑圧システムを、ナビゲーションシステム、テレビ会議システム以外の音声、音響に係る様々なシステムに適用することが可能であり、更にはエコー抑圧装置、音出力装置、音入力装置及び音処理装置の全て又は適宜選択された二或いは三の装置を一の装置として構成する様にしても良い。また音出力装置を、音信号を生成する音信号生成装置と、音出力装置とに分割する等、一の装置を複数の装置として構成する様にしても良い。さらに前記実施の形態1乃至7では、フィルタ係数を0.0又は1.0として櫛形フィルタを形成する形態を示したが、0.0以上1.0以下の値をも取る様にして、台形型フィルタ、三角形型フィルタ等の様々な特性のフィルタを形成させることが可能である。そして前記実施の形態1乃至7は夫々独立して実現されるのではなく、適宜組み合わせることも可能である。 The first to seventh embodiments are merely examples of an infinite embodiment of the present invention, and various hardware and software configurations can be set as appropriate. Various processes can be combined in addition to the basic processes. For example, the echo suppression system of the present invention can be applied to various systems related to voice and sound other than navigation systems and video conference systems, and further, echo suppression devices, sound output devices, sound input devices, and sound processing All of the devices or two or three devices appropriately selected may be configured as one device. Also, one device may be configured as a plurality of devices, such as dividing the sound output device into a sound signal generating device that generates a sound signal and a sound output device. Further, in the first to seventh embodiments, the form in which the comb filter is formed by setting the filter coefficient to 0.0 or 1.0 has been shown. It is possible to form filters having various characteristics such as a mold filter and a triangular filter. The first to seventh embodiments are not realized independently, but can be appropriately combined.
Claims (10)
前記音出力装置は、
複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、
該通過部を通過した複数の音信号に基づく音を夫々出力する複数の音出力部と
を有し、
前記通過部を通過した複数の音信号を加算して参照音信号を生成する加算部を有し、
前記エコー抑圧装置は、
前記音入力装置から音信号を観測音信号として入力される入力部と、
前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と
を有する
ことを特徴とするエコー抑圧システム。A sound output device that outputs a sound based on a sound signal, a sound input device that converts an input sound into a sound signal, and a sound that is input from the sound input device based on a sound that is output from the sound output device In an echo suppression system comprising an echo suppression device for suppressing echo,
The sound output device is
For a plurality of sound signals, passing parts that pass components in different frequency bands, and
A plurality of sound output sections for outputting sounds based on the plurality of sound signals that have passed through the passage section,
An adder that generates a reference sound signal by adding a plurality of sound signals that have passed through the passage;
The echo suppressor is
An input unit for inputting a sound signal from the sound input device as an observation sound signal;
An echo suppression system, comprising: a correction unit that corrects the observation sound signal so as to suppress an echo included in the observation sound signal based on the observation sound signal and the reference sound signal.
複数の音信号を夫々周波数軸上の成分に変換する第1変換部と、
周波数軸上の成分に変換した複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる帯域通過フィルタ部と、
夫々の周波数帯域の成分を通過させた周波数軸上の成分に変換されている複数の音信号を、夫々時間軸上の音信号に変換する第2変換部と
を有することを特徴とする請求項1に記載のエコー抑圧システム。The passage part is
A first converter for converting a plurality of sound signals into components on the frequency axis,
Band pass filter units that pass components of different frequency bands for a plurality of sound signals converted into components on the frequency axis,
2. A second conversion unit that converts a plurality of sound signals converted into components on a frequency axis through which components of respective frequency bands are passed, into sound signals on the time axis, respectively. 2. The echo suppression system according to 1.
前記帯域通過フィルタ部は、音信号毎にフィルタ係数が設定されてあり、
第1音信号に対して第1フィルタ係数、第2音信号に対して第2フィルタ係数、並びに加工音信号に対して加工方法に応じた第1フィルタ係数及び/又は第2フィルタ係数に基づく加工フィルタ係数が夫々設定されている
ことを特徴とする請求項2に記載のエコー抑圧システム。The plurality of sound signals through which the passing sections pass components of different frequency bands are processed sound obtained by processing the first sound signal, the second sound signal, the first sound signal and / or the second sound signal by a predetermined processing method. Signal,
The band pass filter unit has a filter coefficient set for each sound signal,
Processing based on the first filter coefficient for the first sound signal, the second filter coefficient for the second sound signal, and the first filter coefficient and / or the second filter coefficient corresponding to the processing method for the processed sound signal The echo suppression system according to claim 2, wherein filter coefficients are respectively set.
予め設定されている除去帯域に該当する周波数帯域の成分を、何れの音信号に対しても通過させない様にしてあり、
前記補正部は、
前記参照音信号を、周波数毎に設定されたフィルタ係数にてフィルタリングすることにより、前記観測音信号の補正に要する補正量を導出する補正用フィルタ部と、
前記補正後の観測音信号に基づいて、前記補正用フィルタのフィルタ係数の算出及び更新を行う係数更新部と、
前記観測音信号の除去帯域の成分に基づいて、前記係数更新部による更新の可否を判定する更新可否判定部と
を有する
ことを特徴とする請求項1乃至請求項3のいずれかに記載のエコー抑圧システム。The sound output device is
The frequency band component corresponding to the preset removal band is not allowed to pass through any sound signal,
The correction unit is
A filter unit for correction for deriving a correction amount required for correcting the observation sound signal by filtering the reference sound signal with a filter coefficient set for each frequency;
A coefficient updating unit for calculating and updating the filter coefficient of the correction filter based on the corrected observation sound signal;
The echo according to any one of claims 1 to 3 , further comprising: an update availability determination unit that determines whether the coefficient update unit can update based on a component of a removal band of the observation sound signal. Suppression system.
周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、
前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、前記一の音信号のみを通過させる様にしてある
ことを特徴とする請求項1乃至請求項4のいずれかに記載のエコー抑圧システム。The sound output device further includes:
For each frequency band, the amplitudes of multiple sound signals are compared using a predetermined method, and the result of comparison between the amplitude of one sound signal with the maximum amplitude and the amplitudes of all other sound signals A comparison unit for determining whether or not the value indicating is equal to or greater than a predetermined value;
The said passage part is made to pass only said one sound signal with respect to the frequency band which the said comparison part determined to be more than predetermined value. The any one of Claim 1 thru | or 4 characterized by the above-mentioned. The echo suppression system described in 1.
周波数帯域毎に、複数の音信号の振幅の大きさを所定の方法で比較し、振幅の大きさが最大である一の音信号の振幅と、他の全ての音信号の振幅との比較結果を示す値が所定値以上か否かを判定する比較部を更に備え、
前記通過部は、前記比較部が所定値以上と判定した周波数帯域に対しては、全ての音信号を通過させる様にしてある
ことを特徴とする請求項1乃至請求項5のいずれかに記載のエコー抑圧システム。The sound output device further includes:
For each frequency band, the amplitudes of multiple sound signals are compared using a predetermined method, and the result of comparison between the amplitude of one sound signal with the maximum amplitude and the amplitudes of all other sound signals A comparison unit for determining whether or not the value indicating is equal to or greater than a predetermined value;
The said passage part is made to pass all the sound signals with respect to the frequency band which the said comparison part determined to be more than predetermined value. The Claim 1 thru | or 5 characterized by the above-mentioned. Echo suppression system.
前記音出力装置により、
複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過手順と、
夫々異なる周波数帯域の成分が通過した複数の音信号に基づく音を夫々出力する音出力手順と、
前記音入力装置により、
入力された音を音信号に変換する音入力手順と、
前記エコー抑圧装置により、
夫々異なる周波数帯域の成分が通過した複数の音信号を加算して参照音信号を生成する加算手順と、
前記音入力装置から音信号を観測音信号として入力される入力手順と、
前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順と
を含むことを特徴とするエコー抑圧方法。A sound output device that outputs sound based on a sound signal, a sound input device that receives sound, and an echo that suppresses echo based on the sound output from the sound output device from the sound input by the sound input device In an echo suppression method using a suppressor,
By the sound output device,
A procedure for passing components of different frequency bands for a plurality of sound signals,
A sound output procedure for outputting sounds based on a plurality of sound signals through which components of different frequency bands have passed,
With the sound input device,
A sound input procedure for converting the input sound into a sound signal;
By the echo suppression device,
An addition procedure for generating a reference sound signal by adding a plurality of sound signals that have passed through components of different frequency bands;
An input procedure in which a sound signal is input as an observation sound signal from the sound input device;
An echo suppression method, comprising: a correction procedure for correcting the observation sound signal so as to suppress an echo included in the observation sound signal based on the observation sound signal and the reference sound signal.
前記エコー抑圧装置に、
前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して生成した参照音信号と、前記音入力装置にて生成された音信号である観測音信号とに基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正手順を実行させることを特徴とするエコー抑圧プログラム。In cooperation with a sound output device that outputs a sound based on a sound signal and a sound input device that generates a sound signal based on an input sound, the sound input device outputs from the input sound. In an echo suppression program for causing an echo suppressor to execute a procedure for suppressing echo based on the sound
In the echo suppressor,
A reference sound signal generated by adding a plurality of sound signals that have passed through components of different frequency bands output from the sound output device, and an observation sound signal that is a sound signal generated by the sound input device; And executing a correction procedure for correcting the observation sound signal so as to suppress the echo contained in the observation sound signal.
前記音出力装置から出力された夫々異なる周波数帯域の成分を通過させた複数の音信号を加算して参照音信号を生成する加算部と、
前記音入力装置から音信号を観測音信号として入力される入力部と、
前記観測音信号及び前記参照音信号に基づいて、前記観測音信号に含まれるエコーを抑圧すべく前記観測音信号を補正する補正部と
を有することを特徴とするエコー抑圧装置。In cooperation with a sound output device that outputs a sound based on a sound signal and a sound input device that generates a sound signal based on an input sound, the sound input device outputs from the input sound. In an echo suppressor that suppresses echo based on the generated sound,
An adder that generates a reference sound signal by adding a plurality of sound signals that have passed through components of different frequency bands output from the sound output device;
An input unit for inputting a sound signal from the sound input device as an observation sound signal;
An echo suppression apparatus comprising: a correction unit that corrects the observation sound signal so as to suppress an echo included in the observation sound signal based on the observation sound signal and the reference sound signal.
複数の音信号に対し、夫々異なる周波数帯域の成分を通過させる通過部と、
該通過部を通過した複数の音信号を加算して参照音信号を生成する加算部と
を備え、
前記複数の音出力部は、前記通過部を通過した複数の音信号に基づく音を夫々出力する様に構成してあり、
前記加算部は、生成した参照音信号を前記エコー抑圧装置へ出力する様に構成してある
ことを特徴とする音出力装置。A sound input device that includes a plurality of sound output units that output a sound based on a plurality of sound signals, generates a sound signal based on the input sound, and the sound output unit from the sound input to the sound input device In a sound output device that cooperates with an echo suppressor that suppresses echo based on sound output from
For a plurality of sound signals, passing parts that pass components in different frequency bands, and
An adder that generates a reference sound signal by adding a plurality of sound signals that have passed through the passage;
With
Wherein the plurality of sound output section, Ri said sound based on the plurality of sound signals passed through the passing section configured so as to respectively output Thea,
The addition unit, a sound output device, wherein the generated reference sound signal that Ru Thea configured so as to be output to the echo suppressor.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009536910A JP5051235B2 (en) | 2007-10-12 | 2007-12-10 | Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPPCT/JP2007/069930 | 2007-10-12 | ||
PCT/JP2007/069930 WO2009047858A1 (en) | 2007-10-12 | 2007-10-12 | Echo suppression system, echo suppression method, echo suppression program, echo suppression device, sound output device, audio system, navigation system, and moving vehicle |
PCT/JP2007/073776 WO2009047871A1 (en) | 2007-10-12 | 2007-12-10 | Echo suppression system, echo suppression method, echo suppression program, echo suppressor, sound output device, audio system, navigation system, and mobile body |
JP2009536910A JP5051235B2 (en) | 2007-10-12 | 2007-12-10 | Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009047871A1 JPWO2009047871A1 (en) | 2011-02-17 |
JP5051235B2 true JP5051235B2 (en) | 2012-10-17 |
Family
ID=47189632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009536910A Active JP5051235B2 (en) | 2007-10-12 | 2007-12-10 | Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5051235B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0722985A (en) * | 1993-07-01 | 1995-01-24 | Hitachi Denshi Ltd | Transmission line with transmission loss compensation circuit |
JPH08213937A (en) * | 1995-02-07 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | Echo canceller |
JP2002368658A (en) * | 2001-06-08 | 2002-12-20 | Matsushita Electric Ind Co Ltd | Multi-channel echo canceller, method, recording medium and voice communication system |
JP2003284183A (en) * | 2002-03-20 | 2003-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression apparatus, echo suppression method, and program |
JP2004222103A (en) * | 2003-01-17 | 2004-08-05 | Toa Corp | Broadcasting device |
JP2005536128A (en) * | 2002-08-16 | 2005-11-24 | エマ ミックスド シグナル シー. ブイ. | Method and system for processing subband signals using adaptive filters |
-
2007
- 2007-12-10 JP JP2009536910A patent/JP5051235B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0722985A (en) * | 1993-07-01 | 1995-01-24 | Hitachi Denshi Ltd | Transmission line with transmission loss compensation circuit |
JPH08213937A (en) * | 1995-02-07 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | Echo canceller |
JP2002368658A (en) * | 2001-06-08 | 2002-12-20 | Matsushita Electric Ind Co Ltd | Multi-channel echo canceller, method, recording medium and voice communication system |
JP2003284183A (en) * | 2002-03-20 | 2003-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression apparatus, echo suppression method, and program |
JP2005536128A (en) * | 2002-08-16 | 2005-11-24 | エマ ミックスド シグナル シー. ブイ. | Method and system for processing subband signals using adaptive filters |
JP2004222103A (en) * | 2003-01-17 | 2004-08-05 | Toa Corp | Broadcasting device |
Also Published As
Publication number | Publication date |
---|---|
JPWO2009047871A1 (en) | 2011-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8340963B2 (en) | Echo suppressing system, echo suppressing method, recording medium, echo suppressor, sound output device, audio system, navigation system and mobile object | |
JP5149968B2 (en) | Apparatus and method for generating a multi-channel signal including speech signal processing | |
RU2666316C2 (en) | Device and method of improving audio, system of sound improvement | |
CA2908794C (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
RU2601189C2 (en) | Method and device for decomposing stereophonic record using frequency-domain processing applied with spectral weights generator | |
JPWO2014103099A1 (en) | Device with speech recognition and speech recognition method | |
WO2017183462A1 (en) | Signal processor | |
Uhle et al. | Mono-to-stereo upmixing | |
JP5051235B2 (en) | Echo suppression system, echo suppression method, echo suppression program, echo suppression device, and sound output device | |
Uhle | Center signal scaling using signal-to-downmix ratios |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120709 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5051235 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |