JP6187626B1 - 収音装置及びプログラム - Google Patents
収音装置及びプログラム Download PDFInfo
- Publication number
- JP6187626B1 JP6187626B1 JP2016065817A JP2016065817A JP6187626B1 JP 6187626 B1 JP6187626 B1 JP 6187626B1 JP 2016065817 A JP2016065817 A JP 2016065817A JP 2016065817 A JP2016065817 A JP 2016065817A JP 6187626 B1 JP6187626 B1 JP 6187626B1
- Authority
- JP
- Japan
- Prior art keywords
- sound
- target area
- mixed
- signal
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 claims description 15
- 230000001629 suppression Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 abstract description 14
- 238000000034 method Methods 0.000 description 15
- 238000012937 correction Methods 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 238000003491 array Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/01—Noise reduction using microphones having different directional characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/21—Direction finding using differential microphone array [DMA]
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】 目的エリアを音源とする音を収音するエリア収音を行う際に、収音した音の音質をより向上させる。【解決手段】 本発明はエリア収音を行う収音装置に関する。そして、本発明の収音装置は、マイクロホンアレイから入力された入力信号に含まれる背景雑音を推定した推定雑音のパワーと、非目的エリア音のパワーとに基づいて、目的エリア音に混合する混合信号の音量レベルを算出し、算出した混合信号の音量レベルに基づいて、混合信号に混合させる入力信号の音量レベルと推定雑音の音量レベルを調整し、算出された音量レベルに調整した入力信号と、算出された音量レベルに調整した前記推定雑音とを混合させた混合後目的エリア音を生成して出力することを特徴とする。【選択図】 図1
Description
本発明は、収音装置及びプログラムに関し、例えば特定のエリアの音を強調し、それ以外のエリアの音を抑圧する場合に適用し得るものである。
複数の音源が存在する環境下において、ある特定の方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下、「BF」と呼ぶものとする)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。図6は、マイクロホン数が2個の場合の従来の減算型BFを適用した収音装置PSに係る構成を示すブロック図である。従来の減算型BFを適用した収音装置PSは、まず遅延器により目的とする方向に存在する音(以下、「目的音」と呼ぶ)がマイクロホンM1、M2に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。
収音装置PSにおいて、時間差は下記(1)式により算出される。(1)式においてdはマイクロホン間の距離、cは音速、τιは遅延量である。また、(1)式において、θLは、各マイクロホンを結んだ直線に対する垂直方向から目的方向への角度である。
τL=(dsinθL)/c …(1)
τL=(dsinθL)/c …(1)
ここで、収音装置PSは、死角がマイクロホンM1とマイクロホンM2の中心に対し、マイクロホンM1の方向に存在する場合、マイクロホンM1の入力信号χ1(τ)に対し遅延処理を行う。その後、収音装置PSは、(2)式に従い減算器により信号処理を行う。
m(t)=x2(t)−x1(t−τL) …(2)
m(t)=x2(t)−x1(t−τL) …(2)
θL=±π/2の場合、収音装置PSにおいて形成される指向性は図7(A)に示すように、カージオイド型の単一指向性となる。また、θL=0,πの場合、収音装置PSにおいて形成される指向性は、図7(B)のような8の字型の双指向性となる。なお、以下では、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを「双指向性フィルタ」と呼ぶものとする。
また、収音装置PSでは、スペクトル減算法(Spectral Subtraction;以下、「SS」と呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、(4)式に従い全周波数、もしくは指定した周波数帯域で形成される。(4)式では、マイクロホンM1の入力信号Χ1を用いているが、マイクロホンM2の入力信号Χ2でも同様の効果を得ることができる。(4)式において、βはSSの強度を調節するための係数である。収音装置PSでは、SSの処理(減算処理)の際に値がマイナスになった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。収音装置PSでは、SSの処理を適用することにより、双指向性フィルタにより目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
Y(n)=X1(n)−βM(n) …(4)
Y(n)=X1(n)−βM(n) …(4)
従来の収音装置PSにおいて、ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源(以下、非目的エリア音)も収音してしまう可能性がある。
そこで特許文献1では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音するエリア収音装置を提案している。特許文献1に記載されたエリア収音装置では、まず各マイクロホンアレイのBF出力に含まれる目的エリア音のパワーの比率を推定し、それを補正係数とする。特許文献1に記載のエリア収音装置において、例として2つのマイクロホンアレイを使用する場合、目的エリア音パワーの補正係数は、以下の(5)、(6)式、又は以下の(7)、(8)式により算出される。
(5)〜(8)式において、Y1κ(n)、Y2κ(n)は第1、第2のマイクロホンアレイのBF出力の振幅スペクトルを表し、Nは周波数ビンの総数を表し、κは周波数を表し、α1(n)、α2(n)は各BF出力に対するパワー補正係数を表す。また、(5)〜(8)式において、modeは最頻値を表し、medianは中央値を表している。
その後、特許文献1に記載された収音装置では、補正係数により各BF出力を補正し、SSすることで、目的エリア方向に存在する非目的エリア音を抽出する。特許文献1に記載された収音装置では、更に抽出した非目的エリア音を各BFの出力からSSすることにより目的エリア音を抽出することができる。特許文献1に記載された収音装置では、第1のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N1(n)を抽出する際に、以下の(9)式に示すように、第1のマイクロホンアレイのBF出力Y1(n)から第2のマイクロホンアレイのBF出力Y2(n)にパワー補正係数α2を掛けたものをSSする。また、特許文献1に記載された収音装置は、第2のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N2(n)を抽出する場合、(10)式に従った計算を行って抽出する。
N1(n)=Y1(n)−α2(n)Y2(n) …(9)
N2(n)=Y2(n)−α1(n)Y1(n) …(10)
N1(n)=Y1(n)−α2(n)Y2(n) …(9)
N2(n)=Y2(n)−α1(n)Y1(n) …(10)
その後、特許文献1に記載された収音装置は、(11)、(12)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。(11)、(12)式において、γ1(n)、γ2(n)はSS時の強度を変更するための係数である。
Z1(n)=Y1(n)−γ1(n)N1(n) …(11)
Z2(n)=Y2(n)−γ2(n)N2(n) …(12)
Z1(n)=Y1(n)−γ1(n)N1(n) …(11)
Z2(n)=Y2(n)−γ2(n)N2(n) …(12)
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行
しかしながら、特許文献1の手法では、背景雑音や非目的エリア音の音量レベルが大きい場合、目的エリア音抽出の際に行うSSにより、目的エリア音が歪んだり、ミュージカルノイズという耳障りな異音が発生する可能性がある。特許文献1の手法では、これらの影響により音が聞き取りにくくなり、音による円滑なコミュニケーションが阻害される恐れがある。
また、特許文献2に記載された収音装置では、音声区間検出の精度に依存しているため、雑音のレベルが大きい場合、音声区間検出精度が低くなってしまい、安定してミュージカルノイズを抑制することが難しい。また、特許文献2に記載された収音装置では、あくまで非音声区間でのみミュージカルノイズのマスキングを行うため、目的エリア(特定のエリア)内を音源とする音のみ収音する場合、目的エリア以外の非目的エリア音が音声であると認識することができない。
そのため、目的エリアを音源とする音を収音するエリア収音を行う際に、収音した音の音質をより向上させる(例えば、目的エリア音の歪みやミュージカルノイズを抑制する)ことができる収音装置及びプログラムが望まれている。
第1の本発明の収音装置は、(1)マイクロホンアレイから入力された入力信号に含まれる背景雑音を推定して推定雑音として取得し、取得した前記推定雑音を用いて、前記入力信号の雑音成分を抑圧して雑音抑圧後信号を取得する雑音抑圧手段と、(2)前記雑音抑圧後信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、(3)前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出部と、(4)前記推定雑音のパワーと、前記第1の非目的エリア音のパワーと、前記第2の非目的エリア音のパワーとに基づいて、前記目的エリア音に混合する混合信号として前記マイクロホンアレイから入力された前記入力信号と、前記雑音抑圧手段が推定した前記推定雑音とを混合した信号を生成し、前記混合信号の音量レベルを算出する混合レベル算出手段と、(5)前記混合レベル算出手段が算出した前記混合信号の音量レベルに基づいて、前記混合信号に混合させる前記入力信号の音量レベルと、前記混合信号に混合させる前記推定雑音の音量レベルを調整する混合レベル調整手段と、(6)前記目的エリア音に、前記混合レベル調整手段で算出された音量レベルに調整した前記入力信号と、前記混合レベル調整手段で算出された音量レベルに調整した前記推定雑音とを混合させた混合後目的エリア音を生成して出力する信号混合手段とを有することを特徴とする。
第2の本発明の収音プログラムは、コンピュータを、(1)マイクロホンアレイから入力された入力信号に含まれる背景雑音を推定して推定雑音として取得し、取得した前記推定雑音を用いて、前記入力信号の雑音成分を抑圧して雑音抑圧後信号を取得する雑音抑圧手段と、(2)前記雑音抑圧後信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、(3)前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出部と、(4)前記推定雑音のパワーと、前記第1の非目的エリア音のパワーと、前記第2の非目的エリア音のパワーとに基づいて、前記目的エリア音に混合する混合信号として前記マイクロホンアレイから入力された前記入力信号と、前記雑音抑圧手段が推定した前記推定雑音とを混合した信号を生成し、前記混合信号の音量レベルを算出する混合レベル算出手段と、(5)前記混合レベル算出手段が算出した前記混合信号の音量レベルに基づいて、前記混合信号に混合させる前記入力信号の音量レベルと、前記混合信号に混合させる前記推定雑音の音量レベルを調整する混合レベル調整手段と、(6)前記目的エリア音に、前記混合レベル調整手段で算出された音量レベルに調整した前記入力信号と、前記混合レベル調整手段で算出された音量レベルに調整した前記推定雑音とを混合させた混合後目的エリア音を生成して出力する信号混合手段として機能させることを特徴とする。
本発明によれば、目的エリアを音源とする音を収音するエリア収音を行う際に、収音した音の音質をより向上させることができる。
(A)主たる実施形態
以下、本発明による収音装置及びプログラムの一実施形態を、図面を参照しながら詳述する。
以下、本発明による収音装置及びプログラムの一実施形態を、図面を参照しながら詳述する。
(A−1)実施形態の構成
図1は、この実施形態の収音装置100の機能的構成について示したブロック図である。
図1は、この実施形態の収音装置100の機能的構成について示したブロック図である。
収音装置100は、2つのマイクロホンアレイMA(MA1、MA2)を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。
マイクロホンアレイMA1、MA2は、目的エリアが存在する空聞の任意の場所に配置される。目的エリアに対するマイクロホンアレイMA1、MA2の位置は、例えば、図3に示すように、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイMAは2つ以上のマイクロホンMから構成され、各マイクロホンMにより音響信号を収音する。この実施形態では、各マイクロホンアレイMAに、3つのマイクロホンM1、M2、M3が配置されるものとして説明する。すなわち、各マイクロホンアレイMAは、3chマイクロホンアレイを構成している。なお、マイクロホンアレイMAの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイMAを配置する必要がある。
図2は、各マイクロホンアレイMAにおけるマイクロホンM1、M2、M3の位置関係について示した説明図である。
図2に示すように、各マイクロホンアレイMAでは、2つのマイクロホンM1、M2を目的エリアの方向に対して水平となるように配置し、さらにそのマイクロホンM1、M2を結んだ直線と直行し、かつどちらかのマイクロホンM1、M2を通る直線上にマイクロホンM3が配置されている。この際、マイクロホンM3、M2間の距離は、マイクロホンM1、M2間の距離と同じとする。すなわち、3個のマイクロホンM1、M2、M3は、直角二等辺三角形の頂点となるように配置されているものとする。
収音装置100は、信号入力部1、雑音抑圧部2、指向性形成部3、遅延補正部4、空間座標データ5、目的エリア音パワー補正係数算出部6、目的エリア音抽出部7、混合レベル算出部8、混合レベル調節部9、及び信号混合部10を有している。収音装置100を構成する各機能ブロックの詳細処理については後述する。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
この実施形態の収音装置100は、背景雑音と非目的エリア音の大きさに応じて、いずれかのマイクロホンアレイMAからの入力信号と推定雑音の音量レベルをそれぞれ調節し、抽出した目的エリア音に混合するものとする。
目的エリア音を抽出する処理により発生するミュージカルノイズは、背景雑音と非目的エリア音の音量レベルが大きいほど強くなる。そこで、収音装置100では、混合する入力信号と推定雑音の総和の音量レベルも、背景雑音と非目的エリア音の音量レベルに比例して大きくする。収音装置100では、混合する背景雑音の音量レベルを、背景雑音を抑圧する過程で求める推定雑音から算出する。また、収音装置100では、混合する非目的エリア音の音量レベルを、目的エリア音を強調する過程で抽出する目的エリア方向に存在する非目的エリア音と、目的エリア方向以外に存在する非目的エリア音を合わせたものから算出する。
また、収音装置100では、混合する入力信号と推定雑音の比率を、推定雑音と非目的エリア音の音量レベルから決定する。目的エリアの近くに非目的エリア音が存在する場合、混合する入力信号の音量レベルが大きすぎると目的エリア音に非自的エリア音が混入し、どちらが目的エリア音なのかが分からなくなってしまう。そこで、収音装置100は、非目的エリア音が大きいときは混合する入力信号の音量レベルを下げ、推定雑音の音量レベルを大きくして混合する。つまり、収音装置100は、非目的エリア音が存在しないか音量レベルが小さい場合は入力信号の割合を多くし、逆に非目的エリア音の音量レベルが大きい場合推定雑音の割合を多くして混合する。
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態の収音装置100の動作を説明する。
次に、以上のような構成を有するこの実施形態の収音装置100の動作を説明する。
信号入力部1は、各マイクロホンアレイでMA1、MA2収音した音響信号をアナログ信号からデジタル信号に変換し入力する。その後、例えば高速フーリエ変換を用いて時間領域から周波数領域へ変換する。
雑音抑圧部2は、信号入力部1で取得した信号に含まれる背景雑音の成分を推定し、抑圧する。雑音抑圧部2における雑音抑圧処理には、例えば、SSやウィーナーフィルタリング法(Wiener filtering)などを用いることができる。
指向性形成部3は、マイクロホンアレイMA毎に、目的方向以外に存在する非目的エリア音を抽出(例えば、双指向性フィルタにより抽出)し、抽出した非目的エリア音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的エリア方向に指向性を形成した音(BF出力)を取得する。具体的には、指向性形成部3は、マイクロホンアレイMA毎に雑音抑圧部2により背景雑音を抑圧した信号に対し、(4)式に従いBFにより目的エリア方向に指向性を形成した音をBF出力として取得する。したがって、この実施形態において、指向性形成部3は、マイクロホンアレイMA毎に、目的エリア方向に指向性を形成したBF出力を取得するとともに、BF出力を取得する過程で得られた目的エリア方向以外の方向に指向性を形成した非目的エリア音も保持する。なお、指向性形成部3において、BF出力と、目的エリア方向以外の方向に指向性を形成した非目的エリア音を取得する具体的な演算処理方法いついては限定されないものである。
遅延補正部4は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正する。まず空間座標データ5から目的エリアの位置と各マイクロホンアレイMAの位置を取得し、各マイクロホンアレイへMAの目的エリア音の到達時間の差を算出する。次に最も目的エリアから遠い位置に配置されたマイクロホンアレイMAを基準として、全てのマイクロホンアレイMAに目的エリア音が同時に到達するように遅延を加える。
空間座標データ5は、全ての目的エリアの位置情報と、各マイクロホンアレイMAの位置情報を保持する。
目的エリア音パワー補正係数算出部6は、各BF出力に含まれる目的エリア音成分のパワーを同じにするための補正係数を(5)、(6)式または(7)、(8)式に従い算出する。
目的エリア音抽出部7は、目的エリア音パワー補正係数算出部6で算出した補正係数により補正した各BF出力データを(9)式又は(10)式に従ってSSし、目的エリア方向に存在する非目的エリア音を抽出する。さらに、目的エリア音抽出部7は、抽出した非目的エリア音を各BFの出力から(11)式又は(12)式に従いSSすることで目的エリア音を抽出する。
混合レベル算出部8は、雑音抑圧部2で推定した推定雑音と、指向性形成部3で抽出した目的エリア方向以外の非目的エリア音と、目的エリア音抽出部7で抽出した目的エリア音方向の非目的エリア音のパワーを算出し、それらの合計値の大きさから、目的エリア音に混合する入力信号と背景雑音の総音量レベル(混合信号の音量レベル)を決定する。なお、収音装置100において、マイクロホンアレイMA1を主としてエリア収音を行う場合、(11)式によりマイクロホンアレイMA1の入力信号から推定した推定雑音B1(n)と、式(3)に従い抽出した目的エリア方向以外の非目的エリア音M1(n)と、式(9)に従い抽出した目的エリア方向の非目的エリア音N1(n)との合計がA1(n)であるとき、混合レベルをδ1A1(n)とする。ここでδ1は、目的エリア音Z1(n)とA1(n)のSN比に比例する変数であり、例えばSN比0dBでA1(n)を−20dBにする値とする。
混合レベル調節部9は、混合レベル算出部8により求めた混合レベルと、推定雑音と非目的エリア音のパワーの比から目的エリア音に混合する入力信号と推定雑音の音量レベルを調節する。
ここでは、目的エリア音抽出部7は、式(11)に従いマイクロホンアレイMA1を主としてエリア収音を行うものとして説明する。この場合、混合レベル調節部9は、混合する入力信号と推定雑音の比率を決める変数λ1として、推定雑音B1(n)と、非目的エリア音(M1(n)+N1(n))のパワーの比(M1(n)+N1(n))/B1(n)に反比例した値を設定する。混合レベル調節部9は、例えば、(M1(n)+N1(n))/B1(n)=0のとき、λ1=1とする。またλ1の取る範囲は0から1までとする。さらに混合レベルδ1A1(n)を満たすための変数μ1は、(13)式により算出されるものとする。なお、ここでは、マイクロホンアレイMA1を主としてエリア収音を行うため、(13)式において、マイクロホンアレイMA1を形成する任意のマイクロホンから取得した入力信号X11(n)を適用している。
信号混合部10は、目的エリア音抽出部7で抽出した目的エリア音に、信号入力部1で取得した入力信号と、雑音抑圧部2で推定した雑音とを混合レベル調節部9で算出した比率に基づき混合する。ここでは、上述の通り、目的エリア音抽出部7は、式(11)に従いマイクロホンアレイMA1を主としてエリア収音を行う。したがって、信号混合部10は、(14)式を用いて信号を混合し、最終的な出力W1(n)を取得する。
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
この実施形態によれば、以下のような効果を奏することができる。
この実施形態の収音装置100は、図4に示すように、目的エリアの周囲の雑音環境に応じて、マイクの入力信号と推定雑音を目的エリア音に混合する。
図4は、収音装置100が入力エリアと推定雑音を調節して、目的エリア音に混合する処理について示した説明図である。
図4(A)は、入力信号の波形(目的エリア音と雑音を含む波形)について示した図である。図4(B)は、入力信号と推定雑音を混合する前の目的エリア音の波形(ミュージカルノイズ及び歪みが発生した波形)について示した説明図である。図4(C)は、入力信号と推定雑音を混合した後の目的エリア音の波形について示した説明図である。
図4(C)に示すように、収音装置100では、出力する目的エリア音において、ミュージカルノイズをマスキングし、通常の背景雑音のように違和感なく聞かせることができる。また、マイクロホンアレイMA1からの入力信号にはもともと目的エリア音の成分が含まれているため、収音装置100では、図4(C)に示すように目的エリア音に入力信号を混合することにより、目的エリア音の歪みを補正し、音質を改善する効果を奏する。さらに、収音装置100では、非目的エリア音の音量レベルにより、混合する入力信号と推定雑音の音量レベルを調節するため、目的エリア音に混入する非目的エリア音を抑えることができる。
次に、収音装置100における上述の効果を検証するため以下のような実験(以下、「本実験」と呼ぶ)を行った。本実験では、オフィス環境下において、目的エリア内とエリア外にそれぞれスピーカを1つずつ設置し、それぞれ目的エリア音と非目的エリア音の音声を再生する。
本実験では、この状況で、本発明の収音装置100において信号混合部10が出力する音響信号(エリア収音に入力信号と推定雑音を混合した音響信号)をスピーカ出力した音や、目的エリア音抽出部7が出力する音響信号(入力信号と推定雑音を混合する前のエリア収音の音響信号)をスピーカ出力した音を、それぞれ20名の被験者に聞き比べてもらい、主観評価(当該20名の被験者に対するアンケート調査)を行った。本実験の評価項目は、「強調感」(目的エリア音が強調されているかどうか)と「聞き取りやすさ」(目的エリア音が聞き取りやすいかどうか)とした。
図5は、本実験の主観評価の結果について示した説明図である。
本実験では、図5に示すように、「無処理」、「MIX強」、「MIX弱」、「エリア単体」の4つの条件で、それぞれ被験者に音を聴取させ、目的音について「強調感」と「聞き取りやすさ」を主観評価させた。図5(a)は、上述の4つの条件で被験者に音(目的音)の聴取をさせた場合の強調感(目的音の強調感)に関する主観評価の結果である。図5(b)は、上述の4つの条件で被験者に目的音の聴取をさせた場合の聞き取りやすさ(目的音の聞き取りやすさ)に関する主観評価の結果である。本実験の主観評価には、被験者それぞれに対して、それぞれの条件で音の聴取をした後音声用MOS(mean opinion score)テストに従った方式で評価をさせた。本実験では、被験者それぞれに対して、それぞれの条件で人間の音声を目的音とした音声を聴取させ、その際の品質(音声の強調感、音声の聞き取りやすさ)を5段階評価(1が最も音質が悪く、5が最も音質が良い)で格付けさせた。図5では、その評価結果の平均値(被験者20人の平均値)を示している。
本実験において、「無処理」の条件では、収音装置100に入力される入力信号をそのままスピーカから出力した音を被験者に聴取させた。本実験において、「MIX強」の条件では、信号混合部10が出力する音響信号であって、エリア収音に入力信号と推定雑音を混合する際の音量レベルを大きく(後述するMIX弱の条件よりも大きく)した音響信号をスピーカから出力し被験者に聴取させた。本実験において、「MIX弱」の条件では、エリア収音に入力信号と推定雑音を混合する際の音量レベルを小さく(MIX強の条件よりも小さく)した音響信号をスピーカから出力した音を被験者に聴取させた。本実験において、「エリア単体」の条件では、目的エリア音抽出部7が出力する音響信号(入力信号と推定雑音を混合する前のエリア収音の音響信号)をスピーカから出力した音を被験者に聴取させた。
すなわち、MIX弱、MIX強の2つの条件が、本発明の収音装置100が収音して出力する音響信号(信号混合部10から出力される信号)となる。
図5(A)に示すように、MIX弱の条件で、エリア単体と同等の強調感が得られていることがわかる。さらに、図5(B)に示すように、MIX弱の条件で、エリア単体の条件よりも目的音が聞き取りやすくなっていることが分かる。これは、MIX弱の条件では、入力信号と推定雑音を混合したことにより、ミュージカルノイズがマスキングされたことと、目的エリア音の歪が補正されたことの影響だと考えられる。以上の結果から、収音装置100が出力する音響信号では、従来技術におけるエリア収音(例えば、本実験における「エリア単体」の音)と比較し、同程度の強調感を保ちつつ、聞き取りやすさについて改善できることが示された。
(B)他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B−1)上記の実施形態では、収音装置100は、2つのマイクロホンM1、M2が収音した信号を処理しているが、3つ以上のマイクロホンで収音した信号を処理するようにしてもよい。
(B−2)上記各実施形態では、マイクロホンが捕捉して得た音響信号をリアルタイムに処理するものを示したが、マイクロホンが捕捉して得た音響信号を記憶媒体に記憶し、その後、記憶媒体から読み出して処理して目的音、目的エリア音の強調信号を得るようにしても良い。このように記憶媒体を利用する場合には、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良い。同様に、リアルタイム処理をする場合でも、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良く、通信により信号を遠隔地に供給するようにしても良い。
100…収音装置、1…信号入力部、2…雑音抑圧部、3…指向性形成部、4…遅延補正部、5…空間座標データ、6…パワー補正計数算出部、7…目的エリア音抽出部、8…混合レベル算出部、9…混合レベル調節部、10…信号混合部、MA1、MA2…マイクロホンアレイ、マイクロホン…M1、M2、M3。
Claims (4)
- マイクロホンアレイから入力された入力信号に含まれる背景雑音を推定して推定雑音として取得し、取得した前記推定雑音を用いて、前記入力信号の雑音成分を抑圧して雑音抑圧後信号を取得する雑音抑圧手段と、
前記雑音抑圧後信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、
前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出部と、
前記推定雑音のパワーと、前記第1の非目的エリア音のパワーと、前記第2の非目的エリア音のパワーとに基づいて、前記目的エリア音に混合する混合信号として前記マイクロホンアレイから入力された前記入力信号と、前記雑音抑圧手段が推定した前記推定雑音とを混合した信号を生成し、前記混合信号の音量レベルを算出する混合レベル算出手段と、
前記混合レベル算出手段が算出した前記混合信号の音量レベルに基づいて、前記混合信号に混合させる前記入力信号の音量レベルと、前記混合信号に混合させる前記推定雑音の音量レベルを調整する混合レベル調整手段と、
前記目的エリア音に、前記混合レベル調整手段で算出された音量レベルに調整した前記入力信号と、前記混合レベル調整手段で算出された音量レベルに調整した前記推定雑音とを混合させた混合後目的エリア音を生成して出力する信号混合手段と
を有することを特徴とする収音装置。 - 前記混合レベル算出手段は、前記推定雑音のパワーと、前記第1の非目的エリア音のパワーと、前記第2の非目的エリア音のパワーとの合計値に基づいて、前記目的エリア音に混合する前記混合信号の音量レベルを算出することを特徴とする請求項1に記載の収音装置。
- 前記混合レベル調整手段は、前記第1の非目的エリア音のパワーと前記第2の非目的エリア音のパワーの合計と、前記推定雑音のパワーとの比率に基づいて、前記混合信号における前記目的エリア音に混合する前記入力信号と前記推定雑音の比率を算出し、算出した比率に従って、前記混合信号に混合させる前記入力信号の音量レベルと、前記混合信号に混合させる前記推定雑音の音量レベルを調整することを特徴とする請求項2に記載の収音装置。
- コンピュータを、
マイクロホンアレイから入力された入力信号に含まれる背景雑音を推定して推定雑音として取得し、取得した前記推定雑音を用いて、前記入力信号の雑音成分を抑圧して雑音抑圧後信号を取得する雑音抑圧手段と、
前記雑音抑圧後信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、
前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出部と、
前記推定雑音のパワーと、前記第1の非目的エリア音のパワーと、前記第2の非目的エリア音のパワーとに基づいて、前記目的エリア音に混合する混合信号として前記マイクロホンアレイから入力された前記入力信号と、前記雑音抑圧手段が推定した前記推定雑音とを混合した信号を生成し、前記混合信号の音量レベルを算出する混合レベル算出手段と、
前記混合レベル算出手段が算出した前記混合信号の音量レベルに基づいて、前記混合信号に混合させる前記入力信号の音量レベルと、前記混合信号に混合させる前記推定雑音の音量レベルを調整する混合レベル調整手段と、
前記目的エリア音に、前記混合レベル調整手段で算出された音量レベルに調整した前記入力信号と、前記混合レベル調整手段で算出された音量レベルに調整した前記推定雑音とを混合させた混合後目的エリア音を生成して出力する信号混合手段と
して機能させることを特徴とする収音プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016065817A JP6187626B1 (ja) | 2016-03-29 | 2016-03-29 | 収音装置及びプログラム |
US15/376,747 US9986332B2 (en) | 2016-03-29 | 2016-12-13 | Sound pick-up apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016065817A JP6187626B1 (ja) | 2016-03-29 | 2016-03-29 | 収音装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6187626B1 true JP6187626B1 (ja) | 2017-08-30 |
JP2017183902A JP2017183902A (ja) | 2017-10-05 |
Family
ID=59720302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016065817A Active JP6187626B1 (ja) | 2016-03-29 | 2016-03-29 | 収音装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9986332B2 (ja) |
JP (1) | JP6187626B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019068133A (ja) * | 2017-09-28 | 2019-04-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6624255B1 (ja) * | 2018-08-29 | 2019-12-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP6624256B1 (ja) * | 2018-08-29 | 2019-12-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP6669219B2 (ja) * | 2018-09-04 | 2020-03-18 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP7158976B2 (ja) | 2018-09-28 | 2022-10-24 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
CN113228704A (zh) * | 2018-12-27 | 2021-08-06 | 索尼集团公司 | 信息处理装置、信息处理方法和程序 |
JP6725014B1 (ja) * | 2019-01-23 | 2020-07-15 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
JP6822505B2 (ja) | 2019-03-20 | 2021-01-27 | 沖電気工業株式会社 | 収音装置、収音プログラム及び収音方法 |
JP7404657B2 (ja) * | 2019-05-28 | 2023-12-26 | 沖電気工業株式会社 | 音声認識装置、音声認識プログラム、及び音声認識方法 |
US10645520B1 (en) * | 2019-06-24 | 2020-05-05 | Facebook Technologies, Llc | Audio system for artificial reality environment |
JP6879340B2 (ja) | 2019-07-29 | 2021-06-02 | 沖電気工業株式会社 | 収音装置、収音プログラム、及び収音方法 |
JP6908142B1 (ja) * | 2020-01-27 | 2021-07-21 | 沖電気工業株式会社 | 収音装置、収音プログラム、及び収音方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4162604B2 (ja) | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
EP2642768B1 (en) * | 2010-12-21 | 2018-03-14 | Nippon Telegraph And Telephone Corporation | Sound enhancement method, device, program, and recording medium |
JP5482854B2 (ja) * | 2012-09-28 | 2014-05-07 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP5737342B2 (ja) * | 2013-07-22 | 2015-06-17 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP6206003B2 (ja) * | 2013-08-30 | 2017-10-04 | 沖電気工業株式会社 | 音源分離装置、音源分離プログラム、収音装置及び収音プログラム |
JP6197534B2 (ja) * | 2013-09-26 | 2017-09-20 | 沖電気工業株式会社 | 音源分離装置、音源分離方法、及び音源分離プログラム |
JP5648760B1 (ja) * | 2014-03-07 | 2015-01-07 | 沖電気工業株式会社 | 収音装置及びプログラム |
US9510096B2 (en) * | 2014-05-04 | 2016-11-29 | Yang Gao | Noise energy controlling in noise reduction system with two microphones |
JP6149818B2 (ja) * | 2014-07-18 | 2017-06-21 | 沖電気工業株式会社 | 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム |
JP2016042132A (ja) * | 2014-08-18 | 2016-03-31 | ソニー株式会社 | 音声処理装置、音声処理方法、並びにプログラム |
-
2016
- 2016-03-29 JP JP2016065817A patent/JP6187626B1/ja active Active
- 2016-12-13 US US15/376,747 patent/US9986332B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019068133A (ja) * | 2017-09-28 | 2019-04-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
US9986332B2 (en) | 2018-05-29 |
US20170289677A1 (en) | 2017-10-05 |
JP2017183902A (ja) | 2017-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6187626B1 (ja) | 収音装置及びプログラム | |
JP6065028B2 (ja) | 収音装置、プログラム及び方法 | |
KR101547035B1 (ko) | 다중 마이크에 의한 3차원 사운드 포착 및 재생 | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
JP6065030B2 (ja) | 収音装置、プログラム及び方法 | |
JP5772151B2 (ja) | 音源分離装置、プログラム及び方法 | |
JP6540730B2 (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP6943120B2 (ja) | 収音装置、プログラム及び方法 | |
US11095979B2 (en) | Sound pick-up apparatus, recording medium, and sound pick-up method | |
JP2016163135A (ja) | 収音装置、プログラム及び方法 | |
JP6624256B1 (ja) | 収音装置、プログラム及び方法 | |
JP6065029B2 (ja) | 収音装置、プログラム及び方法 | |
JP6879340B2 (ja) | 収音装置、収音プログラム、及び収音方法 | |
JP6863004B2 (ja) | 収音装置、プログラム及び方法 | |
JP6241520B1 (ja) | 収音装置、プログラム及び方法 | |
JP2020053920A (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6260666B1 (ja) | 収音装置、プログラム及び方法 | |
JP5105336B2 (ja) | 音源分離装置、プログラム及び方法 | |
JP6624255B1 (ja) | 収音装置、プログラム及び方法 | |
JP6725014B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6669219B2 (ja) | 収音装置、プログラム及び方法 | |
JP2017181761A (ja) | 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム | |
JP2020048038A (ja) | 収音装置、プログラム及び方法 | |
JP6263890B2 (ja) | 音声信号処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6187626 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |