[go: up one dir, main page]

JP6822505B2 - 収音装置、収音プログラム及び収音方法 - Google Patents

収音装置、収音プログラム及び収音方法 Download PDF

Info

Publication number
JP6822505B2
JP6822505B2 JP2019053617A JP2019053617A JP6822505B2 JP 6822505 B2 JP6822505 B2 JP 6822505B2 JP 2019053617 A JP2019053617 A JP 2019053617A JP 2019053617 A JP2019053617 A JP 2019053617A JP 6822505 B2 JP6822505 B2 JP 6822505B2
Authority
JP
Japan
Prior art keywords
target area
sound
area sound
level
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019053617A
Other languages
English (en)
Other versions
JP2020155972A (ja
Inventor
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2019053617A priority Critical patent/JP6822505B2/ja
Priority to US16/689,504 priority patent/US11095979B2/en
Publication of JP2020155972A publication Critical patent/JP2020155972A/ja
Application granted granted Critical
Publication of JP6822505B2 publication Critical patent/JP6822505B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、収音装置、収音プログラム及び収音方法に関し、例えば特定のエリアの音を強調し、それ以外のエリアの音を抑圧するエリア収音処理に適用し得る。
従来、複数の音源が存在する環境下において、ある特定の方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下、「BF」と呼ぶ)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図5は、マイクロホン数が2個の場合の減算型BF300に係る構成を示すブロック図である。
図5に示す減算型BF300は、遅延器310と減算器320とを有している。
減算型BF300は、まず遅延器310により目的とする方向に存在する音(以下、「目的音」と呼ぶ)が各マイクロホンに到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。時間差は下記(1)式により算出される。ここで「d」はマイクロホン間の距離であり、「c」は音速であり、「τL」は遅延量である。また、ここで「θ」は、各マイクロホン(M1、M2)の間を結んだ直線に対する垂直方向から目的方向への角度である。
τ=(dsinθ)/c …(1)
ここで、死角がマイクロホンM1とマイクロホンM2の中心に対し、マイクロホンM1の方向に存在する場合、遅延器310は、マイクロホンM1の入力信号x(t)に対し遅延処理を行う。その後、減算型BF300では、減算器320が(2)式に従い減算処理を行う。
m(t)=x(t)−x(t−τ) …(2)
減算器320では、周波数領域でも同様に減算処理を行うことができ、その場合(2)式は以下(3)式のように変更される。
Figure 0006822505
図6は、2個のマイクロホンM1、M2を用いた減算型BF300により形成される指向特性を示す図である。
ここでθ=±π/2の場合、減算器320で形成される指向性は図6(a)に示すように、カージオイド型の単一指向性となり、θ=0,πの場合は、図6(b)のような8の字型の双指向性となる。ここでは、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを「双指向性フィルタ」と呼ぶものとする。
また、減算器320では、スペクトル減算法(Spectral Subtraction;以下単に「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、(4)式に従い全周波数、又は指定した周波数帯域で形成される。(4)式では、マイクロホンM1の入力信号Xを用いているが、マイクロホンM2の入力信号Xでも同様の効果を得ることができる。ここでβはSSの強度を調節するための係数である。
減算器320では、減算処理時に値がマイナスになった場合は、0または元の値を小さくした値に置き換える処理(フロアリング処理)を行う。この方式により、減算器320では、双指向性フィルタにより目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
Y(n)=X(n)−βM(n) …(4)
ところで、ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源(以下、「非目的エリア音」と呼ぶ)も収音してしまう可能性がある。そこで特許文献1の記載技術では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法(以下、「エリア収音」と呼ぶ)を提案している。
従来のエリア収音では、まず各マイクロホンアレイのBF出力に含まれる目的エリア音の振幅スペクトルの比率を推定し、それを補正係数とする。例えば、2つのマイクロホンアレイを使用する場合、目的エリア音振幅スペクトルの補正係数は、(5)式、(6)式または(7)式、(8)式により算出される。
Figure 0006822505
ここで、「Y1k(n)」、「Y2k(n)」は、それぞれ第1、第2のマイクロホンアレイのBF出力の振幅スペクトルである。また、「N」は周波数ビンの総数であり、「k」は周波数である。さらに、「α(n)」、「α(n)」は、それぞれ第1、第2のマイクロホンアレイのBF出力に対する振幅スペクトル補正係数である。さらにまた、「mode」は最頻値、「median」は中央値をそれぞれ表している。
従来のエリア収音処理では、その後、補正係数により各BF出力を補正し、SSすることで、目的エリア方向に存在する非目的エリア音を抽出する。更に抽出した非目的エリア音を各BFの出力からSSすることにより目的エリア音を抽出することができる。
この場合、従来のエリア収音処理では、第1のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出するには、(9)式に示すように、第1のマイクロホンアレイのBF出力Y(n)から第2のマイクロホンアレイのBF出力Y(n)に振幅スペクトル補正係数αを掛けたものをSSする。同様に(10)式に従い、第2のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出する。
(n)=Y(n)−α(n)Y(n) …(9)
(n)=Y(n)−α(n)Y(n) …(10)
その後、従来のエリア収音処理では、(11)式、(12)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。(11)式は第1のマイクロホンアレイを基準として目的エリア音を抽出する処理を示しており、(12)式は第2のマイクロホンアレイを基準として目的エリア音を抽出する処理を示している。
(n)=Y(n)−γ(n)N(n) …(11)
(n)=Y(n)−γ(n)N(n) …(12)
ここでγ(n)、γ(n)はSS時の強度を変更するための係数である。
従来のエリア収音処理では、目的エリア音を抽出するために、(4)式と(11)及び(12)式で非線形処理であるSSを行っているため、高雑音環境下ではミュージカルノイズと呼ばれる不快な異音が発生する恐れがある。
そこで、特許文献2の記載技術では、入力信号に目的エリア音が存在している区間と存在していない区間を判定し、目的エリア音が存在していない区間ではエリア収音処理した音を出力しないことにより、ミュージカルノイズなどの異音を抑えている。特許文献2の記載技術では、目的エリア音が存在しているかどうかを判定するために、まず(13)式に従い入力信号と目的エリア音を抽出した出力(以後、「エリア音出力」と呼ぶ)間の振幅スペクトル比R(=エリア音出力/入力信号)を算出する。また、目的エリア内に音源が存在する場合、入力信号Xとエリア音出力Zには目的エリア音が共通に含まれるため、目的エリア音成分の振幅スペクトル比は1に近い値となる。逆に、非目的エリア音成分は、エリア音出力では抑圧されているため、振幅スペクトル比は小さい値となる。その他の背景雑音成分に関してもエリア収音処理では複数回のSSを行うため、専用の雑音抑圧処理を事前にしなくてもある程度抑圧され、振幅スペクトル比は小さい値となる。逆に、目的エリア音が存在しない場合、エリア音出力には、入力信号と比べて消し残りの弱い雑音しか含まれていないため、振幅スペクトル比は全体域で小さい値となる。特許文献2の記載技術では、この特徴により、(14)式に従い各周波数で求めた振幅スペクトル比の平均値Uを取ると、目的エリア音が存在するときと存在しないときとで大きな差が生まれることになる。ここでmとnは、それぞれ処理帯域(周波数帯域)の上限と下限であり、例えば音声情報が十分に含まれる100Hzから6kHzとする。そして、特許文献2の記載技術では、平均パワースペクトル比を予め設定した閾値で判定し、目的エリア音が存在しないと判定された場合は、エリア音出力データを出力せずに無音、もしくは入力信号のゲインを小さくした音を出力する。
Figure 0006822505
また、特許文献3では、背景雑音と非目的エリア音の大きさに応じて、マイクの入力信号と推定雑音の音量レベルをそれぞれに調節し、抽出した目的エリア音に混合することにより、ミュージカルノイズをマスキングして影響を抑えている。目的エリア音を抽出する処理により発生するミュージカルノイズは、背景雑音と非目的エリア音の音量レベルが大きいほど強くなるため、特許文献3の記載技術では、混合する入力信号と推定雑音の総和の音量レベルも、背景雑音と非目的エリア音の音量レベルに比例して大きくしている。また、特許文献3の記載技術において、背景雑音の音量レベルは、背景雑音を抑圧する過程で求める推定雑音から算出する。さらに、特許文献3の記載技術において、非目的エリア音の音量レベルは、それぞれ(3)式で抽出する非目的音と(9)式、(10)式で抽出する非目的エリア音を合わせたものから算出する。さらにまた、特許文献3の記載技術では、混合する入力信号と推定雑音の比率は、推定雑音と非目的エリア音の音量レベルから決定する。目的エリアの近くに非目的エリア音が存在する場合、混合する入力信号の音量レベルが大きすぎると、目的エリア音が存在しないときには、非目的エリア音だけが聞こえ、どちらが目的エリア音なのかが分からなくなってしまう。そこで、特許文献3の記載技術では、非目的エリア音が大きいときは混合する入力信号の音量レベルを下げ、推定雑音の音量レベルを大きくして混合する。つまり非目的エリア音が存在しないか音量レベルが小さい場合は入力信号の割合を多くし、逆に非目的エリア音の音量レベルが大きい場合推定雑音の割合を多くして混合する。特許文献3の手法は、ミュージカルノイズをマスキングするだけでなく、マイク入力信号に含まれる目的エリア音の成分により、目的エリア音の歪みを補正し、音質を改善する効果もある。
特開2014−072708号公報 特開2016−127457号公報 特開2017−183902号公報
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行
しかしながら、特許文献2に記載された手法では、高雑音環境下において、ミュージカルノイズの発生を抑えることはできるが、目的エリア音の歪を改善することができない。また、特許文献2に記載された手法では、目的エリア音が存在しないと判定された際に無音とする場合は、誤判定してしまうと音が欠落する。さらに、特許文献2に記載された手法では、目的エリア音が存在しないと判定された際に入力信号を小さくした音を出力する場合は、目的エリア音と切り替わったときに、歪んだ目的エリア音と入力信号とで音が不連続になり違和感が生じる可能性がある。
一方、特許文献3に記載された手法では、高雑音環境下において、ミュージカルノイズの影響を抑え、かつ目的エリア音の歪を改善することができる。しかしながら、特許文献3に記載された手法では、背景雑音と非目的エリア音のレベルがどちらも大きい場合は、混合信号のレベルも大きくなるため、目的エリア音が存在しない区間での雑音抑圧の効果が弱まってしまう問題がある。
そのため、エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法が望まれている。
第1の本発明の収音装置は、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)前記混合用信号は前記入力信号であることを特徴とする。
第2の本発明の収音装置は、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段をさらに備え、(10)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(11)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段として機能させ、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)前記混合用信号は前記入力信号であることを特徴とする。
第4の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段として機能させ、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)前記コンピュータを、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段としてさらに機能させ、(10)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(11)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
の本発明は、収音方法において、(1)指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、及び雑音レベル算出手段を有し、(2)前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、(4)前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、(5)前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、(6)前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、(7)前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、(8)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(9)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(10)前記混合用信号は前記入力信号であることを特徴とする。
第6の本発明は、収音方法において、(1)指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、雑音レベル算出手段及び背景雑音抑圧手段を有し、(2)前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、(4)前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、(5)前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、(6)前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、(7)前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、(8)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(9)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(10)前記背景雑音抑圧手段は、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成し、(11)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(12)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
本発明によれば、エリア収音処理の際に音質劣化を抑制する収音装置、収音プログラム及び収音方法を提供することができる。
第1の実施形態に係る収音装置の機能的構成を示すブロック図である。 第1及び第2の実施形態に係る収音装置のハードウェア構成の例について示したブロック図である。 第1の実施形態に係る収音装置で混合される信号の例について示した図である。 第2の実施形態に係る収音装置の機能的構成を示すブロック図である。 従来の減算型BFの構成を示すブロック図である。 従来の減算型BFにより形成される指向性フィルタの例について示した説明図である。
(A)第1の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第1の実施形態を図面を参照して説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る収音装置100の機能的構成を示すブロック図である。
収音装置100は、2つのマイクロホンアレイMA(MA1、MA2)を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。
マイクロホンアレイMA1、MA2は、目的エリアが存在する空聞の任意の場所に配置される。目的エリアに対するマイクロホンアレイMA1、MA2の位置は、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイMAは2つ以上のマイクロホンMから構成され、各マイクロホンMにより音響信号を収音する。この実施形態では、各マイクロホンアレイMAに、音響信号を収音する2つのマイクロホンM1、M2が配置されるものとして説明する。すなわち、この実施形態において、各マイクロホンアレイMAは、2chマイクロホンアレイを構成しているものとする。2個のマイクロホンM1、M2の間の距離は限定されないものであるが、この実施形態の例では、2個のマイクロホンM1、M2の間の距離は3cmとする。なお、マイクロホンアレイMAの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイMAを配置する必要がある。
次に、図1、図2を用いて収音装置100の内部構成について説明する。
図1に示す通り、収音装置100は、信号入力部1、指向性形成部2、遅延補正部3、空間座標データ4、補正係数算出部5、目的エリア音抽出部6、目的エリア音判定部7、雑音レベル算出部8、混合レベル調整部9、及び信号混合部10。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
次に、図2を用いて、収音装置100のハードウェア構成について説明する。
図2は、収音装置100のハードウェア構成の例について示したブロック図である。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
図2では、収音装置100を、ソフトウェア(コンピュータ)を用いて構成する際のハードウェア構成の例について示している。
図2に示す収音装置100は、ハードウェア的な構成要素として、プログラム(実施形態の収音プログラムを含む)がインストールされたコンピュータ200を有している。また、コンピュータ200は、収音プログラム専用のコンピュータとしてもよいし、他の機能のプログラムと共用される構成としてもよい。
図2に示すコンピュータ200は、プロセッサ201、一次記憶部202、及び二次記憶部203を有している。一次記憶部202は、プロセッサ201の作業用メモリ(ワークメモリ)として機能する記憶手段であり、例えば、DRAM(Dynamic Random Access Memory)等の高速動作するメモリを適用することができる。二次記憶部203は、OS(Operating System)やプログラムデータ(実施形態に係る収音プログラムのデータを含む)等の種々のデータを記録する記憶手段であり、例えば、FLASHメモリやHDD等の不揮発性メモリを適用することができる。この実施形態のコンピュータ200では、プロセッサ201が起動する際、二次記憶部203に記録されたOSやプログラム(実施形態に係る収音プログラムを含む)を読み込み、一次記憶部202上に展開して実行する。
なお、コンピュータ200の具体的な構成は図2の構成に限定されないものであり、種々の構成を適用することができる。例えば、一次記憶部202が不揮発メモリ(例えば、FLASHメモリ等)であれば、二次記憶部203については除外した構成としてもよい。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の収音装置100の動作(実施形態の収音方法)を説明する。
信号入力部1は、各マイクロホンアレイMA(MA1、MA2)が収音した音響信号の入力をうけるとその音響信号をアナログ信号からデジタル信号に変換する。そして、信号入力部1は、当該音響信号(デジタル信号)を、所定の方法(例えば、高速フーリエ変換)を用いて、時間領域から周波数領域へ変換する。以下では、各マイクロホンアレイMAにおいて、マイクロホンM1、M2の周波数領域の入力信号を、それぞれX、Xとして説明する。
指向性形成部2は、マイクロホンアレイ毎に入力信号に対し、(4)式に従いBFにより目的エリア方向に指向性を形成する。以下では、マイクロホンアレイMA1、MA2のBF出力の振幅スペクトルを、それぞれY1k(n)、Y2k(n)として説明する。
遅延補正部3は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正する。遅延補正部3は、まず空間座標データ4から目的エリアの位置とマイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間の差を算出する。次に、遅延補正部3は、最も目的エリアから遠い位置に配置されたマイクロホンアレイを基準として、全てのマイクロホンアレイに目的エリア音が同時に到達するように遅延を加える。
空間座標データ4は、全ての目的エリアと各マイクロホンアレイと各マイクロホンアレイを構成するマイクロホンの位置情報を保持する。
補正係数算出部5は、各BF出力に含まれる目的エリア音成分の振幅スペクトルを同じにするための補正係数を算出する。以下では、マイクロホンアレイMA1、MA2のBF出力に対する補正係数を、α(n)、α(n)として説明する。補正係数算出部5は、「(5)式、(6)式」または「(7)式、(8)式」に従い補正係数を算出する。
目的エリア音抽出部6は、補正係数算出部5で算出した補正係数により補正した各BF出力から、目的エリア方向に存在する非目的エリア音を抽出する。そして、目的エリア音抽出部6は、補正係数算出部5で算出した補正係数により補正した各BF出力データを、例えば、(9)式もしくは(10)式に従いSSし、目的エリア方向に存在する非目的エリア音(N(n)又はN(n))を抽出する。
さらに、目的エリア音抽出部6は、抽出した非目的エリア音(N(n)又はN(n))を、各BFの出力から(11)式、もしくは(12)式に従いSSすることにより、目的エリア音(Z(n)又はZ(n))を抽出する。
目的エリア音判定部7は、入力信号に目的エリア音が存在するか否かを判定する処理(以下、「目的エリア音判定処理」と呼ぶ)を行う。目的エリア音判定部7は、目的エリア音判定処理で、入力信号に目的エリア音が存在すると判定した場合には、「目的エリア音有り」を示すデータ(信号)を出力し、入力信号に目的エリア音が存在しない判定した場合には、「目的エリア音無し」を示すデータ(信号)を出力する。以下では、目的エリア音判定部7が「目的エリア音有り」を出力している状態(入力信号に目的エリア音が含まれていると判定される状態)を「目的エリア音含有判定状態」と呼び、目的エリア音判定部7が「目的エリア音無し」を出力している状態(入力信号に目的エリア音が含まれていないと判定される状態)を「目的エリア音非含有判定状態」とする。
目的エリア音判定部7における目的エリア音判定処理の方式は限定されないものであり種々の方式を適用することができる。この実施形態では、目的エリア音判定部7は、特許文献2の方式により目的エリア音判定処理を行うものとする。例えば、目的エリア音判定部7は、各周波数について目的エリア音と入力信号の振幅スペクトル比を(13)式に従って求め、各周波数で求めた振幅スペクトル比Rの平均値Uを(14)式に従って求める。そして、目的エリア音判定部7は、求めたUを予め設定した閾値と比較することで、目的エリア音が存在するかしないかを判定する。
雑音レベル算出部8は、目的エリア音判定部7で「目的エリア音無し」と判定したときの入力信号のレベルを、推定した雑音のレベル(以下、「推定雑音レベルP」と呼ぶ)として算出するものとする。例えば、雑音レベル算出部8は、目的エリア音判定部7が、「目的エリア音無し」と1回判定したときの入力信号のレベルを推定雑音レベルPとして取得するようにしてもよい。また、例えば、雑音レベル算出部8は、目的エリア音判定部7が「目的エリア音無し」と判定したときの入力信号を複数回分取得して、その平均値(平均レベル)を推定雑音レベルPとして取得するようにしてもよい。さらに、雑音レベル算出部8は、複数回分の入力レベルの平均値を推定雑音レベルPとして取得する場合、忘却係数を設定し、過去の信号と現在の信号とで重み付け(時系列が古い信号ほど低い重み付け)をしても良い。
また、雑音レベル算出部8は、目的エリア音判定部7で「目的エリア音有り」と判定しているときの入力信号を仮の目的エリア音(簡易的な推定目的エリア音)の推定レベル(以下、「仮目的エリア音推定レベルPΤ」と呼ぶ)として算出する。例えば、雑音レベル算出部8は、目的エリア音判定部7が「目的エリア音有り」と1回判定したときの入力信号のレベルを仮目的エリア音推定レベルPΤとして取得するようにしてもよいし、目的エリア音判定部7が「目的エリア音有り」と判定したときの入力レベルを複数回分取得して、その平均値(平均レベル)を仮目的エリア音推定レベルPΤとして取得するようにしてもよい。
なお、このとき、雑音レベル算出部8は、推定雑音レベルPと仮目的エリア音推定レベルPΤとを同様の方式で算出することが望ましい。例えば、雑音レベル算出部8は、目的エリア音判定部7が「目的エリア音無し」と1回判定したときの入力信号のレベルを推定雑音レベルPとして取得する場合、同様に目的エリア音判定部7が「目的エリア音有り」と1回判定したときの入力信号のレベルを仮目的エリア音推定レベルPΤとして取得するようにすることが望ましい。
そして、雑音レベル算出部8は、推定雑音レベルPと仮目的エリア音推定レベルPΤを、以下の(15)式に適用して簡易的なSN比Qを算出する。
Figure 0006822505
混合レベル調整部9は、目的エリア音判定部7における判定結果を含む要素を考慮して、混合信号のレベルを調整するための係数(以下、「レベル調整係数」とよぶ)を決定する。すなわち、混合レベル調整部9は、目的エリア音判定部7における判定結果が「目的エリア音有り」の状態(目的エリア音含有判定状態)であるか、「目的エリア音無し」の状態(目的エリア音非含有判定状態)であるかで、レベル調整係数を変更するようにしてもよい。例えば、混合レベル調整部9は、予め、「目的エリア音有り」の状態と「目的エリア音無し」の状態とで、それぞれに対応するレベル調整係数を設定しておくようにしてもよい。また、混合レベル調整部9では、ユーザの操作(例えば、ユーザによるコンピュータ200に対する操作)に応じて、適用するレベル調整係数の変更を可能とするようにしてもよい。
以上のように、混合レベル調整部9には、目的エリア音判定部7における判定結果を含む要素を考慮してレベル調整係数を決定するポリシーが設定されている。
図3は、混合レベル調整部9がレベル調整係数を決定するポリシーに応じた混合信号(レベル調整係数に基づいて調整された後の混合信号)を目的エリア音(目的エリア音抽出部6が抽出した目的エリア音)と共に時間領域で図示したグラフである。図3では、目的エリア音の成分に斜線(ハッチ)を付して示し、混合信号(入力信号)の成分を黒塗りで示している。
例えば、混合レベル調整部9は、「目的エリア音有り」の状態の方が、「目的エリア音無し」の状態よりも混合信号レベルが大きくなるようにレベル調整係数を決定するようにしてもよい。例えば、混合レベル調整部9は、「目的エリア音無し」の状態における混合信号レベルを、「目的エリア音有り」の状態の混合信号レベルよりも10dB小さい値とするようにレベル調整係数を決定するようにしてもよい。この場合における、調整後の混合信号と目的エリア音は図3(A)のような内容となる。
また、例えば、混合レベル調整部9は、図3(B)に示すように、「目的エリア音無し」の状態の場合に、混合信号のレベルが0となるように、レベル調整係数を決定するようにしてもよい。
さらに、例えば、混合レベル調整部9は、図3(C)のように「目的エリア音有り」の状態と「目的エリア音無し」の状態で、結果として混合レベルを同じとなるようにレベル調整係数が調整される場合があってもよい。例えば、混合レベル調整部9では、「目的エリア音有り」の状態と「目的エリア音無し」の状態で異なるポリシーでレベル調整係数を決定した結果、一定の条件下で欠課としてレベル調整係数が一致する場合があってもよい。
さらにまた、例えば、混合レベル調整部9は、「目的エリア音無し」の状態の方が、「目的エリア音有り」の状態よりも混合信号レベルが大きくなるようにレベル調整係数を決定するようにしてもよい。例えば、混合レベル調整部9は、「目的エリア音無し」の状態における混合信号レベルを、「目的エリア音有り」の状態の混合信号レベルよりも10dB大きい値とするようにレベル調整係数を決定するようにしてもよい。この場合における、調整後の混合信号と目的エリア音は図3(D)のような内容となる。図3(D)の場合、目的エリア音が存在しないときの出力音は入力信号と同じだが、目的エリア音が存在したときは雑音が抑圧され、目的エリア音を強調する効果がある。
また、例えば、混合レベル調整部9は、全周波数でレベル調整係数を同じ値としても良いし、周波数毎に異なる値を設定しても良い。具体的には、例えば、混合レベル調整部9は、ある周波数k以下のレベル調整係数を0とすれば、混合信号にハイパスフィルタ(高周波濾波フィルタ)を掛けたのと同じ効果が得られる。
さらに、例えば、混合レベル調整部9は、雑音レベル算出部8において算出した推定雑音レベルPもしくはSN比Qを考慮して、動的にレベル調整係数を変更するようにしてもよい。例えば、SN比Qが低い場合(例えば、所定の閾値より低い場合)、入力信号に含まれる雑音レベルが大きく、目的エリア音抽出部6で抽出される目的エリア音の歪やミュージカルノイズが大きくなる傾向にある。そこで、混合レベル調整部9は、SN比Qが低く且つ「目的エリア音有り」の状態の場合に、混合信号レベルがより大きくなるようにレベル調整係数を調整する(例えば、レベル調整係数を一定レベル分加算する)ようにしてもよい。一方、SN比Qが高い場合(例えば、所定の閾値以上の場合)は、目的エリア音抽出部6で抽出される目的エリア音の歪やミュージカルノイズは小さい傾向にある。そこで、混合レベル調整部9は、SN比Qが高い場合は、「目的エリア音有り」の状態及び「目的エリア音無し」の状態いずれの場合であっても、混合信号レベルを小さくするようにレベル調整係数を調整する(例えば、レベル調整係数を一定レベル分減算する)ようにしてもよい。
信号混合部10は、混合レベル調整部9で設定したレベル調整係数を入力信号に掛け、目的エリア音抽出部6で抽出した目的エリア音と混合した出力信号を出力する。以下では、信号混合部10が出力する出力信号を「W」と表すものとする。なお、以下では、マイクロホンアレイMA1を基準とした目的エリア音Zを用いて生成された出力信号を「W」と表し、マイクロホンアレイMA2を基準とした目的エリア音Zを用いて生成された出力信号を「W」と表すものとする。
例えば、目的エリア音抽出部6が(11)式に従いマイクロホンアレイMA1を基準としてエリア収音処理を行った場合、信号混合部10が出力する最終的な出力信号Wは以下の(16)式に従い生成(混合)される。ここで、XMIXは入力信号、μはレベル調整係数である。また、ρは、目的エリア音の大きさを調整するパラメータである。
なお、目的エリア音抽出部6が(12)式に従いマイクロホンアレイMA2を基準としてエリア収音処理を行った場合、信号混合部10が出力する最終的な出力信号Wは以下の(17)式に従い生成(混合)される。
=ρZ+μXMIX …(16)
=ρZ+μXMIX …(17)
また、例えば、信号混合部10は、目的エリア音判定部7における判定が「目的エリア音無し」の場合、ρを0と設定することで、結果として混合信号XMIXの成分だけを出力する状態となってもよい。これにより、出力信号Wにおいてミュージカルノイズの発生を完全に抑えることができる。すなわち、収音装置100は、結果として混合信号のみが出力する構成としてもよい。さらに、例えば、目的エリア音判定部7における判定が「目的エリア音有り」の場合、信号混合部10は、目的エリア音の平均振幅スペクトルが一定になるようにρを動的に変更することで、出力レベルを安定させることができる。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態の収音装置100では、入力信号に目的エリア音が存在する区間と存在しない区間とで、異なるポリシーに従ってレベル調整係数を決定することで、目的エリア音に混合する混合信号(第1の実施形態では入力信号)のレベルを設定し、目的エリア音に入力信号を混合信号として混合している。これにより、第1の実施形態の収音装置100では、混合後の出力信号におけるミュージカルノイズの影響を抑え、目的エリア音の音質を改善すると共に、目的エリア音が存在しないときの雑音の混入を抑えること等の効果を奏することができる。
また、第1の実施形態の収音装置100では、目的エリア音が存在する区間と存在しない区間で同じ混合信号(第1の実施形態では入力信号)を使用するため、目的エリア音を自然に強調することができる。
(B)第2の実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の第2の実施形態を図面を参照して説明する。
(B−1)第2の実施形態の構成
図4は、第2の実施形態に係る収音装置100Aの機能的構成について示したブロック図である。図4では、上述の図1と同一部分又は対応する部分に同一又は対応する符号を付している。
以下では、第2の実施形態の収音装置100Aについて、第1の実施形態との差異を中心に説明する。
従来の収音装置では、入力信号に背景雑音が多く含まれる場合、目的エリア音を抽出する際にミュージカルノイズの発生や、目的エリア音の歪が強くなる可能性がある。そこで、第2の実施形態の収音装置100Aでは、入力信号の背景雑音を抑圧してから目的エリア音を抽出する。また、第2の実施形態の収音装置100Aでは、背景雑音を抑圧した入力信号を混合信号とすることで、混合後の出力信号Wにおける背景雑音の混入を抑えることができる。
具体的には、第2の実施形態の収音装置100Aでは、背景雑音抑圧部11が追加され、さらに雑音レベル算出部8及び混合レベル調整部9が、雑音レベル算出部8A及び混合レベル調整部9Aに置き換わっている点で第1の実施形態と異なっている。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の収音装置100Aの動作(実施形態の収音方法)を説明する。
背景雑音抑圧部11は、信号入力部1で取得した信号に含まれる背景雑音の成分(例えば、人間の音声以外の成分)を推定し(以下、推定した結果を「推定背景雑音」と呼ぶ)、抑圧し、雑音を抑圧した後の入力信号(以下、「雑音抑圧後入力信号」と呼ぶ)を出力する。背景雑音抑圧部11における雑音抑圧処理の方式については限定されないものであり、例えば、SSやウィーナーフィルタリング法(Wiener filtering)などを用いることができる。
第2の実施形態の目的エリア音判定部7は、雑音抑圧後入力信号(背景雑音抑圧部11で背景雑音を抑圧した入力信号)の振幅スペクトルと目的エリア音抽出部6で抽出した目的エリア音とに基づいて目的エリア音判定処理を行う。
雑音レベル算出部8Aは、第1の実施形態と同様にも目的エリア音と、推定雑音レベルとのSN比(S:目的エリア音、N:目的エリア音以外の雑音;以下、以下「第1のSN比」と呼ぶ)を算出する他に、背景雑音抑圧部11で抽出する推定背景雑音、及び目的エリア音抽出部6で抽出した目的エリア音とのSN比(S:目的エリア音の平均振幅スペクトル、N:推定背景雑音の平均振幅スペクトル;以下、「第2のSN比」と呼ぶ)を算出する。また、雑音レベル算出部8Aは、指向性形成部2で抽出される非目的音と目的エリア音抽出部6で抽出する非目的エリア音とのSN比(S:目的エリア音の平均振幅スペクトル、N:非目的音+非目的エリア音の平均振幅スペクトル;以下、「第3のSN比」と呼ぶ)も算出する。
混合レベル調整部9Aは、第1の実施形態と同様に混合信号レベル係数を設定する他に、雑音レベル算出部8Aで算出した各種SN比(第2、第3のSN比)も考慮して混合信号レベル係数を設定するようにしてもよい。例えば、混合レベル調整部9Aは、第2のSN比(S:目的エリア音、N:推定背景雑音)と比較して第3のSN比(S:目的エリア音、N:非目的音+非目的エリア音)が大きい場合、ミュージカルノイズや歪の影響よりも、非目的音と非目的エリア音が混入する影響の方が大きいため、「目的エリア音有り」の状態のときの混合信号レベルを弱く調整する(例えば、レベル調整係数を一定レベル分減算する)ようにしてもよい。
第2の実施形態の信号混合部10は、雑音抑圧後入力信号(背景雑音抑圧部11で背景雑音を抑圧した入力信号)を混合信号として、(16)式に基づき目的エリア音に混合して出力信号Wを得る。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果を比較して以下のような効果を奏することができる。
第2の実施形態の収音装置100Aでは、入力信号を背景雑音抑圧処理してから目的エリア音を抽出することで、ミュージカルノイズの発生や、目的エリア音の歪を抑えることができる。
また、第2の実施形態の収音装置100Aでは、背景雑音を抑圧した入力信号(雑音抑圧後入力信号)を混合信号とすることで、混合後の出力信号Wにおける背景雑音の混入を抑えることができる。
さらに、第2の実施形態の収音装置100Aでは、目的エリア音以外の雑音成分を背景雑音、非目的音、及び非目的エリア音として抽出できるため、それぞれの雑音成分に対するSN比(第1〜第3のSN比)を算出でき、騒音環境に応じた混合レベルの調節が可能になる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態において、遅延補正部3および空間座標データ4は必須ではないため除外するようにしてもよい。例えば、各マイクロホンアレイMAと目的エリア音の配置により、当初から遅延が発生しないか無視できる程度であれば、遅延補正部3の処理および空間座標データ4を除外するようにしてもよい。
(C−2)上記の各実施形態において、補正係数算出部5は必須ではないため除外するようにしてもよい。例えば、各マイクロホンアレイMAと目的エリア音の配置により、各マイクロホンM(各マイクロホンアレイMAを構成する各マイクロホンM)で捕捉される目的エリア音の振幅スペクトルの差が小さいことが明白な場合は、補正係数算出部5の処理を除外してもよい。
(C−3)上記の各実施形態において、SN比Q(第1のSN比)を考慮せずにレベル調整係数を決定する場合には、雑音レベル算出部8は除外するようにしてもよい。
100、100A…収音装置、1…信号入力部、2…指向性形成部、3…遅延補正部、4…空間座標データ、5…補正係数算出部、6…目的エリア音抽出部、7…目的エリア音判定部、8…雑音レベル算出部、8A…雑音レベル算出部、9…混合レベル調整部、9A…混合レベル調整部、10…信号混合部、10A…信号混合部、11…背景雑音抑圧部、16…音響テクノロジーシリーズ、200…コンピュータ、201…プロセッサ、202…一次記憶部、203…二次記憶部。

Claims (10)

  1. 複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
    前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
    前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
    前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    前記混合用信号は前記入力信号である
    ことを特徴とする収音装置。
  2. 前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態の場合と、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態の場合とで、異なる値の前記レベル調整係数を決定することを特徴とする請求項1に記載の収音装置。
  3. 前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態の場合、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態の場合よりも小さい値の前記レベル調整係数を決定することを特徴とする請求項2に記載の収音装置。
  4. 前記混合レベル調整手段は、前記第1のSN比が閾値以上の場合、前記レベル調整係数を減算する調整を行うことを特徴とする請求項1〜3のいずれかに記載の収音装置。
  5. 複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
    前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
    前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
    前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段をさらに備え、
    前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
    前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
    ことを特徴とする収音装置。
  6. 前記背景雑音抑圧手段は、処理の過程で前記入力信号に含まれる背景雑音を推定して推定背景雑音として取得し、
    前記指向性形成手段は、処理の過程で前記入力信号から、前記目的エリア方向以外の方向からの非目的音を抽出し、
    前記混合レベル調整手段は、前記目的エリア音抽出手段が抽出した目的エリア音と、前記背景雑音抑圧手段が取得した推定背景雑音とに基づく第2のSN比より、前記目的エリア音抽出手段が抽出した目的エリア音と、前記目的エリア音抽出手段が取得した前記非目的エリア音及び前記指向性形成手段が取得した非目的音を加算した信号とに基づく第3のSN比が大きい場合、目的エリア音含有判定状態における前記レベル調整係数を減算する調整を行う
    ことを特徴とする請求項に記載の収音装置。
  7. コンピュータを、
    複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
    前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
    前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
    前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段として機能させ、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    前記混合用信号は前記入力信号である
    ことを特徴とする収音プログラム。
  8. コンピュータを、
    複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
    前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
    前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
    前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
    前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段として機能させ、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    前記コンピュータを、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段としてさらに機能させ、
    前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
    前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
    ことを特徴とする収音プログラム。
  9. 収音方法において、
    指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、及び雑音レベル算出手段を有し、
    前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、
    前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、
    前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、
    前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、
    前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、
    前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    前記混合用信号は前記入力信号である
    ことを特徴とする収音方法。
  10. 収音方法において、
    指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、雑音レベル算出手段、及び背景雑音抑圧手段を有し、
    前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、
    前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、
    前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、
    前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、
    前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、
    前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、
    前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
    前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
    前記背景雑音抑圧手段は、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成し、
    前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
    前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
    ことを特徴とする収音方法。
JP2019053617A 2019-03-20 2019-03-20 収音装置、収音プログラム及び収音方法 Active JP6822505B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019053617A JP6822505B2 (ja) 2019-03-20 2019-03-20 収音装置、収音プログラム及び収音方法
US16/689,504 US11095979B2 (en) 2019-03-20 2019-11-20 Sound pick-up apparatus, recording medium, and sound pick-up method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019053617A JP6822505B2 (ja) 2019-03-20 2019-03-20 収音装置、収音プログラム及び収音方法

Publications (2)

Publication Number Publication Date
JP2020155972A JP2020155972A (ja) 2020-09-24
JP6822505B2 true JP6822505B2 (ja) 2021-01-27

Family

ID=72514093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019053617A Active JP6822505B2 (ja) 2019-03-20 2019-03-20 収音装置、収音プログラム及び収音方法

Country Status (2)

Country Link
US (1) US11095979B2 (ja)
JP (1) JP6822505B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10645520B1 (en) * 2019-06-24 2020-05-05 Facebook Technologies, Llc Audio system for artificial reality environment
JP7529064B1 (ja) 2023-01-19 2024-08-06 沖電気工業株式会社 収音装置、収音プログラム、収音方法、判定装置、判定プログラム及び判定方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050147258A1 (en) * 2003-12-24 2005-07-07 Ville Myllyla Method for adjusting adaptation control of adaptive interference canceller
JP4697465B2 (ja) * 2004-11-08 2011-06-08 日本電気株式会社 信号処理の方法、信号処理の装置および信号処理用プログラム
US7925504B2 (en) * 2005-01-20 2011-04-12 Nec Corporation System, method, device, and program for removing one or more signals incoming from one or more directions
JP4225430B2 (ja) * 2005-08-11 2009-02-18 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
JP5482854B2 (ja) 2012-09-28 2014-05-07 沖電気工業株式会社 収音装置及びプログラム
JP6206003B2 (ja) * 2013-08-30 2017-10-04 沖電気工業株式会社 音源分離装置、音源分離プログラム、収音装置及び収音プログラム
JP6065028B2 (ja) 2015-01-05 2017-01-25 沖電気工業株式会社 収音装置、プログラム及び方法
US9781508B2 (en) * 2015-01-05 2017-10-03 Oki Electric Industry Co., Ltd. Sound pickup device, program recorded medium, and method
JP6187626B1 (ja) * 2016-03-29 2017-08-30 沖電気工業株式会社 収音装置及びプログラム
JP6241520B1 (ja) * 2016-08-31 2017-12-06 沖電気工業株式会社 収音装置、プログラム及び方法
JP6436180B2 (ja) * 2017-03-24 2018-12-12 沖電気工業株式会社 収音装置、プログラム及び方法

Also Published As

Publication number Publication date
US11095979B2 (en) 2021-08-17
JP2020155972A (ja) 2020-09-24
US20200304907A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
JP6187626B1 (ja) 収音装置及びプログラム
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6065030B2 (ja) 収音装置、プログラム及び方法
JP6540730B2 (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
JP6822505B2 (ja) 収音装置、収音プログラム及び収音方法
JP7158976B2 (ja) 収音装置、収音プログラム及び収音方法
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP6943120B2 (ja) 収音装置、プログラム及び方法
JP6260666B1 (ja) 収音装置、プログラム及び方法
JP7404657B2 (ja) 音声認識装置、音声認識プログラム、及び音声認識方法
JP6725014B1 (ja) 収音装置、収音プログラム及び収音方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
JP6241520B1 (ja) 収音装置、プログラム及び方法
JP6624256B1 (ja) 収音装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
JP6729744B1 (ja) 収音装置、収音プログラム及び収音方法
JP6923025B1 (ja) 収音装置、プログラム及び方法
JP6885483B1 (ja) 収音装置、収音プログラム及び収音方法
JP6624255B1 (ja) 収音装置、プログラム及び方法
JP2024027617A (ja) 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法
JP6669219B2 (ja) 収音装置、プログラム及び方法
JP2016127458A (ja) 収音装置、プログラム及び方法
JP7529065B1 (ja) 収音装置、収音プログラム及び収音方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201221

R150 Certificate of patent or registration of utility model

Ref document number: 6822505

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150