JP6822505B2 - 収音装置、収音プログラム及び収音方法 - Google Patents
収音装置、収音プログラム及び収音方法 Download PDFInfo
- Publication number
- JP6822505B2 JP6822505B2 JP2019053617A JP2019053617A JP6822505B2 JP 6822505 B2 JP6822505 B2 JP 6822505B2 JP 2019053617 A JP2019053617 A JP 2019053617A JP 2019053617 A JP2019053617 A JP 2019053617A JP 6822505 B2 JP6822505 B2 JP 6822505B2
- Authority
- JP
- Japan
- Prior art keywords
- target area
- sound
- area sound
- level
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 238000001228 spectrum Methods 0.000 claims description 55
- 238000003491 array Methods 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 26
- 230000001629 suppression Effects 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
τL=(dsinθL)/c …(1)
m(t)=x2(t)−x1(t−τL) …(2)
Y(n)=X1(n)−βM(n) …(4)
N1(n)=Y1(n)−α2(n)Y2(n) …(9)
N2(n)=Y2(n)−α1(n)Y1(n) …(10)
Z1(n)=Y1(n)−γ1(n)N1(n) …(11)
Z2(n)=Y2(n)−γ2(n)N2(n) …(12)
第2の本発明の収音装置は、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段をさらに備え、(10)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(11)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
第4の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、(3)前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、(4)前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、(5)前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段として機能させ、(6)前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、(7)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(8)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(9)前記コンピュータを、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段としてさらに機能させ、(10)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(11)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
第6の本発明は、収音方法において、(1)指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、雑音レベル算出手段及び背景雑音抑圧手段を有し、(2)前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、(4)前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、(5)前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、(6)前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、(7)前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、(8)前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、(9)前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、(10)前記背景雑音抑圧手段は、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成し、(11)前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、(12)前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号であることを特徴とする。
以下、本発明による収音装置、収音プログラム及び収音方法の第1の実施形態を図面を参照して説明する。
図1は、第1の実施形態に係る収音装置100の機能的構成を示すブロック図である。
次に、以上のような構成を有する第1の実施形態の収音装置100の動作(実施形態の収音方法)を説明する。
W1=ρZ1+μXMIX …(16)
W2=ρZ2+μXMIX …(17)
第1の実施形態によれば、以下のような効果を奏することができる。
以下、本発明による収音装置、収音プログラム及び収音方法の第2の実施形態を図面を参照して説明する。
図4は、第2の実施形態に係る収音装置100Aの機能的構成について示したブロック図である。図4では、上述の図1と同一部分又は対応する部分に同一又は対応する符号を付している。
次に、以上のような構成を有する第2の実施形態の収音装置100Aの動作(実施形態の収音方法)を説明する。
第2の実施形態によれば、第1の実施形態の効果を比較して以下のような効果を奏することができる。
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
Claims (10)
- 複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
前記混合用信号は前記入力信号である
ことを特徴とする収音装置。 - 前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態の場合と、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態の場合とで、異なる値の前記レベル調整係数を決定することを特徴とする請求項1に記載の収音装置。
- 前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果が目的エリア音非含有判定状態の場合、前記目的エリア音判定手段の判定結果が目的エリア音含有判定状態の場合よりも小さい値の前記レベル調整係数を決定することを特徴とする請求項2に記載の収音装置。
- 前記混合レベル調整手段は、前記第1のSN比が閾値以上の場合、前記レベル調整係数を減算する調整を行うことを特徴とする請求項1〜3のいずれかに記載の収音装置。
- 複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段とを有し、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段をさらに備え、
前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
ことを特徴とする収音装置。 - 前記背景雑音抑圧手段は、処理の過程で前記入力信号に含まれる背景雑音を推定して推定背景雑音として取得し、
前記指向性形成手段は、処理の過程で前記入力信号から、前記目的エリア方向以外の方向からの非目的音を抽出し、
前記混合レベル調整手段は、前記目的エリア音抽出手段が抽出した目的エリア音と、前記背景雑音抑圧手段が取得した推定背景雑音とに基づく第2のSN比より、前記目的エリア音抽出手段が抽出した目的エリア音と、前記目的エリア音抽出手段が取得した前記非目的エリア音及び前記指向性形成手段が取得した非目的音を加算した信号とに基づく第3のSN比が大きい場合、目的エリア音含有判定状態における前記レベル調整係数を減算する調整を行う
ことを特徴とする請求項5に記載の収音装置。 - コンピュータを、
複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段として機能させ、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
前記混合用信号は前記入力信号である
ことを特徴とする収音プログラム。 - コンピュータを、
複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出する目的エリア音抽出手段と、
前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定する目的エリア音判定手段と、
前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定する混合レベル調整手段と、
前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力する混合手段と、
前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出する雑音レベル算出手段として機能させ、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
前記コンピュータを、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成する背景雑音抑圧手段としてさらに機能させ、
前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
ことを特徴とする収音プログラム。 - 収音方法において、
指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、及び雑音レベル算出手段を有し、
前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、
前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、
前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、
前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、
前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、
前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
前記混合用信号は前記入力信号である
ことを特徴とする収音方法。 - 収音方法において、
指向性形成手段、目的エリア音抽出手段、目的エリア音判定手段、混合レベル調整手段、混合手段、雑音レベル算出手段、及び背景雑音抑圧手段を有し、
前記指向性形成手段は、複数のマイクアレイから供給される入力信号又は前記入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの目的方向信号を取得し、
前記目的エリア音抽出手段は、それぞれの前記目的方向信号をスペクトル減算することで前記目的エリア方向に存在する非目的エリア音を抽出し、抽出した前記非目的エリア音をいずれかの前記目的方向信号からスペクトル減算することにより目的エリア音を抽出し、
前記目的エリア音判定手段は、前記入力信号と目的エリア音の振幅スペクトルに基づいて、前記入力信号に目的エリア音の成分が含まれる目的エリア音含有判定状態又は、前記入力信号に目的エリア音の成分が含まれない目的エリア音非含有判定状態のいずれかを判定し、
前記混合レベル調整手段は、前記目的エリア音判定手段の判定結果を含む要素に基づいて、前記目的エリア音抽出手段で抽出された目的エリア音に混合する混合用信号のレベルを調整するためのレベル調整係数を決定し、
前記混合手段は、前記混合用信号のレベルを前記混合レベル調整手段で決定した前記レベル調整係数で調整したレベル調整済混合用信号を、前記目的エリア音抽出手段で抽出された目的エリア音と混合し、混合した後の混合後信号を、前記目的エリアのエリア収音結果として出力し、
前記雑音レベル算出手段は、前記目的エリア音判定手段の判定結果と前記入力信号に基づいて第1のSN比を算出し、
前記混合レベル調整手段は、前記第1のSN比も考慮して前記レベル調整係数を決定し、
前記混合レベル調整手段は、前記第1のSN比が閾値よりも小さく、且つ、目的エリア音含有判定状態の場合に、前記レベル調整係数を加算する調整を行い、
前記背景雑音抑圧手段は、それぞれの前記入力信号に対して背景雑音を抑圧する背景雑音抑圧処理を行って背景雑音抑圧済入力信号を生成し、
前記指向性形成手段は、前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号のそれぞれに対し、ビームフォーマによって前記目的エリアが存在する前記目的エリア方向へ指向性を形成して、前記マイクアレイごとに前記目的エリア方向からの前記目的方向信号を取得し、
前記混合用信号は前記背景雑音抑圧手段が生成した前記背景雑音抑圧済入力信号である
ことを特徴とする収音方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019053617A JP6822505B2 (ja) | 2019-03-20 | 2019-03-20 | 収音装置、収音プログラム及び収音方法 |
US16/689,504 US11095979B2 (en) | 2019-03-20 | 2019-11-20 | Sound pick-up apparatus, recording medium, and sound pick-up method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019053617A JP6822505B2 (ja) | 2019-03-20 | 2019-03-20 | 収音装置、収音プログラム及び収音方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020155972A JP2020155972A (ja) | 2020-09-24 |
JP6822505B2 true JP6822505B2 (ja) | 2021-01-27 |
Family
ID=72514093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019053617A Active JP6822505B2 (ja) | 2019-03-20 | 2019-03-20 | 収音装置、収音プログラム及び収音方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11095979B2 (ja) |
JP (1) | JP6822505B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10645520B1 (en) * | 2019-06-24 | 2020-05-05 | Facebook Technologies, Llc | Audio system for artificial reality environment |
JP7529064B1 (ja) | 2023-01-19 | 2024-08-06 | 沖電気工業株式会社 | 収音装置、収音プログラム、収音方法、判定装置、判定プログラム及び判定方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050147258A1 (en) * | 2003-12-24 | 2005-07-07 | Ville Myllyla | Method for adjusting adaptation control of adaptive interference canceller |
JP4697465B2 (ja) * | 2004-11-08 | 2011-06-08 | 日本電気株式会社 | 信号処理の方法、信号処理の装置および信号処理用プログラム |
US7925504B2 (en) * | 2005-01-20 | 2011-04-12 | Nec Corporation | System, method, device, and program for removing one or more signals incoming from one or more directions |
JP4225430B2 (ja) * | 2005-08-11 | 2009-02-18 | 旭化成株式会社 | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
JP5482854B2 (ja) | 2012-09-28 | 2014-05-07 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP6206003B2 (ja) * | 2013-08-30 | 2017-10-04 | 沖電気工業株式会社 | 音源分離装置、音源分離プログラム、収音装置及び収音プログラム |
JP6065028B2 (ja) | 2015-01-05 | 2017-01-25 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
US9781508B2 (en) * | 2015-01-05 | 2017-10-03 | Oki Electric Industry Co., Ltd. | Sound pickup device, program recorded medium, and method |
JP6187626B1 (ja) * | 2016-03-29 | 2017-08-30 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP6241520B1 (ja) * | 2016-08-31 | 2017-12-06 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
JP6436180B2 (ja) * | 2017-03-24 | 2018-12-12 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
-
2019
- 2019-03-20 JP JP2019053617A patent/JP6822505B2/ja active Active
- 2019-11-20 US US16/689,504 patent/US11095979B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11095979B2 (en) | 2021-08-17 |
JP2020155972A (ja) | 2020-09-24 |
US20200304907A1 (en) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6187626B1 (ja) | 収音装置及びプログラム | |
JP6065028B2 (ja) | 収音装置、プログラム及び方法 | |
JP6065030B2 (ja) | 収音装置、プログラム及び方法 | |
JP6540730B2 (ja) | 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法 | |
JP6822505B2 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP7158976B2 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP6943120B2 (ja) | 収音装置、プログラム及び方法 | |
JP6260666B1 (ja) | 収音装置、プログラム及び方法 | |
JP7404657B2 (ja) | 音声認識装置、音声認識プログラム、及び音声認識方法 | |
JP6725014B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6863004B2 (ja) | 収音装置、プログラム及び方法 | |
JP6879340B2 (ja) | 収音装置、収音プログラム、及び収音方法 | |
JP6241520B1 (ja) | 収音装置、プログラム及び方法 | |
JP6624256B1 (ja) | 収音装置、プログラム及び方法 | |
JP2016163135A (ja) | 収音装置、プログラム及び方法 | |
JP6729744B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6923025B1 (ja) | 収音装置、プログラム及び方法 | |
JP6885483B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
JP6624255B1 (ja) | 収音装置、プログラム及び方法 | |
JP2024027617A (ja) | 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法 | |
JP6669219B2 (ja) | 収音装置、プログラム及び方法 | |
JP2016127458A (ja) | 収音装置、プログラム及び方法 | |
JP7529065B1 (ja) | 収音装置、収音プログラム及び収音方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200908 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6822505 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |