[go: up one dir, main page]

JP4854533B2 - 音響判定方法、音響判定装置及びコンピュータプログラム - Google Patents

音響判定方法、音響判定装置及びコンピュータプログラム Download PDF

Info

Publication number
JP4854533B2
JP4854533B2 JP2007019917A JP2007019917A JP4854533B2 JP 4854533 B2 JP4854533 B2 JP 4854533B2 JP 2007019917 A JP2007019917 A JP 2007019917A JP 2007019917 A JP2007019917 A JP 2007019917A JP 4854533 B2 JP4854533 B2 JP 4854533B2
Authority
JP
Japan
Prior art keywords
sound
acoustic
frequency
signal
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007019917A
Other languages
English (en)
Other versions
JP2008185834A (ja
Inventor
昭二 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007019917A priority Critical patent/JP4854533B2/ja
Priority to US11/987,061 priority patent/US9082415B2/en
Priority to KR1020070122628A priority patent/KR100952894B1/ko
Priority to EP07121944.8A priority patent/EP1953734B1/en
Priority to CN2007101960431A priority patent/CN101236250B/zh
Publication of JP2008185834A publication Critical patent/JP2008185834A/ja
Application granted granted Critical
Publication of JP4854533B2 publication Critical patent/JP4854533B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、複数の音響受付手段にて受け付けた複数の音源からの音響信号に基づいて、特定の音響信号の有無を判定する音響判定方法、該音響判定方法を適用した音響判定装置、及び該音響判定装置を実現するためのコンピュータプログラムに関し、特に音響受付手段から最近傍の音源からの音響信号を特定するための音響判定方法、音響判定装置及びコンピュータプログラムに関する。
昨今のコンピュータ技術の進展により、大量の演算処理を必要とする音響信号処理であっても実用的な処理速度で実行できるようになってきた。このような事情から、複数のマイクロホンを用いたマルチチャンネルの音響処理機能の実用化が期待されている。その一例として、雑音抑制技術がある。雑音抑制技術では、目的とする音源、例えば近傍音源からの音を特定し、入射角又は入射角から決定される夫々のマイクロホンへの音の到達時間差を変数とした同期加算、同期減算等の演算により、特定の音源からの音を強調し、また特定の音源以外からの音を抑圧することにより目的とする音を強調し、他の音を抑制する。そして目的とする近傍音源が移動している場合、同期加算による入射角を変数としたパワー分布を求め、その分布の中でパワーの強い角度に音源があると推定し、その角度からの音を強調し、またその角度以外の音を抑圧するのが一般的である。
また目的の近傍音源からの音が連続して発せられていない場合、予め決定した背景雑音のパワーと現在のパワーとの比又は差を用いて、目的とする近傍音源からの音が発せられている時間区間を検出するのが一般的である。
さらに特許文献1では、同期加算により求まる入射角を変数とするパワー分布のピーク値と、それ以外の角度の値との比率で、入射した音が目的とする近傍音原からの音か遠方音源からの音かを判定する方法が開示されている。
米国特許第6,243,322号明細書
しかしながら同期加算による入射角を変数としたパワー分布は、背景雑音、非定常雑音等の雑音が発生している環境において、複数のピークが出現したり、ピークがブロード化したりするため、目的とする近傍音源を特定することが難しいという問題がある。
また目的とする近傍音原からの音が連続的に一定の強さで発せられていない場合、背景雑音によりピークが鈍ったパワー分布となるため、目的の音源からの音が発せられている時間区間の検出が更に難しくなるという問題がある。
さらに特許文献1に開示された方法では、S/N比の悪い帯域を含む全帯域を使用するため、雑音環境下において、近傍音源からの音が到来する角度におけるピークが鈍り正確に近傍音源から到来する音を判定することが難しいという問題がある。
本発明は斯かる事情に鑑みてなされたものであり、複数のマイクロホンが受け付けた夫々の音響信号の位相差を算出し、算出した位相差が所定の閾値以下である場合に、特定対象となる最近傍の音響信号を含むと判定することにより、雑音環境下でも目的とする音源からの音の発生区間を容易に特定することが可能な音響判定方法、該音響判定方法を適用した音響判定装置、及び該音響判定装置を実現するためのコンピュータプログラムの提供を主たる目的とする。
さらに本発明では、S/N比が所定の閾値以下である場合、目的とする音源からの音響信号を含まないと判断することにより、目的とする音源からの音の発生区間を特定する精度を向上させる音響判定装置等の提供を他の目的とする。
また本発明では、S/N比、背景雑音、フィルタ特性、音声特性等の要因に応じて判定に用いる周波数を取捨選択することにより、目的とする音源からの音の発生区間を特定する精度を向上させる音響判定装置等の提供を更に他の目的とする。
本願は、複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定する音響判定装置を用いた音響判定方法において、前記音響判定装置は、各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換し、デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成し、生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換し、周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出し、算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに音響受付手段から最近傍の音源からの音響信号を含むと判定し、判定した結果に基づく出力を行うことを特徴とする音響判定方法を開示する。
本願は、複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、前記音響受付手段から最近傍の音源からの音響信号の有無を判定する音響判定装置において、各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換する手段と、デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成する手段と、生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換する手段と、周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出する手段と、算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに最近傍の音源からの音響信号を含むと判定する判定手段とを備えることを特徴とする音響判定装置を開示する。
本願は、周波数軸上の信号に変換した音響信号の振幅成分に基づいて信号対雑音比を算出する手段を更に備え、前記判定手段は、算出した信号対雑音比が所定の閾値以下である場合、位相差に関わらず、特定対象となる音響信号を含まないと判定する様に構成してあることを特徴とする音響判定装置を開示する。
本願は、前記複数の音響受付手段は、夫々の相対位置を変更可能に構成してあり、前記複数の音響受付手段間の距離に基づいて、前記判定手段の判定に用いる閾値を算出する手段を更に備えることを特徴とする音響判定装置を開示する。
本願は、周波数軸上の信号に変換した音響信号の振幅成分に基づく周波数毎の信号対雑音比に基づいて、前記判定手段の判定に用いる周波数を選択する選択手段を更に備えることを特徴とする音響判定装置を開示する。
本願は、折り返し誤差を防止すべくデジタル信号に変換する前の音響信号を濾波するアンチエイリアジングフィルタを更に備え、前記判定手段は、前記アンチエイリアジングフィルタの特性に基づく所定の周波数より高い周波数を判定に用いる周波数から除外する様に構成してあることを特徴とする音響判定装置を開示する。
本願は、音声である音響信号を特定する場合に、周波数軸上の信号に変換した音響信号の振幅成分が極小値をとる周波数、又は振幅成分に基づく信号対雑音比が極小値をとる周波数を検出する手段を更に備え、前記判定手段は、検出した周波数を判定に用いる周波数から除外する様に構成してあることを特徴とする音響判定装置を開示する。
本願は、音声である音響信号を特定する場合に、前記判定手段は、音声に係る基本周波数が存在しない周波数を判定に用いる周波数から除外する様に構成してあることを特徴とする音響判定装置を開示する。
本願は、コンピュータに、複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定させるコンピュータプログラムにおいて、コンピュータに、各音響受付手段が受け付け、デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成させる手順と、コンピュータに、生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換させる手順と、コンピュータに、周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出させる手順と、コンピュータに、算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに音響受付手段から最近傍の音源からの音響信号を含むと判定させる手順とを実行させることを特徴とするコンピュータプログラムを開示する。
本願に記載の音響判定方法、音響判定装置及びコンピュータプログラムでは、目的とする最近傍の音源からの音響信号は、反射波及び回折波として混入し難く位相差が小さくなることから、位相差が所定の閾値以下である場合に、目的とする音源からの音響信号を含むと判断することが可能である。しかも背景雑音等の遠方からの雑音は位相差が大きいため、雑音環境下でも目的とする音源からの音響信号が発生している区間を容易に特定することが可能である。
本願に記載の音響判定装置等では、信号対雑音比(S/N比)が所定の閾値以下である場合、目的とする音源からの音響信号を含まないと判断することにより、例えば背景雑音の位相差が偶然揃った場合での誤判定を回避することができるので、特定精度を向上させることが可能である。
本願に記載の音響判定装置等では、音響受付手段の相対位置が変更可能な構成であっても、閾値を動的に変更することにより、最適な閾値を設定し、目的とする音源からの音響信号の特定精度を向上させることが可能である。
本願に記載の音響判定装置等では、信号対雑音比が低い周波数帯を除外することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である。
本願に記載の音響判定装置等では、アンチエイリアジングフィルタの影響が位相差の乱れとして発現する例えば標本化周波数8000Hzでサンプリングした場合の3300Hz以上の周波数帯を除外することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である。
本願に記載の音響判定装置等では、振幅成分が極小値をとる周波数での位相差が乱れ易いという音声の特性を考慮し、当該周波数を判定から除外することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である。
本願に記載の音響判定装置等では、音声の周波数特性に応じて、音声スペクトルが存在しない周波数以下を位相差の判定から除外することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である。
本願に記載の音響判定方法、音響判定装置及びコンピュータプログラムは、マイクロホン等の複数の音響受付手段が受け付けた夫々の音響信号を周波数軸上の信号に変換し、夫々の音響信号の位相差を算出し、算出した位相差が所定の閾値以下である場合に、特定対象となる最近傍の音源からの音響信号を含むと判定する。
複数の音源からの音響信号を受け付ける場合、一般的に、音源と音響受付手段との距離が長い程、音源から音響受付手段まで直接到達する直接波に、壁等の物体に反射して音響受付手段に到達する反射波及び回折して受付手段に到達する回折波が混入し易くなる。直接波と比べて反射波及び回折波は到達までの経路長が長いため、反射波及び回折波が混入した音響信号を周波数軸上に変換した場合、経路に応じて様々な入射角で到来するため位相差スペクトルの値が安定せず、ばらつきが大きくなる。また目的とする音源が最近傍の音源である場合、最近傍の音源からの音響信号は反射波及び回折波が混入し難く位相差スペクトルが直線上に並ぶ様になり、ばらつきが小さくなる。従って本発明では上述した構成により、位相差が所定の閾値以下である場合に、目的とする音源からの音響信号を含むと判断することが可能であり、しかも背景雑音等の遠方からの雑音は位相差が大きいため、雑音環境下でも目的とする音源からの音響信号を容易に特定し、雑音を抑圧することが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、信号対雑音比が所定の閾値以下である場合、位相差に関わらず、特定対象となる音響信号を含まないと判定することにより、例えば背景雑音の位相差が偶然揃った状況での誤判定を回避することができるので、特定精度を向上させることが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、音響受付手段の相対位置が変更可能な場合に、音響受付手段間の距離に基づいて、閾値を算出し、算出した閾値に設定を動的に変更することにより、閾値を常に最適化し、目的とする音源からの音響信号の特定精度を向上させることが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、信号対雑音比が低い周波数帯を除外して判定を行うことにより、目的とする音源からの音響信号の特定精度を向上させることが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、デジタル信号に変換した音響信号の折り返し(エイリアジング)誤差を除去するアンチエイリアジングフィルタ等のフィルタの特性に基づき、フィルタの影響が顕著になる例えば標本化周波数8000Hzでサンプリングした場合、3300Hz以上の周波数帯を除外して判定を行うことにより、目的とする音源からの音響信号の特定精度を向上させることが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、音声である音響信号を特定する場合に、振幅成分が極小値をとる周波数での位相差が乱れ易いという音声の特性を考慮し、当該周波数を除外して判定することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である等、優れた効果を奏する。
本願に記載の音響判定装置等は、音声である音響信号を特定する場合に、音声の周波数特性に応じて、音声スペクトルが存在しない基本周波数以下の周波数帯を除外して位相差を判定することにより、目的とする音源からの音響信号の特定精度を向上させることが可能である等、優れた効果を奏する。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。なお本実施の形態では、処理対象の音響信号が主として人間が発する音声である場合について説明する。
実施の形態1.
図1は、本発明の実施の形態1に係る音響判定方法の概要の一例を示す説明図である。図1中1は、携帯電話に適用した本発明の音響判定装置であり、音響判定装置1は、使用者により所持され、使用者から発せられる音声を音響信号として受け付ける。さらに音響判定装置1は、使用者が発する音声以外にも他の人物が発する音声、機械音、音楽等の様々な背景雑音を受け付ける。そこで本発明の音響判定装置1は、複数の音源から受け付ける様々な音響信号の中から特定対象となる音響信号を特定し、特定した音響信号を強調し、またそれ以外の音響信号を抑圧することにより雑音の抑圧等の処理を行う。なお本発明の音響判定装置1が目的とする音響信号とは、音響判定装置1の最近傍の音源からの音響信号、即ち使用者から発せられる音声である。
図2は、本発明の実施の形態1に係る音響判定装置1のハードウェアの構成例を示すブロック図である。音響判定装置1は、装置全体を制御するCPU等の制御部10と、本発明のコンピュータプログラム100等のプログラム及び各種設定値等のデータを記録するROM、RAM等の記録部11と、通信インタフェースとなるアンテナ及びその付属機器等の通信部12とを備えている。また音響判定装置1は、音響信号を受け付けるマイクロホン等の複数の音響受付部13,13,…と、スピーカ等の音響出力部14と、音響受付部13,13,…及び音響出力部14に係る音響信号の変換処理を行う音響変換部15とを備えている。音響変換部15による変換処理とは、音響出力部14から出力すべくデジタル信号をアナログ信号に変換する処理及び音響受付部13,13,…から受け付けたアナログ信号である音響信号をデジタル信号に変換する処理である。さらに音響判定装置1は、英数字及び各種命令等のキー入力による操作を受け付ける操作部16と、各種情報を表示する液晶ディスプレイ等の表示部17とを備えている。そして携帯電話は、本発明のコンピュータプログラム100に含まれる各種手順を制御部10により実行することで、本発明の音響判定装置1として動作する。
図3は、本発明の実施の形態1に係る音響判定装置1の機能の一例を示す機能ブロック図である。本発明の音響判定装置1は、複数の音響受付部13,13と、アナログ信号である音響信号をデジタル信号に変換した際の折り返し誤差(エイリアジング)を防止すべくLPF(Low Pass Filter )として機能するアンチエイリアジングフィルタ150と、アナログ信号である音響信号をデジタル信号にA/D変換するA/D変換手段151とを備えている。アンチエイリアジングフィルタ150及びA/D変換手段151は、音響変換部15にて実現される機能である。なおアンチエイリアジングフィルタ150及びA/D変換手段151は、音響変換部15として音響判定装置1に内蔵するのではなく、外部の音響取り込みデバイスに実装することも可能である。
さらに本発明の音響判定装置1は、音響信号から処理の単位となる所定時間長のフレームを生成するフレーム生成手段110と、音響信号をFFT(高速フーリエ変換:Fast Fourier Transformation)処理にて周波数軸上の信号に変換するFFT変換手段111と、複数の音響受付部13,13が夫々受け付けた音響信号間の位相差を算出する位相差算出手段112と、音響信号のS/N比を算出するS/N比算出手段113と、処理の対象とする周波数を選択する選択手段114と、位相差が大きい周波数を計数する計数手段115と、目的とする最近傍の音源からの音響信号を特定する音響判定手段116と、特定した音響信号に基づき雑音抑圧等の処理を行う音響処理手段117とを備えている。フレーム生成手段110、FFT変換手段111、位相差算出手段112、選択手段114、計数手段115、音響判定手段116及び音響処理手段117は、記録部11内の各種コンピュータプログラムを実行することにより実現されるソフトウェアとしての機能を示しているが、各種処理チップ等の専用ハードウェアを用いて実現する様にしても良い。
次に本発明の実施の形態1に係る音響判定装置1の処理について説明する。なお以降の説明において、音響判定装置1は、二つの音響受付部13,13を備えるものとして説明する。但し、音響受付部13は二つに限定されるものではなく、三つ以上の音響受付部13,13,…として実装することも可能である。図4は、本発明の実施の形態1に係る音響判定装置1の音響判定処理の一例を示すフローチャートである。音響判定装置1は、コンピュータプログラム100を実行する制御部10の制御により、複数の音響受付部13,13にて、夫々音響信号を受け付け(S101)、LPFであるアンチエイリアジングフィルタ150にて濾波し、A/D変換手段151にて、アナログ信号として受け付けた音響信号を8000Hz等の周期で標本化してデジタル信号に変換する(S102)。
そして音響判定装置1は、制御部10の制御に基づくフレーム生成手段110の処理により、デジタル信号に変換した音響信号から所定時間長のフレームを生成する(S103)。ステップS103では、音響信号を、例えば20ms〜40ms程度の所定時間長の単位でフレーム化する。なお各フレームは、10ms〜20ms程度ずつオーバーラップしている。そして各フレームに対しては、ハミング窓、ハニング窓等の窓関数、高域強調フィルタによるフィルタリング等の音声認識の分野で一般的なフレーム処理が施される。この様にして生成された各フレームに対し、以降の処理が行われる。
音響判定装置1は、制御部10の制御に基づいて、FFT変換手段111の処理により、フレーム単位の音響信号をFFT処理して周波数軸上の信号である位相スペクトル及び振幅スペクトルに変換し(S104)、周波数軸上の信号に変換したフレーム単位の音響信号の振幅成分に基づいてS/N比(信号対雑音比)を算出するS/N比算出処理を開始し(S105)、位相差算出手段112の処理により、各音響信号間の周波数毎の位相スペクトルの差を位相差として算出する(S106)。ステップS104では、例えば256点の音響信号サンプルに対してFFTを行い、128点の周波数の夫々について位相スペクトルの値の差を位相差として算出する。ステップS105にて開始されるS/N比算出処理は、ステップS106以降の処理と並行して実行される。なおS/N比算出処理の詳細は後述する。
そして音響判定装置1は、制御部10の制御に基づく選択手段114の処理により、各周波数の中から処理の対象とする周波数を選択する(S107)。ステップS107では、目的とする最近傍の音源からの音響信号が検出し易く、背景雑音等の外乱の影響を受け難い周波数が選択される。具体的にはアンチエイリアジングフィルタ150の影響により、位相差が乱れやすい周波数帯を除外する。除外すべき周波数帯は、A/D変換手段151の特性によって異なるが、一般的に3300〜3500kHz以上の高域で位相差が乱れ易くなるため例えば3300Hz以上の周波数を処理の対象から除外する。またS/N比算出処理により算出された周波数毎のS/N比を取得し、取得したS/N比が低い順に所定個数の周波数又は予め設定されている閾値以下の周波数を、処理の対象とする周波数から除外する。なおフレーム毎に算出したS/N比を取得して、除外する周波数を決定するのではなく、予めS/N比が低くなり易い周波数を除外する周波数として設定しておく様にしても良い。ステップS107の処理により、処理の対象となる周波数が例えば100点に絞り込まれる。
音響判定装置1は、制御部10の制御に基づく音響判定手段116の処理により、S/N比算出処理により算出されたS/N比を取得し(S108)、取得したS/N比が予め設定されている第0閾値以上であるか否かを判定する(S109)。第0閾値としては、例えば5dB等の値が用いられる。ステップS109にてS/N比が第0閾値以上である場合、目的とする最近傍の音源からの音響信号が含まれている可能性があると判定し、第0閾値未満である場合、目的とする音響信号が含まれていないと判定する。
ステップS109において、S/N比が第0閾値以上であると判定した場合(S109:YES)、音響判定装置1は、制御部10の制御に基づく音響判定手段116の処理により、ステップS107にて選択した周波数の位相差の絶対値が、予め設定されている第1閾値以上である周波数を計数し(S110)、計数結果に基づいて、選択した周波数に対する第1閾値以上となる周波数の割合を算出し(S111)、算出した割合が予め設定されている第2閾値以下であるか否かを判定する(S112)。第1閾値としては、例えばπ/2radian等の値が用いられる。第2閾値としては、例えば3%等の値が用いられる。例えば選択された周波数が100点である場合、位相差がπ/2radian以上の周波数が3点以下であるか否かを判定する。
ステップS112において、算出した割合が予め設定されている第2閾値以下である場合(S112:YES)、音響判定装置1は、制御部10の制御に基づく音響判定手段116の処理により、当該フレームに位相差が小さい直接音による最近傍の音源からの音響信号を含むと判定する(S113)。そして音響処理手段117では、ステップS113の判定結果に基づいて各種音響処理及び音響出力処理を実行する。
ステップS109において、S/N比が第0閾値未満であると判定した場合(S109:NO)、又はステップS112において、算出した割合が予め設定されている第2閾値より大きいと判定した場合(S112:NO)、音響判定装置1は、制御部10の制御に基づく音響判定手段116の処理により、当該フレームに最近傍の音源からの音響信号は含まないと判定する(S114)。そして音響処理手段117では、ステップS113の判定結果に基づいて各種音響処理及び音響出力処理を実行する。音響判定装置1は、上述した一連の処理を、音響受付部13,13による音響信号の受け付けが終了するまで繰り返し実行する。
上述した音響判定処理の例では、音響判定装置1は、ステップS111において、計数結果に基づいて、選択した周波数に対する第1閾値以上となる周波数の割合を算出し、ステップS112において、算出した割合を予め設定されている割合を示す第2閾値と比較する形態を示したが、ステップS110において算出した第1閾値以上となる周波数の個数を、ステップS112において、第2閾値である個数と比較する様にしても良い。周波数の個数を第2閾値とする場合、第2閾値は、固定された定数ではなく、ステップS107にて選択された周波数に基づいて変化する変数となる。
例えば基準値として、ステップS107にて選択される周波数が128点の場合、第2閾値は5個になるように設定されているものとする。この様な条件下において、ステップS107にて128点中28点が除外され、100点の周波数に絞り込まれたとすると、第2閾値は、下記の式1に示す様に4個となる。
5×100/128=3.906≒4 …式1
また同様の条件下において、ステップS107にて128点中56点が除外され、72点の周波数に絞り込まれたとすると、第2閾値は、下記の式2に示す様に3個となる。
5×72/128=2.813≒3 …式2
この様に第2閾値として個数を用いる場合、ステップS107において、周波数を選択した後、選択された周波数の数に基づいて第2閾値を算出する処理が行われる。
図5は、本発明の実施の形態1に係る音響判定装置1のS/N比算出処理の一例を示すフローチャートである。S/N比算出処理は、図4を用いて説明した音響判定処理のステップS105にて開始される処理である。音響判定装置1は、制御部10の制御に基づくS/N比算出手段113の処理により、S/N比算出の対象となるフレームのサンプルの振幅値の二乗和をフレームパワーとして算出し(S201)、予め設定されている背景雑音レベルを読み取り(S202)、算出したフレームパワー及び読み取った背景雑音レベルの比である当該フレームのS/N比(信号対雑音比)を算出する(S203)。なお選択手段114の処理により、周波数毎のS/N比に基づいて除去すべき周波数を決定する必要がある場合、フレーム全体としてのS/N比だけでなく周波数毎のS/N比も算出する。周波数毎のS/N比は、背景雑音の周波数毎のレベルを表す背景雑音スペクトルを用いて、当該フレームの振幅スペクトルと、背景雑音スペクトルとの比として算出する。
そして音響判定装置1は、制御部10の制御に基づくS/N比算出手段113の処理により、フレームパワーと背景雑音レベルとを比較して、フレームパワー及び背景雑音レベルの差が所定の第3閾値以下であるか否かを判定し(S204)、第3閾値以下であると判定した場合(S204:YES)、背景雑音レベルの値を、フレームパワーの値を用いて更新する(S205)。ステップS204では、フレームパワーと背景雑音レベルとの差が所定の第3閾値以下である場合、フレームパワーと背景雑音レベルとの差は、背景雑音レベルが変化したことによるものであると判断し、ステップS205にて背景雑音レベルを最新の値に更新する。ステップS205では、一定の比率で背景雑音レベルとフレームパワーとを組み合わせて算出した値に背景雑音レベルの値を更新する。例えば元の背景雑音レベルを0.9倍した値と、今回のフレームパワーを0.1倍した値との和を更新後の値とする。
ステップS204において、フレームパワー及び背景雑音レベルの差が第3閾値より大きいと判定した場合(S204:NO)、ステップS205の更新処理は行わない。即ちフレームパワーと背景雑音レベルとの差が所定の第3閾値より大きい場合、フレームパワーと背景雑音レベルとの差は、背景雑音とは異なる音響信号を受け付けたことによるものであると判断する。なお背景雑音レベルについては、音声認識、VAD(Voice Activity Detection)、マイクアレイ処理等の分野で用いられている様々な方法を適用して推定することも可能である。音響判定装置1は、上述した一連の処理を、音響受付部13,13による音響信号の受け付けが終了するまで繰り返し実行する。
図6は、本発明の実施の形態1に係る音響判定装置1の音響判定処理に係る周波数と位相差との関係の一例を示すグラフである。図6は音響判定処理にて算出した周波数毎の位相差を、横軸に周波数をとり、縦軸に位相差をとってその関係を示したグラフである。なおグラフに示した周波数の範囲は0〜4000Hzであり、位相差の範囲は−π〜+πradianである。また図6中、+θth及び−θthとして示した値は、音響判定処理にて説明した第1閾値を示している。なお音響判定処理の説明に際しては、位相差の絶対値を第1閾値以上であるか否かを判定するとして説明したが、位相差は負の値をとる場合もあるので、第1閾値も正負の二値が設定される。音響受付部13,13が近傍の音源から受け付ける音響信号は、殆ど直接音であるので位相差は小さく不連続となる位相乱れが少ないのに対し、非定常雑音を含む背景雑音は、遠方の多様な音源から反射波及び回折波を含む様々な経路で音響受付部13,13に到達するため、位相差が大きくまた不連続点となる位相乱れが多くなる。また図6の高周波数側に位相差が大きく、不連続となっている周波数帯が観測されるが、これはアンチエイリアジングフィルタ150の影響によるものである。図6に示す例では、音響判定処理において、3300Hz以上の周波数帯を選択手段114の処理により除外した場合、位相差の絶対値が、第1閾値以上である周波数は1個だけなので、直接音による最近傍の音源からの音響信号を含むと判定される。
図7は、本発明の実施の形態1に係る音響判定装置1の音響判定処理に係る周波数とS/N比との関係の一例を示すグラフである。図7は、S/N比算出処理にて算出した周波数毎のS/N比を、横軸に周波数をとり、縦軸にS/N比をとってその関係を示したグラフである。なおグラフに示した周波数の範囲は、0〜4000Hzであり、S/N比の範囲は0〜100dBである。音響判定処理においては図7中、丸印で示したS/N比が低い周波数帯を選択手段114の処理により除外して音響信号の判定を行う。
図8は、本発明の実施の形態1に係る音響判定装置1の音響判定処理に係る周波数と位相差との関係の一例を示すグラフである。なお図8のグラフの表記方法は図6と同様である。図8では、音響判定処理において、選択された周波数の中で位相差の絶対値が第1閾値θth以上となる周波数を丸印にて示しており、丸印にて示した周波数の割合又は数が第2閾値以下であるか否かを判定する。例えば第2閾値として3点が設定されていた場合、図8に示す例では、最近傍の音源からの音響信号を含まないと判定される。
前記実施の形態1では、音響判定装置が携帯電話である形態を示したが、本発明はこれに限らず、音響受付部を備えた汎用コンピュータであっても良く、また音響受付部は、必ずしも音響判定装置内に固定して配設されている必要はなく、外部のマイクロホンを有線又は無線にて接続しても良い等、様々な形態に展開することが可能である。
また前記実施の形態1では、S/N比が小さい場合、以降の判定を行わない形態を示したが、本発明はこれに限らず、S/N比に限らず、全てのフレームに対して、位相差に基づき最近傍の音源からの音響信号を含むか否かを判定する様にする等、様々な形態に展開することが可能である。
実施の形態2.
実施の形態2は、実施の形態1において、目的とする音源からの音響信号を人物の音声に限定する形態である。なお実施の形態2に係る音響判定方法の概要、音響判定装置の構成及び音響判定装置の機能については、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
実施の形態2では、実施の形態1の音響判定処理において、選択手段114による選択を音声の特性に応じた更なる選択条件が追加される。図9は、本発明の実施の形態2に係る音響判定方法の音声の特性の一例を示すグラフである。図9は、女性が発する音声の特性を示しており、図9(a)が周波数と振幅スペクトルとの関係を示しており、図9(b)が周波数と位相差との関係を示している。図9(a)は、周波数変換処理に基づく周波数毎の振幅スペクトルの値を、横軸に周波数をとり、縦軸に振幅スペクトルをとってその関係を示したグラフである。なおグラフに示した周波数の範囲は、0〜4000Hzである。図9(b)は音響判定処理にて算出した周波数毎の位相差を、横軸に周波数をとり、縦軸に位相差をとってその関係を示したグラフである。なおグラフに示した周波数の範囲は0〜4000Hzであり、位相差の範囲は−π〜+πradianである。図9(a)及び図9(b)を比較すると明らかな様に、振幅スペクトルが極小値をとる周波数では、位相差が大きくなっている。なお振幅スペクトルに代替してS/N比の値を用いても同様の結果となる。そこで音響判定装置1は、選択手段114による周波数の選択を行う場合、S/N比又は振幅スペクトルが極小値をとる周波数を除外することにより、判定精度を向上させることが可能となる。
図10は、本発明の実施の形態2に係る音響判定装置1の極小値検出処理の一例を示すフローチャートである。図9を用いて説明した極小値を検出する処理として、音響判定装置1は、コンピュータプログラム100を実行する制御部10の制御により、周波数軸上の信号に変換した音響信号のS/N比又は振幅スペクトルが極小値をとる周波数を検出し(S301)、検出した極小値に係る周波数及び該周波数の近傍の周波数帯を、除外すべき周波数として記録する(S302)。なお音響信号のS/N比及び振幅スペクトルの値は、S/N比算出処理により算出した値を用いることが可能である。ステップS301による検出は、判断の対象となる周波数に係るS/N比を、前後の周波数に係るS/N比と比較し、前後の周波数に係るS/N比より小さい場合に、対象とした周波数を極小値である周波数として検出する。なお周波数に係るS/N比としては、対象となる周波数を含む近傍数点の周波数の平均値を対象となる周波数に係るS/N比として扱うことにより、微小変化を除去して精度良く極小値を検出することができる。また前後のS/N比からの変化に基づいて極小値を検出する様にしても良い。
図11は、本発明の実施の形態2に係る音響判定方法に係る音声の基本周波数の特性を示すグラフである。図11は、女性及び男性が発する音声の基本周波数の分布を示したグラフであり(例えば古井貞煕著、「ディジタル音声処理」、東海大学出版会、1985年9月、p.18)、横軸が周波数を示し、縦軸が頻度を示している。基本周波数は音声スペクトルの下限を表すので、この周波数よりも低い周波数には音声スペクトルの成分は存在しないことになる。図11に示した音声の周波数分布から明らかな様に、80Hz以上の周波数帯に音声の殆どが含まれる。そこで音響判定装置1は、選択手段114による周波数の選択を行う場合、例えば80Hz以下の周波数を除外することにより、判定精度を向上させることが可能となる。
図9〜図11を用いて説明した様に、目的とする音源からの音響信号を人物の音声に限定する場合、音響判定処理において、音響判定装置1は、選択手段114の処理により、各周波数の中から処理の対象とする周波数の選択として、極小値検出処理により検出して記録した除外すべき周波数及び基本周波数が存在しない低周波数帯の周波数を除外する。これにより判定精度を向上させることが可能となる。
実施の形態3.
実施の形態3は、実施の形態1において、各音響受付部の相対位置が変更可能な形態に適用する場合の形態である。なお実施の形態3に係る音響判定方法の概要、音響判定装置の構成、音響判定装置の機能及び処理については、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。但し、各音響受付部は、例えば音響判定装置に有線により接続された外部マイクロホンの様に相対位置が変更可能に構成される。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
音速V(m/s)、音響受付部13,13間の幅(距離)W(m)、及び標本化周波数F(Hz)の場合において、第1閾値θth(radian)と音響受付部13,13への入射角度φ(radian)との関係は、ナイキスト周波数において下記の式3となることが好ましい。
θth=W・sinφ・F・2π/2V …式3
例えばV=340m、W=0.025m、F=8000Hz、θth=1/2πradianである状態から、W=0.030mに変更した場合、下記の式4に示す様にして算出した値に第1閾値θthも変更することで第1閾値を最適化することが可能となる。
θth=(0.03×0.85×8000×2π)/(340×2)=3/5π …式4
なお標本化周波数が8000Hzであり、音速が340m/sである場合、音響受付部13,13間の幅の上限値は、340/8000=0.0425m=4.25cmとすることが望ましく、これ以上の幅となった場合、サイドローブによる悪影響がでる。また下限値は、経験上1.6cmとすることが望ましく、これ以下の幅となった場合、位相差を検出し難くなるので、誤差の影響が大きくなる。
図12は、本発明の実施の形態3に係る音響判定装置1の第1閾値算出処理の一例を示すフローチャートである。音響判定装置1は、コンピュータプログラム100を実行する制御部10の制御により、音響受付部13,13間の幅(距離)の値を受け付け(S401)、受け付けた幅に基づいて第1閾値を算出し(S402)、算出した第1閾値を設定値として記録する(S403)。ステップS401の受け付けは、人が入力しても良く、また自動的に検出する様にしても良い。この様にして設定された第1閾値に基づいて音響判定処理等の様々な処理が実行される。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定する音響判定装置を用いた音響判定方法において、
前記音響判定装置は、
各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換し、
デジタル信号に変換した夫々の音響信号を周波数軸上の信号に変換し、
周波数軸上の信号に変換した各音響信号間の周波数毎の位相差を算出し、
算出した位相差が所定の閾値以下である場合に、音響受付手段から最近傍の音源からの音響信号を含むと判定し、
判定した結果に基づく出力を行う
ことを特徴とする音響判定方法。
(付記2)
複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定する音響判定装置において、
各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換する手段と、
デジタル信号に変換した夫々の音響信号を周波数軸上の信号に変換する手段と、
周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出する手段と、
算出した位相差が所定の閾値以下である場合に、特定対象となる音響信号を含むと判定する判定手段と、
判定した結果に基づく出力を行う手段と
を備えることを特徴とする音響判定装置。
(付記3)
複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、前記音響受付手段から最近傍の音源からの音響信号の有無を判定する音響判定装置において、
各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換する手段と、
デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成する手段と、
生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換する手段と、
周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出する手段と、
算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに最近傍の音源からの音響信号を含むと判定する判定手段と
を備えることを特徴とする音響判定装置。
(付記4)
周波数軸上の信号に変換した音響信号の振幅成分に基づいて信号対雑音比を算出する手段を更に備え、
前記判定手段は、算出した信号対雑音比が所定の閾値以下である場合、位相差に関わらず、特定対象となる音響信号を含まないと判定する様に構成してある
ことを特徴とする付記2又は付記3に記載の音響判定装置。
(付記5)
前記複数の音響受付手段は、夫々の相対位置を変更可能に構成してあり、
前記複数の音響受付手段間の距離に基づいて、前記判定手段の判定に用いる閾値を算出する手段を更に備える
ことを特徴とする付記2乃至付記4のいずれかに記載の音響判定装置。
(付記6)
周波数軸上の信号に変換した音響信号の振幅成分に基づく周波数毎の信号対雑音比に基づいて、前記判定手段の判定に用いる周波数を選択する選択手段を更に備えることを特徴とする付記2乃至付記5のいずれかに記載の音響判定装置。
(付記7)
前記判定手段が、位相差が第1閾値以上となる周波数の数に基づいて判定する様に構成してある場合に、前記選択手段が選択した周波数の数に基づいて第2閾値を算出する手段を更に備えることを特徴とする付記6に記載の音響判定装置。
(付記8)
折り返し誤差を防止すべくデジタル信号に変換する前の音響信号を濾波するアンチエイリアジングフィルタを更に備え、
前記判定手段は、前記アンチエイリアジングフィルタの特性に基づく所定の周波数より高い周波数を判定に用いる周波数から除外する様に構成してある
ことを特徴とする付記2乃至付記7のいずれかに記載の音響判定装置。
(付記9)
音声である音響信号を特定する場合に、
周波数軸上の信号に変換した音響信号の振幅成分が極小値をとる周波数、又は振幅成分に基づく信号対雑音比が極小値をとる周波数を検出する手段を更に備え、
前記判定手段は、検出した周波数を判定に用いる周波数から除外する様に構成してある
ことを特徴とする付記2乃至付記8のいずれかに記載の音響判定装置。
(付記10)
音声である音響信号を特定する場合に、
前記判定手段は、音声に係る基本周波数が存在しない周波数を判定に用いる周波数から除外する様に構成してあることを特徴とする付記2乃至付記9のいずれかに記載の音響判定装置。
(付記11)
コンピュータに、複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定させるコンピュータプログラムにおいて、
コンピュータに、各音響受付手段が受け付け、デジタル信号に変換した夫々の音響信号を周波数軸上の信号に変換させる手順と、
コンピュータに、周波数軸上の信号に変換した各音響信号間の周波数毎の位相差を算出させる手順と、
コンピュータに、算出した位相差が所定の閾値以下である場合に、音響受付手段から最近傍の音源からの音響信号を含むと判定させる手順と
を実行させることを特徴とするコンピュータプログラム。
本発明の実施の形態1に係る音響判定方法の概要の一例を示す説明図である。 本発明の実施の形態1に係る音響判定装置のハードウェアの構成例を示すブロック図である。 本発明の実施の形態1に係る音響判定装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態1に係る音響判定装置の音響判定処理の一例を示すフローチャートである。 本発明の実施の形態1に係る音響判定装置のS/N比算出処理の一例を示すフローチャートである。 本発明の実施の形態1に係る音響判定装置の音響判定処理に係る周波数と位相差との関係の一例を示すグラフである。 本発明の実施の形態1に係る音響判定装置の音響判定処理に係る周波数とS/N比との関係の一例を示すグラフである。 本発明の実施の形態1に係る音響判定装置の音響判定処理に係る周波数と位相差との関係の一例を示すグラフである。 本発明の実施の形態2に係る音響判定方法の音声の特性の一例を示すグラフである。 本発明の実施の形態2に係る音響判定装置の極小値検出処理の一例を示すフローチャートである。 本発明の実施の形態2に係る音響判定方法に係る音声の基本周波数の特性を示すグラフである。 本発明の実施の形態3に係る音響判定装置の第1閾値算出処理の一例を示すフローチャートである。
符号の説明
1 音響判定装置
10 制御部
13 音響受付部
110 フレーム生成手段
111 FFT変換手段
112 位相差算出手段
113 S/N比算出手段
114 選択手段
115 計数手段
116 音響判定手段
117 音響処理手段
150 アンチエイリアジングフィルタ
151 A/D変換手段
100 コンピュータプログラム

Claims (9)

  1. 複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定する音響判定装置を用いた音響判定方法において、
    前記音響判定装置は、
    各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換し、
    デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成し、
    生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換し、
    周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出し、
    算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに音響受付手段から最近傍の音源からの音響信号を含むと判定し、
    判定した結果に基づく出力を行う
    ことを特徴とする音響判定方法。
  2. 複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、前記音響受付手段から最近傍の音源からの音響信号の有無を判定する音響判定装置において、
    各音響受付手段が受け付けた夫々の音響信号をデジタル信号に変換する手段と、
    デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成する手段と、
    生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換する手段と、
    周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出する手段と、
    算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに最近傍の音源からの音響信号を含むと判定する判定手段と
    を備えることを特徴とする音響判定装置。
  3. 周波数軸上の信号に変換した音響信号の振幅成分に基づいて信号対雑音比を算出する手段を更に備え、
    前記判定手段は、算出した信号対雑音比が所定の閾値以下である場合、位相差に関わらず、特定対象となる音響信号を含まないと判定する様に構成してある
    ことを特徴とする請求項2に記載の音響判定装置。
  4. 前記複数の音響受付手段は、夫々の相対位置を変更可能に構成してあり、
    前記複数の音響受付手段間の距離に基づいて、前記判定手段の判定に用いる閾値を算出する手段を更に備える
    ことを特徴とする請求項2又は請求項3に記載の音響判定装置。
  5. 周波数軸上の信号に変換した音響信号の振幅成分に基づく周波数毎の信号対雑音比に基づいて、前記判定手段の判定に用いる周波数を選択する選択手段を更に備えることを特徴とする請求項2乃至請求項のいずれかに記載の音響判定装置。
  6. 折り返し誤差を防止すべくデジタル信号に変換する前の音響信号を濾波するアンチエイリアジングフィルタを更に備え、
    前記判定手段は、前記アンチエイリアジングフィルタの特性に基づく所定の周波数より高い周波数を判定に用いる周波数から除外する様に構成してある
    ことを特徴とする請求項2乃至請求項のいずれかに記載の音響判定装置。
  7. 音声である音響信号を特定する場合に、
    周波数軸上の信号に変換した音響信号の振幅成分が極小値をとる周波数、又は振幅成分に基づく信号対雑音比が極小値をとる周波数を検出する手段を更に備え、
    前記判定手段は、検出した周波数を判定に用いる周波数から除外する様に構成してある
    ことを特徴とする請求項2乃至請求項のいずれかに記載の音響判定装置。
  8. 音声である音響信号を特定する場合に、
    前記判定手段は、音声に係る基本周波数が存在しない周波数を判定に用いる周波数から除外する様に構成してあることを特徴とする請求項2乃至請求項のいずれかに記載の音響判定装置。
  9. コンピュータに、複数の音響受付手段にて受け付けた複数の音源からのアナログの音響信号に基づいて、特定の音響信号の有無を判定させるコンピュータプログラムにおいて、
    コンピュータに、各音響受付手段が受け付け、デジタル信号に変換した夫々の音響信号から所定時間長のフレームを夫々生成させる手順と、
    コンピュータに、生成したフレーム単位の各音響信号を周波数軸上の信号に夫々変換させる手順と、
    コンピュータに、周波数軸上の信号に変換した各音響信号間の周波数毎の位相成分の差を位相差として算出させる手順と、
    コンピュータに、算出した位相差が第1閾値以上となる周波数の割合又は数が、第2閾値以下である場合、生成したフレームに音響受付手段から最近傍の音源からの音響信号を含むと判定させる手順と
    を実行させることを特徴とするコンピュータプログラム。
JP2007019917A 2007-01-30 2007-01-30 音響判定方法、音響判定装置及びコンピュータプログラム Expired - Fee Related JP4854533B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2007019917A JP4854533B2 (ja) 2007-01-30 2007-01-30 音響判定方法、音響判定装置及びコンピュータプログラム
US11/987,061 US9082415B2 (en) 2007-01-30 2007-11-27 Sound determination method and sound determination apparatus
KR1020070122628A KR100952894B1 (ko) 2007-01-30 2007-11-29 음향 판정 방법 및 음향 판정 장치
EP07121944.8A EP1953734B1 (en) 2007-01-30 2007-11-30 Sound determination method and sound determination apparatus
CN2007101960431A CN101236250B (zh) 2007-01-30 2007-11-30 声音判定方法和声音判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007019917A JP4854533B2 (ja) 2007-01-30 2007-01-30 音響判定方法、音響判定装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2008185834A JP2008185834A (ja) 2008-08-14
JP4854533B2 true JP4854533B2 (ja) 2012-01-18

Family

ID=39092595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007019917A Expired - Fee Related JP4854533B2 (ja) 2007-01-30 2007-01-30 音響判定方法、音響判定装置及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US9082415B2 (ja)
EP (1) EP1953734B1 (ja)
JP (1) JP4854533B2 (ja)
KR (1) KR100952894B1 (ja)
CN (1) CN101236250B (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8369800B2 (en) * 2006-09-15 2013-02-05 Qualcomm Incorporated Methods and apparatus related to power control and/or interference management in a mixed wireless communications system
JP5305743B2 (ja) * 2008-06-02 2013-10-02 株式会社東芝 音響処理装置及びその方法
US9054953B2 (en) * 2008-06-16 2015-06-09 Lg Electronics Inc. Home appliance and home appliance system
JP4547042B2 (ja) * 2008-09-30 2010-09-22 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
WO2010038385A1 (ja) * 2008-09-30 2010-04-08 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
KR101519104B1 (ko) * 2008-10-30 2015-05-11 삼성전자 주식회사 목적음 검출 장치 및 방법
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
KR101442115B1 (ko) * 2009-04-10 2014-09-18 엘지전자 주식회사 가전기기 및 가전기기 시스템
WO2011005018A2 (ko) 2009-07-06 2011-01-13 엘지전자 주식회사 가전기기 진단시스템 및 그 동작방법
KR20110010374A (ko) * 2009-07-24 2011-02-01 엘지전자 주식회사 가전기기 진단시스템 및 그 방법
JP2011033717A (ja) * 2009-07-30 2011-02-17 Secom Co Ltd 雑音抑圧装置
US20110058676A1 (en) * 2009-09-07 2011-03-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
JP5493850B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
KR101748605B1 (ko) 2010-01-15 2017-06-20 엘지전자 주식회사 냉장고 및 냉장고 진단시스템
WO2011089981A1 (ja) * 2010-01-19 2011-07-28 三菱電機株式会社 信号生成装置および信号生成方法
US9165567B2 (en) 2010-04-22 2015-10-20 Qualcomm Incorporated Systems, methods, and apparatus for speech feature detection
KR101658908B1 (ko) * 2010-05-17 2016-09-30 삼성전자주식회사 휴대용 단말기에서 통화 음질을 개선하기 위한 장치 및 방법
JP5672770B2 (ja) * 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
EP2592786B1 (en) 2010-07-06 2015-03-18 LG Electronics Inc. Home appliance diagnosis system and diagnosis method for same
US8898058B2 (en) 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム
US8818800B2 (en) * 2011-07-29 2014-08-26 2236008 Ontario Inc. Off-axis audio suppressions in an automobile cabin
KR101416937B1 (ko) 2011-08-02 2014-08-06 엘지전자 주식회사 가전기기, 가전기기 진단시스템 및 동작방법
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
CN103165137B (zh) * 2011-12-19 2015-05-06 中国科学院声学研究所 一种非平稳噪声环境下传声器阵列的语音增强方法
CN103248992B (zh) * 2012-02-08 2016-01-20 中国科学院声学研究所 一种基于双麦克风的目标方向语音活动检测方法及系统
KR101942781B1 (ko) 2012-07-03 2019-01-28 엘지전자 주식회사 가전기기 및 가전기기 진단을 위한 신호음 출력방법
KR20140007178A (ko) 2012-07-09 2014-01-17 엘지전자 주식회사 가전기기 및 그 시스템
JP6003510B2 (ja) * 2012-10-11 2016-10-05 富士ゼロックス株式会社 音声解析装置、音声解析システムおよびプログラム
CN102981615B (zh) * 2012-11-05 2015-11-25 瑞声声学科技(深圳)有限公司 手势识别装置及识别方法
US9258645B2 (en) * 2012-12-20 2016-02-09 2236008 Ontario Inc. Adaptive phase discovery
CN103117063A (zh) * 2012-12-27 2013-05-22 安徽科大讯飞信息科技股份有限公司 一种基于软件实现的音乐内容截幅检测方法
US9633655B1 (en) 2013-05-23 2017-04-25 Knowles Electronics, Llc Voice sensing and keyword analysis
US9953634B1 (en) 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
WO2015137621A1 (ko) * 2014-03-11 2015-09-17 주식회사 사운들리 저 전력 연관 콘텐츠 제공 시스템, 방법, 및 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR20150106300A (ko) * 2014-03-11 2015-09-21 주식회사 사운들리 저 전력 연관 콘텐츠 제공 시스템, 방법, 및 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
CN105096946B (zh) * 2014-05-08 2020-09-29 钰太芯微电子科技(上海)有限公司 基于语音激活检测的唤醒装置及方法
CN104134440B (zh) * 2014-07-31 2018-05-08 百度在线网络技术(北京)有限公司 用于便携式终端的语音检测方法和语音检测装置
CN106205628B (zh) 2015-05-06 2018-11-02 小米科技有限责任公司 声音信号优化方法及装置
JP6602406B2 (ja) * 2015-06-30 2019-11-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン データベースを生成するための方法および装置
CN106714058B (zh) * 2015-11-13 2024-03-29 钰太芯微电子科技(上海)有限公司 Mems麦克风及基于mems麦克风的移动终端唤醒方法
KR101800425B1 (ko) 2016-02-03 2017-12-20 세이퍼웨이 모바일, 인코퍼레이트 비명 검출 방법 및 이를 위한 장치
JP6645322B2 (ja) 2016-03-31 2020-02-14 富士通株式会社 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム
CN107976651B (zh) * 2016-10-21 2020-12-25 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
US20190033438A1 (en) * 2017-07-27 2019-01-31 Acer Incorporated Distance detection device and distance detection method thereof
CN108564961A (zh) * 2017-11-29 2018-09-21 华北计算技术研究所(中国电子科技集团公司第十五研究所) 一种移动通信设备的语音降噪方法
CN108766455B (zh) 2018-05-16 2020-04-03 南京地平线机器人技术有限公司 对混合信号进行降噪的方法和装置
CN111163411B (zh) * 2018-11-08 2022-11-18 达发科技股份有限公司 减少干扰音影响的方法及声音播放装置
CN109669663B (zh) * 2018-12-28 2021-10-12 百度在线网络技术(北京)有限公司 音区幅值获取方法、装置、电子设备及存储介质
CN110047507B (zh) * 2019-03-01 2021-03-30 北京交通大学 一种声源识别方法及装置
RU2740574C1 (ru) * 2019-09-30 2021-01-15 Акционерное общество "Лаборатория Касперского" Система и способ фильтрации запрошенной пользователем информации
US11276388B2 (en) * 2020-03-31 2022-03-15 Nuvoton Technology Corporation Beamforming system based on delay distribution model using high frequency phase difference
CN111722186B (zh) * 2020-06-30 2024-04-05 中国平安人寿保险股份有限公司 基于声源定位的拍摄方法、装置、电子设备及存储介质
CN112530411B (zh) * 2020-12-15 2021-07-20 北京快鱼电子股份公司 一种实时分角色转录方法、设备和系统
JP7615663B2 (ja) * 2020-12-23 2025-01-17 トヨタ自動車株式会社 音源推定システム、音源推定方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4333170A (en) 1977-11-21 1982-06-01 Northrop Corporation Acoustical detection and tracking system
DE3545447A1 (de) 1985-12-20 1988-01-28 Bayerische Motoren Werke Ag System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero
JP2822713B2 (ja) 1991-09-04 1998-11-11 松下電器産業株式会社 収音装置
WO2000030404A1 (en) * 1998-11-16 2000-05-25 The Board Of Trustees Of The University Of Illinois Binaural signal processing techniques
US6130949A (en) 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JP3384540B2 (ja) * 1997-03-13 2003-03-10 日本電信電話株式会社 受話方法、装置及び記録媒体
US6243322B1 (en) 1999-11-05 2001-06-05 Wavemakers Research, Inc. Method for estimating the distance of an acoustic signal
AU2001261344A1 (en) 2000-05-10 2001-11-20 The Board Of Trustees Of The University Of Illinois Interference suppression techniques
JP2003032779A (ja) * 2001-07-17 2003-01-31 Sony Corp 音処理装置、音処理方法及び音処理プログラム
JP4095348B2 (ja) * 2002-05-31 2008-06-04 学校法人明治大学 雑音除去システムおよびプログラム
JP4247002B2 (ja) 2003-01-22 2009-04-02 富士通株式会社 マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
JP2005049153A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 音声方向推定装置及びその方法
JP4283645B2 (ja) * 2003-11-19 2009-06-24 パイオニア株式会社 信号遅延時間測定装置及びそのためのコンピュータプログラム
JP2006084928A (ja) * 2004-09-17 2006-03-30 Nissan Motor Co Ltd 音声入力装置
JP4580210B2 (ja) * 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP4729927B2 (ja) * 2005-01-11 2011-07-20 ソニー株式会社 音声検出装置、自動撮像装置、および音声検出方法
JP3906230B2 (ja) 2005-03-11 2007-04-18 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2008185834A (ja) 2008-08-14
US20080181058A1 (en) 2008-07-31
US9082415B2 (en) 2015-07-14
CN101236250A (zh) 2008-08-06
CN101236250B (zh) 2011-06-22
EP1953734B1 (en) 2014-03-05
KR100952894B1 (ko) 2010-04-16
EP1953734A3 (en) 2011-12-21
EP1953734A2 (en) 2008-08-06
KR20080071479A (ko) 2008-08-04

Similar Documents

Publication Publication Date Title
JP4854533B2 (ja) 音響判定方法、音響判定装置及びコンピュータプログラム
CN111418010B (zh) 一种多麦克风降噪方法、装置及终端设备
US8620672B2 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
CN104335600B (zh) 多麦克风移动装置中检测及切换降噪模式的方法
JP5862349B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
US9959886B2 (en) Spectral comb voice activity detection
JP5870476B2 (ja) 雑音推定装置、雑音推定方法および雑音推定プログラム
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
US20120330653A1 (en) Device and method for capturing and processing voice
US20140337021A1 (en) Systems and methods for noise characteristic dependent speech enhancement
JP6156012B2 (ja) 音声処理装置及び音声処理用コンピュータプログラム
JP2012150237A (ja) 音信号処理装置、および音信号処理方法、並びにプログラム
JP2011244232A (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
EP3905718B1 (en) Sound pickup device and sound pickup method
US20140341386A1 (en) Noise reduction
JP2011033717A (ja) 雑音抑圧装置
JP6294747B2 (ja) 報知音感知装置、報知音感知方法及びプログラム
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2010091897A (ja) 音声信号強調装置
CN111477246B (zh) 语音处理方法、装置及智能终端
JP5853133B2 (ja) 音響処理装置および音響処理方法
CN114341978B (zh) 采用语音加速度计信号降低耳麦中的噪声

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees