[go: up one dir, main page]

JP6294747B2 - 報知音感知装置、報知音感知方法及びプログラム - Google Patents

報知音感知装置、報知音感知方法及びプログラム Download PDF

Info

Publication number
JP6294747B2
JP6294747B2 JP2014089043A JP2014089043A JP6294747B2 JP 6294747 B2 JP6294747 B2 JP 6294747B2 JP 2014089043 A JP2014089043 A JP 2014089043A JP 2014089043 A JP2014089043 A JP 2014089043A JP 6294747 B2 JP6294747 B2 JP 6294747B2
Authority
JP
Japan
Prior art keywords
frequency
peak
sound
predetermined
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014089043A
Other languages
English (en)
Other versions
JP2015206974A (ja
Inventor
仲 大室
仲 大室
桂右 井本
桂右 井本
尚 植松
尚 植松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014089043A priority Critical patent/JP6294747B2/ja
Publication of JP2015206974A publication Critical patent/JP2015206974A/ja
Application granted granted Critical
Publication of JP6294747B2 publication Critical patent/JP6294747B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Alarm Systems (AREA)

Description

この発明は、周辺で発生した音声や音響を感知する技術に関し、より詳しくは、時計や家電のアラーム音、玄関のチャイム、火災警報器の警報音、電話の着信音、自動車のクラクション、注意を喚起する笛の音などの報知音が発生したときに、その報知音の発生を感知する報知音感知技術に関する。
人に何らかの合図をするときに、人の日常動作に伴う音や自然界に存在する音とは特徴の異なる音を発生させることが多い。このような音には、例えば、全自動洗濯機の洗濯が終了したときや電子レンジの調理が終了した際の「ピーピー」という音、玄関チャイムの「ピンポーン」という音、火災警報器の「ピューピュー」という音などがある。これらを総称して報知音と呼ぶ。
しかしながら、聴覚障がいのある人にとっては、報知音が発生してもそれを聞くことができず、日常生活に不便を生じるだけでなく、身に危険が生じる可能性もある。
この問題に対して、マイクで収音した報知音を、振動に変えて呈示する方法が非特許文献1に記載されている。例えば、スマートフォンや専用の機器をユーザが身につけ、マイクから取り込んだ音をソフトウェアで常時分析して、例えば高域通過フィルタで帯域制限した信号のパワーが閾値以上の音を感知したときにはバイブレータを起動し、音の情報を振動に変換してユーザに知らせるものである。音の発生パターンに応じて振動のパターンを変化させ、異なる種類の報知音を区別することも可能である。
織田、古家、片岡、「聴覚障害者支援を目的とした振動による報知音の伝達方法とその有効性」、電子情報通信学会論文誌.D、Vol. J89-D、No.12、pp. 2671-2678
非特許文献1の方法は、聴覚障がい者に一定の利便性を提供する一方で、閾値による感度の調整が難しく、感度を上げる(すなわち閾値を下げる)とユーザが必要としない音にも反応して過剰に振動し、感度を下げる(すなわち閾値を上げる)とユーザが必要とする音が周囲で発生しても感知しない場合があるという問題があった。
この発明は、このような状況に鑑み、周囲で発生した音が報知音であるかないかをより厳密に判断することができる報知音感知技術を提供することを目的とする。
上記の課題を解決するために、この発明の報知音感知装置は、入力された音響信号があらかじめ定めた周波数帯域内でパワーが集中する周波数を所定の数以上持つことを検出すると報知音の感知を示す感知結果を出力する。
この発明の報知音感知技術によれば、周囲で発生した音が報知音であるかないかをより厳密に判断することができる。つまり、人の日常動作に伴う音や自然界に存在する音がある環境において、報知音が鳴ったことを正確に感知することができる。これにより、聴覚障がい者に音以外の方法によって報知音が鳴ったことを正確に通知することができる。また、聴覚障がい者向けのサービスに限らず健常者向けにも、ユーザが報知音の発生源から離れた場所にいるときに、報知音の発生源の近くに報知音感知装置を置き、例えば無線などの通信手段を用いて感知結果を離れたユーザに通知することができる。
図1は、第一実施形態の報知音感知装置の機能構成を例示する図である。 図2は、報知音の特徴を説明するための図である。 図3は、報知音の特徴を説明するための図である。 図4は、報知音の特徴を説明するための図である。 図5は、報知音の特徴を説明するための図である。 図6は、第二実施形態の報知音感知装置の機能構成を例示する図である。 図7は、第二実施形態の報知音感知方法の処理フローを例示する図である。 図8は、第三実施形態の報知音感知装置の機能構成を例示する図である。 図9は、第四実施形態の報知音感知装置の機能構成を例示する図である。 図10は、連続音と間欠音の特徴を説明するための図である。 図11は、第四実施形態の判定規則を概念的に示す図である。
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
[第一実施形態]
この発明の第一実施形態は、この発明の最上位の概念を示す実施形態である。第一実施形態は、図1に示すように、音声や音響信号(以下、音響信号)を入力とし、報知音を感知したこと(もしくは報知音を感知しなかったこと)を示す感知結果を出力する報知音感知装置及び方法である。
第一実施形態の報知音感知装置1は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。報知音感知装置1は、例えば、中央演算処理装置の制御のもとで各処理を実行する。報知音感知装置1に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。また、報知音感知装置1の各処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。
図2から図5を参照して、報知音を感知する対象となる音響信号の特徴を説明する。
図2は、オフィスで一定時間録音した音の例である。図2の例は、横軸を時間とし、縦軸を振幅とし、時間領域の波形を図にしたものである。図2の例では、2-Aの矢印で示す時間帯に携帯電話の着信音が鳴っている。この着信音を文字で表現すると、「ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッ、ピピピッピピピッ」といった感じである。それ以外の時間は、オフィスにおける通常業務で発生するノイズ(オフィスノイズ)であり、定常的な音もあれば、2-Bの矢印で示すような、突発性で音量の大きいノイズも発生している。
図3はリビングルームで一定時間録音した音の例である。図3の例は、図2と同様に、時間領域の波形を図にしたものである。一見、定常的な雑音(フロアノイズ)だけで、報知音は鳴っていないように見えるが、実際にはこのとき、隣の台所ではキッチンタイマーが鳴っており、録音された音を聴くと、キッチンタイマーの音も録音されていることがわかる。
このような状況において、報知音感知装置1は、図2のオフィスの例では携帯電話の着信音が鳴ったときに、図3のリビングの例ではキッチンタイマーが鳴ったときに、感知を示す感知結果を出力し、それ以外の時間帯では感知を示す感知結果を出力しない(または、不感知を示す感知結果を出力する)ことが求められる。しかしながら、図2及び図3の例において従来技術を用いると、図2のオフィスの例では突発性で音量の大きいノイズでも感知してしまい、図3のリビングの例ではキッチンタイマーを感知することができず、いずれの場合も正確に感知結果を出力することができない。
図4(2-A)は、図2において2-Aで示した時刻におけるパワースペクトルを図示したものであり、図4(2-B)は、図2において2-Bで示した時刻におけるパワースペクトルを図示したものである。それぞれ、横軸が周波数(Hz)であり、縦軸がパワー(dB)である。報知音である図4(2-A)は、突発性ノイズである図4(2-B)に対して顕著な特徴がある。図4(2-A)では、矢印で示した2.8kHz付近と5.6kHz付近にピークを持つスペクトル構造をしていることがわかる。図4(2-B)では、そのような特徴は認められない。
図5(3-A)は、図3において3-Aで示した時刻におけるパワースペクトルを図示したものであり、図5(3-B)は、図3において3-Bで示した時刻におけるパワースペクトルを図示したものである。図3では一見、報知音がないように見られたが、図5(3-B)のスペクトルは4.1kHz付近にピークを持つ構造であり、図5(3-A)にはそのような特徴は認められない。実際に、図3において3-Bで示した時刻にはキッチンタイマーが鳴っており、3-Aで示した時刻には鳴っていない。
これらの観察結果より、報知音をその他の周囲雑音の中から見つけるためには、1つ以上のピークを持つ、すなわちパワーが集中する周波数を1箇所以上持つ(以下、ピークを持つと呼ぶ。)かどうかを見分ければよいことがわかる。しかも、報知音は一般に、「ブー」という低い音ではなく、「ピー」という比較的高い音が用いられることが多いため、あらかじめ定めた第一の周波数(例えば、1.0kHz)から、第二の周波数(例えば、6.0kHz)の間の周波数に1個以上N個以下のピークを持つ音であると判断したら、感知を示す感知結果を出力し、それ以外の場合は感知を示す感知結果を出力しない、または不感知を示す感知結果を出力する。ピークの数の上限Nを定めることは必須ではないが、例えば人の声のように多数の周波数にパワーが集中した音を報知音として誤感知することを回避することができ、より精度よく報知音を感知することができる。Nの具体的な値は実験的に求めるのがよいが、例えば6程度とすることができる。
したがって、第一実施形態の報知音感知装置1は、入力された音響信号があらかじめ定めた周波数帯域内にパワーが集中する周波数を持つことを検出すると報知音の感知を示す感知結果を出力するものである。
[第二実施形態]
この発明の第二実施形態は、第一実施形態の報知音感知装置及び方法の機能構成を具体化した報知音感知装置及び方法である。
第二実施形態の報知音感知装置1は、図6に示すように、ケプストラム計算部10、窓かけ部14、第二FFT部15及び判定部16を例えば含み、音響信号s(n)を入力とし、感知結果aを出力する。ケプストラム計算部10は、第一FFT部11、対数パワースペクトル計算部12及び逆FFT部13を例えば含む。
図7を参照して、第二実施形態の報知音感知方法を説明する。
入力音響信号s(n)はパルス符号変調(PCM: Pulse Code Modulation)などのディジタル形式で、フレームと呼ばれる一定の時間毎に区切られている。サンプリング周波数は任意の値を利用してよいが、1.0kHzから6.0kHzの周波数特性を分析するには、16kHz以上でサンプリングするのが適当である。以下、特に断わりがある場合を除いて、サンプリング周波数が16kHzであることを例として説明する。フレーム長も任意の値を利用してよく、例えば、5ミリ秒(16kHzサンプリングの場合は、80サンプル)、10ミリ秒(16kHzサンプリングの場合は、160サンプル)、20ミリ秒(16kHzサンプリングの場合は、320サンプル)、32ミリ秒(16kHzサンプリングの場合は、512サンプル)などが利用できる。
ステップS11において、第一FFT部11は、入力音響信号を蓄えるバッファを備え、短時間フーリエ変換の手法を用いて、入力音響信号を周波数スペクトルS(k)に変換する。周波数スペクトルS(k)は、対数パワースペクトル計算部12へ入力される。フーリエ変換の窓長はフレーム長以上にするものとし、フーリエ変換の窓長がフレーム長を超えるときは、複数のフレームにまたがった時間領域のバッファ内の信号を変換するものとする。例えば、フレーム長を32ミリ秒、フーリエ変換の窓長を64ミリ秒とすると、2フレーム分をまとめて変換するものとする。フーリエ変換の窓長がフレーム長より長い分は、各フレームの処理において時間領域をオーバーラップさせるものとする。例えば、第iフレームの音響信号が入力されたときには、第i-1フレームと第iフレームの音響信号をフーリエ変換し、第i+1フレームの音響信号が入力されたときには、第iフレームと第i+1フレームの音響信号をフーリエ変換する。
ステップS12において、対数パワースペクトル計算部12は、周波数スペクトルS(k)から、対数尺度のパワースペクトル(以下、対数パワースペクトルという)を計算する。対数パワースペクトルは、逆FFT部13へ入力される。
ステップS13において、逆FFT部13は、対数パワースペクトル計算部12が出力する対数パワースペクトルを逆フーリエ変換して時間領域の信号c(n)に戻す。逆FFT部13の出力c(n)はFFTケプストラム係数と呼ぶ(以下、単にケプストラムという)。ケプストラムの計算方法の詳細は、一般に広く知られている方法を用いることができる。ケプストラムの計算方法は、例えば、「斎藤、中田、「音声情報処理の基礎」、オーム社、1981年、pp.99-103(参考文献1)」に記載されている。参考文献1には、後述するケプストラムに窓かけをする手法についても記載されている。
ステップS14において、窓かけ部14は、あらかじめ定めた窓関数を用いて、ケプストラムc(n)に重みを掛けた重み付きケプストラムw(n)c(n)を出力する。窓関数はnを変数とする重み関数であり、方形窓のほか、三角関数を用いて定義する窓(例えば、ハミング窓、ハニング窓など)を利用することができる。具体的な窓関数の決め方は後述する。
ステップS15において、第二FFT部15は、重み付きケプストラムw(n)c(n)を再度周波数領域に変換した信号Cw(k)を出力する。一般的に、重み付きケプストラムを周波数領域に変換すると、重みに応じてスペクトルの特徴が強調されたスペクトルが得られることが知られており、以降の説明では、信号Cw(k)を強調スペクトルと呼ぶことにする。
ステップS16において、判定部16は、第二FFT部15の出力する強調スペクトルCw(k)におけるあらかじめ定めた周波数帯域内の各周波数kに対応する値をあらかじめ定めた閾値Caと比較して報知音の感知を示す感知結果を出力する。具体的には、KLをあらかじめ定めた第一の周波数とし、KHをあらかじめ定めた第二の周波数とし、KL≦k≦KHの範囲の各周波数kに対応する強調スペクトルCw(k)の値を調べ、閾値Caを超える(以上でもよい。以下、閾値との比較において同じ。)値があるときには、報知音の感知を示す感知結果aを出力し、閾値Caを超える値がないときは、報知音の感知を示す感知結果aを出力しない。このとき、閾値Caを超える値がないときは、報知音の不感知を示す感知結果aを出力するようにしてもよい。例えば、閾値Caを超える値があるときは、感知結果としてa=1を出力し、閾値Caを超える値がないときはa=0を出力する。
第一の周波数KL、第二の周波数KH及び閾値Caの値は、いずれも報知音の存在する可能性がある範囲によって定める。特定の報知音はJISのガイドライン等で標準化されているため、これらに記載された報知音の周波数範囲に合わせて設定してもよい。また、独自に設計された報知音に合わせて設定するものであってもよい。第一の周波数KLは、例えば、1.0kHzとすることができる。第二の周波数KHは、例えば、6.0kHzとすることができる。
窓かけ部14の処理において、ケプストラムc(n)に重みをかけるのは、図4(2-A)及び図5(3-B)の例において、パワーが集中した周波数成分を強調して、1個以上N個以下の周波数にピークを持つ音であるかどうかを安定的に判定できるようにするためである。ケプストラムc(n)の値は、nが小さい領域はスペクトルの傾きや緩やかな概形を表し、nが大きくなるにつれてスペクトルの微細構造を表すことが知られている。また、nの値に応じた重み係数を乗算することによって、スペクトルの概形を強調又は除去したり、スペクトルの微細構造を強調又は除去したりできることが知られている。
この発明では、報知音を感知すること、すなわち、特定の周波数にパワーが集中した信号が存在することを感知することが目的である。図4及び図5の例において、スペクトルの傾きや緩やかな概形は報知音以外の周囲雑音によって生じているものと考えられる。したがって、第二実施形態では、nが小さい領域の重みがそれ以外の領域よりも小さくなる窓関数を利用するものとする。窓関数の一例として、
n≦Ncのとき、w(n)=0
それ以外のとき、w(n)=1
のような方形窓を利用することができる。Ncの値には、例えば10を用いることができる。
窓関数の別の一例として、Nc<Nhとし、
n≦Ncのとき、w(n)=0
n≧Nhのとき、w(n)=0
それ以外のとき、w(n)=1
のように、nが小さい領域のほか、nが大きい領域の重みも小さくなるように窓関数を定義してもよい。nが大きい領域を除外するのは、報知音のピーク周波数にはある程度の幅があるものとし、それよりも細かなスペクトルの微細構造も除去することによって、安定した報知音の感知ができるものと考えられるためである。フレーム長を32ミリ秒(512サンプル)、フーリエ変換の窓長を1024サンプルとしたとき、Nhの値は、例えば、100〜400程度に設定することができる。
上記の例では、w(n)=0又はw(n)=1の方形窓を用いたが、例えば、nの値によってゆるやかにw(n)の値が変化する窓関数を定義してもよい。例えば、nが小さい領域とnが大きい領域でw(n)が小さくなるように、三角関数を用いて窓を定義することができる。このような窓関数の代表的なものには、ハミング窓やハニング窓がある。
[第三実施形態]
この発明の第三実施形態は、第二実施形態の判定部16の機能構成を具体化した報知音感知装置及び方法である。
第三実施形態の判定部16は、図8に示すように、ピーク検出部161、総合判定部162及びメモリ部163を例えば含み、強調スペクトルCw(k)を入力とし、感知結果aを出力する。
以下、第三実施形態の判定部16の行う処理について、第二実施形態と異なる部分を中心に説明する。
ピーク検出部161は、KL≦k≦KHの範囲の周波数帯域内の各周波数kに対応する強調スペクトルCw(k)の値を閾値Caと比較して、閾値Caを超える値があるときは、ピーク検出結果a0として1以上の値を出力し、閾値Caを超える値がないときは、ピーク検出結果a0として0の値を出力する。ピーク検出結果a0の値は、単にピークの有無を表す値であってもよいし、ピークの個数としてもよい。ピークの有無を表す値とする場合には、強調スペクトルCw(k)の値を調べ、閾値Caを超える値があるときは、ピーク検出結果a0=1を出力し、閾値Caを超える値がないときは、ピーク検出結果a0=0を出力する。ピークの個数を求める方法は第四実施形態において詳述する。ピーク検出結果a0は、総合判定部162とメモリ部163へ入力される。
メモリ部163は、あらかじめ定めた時間(フレーム数)にわたってピーク検出結果a0の値を蓄積し、その時系列を総合判定部162に送る。フレーム数は存在する可能性のある報知音の長さとフレーム長に基づいた数に設定すればよい。
総合判定部162は、現在のフレームのピーク検出結果a0の値と、過去のピーク検出結果a0の値の時系列を利用し、あらかじめ定めた規則に基づいて感知すべき報知音が発生したかどうかを示す感知結果aを出力する。あらかじめ定めた規則の例としては、
1.連続でXフレーム以上(例えば、X=10、フレーム長が32ミリ秒のときは320ミリ秒以上連続して)、ピーク検出結果a0が1以上のときに報知音が発生したものと判定する。
または、
2.あらかじめ定めた過去一定時間T内(例えば、過去6秒以内)に、Yフレーム以上(例えば、Y=40)、ピーク検出結果a0が1以上のときに報知音が発生したものと判定する。
すなわち、総合判定部162は、1つのフレームの周波数分析結果だけで報知音が発生したかどうかを決定しないで、あらかじめ定めた過去一定時間内の分析結果(連続性、頻度)に基づいて報知音が発生したかどうかの総合判定を行う。
[第四実施形態]
この発明の第四実施形態は、第三実施形態のピーク検出部161と総合判定部162の機能構成を具体化した報知音感知装置及び方法である。
第四実施形態のピーク検出部161は、図9に示すように、ピーク数検出部1611及びピーク周波数検出部1622を例えば含み、強調スペクトルCw(k)を入力とし、ピーク数an及びピーク中心周波数akを出力する。
第四実施形態の総合判定部162は、図9に示すように、連続音判定部1621及び間欠音判定部1622を例えば含み、ピーク数anの時系列及びピーク中心周波数akの時系列を入力とし、感知結果aを出力する。
以下、第四実施形態の判定部16の行う処理について、第三実施形態と異なる部分を中心に説明する。
ピーク数検出部1611は、KL≦k≦KHの範囲の周波数帯域内の各周波数kに対応する強調スペクトルCw(k)の値を閾値Caと比較して、閾値Caを超える値があるときは、ピーク数anを求める。ここで、ピーク数とは、閾値を超えたkの個数ではなく、kの小さい(または大きい)方から順に各周波数kに対応する強調スペクトルCw(k)の値を調べ、閾値Caを超えない状態から強調スペクトルCw(k)の値が徐々に増加し、閾値Caを超えた周波数ksから、次に閾値Caを超えない状態になる直前の周波数keまでを1つのピークとしたピークの数である。
ピーク周波数検出部1622は、KL≦k≦KHの範囲の周波数帯域内の各周波数kに対応する強調スペクトルCw(k)の値を閾値Caと比較して、閾値Caを超える値があるときは、ピーク中心周波数akを求める。ここで、ピーク中心周波数とは、ピーク数検出部1611が求めた各ピークにおいて、閾値Caを超えた周波数ksと閾値Caを超えない状態になる直前の周波数keの中間点の周波数、またはks≦k≦keで強調スペクトルCw(k)の値が最大となる周波数である。なお、ピーク数anが2以上の場合は、ピーク中心周波数akは、それぞれのピークに対応して複数個求めるものとする。
KL≦k≦KHの範囲に閾値Caを超える強調スペクトルCw(k)の値がないときは、ピーク数anを0とし、ピーク中心周波数akは求めなくてよい。例えば、ソフトウェアの実装上は、ピーク中心周波数akも0としておけばよい。
メモリ部163は、あらかじめ定めた時間(フレーム数)にわたってピーク数anとピーク中心周波数akの値を蓄積し、その時系列を総合判定部162に送る。
連続音判定部1621は、現在のフレームにおけるピーク数anの値と、過去のフレームにおけるピーク数anの値の時系列を利用し、あらかじめ定めた連続音を検出する規則に基づいて感知すべき報知音が発生したかどうかの感知結果aを出力する。連続音とは、特定の周波数にパワーが集中する音が連続する報知音である。
間欠音判定部1622は、現在のフレームにおけるピーク数anの値及びピーク中心周波数akの値と、過去のフレームにおけるピーク数anの時系列及びピーク中心周波数akの値の時系列を利用し、あらかじめ定めた間欠音を検出する規則に基づいて感知すべき報知音が発生したかどうかの感知結果aを出力する。間欠音とは、特定の周波数にパワーが集中する音が間欠的に継続する報知音である。
総合判定部162は、連続音判定部1621と間欠音判定部1622を並列して両方動作させてもよいし、まず連続音判定部1621を動作させ、報知音が発生したと判定されなかったときに間欠音判定部1622を動作させる構成でもよい。
総合判定部162は、連続音判定部1621と間欠音判定部1622の少なくとも一方で報知音が発生したと判定された場合には、報知音の発生を示す感知結果を出力する。また、連続音判定部1621と間欠音判定部1622のいずれでも報知音が発生したと判定されなかった場合には、報知音の不感知を示す感知結果を出力する。
連続音と間欠音で検出する規則を異なるものに設定するのは、報知音をより誤りなく検出するためである。
連続音の例としては、「ピー」という同じ音が一定時間継続する報知音(例えば、洗濯機、電子レンジなどの動作終了音など)のほか、「ピーンポーン」という音程が変わるインターフォンの呼び出し音、「ピューピュー」と音程が連続的に変わる火災警報音、「トゥルルルル」や「チリリリン」といった複雑な音質の電話の着信音などを想定する。これらの音は、必ずしも同じ音が継続せず、音程が変化する音であっても、特定の周波数にパワーが集中する音が継続することによって、人は報知音であると認識する。なお、音程が変化するとは、パワーが集中する周波数やそのピークの数が時間変動することをいう。
間欠音の例としては、「ピピッ、ピピッ、」という目覚まし時計、キッチンタイマー、携帯電話の着信音などを想定する。これらは、音の鳴り始めから鳴り終わりまでの時間は一定以上継続しているが、一回一回の音が出ている時間はごく短時間である。しかし、同じ音が規則正しく間欠的に鳴ることによって、人は連続音と同様にそれを報知音であると認識する。
第三実施形態の方法において、連続音と間欠音を同じ規則で検出しようとすると、「あらかじめ定めた過去一定時間T内に、Yフレーム以上にわたってピーク数a0が1以上のときに報知音が発生したものと判定する」という規則を定める際のTとYの値を、間欠音が検出できる値に設定しなければならない、つまりTの値(すなわち、Tに対応するフレーム数)に対してYの値を十分に小さく設定しなければならない。しかしながら、このように設定すると、報知音が鳴っていないのに、日常生活音を報知音と誤って判断し、誤った感知結果を出力してしまうことがある。特に、食器やテレビ番組の音を報知音と誤る場合が多くなる。これを防ぐために、同じ音が規則正しく間欠的に鳴っているかどうかを判断する必要がある。
逆に、連続音の検出では、同じ音が連続して鳴っているという制限をつけると、インターフォンや火災警報音のように音程が変化する音を検出できなくなることから、連続音は音程が変化しても、とにかく特定の周波数にパワーが集中した音が連続して鳴っていれば報知音と判断してよいこととする。
連続音を検出する規則の例としては、
1.連続でXフレーム以上(例えば、X=10、フレーム長が32ミリ秒のときは320ミリ秒以上連続して)、ピークの数anが1以上のときに報知音が発生したものと判定する。
または、
2.あらかじめ定めた過去一定時間Tc内(例えば、過去1秒以内)に、Ycフレーム以上(例えば、Yc=20)、ピークの数anが1以上のときに報知音が発生したものと判定する。
すなわち、連続音判定部1621は、1つのフレームの周波数分析結果だけで連続音が発生したかどうかを決定しないで、あらかじめ定めた過去一定時間内の分析結果(連続性、頻度)に基づいて連続音が発生したかどうかの判定を行う。
間欠音を検出する規則の例としては、
1.あらかじめ定めた過去一定時間Tb内(例えば、過去6秒以内)に、Ybフレーム以上(例えば、Yb=10)、ピークの数an及びピークの中心周波数akが0でない同一の値であるフレームがあるときに報知音が発生したものと判定する。
または、
2.あらかじめ定めた過去一定時間Tb内(例えば、過去6秒以内)で、ピークの数an及びピークの中心周波数akが0でない同一の値、または値の差があらかじめ定めた許容差以内(以下、総称して同一と呼ぶ)のフレームの組を抽出し、当該フレーム間の時間差(フレーム番号の差)があらかじめ定めた所定の値以下の場合には、当該フレーム間は連続して同一の音が鳴っているとみなした上で、上述した連続音を検出する規則を適用して報知音の発生を判定する。前記「当該フレーム間は連続して同一の音が鳴っているとみなした上」とは、例えば、当該フレーム間のすべてのフレームのピークの数an及びピークの中心周波数akを、当該フレームのピークの数an及びピークの中心周波数akで置き換える処理としてもよい。または、実際にピークの数anが1以上のフレームは当該フレームの2つだけであるが、前記連続音を検出する規則のXおよびYcを数えるときに、当該フレームの数に前記フレーム番号の差を加える、厳密には当該フレームの数に前記フレーム番号の差を加えて1減ずる(1フレーム重複するため)処理としてもよい。なお、連続音を検出する規則を適用する際の閾値X、Tc、Ycは、連続音判定部1621のそれらとは異なる値を設定することができる。
すなわち、間欠音判定部1622は、1つのフレームの周波数分析結果だけで間欠音が発生したかどうかを決定しないで、あらかじめ定めた過去一定時間内の分析結果(連続性、頻度)に基づいて間欠音が発生したかどうかの判定を行う。
第三実施形態と第四実施形態の違いについて、より詳しく説明する。図10に(A)音程の変化する連続音、(B)間欠音、(C)報知音以外の音(生活雑音等)のピークの中心周波数を例示する。これらはピークの数anが1の例であり、横軸が時間、縦軸がピークの中心周波数を示す。ピークの数anが2以上のときは、同じ時刻にピークの中心周波数を示す線(図中の横線)が2本以上あることになるが、ここでは説明を簡単にするためにanが1の例のみを説明する。ピークの中心周波数を示す線が無い時間帯は、ピークを持たないことを示す。第三実施形態においてピーク検出結果a0をピークの有無を表す値(a0=1)とした場合には、図10の例では、(A)(B)で報知音が発生したと判定しようとすると、(C)でも報知音が発生したと判定される。これは、一定時間T内において、a0=1のフレーム数が(B)よりも(C)のほうが多いためである。図11は、第四実施形態における間欠音判定部1622の判定規則を概念的に示したもので、(B)は(B’)のような連続音とみなす。第四実施形態では、連続音判定部1621により(A)のみが報知音と判定され、間欠音判定部1622により(B)が報知音と判定される。したがって、(A)(B)の場合に報知音が発生したと判定され、(C)は報知音と判定されない。
[第五実施形態]
この発明の第五実施形態は、第四実施形態のピーク検出部161および総合判定部162の変形例である。
一般に、報知音は1.0kHz以上の高い周波数の音である。そこで、第四実施形態のピーク検出部161において、k<KLの範囲に閾値Caを超える強調スペクトルCw(k)の値があるかどうかを更に調べ、当該範囲に閾値を超える値があったフレームは、判定対象から除外する。判定対象から除外するとは、例えば当該フレームのピークの数anを0とする。
これによって、報知音でない音を報知音と誤感知する確率がより低下する。
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[プログラム、記録媒体]
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
1 報知音感知装置
10 ケプストラム計算部
11 第一FFT部
12 対数パワースペクトル計算部
13 逆FFT部
14 窓かけ部
15 第二FFT部
16 判定部
161 ピーク検出部
1611 ピーク数検出部
1612 ピーク周波数検出部
162 総合判定部
1621 連続音判定部
1622 間欠音判定部
163 メモリ部

Claims (6)

  1. 入力された音響信号を周波数スペクトルに変換する第一FFT部と、
    上記周波数スペクトルから対数パワースペクトルを計算する対数パワースペクトル計算部と、
    上記対数パワースペクトルをケプストラムに変換する逆FFT部と、
    あらかじめ定めた窓関数を用いて上記ケプストラムに重み付けした重み付きケプストラムを生成する窓かけ部と、
    上記重み付きケプストラムを周波数領域に変換した強調スペクトルを生成する第二FFT部と、
    あらかじめ定めた周波数帯域内の各周波数に対応する上記強調スペクトルの値をあらかじめ定めた閾値と比較して報知音の感知を示す感知結果を出力する判定部と、
    を含み、
    上記判定部は、
    上記周波数帯域内の各周波数に対応する上記強調スペクトルの値を周波数の昇順又は降順に上記閾値と比較して、上記閾値を超えた周波数から上記閾値を超えない状態になる直前の周波数までを1つのピークとしてピーク数を求めるピーク数検出部と、
    上記ピークについて上記閾値を超えた周波数と上記閾値を超えない状態になる直前の周波数との間の周波数からピーク中心周波数を求めるピーク周波数検出部と、
    上記ピーク数及び上記ピーク中心周波数を蓄積して上記ピーク数及び上記ピーク中心周波数の時系列を出力するメモリ部と、
    上記ピーク数及び上記ピーク中心周波数の時系列を検証して、特定の周波数にパワーが集中する音が連続する連続音が発生したかどうかを判定する連続音判定部と、
    上記ピーク数及び上記ピーク中心周波数の時系列を検証して、特定の周波数にパワーが集中する音が間欠的に継続する間欠音が発生したかどうかを判定する間欠音判定部と、
    を含み、
    上記間欠音判定部は、
    所定の時間内に所定の数以上のフレームで上記ピーク数an及び上記ピーク中心周波数akが0以外で同一の値であるとき、
    もしくは、
    所定の時間内でピーク数an及びピーク中心周波数akが0以外で同一のフレームの組を抽出し、当該フレーム間の時間差が所定の値以下の場合に、所定の数以上のフレームで連続して上記ピーク数anが1以上のとき、
    もしくは、
    所定の時間内でピーク数an及びピーク中心周波数akが0以外で同一のフレームの組を抽出し、当該フレーム間の時間差が所定の値以下の場合に、所定の時間内に所定の数以上のフレームで上記ピーク数anが1以上のとき、
    上記間欠音が発生したと判定するものである
    報知音感知装置。
  2. 請求項1に記載の報知音感知装置であって、
    上記連続音判定部は、
    所定の数以上のフレームで連続して上記ピーク数anが1以上のとき、
    もしくは、
    所定の時間内に所定の数以上のフレームで上記ピーク数anが1以上のとき、
    上記連続音が発生したと判定するものである
    報知音感知装置。
  3. 請求項1又は2に記載の報知音感知装置であって、
    上記判定部は、上記連続音判定部において、上記連続音が発生したと判定されなかった場合に、上記間欠音判定部において、上記間欠音が発生したかどうかを判定して上記感知結果を出力する総合判定部をさらに含む
    報知音感知装置。
  4. 請求項3に記載の報知音感知装置であって、
    上記総合判定部は、上記周波数帯域の範囲外の周波数において上記強調スペクトルの値が上記閾値を超えるときは検証の対象から除外するものである
    報知音感知装置。
  5. 入力された音響信号を周波数スペクトルに変換する第一FFTステップと、
    上記周波数スペクトルから対数パワースペクトルを計算する対数パワースペクトル計算ステップと、
    上記対数パワースペクトルをケプストラムに変換する逆FFTステップと、
    あらかじめ定めた窓関数を用いて上記ケプストラムに重み付けした重み付きケプストラムを生成する窓かけステップと、
    上記重み付きケプストラムを周波数領域に変換した強調スペクトルを生成する第二FFTステップと、
    あらかじめ定めた周波数帯域内の各周波数に対応する上記強調スペクトルの値をあらかじめ定めた閾値と比較して報知音の感知を示す感知結果を出力する判定ステップと、
    を含み、
    上記判定ステップは、
    上記周波数帯域内の各周波数に対応する上記強調スペクトルの値を周波数の昇順又は降順に上記閾値と比較して、上記閾値を超えた周波数から上記閾値を超えない状態になる直前の周波数までを1つのピークとしてピーク数を求めるピーク数検出ステップと、
    上記ピークについて上記閾値を超えた周波数と上記閾値を超えない状態になる直前の周波数との間の周波数からピーク中心周波数を求めるピーク周波数検出ステップと、
    上記ピーク数及び上記ピーク中心周波数を蓄積して上記ピーク数及び上記ピーク中心周波数の時系列を出力するメモリステップと、
    上記ピーク数及び上記ピーク中心周波数の時系列を検証して、特定の周波数にパワーが集中する音が連続する連続音が発生したかどうかを判定する連続音判定ステップと、
    上記ピーク数及び上記ピーク中心周波数の時系列を検証して、特定の周波数にパワーが集中する音が間欠的に継続する間欠音が発生したかどうかを判定する間欠音判定ステップと、
    を含み、
    上記間欠音判定ステップは、
    所定の時間内に所定の数以上のフレームで上記ピーク数an及び上記ピーク中心周波数akが0以外で同一の値であるとき、
    もしくは、
    所定の時間内でピーク数an及びピーク中心周波数akが0以外で同一のフレームの組を抽出し、当該フレーム間の時間差が所定の値以下の場合に、所定の数以上のフレームで連続して上記ピーク数anが1以上のとき、
    もしくは、
    所定の時間内でピーク数an及びピーク中心周波数akが0以外で同一のフレームの組を抽出し、当該フレーム間の時間差が所定の値以下の場合に、所定の時間内に所定の数以上のフレームで上記ピーク数anが1以上のとき、
    上記間欠音が発生したと判定する
    報知音感知方法。
  6. 請求項1からのいずれかに記載の報知音感知装置としてコンピュータを機能させるためのプログラム。
JP2014089043A 2014-04-23 2014-04-23 報知音感知装置、報知音感知方法及びプログラム Active JP6294747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014089043A JP6294747B2 (ja) 2014-04-23 2014-04-23 報知音感知装置、報知音感知方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014089043A JP6294747B2 (ja) 2014-04-23 2014-04-23 報知音感知装置、報知音感知方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2015206974A JP2015206974A (ja) 2015-11-19
JP6294747B2 true JP6294747B2 (ja) 2018-03-14

Family

ID=54603798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014089043A Active JP6294747B2 (ja) 2014-04-23 2014-04-23 報知音感知装置、報知音感知方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6294747B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017151650A1 (en) 2016-02-29 2017-09-08 Littrell Robert J A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus
WO2020186260A1 (en) 2019-03-14 2020-09-17 Vesper Technologies Inc. A piezoelectric mems device with an adaptive threshold for detection of an acoustic stimulus
US11617048B2 (en) 2019-03-14 2023-03-28 Qualcomm Incorporated Microphone having a digital output determined at different power consumption levels
JP7250329B2 (ja) * 2019-06-24 2023-04-03 日本キャステム株式会社 報知音検出装置および報知音検出方法
US11726105B2 (en) 2019-06-26 2023-08-15 Qualcomm Incorporated Piezoelectric accelerometer with wake function
JP6759479B1 (ja) * 2020-03-24 2020-09-23 株式会社 日立産業制御ソリューションズ 音響分析支援システム、及び音響分析支援方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0883090A (ja) * 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 環境音検出装置
JP2007047422A (ja) * 2005-08-09 2007-02-22 Kazuhiro Fuchi 音声分析合成装置および音声分析合成方法
JP2011027972A (ja) * 2009-07-24 2011-02-10 Fujitsu Ltd 信号処理装置、信号処理方法、及び信号処理プログラム
JP2011087118A (ja) * 2009-10-15 2011-04-28 Sony Corp 音声処理装置、音声処理方法、およびプログラム
JP5874431B2 (ja) * 2012-02-20 2016-03-02 株式会社Jvcケンウッド 報知音検出装置、雑音信号抑制装置、報知音検出方法、雑音信号抑制方法

Also Published As

Publication number Publication date
JP2015206974A (ja) 2015-11-19

Similar Documents

Publication Publication Date Title
JP6294747B2 (ja) 報知音感知装置、報知音感知方法及びプログラム
JP6257063B2 (ja) 周囲雑音二乗平均平方根(rms)検出器
US20190087153A1 (en) Audio User Interface Apparatus And Method
US11941968B2 (en) Systems and methods for identifying an acoustic source based on observed sound
US9959886B2 (en) Spectral comb voice activity detection
US20140337021A1 (en) Systems and methods for noise characteristic dependent speech enhancement
GB2581596A (en) Headset on ear state detection
JP2008185834A (ja) 音響判定方法、音響判定装置及びコンピュータプログラム
JP6367691B2 (ja) 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム
WO2018031302A1 (en) Vowel sensing voice activity detector
CN105118522B (zh) 噪声检测方法及装置
US11895474B2 (en) Activity detection on devices with multi-modal sensing
US20210208664A1 (en) Methods and apparatus to detect proximity of objects to computing devices using near ultrasonic sound waves
AU2022275486B2 (en) Methods and apparatus to fingerprint an audio signal via normalization
US11120795B2 (en) Noise cancellation
US20180003818A1 (en) Method and apparatus for space status detection based on acoustic chirp signals
KR101722686B1 (ko) 벨소리 출력 장치 및 방법
JP6337752B2 (ja) 乳幼児泣き声検出装置
JP2011053557A (ja) 悲鳴検出装置および悲鳴検出方法
JP7250329B2 (ja) 報知音検出装置および報知音検出方法
JP2015161718A (ja) 発話検出装置、発話検出方法及び発話検出プログラム
CN108520755B (zh) 一种检测方法及装置
CN113990338A (zh) 一种音频处理方法及装置
JP2016158072A (ja) 集音装置、音声処理方法、および音声処理プログラム
JP2013153338A (ja) アラーム装置、携帯端末、およびアラーム音の停止方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170711

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180216

R150 Certificate of patent or registration of utility model

Ref document number: 6294747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150