JP5459220B2 - 発話音声検出装置 - Google Patents
発話音声検出装置 Download PDFInfo
- Publication number
- JP5459220B2 JP5459220B2 JP2010540300A JP2010540300A JP5459220B2 JP 5459220 B2 JP5459220 B2 JP 5459220B2 JP 2010540300 A JP2010540300 A JP 2010540300A JP 2010540300 A JP2010540300 A JP 2010540300A JP 5459220 B2 JP5459220 B2 JP 5459220B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input power
- frequency
- power
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
入力された音声信号を受け付ける音声受付手段と、
上記音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う入力パワー算出手段と、
周波数と、その周波数に対して上記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行う補正関数推定手段と、
周波数毎に、上記推定された補正関数により規定される関係に従って取得される補正係数を、上記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行う入力パワー補正手段と、
上記補正された入力パワーに基づいて、上記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う発話音声検出手段と、
を備える。
入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行い、
周波数と、その周波数に対して上記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行い、
周波数毎に、上記推定された補正関数により規定される関係に従って取得される補正係数を、上記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行い、
上記補正された入力パワーに基づいて、上記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う、方法である。
情報処理装置に、
入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う入力パワー算出手段と、
周波数と、その周波数に対して上記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行う補正関数推定手段と、
周波数毎に、上記推定された補正関数により規定される関係に従って取得される補正係数を、上記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行う入力パワー補正手段と、
上記補正された入力パワーに基づいて、上記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う発話音声検出手段と、
を実現させるためのプログラムである。
図1に示したように、第1実施形態に係る発話音声検出装置1は、情報処理装置である。発話音声検出装置1は、図示しない中央処理装置(CPU;Central Processing Unit)、記憶装置(メモリ及びハードディスク駆動装置(HDD))、及び、入力装置を備える。
発話音声検出装置1のCPUは、図2にフローチャートにより示した発話音声検出プログラムを、所定の演算周期が経過する毎に実行するようになっている。
いま、受け付けた音声信号が白色雑音を表す音声信号である場合を想定して説明を続ける。この場合、発話音声検出装置1は、複数のマイクロフォンMC1〜MCLのそれぞれに対して補正関数を推定する補正関数推定処理(記憶装置に記憶されている補正係数fiを更新する処理)を行う。
このようにして、CPUは、周波数毎に、雑音パワーNi(t)を複数のマイクロフォンMC1〜MCLのそれぞれに対して取得する。
これによれば、多項式関数の次数Mを調整することにより、周波数の変化に対する、補正係数fiの変化の滑らかさの程度を調整することができる。
次に、本発明の第2実施形態に係る発話音声検出装置について図4を参照しながら説明する。
第2実施形態に係る発話音声検出装置1の機能は、音声受付部(音声受付手段)18と、入力パワー算出部(入力パワー算出手段)11と、入力パワー補正部(入力パワー補正手段)12と、補正関数推定部(補正関数推定手段)14と、発話音声検出部(発話音声検出手段)16と、を含む。
入力パワー算出部11は、音声受付部18により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う。
を備える。
上記補正関数推定手段は、上記補正された入力パワーと、上記基準パワーと、の差を二乗した値の、所定の周波数の範囲にわたる和を最小とする上記補正関数を推定するように構成されることが好適である。
上記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得する雑音パワー取得手段と、
周波数毎に、上記補正された入力パワーを上記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得する信号対雑音比取得手段と、を含むとともに、
上記取得された信号対雑音比が予め設定された閾値よりも大きい場合、上記受け付けられた音声信号が表す音声が発話音声であると判定するように構成されることが好適である。
上記信号対雑音比取得手段は、上記算出された周波数毎信号対雑音比の最大値を上記信号対雑音比として取得するように構成されることが好適である。
上記音声受付手段を複数備えるとともに、
上記入力パワー算出手段は、上記入力パワー算出処理を上記複数の音声受付手段のそれぞれに対して行うように構成され、
上記補正関数推定手段は、上記補正関数推定処理を上記複数の音声受付手段のそれぞれに対して行うように構成され、
上記入力パワー補正手段は、上記入力パワー補正処理を上記複数の音声受付手段のそれぞれに対して行うように構成され、
上記発話音声検出手段は、
上記発話音声検出処理を上記複数の音声受付手段のそれぞれに対して行うように構成されるとともに、周波数毎に、上記入力パワー補正手段により上記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最大の入力パワーを算出する基となった音声信号を受け付けた音声受付手段に対する雑音パワーとして、上記入力パワー補正手段により上記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最小の入力パワーを用いるように構成されることが好適である。
周波数毎に、上記入力パワー補正手段により上記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最大の入力パワーを算出する基となった音声信号を受け付けた音声受付手段以外の音声受付手段に対する雑音パワーとして、上記入力パワー補正手段により当該音声受付手段に対して補正された入力パワーを用いるように構成されることが好適である。
上記入力パワー算出手段は、上記音声受付手段により受け付けられた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して上記入力パワーを周波数毎に算出するように構成され、
上記発話音声検出装置は、
上記入力パワー算出手段により上記音声信号の各部分に対して算出された入力パワーを平均した時間平均パワーを算出する時間平均パワー算出処理を、上記複数の音声受付手段のそれぞれに対して行う時間平均パワー算出手段を備え、
上記補正関数推定手段は、周波数と、その周波数に対して上記算出された時間平均パワーを、上記時間平均パワー算出手段により上記複数の音声受付手段の1つに対して算出され且つその周波数に対して算出された時間平均パワーに近づけるための補正係数と、の関係を規定する上記補正関数を推定する上記補正関数推定処理を上記複数の音声受付手段のそれぞれに対して行うように構成されることが好適である。
上記補正関数推定手段は、上記入力パワー算出手段により上記複数の音声受付手段のそれぞれに対して算出された入力パワーを平均した平均パワーを上記基準パワーとして用いるように構成されることが好適である。
上記入力パワー算出手段は、上記音声受付手段により受け付けられた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して上記入力パワーを周波数毎に算出するように構成され、
上記発話音声検出装置は、
上記入力パワー算出手段により上記音声信号の各部分に対して算出された入力パワーを平均した時間平均パワーを算出する時間平均パワー算出処理を、上記複数の音声受付手段のそれぞれに対して行う時間平均パワー算出手段を備え、
上記補正関数推定手段は、周波数と、その周波数に対して上記算出された時間平均パワーを、上記時間平均パワー算出手段により上記複数の音声受付手段のそれぞれに対して算出され且つその周波数に対して算出された時間平均パワーを平均した平均時間平均パワーに近づけるための補正係数と、の関係を規定する上記補正関数を推定する上記補正関数推定処理を上記複数の音声受付手段のそれぞれに対して行うように構成されることが好適である。
入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行い、
周波数と、その周波数に対して上記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行い、
周波数毎に、上記推定された補正関数により規定される関係に従って取得される補正係数を、上記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行い、
上記補正された入力パワーに基づいて、上記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う、方法である。
上記補正された入力パワーと、上記基準パワーと、の差を二乗した値の、所定の周波数の範囲にわたる和を最小とする上記補正関数を推定するように構成されることが好適である。
上記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得し、
周波数毎に、上記補正された入力パワーを上記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得し、
上記取得された信号対雑音比が予め設定された閾値よりも大きい場合、上記受け付けられた音声信号が表す音声が発話音声であると判定するように構成されることが好適である。
情報処理装置に、
入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う入力パワー算出手段と、
周波数と、その周波数に対して上記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行う補正関数推定手段と、
周波数毎に、上記推定された補正関数により規定される関係に従って取得される補正係数を、上記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行う入力パワー補正手段と、
上記補正された入力パワーに基づいて、上記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う発話音声検出手段と、
を実現させるためのプログラムである。
上記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得する雑音パワー取得手段と、
周波数毎に、上記補正された入力パワーを上記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得する信号対雑音比取得手段と、を含むとともに、
上記取得された信号対雑音比が予め設定された閾値よりも大きい場合、上記受け付けられた音声信号が表す音声が発話音声であると判定するように構成されることが好適である。
11 入力パワー算出部
12 入力パワー補正部
13 時間平均パワー算出部
14 補正関数推定部
15 補正関数記憶部
16 発話音声検出部
16a 雑音パワー取得部
16b 信号対雑音比取得部
18 音声受付部
MC1〜MCL マイクロフォン
Claims (22)
- 入力された音声信号を受け付ける音声受付手段と、
前記音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う入力パワー算出手段と、
周波数と、その周波数に対して前記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行う補正関数推定手段と、
周波数毎に、前記推定された補正関数により規定される関係に従って取得される補正係数を、前記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行う入力パワー補正手段と、
前記補正された入力パワーに基づいて、前記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う発話音声検出手段と、
を備える発話音声検出装置。 - 請求項1に記載の発話音声検出装置であって、
前記補正関数は、周波数を変数とする多項式関数である発話音声検出装置。 - 請求項1又は請求項2に記載の発話音声検出装置であって、
前記補正関数推定手段は、前記補正された入力パワーと、前記基準パワーと、の差を二乗した値の、所定の周波数の範囲にわたる和を最小とする前記補正関数を推定するように構成された発話音声検出装置。 - 請求項1乃至請求項3のいずれか一項に記載の発話音声検出装置であって、
前記発話音声検出手段は、
前記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得する雑音パワー取得手段と、
周波数毎に、前記補正された入力パワーを前記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得する信号対雑音比取得手段と、を含むとともに、
前記取得された信号対雑音比が予め設定された閾値よりも大きい場合、前記受け付けられた音声信号が表す音声が発話音声であると判定するように構成された発話音声検出装置。 - 請求項4に記載の発話音声検出装置であって、
前記信号対雑音比取得手段は、前記算出された周波数毎信号対雑音比の、所定の周波数の範囲にわたる和を前記信号対雑音比として取得するように構成された発話音声検出装置。 - 請求項4に記載の発話音声検出装置であって、
前記信号対雑音比取得手段は、前記算出された周波数毎信号対雑音比の最大値を前記信号対雑音比として取得するように構成された発話音声検出装置。 - 請求項4乃至請求項6のいずれか一項に記載の発話音声検出装置であって、
前記音声受付手段を複数備えるとともに、
前記入力パワー算出手段は、前記入力パワー算出処理を前記複数の音声受付手段のそれぞれに対して行うように構成され、
前記補正関数推定手段は、前記補正関数推定処理を前記複数の音声受付手段のそれぞれに対して行うように構成され、
前記入力パワー補正手段は、前記入力パワー補正処理を前記複数の音声受付手段のそれぞれに対して行うように構成され、
前記発話音声検出手段は、
前記発話音声検出処理を前記複数の音声受付手段のそれぞれに対して行うように構成されるとともに、周波数毎に、前記入力パワー補正手段により前記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最大の入力パワーを算出する基となった音声信号を受け付けた音声受付手段に対する雑音パワーとして、前記入力パワー補正手段により前記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最小の入力パワーを用いるように構成された発話音声検出装置。 - 請求項7に記載の発話音声検出装置であって、
前記発話音声検出手段は、
周波数毎に、前記入力パワー補正手段により前記複数の音声受付手段のそれぞれに対して補正された入力パワーのうちの最大の入力パワーを算出する基となった音声信号を受け付けた音声受付手段以外の音声受付手段に対する雑音パワーとして、前記入力パワー補正手段により当該音声受付手段に対して補正された入力パワーを用いるように構成された発話音声検出装置。 - 請求項7又は請求項8に記載の発話音声検出装置であって、
前記補正関数推定手段は、前記入力パワー算出手段により前記複数の音声受付手段の1つに対して算出された入力パワーを前記基準パワーとして用いるように構成された発話音声検出装置。 - 請求項9に記載の発話音声検出装置であって、
前記入力パワー算出手段は、前記音声受付手段により受け付けられた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して前記入力パワーを周波数毎に算出するように構成され、
前記発話音声検出装置は、
前記入力パワー算出手段により前記音声信号の各部分に対して算出された入力パワーを平均した時間平均パワーを算出する時間平均パワー算出処理を、前記複数の音声受付手段のそれぞれに対して行う時間平均パワー算出手段を備え、
前記補正関数推定手段は、周波数と、その周波数に対して前記算出された時間平均パワーを、前記時間平均パワー算出手段により前記複数の音声受付手段の1つに対して算出され且つその周波数に対して算出された時間平均パワーに近づけるための補正係数と、の関係を規定する前記補正関数を推定する前記補正関数推定処理を前記複数の音声受付手段のそれぞれに対して行うように構成された発話音声検出装置。 - 請求項7又は請求項8に記載の発話音声検出装置であって、
前記補正関数推定手段は、前記入力パワー算出手段により前記複数の音声受付手段のそれぞれに対して算出された入力パワーを平均した平均パワーを前記基準パワーとして用いるように構成された発話音声検出装置。 - 請求項11に記載の発話音声検出装置であって、
前記入力パワー算出手段は、前記音声受付手段により受け付けられた音声信号を所定のフレーム間隔毎に分割し、当該分割された各部分に対して前記入力パワーを周波数毎に算出するように構成され、
前記発話音声検出装置は、
前記入力パワー算出手段により前記音声信号の各部分に対して算出された入力パワーを平均した時間平均パワーを算出する時間平均パワー算出処理を、前記複数の音声受付手段のそれぞれに対して行う時間平均パワー算出手段を備え、
前記補正関数推定手段は、周波数と、その周波数に対して前記算出された時間平均パワーを、前記時間平均パワー算出手段により前記複数の音声受付手段のそれぞれに対して算出され且つその周波数に対して算出された時間平均パワーを平均した平均時間平均パワーに近づけるための補正係数と、の関係を規定する前記補正関数を推定する前記補正関数推定処理を前記複数の音声受付手段のそれぞれに対して行うように構成された発話音声検出装置。 - 請求項1乃至請求項12のいずれか一項に記載の発話音声検出装置であって、
前記補正関数推定手段は、予め記憶された値を前記基準パワーとして用いるように構成された発話音声検出装置。 - 請求項1乃至請求項13のいずれか一項に記載の発話音声検出装置であって、
前記補正関数推定手段は、前記音声受付手段により受け付けられた音声信号が表す音声が白色雑音である場合、前記補正関数を推定するように構成された発話音声検出装置。 - 入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行い、
周波数と、その周波数に対して前記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行い、
周波数毎に、前記推定された補正関数により規定される関係に従って取得される補正係数を、前記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行い、
前記補正された入力パワーに基づいて、前記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う、発話音声検出方法。 - 請求項15に記載の発話音声検出方法であって、
前記補正関数は、周波数を変数とする多項式関数である発話音声検出方法。 - 請求項15又は請求項16に記載の発話音声検出方法であって、
前記補正された入力パワーと、前記基準パワーと、の差を二乗した値の、所定の周波数の範囲にわたる和を最小とする前記補正関数を推定するように構成された発話音声検出方法。 - 請求項15乃至請求項17のいずれか一項に記載の発話音声検出方法であって、
前記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得し、
周波数毎に、前記補正された入力パワーを前記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得し、
前記取得された信号対雑音比が予め設定された閾値よりも大きい場合、前記受け付けられた音声信号が表す音声が発話音声であると判定するように構成された発話音声検出方法。 - 情報処理装置に、
入力された音声信号を受け付ける音声受付手段により受け付けられた音声信号に基づいて、その音声信号が表す音声の大きさを表す入力パワーを周波数毎に算出する入力パワー算出処理を行う入力パワー算出手段と、
周波数と、その周波数に対して前記算出された入力パワーをその周波数に対して定められた基準パワーに近づけるための補正係数と、の関係を規定する連続関数である補正関数を推定する補正関数推定処理を行う補正関数推定手段と、
周波数毎に、前記推定された補正関数により規定される関係に従って取得される補正係数を、前記算出された入力パワーに乗じることにより、当該入力パワーを補正する入力パワー補正処理を行う入力パワー補正手段と、
前記補正された入力パワーに基づいて、前記受け付けられた音声信号が表す音声が発話音声であるか否かを判定する発話音声検出処理を行う発話音声検出手段と、
を実現させるための発話音声検出プログラム。 - 請求項19に記載の発話音声検出プログラムであって、
前記補正関数は、周波数を変数とする多項式関数である発話音声検出プログラム。 - 請求項19又は請求項20に記載の発話音声検出プログラムであって、
前記補正関数推定手段は、前記補正された入力パワーと、前記基準パワーと、の差を二乗した値の、所定の周波数の範囲にわたる和を最小とする前記補正関数を推定するように構成された発話音声検出プログラム。 - 請求項19乃至請求項21のいずれか一項に記載の発話音声検出プログラムであって、
前記発話音声検出手段は、
前記音声受付手段により受け付けられた音声信号が表す音声のうちの雑音の大きさを表す雑音パワーを周波数毎に取得する雑音パワー取得手段と、
周波数毎に、前記補正された入力パワーを前記取得された雑音パワーにより除することにより周波数毎信号対雑音比を算出し、当該算出した周波数毎信号対雑音比を代表する値である信号対雑音比を取得する信号対雑音比取得手段と、を含むとともに、
前記取得された信号対雑音比が予め設定された閾値よりも大きい場合、前記受け付けられた音声信号が表す音声が発話音声であると判定するように構成された発話音声検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010540300A JP5459220B2 (ja) | 2008-11-27 | 2009-09-03 | 発話音声検出装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008302242 | 2008-11-27 | ||
JP2008302242 | 2008-11-27 | ||
JP2010540300A JP5459220B2 (ja) | 2008-11-27 | 2009-09-03 | 発話音声検出装置 |
PCT/JP2009/004339 WO2010061505A1 (ja) | 2008-11-27 | 2009-09-03 | 発話音声検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010061505A1 JPWO2010061505A1 (ja) | 2012-04-19 |
JP5459220B2 true JP5459220B2 (ja) | 2014-04-02 |
Family
ID=42225397
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010540300A Active JP5459220B2 (ja) | 2008-11-27 | 2009-09-03 | 発話音声検出装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8856001B2 (ja) |
JP (1) | JP5459220B2 (ja) |
WO (1) | WO2010061505A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5494492B2 (ja) * | 2008-11-27 | 2014-05-14 | 日本電気株式会社 | 信号補正装置 |
CN105103230B (zh) * | 2013-04-11 | 2020-01-03 | 日本电气株式会社 | 信号处理装置、信号处理方法、信号处理程序 |
JP6244658B2 (ja) * | 2013-05-23 | 2017-12-13 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
US9685156B2 (en) * | 2015-03-12 | 2017-06-20 | Sony Mobile Communications Inc. | Low-power voice command detector |
CN106887241A (zh) | 2016-10-12 | 2017-06-23 | 阿里巴巴集团控股有限公司 | 一种语音信号检测方法与装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH075895A (ja) * | 1993-04-20 | 1995-01-10 | Clarion Co Ltd | 音声認識装置及び騒音環境での音声認識方法 |
JP2007068125A (ja) * | 2005-09-02 | 2007-03-15 | Nec Corp | 信号処理の方法及び装置並びにコンピュータプログラム |
JP2007328228A (ja) * | 2006-06-09 | 2007-12-20 | Sony Corp | 信号処理装置、信号処理方法、及びプログラム |
JP5134477B2 (ja) * | 2008-09-17 | 2013-01-30 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004111996A1 (ja) * | 2003-06-11 | 2004-12-23 | Matsushita Electric Industrial Co., Ltd. | 音響区間検出方法および装置 |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
JP4746533B2 (ja) | 2006-12-21 | 2011-08-10 | 日本電信電話株式会社 | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 |
-
2009
- 2009-09-03 JP JP2010540300A patent/JP5459220B2/ja active Active
- 2009-09-03 WO PCT/JP2009/004339 patent/WO2010061505A1/ja active Application Filing
- 2009-09-03 US US13/125,493 patent/US8856001B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH075895A (ja) * | 1993-04-20 | 1995-01-10 | Clarion Co Ltd | 音声認識装置及び騒音環境での音声認識方法 |
JP2007068125A (ja) * | 2005-09-02 | 2007-03-15 | Nec Corp | 信号処理の方法及び装置並びにコンピュータプログラム |
JP2007328228A (ja) * | 2006-06-09 | 2007-12-20 | Sony Corp | 信号処理装置、信号処理方法、及びプログラム |
JP5134477B2 (ja) * | 2008-09-17 | 2013-01-30 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US8856001B2 (en) | 2014-10-07 |
US20110202339A1 (en) | 2011-08-18 |
WO2010061505A1 (ja) | 2010-06-03 |
JPWO2010061505A1 (ja) | 2012-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100883712B1 (ko) | 음원 방향 추정 방법, 및 음원 방향 추정 장치 | |
JP5452655B2 (ja) | 音声状態モデルを使用したマルチセンサ音声高品質化 | |
JP5197458B2 (ja) | 受音信号処理装置、方法およびプログラム | |
JP5219522B2 (ja) | 音声明瞭度改善システム及び音声明瞭度改善方法 | |
EP2773137B1 (en) | Microphone sensitivity difference correction device | |
JP5381982B2 (ja) | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 | |
US8509451B2 (en) | Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP6668995B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
US20090232318A1 (en) | Output correcting device and method, and loudspeaker output correcting device and method | |
CN101640830A (zh) | 传输特性估算装置、噪声抑制装置以及传输特性估算方法 | |
JP5459220B2 (ja) | 発話音声検出装置 | |
US8259961B2 (en) | Audio processing apparatus and program | |
US20130156221A1 (en) | Signal processing apparatus and signal processing method | |
WO2020110228A1 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
JP5494492B2 (ja) | 信号補正装置 | |
JP5772591B2 (ja) | 音声信号処理装置 | |
US9659575B2 (en) | Signal processor and method therefor | |
US20130044890A1 (en) | Information processing device, information processing method and program | |
CN112133320A (zh) | 语音处理装置及语音处理方法 | |
JP6102144B2 (ja) | 音響信号処理装置、方法及びプログラム | |
JP2010102203A (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2003177783A (ja) | 音声認識装置、音声認識方式及び音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20120723 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131230 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5459220 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |