JP7385381B2 - 異常音検知システム、擬似音生成システム、および擬似音生成方法 - Google Patents
異常音検知システム、擬似音生成システム、および擬似音生成方法 Download PDFInfo
- Publication number
- JP7385381B2 JP7385381B2 JP2019115257A JP2019115257A JP7385381B2 JP 7385381 B2 JP7385381 B2 JP 7385381B2 JP 2019115257 A JP2019115257 A JP 2019115257A JP 2019115257 A JP2019115257 A JP 2019115257A JP 7385381 B2 JP7385381 B2 JP 7385381B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrogram
- pseudo
- mel
- statistics
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
マイクロホン101は設置した対象設備110の稼動音を、例えば所定の周期ごとに、またはユーザが指定した時刻ごとに、入力としてアナログ入力信号をAD変換器102に送る。
AD変換器102は入力されたアナログ入力信号をデジタル入力信号に変換し、音響監視端末103に送る。
音響監視端末103はデジタル入力信号を入力として、各周波数の振幅時系列の直流成分、周期成分、および、独立同分布成分それぞれの統計量(圧縮データ)に変換し、遠隔地の音響監視サーバ104に、無線ネットワークを含むネットワーク120を介して送る。
音響監視サーバ104は前記統計量を入力として、対象設備の稼動音を模擬した擬似音をデジタル出力信号としてDA変換器105に送る。
DA変換器105は入力されたデジタル出力信号をアナログ出力信号に変換し、ヘッドホン106に送り、ヘッドホン106から擬似音を出力する。
ここで、一般に人間の耳には実際の周波数の音がそのまま聞こえるわけではなく、ずれが生じ、可聴域の上限に近い音は実際の音よりも低めに聞こえる。このずれを人間の知覚する音の高さを測る尺度に調整した周波数をメル(尺度)周波数という。メル尺度で等間隔な特定の周波数帯のみを抽出するフィルタであるメルフィルタバンクを、パワースペクトログラムXに適用して、対数メルスペクトログラムYを計算する。
M行×T列の行列である対数メルスペクトログラムYの各成分値をy(m,t)と表すと、その時間差分信号Δは、M行×(T-1)列の行列となり、その成分値δy(m,t)=y(m,t)-y(m,t-1) と算出される。
統計量の組は、例えば、メル周波数ビンmの行の対数メルスペクトログラムYの各成分値y(m,t)の平均値μ(m)、標準偏差σ(m)、および、時間差分信号Δのメル周波数ビンmの行の各成分値δy(m,t)の標準偏差σΔ(m)である。平均値μ(m)は振幅時系列の直流成分を表し、標準偏差σ(m)は独立同分布成分を表す。σΔ(m) / σ(m)が振幅時系列の周期成分を表す。
この場合、統計量の組は、例えば、メル周波数ビンmの行の対数メルスペクトログラムYの各成分値y(m,t)の平均値μ(m)、および、y(m, t)に対する時間t方向のフーリエ変換によって得られる振幅スペクトラムが最大である交流成分の角周波数ω(m)、および、その振幅a(m)、および、残差e(m, t)の標準偏差σ_e(m)である。ただし、残差e(m, t)は数式(2)であらわされる。
ここで、擬似パワースペクトログラム^Xは周波数領域信号レベルであり、位相成分は消失しているので、Griffin-Limアルゴリズムを使用して位相成分を生成して時間領域の音響信号(時間領域擬似音)を復元する。
M行×T列の行列である擬似対数メルスペクトログラムZの各成分値をz(m,t)と表すと、その時間差分信号Δは、M行×(T-1)列の行列となり、その成分値δz(m,t)=z(m,t) - z(m,t-1) と算出される。
そして、その2M×(T-1)次元の行列の中から、2M×L次元の特徴量ベクトルを、1列ずつずらしながら、(T-L) 個{この場合には、例えば(T-L)通りある。}だけ抽出する。
正常音モデルデータベースに格納されるモデルパラメタは、例えばGMMの場合、Q個の各クラスタq = 1、・・・Qの平均ベクトル(2M×L次元)μq、各クラスタの共分散行列(2M×L×2M×L次元)Γq、各クラスタの重み係数(1次元)πqである。
音響監視端末103の異常検知部218で異常検知処理を実行する際に、正常音モデルデータベースから該当する正常音モデルが読み出されて送信される。
非定常成分除去部301は、パワー計算部203から送られたパワースペクトログラムXから非定常音を除去し、周期定常的な音のみを抽出し、対数メルスペクトログラム算出部204に送る。具体的な処理方法として、Harmonic/Percussive Sound Separation (HPSS) やNearest Neighbor filter (NN filter) を用いることができる。
擬似スペクトログラム直接復元部401は、ユーザが指定した時刻に対応するタイムスタンプの統計量の組をタイムスタンプ-統計量DB209から読み出し、読みだされた統計量の組 (μ(m)、σ(m)、σΔ(m)) から擬似パワースペクトログラム^Xを計算し、出力する。
擬似対数メルスペクトログラム生成部701は、統計量計算部206から送られた統計量の組 (μ(m)、σ(m)、σΔ(m)) から擬似対数メルスペクトログラムZを計算し、Δ(時間差分)計算部702に出力する。設備の稼動音が周期定常的な音であると仮定すれば、擬似対数メルスペクトログラムZの各成分z(m,t)は数式(1)で計算できる。
ただし、γは0~1の定数パラメタ、ω = 2 sin^-1 (0.5 σΔ(m) / σ(m))、 φは任意、rは正規分布N(0, σ(m))に従う確率変数である。
102 AD変換器
103 音響監視端末
104 音響監視サーバ
105 DA変換器
106 ヘッドホン
110 対象設備
120 ネットワーク
201 音響信号録音部
202 周波数変換部
203 パワー計算部
204 対数メルスペクトログラム算出部
205 Δ(時間差分)計算部
206 統計量計算部
207 統計量送信部
208 統計量受信部
209 タイムスタンプ-統計量DB
210 擬似対数メルスペクトログラム生成部
211 擬似スペクトログラム復元部
212 周波数-時間領域変換部
213 擬似音再生部
214 Δ(時間差分)計算部
215 特徴量ベクトル作成部
216 正常音モデル学習部
217 特徴量ベクトル作成部
218 異常検知部
219 異常通知部
220 異常表示部
301 非定常成分除去部
401 擬似スペクトログラム直接復元部
402 対数メルスペクトログラム算出部
501 振幅時系列位相の抽出
601 ランダム位相生成部
701 擬似対数メルスペクトログラム生成部
702 Δ(時間差分)計算部
Claims (8)
- 音データに含まれる異常音を判定する異常音検知システムであって、前記異常音検知システムは、端末と、サーバと、を有し、
前記端末は:
前記音データを入力して、メル周波数ビンごとに、対数メルスペクトログラムを算出する対数メルスペクトログラム算出部と、
対数メルスペクトログラムのメル周波数ビンごとの時間方向の平均値、メル周波数ビンごとの時間方向の標準偏差、対数メルスペクトログラムのメル周波数ビンごとに、時間方向の差分をとった標準偏差のそれぞれの大きさを表す統計量の組を計算する統計量計算部と、
前記統計量の組を送信する統計量送信部と、
を有し、
前記サーバは:
前記統計量の組を受信する統計量受信部と、
前記統計量の組から生成した擬似対数メルスペクトログラムから、特徴量ベクトルを抽出する特徴量ベクトル生成部と、
前記特徴量ベクトルを用いて正常音モデルを学習する正常音モデル学習部と、
を有し、
前記端末が、前記対数メルスペクトログラムから特徴量ベクトルを抽出し、前記サーバから正常音モデルを受信し、前記特徴量ベクトルが前記正常音モデルから生成される確率または距離に相当する値を算出し、該確率または距離に相当する値に基づいて異常音を含む否かを判定して前記サーバへ報告することを特徴とする異常音検知システム。 - 前記端末の前記対数メルスペクトログラム算出部の前段に、入力した前記音データから生成したパワースペクトログラムから非定常音を除去し、周期定常的な音を抽出する非定常成分除去部を更に備えることを特徴とする請求項1に記載の異常音検知システム。
- 前記端末が、前記統計量計算部が算出した統計量の組から擬似対数メルスペクトログラムを生成して、前記擬似対数メルスペクトログラムとその時間差分信号の組から特徴量ベクトルを抽出し、前記サーバから正常音モデルを受信し、前記特徴量ベクトルが前記正常音モデルから生成される確率を算出し、該確率が所定の確率未満であれば異常音を含むと判定して前記サーバへ報告することを特徴とする請求項1に記載の異常音検知システム。
- 擬似音生成システムは、端末と、サーバと、を有し、
前記端末は:
音データを入力して、メル周波数ビンごとに、対数メルスペクトログラムを算出する対数メルスペクトログラム算出部と、
対数メルスペクトログラムのメル周波数ビンごとの時間方向の平均値、メル周波数ビンごとの時間方向の標準偏差、対数メルスペクトログラムのメル周波数ビンごとに、時間方向の差分をとった標準偏差のそれぞれの大きさを表す統計量の組を計算する統計量計算部と、
前記統計量の組を送信する統計量送信部と、
を有し、
前記サーバは:
前記統計量の組を受信する統計量受信部と、
前記統計量の組から生成した擬似対数メルスペクトログラムに対してメルフィルタバンクの擬似逆行列を乗算して擬似パワースペクトログラムを算出する擬似スペクトログラム復元部と、
前記擬似パワースペクトログラムに各周波数の位相成分を生成して組合せて時間領域のデジタル出力信号を出力する周波数-時間領域変換部と、
前記時間領域のデジタル出力信号を再生する擬似音再生部と、を有することを特徴とする擬似音生成システム。 - 前記端末の前記対数メルスペクトログラム算出部の前段に、入力した前記音データから生成したパワースペクトログラムから非定常音を除去し、周期定常的な音を抽出する非定常成分除去部を更に備えることを特徴とする請求項4に記載の擬似音生成システム。
- 前記サーバにおいて、
事前に診断対象の設備から録音した非圧縮の稼動音、および、対数メルスペクトログラムのメル周波数ビンごとの時間方向の平均値、メル周波数ビンごとの時間方向の標準偏差、対数メルスペクトログラムのメル周波数ビンごとに、時間方向の差分をとった標準偏差を表す統計量の組に基づいて、統計量の組から非圧縮の音のスペクトログラムへの写像を学習し、
学習した写像に基づいて、サーバが受信した統計量の組から擬似パワースペクトログラムを生成する擬似スペクトログラム直接復元部を更に備えることを特徴とする請求項4に記載の擬似音生成システム。 - 前記学習した写像は、多層ニューラルネットワークでモデル化され、ランダム位相生成部が各周波数kの位相φ(k)をランダムに生成し、多層ニューラルネットワークの中間層の各周波数kの分岐の後ろの素子に入力する構成となることを特徴とする請求項6に記載の擬似音生成システム。
- マイクロホン、AD変換器を備えた端末が、
入力した音響信号からパワースペクトログラムを計算し、
前記パワースペクトログラムからメル周波数ビンごとに、対数メルスペクトログラムを算出し、
前記対数メルスペクトログラムのメル周波数ビンごとの時間方向の平均値、メル周波数ビンごとの時間方向の標準偏差、対数メルスペクトログラムの時間方向のメル周波数ビンごとに、差分をとった標準偏差のそれぞれの大きさを表す統計量の組を計算し、
前記統計量の組をサーバへ送信し、
前記サーバが、
前記統計量の組を前記端末から受信し、
前記統計量の組から擬似対数メルスペクトログラムを生成し、
前記擬似対数メルスペクトログラムに対してメルフィルタバンクの擬似逆行列を乗算して擬似パワースペクトログラムを算出し、
前記擬似パワースペクトログラムに各周波数の位相成分を生成して組合せて時間領域のデジタル出力信号を生成し、
前記時間領域のデジタル出力信号を擬似音として再生する、
ことを特徴とする擬似音生成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019115257A JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
CN202010459129.4A CN112116924B (zh) | 2019-06-21 | 2020-05-27 | 异常音检测系统、伪音生成系统及伪音生成方法 |
US16/892,936 US11164594B2 (en) | 2019-06-21 | 2020-06-04 | Abnormal sound detection system, artificial sound creation system, and artificial sound creating method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019115257A JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021001964A JP2021001964A (ja) | 2021-01-07 |
JP7385381B2 true JP7385381B2 (ja) | 2023-11-22 |
Family
ID=73798897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019115257A Active JP7385381B2 (ja) | 2019-06-21 | 2019-06-21 | 異常音検知システム、擬似音生成システム、および擬似音生成方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11164594B2 (ja) |
JP (1) | JP7385381B2 (ja) |
CN (1) | CN112116924B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112397055B (zh) * | 2021-01-19 | 2021-07-27 | 北京家人智能科技有限公司 | 一种异常声音检测方法、装置和电子设备 |
CN112767960B (zh) * | 2021-02-05 | 2022-04-26 | 云从科技集团股份有限公司 | 一种音频降噪方法、系统、设备及介质 |
CN113077810A (zh) * | 2021-03-19 | 2021-07-06 | 杨予诺 | 一种基于β-VAE算法的声源分离方法 |
CN113488072A (zh) * | 2021-06-10 | 2021-10-08 | 东台科创机械实业有限公司 | 一种无线检测车辆异响的装置和方法 |
CN113326899A (zh) * | 2021-06-29 | 2021-08-31 | 西藏新好科技有限公司 | 一种基于深度学习模型的仔猪被压检测方法 |
CN113724725B (zh) * | 2021-11-04 | 2022-01-18 | 北京百瑞互联技术有限公司 | 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 |
CN114299907B (zh) * | 2022-01-19 | 2024-07-05 | 东风汽车集团股份有限公司 | 一种减振器总成异响检测方法 |
CN116825131A (zh) * | 2022-06-24 | 2023-09-29 | 南方电网调峰调频发电有限公司储能科研院 | 融合频带自向下注意力机制的电厂设备状态听觉监测方法 |
CN114927141B (zh) * | 2022-07-19 | 2022-10-25 | 中国人民解放军海军工程大学 | 异常水声信号的检测方法及系统 |
CN115424635B (zh) * | 2022-11-03 | 2023-02-10 | 南京凯盛国际工程有限公司 | 一种基于声音特征的水泥厂设备故障诊断方法 |
CN116222997B (zh) * | 2023-03-07 | 2024-04-05 | 华北电力大学(保定) | 基于波束形成及时空网络的托辊故障声源距离估计方法 |
CN117059128B (zh) * | 2023-09-04 | 2025-01-17 | 深圳远大科技工程有限公司 | 基于声音识别的机房异常监测方法 |
CN118230758B (zh) * | 2024-05-27 | 2024-08-09 | 崂山国家实验室 | 基于编码器与卷积融合的水声目标识别方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002140090A (ja) | 2000-11-02 | 2002-05-17 | Toshiba Corp | 異常監視装置 |
JP2002257625A (ja) | 2001-03-06 | 2002-09-11 | Kobe Steel Ltd | 異常診断装置 |
JP2003501925A (ja) | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2009175077A (ja) | 2008-01-28 | 2009-08-06 | Koga:Kk | 異音判定装置 |
WO2018150616A1 (ja) | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 異常音検出装置、異常度計算装置、異常音生成装置、異常音検出学習装置、異常信号検出装置、異常信号検出学習装置、これらの方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09166483A (ja) * | 1995-12-19 | 1997-06-24 | Hitachi Ltd | 機器監視方法及びその装置 |
CN101236742B (zh) * | 2008-03-03 | 2011-08-10 | 中兴通讯股份有限公司 | 音乐/非音乐的实时检测方法和装置 |
US10026407B1 (en) * | 2010-12-17 | 2018-07-17 | Arrowhead Center, Inc. | Low bit-rate speech coding through quantization of mel-frequency cepstral coefficients |
JP5572541B2 (ja) | 2010-12-27 | 2014-08-13 | 株式会社日立超エル・エス・アイ・システムズ | ビデオエンコーダシステム |
CN102664006B (zh) * | 2012-04-14 | 2014-05-14 | 中国人民解放军国防科学技术大学 | 基于时频域分析的异常人声检测方法 |
CN104392717A (zh) * | 2014-12-08 | 2015-03-04 | 常州工学院 | 一种基于声道谱高斯混合建模的快速语音转换系统及其方法 |
JP6420198B2 (ja) * | 2015-04-23 | 2018-11-07 | 日本電信電話株式会社 | 閾値推定装置、音声合成装置、その方法及びプログラム |
JP6377592B2 (ja) * | 2015-11-09 | 2018-08-22 | 日本電信電話株式会社 | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム |
US10147415B2 (en) * | 2017-02-02 | 2018-12-04 | Microsoft Technology Licensing, Llc | Artificially generated speech for a communication session |
CN106941005A (zh) * | 2017-02-24 | 2017-07-11 | 华南理工大学 | 一种基于语音声学特征的声带异常检测方法 |
EP3424432B1 (en) * | 2017-07-04 | 2020-09-30 | Tata Consultancy Services Limited | Systems and methods for detecting pulmonary abnormalities using lung sounds |
US20200233397A1 (en) * | 2019-01-23 | 2020-07-23 | New York University | System, method and computer-accessible medium for machine condition monitoring |
-
2019
- 2019-06-21 JP JP2019115257A patent/JP7385381B2/ja active Active
-
2020
- 2020-05-27 CN CN202010459129.4A patent/CN112116924B/zh active Active
- 2020-06-04 US US16/892,936 patent/US11164594B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003501925A (ja) | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2002140090A (ja) | 2000-11-02 | 2002-05-17 | Toshiba Corp | 異常監視装置 |
JP2002257625A (ja) | 2001-03-06 | 2002-09-11 | Kobe Steel Ltd | 異常診断装置 |
JP2009175077A (ja) | 2008-01-28 | 2009-08-06 | Koga:Kk | 異音判定装置 |
WO2018150616A1 (ja) | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 異常音検出装置、異常度計算装置、異常音生成装置、異常音検出学習装置、異常信号検出装置、異常信号検出学習装置、これらの方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11164594B2 (en) | 2021-11-02 |
US20200402527A1 (en) | 2020-12-24 |
CN112116924B (zh) | 2024-02-13 |
JP2021001964A (ja) | 2021-01-07 |
CN112116924A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7385381B2 (ja) | 異常音検知システム、擬似音生成システム、および擬似音生成方法 | |
Bello et al. | Sound analysis in smart cities | |
CN102246228B (zh) | 声音识别系统 | |
WO2022012195A1 (zh) | 音频信号处理方法和相关装置 | |
JP2020525817A (ja) | 声紋認識方法、装置、端末機器および記憶媒体 | |
CN111768795A (zh) | 语音信号的噪声抑制方法、装置、设备及存储介质 | |
JP6485711B2 (ja) | 音場再現装置および方法、並びにプログラム | |
Bjorck et al. | Automatic detection and compression for passive acoustic monitoring of the african forest elephant | |
US9767846B2 (en) | Systems and methods for analyzing audio characteristics and generating a uniform soundtrack from multiple sources | |
CN105516876A (zh) | 一种基于谱熵的啸叫检测方法 | |
CN103299548B (zh) | 执行增强的∑-δ调制 | |
TW201432672A (zh) | 增強回響化語音的方法與裝置 | |
Tran et al. | Denoising induction motor sounds using an autoencoder | |
CN109637509B (zh) | 一种音乐自动生成方法、装置及计算机可读存储介质 | |
CN113792657B (zh) | 提取声学信号识别与盲解卷积算法的齿轮箱故障的方法 | |
KR102062454B1 (ko) | 음악 장르 분류 장치 및 방법 | |
Suhaimy et al. | Classification of ambulance siren sound with MFCC-SVM | |
CA3211751A1 (en) | Apparatus and method for clean dialogue loudness estimates based on deep neural networks | |
CN114627897A (zh) | 音频信号异常监测方法、装置、设备、介质和程序产品 | |
Jesudhas et al. | A novel approach to build a low complexity smart sound recognition system for domestic environment | |
TWI820333B (zh) | 方法,電腦程式,編碼器和監控裝置 | |
US11869492B2 (en) | Anomaly detection system and method using noise signal and adversarial neural network | |
US20230067510A1 (en) | Signal processing apparatus, signal processing method, and program | |
JP2013182161A (ja) | 音響処理装置およびプログラム | |
Kanhe et al. | Security of electronic patient record using imperceptible DCT-SVD based audio watermarking technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7385381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |