JP4545729B2 - 音声信号検出システム及び方法 - Google Patents
音声信号検出システム及び方法 Download PDFInfo
- Publication number
- JP4545729B2 JP4545729B2 JP2006271127A JP2006271127A JP4545729B2 JP 4545729 B2 JP4545729 B2 JP 4545729B2 JP 2006271127 A JP2006271127 A JP 2006271127A JP 2006271127 A JP2006271127 A JP 2006271127A JP 4545729 B2 JP4545729 B2 JP 4545729B2
- Authority
- JP
- Japan
- Prior art keywords
- peak
- micro
- audio signal
- voltage level
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L15/00—Devices or apparatus for measuring two or more fluid pressure values simultaneously
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Description
104 ピーク検出部
106 マイクロイベント検出部
108 マイクロイベント連結部
110 音声開始点及び終了点判断部
122 背景雑音ヒストグラム生成部
124 ピーク検出閾値電圧レベル決定部
Claims (8)
- 音声信号検出システムにおいて、
入力信号から時間軸上の該入力信号の振幅のピークを抽出するピーク抽出部と、
抽出された前記ピークの電圧レベルと所定の閾値電圧レベルとを比較して、その比較結果を二進シーケンスに変換するピーク検出部と、
前記変換された二進シーケンスを検査するためのテストウインドウの長さを決定し、前記テストウインドウの長さ単位でマイクロイベントを検出するマイクロイベント検出部と、
前記検出されたマイクロイベントをリンクするマイクロイベントリンク部と、
前記リンクされたマイクロイベントの開始点及び終了点を検出して、音声信号の開始点及び終了点を判断する音声信号の開始点及び終了点検出部と、を含み、
前記マイクロイベント検出部は、前記各テストウインドウ内の前記閾値電圧レベルよりも大きいピークに該当するシーケンスの個数を把握し、把握されたシーケンスの個数が所定の個数であれば、そのシーケンスをマイクロイベントとして検出する
ことを特徴とする、音声信号検出システム。 - 背景雑音だけが存在する入力信号から抽出された前記ピークと、そのピークの電圧レベルとを用いて、背景雑音ヒストグラムを生成する背景雑音ヒストグラム生成部と、
生成された前記背景雑音ヒストグラムを用いて、所定のピーク選択率に対応する閾値電圧レベルLを決定する閾値電圧レベル決定部と、をさらに含むことを特徴とする、請求項1に記載の音声信号検出システム。 - 前記マイクロイベントリンク部は、前記検出されたマイクロイベントのうち、互いの時間間隔が一時的な相関閾値以内のマイクロイベントをリンクすることを特徴とする、請求項1に記載の音声信号検出システム。
- 前記一時的な相関閾値は40msであることを特徴とする、請求項3に記載の音声信号検出システム。
- 音声信号検出方法において、
入力信号から時間軸上の該入力信号の振幅のピークを抽出するステップと、
抽出された前記ピークの電圧レベルと所定の閾値電圧レベルとを比較して、その比較結果を二進シーケンスに変換するステップと、
前記変換された二進シーケンスを検査するためのテストウインドウの長さを決定し、前記テストウインドウの長さ単位でマイクロイベントを検出するステップと、
前記検出されたマイクロイベントをリンクするステップと、
前記リンクされたマイクロイベントの開始点及び終了点を検出して、音声信号の開始点及び終了点を判断するステップと、を含み、
前記マイクロイベントを検出するステップは、
前記各テストウインドウ内の前記閾値電圧レベルよりも大きいピークに該当するシーケンスの個数を把握するステップと、
把握されたシーケンスの個数が所定の個数であれば、そのシーケンスをマイクロイベントとして検出するステップと、を含む
ことを特徴とする、音声信号検出方法。 - 背景雑音だけが存在する入力信号から抽出された前記ピークと、そのピークの電圧レベルとを用いて、背景雑音ヒストグラムを生成するステップと、
生成された前記背景雑音ヒストグラムを用いて、所定のピーク選択率に対応する閾値電圧レベルLを決定するステップと、をさらに含むことを特徴とする、請求項5に記載の音声信号検出方法。 - 前記マイクロイベントをリンクするステップは、前記検出されたマイクロイベントのうち、互いの時間間隔が一時的な相関閾値以内のマイクロイベントをリンクすることを特徴とする、請求項5に記載の音声信号検出方法。
- 前記一時的な相関閾値は40msであることを特徴とする、請求項7に記載の音声信号検出方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050102583A KR100800873B1 (ko) | 2005-10-28 | 2005-10-28 | 음성 신호 검출 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007122047A JP2007122047A (ja) | 2007-05-17 |
JP4545729B2 true JP4545729B2 (ja) | 2010-09-15 |
Family
ID=37635197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006271127A Expired - Fee Related JP4545729B2 (ja) | 2005-10-28 | 2006-10-02 | 音声信号検出システム及び方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7739107B2 (ja) |
EP (1) | EP1780704B1 (ja) |
JP (1) | JP4545729B2 (ja) |
KR (1) | KR100800873B1 (ja) |
CN (1) | CN1956055A (ja) |
DE (1) | DE602006000487T2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515454B (zh) * | 2008-02-22 | 2011-05-25 | 杨夙 | 用于语音、音乐、噪音自动分类的信号特征提取方法 |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
CN101625859B (zh) * | 2008-07-10 | 2012-06-06 | 新奥特(北京)视频技术有限公司 | 语音端点检测中的短时能频值波形斜率门限的确定方法 |
CN101625862B (zh) * | 2008-07-10 | 2012-07-18 | 新奥特(北京)视频技术有限公司 | 自动字幕生成系统中语音区间的检测方法 |
JP5834449B2 (ja) * | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
CN102014017B (zh) | 2010-09-30 | 2013-10-09 | 华为技术有限公司 | 一种信号检测电路、方法及系统 |
CN103856600B (zh) * | 2012-12-04 | 2016-09-28 | 中兴通讯股份有限公司 | 一种内置搜索语音短信功能的移动终端及其搜索方法 |
KR20150105847A (ko) * | 2014-03-10 | 2015-09-18 | 삼성전기주식회사 | 음성구간 검출 방법 및 장치 |
CN105095624B (zh) * | 2014-05-15 | 2017-08-01 | 中国电子科技集团公司第三十四研究所 | 一种光纤传感振动信号的识别方法 |
CN105551491A (zh) * | 2016-02-15 | 2016-05-04 | 海信集团有限公司 | 语音识别方法和设备 |
US10789965B2 (en) * | 2018-07-03 | 2020-09-29 | Silicon Laboratories Inc. | System, apparatus and method for time synchronization of delayed data streams by matching of wavelet coefficients |
KR20200017143A (ko) | 2018-08-08 | 2020-02-18 | 주식회사 케이티 | 음성 신호를 처리하는 장치, 방법 및 컴퓨터 판독가능 매체 |
US10891936B2 (en) * | 2019-06-05 | 2021-01-12 | Harman International Industries, Incorporated | Voice echo suppression in engine order cancellation systems |
CN114220421B (zh) * | 2021-12-16 | 2025-02-07 | 云知声智能科技股份有限公司 | 字级别的时间戳的生成方法、装置、电子设备和存储介质 |
CN117912487B (zh) * | 2024-01-18 | 2024-11-12 | 哈尔滨工业大学 | 用于多余物检测的两级自适应多门限脉冲提取方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59104700A (ja) * | 1983-11-18 | 1984-06-16 | 株式会社日立製作所 | 音声切り出し装置 |
JPH10301594A (ja) * | 1997-05-01 | 1998-11-13 | Fujitsu Ltd | 有音検出装置 |
JP2000066691A (ja) * | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
WO2001039175A1 (fr) * | 1999-11-24 | 2001-05-31 | Fujitsu Limited | Procede et appareil de detection vocale |
JP2002531882A (ja) * | 1998-11-30 | 2002-09-24 | マイクロソフト コーポレイション | バレーパーセンテージを使用した純粋音声の検出 |
JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
JP2007072005A (ja) * | 2005-09-05 | 2007-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1343869A (en) | 1972-05-05 | 1974-01-16 | Post Office | Method and apparatus for detecting a speech signal in the presence of noise |
US4514703A (en) * | 1982-12-20 | 1985-04-30 | Motrola, Inc. | Automatic level control system |
GB2139052A (en) | 1983-04-20 | 1984-10-31 | Philips Electronic Associated | Apparatus for distinguishing between speech and certain other signals |
JPH02244200A (ja) * | 1989-03-17 | 1990-09-28 | Akio Ogiwara | 音声信号処理用ピッチ検出回路 |
US4975657A (en) | 1989-11-02 | 1990-12-04 | Motorola Inc. | Speech detector for automatic level control systems |
JPH0713585A (ja) | 1993-06-21 | 1995-01-17 | Casio Comput Co Ltd | 音声区間切出し装置 |
US5563925A (en) | 1995-07-20 | 1996-10-08 | Siemens Medical Systems, Inc. | Apparatus and method for adjusting radiation in a radiation-emitting device |
KR100195009B1 (ko) | 1995-09-30 | 1999-06-15 | 윤종용 | 음성재생장치의 음성신호 검출회로 및 그 방법 |
TW333610B (en) * | 1997-10-16 | 1998-06-11 | Winbond Electronics Corp | The phonetic detecting apparatus and its detecting method |
US6480823B1 (en) * | 1998-03-24 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Speech detection for noisy conditions |
JP2001067092A (ja) | 1999-08-26 | 2001-03-16 | Matsushita Electric Ind Co Ltd | 音声検出装置 |
US6904146B2 (en) * | 2002-05-03 | 2005-06-07 | Acoustic Technology, Inc. | Full duplex echo cancelling circuit |
-
2005
- 2005-10-28 KR KR1020050102583A patent/KR100800873B1/ko not_active Expired - Fee Related
-
2006
- 2006-10-02 JP JP2006271127A patent/JP4545729B2/ja not_active Expired - Fee Related
- 2006-10-04 US US11/542,866 patent/US7739107B2/en not_active Expired - Fee Related
- 2006-10-24 EP EP06122828A patent/EP1780704B1/en not_active Ceased
- 2006-10-24 DE DE602006000487T patent/DE602006000487T2/de active Active
- 2006-10-26 CN CNA2006101427048A patent/CN1956055A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59104700A (ja) * | 1983-11-18 | 1984-06-16 | 株式会社日立製作所 | 音声切り出し装置 |
JPH10301594A (ja) * | 1997-05-01 | 1998-11-13 | Fujitsu Ltd | 有音検出装置 |
JP2000066691A (ja) * | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
JP2002531882A (ja) * | 1998-11-30 | 2002-09-24 | マイクロソフト コーポレイション | バレーパーセンテージを使用した純粋音声の検出 |
WO2001039175A1 (fr) * | 1999-11-24 | 2001-05-31 | Fujitsu Limited | Procede et appareil de detection vocale |
JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
JP2007072005A (ja) * | 2005-09-05 | 2007-03-22 | Nippon Telegr & Teleph Corp <Ntt> | 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US7739107B2 (en) | 2010-06-15 |
JP2007122047A (ja) | 2007-05-17 |
DE602006000487T2 (de) | 2009-01-22 |
CN1956055A (zh) | 2007-05-02 |
DE602006000487D1 (de) | 2008-03-13 |
EP1780704B1 (en) | 2008-01-23 |
KR20070045846A (ko) | 2007-05-02 |
KR100800873B1 (ko) | 2008-02-04 |
EP1780704A1 (en) | 2007-05-02 |
US20070100609A1 (en) | 2007-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4545729B2 (ja) | 音声信号検出システム及び方法 | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
US7912709B2 (en) | Method and apparatus for estimating harmonic information, spectral envelope information, and degree of voicing of speech signal | |
US9401160B2 (en) | Methods and voice activity detectors for speech encoders | |
Ramírez et al. | A new Kullback-Leibler VAD for speech recognition in noise | |
US7917357B2 (en) | Real-time detection and preservation of speech onset in a signal | |
US20040064314A1 (en) | Methods and apparatus for speech end-point detection | |
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
US20140067388A1 (en) | Robust voice activity detection in adverse environments | |
US20110264449A1 (en) | Detector and Method for Voice Activity Detection | |
US9520141B2 (en) | Keyboard typing detection and suppression | |
US20070106503A1 (en) | Method and apparatus for extracting pitch information from audio signal using morphology | |
US7860708B2 (en) | Apparatus and method for extracting pitch information from speech signal | |
US20100082341A1 (en) | Speaker recognition device and method using voice signal analysis | |
KR20060058747A (ko) | 음성 판별 방법 | |
Ramírez et al. | Speech/non-speech discrimination based on contextual information integrated bispectrum LRT | |
US20080172225A1 (en) | Apparatus and method for pre-processing speech signal | |
Anguera et al. | Purity algorithms for speaker diarization of meetings data | |
US7747439B2 (en) | Method and system for recognizing phoneme in speech signal | |
JP6616182B2 (ja) | 話者認識装置、判別値生成方法及びプログラム | |
KR20120056661A (ko) | 음성 신호 전처리 장치 및 방법 | |
US7630891B2 (en) | Voice region detection apparatus and method with color noise removal using run statistics | |
JP4682700B2 (ja) | 音声認識装置 | |
KR100303477B1 (ko) | 가능성비 검사에 근거한 음성 유무 검출 장치 | |
Górriz et al. | Generalized LRT-based voice activity detector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100630 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4545729 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |