KR100745977B1 - 음성 구간 검출 장치 및 방법 - Google Patents
음성 구간 검출 장치 및 방법 Download PDFInfo
- Publication number
- KR100745977B1 KR100745977B1 KR1020050089526A KR20050089526A KR100745977B1 KR 100745977 B1 KR100745977 B1 KR 100745977B1 KR 1020050089526 A KR1020050089526 A KR 1020050089526A KR 20050089526 A KR20050089526 A KR 20050089526A KR 100745977 B1 KR100745977 B1 KR 100745977B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- probability distribution
- probability
- distribution model
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
ESPP | Y | U |
제1 선행 기술 | 0.47 | 0.47 |
제2 선행 기술 | 0.35 | 0.34 |
본 발명 | 0.35 | 0.28 |
EVAD (시작점) | Y | U |
제1 선행 기술 | 134ms | 134ms |
제2 선행 기술 | 170ms | 150ms |
본 발명 | 144ms | 103ms |
EVAD (끝점) | Y | U |
제1 선행 기술 | 291ms | 291ms |
제2 선행 기술 | 214ms | 193ms |
본 발명 | 196ms | 131ms |
Claims (18)
- 수신된 음성 입력신호를 소정의 시간 간격으로 나눈 프레임 단위로 주파수 영역의 신호로 변환하는 도메인 변환 모듈;상기 변환된 주파수 영역의 신호로부터 이전 프레임에 대한 잡음 스펙트럼을 차감한 스펙트럼 차감 신호를 생성하는 차감 스펙트럼 생성 모듈;상기 스펙트럼 차감 신호를 소정의 확률 분포 모델에 적용하는 모델링 모듈; 및상기 모델링 모듈에 의해 연산된 확률 분포를 통하여 현재의 프레임 구간에 음성 신호가 존재하는지 여부를 결정하는 음성 검출 모듈을 포함하는 음성 구간 검출 장치.
- 제1항에 있어서,상기 도메인 변환 모듈은 고속 푸리에 변환(FFT)을 이용하여 주파수 영역의 신호로 변환하는 음성 구간 검출 장치.
- 제1항에 있어서,상기 잡음 스펙트럼은 상기 모델링 모듈로부터 수신한 음성 부존재 확률에 대한 정보 및 상기 변환된 주파수 영역의 신호를 이용하여 연산되는 음성 구간 검출 장치.
- 삭제
- 제1항에 있어서,상기 확률 분포 모델은 피크(peak)가 밴드 에너지 레벨의 0에 가깝고, 히스포그램의 테일(tail)이 긴 통계적 모델을 포함하는 음성 구간 검출 장치.
- 제1항에 있어서,상기 확률 분포 모델은 레일리 분포에 라플라스 분포를 적용한 확률 분포 모델을 포함하는 음성 구간 검출 장치.
- 제6항에 있어서,상기 음성 검출 모듈은 상기 확률 분포 모델에 의한 확률 분포로부터 현재 프레임에 음성이 존재하는지 여부를 결정하는 음성 구간 검출 장치.
- 제1항에 있어서,상기 확률 분포 모델은 레일리 분포 모델을 포함하는 음성 구간 검출 장치.
- 제8항에 있어서,상기 모델링 모듈은 상기 확률 분포 모델로부터 현재 프레임에 음성이 존재하지 않을 확률을 연산하여 연산된 확률 정보를 상기 차감 스펙트럼 생성 모듈로 전달하고, 상기 차감 스펙트럼 생성 모듈은 상기 전달된 확률 정보를 이용하여 상기 잡음 스펙트럼을 갱신하는 음성 구간 검출 장치.
- 수신된 입력 신호를 소정의 시간 간격으로 나눈 프레임 단위로 주파수 영역의 신호로 변환하는 (a) 단계;상기 변환된 주파수 영역의 신호로부터 이전 프레임에 대한 잡음 스펙트럼을 차감한 스펙트럼 차감 신호를 생성하는 (b) 단계;상기 스펙트럼 차감 신호를 소정의 확률 분포 모델에 적용하는 (c) 단계; 및상기 확률 분포 모델의 적용에 따른 확률 분포를 통하여 현재의 프레임 구간에 음성 신호가 존재하는지 여부를 결정하는 (d) 단계를 포함하는 음성 구간 검출 방법.
- 제10항에 있어서,상기 (a) 단계는 고속 푸리에 변환(FFT)을 이용하여 주파수 영역의 신호로 변환하는 단계를 포함하는 음성 구간 검출 방법.
- 제10항에 있어서,상기 잡음 스펙트럼은 상기 확률 분포 모델의 적용에 따른 음성 부존재 확률에 대한 정보 및 상기 변환된 주파수 영역의 신호를 이용하여 연산되는 음성 구간 검출 방법.
- 삭제
- 제10항에 있어서,상기 확률 분포 모델은 피크(peak)가 밴드 에너지 레벨의 0에 가깝고, 히스포그램의 테일(tail)이 긴 통계적 모델을 포함하는 음성 구간 검출 방법.
- 제10항에 있어서,상기 확률 분포 모델은 레일리 분포에 라플라스 분포를 적용한 확률 분포 모델을 포함하는 음성 구간 검출 방법.
- 제15항에 있어서,상기 (d) 단계는 상기 확률 분포 모델의 확률 분포로부터 현재 프레임에 음성이 존재하는지 여부를 결정하는 음성 구간 검출 방법.
- 제10항에 있어서,상기 확률 분포 모델은 레일리 분포 모델을 포함하는 음성 구간 검출 방법.
- 제17항에 있어서,상기 (c) 단계는 상기 확률 분포 모델로부터 현재 프레임에 음성이 존재하지 않을 확률을 연산하여 연산된 확률 정보를 제공하고, 상기 (b) 단계는 상기 제공된 확률 정보를 이용하여 상기 잡음 스펙트럼을 갱신하는 단계를 포함하는 음성 구간 검출 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050089526A KR100745977B1 (ko) | 2005-09-26 | 2005-09-26 | 음성 구간 검출 장치 및 방법 |
US11/472,304 US7711558B2 (en) | 2005-09-26 | 2006-06-22 | Apparatus and method for detecting voice activity period |
JP2006223742A JP4769663B2 (ja) | 2005-09-26 | 2006-08-21 | 音声区間検出装置及び音声区間検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050089526A KR100745977B1 (ko) | 2005-09-26 | 2005-09-26 | 음성 구간 검출 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070034881A KR20070034881A (ko) | 2007-03-29 |
KR100745977B1 true KR100745977B1 (ko) | 2007-08-06 |
Family
ID=37895263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050089526A Expired - Fee Related KR100745977B1 (ko) | 2005-09-26 | 2005-09-26 | 음성 구간 검출 장치 및 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7711558B2 (ko) |
JP (1) | JP4769663B2 (ko) |
KR (1) | KR100745977B1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
EP2242046A4 (en) * | 2008-01-11 | 2013-10-30 | Nec Corp | SYSTEM, APPARATUS, METHOD AND PROGRAM FOR CONTROL OF SIGNAL ANALYSIS, SIGNAL ANALYSIS AND SIGNAL CONTROL |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
CN101960514A (zh) | 2008-03-14 | 2011-01-26 | 日本电气株式会社 | 信号分析控制系统及其方法、信号控制装置及其方法和程序 |
WO2009131066A1 (ja) * | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
GB0901504D0 (en) | 2009-01-29 | 2009-03-11 | Cambridge Silicon Radio Ltd | Radio Apparatus |
JP5772591B2 (ja) * | 2009-03-18 | 2015-09-02 | 日本電気株式会社 | 音声信号処理装置 |
ES2371619B1 (es) * | 2009-10-08 | 2012-08-08 | Telefónica, S.A. | Procedimiento de detección de segmentos de voz. |
ES2987086T3 (es) | 2010-12-24 | 2024-11-13 | Huawei Tech Co Ltd | Método y aparato para detectar adaptivamente una actividad de voz en una señal de audio de entrada |
KR20120080409A (ko) * | 2011-01-07 | 2012-07-17 | 삼성전자주식회사 | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 |
JP5668553B2 (ja) * | 2011-03-18 | 2015-02-12 | 富士通株式会社 | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム |
US9280982B1 (en) * | 2011-03-29 | 2016-03-08 | Google Technology Holdings LLC | Nonstationary noise estimator (NNSE) |
US20130090926A1 (en) * | 2011-09-16 | 2013-04-11 | Qualcomm Incorporated | Mobile device context information using speech detection |
WO2019119593A1 (zh) * | 2017-12-18 | 2019-06-27 | 华为技术有限公司 | 语音增强方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
JPH10240294A (ja) | 1997-02-28 | 1998-09-11 | Mitsubishi Electric Corp | 雑音軽減方法及び雑音軽減装置 |
US20020173276A1 (en) * | 1999-09-10 | 2002-11-21 | Wolfgang Tschirk | Method for suppressing spurious noise in a signal field |
KR20040056977A (ko) * | 2002-12-24 | 2004-07-01 | 한국전자통신연구원 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및음성 검출 방법 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5148489A (en) * | 1990-02-28 | 1992-09-15 | Sri International | Method for spectral estimation to improve noise robustness for speech recognition |
JPH04251299A (ja) | 1991-01-09 | 1992-09-07 | Sanyo Electric Co Ltd | 音声区間検出方法 |
JP3484757B2 (ja) | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US6044341A (en) * | 1997-07-16 | 2000-03-28 | Olympus Optical Co., Ltd. | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice |
US6691087B2 (en) * | 1997-11-21 | 2004-02-10 | Sarnoff Corporation | Method and apparatus for adaptive speech detection by applying a probabilistic description to the classification and tracking of signal components |
WO2001039175A1 (fr) | 1999-11-24 | 2001-05-31 | Fujitsu Limited | Procede et appareil de detection vocale |
US6615170B1 (en) * | 2000-03-07 | 2003-09-02 | International Business Machines Corporation | Model-based voice activity detection system and method using a log-likelihood ratio and pitch |
US20020116187A1 (en) * | 2000-10-04 | 2002-08-22 | Gamze Erten | Speech detection |
KR100400226B1 (ko) * | 2001-10-15 | 2003-10-01 | 삼성전자주식회사 | 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법 |
US7139703B2 (en) * | 2002-04-05 | 2006-11-21 | Microsoft Corporation | Method of iterative noise estimation in a recursive framework |
US7047047B2 (en) * | 2002-09-06 | 2006-05-16 | Microsoft Corporation | Non-linear observation model for removing noise from corrupted signals |
US7305132B2 (en) | 2003-11-19 | 2007-12-04 | Mitsubishi Electric Research Laboratories, Inc. | Classification in likelihood spaces |
-
2005
- 2005-09-26 KR KR1020050089526A patent/KR100745977B1/ko not_active Expired - Fee Related
-
2006
- 2006-06-22 US US11/472,304 patent/US7711558B2/en active Active
- 2006-08-21 JP JP2006223742A patent/JP4769663B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
JPH10240294A (ja) | 1997-02-28 | 1998-09-11 | Mitsubishi Electric Corp | 雑音軽減方法及び雑音軽減装置 |
US20020173276A1 (en) * | 1999-09-10 | 2002-11-21 | Wolfgang Tschirk | Method for suppressing spurious noise in a signal field |
KR20040056977A (ko) * | 2002-12-24 | 2004-07-01 | 한국전자통신연구원 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및음성 검출 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP4769663B2 (ja) | 2011-09-07 |
US7711558B2 (en) | 2010-05-04 |
US20070073537A1 (en) | 2007-03-29 |
JP2007094388A (ja) | 2007-04-12 |
KR20070034881A (ko) | 2007-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100745977B1 (ko) | 음성 구간 검출 장치 및 방법 | |
CN111261183B (zh) | 一种语音去噪的方法及装置 | |
US10504539B2 (en) | Voice activity detection systems and methods | |
US9754608B2 (en) | Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium | |
US7574008B2 (en) | Method and apparatus for multi-sensory speech enhancement | |
EP3040991A1 (en) | Voice activation detection method and device | |
EP3276621B1 (en) | Noise suppression device and noise suppressing method | |
US20110077939A1 (en) | Model-based distortion compensating noise reduction apparatus and method for speech recognition | |
WO2000036592A1 (en) | Improved noise spectrum tracking for speech enhancement | |
US8296135B2 (en) | Noise cancellation system and method | |
CN103109320A (zh) | 噪声抑制装置 | |
WO2007001821A2 (en) | Multi-sensory speech enhancement using a speech-state model | |
CN111951818B (zh) | 一种基于改进功率差噪声估计算法的双麦克风语音增强方法 | |
CN106558315A (zh) | 异质麦克风自动增益校准方法及系统 | |
CN111613243B (zh) | 一种语音检测的方法及其装置 | |
US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
CN106816157A (zh) | 语音识别方法及装置 | |
CN111508512B (zh) | 语音信号中的摩擦音检测的方法和系统 | |
US20080147389A1 (en) | Method and Apparatus for Robust Speech Activity Detection | |
JP3118023B2 (ja) | 音声区間検出方式及び音声認識装置 | |
KR20000056371A (ko) | 가능성비 검사에 근거한 음성 유무 검출 장치 | |
US20010029447A1 (en) | Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor | |
Mahmoodzadeh et al. | Single channel speech separation with a frame-based pitch range estimation method in modulation frequency | |
JP7106120B2 (ja) | 音声対話装置および音声対話システム | |
JP2005284016A (ja) | 音声信号の雑音推定方法およびそれを用いた雑音除去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20050926 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20060928 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
PG1501 | Laying open of application | ||
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20070412 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20060928 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
PJ0201 | Trial against decision of rejection |
Patent event date: 20070511 Comment text: Request for Trial against Decision on Refusal Patent event code: PJ02012R01D Patent event date: 20070412 Comment text: Decision to Refuse Application Patent event code: PJ02011S01I Appeal kind category: Appeal against decision to decline refusal Decision date: 20070625 Appeal identifier: 2007101005061 Request date: 20070511 |
|
PB0901 | Examination by re-examination before a trial |
Comment text: Amendment to Specification, etc. Patent event date: 20070511 Patent event code: PB09011R02I Comment text: Request for Trial against Decision on Refusal Patent event date: 20070511 Patent event code: PB09011R01I Comment text: Amendment to Specification, etc. Patent event date: 20061123 Patent event code: PB09011R02I |
|
B701 | Decision to grant | ||
PB0701 | Decision of registration after re-examination before a trial |
Patent event date: 20070625 Comment text: Decision to Grant Registration Patent event code: PB07012S01D Patent event date: 20070612 Comment text: Transfer of Trial File for Re-examination before a Trial Patent event code: PB07011S01I |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20070730 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20070731 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20100629 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20110629 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20120628 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130627 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20130627 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140627 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20140627 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150629 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20150629 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20160629 Start annual number: 10 End annual number: 10 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20180510 |