KR102218151B1 - 음성 인식률을 향상시키기 위한 타겟 음성 신호 출력 장치 및 방법 - Google Patents
음성 인식률을 향상시키기 위한 타겟 음성 신호 출력 장치 및 방법 Download PDFInfo
- Publication number
- KR102218151B1 KR102218151B1 KR1020190083248A KR20190083248A KR102218151B1 KR 102218151 B1 KR102218151 B1 KR 102218151B1 KR 1020190083248 A KR1020190083248 A KR 1020190083248A KR 20190083248 A KR20190083248 A KR 20190083248A KR 102218151 B1 KR102218151 B1 KR 102218151B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- module
- voice
- output
- noise removal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 35
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 238000011410 subtraction method Methods 0.000 claims abstract description 16
- 230000009467 reduction Effects 0.000 claims abstract description 12
- 238000005452 bending Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
Description
도 2는 본 명세서의 다른 실시예에 따른 타겟 음성 신호 출력 장치의 개략적인 블럭도이다.
도 3은 본 명세서의 일 실시예에 따른 타겟 음성 신호 출력 방법에 대한 개략적인 흐름도이다.
도 4는 본 명세서의 다른 실시예에 따른 타겟 음성 신호 출력 방법에 대한 개략적인 흐름도이다.
도 5는 본 명세서의 또 다른 실시예에 따른 타겟 음성 신호 출력 장치의 구성을 개략적으로 도시한 블럭도이다.
도 6은 본 명세서의 또 다른 실시예에 따른 타겟 음성 신호 출력 방법의 흐름도이다.
도 7은 예시적인 신호의 파형 참고도이다.
120 : 제2 잡음 제거 모듈
130 : 음성 구간 검출 모듈
140 : 타겟 신호 출력 모듈
Claims (15)
- 제1 마이크로폰으로부터 출력된 메인 신호에서 제2 마이크로폰으로부터 출력된 서브 신호를 제거한 신호를 출력하는 제1 잡음 제거 모듈;
상기 메인 신호에서 상기 서브 신호가 제거된 신호에 스펙트럼 차감법을 이용한 게인값을 곱한 신호를 출력하는 제2 잡음 제거 모듈;
상기 제2 잡음 제거 모듈에서 출력된 신호에서 아래 수식을 통해 산출된 신호의 굴곡도가 미리 설정된 굴곡도 기준값 이상인 지점을 음성 시작점으로 판단하고, 상기 음성 시작점 이후 상기 신호의 진폭이 미리 설정된 굴곡도 기준값 이하인 지점을 음성 종료점으로 판단하는 음성 구간 검출 모듈; 및
상기 제1 잡음 제거 모듈에서 출력된 신호 중 상기 음성 구간 검출 모듈에서 판단된 음성 시작점부터 음성 종료점까지의 구간에 해당하는 신호를 출력하는 타겟 신호 출력 모듈;을 포함하는 타겟 음성 신호 출력 장치.
는 k 번째 주파수, 는 i번째 프레임에서 k번째 주파수 성분, N은 주파수 굴곡도를 계산하는 주파수 성분의 상한값 - 청구항 1에 있어서,
상기 제2 잡음 제거 모듈은, 상기 메인 신호에서 상기 서브 신호가 제거된 신호에 MMSE 또는 MMSE-LSA의 스펙트럼 차감법을 이용하여 게인값을 곱한 신호를 출력하는 것을 특징으로 하는 타겟 음성 신호 출력 장치. - 삭제
- 삭제
- 삭제
- 청구항 1에 있어서,
상기 제1 잡음 제거 모듈은, 상기 메인 신호 및 상기 서브 신호에서 에코 신호를 제거하는 에코 제거 모듈;을 더 포함하는 타겟 음성 신호 출력 장치. - 청구항 1에 있어서,
상기 제2 잡음 제거 모듈은,
상기 메인 신호 및 상기 서브 신호에서 에코 신호를 제거하는 에코 제거 모듈; 및
상기 에코 제거 모듈에서 출력된 신호에서 잔여 에코를 제거하는 잔여 에코 제거 모듈;을 더 포함하는 타겟 음성 신호 출력 장치. - 제1 마이크로폰으로부터 출력된 메인 신호에서 제2 마이크로폰으로부터 출력된 서브 신호를 제거한 신호를 출력하는 제1 잡음 제거 단계;
상기 메인 신호에서 상기 서브 신호가 제거된 신호에 스펙트럼 차감법을 이용한 게인값을 곱한 신호를 출력하는 제2 잡음 제거 단계;
상기 제2 잡음 제거 모듈에서 출력된 신호에서 아래 수식을 통해 산출된 신호의 굴곡도가 미리 설정된 굴곡도 기준값 이상인 지점을 음성 시작점으로 판단하고, 상기 음성 시작점 이후 상기 신호의 진폭이 미리 설정된 굴곡도 기준값 이하인 지점을 음성 종료점으로 판단하는 음성 구간 검출 단계; 및
상기 제1 잡음 제거 모듈에서 출력된 신호 중 상기 음성 구간 검출 모듈에서 판단된 음성 시작점부터 음성 종료점까지의 구간에 해당하는 신호를 출력하는 타겟 신호 출력 단계;를 포함하는 타겟 음성 신호 출력 방법.
는 k 번째 주파수, 는 i번째 프레임에서 k번째 주파수 성분, N은 주파수 굴곡도를 계산하는 주파수 성분의 상한값 - 청구항 8에 있어서,
상기 제2 잡음 제거 단계는, 상기 메인 신호에서 상기 서브 신호가 제거된 신호에 MMSE 또는 MMSE-LSA의 스펙트럼 차감법을 이용하여 게인값을 곱한 신호를 출력하는 단계인 것을 특징으로 하는 타겟 음성 신호 출력 방법. - 삭제
- 삭제
- 삭제
- 청구항 8에 있어서,
상기 제1 잡음 제거 단계 이전에, 상기 메인 신호 및 상기 서브 신호에서 에코 신호를 제거하는 에코 제거 단계;를 더 포함하는 타겟 음성 신호 출력 방법. - 청구항 8에 있어서,
상기 제2 잡음 제거 단계 이전에,
상기 메인 신호 및 상기 서브 신호에서 에코 신호를 제거하는 에코 제거 단계; 및
상기 메인 신호 및 상기 서브 신호에서 에코 신호가 제거된 신호에서 잔여 에코를 제거하는 잔여 에코 제거 단계;를 더 포함하는 타겟 음성 신호 출력 방법. - 컴퓨터에서 청구항 8, 9, 13 및 14 중 어느 한 청구항에 따른 타겟 음성 신호 출력 방법의 각 단계들을 수행하도록 작성되어 컴퓨터로 독출 가능한 기록 매체에 기록된 컴퓨터프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190063718 | 2019-05-30 | ||
KR1020190063718 | 2019-05-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200137900A KR20200137900A (ko) | 2020-12-09 |
KR102218151B1 true KR102218151B1 (ko) | 2021-02-23 |
Family
ID=73786949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190083248A Active KR102218151B1 (ko) | 2019-05-30 | 2019-07-10 | 음성 인식률을 향상시키기 위한 타겟 음성 신호 출력 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102218151B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012168212A (ja) * | 2011-02-09 | 2012-09-06 | Jvc Kenwood Corp | ノイズ低減装置およびノイズ低減方法 |
KR101184806B1 (ko) | 2007-10-18 | 2012-09-20 | 모토로라 모빌리티 엘엘씨 | 강인한 두 마이크로폰 잡음 억제 시스템 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101008022B1 (ko) * | 2004-02-10 | 2011-01-14 | 삼성전자주식회사 | 유성음 및 무성음 검출방법 및 장치 |
KR101340520B1 (ko) * | 2008-07-22 | 2013-12-11 | 삼성전자주식회사 | 잡음을 제거하는 장치 및 방법 |
KR101966175B1 (ko) * | 2012-05-11 | 2019-04-05 | 엘지전자 주식회사 | 잡음 제거 장치 및 방법 |
KR101557779B1 (ko) | 2014-02-14 | 2015-10-06 | 주식회사 시그테크 | 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치 |
-
2019
- 2019-07-10 KR KR1020190083248A patent/KR102218151B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101184806B1 (ko) | 2007-10-18 | 2012-09-20 | 모토로라 모빌리티 엘엘씨 | 강인한 두 마이크로폰 잡음 억제 시스템 |
JP2012168212A (ja) * | 2011-02-09 | 2012-09-06 | Jvc Kenwood Corp | ノイズ低減装置およびノイズ低減方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20200137900A (ko) | 2020-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
JP4842583B2 (ja) | 多感覚音声強調のための方法および装置 | |
CN101149928B (zh) | 声音信号处理方法、声音信号处理设备及计算机程序 | |
CN111161752A (zh) | 回声消除方法和装置 | |
US9378755B2 (en) | Detecting a user's voice activity using dynamic probabilistic models of speech features | |
CN112530410B (zh) | 一种命令词识别方法及设备 | |
JP2006215568A (ja) | 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体 | |
US9105270B2 (en) | Method and apparatus for audio signal enhancement in reverberant environment | |
US11308946B2 (en) | Methods and apparatus for ASR with embedded noise reduction | |
JP6151236B2 (ja) | 雑音抑圧装置、その方法及びプログラム | |
CN114360561B (zh) | 一种基于深度神经网络技术的语音增强方法 | |
WO2023001128A1 (zh) | 音频数据的处理方法、装置及设备 | |
JP2014518404A (ja) | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 | |
CN111883154A (zh) | 回声消除方法及装置、计算机可读的存储介质、电子装置 | |
EP4476719A1 (en) | Generalized automatic speech recognition for joint acoustic echo cancellation, speech enhancement, and voice separation | |
CN118800268A (zh) | 语音信号处理方法、语音信号处理设备及存储介质 | |
JP2007293059A (ja) | 信号処理装置およびその方法 | |
US8990092B2 (en) | Voice recognition device | |
CN119694328A (zh) | 一种基于声音特征的录音除噪方法、系统、设备及介质 | |
KR102218151B1 (ko) | 음성 인식률을 향상시키기 위한 타겟 음성 신호 출력 장치 및 방법 | |
JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
CN109741761B (zh) | 声音处理方法和装置 | |
CN115985337B (zh) | 一种基于单麦克风的瞬态噪声检测与抑制的方法及装置 | |
JP4464797B2 (ja) | 音声認識方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
JP6106618B2 (ja) | 音声区間検出装置、音声認識装置、その方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190710 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20201023 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210127 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210216 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210216 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240316 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20250124 Start annual number: 5 End annual number: 5 |